통계학과

Difficulty: High수학이라는 거대한 산을 넘어야 보이는 보물창고

통계학과

Department of Statistics

불확실한 세상 속에서 데이터라는 등불을 들고 숨겨진 진실과 패턴을 찾아내는 데이터 과학의 본류이자 기초 학문입니다.

Philosophy

"All models are wrong, but some are useful. (George E. P. Box)"
Core Concept
Uncertainty

Trending

Toolkit

  • R
    R통계 분석 및 시각화
    통계학자들에 의해 만들어진 언어인 만큼, 통계 분석에 최적화되어 있어요. 특히 'ggplot2'를 활용한 시각화 기능은 타의 추종을 불허하죠. 논문 작성이나 순수 통계 연구에 매우 강력합니다.
  • 파이썬
    파이썬머신러닝 및 범용 프로그래밍
    현재 데이터 사이언스 업계의 표준과도 같은 언어입니다. Pandas로 데이터를 씹고 뜯고 맛보고, Scikit-learn으로 모델을 돌리죠. 개발자와 협업하거나 시스템에 모델을 심을 때 필수적입니다.
  • SQL
    SQL데이터베이스 접근 및 추출
    아무리 분석 실력이 좋아도 데이터가 없으면 무용지물이에요. 회사에 있는 데이터베이스에서 내가 원하는 데이터를 꺼내오기 위해 반드시 익혀야 할 기본 중의 기본입니다.
  • SAS
    SAS금융 및 의료 통계 분석
    비싸고 무겁지만, 안정성이 중요시되는 제약회사(임상)나 금융권, 공공기관에서는 여전히 강력한 힘을 발휘하는 툴입니다. 해당 분야로 진로를 정했다면 배워두는 게 좋아요.
  • 엑셀
    엑셀데이터 전처리 및 간단한 분석
    너무 쉽다고 무시하지 마세요. 실무에서 가장 빠르고 직관적으로 데이터를 훑어보고 공유하는 데 엑셀만 한 게 없습니다. 고급 기능을 익혀두면 사랑받는 신입사원이 될 수 있어요.
  • 깃/깃허브
    깃/깃허브코드 버전 관리 및 협업
    작성한 분석 코드의 역사를 기록하고 다른 사람들과 공유하는 저장소입니다. 포트폴리오 관리 차원에서도 미리 익숙해지는 것이 좋습니다.
  • 태블로
    태블로비즈니스 인텔리전스(BI) 시각화
    복잡한 코딩 없이도 데이터를 드래그 앤 드롭하여 아름다운 대시보드를 만들 수 있습니다. 분석 결과를 경영진이나 비전공자에게 설득력 있게 보여줄 때 아주 유용해요.

Career Paths

데이터 사이언스 & IT
IT 기업, 스타트업, 포털 사이트
금융 & 리스크 관리
보험사, 증권사, 은행, 자산운용사
바이오 & 헬스케어
제약회사, CRO(임상시험수탁기관), 대학병원, 질병관리청
비즈니스 & 마케팅
리서치 펌, 대기업 마케팅팀, 컨설팅 회사, 여론조사 기관
공공 & 학계
통계청, 한국은행, 공공기관, 대학교 및 연구소

RoadmapStep-by-step

Level 1

수학적 기초 다지기

통계학은 숫자로 된 언어입니다. 본격적인 통계 이론을 이해하기 위해서는 미적분과 행렬이라는 기초 문법을 탄탄히 해야 해요. 이 시기에 배우는 수학이 나중에 나올 모든 증명의 기반이 되니 절대 소홀히 하면 안 됩니다.

Key Modules
미적분학
선형대수학
통계학입문
Level 2

통계적 사고의 확장

이제 데이터를 다루는 가장 기본적인 무기들을 장착할 때입니다. 변수 하나하나의 관계를 파헤치고, 확률이라는 개념을 통해 불확실성을 수치화하는 법을 배웁니다. 이때부터 '직관'보다는 '데이터'를 믿는 훈련을 하게 될 거예요.

Key Modules
회귀분석
확률론
통계프로그래밍
Level 3

이론의 심화와 고비

통계학과 학생들의 최대 고비가 찾아오는 시기입니다. 수식으로 가득 찬 칠판을 보며 좌절할 수도 있지만, 이 과정을 견뎌내야 진정한 전공자로 거듭날 수 있어요. '왜' 그런 결과가 나오는지 수학적으로 엄밀하게 증명하는 힘을 기릅니다.

Key Modules
수리통계학
실험계획법
다변량분석
Level 4

응용과 실무 준비

이론을 넘어 실제 현장의 데이터를 다룰 준비를 합니다. 시간이 흐름에 따라 변하는 데이터나, 방대한 양의 빅데이터를 처리하는 최신 기법들을 배우게 됩니다. 이때부터는 자신의 진로(금융, 바이오, IT 등)에 맞는 과목을 골라 듣는 것이 좋아요.

Key Modules
시계열분석
데이터마이닝
베이지안통계
비모수통계

Challenges& Reality Check

🤔
수리통계학의 벽
"2~3학년 전공 필수 과목인 수리통계학을 마주할 때"
'나는 통계 데이터를 다루러 왔는데 왜 수학 증명만 하고 있지?'라는 회의감이 들 수 있어요. 난해한 수식과 증명 과정에 압도되어 전공을 포기하고 싶어지는 순간이 찾아옵니다.

이 이론적 배경이 없으면 나중에 결과를 해석할 때 오류를 범하기 쉬워요. '지금 짓는 이 기초가 나를 흔들리지 않는 전문가로 만든다'고 생각하고, 증명 과정을 손으로 직접 써보며 천천히 따라가 보세요.

🤔
코딩과 수학 사이의 정체성 혼란
"컴퓨터공학과 수학과 사이에서 애매함을 느낄 때"
컴공과 친구들보다 코딩을 못 하는 것 같고, 수학과 친구들보다 증명을 못 하는 것 같아 의기소침해질 수 있습니다. '나는 대체 뭐 하는 사람인가'라는 고민이 깊어지죠.

여러분의 강점은 그 둘을 연결하는 '데이터 해석 능력'에 있어요. 코딩은 도구이고 수학은 언어일 뿐, 그 도구와 언어로 세상의 현상을 설명해내는 통찰력은 여러분만의 무기랍니다.

🤔
P-value의 저주
"분석 결과가 유의하지 않게 나올 때"
밤새워 데이터를 돌렸는데 P-value가 0.05보다 크게 나와서 '유의한 결과가 없다'는 결론에 도달하면 허탈함이 몰려옵니다. 마치 내 노력이 부정당한 기분이 들죠.

유의하지 않다는 결과 그 자체도 중요한 발견입니다. 데이터에 억지로 의미를 부여하려 하지 말고(P-hacking), 왜 그런 결과가 나왔는지 탐구하는 자세가 진짜 연구자의 태도예요.

🤔
도메인 지식의 부재
"실제 데이터를 분석하는데 그 분야를 전혀 모를 때"
의학 데이터를 분석하는데 의학 용어를 모르거나, 주식 데이터를 보는데 경제를 모르면 숫자는 그냥 숫자일 뿐 해석이 불가능해집니다.

통계학은 어떤 분야와도 결합할 수 있는 '만능 소스'예요. 평소에 관심 있는 분야(경제, 스포츠, 마케팅 등)를 하나 정해서 꾸준히 관련 지식을 쌓아두면 시너지가 폭발할 거예요.