메뉴 건너뛰기
로고
책갈피 추가
페이지

4페이지 내용 : 권이태 서울대 통계학과 1학년 머신러닝과 빅데이터 분석 위한 효율적 통계 분석 기법을 개발하고 싶어요” “ 통계학과를 지원한 동기는? 원래는 통계학보다 생물학에 더 관심이 많았다. 고등학생 때 생물학 탐구 활동으로 히스톤탈아 세틸화효소 억제제가 분열효모 전사체에 미치는 영향을 분석했는데, 이를 위해선 수천 개에 달 하는 각 유전자들의 발현량이 약품 처리 전후 어떻게 변하는지 확인해야 했다. 이를 판별하기 위해 사용한 도구가 바로 통계학이었다. 유전자와 같이 많은 개수의 정보를 다룰 경우는 R과 같은 다양한 프로그래밍 도구들을 이용해야 하며, 데이터의 길이와 차원이 증가할수록 더 좋은 성능의 컴퓨터가 필요하다. 당시 통계학적 지식이 많이 부족해 만족스러운 분석 결과를 얻지 못했다. 그 후 생물학적 데이터로 유의미한 결과를 얻어내는 생물통계학에 관심을 가졌고, 통 계학과에서 연구방법론적 지식을 얻고 싶어 지원했다. 가장 좋았던 전공 수업은? 서울대 통계학과는 1학년 1학기 때 권장하는 전공 수업이 없다. 1학년 때는 보통 물리학, 화학 등 과학 교과 교양 수업 위주로 수강하고 2학기부터 전산통계 및 실험 과목에서 R이라는 프로그 래밍 언어를 이용한 통계처리 기법을 익힌다. 통계학과가 자연 계열에 있는 만큼, 단순한 자료 분석을 넘어 수학적 증명을 통해 왜 그렇게 분석해야 하는지 심도 있게 다룬다. 이를 위해 1학 년 때 미적분학 과목에서 기초적인 다변수 미적분학을 공부하고, 2학년 때 해석학과 선형대수 학 등을 배우며 수리통계학과 확률론을 위한 기반을 쌓는다. 이번 학기에 수강한 해석개론 및 연습 1 과목이 가장 기억에 남는다. 그동안 배웠던 계산 위주 의 수학에서 벗어나 엄밀함 위에 극한, 미분, 적분을 쌓아내는데, 처음 접하다 보니 어렵기도 했 지만 반대로 많은 흥미를 느꼈다. 특히 교수님들이 직접 편찬하신 교재를 사용했는데, 기초적 인 위상 개념도 소개하고 있어 더욱 재미있게 이해할 수 있었다. 앞으로 통계학에서 연구하고 싶은 분야는? 통계학은 컴퓨터과학과 매우 밀접하지만, 우리가 일반적으로 사용하는 컴퓨터로는 유전자 발 현량과 같은 많은 데이터를 이용한 작업을 수행하지 못한다. 머신러닝과 데이터 분석 과정에서 일반적인 하드웨어가 감당할 수 없을 정도의 계산량 부하가 쏟아지기 때문이다. 반대로 알고리 즘의 계산량을 줄이고, 수많은 데이터 중 쓸모 있는 데이터만 골라내는 방식을 개발할 경우, 필 요한 컴퓨터의 사양을 낮출 뿐만 아니라 처리 속도 역시 증가시킬 수 있다. 통계학을 이용해 머 신러닝과 빅데이터 분석에 쓰일 수 있는 효율적인 통계 분석 기법을 개발하고, 궁극적으로는 일반인도 쉽게 사용할 수 있는 통계 분석 프로그램을 만들고 싶다. 통계학과를 희망하는 고등학생 후배들에게 조언한다면? 수학 실력은 통계학과를 지원하는 데 도움이 되지만 걸림돌이 되지는 않는다. 오히려 통계학과 가 원하는 인재는 수학을 잘하는 학생이 아닌 ‘데이터 문해력’이 좋은 학생 같다. 문 文 해력이 주어진 글을 얼마나 비판적으로 읽어 요점을 파악하는지를 평가하는 척도라면, 데이터 문해력 은 주어진 데이터와 그래프의 함의를 올바르게 파악하는 척도라고 볼 수 있다. 주어진 데이터 가 제대로 얻어진 것인지, 그리고 그 결과는 올바르게 표시되었는지 판단할 수 있는 능력이 바 로 데이터 문해력이다. 더불어 독서의 중요성을 강조하고 싶다. 독서는 지식을 쌓아줄 뿐만 아 니라 데이터 문해력도 키워준다. naeiledu53

페이지
책갈피 추가

탐 색