기계학습 (Machine Learning)
참 막연한 단어이다. 기계학습이라니.
인공지능의 한 분야로 Bayesian Framework과 부합하여
컴퓨터가 스스로 학습할 수 있도록 하는 알고리즘 및 기술을 개발하는 분야이다.
저번학기에 대학원 첫 과목으로 들었던 과목인데,
전산과 과목답게 쉽운 로드는 아니었다.
위에 이야기한 기계학습의 간단한 설명은 정말 Conceptual한 이야기이고,
구체적으로 수업에서는
Supervised Learning
Unsupervised Learning
Parametric Method
Multivariate Methods
Clustering
Dimension Reduction Technique
Nonparametric Method
Multi-layer Perceptrons
등의 개념들을 배운다.
이것도 처음 들으면 굉장히 생소하다.
더 쉽게 설명하자면,
어떠한 Data가 들어왔을때 참/거짓을 말해주는 알고리즘부터 시작해서
Regression 및 다른 technique를 이용하여 전체적인 data를 구분하는 일도 하고,
차원이 높은 데이터를 좀 더 쉽게 구분하고 분석하게 하기 위해서 차원을 낮추는 일도 하고,
그렇게 분류한 기초 데이터를 통해서 기계(컴퓨터)가 스스로 판단할 수 있도록 알고리즘을 개발하는 일을 한다.
수업에서 사용한 프로그래밍 언어는 R이라는 프로그래밍 언어다.
R은 Freeware로 http://www.r-project.org/ 에 들어가서 받으면 무료로 사용할 수 있다.
보통 통계 프로그램으로 많이 알려져있지만 기계학습분야에서도 많이 사용된다.