수학 - Mathematics

데이터 분석, 데이터 마이닝, 기계 학습의 하부로 깊숙히 들어가면 갈수록 결국 수학에서 자유로울수는 없다. 데이터과학에서도 이과라고 불리는 공학계, 이학계의 대학과정을 졸업한 사람이라면 반드시 익혀야 할 기초 대수학을 익히지 않으면 결국 고급 기술을 제대로 활용하기 어렵다. 데이터과학을 접하는 초기 단계에서는 수학이 크게 중요하지 않은 것 처럼 보일 수도 있지만 고급 기술이나 정밀도가 높고 섬세한 작업을 하기 위해서는 대수학에 대한 학습이 중급 수준까지 되어야 한다.

데이터 마이닝, 기계 학습에 필요한 수학은 익히 잘 알려진 것처럼 공학에서 기본적으로 배워야 하는 미분적분, 선형대수학, 미분방정식이다. 이 대수학들은 대수학에서 가장 쉬운 것들이라고 알려졌지만 현실적으로 아직까지는 수학과나 수학과 밀접한 관련이 있는 학과가 아닌 이상은 다 익히기 어렵고 개인의 노력이 많이 필요하다.

데이터과학을 하는 동안 대수학은 꾸준히 공부해야 하며 일정 수준까지 도달하지 못하면 일정 단계 이상의 데이터과학자가 되는 것은 어렵다.

행렬 Matrix

벡터와 선형공간을 다루는 수학을 선형대수학이라고 한다. 만약 행렬을 본적이 있고 행렬이 있는 수식을 본적이 있다면 틀림없이 선형대수학에 관련된 것이다. 선형대수학은 행렬을 다루는 수학이다.

선형대수학은 행렬대수학이라고 부르기도 하는데 선형대수학으로 부르는 이유는 벡터공간에서 벡터를 선형으로 이동하는 것으로 문제를 해결하기 때문이다. 선형이동은 벡터에 숫자를 가감승제하는 사칙연산으로 공간에서의 위치를 바꾸는 것으로 문제를 해결하기 때문이다. 벡터에 덧셈, 뺄셈, 곱셈, 나눗셈을 하면 벡터가 선형으로 이동한다. 즉 직선으로 움직인다.

미적분 Calculus

기계학습이나 선형최적화, 딥러닝들은 모두 실제로는 최적화 문제이다. 수학에서 최적화 문제를 푸는 방법은 여러가지가 있지만 가장 쉬운 것이 미분이다. 그리고 확률과 고급 통계학을 익히기 위해서는 적분이 필요하다.

대부분의 유명한 알고리즘은 깊이 파들어가면 끝에 거의 항상 편미분이 나온다. 미분과 적분을 모두 익히고 싶지 않더라도 편미분까지는 필수라고 할 수 있다.

수학과 데이터과학에 대한 가상의 질문과 답변 목록

  • Q: 편미분을 모르면 기계학습 모델을 만들 수 없는가? A: 있다.