에코프로.AI

[AI Foundation] 머신러닝(ML)과 수학 본문

AI Foundation

[AI Foundation] 머신러닝(ML)과 수학

AI_HitchHiker 2024. 1. 18. 15:11


머신러닝(ML)에 수학이 필요한 이유

수학을 몰라도 파이썬을 이용해서, 머신러닝 모델을 생성할 수는 있지만, 모델 알고리즘을 최적화하고,결과를 해석할려면아래와 같은 관련 수학지식이 필요합니다. 

  • 이해와 설계 : 머신러닝 알고리즘은 수학적 개념을 기반으로 합니다. 이를 이해하고 효율적으로 설계하기 위해서는 기본적인 수학 지식이 필요합니다.
  • 최적화 : 머신러닝 모델을 훈련시키는 과정은 주어진 데이터에 대해 최적의 패턴을 찾는 것을 포함합니다. 이 과정은 수학적 최적화 기법을 사용합니다.
  • 데이터 이해 : 데이터의 구조와 패턴을 파악하고 모델링하기 위해 통계학적 방법이 필요합니다.
  • 결과 해석 : 모델의 결과를 해석하고 유효성을 검증하기 위해 통계적 지식이 필요합니다.

머신러닝(ML)에 필요한 수학

  • 선형대수학 : 벡터와 행렬은 머신러닝에서 데이터를 표현하는 기본 단위입니다. 선형대수학은 데이터 구조와 변환을 이해하는 데 필수적입니다.
  • 확률론과 통계학 : 데이터의 불확실성을 모델링하고, 추론을 위해 필요합니다. 또한, 모델의 성능을 평가하고 해석하는 데 중요한 역할을 합니다.
  • 미적분학 : 머신러닝 모델을 최적화하기 위해 손실 함수의 최소화나 최대화를 계산할 때 미분이 사용됩니다. 경사하강법 같은 최적화 알고리즘은 미적분학에 기반을 둡니다.
  • 최적화 이론 : 모델의 학습 과정에서 최적의 매개변수를 찾기 위해 사용되는 수학적 방법론입니다.
  • 정보 이론 : 데이터에서 정보를 추출하고 이해하는 방법을 제공합니다. 예를 들어, 엔트로피와 정보 이득 개념은 의사결정 트리 알고리즘에 사용됩니다.

머신러닝(ML)의 모델 별 수학과의 연계성

선형 회귀(Linear Regression)

  • 개념 : 데이터 포인트들 사이의 최적의 직선을 찾는 알고리즘입니다.
  • 수학의 역할 : 데이터 포인트들 사이의 거리(오차)를 최소화하는 직선의 방정식을 찾기 위해 대수학과 통계학이 사용됩니다.

로지스틱 회귀(Logistic Regression)

  • 개념 : 데이터가 특정 카테고리에 속할 확률을 계산하는 알고리즘입니다. 예를 들어, 이메일이 스팸인지 아닌지 결정합니다.
  • 수학의 역할 : 확률을 계산하기 위해 확률론과 통계학이 필요하며, 최적의 파라미터를 찾기 위해 미적분과 최적화 이론이 사용됩니다.

결정 트리(Decision Tree)

  • 개념 : 데이터를 분류하거나 값을 예측하는 데 사용되는 트리 구조의 모델입니다. 각 분기점은 데이터의 특성에 대한 질문을 나타냅니다.
  • 수학의 역할 : 데이터를 어떻게 분할할지 결정하기 위해 정보 이론(엔트로피와 정보 이득)이 사용됩니다.

랜덤 포레스트(Random Forest)

  • 개념 : 여러 결정 트리를 결합하여 더 강력한 모델을 만드는 알고리즘입니다.
  • 수학의 역할 : 각 트리의 성능을 평가하고 결합하는 방법을 결정하기 위해 통계학이 중요합니다.

신경망(Neural Networks)

  • 개념 : 뇌의 신경망을 모방하여 복잡한 패턴을 인식하고 학습하는 모델입니다.
  • 수학의 역할 : 신경망의 학습 과정에서 미분(경사 하강법)과 선형 대수학(행렬 연산)이 핵심적으로 사용됩니다.

서포트 벡터 머신(Support Vector Machine, SVM)

  • 개념 : 데이터를 가장 잘 구분하는 경계를 찾는 알고리즘입니다.
  • 수학의 역할 : 데이터 간의 거리(마진)를 최대화하는 경계를 찾기 위해 벡터와 최적화 이론이 사용됩니다.
    각 모델은 데이터의 특성과 문제의 종류에 따라 선택되며, 수학은 이러한 알고리즘을 이해하고 적용하는 데 필수적인 역할을 합니다. 수학적 개념들은 모델이 어떻게 작동하는지 이해하고, 어떤 상황에서 사용해야 하는지 결정하는 데 도움을 줍니다.