에코프로.AI

[AI Foundation] 머신러닝(ML) 개발을 위한 필요기술 본문

AI Foundation

[AI Foundation] 머신러닝(ML) 개발을 위한 필요기술

AI_HitchHiker 2024. 1. 18. 15:11


머신러닝을 사용하여, 데이터를 전처리하고, 모델을 만들고, 검증등의 작업을 하려면 여러가지 기초지식이 필요합니다.

아래의 지식들을 어느정도 알고있어야 상황에 맞고 효율적인 모델작업이 가능합니다.

 


1. 수학 지식

https://www.techslang.com/the-role-of-mathematics-in-machine-learning/

 

너무 깊은 지식은 필요하지 않을 수도 있으나, 기초적인 흐름은 알고있어야, 모델의 검증이나 모델조정작업 시

원활한 작업이 가능할 것 같습니다.

  • 통계학 : 데이터 이해, 기술적 통계, 확률론
  • 선형대수 : 벡터, 행렬 연산
  • 미적분학 : 함수의 이해, 기울기, 최적화
  • 기초적인 확률론 : 확률적 사고, 조건부 확률


2. 프로그래밍 지식

https://devopedia.org/machine-learning-in-python

 

R언어도 많이 사용한다고 하나, 범용성이나 플렉시블한 부분관련 파이썬을 추천합니다.

  • 파이썬 : 머신러닝에서 가장 널리 사용되는 언어
  • 데이터 처리 : Pandas, NumPy
  • 데이터 시각화 : Matplotlib, Seaborn
  • 머신러닝 라이브러리
  • 파이토치(PyTorch) : facebook에서 만든 딥러닝 연구 플랫폼입니다. 코드를 조금 간결하게 쓸 수 있습니다.
  • 사이킷런(scikit-learn) : 머신 러닝 라이브러리 중에 하나인데, 학습하고 사용하기 쉬운데, 딥러닝과 강화학습 라이브러리를 지원하지 않습니다.
  • 텐서플로우(TensorFlow) : 2015년에 오픈 소스로 공개된 구글의 러신러닝 시스템입니다. 복잡한 머신 러닝 작업을 텐서플로우를 사용하여 간단하게 구현할 수 있습니다.
  • 케라스(Kreas) : 오픈소스 신경망 라이브러리이고, 텐서플로우, MXNet, Deeplearning4j 등을 백엔드로 사용하여 AI코딩을 할 수 있게 해줍니다.


3. 머신러닝 지식

  • 지도 학습 (Supervised Learning) : 회귀, 분류
  • 비지도 학습 (Unsupervised Learning) : 클러스터링, 차원 축소
  • 모델 평가 : 교차 검증, 성능 지표 이해


4. 심화 머신러닝 지식

  • 신경망과 딥러닝 : 기본 아키텍처, 역전파
  • 특화된 학습 방법 : 강화학습, 전이학습


5. 실전 프로젝트

  • 데이터셋 이해와 전처리
  • 실제 문제 해결을 위한 모델 설계
  • 모델 튜닝과 최적화


6. 참고 자료 및 웹사이트


이 과정들은 이론적인 지식부터 실제 코딩까지 다루고 있으며, 실제 데이터셋을 활용한 실습을 포함하고 있어 매우 유용합니다. 머신러닝을 배우는 데 있어서 가장 중요한 것은 이론적 지식뿐만 아니라 실제 문제에 적용해보는 경험을 쌓는 것입니다. 따라서, 이론 공부와 병행하여 다양한 프로젝트와 챌린지에 참여해 보는 것을 추천합니다.

 


더보기

Feat. ChatGPT
Q. 머신러닝을 처음부터 배우려고 해.
필요한 기초지식과 기술관련해서 교육순서와 항목을 정리해서 알려줘.
참고 사이트가 있으면 사이트로 참조해줘.

A. 머신러닝을 처음부터 배우는 것은 흥미롭고 가치 있는 여정이 될 것입니다. 이 분야를 공부하기 위해 필요한 기초 지식과 기술을 단계별로 정리해보겠습니다.

1. 수학 기초
통계학: 데이터 이해, 기술적 통계, 확률론
선형대수: 벡터, 행렬 연산
미적분학: 함수의 이해, 기울기, 최적화
기초적인 확률론: 확률적 사고, 조건부 확률
2. 프로그래밍 기초
파이썬: 머신러닝에서 가장 널리 사용되는 언어
데이터 처리: Pandas, NumPy
데이터 시각화: Matplotlib, Seaborn
3. 머신러닝 기초
감독 학습: 회귀, 분류
비감독 학습: 클러스터링, 차원 축소
모델 평가: 교차 검증, 성능 지표 이해
4. 심화 머신러닝
신경망과 딥러닝: 기본 아키텍처, 역전파
특화된 학습 방법: 강화학습, 전이학습
5. 실전 프로젝트
데이터셋 이해와 전처리
실제 문제 해결을 위한 모델 설계
모델 튜닝과 최적화
참고 자료 및 웹사이트
Coursera - Andrew Ng의 "Machine Learning" 코스
Kaggle - 데이터 과학 및 머신러닝 관련 경연대회 및 학습 자료
edX - 다양한 대학의 무료 온라인 과정
Udemy 또는 Udacity - 실무 중심의 강의
Google's Machine Learning Crash Course - 구글 제공 무료 과정
DeepLearning.AI - 딥러닝에 중점을 둔 과정
이 과정들은 이론적인 지식부터 실제 코딩까지 다루고 있으며, 실제 데이터셋을 활용한 실습을 포함하고 있어 매우 유용합니다. 머신러닝을 배우는 데 있어서 가장 중요한 것은 이론적 지식뿐만 아니라 실제 문제에 적용해보는 경험을 쌓는 것입니다. 따라서, 이론 공부와 병행하여 다양한 프로젝트와 챌린지에 참여해 보는 것을 추천합니다.