목차
1. 인공지능, 머신러닝, 딥러닝
2. 지도학습, 비지도학습, 강화학습
3. 머신러닝 라이프 사이클

 

1. 인공지능 > 머신러닝 > 딥러닝

인공지능 : 인공 + 지능 기계가 인간처럼 지능을 가지고 하는 일 (인간의 인지 능력을 기계가 모방)

머신러닝 : AI의 하위 분야, 프로그래밍이 되어 있지 않아도 데이터셋으로부터 학습, 예측, 결정 하는 시스템 (데이터로부터 패턴 인식), (어떠한 작업 T에 대하여 경험 E와 함께 성능 P를 향상시킨다) 머신러닝 작업을 하려면 T, E, P가 확실히 정의되어야 한다.)

딥러닝 : 머신러닝의 하위 분야 (신경망 기반 모델)

 

2. 지도학습 VS 비지도학습 VS 강화학습

- 지도학습 : 훈련데이터를 통해서 정답 레이블을 함께 학습시켜 원하는 결과를 얻도록 학습

 ex) 분류, 회귀, 주어진 이미지가 어떤 레이블을 가지는지 분류, kNN

- 비지도학습 : 훈련데이터 속에서 패턴을 찾아 유사성을 가지고 학습. (정답레이블 제공하지 않음)

 ex) 군집화, K-Means

- 강화학습 : 특수 환경에서 정의된 agent를 특정 작업을 무수히 반복하면서 행동에 대한 보상을 받으며 학습. (지도학습, 비지도학습과 달리 데이터셋으로 학습시키지 않음)

  ex) 게임이론, 자율주행

 

(같이 읽어보면 좋을 자료)

Hands-On-ML/Chap16-Reinforcement_Learning/Chap16-Reinforcement_Learning.ipynb at master · ExcelsiorCJH/Hands-On-ML (github.com)

 

3. 머신러닝 라이프 사이클

머신러닝 라이프 사이클 : 머신 러닝 모델을 개발, 배포, 유지보수하는 일련의 단계들을 정의하는 프로세스

 

크게 6가지 단계가 있다. 

1. 계획하기

2. 데이터 준비

3. 모델 엔지니어링

4. 모델 평가

5. 모델 배포

6. 모니터링 및 유지, 관리

 

1. 해결하려고 하는 문제가 뭔지, 비즈니스 측면에서 어떤 수익을 창출할 수 있으며 실현 가능성이 있는지 확인하는 단계다. 단지 흥미로운지에 대한 이슈만 고려하는 것이 아니라 머신러닝을 사용하여 어떻게 개선해 나갈 수 있는지 타당성 보고서를 작성한다. 

2. 내부 데이터 수집, 오픈 소스로 수집(스크래핑), 공급업체에서 구매하거나 합성 데이터를 생성하는 등 방법으로 데이터를 수집할 수 있다. 데이터를 수집하고도 사용하지 않는 경우가 있기 때문에 데이터 수집과 라벨링에는 돈, 시간, 전문가, 법적 계약이 필요하다. 수집하고 나면 누락된 값, 이상치, 불균형 클래스 처리, 데이터 증강 등을 실행한다. 

3. 본격적으로 2에서 준비한 데이터를 기반으로 모델 아키텍쳐를 구축하고 훈련하는 단계다. 모델 metric에 대해 정의하고, 학습, 검증 데이터셋을 기반으로 모델을 학습하고 검증한다. 

4. 모델이 production에 적합한지를 확인하기 위해서 다양한 지표로 모델을 평가한다. 

5, 6. 배포 후 지속적인 모니터링을 통해 업데이트 과정을 거친다. 

 

 

 

강화 학습 - 위키백과, 우리 모두의 백과사전 (wikipedia.org)

sweetpotato7