-
[IMLP] Chapter 2. 지도 학습 (1)Machine Learning/Intro to Machine Learning with Python 2022. 5. 18. 15:47
본 글은 2.1, 2.2까지 정리한 내용!
챕터가 길어서 주요 내용끼리 묶어서 정리할 예정
[분류와 회귀]
#. 분류
- 미리 정의된, 가능서 ㅇ있는 여러 클래스 레이블 중 하나를 예측
- 이진 분류(binary) 혹은 다중 분류(multiclass)
- 답은 예/아니오
- 예시: 스팸 분류
#. 회귀
- 부동소수점수를 예측
- 예시: 연간 소득 예측
#. 출력값에 연속성이 있는지로 회귀/분류 구분 가능
[일반화, 과대적합, 과소적합]
#. 일반화(generatlization)
: 모델이 처음 보는 데이터에 대해 정확하게 예측 가능
#. 과적합(overfitting)
: 가진 정보를 모두 사용해서 복잡한 모델을 만드는 것
#. 과소적합(underfitting)
: 데이터의 면면과 다양성을 잡아내지 못하고 훈련 세트에도 잘 맞지 않는, 너무 간단한 모델
#. 예제
-> 익숙하지 않은 function 정리 1: np.bincount()
print("클래스별 샘플 개수:\n{}".format({n: v for n, v in zip(cancer.target_names, np.bincount(cancer.target))}))
'Machine Learning > Intro to Machine Learning with Python' 카테고리의 다른 글
[IMLP] Chapter 2. 지도 학습 (3) - 지도학습 알고리즘 (3): 나이브 베이즈 분류기 (0) 2022.05.18 [IMLP] Chapter 2. 지도 학습 (3) - 지도학습 알고리즘 (2): 선형 모델 (0) 2022.05.18 [IMLP] Chapter 2. 지도 학습 (2) - 지도학습 알고리즘 (1): k-NN (0) 2022.05.18 [IMLP] Chapter 1. 소개 (0) 2022.05.18 [IMLP] 시작 (0) 2022.05.18