머신러닝 모델 성능 평가 (홀드아웃 및 k-겹 교차 검증)
모델이 너무 간단하면 과소적합(높은 편향)이 문제가 되기도하고, 모델이 너무 복잡하면 훈련 데이터에 과대적합(높은 분산)이 일어나 문제가 되곤 합니다.이런 현상을 피해 적절한 편향-분산 trade-off를 찾기 위해서는 모델을 잘 평가해야 하는데, 대표적인 교차 검증 기법인 홀드아웃 교차 검증(holdout cross-validation)과 k-겹 교차 검증(k-fold cross-validation)을 이용하여 신뢰 할만한 추정을 찾습니다.이는 모델의 일반화 성능, 즉 처음 본 데이터에 모델이 얼마나 잘 동작하는지 추정하도록 도와줍니다.홀드아웃 교차 검증(holdout cross-validation)데이터셋을 모델 훈련에 사용할 훈련 세트와 일반화 성능을 추정하는데 사용할 테스트 세트로 나눕니다.그리고..