preview

학습/테스트 분할 (Train-Test Split)

모델 평가의 첫 단계. 데이터를 훈련용 과 평가용 으로 나누지 않으면 "외운 것" 과 "일반화한 것"을 구분할 수 없죠.

왜 단순 자르기는 안 좋은가

데이터가 시간·레이블 순서로 정렬돼 있으면, 앞에서 자르면 훈련/테스트 분포가 달라집니다. 그래서 항상 셔플 후 분할 합니다.

실험을 반복할 때 같은 결과가 나오도록 랜덤 시드(seed) 를 받아 np.random.default_rng(seed) 로 섞습니다.

함수 train_test_split(X, y, test_ratio, seed) 를 완성하세요.