← 문제 목록/특성 표준화 (Z-score)

특성 표준화 (Z-score)

데이터 전처리 · easy

preview

특성 표준화 (Z-score Normalization)

특성 간 스케일이 다르면 거리 기반 모델(KNN, SVM)과 경사하강 기반 모델(로지스틱 회귀, 신경망)이 특정 특성에 편향됩니다. 각 열을 평균 0, 표준편차 1로 맞춰주는 게 표준화:

Xij=XijμjσjX'_{ij} = \frac{X_{ij} - \mu_j}{\sigma_j}

여기서 μj,σj\mu_j, \sigma_jjj번째 열의 평균·표준편차.

과제

함수 standardize(X) 를 완성하세요.

  • 입력: (N, D) 2D 배열.
  • 반환: (X_std, mu, sigma) — 표준화된 배열, 컬럼별 평균, 컬럼별 표준편차.
  • 컬럼별 (axis=0) 연산 + 브로드캐스팅.

테스트 케이스

#이름검증
1평균 ≈ 0X_std.mean(axis=0) 가 0에 가까움
2표준편차 ≈ 1X_std.std(axis=0) 가 1에 가까움
3shape 유지출력 shape == 입력 shape
4통계 반환mu shape (D,), sigma shape (D,)
Loading...

코드를 작성하고 Run 을 눌러보세요.