언더샘플링 썸네일형 리스트형 Python으로 불균형 데이터 전처리하기 소개 머신 러닝에서 데이터 전처리는 원시 데이터를 머신 러닝 모델에 더 적합한 형식으로 변환하는 중요한 단계입니다. 머신 러닝에서 흔히 발생하는 문제 중 하나는 한 클래스의 인스턴스 수가 다른 클래스보다 훨씬 많거나 적은 불균형 데이터를 처리하는 것입니다. 이 글에서는 데이터의 균형을 맞추고 머신 러닝 모델의 성능을 개선하는 데 도움이 되는 기술을 중심으로 Python을 사용하여 불균형 데이터를 전처리하는 방법을 살펴보겠습니다. 불균형 데이터 이해하기 전처리 기법을 살펴보기 전에 먼저 불균형 데이터가 무엇인지 이해해 보겠습니다. 분류 문제에서 목표는 특징 집합을 기반으로 주어진 인스턴스의 클래스를 예측하는 것입니다. 한 클래스의 인스턴스 수가 다른 클래스보다 훨씬 많거나 적은 데이터 세트가 있다면 불균형.. 더보기 이전 1 다음