문제이해 --> EDA --> 데이터 전처리 문제이해: 목적을 정확하게 파악하고 목표점을 정한다 EDA: 주어진 데이터를 분석하고 데이터를 이해한다. 데이터 구조파악, 데이터 시각화(주요 피처 파악) 데이터 전처리: 중구난방인 데이터셋을 형태를 일정하게 만들어 주고 필요없는 내용은 걸러낸다. 문제 이해 -문제 정의, 해결해야할 문제 파악, 문제 유형(선형회귀/ 이진분류 등등), 평가 지표 EDA 데이터 구조 탐색 -파일별 용도 파악 -데이터의 양(레코드 수, 피처수, 전체 용량 등) -피처 이해(이름, 의미, 데이터 타입, 결측값 개수, 고윳값 개수, 실제값의 데이터 종류 등등) -훈련 데이터와 테스트 데이터의 차이 -타깃값: 제출(예측)해야 하는 값 데이터 시각화 -feature engineering ..