목록2024/02/04 (1)
그로스&퍼포먼스 마케팅

결측치와 중복값 처리는 시리즈,데이터프레임, 나아가 데이터분석의 전처리단계에서 가장 중요한 부분이라고 생각합니다. 결측치란 단순히 말해서 해당 데이터에 값이 없는 것을 뜻합니다. 결측치와 중복값이 존재하는 시리즈를 만들어주었습니다. 결측치 확인 series.isnull() 직접 눈으로 확인하는 법도 있지만, isnull() 함수를 이용하면 해당값이 결측치인지 아닌지를 bool값으로 반환해줍니다. 뒤에 .sum을 덧붙인다면 총 몇개의 결측치가 있는지도 확인이 가능합니다. 결측치 제거 series.dropna() dropna() 함수는 결측치를 모두 제거해줍니다. 괄호안에 옵션을 넣을 수 있지만, 이는 대부분 데이터프레임에서 사용됩니다. 결측치 채우기 result_series = series.fillna(0..
Python
2024. 2. 4. 10:00