데이타 결측치(누락값, 결측값) 처리하기 : fillna (ffill, bfill), dropna, isnull
데이타, 머신러닝 분석은 결측값 해결부터 시작합니다. 머신러닝의 모든 데이타는 숫자를 통해 행해지고 결측값 즉 NaN, NAN, nun과 같은 방법으로 표기되는 결측값을 처리해야 하는 문제가 있습니다. 모든 Machin Learning 프로그래머들은 해당 작업을 해야 하는 문제에 봉착합니다. 이를 처리하는 방법에 대해 알아보겠습니다. 1. 누락값 확인하기 누락값을 사용하기 위해 numpy에서 누락값을 불러옵니다. from numpy import NAN, NaN, nan 누락값은 0, ' '와 같은 값과는 다른 개념이라는 것에 주의해야 합니다. 누락값은 말 그대로 데이터 자체가 없다는 것을 의미합니다. 아래값을 실행하면 모든 값은 False입니다. 즉 그 어떤것과도 같지 않습니다. print(NaN == ..