반응형
Pandas에서 기초 통계를 위한 groupby 응용, 직접 실행해 보면 어떻게 나오는지 확인이 가능합니다. '빈도수'를 확인하기 위한 nunique()를 사용합니다. 즉 Unique한 Valu를 구할 때 유용합니다.
무엇보다 맨 하단의 예제를 통해 matplotlib를 통해 Pandas의 데이타를 간단한 명령어로 시각화하는 방법의 예시를 잘 기억해두세요.
import pandas as pd
# print("\n-- \n", "")
pandas_DF = pd.read_csv(r'C:\Users\HANA\PycharmProjects\HANATOUR\Pandas\doit_pandas-master\data\gapminder.tsv', sep='\t')
print("\n-- pandas_DF.columns\n", pandas_DF.columns)
#0~9개만 나오게 한다.
print(pandas_DF.head(n=10))
#select mean(lifeExp) from pandas_DF gorup by year
print(pandas_DF.groupby('year')['lifeExp'].mean())
grouped_year_df = pandas_DF.groupby('year')
print('grouped_year_df\n', grouped_year_df)
grouped_year_df_lifeExp = grouped_year_df['lifeExp']
mean_lifeExp_by_year = grouped_year_df_lifeExp.mean()
print('mean_lifeExp_by_year\n', mean_lifeExp_by_year)
multi_group_var = pandas_DF.groupby(['year','continent'])[['lifeExp', 'gdpPercap']].mean()
print('multi_group_var\n', multi_group_var)
print('nonique\n', pandas_DF.groupby('continent')['country'].nunique())
matplolib를 이용해 상기 Pandas의 그룹에 Plot()만 넣으면 바로 그래프를 그릴 수 있어 편리하게 이용할 수 있다.
import matplotlib.pyplot as plt
#그래프그리기
pandas_DF.groupby('year')['lifeExp'].mean().plot()
plt.show()
반응형
'Pandas' 카테고리의 다른 글
Pandas Sidetable: 판다스 똑똑하게 사용하기 - Freq, Counts, Missing, Subtotal (0) | 2021.04.16 |
---|---|
데이타 결측치(누락값, 결측값) 처리하기 : fillna (ffill, bfill), dropna, isnull (0) | 2020.12.07 |
Pandas에서 시간, 날짜 다루기 - to_datetime만 잘 다루면 끝! (0) | 2020.11.28 |
Pandas, read_excel()을 이용한 데이타 읽은 후 K-Means에 적용하기: 실습 (0) | 2020.11.27 |
[TIP] Pycharm, Run Window에서 결과 값 전체 보이게 하기 (0) | 2020.11.01 |
Pandas 데이터 추출, 활용 하기 : loc, iloc 활용 [슬라이싱] (0) | 2020.10.14 |
Pandas 데이터 추출, 활용 하기 : loc, iloc 활용 [행단위] (0) | 2020.10.09 |
Pandas(판다스)로 데이터 핸들링 : 기본 : info(), describe(), value_counts(), head() (1) | 2020.10.04 |