본문 바로가기

Pandas

Pandas 기초 통계를 위한 groupby 응용 - nunique()와 matplot로 그래프 간단하게 그리기

반응형

 

Pandas에서 기초 통계를 위한 groupby 응용, 직접 실행해 보면 어떻게 나오는지 확인이 가능합니다.  '빈도수'를 확인하기 위한 nunique()를 사용합니다. 즉 Unique한 Valu를 구할 때 유용합니다.

 

무엇보다 맨 하단의 예제를 통해 matplotlib를 통해 Pandas의 데이타를 간단한 명령어로 시각화하는 방법의 예시를 잘 기억해두세요.

 

 

gapminder.tsv
0.08MB

import pandas as pd

# print("\n-- \n", "")
pandas_DF = pd.read_csv(r'C:\Users\HANA\PycharmProjects\HANATOUR\Pandas\doit_pandas-master\data\gapminder.tsv', sep='\t')
print("\n-- pandas_DF.columns\n", pandas_DF.columns)

#0~9개만 나오게 한다.
print(pandas_DF.head(n=10))

#select mean(lifeExp) from pandas_DF gorup by year
print(pandas_DF.groupby('year')['lifeExp'].mean())

grouped_year_df = pandas_DF.groupby('year')
print('grouped_year_df\n', grouped_year_df)

grouped_year_df_lifeExp = grouped_year_df['lifeExp']
mean_lifeExp_by_year = grouped_year_df_lifeExp.mean()
print('mean_lifeExp_by_year\n', mean_lifeExp_by_year)

multi_group_var = pandas_DF.groupby(['year','continent'])[['lifeExp', 'gdpPercap']].mean()
print('multi_group_var\n', multi_group_var)

print('nonique\n', pandas_DF.groupby('continent')['country'].nunique())

 

matplolib를 이용해 상기 Pandas의 그룹에 Plot()만 넣으면 바로 그래프를 그릴 수 있어 편리하게 이용할 수 있다.

import matplotlib.pyplot as plt

#그래프그리기
pandas_DF.groupby('year')['lifeExp'].mean().plot()
plt.show()

반응형