본문 바로가기

ML with SckitLearn

사이킷런(Scikit-Learn)의 내장 데이타 세트 : IRIS (load_iris())

반응형

사이킷런에는 별도의 외부 웹사이트에서 데이터 세트를 내려받을 필요 없이 예제로 활용할 수 있는 간단하면서도 좋은 데이터 세트가 내장돼 있습니다. 이 데이터는 datasets모듈에 있는 여러 API를 호출해 만들 수 있습니다. 

 

●분류나 회귀 연습용 예제 데이터

API명 설명
datasets.load_iris() 분류 용도이며, 붓꽃에 대한 피처를 가진 데이터 세트

 

사이킷런에 내장된 이 데이터 세트는 일반적으로 딕셔너리 형태로 돼 있습니다.

키는 보통 data, target, target_name, feature_names, DESCR로 구성돼 있습니다.

 

  • data : 피처의 데이터 세트
  • target : 분류 시 레이블 값, 회귀일 때는 숫자 결과값 데이터 Set
  • target_names : 개별 레이블의 이름을 나타냅니다.
  • feature_names : 피처의 이름을 나타냅니다.
  • DESCR : 데이터 세트에 대한 설명과 각 피처의 설명을 나타냅니다.

 

● Dataset Load : IRIS

from sklearn.datasets import load_iris

iris_data = load_iris()
keys = iris_data.keys()
print('IRIS''s Keys', keys)
#Result
IRISs Keys dict_keys(['data', 'target', 'frame', 'target_names', 'DESCR', 'feature_names', 'filename'])

 

IRIS's data structure

 

 IRIS's data structure Print

print('IRIS''s Keys', keys)

print('feature names''s shape:', len(iris_data.feature_names))
print('feature names :', iris_data.feature_names)

print('target names''s shape:', len(iris_data.target_names))
print('target names :', iris_data.target_names)

print('data shape :', iris_data.data.shape)
print('data :', iris_data['data'])

print('target shape :', iris_data.target.shape)
print('target :', iris_data.target)
#Result
feature namess shape: 4
feature names : ['sepal length (cm)', 'sepal width (cm)', 'petal length (cm)', 'petal width (cm)']

target namess shape: 3
target names : ['setosa' 'versicolor' 'virginica']

data shape : (150, 4)
data : [[5.1 3.5 1.4 0.2]
 [4.9 3.  1.4 0.2]
 [4.7 3.2 1.3 0.2]
 [4.6 3.1 1.5 0.2]
 [5.  3.6 1.4 0.2]
 [5.4 3.9 1.7 0.4]
 [4.6 3.4 1.4 0.3]
 .......
 [5.8 2.7 5.1 1.9]
 [6.8 3.2 5.9 2.3]
 [6.7 3.3 5.7 2.5]
 [6.7 3.  5.2 2.3]
 [6.3 2.5 5.  1.9]
 [6.5 3.  5.2 2. ]
 [6.2 3.4 5.4 2.3]
 [5.9 3.  5.1 1.8]]
 
target shape : (150,)
target : [0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
 0 0 0 0 0 0 0 0 0 0 0 0 0 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1
 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 2 2 2 2 2 2 2 2 2 2 2
 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2
 2 2]
반응형