반응형
사이킷런에는 별도의 외부 웹사이트에서 데이터 세트를 내려받을 필요 없이 예제로 활용할 수 있는 간단하면서도 좋은 데이터 세트가 내장돼 있습니다. 이 데이터는 datasets모듈에 있는 여러 API를 호출해 만들 수 있습니다.
●분류나 회귀 연습용 예제 데이터
API명 | 설명 |
datasets.load_iris() | 분류 용도이며, 붓꽃에 대한 피처를 가진 데이터 세트 |
사이킷런에 내장된 이 데이터 세트는 일반적으로 딕셔너리 형태로 돼 있습니다.
키는 보통 data, target, target_name, feature_names, DESCR로 구성돼 있습니다.
- data : 피처의 데이터 세트
- target : 분류 시 레이블 값, 회귀일 때는 숫자 결과값 데이터 Set
- target_names : 개별 레이블의 이름을 나타냅니다.
- feature_names : 피처의 이름을 나타냅니다.
- DESCR : 데이터 세트에 대한 설명과 각 피처의 설명을 나타냅니다.
● Dataset Load : IRIS
from sklearn.datasets import load_iris
iris_data = load_iris()
keys = iris_data.keys()
print('IRIS''s Keys', keys)
#Result
IRISs Keys dict_keys(['data', 'target', 'frame', 'target_names', 'DESCR', 'feature_names', 'filename'])
● IRIS's data structure
● IRIS's data structure Print
print('IRIS''s Keys', keys)
print('feature names''s shape:', len(iris_data.feature_names))
print('feature names :', iris_data.feature_names)
print('target names''s shape:', len(iris_data.target_names))
print('target names :', iris_data.target_names)
print('data shape :', iris_data.data.shape)
print('data :', iris_data['data'])
print('target shape :', iris_data.target.shape)
print('target :', iris_data.target)
#Result
feature namess shape: 4
feature names : ['sepal length (cm)', 'sepal width (cm)', 'petal length (cm)', 'petal width (cm)']
target namess shape: 3
target names : ['setosa' 'versicolor' 'virginica']
data shape : (150, 4)
data : [[5.1 3.5 1.4 0.2]
[4.9 3. 1.4 0.2]
[4.7 3.2 1.3 0.2]
[4.6 3.1 1.5 0.2]
[5. 3.6 1.4 0.2]
[5.4 3.9 1.7 0.4]
[4.6 3.4 1.4 0.3]
.......
[5.8 2.7 5.1 1.9]
[6.8 3.2 5.9 2.3]
[6.7 3.3 5.7 2.5]
[6.7 3. 5.2 2.3]
[6.3 2.5 5. 1.9]
[6.5 3. 5.2 2. ]
[6.2 3.4 5.4 2.3]
[5.9 3. 5.1 1.8]]
target shape : (150,)
target : [0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0 0 0 0 0 0 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1
1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 2 2 2 2 2 2 2 2 2 2 2
2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2
2 2]
반응형
'ML with SckitLearn' 카테고리의 다른 글
온라인쇼핑몰을 위한 RFM Segmentation 실전 연습 (0) | 2020.10.02 |
---|---|
[DBSCAN] 밀도기반 군집화 Cluster Algorithm (0) | 2020.10.01 |
Estimator의 이해와 fit(), predict(), accuracy_score() Method (0) | 2020.09.30 |
[GMM] Gaussian Mixture Model 개요에 대해 (0) | 2020.09.29 |
실루엣 분석(Silhouette Analysis) : Clustering 적절성 분석 (0) | 2020.09.27 |
차원 축소 (Dimension Reduction) 개요 (0) | 2020.09.27 |
PCA(Principal Component Analysis) : 차원축소(Dimension Reduction) (0) | 2020.09.26 |
[K-Means] K-평균 Clustering 알고리즘 이해 (0) | 2020.09.21 |