세미 랜덤 데이터에 대해 k 최근접 이웃 분류를 실행

Data Science

세미 랜덤 데이터에 대해 k 최근접 이웃 분류를 실행

editor2080 2018. 6. 29. 14:12

1-1. code

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
from sklearn import neighbors, metrics
import numpy as np
 
# 랜덤 예측 변수 데이터를 생성하고, 예측 데이터에 기반한 세미 랜덤 목표 데이터를 생성
predictors = np.random.random(1000).reshape(500, 2)
target = np.around(predictors.dot(np.array([0.4, 0.6])) + np.random.random(500))
 
# 10 최근접 이웃 모델을 적용
clf = neighbors.KNeighborsClassifier(n_neighbors = 10)
knn = clf.fit(predictors, target)
 
# 모델 적합 점수 취득
knn.score(predictors, target)
 
# 예측값을 사용해 실제와 비교. 비교에는 혼동 행렬을 사용
prediction = knn.predict(predictors)
 
# 3x3 행렬을 취득
metrics.confusion_matrix(target, prediction)
 
Colored by Color Scripter
cs

1-2. result

출처: 파이썬으로 배우는 데이터 과학 입문과 실습 소규모 데이터셋 처리부터 빅데이터 처리, 머신러닝, 시각화까지

저작자표시 (새창열림)