Data Science
세미 랜덤 데이터에 대해 k 최근접 이웃 분류를 실행
editor2080
2018. 6. 29. 14:12
1.
1-1. code
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 | from sklearn import neighbors, metrics import numpy as np # 랜덤 예측 변수 데이터를 생성하고, 예측 데이터에 기반한 세미 랜덤 목표 데이터를 생성 predictors = np.random.random(1000).reshape(500, 2) target = np.around(predictors.dot(np.array([0.4, 0.6])) + np.random.random(500)) # 10 최근접 이웃 모델을 적용 clf = neighbors.KNeighborsClassifier(n_neighbors = 10) knn = clf.fit(predictors, target) # 모델 적합 점수 취득 knn.score(predictors, target) # 예측값을 사용해 실제와 비교. 비교에는 혼동 행렬을 사용 prediction = knn.predict(predictors) # 3x3 행렬을 취득 metrics.confusion_matrix(target, prediction) | cs |
1-2. result
출처: 파이썬으로 배우는 데이터 과학 입문과 실습 소규모 데이터셋 처리부터 빅데이터 처리, 머신러닝, 시각화까지