KNN(K-Nearest-Neighbours Classiflication)分类算法,供大家参考,具体内容如下
最简单的分类算法,易于理解和实现
实现步骤:通过选取与该点距离最近的k个样本,在这k个样本中哪一个类别的数量多,就把k归为哪一类。
注意
- 该算法需要保存训练集的观察值,以此判定待分类数据属于哪一类
- k需要进行自定义,一般选取k<30
- 距离一般用欧氏距离,即"" src="/UploadFiles/2021-04-08/20191016115623808.jpg">
通过sklearn对数据使用KNN算法进行分类
代码如下:
## 导入鸢尾花数据集 iris = datasets.load_iris() data = iris.data[:, :2] target = iris.target ## 区分训练集和测试集,75%的训练集和25%的测试集 train_data, test_data = train_test_split(np.c_[data, target]) ## 训练并预测,其中选取k=15 clf = neighbors.KNeighborsClassifier(15, 'distance') clf.fit(train_data[:, :2], train_data[:, 2]) Z = clf.predict(test_data[:, :2]) print '准确率:' ,clf.score(test_data[:, :2], test_data[:, 2]) colormap = dict(zip(np.unique(target), sns.color_palette()[:3])) plt.scatter(train_data[:, 0], train_data[:, 1], edgecolors=[colormap[x] for x in train_data[:, 2]],c='', s=80, label='all_data') plt.scatter(test_data[:, 0], test_data[:, 1], marker='^', color=[colormap[x] for x in Z], s=20, label='test_data') plt.legend() plt.show()
结果如下:
以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持。
免责声明:本站文章均来自网站采集或用户投稿,网站不提供任何软件下载或自行开发的软件!
如有用户或公司发现本站内容信息存在侵权行为,请邮件告知! 858582#qq.com
暂无“python运用sklearn实现KNN分类算法”评论...
RTX 5090要首发 性能要翻倍!三星展示GDDR7显存
三星在GTC上展示了专为下一代游戏GPU设计的GDDR7内存。
首次推出的GDDR7内存模块密度为16GB,每个模块容量为2GB。其速度预设为32 Gbps(PAM3),但也可以降至28 Gbps,以提高产量和初始阶段的整体性能和成本效益。
据三星表示,GDDR7内存的能效将提高20%,同时工作电压仅为1.1V,低于标准的1.2V。通过采用更新的封装材料和优化的电路设计,使得在高速运行时的发热量降低,GDDR7的热阻比GDDR6降低了70%。
更新动态
20240727
20240727
- 《刀郎13CD合集》[WAV+CUE][8.4G]
- 群星.2024-天行健影视剧原声带【企鹅影视】【FLAC分轨】
- 郑源2008-源·情歌[首版][WAV+CUE]
- 郭峰1999-甘心情愿[首版][WAV+CUE]
- 关智斌.2006-寻找美惠【英皇娱乐】【FLAC分轨】
- 谢安琪.2007-THEFIRSTDAY(新歌+重绎)【新艺宝】【WAV+CUE】
- 群星.1992-1994-宝丽金绝佳经典2辑【宝丽金】【WAV+CUE】
- 雷婷-《我的爱回不来(紫银合金AQCD)》[WAV+CUE]
- 群星《妙音20周年辉煌经典纪念版》蓝光BSCD[正版原抓WAV+CUE]
- 【雨果唱片】音乐图书馆系列《绣金匾》1999【WAV整轨+CUE】
- 曜爆甘弦乐团《忆声弦命 滚石40【40首OST 致经典】》[320K/MP3][94.1MB]
- 曜爆甘弦乐团《忆声弦命 滚石40【40首OST 致经典】》[FLAC/分轨][208.1MB]
- 丁当《日与夜,跟自己说晚安》[320K/MP3][98.51MB]
- 何炅.2005-漫游【中唱】【WAV+CUE】
- 何嘉莉.1998-MYDREAMS(EP)【飞图】【WAV+CUE】