1 K-means算法
实际上,无论是从算法思想,还是具体实现上,K-means算法是一种很简单的算法。它属于无监督分类,通过按照一定的方式度量样本之间的相似度,通过迭代更新聚类中心,当聚类中心不再移动或移动差值小于阈值时,则就样本分为不同的类别。
1.1 算法思路
- 随机选取聚类中心
- 根据当前聚类中心,利用选定的度量方式,分类所有样本点
- 计算当前每一类的样本点的均值,作为下一次迭代的聚类中心
- 计算下一次迭代的聚类中心与当前聚类中心的差距
- 如4中的差距小于给定迭代阈值时,迭代结束。反之,至2继续下一次迭代
1.2 度量方式
根据聚类中心,将所有样本点分为最相似的类别。这需要一个有效的盘踞,平方差是最常用的度量方式,如下
2 应用于图像分割
我们知道:无论是灰度图还是RGB彩色图,实际上都是存有灰度值的矩阵,所以,图像的数据格式决定了在图像分割方向上,使用K-means聚类算法是十分容易也十分具体的。
2.1 Code
导入必要的包
import numpy as np import random
损失函数
def loss_function(present_center, pre_center): ''' 损失函数,计算上一次与当前聚类中的差异(像素差的平方和) :param present_center: 当前聚类中心 :param pre_center: 上一次聚类中心 :return: 损失值 ''' present_center = np.array(present_center) pre_center = np.array(pre_center) return np.sum((present_center - pre_center)**2)
分类器
def classifer(intput_signal, center): ''' 分类器(通过当前的聚类中心,给输入图像分类) :param intput_signal: 输入图像 :param center: 聚类中心 :return: 标签矩阵 ''' input_row, input_col= intput_signal.shape # 输入图像的尺寸 pixls_labels = np.zeros((input_row, input_col)) # 储存所有像素标签 pixl_distance_t = [] # 单个元素与所有聚类中心的距离,临时用 for i in range(input_row): for j in range(input_col): # 计算每个像素与所有聚类中心的差平方 for k in range(len(center)): distance_t = np.sum(abs((intput_signal[i, j]).astype(int) - center[k].astype(int))**2) pixl_distance_t.append(distance_t) # 差异最小则为该类 pixls_labels[i, j] = int(pixl_distance_t.index(min(pixl_distance_t))) # 清空该list,为下一个像素点做准备 pixl_distance_t = [] return pixls_labels
基于k-means算法的图像分割
def k_means(input_signal, center_num, threshold): ''' 基于k-means算法的图像分割(适用于灰度图) :param input_signal: 输入图像 :param center_num: 聚类中心数目 :param threshold: 迭代阈值 :return: ''' input_signal_cp = np.copy(input_signal) # 输入信号的副本 input_row, input_col = input_signal_cp.shape # 输入图像的尺寸 pixls_labels = np.zeros((input_row, input_col)) # 储存所有像素标签 # 随机初始聚类中心行标与列标 initial_center_row_num = [i for i in range(input_row)] random.shuffle(initial_center_row_num) initial_center_row_num = initial_center_row_num[:center_num] initial_center_col_num = [i for i in range(input_col)] random.shuffle(initial_center_col_num) initial_center_col_num = initial_center_col_num[:center_num] # 当前的聚类中心 present_center = [] for i in range(center_num): present_center.append(input_signal_cp[initial_center_row_num[i], initial_center_row_num[i]]) pixls_labels = classifer(input_signal_cp, present_center) num = 0 # 用于记录迭代次数 while True: pre_centet = present_center.copy() # 储存前一次的聚类中心 # 计算当前聚类中心 for n in range(center_num): temp = np.where(pixls_labels == n) present_center[n] = sum(input_signal_cp[temp].astype(int)) / len(input_signal_cp[temp]) # 根据当前聚类中心分类 pixls_labels = classifer(input_signal_cp, present_center) # 计算上一次聚类中心与当前聚类中心的差异 loss = loss_function(present_center, pre_centet) num = num + 1 print("Step:"+ str(num) + " Loss:" + str(loss)) # 当损失小于迭代阈值时,结束迭代 if loss <= threshold: break return pixls_labels
3 分类效果
聚类中心个数=3,迭代阈值为=1
聚类中心个数=3,迭代阈值为=1
4 GitHub
click me
以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持。
免责声明:本站文章均来自网站采集或用户投稿,网站不提供任何软件下载或自行开发的软件!
如有用户或公司发现本站内容信息存在侵权行为,请邮件告知! 858582#qq.com
暂无“python基于K-means聚类算法的图像分割”评论...
RTX 5090要首发 性能要翻倍!三星展示GDDR7显存
三星在GTC上展示了专为下一代游戏GPU设计的GDDR7内存。
首次推出的GDDR7内存模块密度为16GB,每个模块容量为2GB。其速度预设为32 Gbps(PAM3),但也可以降至28 Gbps,以提高产量和初始阶段的整体性能和成本效益。
据三星表示,GDDR7内存的能效将提高20%,同时工作电压仅为1.1V,低于标准的1.2V。通过采用更新的封装材料和优化的电路设计,使得在高速运行时的发热量降低,GDDR7的热阻比GDDR6降低了70%。
更新动态
2024年11月09日
2024年11月09日
- 雨林唱片《赏》新曲+精选集SACD版[ISO][2.3G]
- 罗大佑与OK男女合唱团.1995-再会吧!素兰【音乐工厂】【WAV+CUE】
- 草蜢.1993-宝贝对不起(国)【宝丽金】【WAV+CUE】
- 杨培安.2009-抒·情(EP)【擎天娱乐】【WAV+CUE】
- 周慧敏《EndlessDream》[WAV+CUE]
- 彭芳《纯色角3》2007[WAV+CUE]
- 江志丰2008-今生为你[豪记][WAV+CUE]
- 罗大佑1994《恋曲2000》音乐工厂[WAV+CUE][1G]
- 群星《一首歌一个故事》赵英俊某些作品重唱企划[FLAC分轨][1G]
- 群星《网易云英文歌曲播放量TOP100》[MP3][1G]
- 方大同.2024-梦想家TheDreamer【赋音乐】【FLAC分轨】
- 李慧珍.2007-爱死了【华谊兄弟】【WAV+CUE】
- 王大文.2019-国际太空站【环球】【FLAC分轨】
- 群星《2022超好听的十倍音质网络歌曲(163)》U盘音乐[WAV分轨][1.1G]
- 童丽《啼笑姻缘》头版限量编号24K金碟[低速原抓WAV+CUE][1.1G]