今日在学机器学习 第八章(Unsupervised learning) 的时候 开头介绍时讲到了 K-means 应用在大型计算集群的资源分配上(见下图).
突然间一些回忆就猛的涌上心头: 本科跟着老师做的算法研究 最后毕业论文的名字叫做《基于虚拟机放置策略的数据中心网络节能算法研究》 其实和刚刚提到的资源分配非常类似. 当时在论文摘要中提到了 K-means 算法 可惜并没有深入去了解原理. 惭愧 趁这个机会好好学习下 算法并不复杂 更多的是作为一次记录与反省.
个人理解 一是知道了一堆人中男人和女人 找个方法把他们分开 然后新来一个人也能根据这个方法来判断他的性别. 二是把一堆人自动分为两类.
将图中的所有点 根据与初始化点的距离 分为两组.
根据第二步得出的两组点 重现计算新两个的中心(见下图箭头所指的点所示).
一直重复前三步的操作 直到新的中心不再变化为止.
有不懂的地方尽管给我留言哦 笔芯.