kmeans算法報告總結(jié)

時間：2021-05-09 18:54:55 其他報告我要投稿

實習(xí)報告總結(jié) 推薦度：
總結(jié)報告推薦度：
考察報告總結(jié) 推薦度：
考察總結(jié)報告推薦度：
實驗報告總結(jié) 推薦度：
相關(guān)推薦

關(guān)于kmeans算法報告總結(jié)

　　一、背景知識簡介：

關(guān)于kmeans算法報告總結(jié)

　　Kmeans算法是一種經(jīng)典的聚類算法，在模式識別中得到了廣泛的應(yīng)用，基于Kmeans的變種算法也有很多，模糊Kmeans、分層Kmeans等。

　　Kmeans和應(yīng)用于混合高斯模型的受限EM算法是一致的。高斯混合模型廣泛用于數(shù)據(jù)挖掘、模式識別、機器學(xué)習(xí)、統(tǒng)計分析。Kmeans的迭代步驟可以看成E步和M步，E：固定參數(shù)類別中心向量重新標記樣本，M：固定標記樣本調(diào)整類別中心向量。K均值只考慮（估計）了均值，而沒有估計類別的方差，所以聚類的結(jié)構(gòu)比較適合于特征協(xié)方差相等的類別。

　　二、 k-means聚類算法

　　k-means 算法接受參數(shù) k ；然后將事先輸入的n個數(shù)據(jù)對象劃分為 k個聚類以便使得所獲得的聚類滿足：同一聚類中的對象相似度較高；而不同聚類中的對象相似度較小。聚類相似度是利用各聚類中對象的均值所獲得一個“中心對象”（引力中心）來進行計算的。

　　K-means算法是最為經(jīng)典的基于劃分的聚類方法，是十大經(jīng)典數(shù)據(jù)挖掘算法之一。K-means算法的基本思想是：以空間中k個點為中心進行聚類，對最靠近他們的對象歸類。通過迭代的方法，逐次更新各聚類中心的'值，直至得到最好的聚類結(jié)果。

　　（1）算法思路：

　　首先從n個數(shù)據(jù)對象任意選擇 k 個對象作為初始聚類中心；而對于所剩下其它對象，則根據(jù)它們與這些聚類中心的相似度（距離），分別將它們分配給與其最相似的（聚類中心所代表的）聚類；然后再計算每個所獲新聚類的聚類中心（該聚類中所有對象的均值）；不斷重復(fù)這一過程直到標準測度函數(shù)開始收斂為止。一般都采用均方差作為標準測度函數(shù). k個聚類具有以下特點：各聚類本身盡可能的緊湊，而各聚類之間盡可能的分開。

　　該算法的最大優(yōu)勢在于簡潔和快速。算法的關(guān)鍵在于初始中心的選擇和距離公式。

　　（2）算法步驟：

　　step.1---初始化距離K個聚類的質(zhì)心（隨機產(chǎn)生）

　　step.2---計算所有數(shù)據(jù)樣本與每個質(zhì)心的歐氏距離，將數(shù)據(jù)樣本加入與其歐氏距離最短的那個質(zhì)心的簇中（記錄其數(shù)據(jù)樣本的編號）

　　step.3---計算現(xiàn)在每個簇的質(zhì)心，進行更新，判斷新質(zhì)心是否與原質(zhì)心相等，若相等，則迭代結(jié)束，若不相等，回到step2繼續(xù)迭代。

【關(guān)于kmeans算法報告總結(jié)】相關(guān)文章：

《基于導(dǎo)納的圖像加密算法的研究》的開題報告09-20

工齡的四種算法12-03

常見的算法面試題解法09-21

個人所得稅計算法09-07

亚洲v欧美v国产v在线成_制服丝袜中文字幕丝袜专区_一区二区三区韩国电影_激情欧美一区二区中文字幕

kmeans算法報告總結(jié)