聚類算法有:劃分法、層次法、密度算法、圖論聚類法、網格算法、模型算法 。
1、劃分法
劃分法(partitioning methods) , 給定一個有N個元組或者紀錄的數據集 , 分裂法將構造K個分組 , 每一個分組就代表一個聚類 , K<N 。使用這個基本思想的算法有:K-MEANS算法、K-MEDOIDS算法、CLARANS算法 。
2、層次法
層次法(hierarchical methods) , 這種方法對給定的數據集進行層次似的分解 , 直到某種條件滿足為止 。具體又可分為“自底向上”和“自頂向下”兩種方案 。代表算法有:BIRCH算法、CURE算法、CHAMELEON算法等 。
3、密度算法
基于密度的方法(density-based methods) , 基于密度的方法與其它方法的一個根本區別是:它不是基于各種各樣的距離的 , 而是基于密度的 。這樣就能克服基于距離的算法只能發現“類圓形”的聚類的缺點 。代表算法有:DBSCAN算法、OPTICS算法、DENCLUE算法等 。
4、圖論聚類法
圖論聚類方法解決的第一步是建立與問題相適應的圖 , 圖的節點對應于被分析數據的最小單元 , 圖的邊(或弧)對應于最小處理單元數據之間的相似性度量 。因此 , 每一個最小處理單元數據之間都會有一個度量表達 , 這就確保了數據的局部特性比較易于處理 。圖論聚類法是以樣本數據的局域連接特征作為聚類的主要信息源 , 因而其主要優點是易于處理局部數據的特性 。
【聚類算法有哪些】5、網格算法

基于網格的方法(grid-based methods) , 這種方法首先將數據空間劃分成為有限個單元(cell)的網格結構,所有的處理都是以單個的單元為對象的 。代表算法有:STING算法、CLIQUE算法、WAVE-CLUSTER算法 。
6、模型算法
基于模型的方法(model-based methods) , 基于模型的方法給每一個聚類假定一個模型 , 然后去尋找能夠很好的滿足這個模型的數據集 。通常有兩種嘗試方向:統計的方案和神經網絡的方案 。
擴展資料:
聚類分析起源于分類學 , 在古老的分類學中 , 人們主要依靠經驗和專業知識來實現分類 , 很少利用數學工具進行定量的分類 。隨著人類科學技術的發展 , 對分類的要求越來越高 , 以致有時僅憑經驗和專業知識難以確切地進行分類 , 于是人們逐漸地把數學工具引用到了分類學中 , 形成了數值分類學 , 之后又將多元分析的技術引入到數值分類學形成了聚類分析 。聚類分析內容非常豐富 , 有系統聚類法、有序樣品聚類法、動態聚類法、模糊聚類法、圖論聚類法、聚類預報法等 。
在商業上 , 聚類可以幫助市場分析人員從消費者數據庫中區分出不同的消費群體來 , 并且概括出每一類消費者的消費模式或者說習慣 。它作為數據挖掘中的一個模塊 , 可以作為一個單獨的工具以發現數據庫中分布的一些深層的信息 , 并且概括出每一類的特點 , 或者把注意力放在某一個特定的類上以作進一步的分析;并且 , 聚類分析也可以作為數據挖掘算法中其他分析算法的一個預處理步驟 。
參考資料:百度百科-聚類算法
猜你喜歡
- 書名:為女性尋求強有力的契約 玄幻小說
- 海綿原料是什么 海綿原料有什么
- 怎樣燒雞湯更營養 雞湯要怎么燉才更有營養
- 年初七送的祝福語 大年初七祝福語有哪些
- 求悲 求悲 求悲 求婚小說
- 性組詞 性的意思
- 一件妮子大衣需要什么褲子和鞋子?
- 腌酸菜為什么用開水燙 有什么說法嗎?
- 采摘果實的方法 采摘果實有什么方法
- 祝妹妹生曰快樂祝福語 祝妹妹生曰快樂祝福語有哪些
