資料介紹
聚類分析是將研究對(duì)象分為相對(duì)同質(zhì)的群組的統(tǒng)計(jì)分析技術(shù),聚類分析的核心就是發(fā)現(xiàn)有用的對(duì)象簇。K-means聚類算法由于具有出色的速度和良好的可擴(kuò)展性,一直備受廣大學(xué)者的關(guān)注。然而,傳統(tǒng)的K-means算法,未考慮各個(gè)屬性對(duì)于最終聚類結(jié)果的影響差異性,這使得聚類的精度有一定的影響。針對(duì)上述問題,本文提出一種改進(jìn)的特征加權(quán)算法。改進(jìn)算法通過采用信息熵和ReliefF特征選擇算法對(duì)特征進(jìn)行加權(quán)選擇,修正聚類對(duì)象間的距離函數(shù),使算法達(dá)到更準(zhǔn)確更高效的聚類效果。仿真實(shí)驗(yàn)結(jié)果表明,與傳統(tǒng)的K-means算法相比,改進(jìn)后的算法聚類結(jié)果穩(wěn)定,聚類的精度有明顯提升。
數(shù)據(jù)挖掘是目前人工智能和數(shù)據(jù)庫領(lǐng)域研究的熱點(diǎn)問題,指從大量的數(shù)據(jù)中提取隱含在其中的、人們事先不知道的、但又是潛在有用的信息和知識(shí)的過程。聚類分析現(xiàn)在已經(jīng)成為數(shù)據(jù)挖掘領(lǐng)域中一個(gè)非常重要的研究方向。MacQueen 提出的K-means 算法是聚類分析中最常用的方法之一。它采用距離作為相似性的評(píng)價(jià)指標(biāo),即認(rèn)為兩個(gè)對(duì)象的距離越近,其相似度就越大。該算法認(rèn)為簇是由距離靠近的對(duì)象組成的,因此把得到緊湊且獨(dú)立的簇作為最終目標(biāo)。K-means 算法假設(shè)樣本的每個(gè)特征對(duì)最終聚類的貢獻(xiàn)程度一樣,但在實(shí)際情況中某些特征在聚類的過程中起到很大的作用,而某些特征的作用卻很小,甚至對(duì)聚類過程沒有影響。
?
針對(duì)傳統(tǒng)K-means 算法的這一問題,學(xué)者們進(jìn)行了大量研究,研究表明:通過對(duì)特征賦予不同的特征權(quán)值,能夠有效解決上述問題并提高聚類性能。目前,計(jì)算特征權(quán)重的算法有很多種:等人提出一種結(jié)合限制數(shù)據(jù)的特征權(quán)值量化函數(shù),該函數(shù)通過用戶指定的限制數(shù)據(jù)進(jìn)行特征權(quán)值量化并對(duì)不同的限制數(shù)據(jù)賦予不同的置信度,解決了限制數(shù)據(jù)分布不均勻和限制數(shù)據(jù)中可能包含不一致性的問題;LiJie 等人提出將針對(duì)分類問題的ReliefF 算法應(yīng)用于聚類問題,通過ReliefF 算法計(jì)算特征權(quán)重值,并對(duì)各維特征進(jìn)行加權(quán),提高聚類的性能;Meng Qian 等人提出通過梯度下降技術(shù)最小化特征評(píng)估函數(shù)FLearning (w)為每個(gè)特征分配權(quán)重并進(jìn)行加權(quán),該算法采用遺傳算法和模擬退火算法的優(yōu)點(diǎn),減弱冗余特征的影響,解決了容易陷入局部最優(yōu)解的問題。Songtao Shang 等人提出一種改進(jìn)的基尼指數(shù)算法計(jì)算特征權(quán)重,該算法克服了原始Gini 的缺點(diǎn),將條件概率與后驗(yàn)概率結(jié)合,抑制訓(xùn)練集不平衡時(shí)的影響。利用信息論中的信息熵計(jì)算特征權(quán)重并對(duì)各位特征加權(quán),有效的解決了特征對(duì)聚類的影響。
綜上所述,為了提高傳統(tǒng)K-means 算法的聚類精度,國(guó)內(nèi)外學(xué)者對(duì)K-means 算法進(jìn)行了大量改進(jìn)探索研究,并取得了一些階段性的成果。本文擬研究傳統(tǒng)K-means 算法在聚類過程中聚類對(duì)象的每個(gè)特征對(duì)聚類結(jié)果的貢獻(xiàn)度,使貢獻(xiàn)程度大的特征優(yōu)先利用,理論上講可以有效提升K-means 算法聚類的準(zhǔn)確率和精度。因此,本文提出將熵值法和ReliefF 特征選擇算法有機(jī)融合,通過采用信息熵和ReliefF 特征選擇算法對(duì)特征進(jìn)行加權(quán)選擇,修正聚類對(duì)象間的距離函數(shù),使算法達(dá)到更準(zhǔn)確更高效的聚類效果。實(shí)驗(yàn)結(jié)果表明,改進(jìn)后的算法聚類結(jié)果穩(wěn)定,且具有較高的準(zhǔn)確率,達(dá)到預(yù)期目的。
- 基于特征和實(shí)例遷移的加權(quán)多任務(wù)聚類算法 3次下載
- 集成簇內(nèi)和簇間距離的加權(quán)k-means聚類方法 1次下載
- 針對(duì)高維稀疏數(shù)據(jù)的可重疊子空間K-Means聚類算法 13次下載
- 基于距離和密度的并行二分K-means算法 17次下載
- 一種改進(jìn)的聚類聯(lián)合相似度推薦算法 10次下載
- 如何使用多維網(wǎng)格空間進(jìn)行改進(jìn)K-means聚類算法資料概述 1次下載
- 基于改進(jìn)k-means算法的MANET異常檢測(cè)方法 0次下載
- 基于聚類集成技術(shù)的在線特征選擇 0次下載
- 基于改進(jìn)K_means聚類的欠定盲分離算法_柴文標(biāo) 0次下載
- 特征加權(quán)和優(yōu)化劃分的模糊C均值聚類算法 0次下載
- 混合細(xì)菌覓食和粒子群的k_means聚類算法 0次下載
- 基于最小生成樹的層次K_means聚類算法 5次下載
- K-means+聚類算法研究綜述
- 改進(jìn)的k-means聚類算法在供電企業(yè)CRM中的應(yīng)用
- 一種增強(qiáng)的K-means聚類算法在入侵檢測(cè)中的應(yīng)用
- 基于K-means聚類算法的圖像分割 2258次閱讀
- 如何在 Python 中安裝和使用頂級(jí)聚類算法 613次閱讀
- 10種頂流聚類算法Python實(shí)現(xiàn)(附完整代碼) 1617次閱讀
- 基于距離的聚類算法K-means的設(shè)計(jì)實(shí)現(xiàn) 2348次閱讀
- 基本的k-means算法流程 1.9w次閱讀
- PLC常用基本環(huán)節(jié)梯形圖和詳細(xì)文字說明詳細(xì)資料概述 1w次閱讀
- K-Means算法的簡(jiǎn)單介紹 4934次閱讀
- 人工智能機(jī)器學(xué)習(xí)之K近鄰算法(KNN) 2882次閱讀
- Python無監(jiān)督學(xué)習(xí)的幾種聚類算法包括K-Means聚類,分層聚類等詳細(xì)概述 3w次閱讀
- 一種基于MapReduce模型的并行化k-medoids聚類算法 5377次閱讀
- 基于密度DBSCAN的聚類算法 2.1w次閱讀
- k means聚類算法實(shí)例 1.5w次閱讀
- K-means的優(yōu)缺點(diǎn)及改進(jìn) 3.2w次閱讀
- k-means算法原理解析 8362次閱讀
- 關(guān)聯(lián)規(guī)則挖掘——Apriori算法的基本原理以及改進(jìn) 9439次閱讀
下載排行
本周
- 1TC358743XBG評(píng)估板參考手冊(cè)
- 1.36 MB | 330次下載 | 免費(fèi)
- 2開關(guān)電源基礎(chǔ)知識(shí)
- 5.73 MB | 11次下載 | 免費(fèi)
- 3嵌入式linux-聊天程序設(shè)計(jì)
- 0.60 MB | 3次下載 | 免費(fèi)
- 4DIY動(dòng)手組裝LED電子顯示屏
- 0.98 MB | 3次下載 | 免費(fèi)
- 5基于FPGA的C8051F單片機(jī)開發(fā)板設(shè)計(jì)
- 0.70 MB | 2次下載 | 免費(fèi)
- 651單片機(jī)窗簾控制器仿真程序
- 1.93 MB | 2次下載 | 免費(fèi)
- 751單片機(jī)大棚環(huán)境控制器仿真程序
- 1.10 MB | 2次下載 | 免費(fèi)
- 8基于51單片機(jī)的RGB調(diào)色燈程序仿真
- 0.86 MB | 2次下載 | 免費(fèi)
本月
- 1OrCAD10.5下載OrCAD10.5中文版軟件
- 0.00 MB | 234315次下載 | 免費(fèi)
- 2555集成電路應(yīng)用800例(新編版)
- 0.00 MB | 33566次下載 | 免費(fèi)
- 3接口電路圖大全
- 未知 | 30323次下載 | 免費(fèi)
- 4開關(guān)電源設(shè)計(jì)實(shí)例指南
- 未知 | 21549次下載 | 免費(fèi)
- 5電氣工程師手冊(cè)免費(fèi)下載(新編第二版pdf電子書)
- 0.00 MB | 15349次下載 | 免費(fèi)
- 6數(shù)字電路基礎(chǔ)pdf(下載)
- 未知 | 13750次下載 | 免費(fèi)
- 7電子制作實(shí)例集錦 下載
- 未知 | 8113次下載 | 免費(fèi)
- 8《LED驅(qū)動(dòng)電路設(shè)計(jì)》 溫德爾著
- 0.00 MB | 6656次下載 | 免費(fèi)
總榜
- 1matlab軟件下載入口
- 未知 | 935054次下載 | 免費(fèi)
- 2protel99se軟件下載(可英文版轉(zhuǎn)中文版)
- 78.1 MB | 537798次下載 | 免費(fèi)
- 3MATLAB 7.1 下載 (含軟件介紹)
- 未知 | 420027次下載 | 免費(fèi)
- 4OrCAD10.5下載OrCAD10.5中文版軟件
- 0.00 MB | 234315次下載 | 免費(fèi)
- 5Altium DXP2002下載入口
- 未知 | 233046次下載 | 免費(fèi)
- 6電路仿真軟件multisim 10.0免費(fèi)下載
- 340992 | 191186次下載 | 免費(fèi)
- 7十天學(xué)會(huì)AVR單片機(jī)與C語言視頻教程 下載
- 158M | 183279次下載 | 免費(fèi)
- 8proe5.0野火版下載(中文版免費(fèi)下載)
- 未知 | 138040次下載 | 免費(fèi)
評(píng)論