基于KNN的煙草企業(yè)檔案文本分類(lèi)
大?。?/span>0.40 MB 人氣: 2017-12-12 需要積分:1
推薦 + 挑錯(cuò) + 收藏(0) + 用戶評(píng)論(0)
標(biāo)簽:文本分類(lèi)(7267)KNN(10751)
通過(guò)對(duì)云南某卷煙廠歷史檔案文本數(shù)據(jù)的分析研究,結(jié)合實(shí)際情況,對(duì)檔案文本主題詞的獲取和自動(dòng)分類(lèi)算法進(jìn)行了詳細(xì)的設(shè)計(jì)。且在主題詞獲取算法中引入了TFIDF算法,解決了檔案文本缺少題名、文號(hào)及責(zé)任者項(xiàng)時(shí),算法無(wú)法自動(dòng)獲取主題詞的問(wèn)題。在文本自動(dòng)分類(lèi)算法中引入了KNN最鄰近算法,解決了無(wú)法根據(jù)題名、文號(hào)進(jìn)行檔案文本自動(dòng)分類(lèi)的問(wèn)題。同時(shí),還考慮了檔案文本按保存期限進(jìn)行分類(lèi)的問(wèn)題。實(shí)驗(yàn)結(jié)果證明,該算法明顯提高了煙草企業(yè)檔案文本的分類(lèi)效率。
非常好我支持^.^
(0) 0%
不好我反對(duì)
(0) 0%
下載地址
基于KNN的煙草企業(yè)檔案文本分類(lèi)下載
相關(guān)電子資料下載
- 卷積神經(jīng)網(wǎng)絡(luò)在文本分類(lèi)領(lǐng)域的應(yīng)用 152
- 應(yīng)用于MEMS執(zhí)行器的8英寸硅晶圓上的KNN無(wú)鉛技術(shù)介紹 345
- 人工智能中文本分類(lèi)的基本原理和關(guān)鍵技術(shù) 768
- 基于STM32的解魔方機(jī)器人設(shè)計(jì)方案 578
- NLP中的遷移學(xué)習(xí):利用預(yù)訓(xùn)練模型進(jìn)行文本分類(lèi) 357
- 機(jī)器學(xué)習(xí)技術(shù)之KNN近鄰算法編程實(shí)例 161
- PyTorch文本分類(lèi)任務(wù)的基本流程 892
- 在NGC上玩轉(zhuǎn)飛槳自然語(yǔ)言處理模型庫(kù)PaddleNLP!信息抽取、文本分類(lèi)、文檔智能、 1052
- KNN算法、分類(lèi)回歸樹(shù)、隨機(jī)森林的優(yōu)缺點(diǎn)及應(yīng)用實(shí)例 4258
- 深度學(xué)習(xí)——如何用LSTM進(jìn)行文本分類(lèi) 1298