基于MapReduce數(shù)據(jù)流相似性搜索并行算法
大小:0.92 MB 人氣: 2017-12-07 需要積分:2
設(shè)計時間序列數(shù)據(jù)在Hadoop分布式文件系統(tǒng)(HDFS)中的有效存儲方式,利用分布式緩存工具Distributed Cache將各子序列分發(fā)到Hadoop集群的計算節(jié)點上,將動態(tài)時間彎曲距離矩陣劃分成多個子矩陣,采取并行迭代計算每條反對角線上子矩陣的方法,基于MapReduce編程模型,實現(xiàn)高效并行計算時間序列動態(tài)彎曲距離,通過改進剪裁冗余計算方法,設(shè)計實現(xiàn)一種數(shù)據(jù)流多模式相似性搜索并行算法。中國雪深長時間序列數(shù)據(jù)集的實驗結(jié)果表明,當(dāng)每條時間序列的長度達(dá)到5000以上時,并行計算動態(tài)彎曲距離所需時間少于串行計算所需時間,當(dāng)每條時間序列的長度達(dá)到9000以上時,參與計算的集群節(jié)點越多,并行計算所需時間越少;當(dāng)模式長度達(dá)到4000、參與計算的集群節(jié)點數(shù)達(dá)5個以上時,從數(shù)據(jù)流中并行搜索出與模式匹配的相似子序列所需時間約為串行搜索所需時間的20%。
?
非常好我支持^.^
(0) 0%
不好我反對
(0) 0%
下載地址
基于MapReduce數(shù)據(jù)流相似性搜索并行算法下載
相關(guān)電子資料下載
- 倍加福打造工業(yè)4.0解決方案 實現(xiàn)無縫數(shù)據(jù)流通 3786
- 比無縫漫游更高級的無感漫游,你聽說過嗎? 234
- 2024年春節(jié)通信行業(yè)網(wǎng)絡(luò)運行安全穩(wěn)定,移動數(shù)據(jù)流量與漫游業(yè)務(wù)大幅增長 363
- 8-1多路復(fù)用器有哪些應(yīng)用場景呢 627
- 實時交換機與非實時交換機的區(qū)別是什么? 1703
- 傳輸控制協(xié)議TCP特點及三次握手過程 845
- 可重構(gòu)數(shù)據(jù)流計算引領(lǐng)架構(gòu)創(chuàng)新 639
- labview編寫程序的一般步驟 1191
- 《愛立信移動市場報告》:5G強勁成長-全球移動數(shù)據(jù)流量在未來六年增長三倍 512
- 傳輸層的主要功能是什么 1802