一種統(tǒng)計(jì)屬性約簡(jiǎn)的定義
推薦 + 挑錯(cuò) + 收藏(0) + 用戶評(píng)論(0)
傳統(tǒng)的屬性約簡(jiǎn)由于其時(shí)間復(fù)雜度和空間復(fù)雜度過(guò)高,幾乎無(wú)法應(yīng)用到大規(guī)模的數(shù)據(jù)集中.將隨機(jī)抽樣引入傳統(tǒng)的模糊粗糙集中,使得屬性約簡(jiǎn)的效率大幅度提升.首先,在統(tǒng)計(jì)下近似的基礎(chǔ)上提出一種統(tǒng)計(jì)屬性約簡(jiǎn)的定義.這里的約簡(jiǎn)不是原有意義上的約簡(jiǎn)。而是保持基于統(tǒng)計(jì)下近似定義的統(tǒng)計(jì)辨識(shí)度不變的屬性子集,然后。采用抽樣的方法計(jì)算統(tǒng)計(jì)辨識(shí)度的樣本估計(jì)值,基于此估計(jì)值可以對(duì)統(tǒng)計(jì)屬性重要性進(jìn)行排序,從而可以設(shè)計(jì)一種快速的適用于大規(guī)模數(shù)據(jù)的序約簡(jiǎn)算法.由于隨機(jī)抽樣集以及統(tǒng)計(jì)近似概念的引入,該算法從時(shí)間和空間上均降低了約簡(jiǎn)的計(jì)算復(fù)雜度,同時(shí)又保持了數(shù)據(jù)集中信息含量幾乎不變.最后,數(shù)值實(shí)驗(yàn)將基于隨機(jī)抽樣的序約簡(jiǎn)算法和兩種傳統(tǒng)的屬性約簡(jiǎn)算法從以下3個(gè)方面進(jìn)行了對(duì)比:計(jì)算屬性約簡(jiǎn)時(shí)間消耗、計(jì)算屬性約簡(jiǎn)空間消耗、約簡(jiǎn)效果.對(duì)比實(shí)驗(yàn)驗(yàn)證了基于隨機(jī)抽樣的序約簡(jiǎn)算法在時(shí)間與空間上的優(yōu)勢(shì).
?
非常好我支持^.^
(0) 0%
不好我反對(duì)
(0) 0%