數(shù)據(jù)挖掘中應(yīng)用較多的技術(shù)機(jī)器學(xué)習(xí)。
機(jī)器學(xué)習(xí)主流算法包括三種:關(guān)聯(lián)分析、分類分析、聚類分析。本文主要介紹分類分析、聚類分析。
圖片來源:來自網(wǎng)絡(luò)
一、分類分析
(1)分類分析概念 分類分析是指算法通過學(xué)習(xí)得出“某種分類依據(jù)”,該分類依據(jù)可以判斷一個(gè)新事物的類別(含個(gè)人理解)。
(2)分類分析過程 分類分析包括兩個(gè)過程:
1)通過大量樣本的訓(xùn)練,使算法可以建立準(zhǔn)確率超過某值的分類依據(jù)。
2)算法根據(jù)分類依據(jù)對(duì)新事物分類。
(3)分類分析過程與學(xué)生學(xué)習(xí)過程對(duì)比
1)學(xué)生本身具有學(xué)習(xí)能力,但不會(huì)做某一類型的題。這類似于機(jī)器學(xué)習(xí)算法具有學(xué)習(xí)能力,但不會(huì)對(duì)某一事物進(jìn)行分類。
2)學(xué)生在學(xué)習(xí)過程中需要做大量習(xí)題,而且還需要根據(jù)標(biāo)準(zhǔn)答案確定每道題的正誤,學(xué)生在該過程逐步調(diào)整其知識(shí)體系。這類似于機(jī)器學(xué)習(xí)算法需要通過大量樣本的訓(xùn)練,機(jī)器學(xué)習(xí)的每個(gè)樣本均包含輸入和輸出,機(jī)器學(xué)習(xí)可以通過將樣本輸入其建立模型得出的輸出與樣本輸出(樣本輸出類似標(biāo)準(zhǔn)答案)進(jìn)行對(duì)比,判斷其建立模型的準(zhǔn)確性,不斷調(diào)整其建立的模型。
3)當(dāng)學(xué)生掌握所學(xué)的知識(shí)后,其就具備了在考試中解答新的同類型問題的能力。這類似于機(jī)器學(xué)習(xí)算法通過其建立的模型對(duì)新事物分類。
(4)分類分析算法
常見的分類分析算法包括:決策樹、K近鄰法(kNN)、樸素貝葉斯、感知機(jī)、支持向量機(jī)(SVM)。
更高級(jí)的分類分析方法包括:邏輯斯諦回歸(Logistic回歸)、貝葉斯網(wǎng)絡(luò)、神經(jīng)網(wǎng)路等。
二、聚類分析
(1)聚類分析概念
聚類分析是將一群物理對(duì)象劃分成相似的對(duì)象集合的過程。在聚類分析中,各個(gè)聚類內(nèi)的數(shù)據(jù)對(duì)象是相似的,不同聚類間的對(duì)象是相異的。
圖片來源:來自網(wǎng)絡(luò)
(2)聚類分析與分類分析對(duì)比
與分類分析類似,聚類分析的目的也是將樣本劃分至不同的子集。兩者不同的是:分類分析需要大量樣本訓(xùn)練,分類分析的算法在學(xué)習(xí)過程中需被告知每個(gè)樣本的類別;聚類分析不需要訓(xùn)練樣本,聚類分析的算法學(xué)習(xí)的數(shù)據(jù)是沒有指導(dǎo)信息的數(shù)據(jù),聚類分析的算法通過其內(nèi)部機(jī)制對(duì)樣本進(jìn)行劃分,將“它”認(rèn)為同類的數(shù)據(jù)進(jìn)行聚類。
(3)聚類分析與日常事物分類方式對(duì)比 聚類分析的分類方式使其對(duì)事物的分類方式可能有別于日常生活中對(duì)事物的劃分。
例如,日常生活中如果對(duì)香蕉、草莓、木塊分類,人們可能更容易將香蕉和草莓劃分為水果一類,將木塊劃分為另外的類別;但聚類分析算法可能將香蕉和木塊劃分為一類,將草莓劃分為另外的類別,分類依據(jù)是香蕉和木塊都是黃色的。
圖片來源:來自網(wǎng)絡(luò)
(4)聚類分析方法
聚類分析的常用方法包括:K-means算法、K中心點(diǎn)算法、層次聚類算法等。
審核編輯:劉清
聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。
舉報(bào)投訴
-
SVM
-
機(jī)器學(xué)習(xí)
-
神經(jīng)網(wǎng)路
原文標(biāo)題:大數(shù)據(jù)相關(guān)介紹(25)——機(jī)器學(xué)習(xí)之分類分析、聚類分析
文章出處:【微信號(hào):行業(yè)學(xué)習(xí)與研究,微信公眾號(hào):行業(yè)學(xué)習(xí)與研究】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
相關(guān)推薦
在探討ZETA在機(jī)器學(xué)習(xí)中的應(yīng)用以及ZETA的優(yōu)缺點(diǎn)時(shí),需要明確的是,ZETA一詞在不同領(lǐng)域可能有不同的含義和應(yīng)用。以下是根據(jù)不同領(lǐng)域的ZETA進(jìn)行的分析: 一、ZETA在機(jī)器
發(fā)表于 12-20 09:11
?368次閱讀
傅里葉變換在機(jī)器學(xué)習(xí)中的應(yīng)用 傅里葉變換是一種將信號(hào)分解為其組成頻率分量的數(shù)學(xué)運(yùn)算,它在機(jī)器學(xué)習(xí)中的應(yīng)用日益廣泛。以下是一些主要的應(yīng)用領(lǐng)域: 信號(hào)處理 : 音頻處理:傅里葉變換有助于識(shí)
發(fā)表于 12-06 17:06
?332次閱讀
計(jì)算機(jī)系統(tǒng)自身的性能”。事實(shí)上,由于“經(jīng)驗(yàn)”在計(jì)算機(jī)系統(tǒng)中主要以數(shù)據(jù)的形式存在,因此機(jī)器學(xué)習(xí)需要設(shè)法對(duì)數(shù)據(jù)進(jìn)行分析學(xué)習(xí),這就使得它逐漸成為智能數(shù)據(jù)分
發(fā)表于 11-16 01:07
?521次閱讀
行為分析智能監(jiān)測(cè)攝像機(jī)是一種結(jié)合了人工智能和機(jī)器學(xué)習(xí)技術(shù)的智能設(shè)備,能夠?qū)崟r(shí)監(jiān)測(cè)目標(biāo)區(qū)域內(nèi)的行為動(dòng)態(tài),并通過分析和識(shí)別行為特征來提供安全監(jiān)控和管理。這種攝像機(jī)在安防領(lǐng)域、智能交通和智能
發(fā)表于 08-21 10:14
?386次閱讀
個(gè)重要環(huán)節(jié),目標(biāo)是從給定的時(shí)間序列數(shù)據(jù)中提取出有用的信息和特征,以支持后續(xù)的分析和預(yù)測(cè)任務(wù)。
特征工程(Feature Engineering)是將數(shù)據(jù)轉(zhuǎn)換為更好地表示潛在問題的特征,從而提高機(jī)器學(xué)習(xí)
發(fā)表于 08-17 21:12
本人有些機(jī)器學(xué)習(xí)的基礎(chǔ),理解起來一點(diǎn)也不輕松,加油。
作者首先說明了時(shí)間序列的信息提取是時(shí)間序列分析的一個(gè)重要環(huán)節(jié),目標(biāo)是從給定的時(shí)間序列數(shù)據(jù)中提取出有用的信息和特征,以支持后續(xù)的分析
發(fā)表于 08-14 18:00
清晰,從時(shí)間序列分析的基礎(chǔ)理論出發(fā),逐步深入到機(jī)器學(xué)習(xí)算法在時(shí)間序列預(yù)測(cè)中的應(yīng)用,內(nèi)容全面,循序漸進(jìn)。每一章都經(jīng)過精心設(shè)計(jì),對(duì)理論知識(shí)進(jìn)行了詳細(xì)的闡述,對(duì)實(shí)際案例進(jìn)行了生動(dòng)的展示,使讀者在理論與實(shí)踐
發(fā)表于 08-12 11:28
這本書以其系統(tǒng)性的框架和深入淺出的講解,為讀者繪制了一幅時(shí)間序列分析與機(jī)器學(xué)習(xí)融合應(yīng)用的宏偉藍(lán)圖。作者不僅扎實(shí)地構(gòu)建了時(shí)間序列分析的基礎(chǔ)知識(shí),更巧妙地展示了
發(fā)表于 08-12 11:21
收到《時(shí)間序列與機(jī)器學(xué)習(xí)》一書,彩色印刷,公式代碼清晰,非常精美。感謝作者,感謝電子發(fā)燒友提供了一個(gè)讓我學(xué)習(xí)時(shí)間序列及應(yīng)用的機(jī)會(huì)!
前言第一段描述了編寫背景:
由此可知,這是一本關(guān)于時(shí)間序列進(jìn)行大數(shù)據(jù)
發(fā)表于 08-11 17:55
的應(yīng)用也很廣泛,用機(jī)器學(xué)習(xí)為時(shí)間分析帶來新的可能性。人們往往可以通過過往的時(shí)間序列數(shù)據(jù)來預(yù)測(cè)未來,在各行各業(yè)中都有很好的應(yīng)用與發(fā)展前景。
時(shí)間序列分類:
1.單維時(shí)間序列
單維時(shí)間序列
發(fā)表于 08-07 23:03
時(shí)間序列分類(Time Series Classification, TSC)是機(jī)器學(xué)習(xí)和深度學(xué)習(xí)領(lǐng)域的重要任務(wù)之一,廣泛應(yīng)用于人體活動(dòng)識(shí)別、系統(tǒng)監(jiān)測(cè)、金融預(yù)測(cè)、醫(yī)療診斷等多個(gè)領(lǐng)域。隨
發(fā)表于 07-09 15:54
?1186次閱讀
隨著大數(shù)據(jù)時(shí)代的到來,數(shù)據(jù)量的爆炸性增長(zhǎng)對(duì)數(shù)據(jù)分析提出了更高的要求。機(jī)器學(xué)習(xí)作為一種強(qiáng)大的工具,通過訓(xùn)練模型從數(shù)據(jù)中學(xué)習(xí)規(guī)律,為企業(yè)和組織提供了更高效、更準(zhǔn)確的數(shù)據(jù)
發(fā)表于 07-02 11:22
?839次閱讀
在人工智能的浪潮中,機(jī)器學(xué)習(xí)和深度學(xué)習(xí)無疑是兩大核心驅(qū)動(dòng)力。它們各自以其獨(dú)特的方式推動(dòng)著技術(shù)的進(jìn)步,為眾多領(lǐng)域帶來了革命性的變化。然而,盡管它們都屬于機(jī)器
發(fā)表于 07-01 11:40
?1552次閱讀
設(shè)備的運(yùn)行狀況,生成各種維度的報(bào)告。
同時(shí),通過大數(shù)據(jù)分析和機(jī)器學(xué)習(xí)技術(shù),可以對(duì)業(yè)務(wù)進(jìn)行預(yù)測(cè)和預(yù)警,從而協(xié)助社會(huì)和企業(yè)進(jìn)行科學(xué)決策、降低成本并創(chuàng)造新的價(jià)值。
當(dāng)今時(shí)代,數(shù)據(jù)無處不在,而時(shí)間序列數(shù)據(jù)更是
發(fā)表于 06-25 15:00
頻譜分析儀是電子測(cè)量領(lǐng)域中的一項(xiàng)重要工具,主要用于分析信號(hào)的頻譜特性。隨著電子技術(shù)的飛速發(fā)展,頻譜分析儀的應(yīng)用范圍日益廣泛,其種類和技術(shù)指標(biāo)也日益豐富。本文將對(duì)頻譜分析儀的
發(fā)表于 05-14 15:48
?750次閱讀
評(píng)論