欧美性猛交xxxx免费看_牛牛在线视频国产免费_天堂草原电视剧在线观看免费_国产粉嫩高清在线观看_国产欧美日本亚洲精品一5区

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

基于PyTorch重寫的機(jī)器學(xué)習(xí)工具包HyperLearn

DPVg_AI_era ? 來源:未知 ? 作者:李倩 ? 2018-11-20 09:23 ? 次閱讀

基于PyTorch重寫的機(jī)器學(xué)習(xí)工具包HyperLearn,速度更快、內(nèi)存使用更少,效率提高了一倍。

HyperLearn是一個(gè)基于PyTorch重寫的機(jī)器學(xué)習(xí)工具包Scikit Learn,它的一些模塊速度更快、需要內(nèi)存更少,效率提高了一倍。

專為大數(shù)據(jù)而設(shè)計(jì),HyperLearn可以使用50%以下的內(nèi)存,并在某些模塊上運(yùn)行速度提高50%以上。將支持GPU,并且所有模塊都是并行化的。

項(xiàng)目作者DanielHan-Chen,畢業(yè)于澳大利亞新南威爾士大學(xué),專注于AI、NLP和無監(jiān)督機(jī)器學(xué)習(xí)的推薦和匹配算法。

基于HyperLearn,作者展示了如何讓很多機(jī)器學(xué)習(xí)算法更快、更高效。

其中一些很酷的算法:

最小二乘法/線性回歸的擬合時(shí)間相比sklearn減少70%,內(nèi)存使用減少50%

由于新的并行算法,非負(fù)矩陣分解的擬合時(shí)間相比sklearn減少50%

Euclidean算法/余弦相似度算法加快40%

LSMR迭代最小二乘法時(shí)間減少50%

新的Reconstruction SVD算法——使用SVD來估算丟失的數(shù)據(jù),比mean imputation方法好約30%稀疏矩陣運(yùn)算速度提高50%——并行化

RandomizedSVD,速度加快20%~30%

New Incremental SVD和Incremental Eig,RandomizedSVD / Truncated SVD

等等

項(xiàng)目地址:

https://github.com/danielhanchen/hyperlearn

并且,作者寫了一本電子書:Modern Big Data Algorithms,介紹了12個(gè)新算法以及一些更新的算法:

紅色:新算法;綠色:更新的算法;藍(lán)色:即將發(fā)布

讓我們先大致看一下“奇異值分解”(SVD)這一章,這是最重要的算法之一。SVD將PCA、線性回歸、嶺回歸、QDA、LDA、LSI、推薦系統(tǒng)、壓縮算法、L2 distance等多種算法聯(lián)系在一起,可以說是機(jī)器學(xué)習(xí)中最重要的算法了。

Page on SVD

Page on Reconstruction SVD

Using SVD to reconstruct missing data

提速50%+,RAM使用減少50%+

提速50%+,RAM使用減少50%+,GPU支持的重寫Sklearn,使用Statsmodels組合新的算法。

HyperLearn完全用PyTorch, NoGil Numba, Numpy, panda, Scipy 和 LAPACK編寫,鏡像主要是Scikit Learn。HyperLearn還嵌入了統(tǒng)計(jì)推斷方法,可以被想Scikit Learn語法(model.confidence_interval_)一樣調(diào)用。

速度/內(nèi)存的比較

時(shí)間表示Fit + Predict的時(shí)間。RAM(mb) = max( RAM(Fit), RAM(Predict) )

以下是N = 5000,P = 6000時(shí)的初步結(jié)果:

關(guān)鍵方法和目標(biāo)

令人尷尬的并行循環(huán)

速度提升50%+,精簡50%+

為什么Statsmodels有時(shí)會(huì)慢得讓人無法忍受?

使用PyTorch的深度學(xué)習(xí)模塊

代碼量減少20%+,更清晰的代碼

訪問舊算法和令人興奮的新算法

1. 令人尷尬的并行循環(huán)

包括內(nèi)存共享,內(nèi)存管理

通過PyTorch和Numba的CUDA并行性

2. 50%+ Faster, 50%+ Leaner

矩陣乘法排序:

https://en.wikipedia.org/wiki/Matrix_chain_multiplication

Element Wise矩陣乘法將復(fù)雜度從O(n^3)降低到O(n^2):https://en.wikipedia.org/wiki/Hadamard_product_(matrices)

將矩陣運(yùn)算簡化為Einstein Notation:https://en.wikipedia.org/wiki/Einstein_notation

連續(xù)評(píng)估一次性矩陣操作以減少RAM開銷。

如果p >> n,則可能分解X.T優(yōu)于分解X.

在某些情況下,應(yīng)用QR分解SVD可能會(huì)更快。

利用矩陣的結(jié)構(gòu)來計(jì)算更快(例如三角矩陣,Hermitian矩陣)。

計(jì)算 SVD(X),然后獲得pinv(X) ,有時(shí)比單純計(jì)算pinv(X)更快

3. 為什么Statsmodels有時(shí)會(huì)慢得讓人無法忍受?

對(duì)線性模型的置信度、預(yù)測(cè)區(qū)間,假設(shè)檢驗(yàn)和擬合優(yōu)度檢驗(yàn)進(jìn)行了優(yōu)化。

盡可能使用 Einstein Notation和Hadamard Products。

僅計(jì)算需要計(jì)算的內(nèi)容(計(jì)算矩陣對(duì)角線,而不是整個(gè)矩陣)。

修復(fù)Statsmodels在符號(hào)、速度、內(nèi)存方面的問題和變量存儲(chǔ)上的缺陷。

4. 使用PyTorch的深度學(xué)習(xí)模塊

使用PyTorch創(chuàng)建Scikit-Learn

5. 代碼量減少20%+,更清晰的代碼

盡可能使用 Decorators和Functions。

直觀的中層函數(shù)名稱,如(isTensor,isIterable)。

通過hyperlearn.multiprocessing輕松處理并行

6. 訪問舊算法和令人興奮的新算法

矩陣補(bǔ)全算法——非負(fù)最小二乘法,NNMF

批相似性隱含狄利克雷分布(BS-LDA)

相關(guān)回歸(Correlation Regression)

可行的廣義最小二乘法FGLS

Outlier Tolerant Regression

多維樣條回歸(Multidimensional Spline Regression)

廣義MICE

使用Uber的Pyro進(jìn)行貝葉斯深度學(xué)習(xí)

《現(xiàn)代大數(shù)據(jù)算法》電子書下載地址:

https://github.com/danielhanchen/hyperlearn/blob/master/Modern%20Big%20Data%20Algorithms.pdf

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 機(jī)器學(xué)習(xí)

    關(guān)注

    66

    文章

    8444

    瀏覽量

    133117
  • pytorch
    +關(guān)注

    關(guān)注

    2

    文章

    808

    瀏覽量

    13376

原文標(biāo)題:基于PyTorch重寫sklearn,《現(xiàn)代大數(shù)據(jù)算法》電子書下載

文章出處:【微信號(hào):AI_era,微信公眾號(hào):新智元】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    恩智浦車規(guī)級(jí)深度學(xué)習(xí)工具包使新一代汽車應(yīng)用性能提高30倍

    恩智浦半導(dǎo)體推出汽車車規(guī)級(jí)深度學(xué)習(xí)工具包eIQ Auto,擴(kuò)展了公司eIQ機(jī)器學(xué)習(xí)產(chǎn)品系列。該工具包旨在幫助客戶從開發(fā)環(huán)境快速地轉(zhuǎn)向滿足汽車
    發(fā)表于 11-06 11:46 ?786次閱讀

    Facebook推出ReAgent AI強(qiáng)化學(xué)習(xí)工具包

    Facebook近日推出ReAgent強(qiáng)化學(xué)習(xí)(reinforcement learning)工具包,首次通過收集離線反饋(offline feedback)來實(shí)現(xiàn)策略評(píng)估(policy evaluation)。
    發(fā)表于 10-19 09:38 ?1614次閱讀

    Python人工智能學(xué)習(xí)工具包+入門與實(shí)踐資料集錦

    本資料的主要內(nèi)容詳細(xì)介紹的是Python工具包合集包括了:網(wǎng)頁爬蟲工具集,文本處理工具集,Python科學(xué)計(jì)算工具包,Python機(jī)器
    發(fā)表于 11-22 14:46

    求LabVIEW2014 機(jī)器學(xué)習(xí)工具包

    有哪位大神有l(wèi)abview2014 機(jī)器學(xué)習(xí)工具包啊,分享一下,急需!!非常感謝!
    發(fā)表于 03-15 23:08

    并口開發(fā)調(diào)試工具包 (推薦)

    并口開發(fā)調(diào)試工具包 (推薦):
    發(fā)表于 05-27 10:15 ?35次下載
    并口開發(fā)調(diào)試<b class='flag-5'>工具包</b> (推薦)

    固件工具包

    固件工具包 修改工具包 高興向大家公布這個(gè)信息! 首先介紹一下這個(gè)工具地用途: 1、修改固件 - 通過此工具能夠修改固件中絕大多數(shù)地信息及配置。 2、...
    發(fā)表于 03-16 14:49 ?71次下載

    單片機(jī)開發(fā)調(diào)試工具包

    單片機(jī)開發(fā)調(diào)試工具包,學(xué)習(xí)51單片機(jī)必備的工具
    發(fā)表于 12-17 10:45 ?19次下載

    WEBENCH 設(shè)計(jì)工具包綜合概述

    WEBENCH 設(shè)計(jì)工具包綜合概述
    發(fā)表于 09-15 09:28 ?6次下載
    WEBENCH 設(shè)計(jì)<b class='flag-5'>工具包</b>綜合概述

    Google Kubernetes機(jī)器學(xué)習(xí)工具包Kubeflow發(fā)布0.1版

    Google自家推出的Kubernetes機(jī)器學(xué)習(xí)工具包Kubeflow終于發(fā)布了0.1版。 Google表示,雖然該項(xiàng)目僅成立5個(gè)多月,但是目前在GitHub上,已經(jīng)有超過3,000名用戶收藏該項(xiàng)目,“而在GitHub平臺(tái)的關(guān)
    發(fā)表于 05-17 08:17 ?1828次閱讀

    Microchip蘋果配件開發(fā)工具包

    這一講是Microchip蘋果配件開發(fā)工具包蘋果配件開發(fā)工具包
    的頭像 發(fā)表于 06-06 13:45 ?2345次閱讀

    Python網(wǎng)頁爬蟲,文本處理,科學(xué)計(jì)算,機(jī)器學(xué)習(xí)和數(shù)據(jù)挖掘工具

    本文檔的主要內(nèi)容詳細(xì)介紹的是Python工具包合集包括了:網(wǎng)頁爬蟲工具集,文本處理工具集,Python科學(xué)計(jì)算工具包,Python機(jī)器
    發(fā)表于 09-07 17:14 ?37次下載
    Python網(wǎng)頁爬蟲,文本處理,科學(xué)計(jì)算,<b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)</b>和數(shù)據(jù)挖掘<b class='flag-5'>工具</b>集

    清華大學(xué)發(fā)布首個(gè)開源自動(dòng)圖學(xué)工具包

    如何應(yīng)用自動(dòng)機(jī)器學(xué)習(xí) (AutoML) 加速圖機(jī)器學(xué)習(xí)任務(wù)的處理?清華大學(xué)發(fā)布全球首個(gè)開源自動(dòng)圖學(xué)習(xí)工具
    的頭像 發(fā)表于 12-22 16:32 ?1714次閱讀

    使用 OpenVINO? 工具包監(jiān)控機(jī)器操作員

    使用 OpenVINO? 工具包監(jiān)控機(jī)器操作員
    的頭像 發(fā)表于 01-03 09:45 ?796次閱讀
    使用 OpenVINO? <b class='flag-5'>工具包</b>監(jiān)控<b class='flag-5'>機(jī)器</b>操作員

    OneInstall工具包

    電子發(fā)燒友網(wǎng)站提供《OneInstall工具包.exe》資料免費(fèi)下載
    發(fā)表于 08-18 14:54 ?0次下載
    OneInstall<b class='flag-5'>工具包</b>

    Microchip(微芯)推出MPLAB機(jī)器學(xué)習(xí)開發(fā)工具包

    機(jī)器學(xué)習(xí)(ML)正成為嵌入式設(shè)計(jì)人員開發(fā)或改進(jìn)各種產(chǎn)品的標(biāo)準(zhǔn)要求。為滿足這一需求,Microchip(微芯)近日推出了全新的MPLAB?機(jī)器學(xué)習(xí)開發(fā)
    的頭像 發(fā)表于 09-12 18:26 ?1106次閱讀
    Microchip(微芯)推出MPLAB<b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)</b>開發(fā)<b class='flag-5'>工具包</b>