2021年里AI飛速發(fā)展,優(yōu)秀算法層出不窮,令我們大開(kāi)眼界。
而真正要將這些算法實(shí)現(xiàn),一定少不了Python這個(gè)主流機(jī)器學(xué)習(xí)語(yǔ)言的加持。
今年各大公司和研究小組都推出了一系列方便使用的高性能開(kāi)源庫(kù),其中還不乏一些國(guó)產(chǎn)的優(yōu)秀作品。
在這里將盤(pán)點(diǎn)出最佳的10名,致力于幫你解決各種問(wèn)題。
如果你還在為模型訓(xùn)練中的“雜務(wù)”頭疼,那就快來(lái)看看吧。
1. Awkward Array
根據(jù)官方介紹,Awkward Array用于嵌套的、大小不一的數(shù)據(jù),包括任意長(zhǎng)度的列表、記錄、混合的類(lèi)型和缺失數(shù)據(jù),使用起來(lái)類(lèi)似NumPy。
看起來(lái)像是升級(jí)版的NumPy呀。
果然,不同長(zhǎng)度的數(shù)組可以直接放在一起運(yùn)算。
并且,官方表示Awkward Array不僅使用起來(lái)更簡(jiǎn)便,在速度和內(nèi)存上也有量級(jí)的優(yōu)勢(shì)。
看看是不是可以安排上了~
https://pypi.org/project/awkward/
2. Jupytext
相信大家對(duì)Jupyter Notebook都不陌生。
當(dāng)你有了Jupytext這個(gè)小插件就可以將Jupyter Notebook和IDE完美結(jié)合,聽(tīng)起來(lái)是不是很棒!
從此Jupyter Notebook可以被存儲(chǔ)為Markdown文件或多種語(yǔ)言的腳本文件。
Jupytext可以做的事主要有:
Jupyter Notebook的版本控制
在你喜歡的文本編輯器中編輯、合并或重構(gòu)Notebook
在Notebook上使用Q&A檢查
在Python中使用的樣子:
此項(xiàng)目在Github上已有5k+star。
https://github.com/mwouts/jupytext
3. Gradio
比Streamlit還輕量的UI設(shè)計(jì)庫(kù),Gradio讓你輕松在瀏覽器中“玩轉(zhuǎn)”你的模型,可以直接在瀏覽器中拖放圖片,粘貼文字,錄制聲音,等等。
只要將launch()函數(shù)中的參數(shù)設(shè)置為share=True,還能得到一個(gè)可分享的網(wǎng)址,拿到鏈接的朋友在電腦和手機(jī)端都能打開(kāi),活脫脫就是一個(gè)小程序。
時(shí)常需要做Demo的小伙伴快看起來(lái)吧,此項(xiàng)目在Github上已有4.5k+star。
https://github.com/gradio-app/gradio
4. Hub
這個(gè)Hub在數(shù)據(jù)管理和數(shù)據(jù)預(yù)處理上可是一把好手。
它可以處理任何類(lèi)型,任何大小的數(shù)據(jù),并且因?yàn)閿?shù)據(jù)儲(chǔ)存在云端上,所以可以無(wú)縫在任何機(jī)器上訪(fǎng)問(wèn)。
被壓縮為二進(jìn)制字節(jié)的數(shù)據(jù)可以被存儲(chǔ)在任何地方,并且只有在需要的時(shí)候才會(huì)被獲取,所以沒(méi)有TB級(jí)硬盤(pán)也可以處理TB級(jí)數(shù)據(jù)。
Hub貼心地提供了重要API,支持?jǐn)?shù)據(jù)在常用工具(PyTorch等)上的使用,數(shù)據(jù)版本控制,數(shù)據(jù)轉(zhuǎn)換等功能。
此項(xiàng)目在github上已有4.1k+star。
https://github.com/activeloopai/Hub
5. AugLy
AugLy是facebook最新推出的數(shù)據(jù)增強(qiáng)庫(kù),同時(shí)支持語(yǔ)音,文本,圖像和視頻類(lèi)型的數(shù)據(jù),包含了100多種增強(qiáng)方式。
數(shù)據(jù)對(duì)于模型訓(xùn)練至關(guān)重要,而標(biāo)注大規(guī)模數(shù)據(jù)十分困難。由于人力資源,和模型特性的限制,數(shù)據(jù)增強(qiáng)的應(yīng)用越來(lái)越廣泛。
AugLy的優(yōu)點(diǎn):
處理類(lèi)型更為全面。其他的數(shù)據(jù)增強(qiáng)庫(kù),例如Albumentations和NVIDIA DALI,主要負(fù)責(zé)圖像相關(guān)數(shù)據(jù)的處理,文字?jǐn)?shù)據(jù)不支持。
處理方式十分人性化。AugLy可以將一張圖片做成備忘錄,在圖片/視頻上疊加文字/Emojis,轉(zhuǎn)發(fā)社交媒體上的截圖,還可以幫助你處理諸如拷貝檢測(cè)、仇恨言論檢測(cè)或版權(quán)侵權(quán)等問(wèn)題。
此項(xiàng)目在Github上已有4.1k+star。
https://github.com/facebookresearch/AugLy
6. Evidently
Evidently是用來(lái)監(jiān)測(cè)模型效果的工具,可從Pandas DataFrame或csv文件中生成交互式可視化報(bào)告和JSON格式的效果簡(jiǎn)介。在Jupyter Notebook中可以使用。
目前可以提供6種報(bào)告:數(shù)據(jù)漂移、數(shù)值目標(biāo)漂移、分類(lèi)目標(biāo)漂移、回歸模型性能、分類(lèi)模型性能和概率分類(lèi)模型性能。
此項(xiàng)目在Github上已有1.8k+star。
https://github.com/evidentlyai/evidently
7. YOLOX
如果你熟悉YOLO的話(huà),那你或許會(huì)對(duì)曠視今年推出的YOLOX感興趣。
YOLO就是那個(gè)目標(biāo)檢測(cè)算法,可以被使用在汽車(chē)自動(dòng)駕駛等前沿技術(shù)中。
而YOLOX是YOLO的無(wú)錨版本,設(shè)計(jì)更簡(jiǎn)單,但性能更好!它的目標(biāo)是在研究界和工業(yè)界之間架起一座橋梁,同時(shí)彌合兩方之間的差距。
這個(gè)Github上的開(kāi)源項(xiàng)目在短短半年內(nèi)已獲得5.2k+star。
https://github.com/Megvii-BaseDetection/YOLOX
8. LightSeq
正如它的名字一樣,LightSeq是一款由字節(jié)跳動(dòng)開(kāi)發(fā)的支持BERT、GPT、Transformer等眾多模型的超快推理引擎。
可以看到它的表現(xiàn),比FasterTransformer還要Fast。
LightSeq支持的模型也是非常全面。
總之就是兩個(gè)字“好用”。此項(xiàng)目在Github上已有1.9k+star。
https://github.com/bytedance/lightseq
9. Greykite
想預(yù)測(cè)COVID-19的恢復(fù)速度嗎?那就來(lái)看看LinkedIn為了自家時(shí)間序列預(yù)測(cè)需求開(kāi)發(fā)的Greykite吧。
功能全面(多種時(shí)間趨勢(shì)),界面直觀,預(yù)測(cè)速度快和可擴(kuò)展性強(qiáng)是它最大的亮點(diǎn)。
被應(yīng)用在上面的三大算法:
Silverkite (Greykite’s flagship algorithm)
Facebook Prophet
Auto Arima
感興趣的話(huà)就去研究看看吧,此項(xiàng)目在Github上已有1.4k+star。
https://github.com/linkedin/greykite
10. Jina and Finetuner
如今,在搜索引擎等應(yīng)用上,語(yǔ)義識(shí)別的地位越來(lái)越高,因?yàn)樗梢杂行П苊庾衷~匹配的局限。
不過(guò)語(yǔ)義識(shí)別涉及的神經(jīng)網(wǎng)絡(luò)可能會(huì)讓很多人感到頭大,Jina和Finetuner可以幫你解決這些問(wèn)題。
Jina是一個(gè)神經(jīng)搜索框架,使任何人都能在幾分鐘內(nèi)建立可擴(kuò)展的深度學(xué)習(xí)搜索應(yīng)用程序。
Finetuner配合Jina幫助你對(duì)神經(jīng)網(wǎng)絡(luò)進(jìn)行調(diào)參,以獲得神經(jīng)搜索任務(wù)的最佳結(jié)果。
Jina和Finetuner適合沒(méi)什么經(jīng)驗(yàn),又想嘗試的朋友。
https://github.com/jina-ai/finetuner
參考鏈接:
https://tryolabs.com/blog/2021/12/21/top-python-libraries-2021
審核編輯 :李倩
-
數(shù)據(jù)
+關(guān)注
關(guān)注
8文章
7178瀏覽量
89720 -
機(jī)器學(xué)習(xí)
+關(guān)注
關(guān)注
66文章
8447瀏覽量
133131 -
python
+關(guān)注
關(guān)注
56文章
4811瀏覽量
85079
原文標(biāo)題:這10個(gè)Python機(jī)器學(xué)習(xí)庫(kù),你用過(guò)哪些?
文章出處:【微信號(hào):TheBigData1024,微信公眾號(hào):人工智能與大數(shù)據(jù)技術(shù)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
適用于MySQL和MariaDB的Python連接器:可靠的MySQL數(shù)據(jù)連接器和數(shù)據(jù)庫(kù)
![適用于MySQL和MariaDB的<b class='flag-5'>Python</b>連接器:可靠的MySQL數(shù)據(jù)連接器和數(shù)據(jù)<b class='flag-5'>庫(kù)</b>](https://file1.elecfans.com/web3/M00/06/57/wKgZPGeJ2kmAcWpWAAAh1ecL_LM122.png)
如何使用Python構(gòu)建LSTM神經(jīng)網(wǎng)絡(luò)模型
樹(shù)莓派開(kāi)發(fā)的最佳編程語(yǔ)言選擇
RISC-V如何支持不同的AI和機(jī)器學(xué)習(xí)框架和庫(kù)?
如何幫助孩子高效學(xué)習(xí)Python:開(kāi)源硬件實(shí)踐是最優(yōu)選擇
【「時(shí)間序列與機(jī)器學(xué)習(xí)」閱讀體驗(yàn)】時(shí)間序列的信息提取
【《時(shí)間序列與機(jī)器學(xué)習(xí)》閱讀體驗(yàn)】+ 時(shí)間序列的信息提取
pytorch和python的關(guān)系是什么
Python在AI中的應(yīng)用實(shí)例
Python自動(dòng)訓(xùn)練人工神經(jīng)網(wǎng)絡(luò)
opencv-python和opencv一樣嗎
深度學(xué)習(xí)常用的Python庫(kù)
如何使用Python進(jìn)行神經(jīng)網(wǎng)絡(luò)編程
ESP32下如何加自定義Python庫(kù)?
機(jī)器學(xué)習(xí)8大調(diào)參技巧
![<b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)</b>8大調(diào)參技巧](https://file.elecfans.com/web2/M00/4E/DC/poYBAGLCjeiALm_WAAAYmfR7Qec474.png)
評(píng)論