欧美性猛交xxxx免费看_牛牛在线视频国产免费_天堂草原电视剧在线观看免费_国产粉嫩高清在线观看_国产欧美日本亚洲精品一5区

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

云計算機器學習平臺的標配功能及選購指南

如意 ? 來源:企業(yè)網(wǎng)D1Net ? 作者:Martin Heller ? 2020-08-18 11:27 ? 次閱讀

云計算機器學習平臺提供的多種功能可以支持完整的機器學習生命周期。

為了創(chuàng)建有效的機器學習和深度學習模型,組織需要獲取大量的數(shù)據(jù),并對其執(zhí)行特征工程的方法,以及在合理的時間內訓練數(shù)據(jù)模型的方法。然后,組織需要一種方法來部署模型,監(jiān)視它們是否隨時間的推移而改變,以及根據(jù)需要重新訓練它們。

如果組織已經(jīng)在計算資源和加速器(例如GPU)上進行了投資,則可以在內部部署基礎設施完成所有這些操作,但是可能會發(fā)現(xiàn),如果資源足夠,它們在很多時間都處于閑置狀態(tài)。另一方面,有時在云平臺中運行整個管道,根據(jù)需要使用大量計算資源和加速器,然后釋放它們,可能更具成本效益。

主要的云計算提供商(以及其他云計算提供商)已投入大量精力來構建其機器學習平臺,以支持從計劃項目到維護生產(chǎn)模型的完整機器學習生命周期。組織如何確定哪些云平臺可以滿足其需求?每個端到端機器學習平臺都應提供以下12種功能。

1.接近自己的數(shù)據(jù)

如果組織擁有建立精確模型所需的大量數(shù)據(jù),則不希望將其傳輸?shù)绞澜绺鞯亍_@里的問題并不是距離,而是時間:數(shù)據(jù)傳輸速度最終受到光速限制,即使在帶寬無限的完美網(wǎng)絡上也是如此。長距離意味著等待時間更長。

對于非常大的數(shù)據(jù)集,理想的情況是在已經(jīng)存在數(shù)據(jù)的地方建立模型,從而不需要傳輸大量數(shù)據(jù)。一些數(shù)據(jù)庫在一定程度上支持這一點。

下一個最佳情況是數(shù)據(jù)與模型構建軟件位于同一高速網(wǎng)絡上,這通常意味著在同一數(shù)據(jù)中心內。如果組織擁有TB或更大容量的數(shù)據(jù),即使將數(shù)據(jù)從一個數(shù)據(jù)中心遷移到云計算可用性區(qū)域內的另一個數(shù)據(jù)中心,也可能會造成嚴重的延遲。組織可以通過執(zhí)行增量更新來緩解這種情況。

最壞的情況是,組織必須在帶寬受限和高延遲的路徑上遠程移動大量數(shù)據(jù)。而在這方面,澳大利亞為此部署的跨太平洋電纜的工程令人驚嘆。

2.支持ETL或ELT管道

ETL(導出、轉換和加載)和ELT(導出、加載和轉換)是數(shù)據(jù)庫領域中常見的兩種數(shù)據(jù)管道配置。機器學習和深度學習擴大了對這些內容的需求,尤其是轉換部分。當轉換需要更改時,ELT為組織提供更大的靈活性,因為加載階段通常是大數(shù)據(jù)最耗時的階段。

通常情況下,沒有進行處理的數(shù)據(jù)很嘈雜,需要過濾。此外,這些數(shù)據(jù)的范圍也有所不同:一個變量的最大值可能高達數(shù)百萬,而另一個變量的范圍可能是-0.1至-0.001。對于機器學習來說,必須將其變量轉換為標準化的范圍,以防止較大范圍的變量控制模型。具體的標準化范圍取決于模型使用的算法。

3.支持在線環(huán)境進行模型構建

傳統(tǒng)的觀點是,組織應該將數(shù)據(jù)導入桌面設備以進行模型構建。建立良好的機器學習和深度學習模型所需的大量數(shù)據(jù)改變了局面:組織可以將一小部分數(shù)據(jù)樣本下載到桌面設備上,以進行探索性數(shù)據(jù)分析和模型構建,但是對于生產(chǎn)模型,則需要訪問完整的模型數(shù)據(jù)。

Jupyter Notebooks、JupyterLab和Apache Zeppelin等基于Web的開發(fā)環(huán)境非常適合模型構建。如果組織的數(shù)據(jù)與筆記本電腦環(huán)境位于同一云平臺中,則可以對數(shù)據(jù)進行分析,以很大程度地減少數(shù)據(jù)移動的時間。

4.支持擴展訓練

除了訓練模型之外,筆記本電池的計算和內存要求通常很小。如果筆記本可以生成在多個大型虛擬機或容器上運行的訓練作業(yè),則將大有幫助。如果訓練可以訪問加速器(例如GPU、TPU和FPGA),也將有很大幫助;這些模型可以將數(shù)天的訓練過程變成數(shù)小時。

5.支持AutoML和自動特征工程

并不是每個組織都擅長于選擇機器學習模型、選擇特征(模型使用的變量),以及從原始觀察中設計新特征。即使組織擅長這些任務,它們也很耗時,而且可以在很大程度上實現(xiàn)自動化。

AutoML系統(tǒng)經(jīng)常嘗試使用許多模型來查看哪些模型可以產(chǎn)生優(yōu)秀目標函數(shù)值,例如回歸問題的最小平方誤差。出色的AutoML系統(tǒng)還可以執(zhí)行功能工程,并有效地利用它們的資源,以盡可能多的特征集合來追求優(yōu)質的模型。

6.支持優(yōu)質的機器學習和深度學習框架

大多數(shù)數(shù)據(jù)科學家擁有用于機器學習和深度學習技術的很喜歡的框架和編程語言。對于喜歡Python的人來說,Scikit學習通常是機器學習的最愛,而TensorFlow、PyTorch、Keras、MXNet通常是深度學習的首選。在Scala中,Spark MLlib往往是機器學習的首選。在R中,有許多原生機器學習包,以及與Python的良好接口。而在Java中,H2O.ai的評價很高,Java-ML和Deep Java Library也是如此。

云計算機器學習和深度學習平臺往往擁有自己的算法集合,并且它們通常以至少一種語言或作為具有特定入口點的容器來支持外部框架。在某些情況下,組織可以將自己的算法和統(tǒng)計方法與平臺的AutoML功能集成在一起,這非常方便。

一些云平臺還提供了自己的主要深度學習框架的調整版本。例如,AWS公司擁有TensorFlow的優(yōu)化版本,該公司聲稱可以為深度神經(jīng)網(wǎng)絡訓練提供近乎線性的可擴展性。

7.提供預訓練的模型并支持轉移學習

并非每個人都希望花費時間和資源來訓練自己的模型,而即使當預訓練的模型可用時,他們也不應該如此。例如,ImageNet數(shù)據(jù)集非常龐大,并且要針對其訓練比較先進的深度神經(jīng)網(wǎng)絡可能要花費數(shù)周的時間,因此在可能的情況下使用預先訓練的模型是有意義的。

另一方面,經(jīng)過預訓練的模型可能無法始終標識組織關心的對象。轉移學習可以幫助組織針對特定數(shù)據(jù)集自定義神經(jīng)網(wǎng)絡的最后幾層,而無需花費更多時間和資金來訓練整個網(wǎng)絡。

8.提供優(yōu)化的人工智能服務

主要的云平臺為許多應用程序提供了功能強大且經(jīng)過優(yōu)化的人工智能服務,而不僅僅是圖像識別。其示例包括語言翻譯、語音轉換到文本、文本轉換到語音、預測和推薦。

這些服務已經(jīng)經(jīng)過訓練和測試,其使用的數(shù)據(jù)量超出了企業(yè)通??色@得的數(shù)據(jù)量。它們還已經(jīng)部署在具有足夠計算資源(包括加速器)的服務端點上,以確保在全球負載下具有良好的響應時間。

9.管理實驗

為組織的數(shù)據(jù)集找到優(yōu)秀模型的唯一方法是嘗試采用所有方法,無論是人工還是使用AutoML。這就留下了另一個問題:管理實驗。

良好的云計算機器學習平臺將為組織提供一種方式,可以查看和比較每個實驗的目標函數(shù)值(訓練集和測試數(shù)據(jù))以及模型和混淆矩陣的大小。而能夠繪制所有這些圖表具有一定的優(yōu)勢。

10.支持模型部署以進行預測

一旦組織有了根據(jù)自己的條件選擇優(yōu)秀實驗的方法,就需要一種簡單的方法來部署模型。如果組織出于同一目的部署多個模型,則還需要一種在它們之間分配流量的方法來進行a/b測試。

11.監(jiān)控預測效果

數(shù)據(jù)隨著世界的變化而變化。這意味著組織無法部署模型而忘記它。與其相反,組織需要監(jiān)視為預測而提交的數(shù)據(jù)。當數(shù)據(jù)從原始訓練數(shù)據(jù)集的基線開始發(fā)生明顯變化時,組織需要重新訓練模型。

12.控制成本

最后,組織需要一些方法來控制模型產(chǎn)生的成本。部署用于生產(chǎn)推理的模型通常占到深度學習成本的90%,而訓練僅占成本的10%。

控制預測成本的優(yōu)秀方法取決于組織的負載和模型的復雜性。如果負載很高,則可以使用加速器來避免添加更多虛擬機實例。如果負載可變,則隨著負載的增加或減少,組織可能能夠動態(tài)更改大小或實例或容器的數(shù)量。而且,如果組織的負載較少,則可以使用帶有部分加速器的非常小的實例來處理預測。

【編輯推薦】

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 云計算
    +關注

    關注

    39

    文章

    7849

    瀏覽量

    137917
  • 機器學習
    +關注

    關注

    66

    文章

    8442

    瀏覽量

    133107
  • 深度學習
    +關注

    關注

    73

    文章

    5516

    瀏覽量

    121586
收藏 人收藏

    評論

    相關推薦

    工業(yè)中使用哪種計算機?

    在工業(yè)環(huán)境中,工控機被廣泛使用。這些計算機的設計可承受極端溫度、灰塵和振動等惡劣條件。它們比標準消費類計算機更耐用、更可靠。工業(yè)計算機可控制機器、監(jiān)控流程并實時收集數(shù)據(jù)。其堅固的結構和
    的頭像 發(fā)表于 11-29 14:07 ?233次閱讀
    工業(yè)中使用哪種<b class='flag-5'>計算機</b>?

    計算機存儲系統(tǒng)的工作原理和功能

    計算機存儲系統(tǒng)作為計算機系統(tǒng)中至關重要的組成部分,其原理和功能對于理解計算機的運行機制具有關鍵意義。以下將詳細闡述計算機存儲系統(tǒng)的原理和
    的頭像 發(fā)表于 09-26 16:42 ?1386次閱讀

    如何理解計算?

    訪問需求。 **數(shù)據(jù)分析和挖掘:**用戶可以使用計算來處理和分析海量的數(shù)據(jù),通過平臺可以提供高性能的計算資源來加速數(shù)據(jù)分析的過程。 **
    發(fā)表于 08-16 17:02

    計算機系統(tǒng)的組成和功能

    計算機系統(tǒng)是一個復雜而龐大的概念,它涵蓋了計算機硬件、軟件以及它們之間相互作用的所有元素。為了全面而深入地探討計算機系統(tǒng),本文將從定義、組成、功能、發(fā)展歷程以及未來趨勢等方面進行詳細闡
    的頭像 發(fā)表于 07-24 17:41 ?1301次閱讀

    機器視覺和計算機視覺有什么區(qū)別

    機器視覺和計算機視覺是兩個密切相關但又有所區(qū)別的概念。 一、定義 機器視覺 機器視覺,又稱為計算機視覺,是指利用
    的頭像 發(fā)表于 07-16 10:23 ?639次閱讀

    計算機視覺與人工智能的關系是什么

    引言 計算機視覺是一門研究如何使計算機能夠理解和解釋視覺信息的學科。它涉及到圖像處理、模式識別、機器學習等多個領域的知識。人工智能則是研究如何使計算
    的頭像 發(fā)表于 07-09 09:25 ?777次閱讀

    計算機視覺和機器視覺區(qū)別在哪

    計算機視覺和機器視覺是兩個密切相關但又有明顯區(qū)別的領域。 一、定義 計算機視覺 計算機視覺是一門研究如何使計算機能夠像人類一樣理解和解釋視覺
    的頭像 發(fā)表于 07-09 09:22 ?535次閱讀

    深度學習計算機視覺領域的應用

    隨著人工智能技術的飛速發(fā)展,深度學習作為其中的核心技術之一,已經(jīng)在計算機視覺領域取得了顯著的成果。計算機視覺,作為計算機科學的一個重要分支,旨在讓
    的頭像 發(fā)表于 07-01 11:38 ?997次閱讀

    計算機控制器的結構和功能

    隨著信息技術的迅猛發(fā)展,計算機已經(jīng)深入我們生活的方方面面。而計算機控制器,作為計算機系統(tǒng)的核心部件之一,承擔著協(xié)調各部件工作、指揮整個計算機按程序運行的重要任務。本文將詳細介紹
    的頭像 發(fā)表于 06-17 15:47 ?1961次閱讀

    本源超導量子計算機自主制造鏈11類產(chǎn)品系列之十一:中國首款搭載量子計算機真機的量子計算平臺

    使用。中國首款搭載量子計算機真機的量子計算平臺本源量子計算
    的頭像 發(fā)表于 06-07 08:22 ?446次閱讀
    本源超導量子<b class='flag-5'>計算機</b>自主制造鏈11類產(chǎn)品系列之十一:中國首款搭載量子<b class='flag-5'>計算機</b>真機的量子<b class='flag-5'>計算</b><b class='flag-5'>云</b><b class='flag-5'>平臺</b>

    工業(yè)計算機功能和特點

    在數(shù)字化和自動化的浪潮中,工業(yè)計算機以其獨特的功能和強大的計算能力,逐漸在工業(yè)領域中嶄露頭角。本文將對工業(yè)計算機進行詳細介紹,包括其定義、功能
    的頭像 發(fā)表于 06-06 17:01 ?891次閱讀

    工業(yè)計算機與普通計算機的區(qū)別

    在信息化和自動化日益發(fā)展的今天,計算機已經(jīng)成為了我們日常生活和工作中不可或缺的工具。然而,在計算機領域中,工業(yè)計算機和普通計算機雖然都具備基本的計算
    的頭像 發(fā)表于 06-06 16:45 ?1629次閱讀

    國產(chǎn)計算機平臺——兆芯

    國產(chǎn)計算機平臺介紹,今天我們來介紹兆芯平臺。 上海兆芯集成電路有限公司成立于2013年,是國內領先的芯片設計廠家,由上海國資委下屬企業(yè)和臺灣威盛電子合資成立。威盛持有X86許可證,允許其子公司生產(chǎn)
    的頭像 發(fā)表于 05-28 10:17 ?1069次閱讀
    國產(chǎn)<b class='flag-5'>計算機</b><b class='flag-5'>平臺</b>——兆芯

    【量子計算機重構未來 | 閱讀體驗】+ 初識量子計算機

    : 現(xiàn)在到哪里可以買到量子計算機? 1、購買實物的量子計算機: Rigetti和D-Wave公司,當前價格非常昂貴。 2、購買量子計算機服務:IBM、Google、Amazon、Mi
    發(fā)表于 03-05 17:37

    國產(chǎn)計算機平臺介紹——龍芯

    你了解中國的自主平臺計算機嗎?不僅是中國制造,而是由中國自主研發(fā),可以持續(xù)迭代產(chǎn)品,而且還能夠決定產(chǎn)品用途、決定技術歸屬權的國產(chǎn)計算機才是真正中國計算機。 而作為中國
    的頭像 發(fā)表于 03-05 11:40 ?949次閱讀
    國產(chǎn)<b class='flag-5'>計算機</b><b class='flag-5'>平臺</b>介紹——龍芯