欧美性猛交xxxx免费看_牛牛在线视频国产免费_天堂草原电视剧在线观看免费_国产粉嫩高清在线观看_国产欧美日本亚洲精品一5区

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

如何才能讓人工智能成為實實在在創(chuàng)變未來的持續(xù)力量

nlfO_thejiangme ? 來源:未知 ? 作者:李倩 ? 2018-04-17 15:26 ? 次閱讀

本文為將門線上技術(shù)社群直播兩周年&100期特別活動第一期、阿里巴巴集團副總裁、高級研究員華先勝老師強勢回歸的分享回顧。華老師結(jié)合阿里巴巴在電商、城市計算、工業(yè)、醫(yī)療和設(shè)計等領(lǐng)域的人工智能技術(shù)和應(yīng)用上的探索和實踐,通過每一個Case Study,和我們一起詳細探討了如何才能讓人工智能成為實實在在創(chuàng)變未來的持續(xù)力量。

最近我正好看到一個文件,說美國綜合了很多調(diào)研報告,總結(jié)了20項在未來30年將會改變世界的技術(shù),我自己看了一眼,發(fā)現(xiàn)前面10項基本上都跟人工智能直接、或間接相關(guān)。

所以,看得出來人工智能在將來的世界里未來30年會扮演非常重要的角色,它將會影響各行各業(yè)。

那這些行業(yè)到底會發(fā)生什么樣的變化,是被顛覆、會被改變、還是會對它整個布局、整個發(fā)展、整個狀態(tài)發(fā)生或大或小的變化,我們分享完以后可以回來再看一下。

前面是一個引子,接下來解釋一下今天的題目。無行業(yè),不AI有兩種解釋方法。

第一,無行業(yè)不AI。沒有一個行業(yè)沒有AI,也就是說所有行業(yè)都會有AI降臨(這個可能有些夸張,可以說是大部分行業(yè)吧),就是說AI將會滲透到各行各業(yè)里。

第二,無行業(yè),不AI。就是說不深入行業(yè)的話是沒有成功的AI的。我經(jīng)常聽到的、也是經(jīng)常講的一句話,也是在阿里里經(jīng)常討論的一句話,就是說今天我們通用的計算是有的,但通用的AI是沒有的。所以,AI的技術(shù)要讓它真正的落地,一定是要深入一個行業(yè),為什么這么說、為什么這樣做才可以?后面我們會根據(jù)實例來一步步拆解。

第三,視覺智能。因為我是做視覺的,所以重點從視覺智能案例一起來分析。視覺智能也是這次人工智能的熱點,因為畢竟從應(yīng)用的場景看,從今天技術(shù)成熟度來看,也是視覺方面做的更為靠前。人的信息獲取絕大部分都是視覺,有人是70%、有人是80%、有人是90%,但至少有70%以上是從視覺獲取的。所以,這一部分的信息也是最重要的。

第四,探索與實踐。我今天講的例子還算相對比較成功的。其實背后還有很多辛酸、眼淚,今天就不見得給大家分享了,但中間一些坑我可能會提到。

今天的AI,我套用主席的一句詩叫“天生一個仙人洞,無限風光在險峰”。確實首先AI非常風光,AI行業(yè)的工資也非常高,現(xiàn)在AI的人才也比較難雇。不管是從工資也好、還是融資、估值等之類的角度看,都很風光,但這個風光確實有點像在險峰上。

所以我后面想接一句“卻是容易翻車處”。要保證不翻車的話,很重要的是要在商業(yè)上要有成功。商業(yè)上的成功很重要的一條是誰來買單。我們不希望只是VC買單,一個個往下接盤,看上去好像也有人買單似的,但這個肯定不是我們希望的,也是不能長久的。

在商業(yè)上的成功關(guān)鍵是什么呢?刷榜、PR、融資還是估值?我想除了這些以外,還有一個就是我們今天的主題,即行業(yè)壁壘。

我講行業(yè)壁壘的時候,并不是著重說我們需要跟這個行業(yè)誰誰誰有什么關(guān)系,也不僅僅是行業(yè)的知識。

今天我講的行業(yè)壁壘是我們對行業(yè)深入的理解,對行業(yè)的數(shù)據(jù)、對行業(yè)的問題、對行業(yè)的用戶非常深入地理解它,為解決這個行業(yè)真正的問題,為這個行業(yè)的用戶、客戶帶來真正不可帶替代的價值。從這個角度來講,它會成為一個壁壘,而且這個壁壘我個人認為可能會是更重要的壁壘。

前面說了一些自己的觀點,后面我們還是從具體例子看一下。

視覺設(shè)計

這個其實做的人會比較少一點。曾經(jīng)Google的DeepMind做過這個,今天我講的是更能夠商用的,更有商業(yè)價值的一種設(shè)計,而不是看著好玩的。

設(shè)計行業(yè),我們這里主要講二維設(shè)計平面設(shè)計,但實際上還有三維、還有動畫、視頻等。這個行業(yè)據(jù)說有4000萬從業(yè)人員,他有很多工具,離線工具、在線工具,還有很多模塊、很多素材,據(jù)說中國整個市場容量是3000億,其實還是蠻大的。

現(xiàn)在這個行業(yè)基本上都是人工來做,效率還是比較低的。有很多工作并不需要頂級設(shè)計師來完成,但又不是說隨便一個人就能設(shè)計出來的。我們看到這個情況以后,尤其在電商領(lǐng)域,阿里有這樣一個很大的應(yīng)用場景,有大量的商品廣告(我們把它叫“Banner”),我們就開始思考這個問題的解決方案。

這個廣告在電商的網(wǎng)站上經(jīng)常出現(xiàn),每天的需求量也非常大,我們就以這個作為突破口開始去看,我們能不能依靠算法能夠達到初級設(shè)計師的水平。

在AI行業(yè),大部分人做的都是識別、理解、搜索。這個基本上是從視覺的信號里去獲取語義、或特征,而設(shè)計其實是反過來的,是生成或融合視覺信號。

今天也有一些這個方向的學術(shù)工作,像Style Transfer,很早就有人做了,也不難實現(xiàn)。但說真正商用的東西,還不多見,今天我來介紹的就是一個這樣的例子。

整個2D設(shè)計,目標是可控視覺內(nèi)容的設(shè)計與生成。給定一些要求、一些素材以后,要設(shè)計成一個稿子,每個人設(shè)計出來的都是不一樣的,不大可能有兩個互相不參考的人能夠設(shè)計出同樣一個東西來。我們也是這樣的。我們既要給他足夠大的自由度,但也有一定的可控性。所以我們這個系統(tǒng)做出來以后,其實每次同樣的輸入,每次輸出的數(shù)據(jù)結(jié)果都可以是不一樣的。

所以,我們的目標是:可控視覺內(nèi)容設(shè)計與生成,讓AI做設(shè)計,使數(shù)據(jù)內(nèi)容、制造變得高質(zhì)、高效、普惠、低成本。愿景是:“所想、即所見、即所得”。這個稍微夸張了一點,但實際上你還是要把一些素材,例如文字、圖片送到系統(tǒng)中去,后面出來的就是你想要的東西。

這里基本的技術(shù)包括了圖像的理解,包括了增強、編輯、渲染、生成、評估等,因為我們必須知道我們做出來的東西是好還是壞,而且要自動做出評估。

下面這張圖是一個非常High level的系統(tǒng)構(gòu)成,所想+云上的視覺(智能生成引擎),我們即所見、即所得的是三類東西。

第一類的東西應(yīng)該很快就會面世、發(fā)布,我們內(nèi)部叫鹿班,也就是二維圖像的設(shè)計和生成?,F(xiàn)在我們還在做的是三維的圖像生成。

這項技術(shù)在去年的雙11上得到了非常充分的運用。這項技術(shù)有了以后,對于每一個不同的產(chǎn)品會有不同的設(shè)計出來。我們做個性化推薦、搜索的時候是要千人千面,每個人的結(jié)果不一樣。有了這項技術(shù)之后,是千貨千面,合起來就是千人、千貨、千千面。

所以,每一個不同的人對同一件商品會得到不同的設(shè)計,因為系統(tǒng)會根據(jù)他的喜好會得到不同的設(shè)計,可以以他更喜歡的方式來展現(xiàn)這個商品。

在去年雙11的時候,有4.1億的設(shè)計是用算法生成的。峰值的時候,每天可以生成5000萬個,生成完以后直接就上線了。

我們把這個系統(tǒng)成功做出來,其中一定要有設(shè)計師一起來深度參與的,因為畢竟我們是做技術(shù)的人,不熟悉設(shè)計的原理。

大家可以看到剛才這個技術(shù)實際上有點想革設(shè)計師的命,那設(shè)計師怎么會跟你合作呢。我們在做很多行業(yè)的時候,比如像醫(yī)療,有時也會引起一些恐慌。其實我想這可能是還沒有真正理解AI到底能做什么、到底什么東西是不能做的。

我們在尋求設(shè)計師合作的時候一定要找頂級設(shè)計師來合作,然后才能做出來一個AI的設(shè)計師(大概是一個入門級水平的設(shè)計師)。

但現(xiàn)在我們的AI設(shè)計師也只能做到這種比較有模式的設(shè)計。如果要做的非常有創(chuàng)新,今天的算法還是完成不了的。

所以,實際上設(shè)計師是不會失業(yè)的。但如果你只是一個二流、三流的平面設(shè)計師,可能會失業(yè)。這個其實也是在深入行業(yè)的時候碰到了一個很有意思的問題。有些行業(yè)我們雖然會顛覆它,但這個行業(yè)里的頂尖高手一定會有他們的未來,我想也會促使我們每個行業(yè)的從業(yè)者,從簡單、重復的腦力勞動中、或有復雜但有模式的腦力勞動中解放出來,這是第一個例子。

視頻廣告

我記得在很多年前,YouTube剛出來,以及在國內(nèi)很多視頻網(wǎng)站還在為贏得用戶而戰(zhàn)斗的時候,可能沒有多少人關(guān)注廣告,因為那時候要吸引用戶,后來慢慢地開始做廣告了。

今天廣告仍然是視頻網(wǎng)站很重要的收入來源,當然也還有會員費的收入。但這個視頻廣告的體驗到底好不好?我放一幅圖在這其實就是這個意思,今天我們看到視頻的廣告體驗有點像這個人拿著標槍就想把它砸掉,我不知道大家有沒有這個體驗。

那有沒有更好的方式來做視頻廣告。那我們先來看一下廣告的分類,大致可以分為三類。

一.Video-In。就是把廣告的內(nèi)容插到視頻里去,其實in有不同的做法。第一種是直接把視頻的片段放進去,也有把廣告overlay疊加到視頻里面去,還有把廣告信息作為三維的placement放到場景里面去。

二.Video-Out。就是說從video已有的內(nèi)容往外做,里面有什么商品、有什么人物,然后給一個上下文相關(guān)的廣告。

三.廣告設(shè)計。這個跟剛才講到的內(nèi)容是類似的,這里就不再講了。

這里我給大家講兩個例子。

案例一:場景關(guān)聯(lián)的廣告。這個我們也是在優(yōu)酷土豆上做過的技術(shù),是基于對視頻的里的目標和場景進行分析來做上下文關(guān)聯(lián)廣告。今天的視頻識別技術(shù)遠遠比以前做得更精細,所以我們可以根據(jù)識別的目標和場景做內(nèi)容更為相關(guān)的廣告。

這里還有一些關(guān)于大場景判斷的問題,這種方式比那種直接放一個完全不相關(guān)的廣告,用戶的體驗會要好一些。

案例二:植入式的廣告。廣告植入能不能做到更好?做到更好的話就是這種方式——我經(jīng)常把它叫“優(yōu)雅的廣告”,者叫“植入式的廣告”。比如說我們檢測到視頻里有一個平面,我們就把這個廣告貼進去,像這個東西本來就在真實場景里存在一樣。

這個技術(shù)當然也是要建立在識別的基礎(chǔ)上,一定要對這個場景有非常好的理解,這種理解就分兩類。

對語義的理解。

對三維結(jié)構(gòu)的理解。

我們對它進行理解以后,就要找到合適的地方。剛才我們講的是平面上去替換了,其實在桌面上它還可以放一個東西,比如放一瓶酸奶,把礦泉水換成別的東西之類的。所以平面的檢測不管是水平還是豎直的,然后進行廣告位的篩選。

這個技術(shù),包括還有光照分析、模糊分析、遮擋分析之類的,到廣告位的存儲,再到線上的實時渲染。聽起來有點像增強現(xiàn)實,其實這里有很多是相通的技術(shù),只不過在這里它的要求不一樣,它的難度也不一樣。

從難度上來講,它容易的地方在于我們不需要做到實時,因為我們是離線尋找廣告位,然后在線把它放進去,所以大量的計算是離線完成。

它的難處是我們只有一個視頻,我沒有深度、沒有雙目、沒有設(shè)備、沒有相機的位置,什么都不知道,完全根據(jù)視頻來做。所以,一般來說只有運動的視頻,我們才可以通過structure from motion或類似的技術(shù)去估計場景的三維信息。

從應(yīng)用角度講,因為我們不需要實時,而且也不需要全程地去做渲染,我們可以選擇合適的位置來做,因為一個視頻你做廣告的時候也不可能全部都做,全部都做的話體驗也是非常差的。

我們可以選擇我們最有把握的地方去把廣告放進去,從而使得客戶最后渲染出來的結(jié)果比較真實、自然。

還有一種情況,像直播的場景,雖然網(wǎng)紅主播就可以掙到很多錢,但我們也不妨用一點點交互,使得它背后的背景墻也變成一個可以放廣告的地方。這種廣告的插入,需要有一點點交互,不然我們不知道三維的結(jié)構(gòu)。

比如這個人晃動的時候遮住了后面背景上放廣告的話,應(yīng)該會產(chǎn)生實際的遮擋關(guān)系,遮擋的效果,包括相機如果有輕微抖動的話,后墻上的廣告也會跟著一起來抖動。

視頻廣告其實一直是一個視頻網(wǎng)站又愛又恨的東西,因為這里存在四方的關(guān)系。

視頻網(wǎng)站的服務(wù)商

視頻提供者

廣告

用戶

這四方的體驗都是很重要的,廣告做得太多,用戶的體驗就會比較差,廣告商其實也會不高興,因為看的人就會少,效果也不好。如果廣告太少,整個網(wǎng)站的收入就會比較少,用戶的體驗當然是好的,這里有很多權(quán)衡在里面。

包括今天的視頻網(wǎng)站,經(jīng)常也不太敢去嘗試一些非常創(chuàng)新的變化。因為本身整個大的網(wǎng)站的成本也非常高,目前的模式對他們有一定的收入,但一旦做很大改變的時候,引起收入很大的變化,這個風險也是非常大的。

所以,在這方面有些創(chuàng)新非常難,因為它帶來的效果是立竿見影的,好的效果、壞的效果都是立竿見影的。

視覺診斷

如何診斷機器是今天我要講,還有一種是診斷人,診斷人就是醫(yī)療圖像處理,這部分我們今天就不涉及了。

這里有一些跟一般視覺識別任務(wù)不一樣的地方。

它的發(fā)生概率比較低,數(shù)據(jù)量也比較少。它通常是一個小概率事件,而且小概率事件的差異性也比較大。所以我經(jīng)常把它比喻成大海撈針,大海撈針非常不容易,但我能不能縮小范圍,變成桌面上去找針,在桌面上一看我就知道針在哪里了。

我經(jīng)常用一些數(shù)字來說明這個問題:比如說我們要在1萬個樣本里去找其中的10個有問題的樣本。如果不用技術(shù)手段的話,只能這1萬個樣本都看一遍了,那你的勞動量就是1萬。但我今天有個技術(shù),雖然我不知道哪10個,但我一定知道在其中那100個里面。我知道那100個,這10個一定在那100個里,這就是從大海撈針到了桌面找針,這時候這100個需要人去看。

這時候我們看的樣本里面只有10個是對的,準確率只有10%,到召回率在這個理想狀態(tài)是100%。這時候雖然準確率雖然只有10%,可我們省的人力是多少?大家可以算一下這個數(shù)字,省的人力是99%,就是你有99%的人力已經(jīng)省掉了。這個意義是非常重大的!

這類問題實際當中有很多很多,這時候我們在做算法的設(shè)計上要求是不一樣的,就是你的recall要非常高,你的精度是可以犧牲一些的。這個只適合于發(fā)生概率低的事情,帶來的效果一定是有它的價值,例如節(jié)省了人力、提升了質(zhì)量、降低了成本,或者增強了安全性。有些情況下是不能用人去看的,人去檢查的話風險比較大,我們可以通過機器來做。

其中,節(jié)省人力是最直接的,比如像剛才講的99%的人力就已經(jīng)節(jié)省掉了,哪怕我不是在那100個里面去找,而是需要在1000個里們?nèi)フ?,這時候準確率只有1%,但我已經(jīng)省掉了90%的人力,已經(jīng)相當了不起了。

接下來介紹一下行業(yè)視覺診斷,這里說的主要是除了醫(yī)療之外的其它里面視覺診斷,比如:太陽板瑕疵,太陽能電池板的瑕疵檢測,蟲板的密度估計,列車故障的檢測等。這里的解決方法大家都可以比較容易想到的,深度學習、圖像處理,加上檢測識別,但這里每一個問題都看起來容易,其實實際上并不太容易,而且各種情況都有,怎樣才能去避免每一個場景都重復去開發(fā)一套方法,這個也是我們需要去思考和解決的問題。

行業(yè)診斷的現(xiàn)狀基本上有三種方式。

第一種:全人工實現(xiàn)的,人力成本非常高。

第二種:有攝像頭,但靠人去觀察。這個對于人來說每天壓力很大,他沒有看出來后面出現(xiàn)問題了,他可能這個月就白干了。實際上在我們真實場景中經(jīng)常發(fā)現(xiàn),人看漏的可能性是非常高的。人會有疲勞、會有情緒之類的,所以經(jīng)常會漏掉。

第三種:簡單的分析功能,但現(xiàn)在遠遠沒有達到自動化的程度。

行業(yè)診斷哪些能做、哪些不能做?

第一類:基本上肉眼內(nèi)容可分辨的其實是可以做的,所有需要人的肉眼去分辨的東西都可以考慮要不要用人工智能來識別。

第二類:還有一些肉眼分辨比較困難,機器在有些方面能夠比人有更敏銳的洞察力,只要給一定量的數(shù)據(jù),設(shè)計好算法,有些情況下是可以做的。

第三類:肉眼無法分辨的,需要輔助措施。比如需要手捏一捏、估計一下重量,這個機器就沒有辦法了。像內(nèi)胎壁厚薄的檢測、稻殼含水量的計算,估計應(yīng)該過過稱才能知道了。

我突然想起來一個以前講聽過的笑話,說有個生產(chǎn)線上有肥皂裝到紙盒子里去,生產(chǎn)線上有時候出現(xiàn)有的盒子沒有裝肥皂,那怎樣把沒有裝肥皂的盒子找出來,當時這個公司花了很多錢,請他們的博士用了很多方法,各種傳感器、各種智能的方法去分析,做出一套東西出來了。結(jié)果與此同時,有一個工人在旁邊放了一個電風扇,這個電風扇一開動,沒有裝肥皂的盒子就被吹走了,很簡單的方法就解決了這個問題。

這雖然是個笑話,其實我們在真實場景下也可能會發(fā)生類似的事情。也就是,我們要清楚到底我們能夠提供一些什么樣的價值,哪些是適合我們技術(shù)來做的,有些東西可能有更簡單的方法。

回到案例,第一是太陽能電池片的裂紋檢測,這里有多種不一樣的裂紋,有十幾種不同的瑕疵,比如像單條的裂紋、交叉的裂紋等。

目前我們一個初步的結(jié)果,這個精度其實是指“recall”(召回率),快到100%了。誤報目前是接近3%,這種情況下,根據(jù)整個電池面板的比例最后大概能省到1/10到1/20的能力。

我們再往前走一步的話,可能正常的誤報率就進一步降低到跟人相當、或比人還有更好水平的時候,就完全代替了人工,所以人力的比例會變成零,但這也要求你的精度足夠高,甚至高過人。實際上真正的情況下,機器的recall要比人的recall高,因為機器不會疲勞。

案例二是列車故障的檢測。我們每天坐的列車,如果進了車站從來沒有人檢修,一直到出了故障才檢修的話,這個也是挺恐怖的,其實大家也不用擔心,車進站的時候都是有檢修的。

這個圖片顯示的例子是貨運列車,這個進來以后都會有檢修,過去是人要上去檢修,今天有很多公司用的方法都是拍幾千上萬張圖片,這些圖片就放到數(shù)據(jù)中心,大家喝著咖啡、喝著茶就可以看了,但其實他看的時候壓力是很大的,因為很容易漏掉。

我們當時做了一個算法,故障的種類也是千奇百怪,有好幾百種,比如開關(guān)沒有關(guān)好、漏油、裂紋等。這個真的是非常難的問題,我們當時做了其中一部分。上線測試的時候,人檢漏檢掉而機器能夠檢出來的有141個,雖然這里的誤檢率還是蠻高的,因為這個情況非常復雜,但實際上可以大大地減少漏檢的可能性,同時也可以降低人力。

我們基于這些案例,最后總結(jié)出來阿里視覺診斷的引擎。

城市大腦

最后要介紹的是城市大腦。

它要解決的是城市數(shù)據(jù)的問題,這個問題提出來是因為今天城市里的數(shù)據(jù)其實是非常多的,尤其是攝像頭的數(shù)據(jù)量非常大 。這些數(shù)據(jù)的價值還還可以進一步挖掘,有很多很有意義的、可以解決現(xiàn)在城市管理方面很多難題的一些價值,把這些挖掘出來。

為什么能挖掘出來呢?就是因為今天AI的技術(shù)、今天的算力到了這樣一個階段,可以讓我們?nèi)ニ伎?、去嘗試建一個這樣的“城市大腦”去挖掘城市數(shù)據(jù)的價值。

我給城市大腦的定義就是用AI和算力挖掘大量城市數(shù)據(jù)不可替代的價值。這個價值是什么?可以有不同的角度去講,城市治理和服務(wù)的數(shù)據(jù)化、智能化,全面實施全量的優(yōu)化決策、預測和干預,帶來的就是高效、低耗、少能力、便捷等。

城市大腦題目非常大,我們今天主要從其中兩個角度講即城市交通和安防兩個角度來講。

城市目前的幾個現(xiàn)狀是——

第一,盲人摸象。

整個城市的感知其實是有點盲人摸象的。有很多感知手段,地磁線圈微波、卡口、GPS、視頻,但視頻沒有被充分利用起來,其它的監(jiān)察數(shù)據(jù)的話,設(shè)備也是經(jīng)常損壞,沒有一個全面的感知,只是看到了一部分的東西,所以叫“盲人摸象”。

第二,燈下黑。

即使我們用到攝像頭了,其實大部分城市攝像頭是不太智能的?!盁粝潞凇本褪钦f攝像頭有,可我沒有辦法去做分析,因為你人力只有這么多。攝像頭有很多,幾萬、幾十萬,甚至大城市有上百萬的攝像頭。但是,除了查違章有一部分智能攝像頭,其它大部分都是事后去看的和當時少量的人力觀察。

第三,霧里看花。

今天的感知手段不能做全局、全量的實時感知。所以我們沒有辦法去找到很多現(xiàn)象,比如擁堵也好、安全隱患也好,它背后的原因在哪里,所以我們叫霧里看花。

我們進一步看城市大腦是什么樣的東西?首先城市有大量的數(shù)據(jù),包括視頻數(shù)據(jù),我今天講的更多也是視頻數(shù)據(jù),而且視頻數(shù)據(jù)跟其它數(shù)據(jù)不一樣的地方在于,視頻數(shù)據(jù)(pixel)是需要進行分析的,其它數(shù)據(jù)是直接可以使用的。

所以,我們希望所有攝像頭里視野能看到的東西,我們都能理解,包括:車、人、物、事。

車的情況,什么車、什么速度、往哪里走,車牌。

人的情況,駕駛員、行人、騎自行車的人。

物的情況,各種交通標志、拋灑物等之類的。

事的情況,發(fā)生什么事件,有沒有擁堵、逆行、交通事故等都要理解得很透徹。

有了這些之后,我們就可以進行決策和優(yōu)化了,比如簡單的決策是直接把這個事件事故的結(jié)果報告出來,有交警進行下一步處理;優(yōu)化比如紅綠燈優(yōu)化,我們知道所有交通的流量,“眼見為實”地通過視覺分析出來交通的情況,基于此我們可以做更好的紅綠燈配時的優(yōu)化。

還有,把整個城市里面的視覺對象放到搜索引擎里去,這就是像上次講過的拍立淘這樣的技術(shù),今天我們做的是城市元素,所以我們把它叫“索引城市”,里面可以進行搜索可疑車輛、可疑人,比如失蹤的人、有肇事車輛逃逸等,就可以通過它來尋找。當然,我們建立這種視覺數(shù)據(jù)的關(guān)系以后,也可以發(fā)覺他們之間的規(guī)律,找到他們之間背后的原因。

下一步預測,雖然我們沒有辦法預測每一個人、每一輛車的行為,但我們可以預測一個趨勢,比如10分鐘以后的車流是什么,20分鐘以后是什么樣子的,甚至可以做長時間的預測。短時間預測對我們GPS導航就很有好處,今天的GPS導航其實是沒有預測的,預測也是用的歷史數(shù)據(jù)做的預測,不是實時數(shù)據(jù)做的預測。如果說有很好的預測,那對你的路徑規(guī)劃可以做的更優(yōu)化。而長時間預測的話,比如如果對一個城市第二天發(fā)生的情況進行預測,比如第二天天氣不好,還有幾個重要的活動,你大概能夠估計出來明天車流、人流的情況,可能有哪些地方交通擁堵會增加多長時間,哪里交通事故的概率可能會增加。

有了這些信息以后,你就可以進行干預了。

第一種干預,可以預先分配這個資源,預先放到那里,人力、警力、醫(yī)療資源,一旦出了事情以后,馬上就可以應(yīng)對。

更厲害的干預,就是比如明天要發(fā)生的不好事情的話,我們可以提前做一些事情不讓它發(fā)生,比如交通的管控、比如誘導等之類的。

關(guān)于城市感知,我們今天提出來的城市大腦是要做感而全面知、感而全量知、感而實時知。這三個概念我分別簡單做一下介紹。

全面知,我們需要對整個路面上的情況了如指掌,也是今天因為我們在云端的方案有這么大的算力、有這么大的靈活度,以及今天AI技術(shù)的發(fā)展,可以讓我們?nèi)ツ曜霾煌闆r下的精細目標檢測識別、跟蹤等之類的,不管是什么天氣、什么質(zhì)量。

事件事故檢測也是一個異常檢測的問題,因為事件事故的種類樣子也很多,樣本數(shù)量又比較少,跟剛才講的工業(yè)診斷有點像,不過它不是圖片而是視頻,而是視頻的難度更大。這里我們也是把它變成異常檢測的問題,也就是說我們有大量的正常的數(shù)據(jù),我們?nèi)檎5臄?shù)據(jù)建模,有了正常的數(shù)據(jù)的模型,那么異常的視頻片段送進來之后,它的響應(yīng)就會非常高。

除了全面以外,還有全量、實時,這更多是兩方面的內(nèi)容。

方面一:系統(tǒng)層級。背后要有一套計算平臺來支撐,也就是需要有一個大的視頻處理的平臺。我們處理一路視頻、兩路視頻沒有問題,處理十路有沒有問題,但處理百路、千路、萬路的時候會不會有問題?這里其實要有一套背后的系統(tǒng)來支撐。我們阿里云有這樣一套系統(tǒng),在這個基礎(chǔ)上我們就build了一個視頻處理的流水線。當然也有不一樣的地方,因為數(shù)據(jù)的吞吐量大,計算的復雜度高,所以我們也需要對它進行一些優(yōu)化和改造,使得它能夠吃的進去這么大量的數(shù)據(jù),處理得了,還能吐得出來結(jié)果。

方面二:算法本身的計算速度。這個也是非常重要的。如果計算的成本非常高,就沒有辦法實現(xiàn)。所以計算的加速是非常大的投入,當時我們做了三個方面的加速:器件加速、模型精簡和并發(fā)計算流程的優(yōu)化。

一個具體例子,就是我們最近發(fā)布的一個產(chǎn)品,叫“天曜”。這個產(chǎn)品背后我們做了球機的算法,使得原來沒有智能的球機變成有智能的球機,就代替了交警的巡邏,而且它可以24小時巡邏,360度自動巡航,可以對交通違法、交通事故進行全面的監(jiān)測。將來也許可以自動地進行處理,現(xiàn)在還是要人力來處理。

很多交通擁堵都是事故引起的,我們能夠快速地處理,根據(jù)攝像頭看的的內(nèi)容,就知道是誰的責任。不是很嚴重的話,趕緊走人,以免造成交通擁堵;還有一些嚴重的事故,我們能夠及時地發(fā)現(xiàn),及時地把醫(yī)療資源(救護車)送過去就能挽救人的生命。天曜是全天候、全面交通事件、事故感知的一套系統(tǒng)。

這項工作的特點就是充分利用城市既有的監(jiān)控設(shè)備發(fā)揮最大的效率。我們對現(xiàn)有整個鏈路、整個設(shè)備不進行任何改變,我們通過云計算,把無智能的設(shè)備變成一個具有強大人工智能的設(shè)備。讓這個視頻監(jiān)控實現(xiàn)了自動的巡航、巡檢,實現(xiàn)了讓機器替換人力,使得警力可以用在更重要的地方,而不至于用在這樣一個比較簡單的場景。我們現(xiàn)在也在跟AI芯片進行測試,成本會進一步降低,能耗也會降低。

接下來我們跳出來看一下,城市大腦不同的地方在哪里?城市大腦的不同之處,我們是通過大量異構(gòu)城市數(shù)據(jù)中,通過大規(guī)模的計算和AI算法挖掘出不可替代的價值。像剛才講的這些價值,過去的方法是沒有辦法實現(xiàn)的,人力也是無法完成的。這就是第二點,城市大腦在做的事情是大多是人的智能是不能完成的,因為它的復雜度、計算量是沒有辦法完成的,AI在這些方面其實是超越人力的。

第三點是城市大腦希望有一些會成為一個城市基礎(chǔ)設(shè)施,就像水和電一樣。這是創(chuàng)造出來的一個需求。

城市大腦是一個如此巨大的項目,所以我們要把它做成人工智能開放創(chuàng)新平臺的。因為它的問題復雜度、數(shù)據(jù)的量、數(shù)據(jù)的復雜度和要解決問題的數(shù)量之多,以及它可能產(chǎn)生的價值和影響力之大,使得它可以成為一個創(chuàng)新平臺。這也是為什么城市大腦會成為科技部四個國家人工智能開放創(chuàng)新平臺之一。

總結(jié)

我們剛才講了四個例子,核心是要給客戶創(chuàng)造價值,這個價值有的是錦上添花,但基本上是雪中送炭和創(chuàng)造出來的剛需為主,因為這部分更有競爭力一點,在商業(yè)上也更容易成功。

我們再回到最開始,確實人工智能會去改變、去顛覆、去革新各個行業(yè)。所以我經(jīng)常講的一句話是:Intelligence Everywhere,勢不可當。我們從業(yè)者在這其中,到底是成為“勢”還是“擋”,這是我們不同的選擇,不同的選擇和策略,可能成為擋,也可能成為勢。

人工智能對行業(yè)的影響一定會進入各行各業(yè),大量的簡單勞動力可能會被機器替代,復雜但有規(guī)律的腦力勞動也可能會被替代掉,頂級的技術(shù)、藝術(shù)、設(shè)計、服務(wù)、科研、教育等這些還需要專業(yè)的人力,但人工智能會成為他們的助理。

人工智能今天如果真正能讓它落地,而不是成為一個泡沫,不是成為一個虛的東西的話,我們一定要深入這個行業(yè)、理解這個行業(yè),理解這個行業(yè)的數(shù)據(jù)、需求、局限、和價值點等,為這個行業(yè)的場景定制出最適合的最有效的算法和系統(tǒng),這樣的話才能夠真正讓人工智能落在實處,能夠創(chuàng)造、改變我們的未來。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 人工智能
    +關(guān)注

    關(guān)注

    1796

    文章

    47814

    瀏覽量

    240593
  • 視覺設(shè)計
    +關(guān)注

    關(guān)注

    0

    文章

    2

    瀏覽量

    1611

原文標題:華先勝:無行業(yè), 不AI——阿里視覺智能的探索與實踐

文章出處:【微信號:thejiangmen,微信公眾號:將門創(chuàng)投】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    人工智能驅(qū)動網(wǎng)絡(luò)空間作戰(zhàn)的新紀元

    、高效化網(wǎng)絡(luò)指揮控制等,將在未來網(wǎng)絡(luò)作戰(zhàn)中發(fā)揮關(guān)鍵性作用,徹底改變網(wǎng)絡(luò)作戰(zhàn)面貌。 人工智能成為制勝網(wǎng)域戰(zhàn)略制高點。當前,軍事大國先后推出人工智能發(fā)展戰(zhàn)略,紛紛將人工智能作為國防軍事和網(wǎng)
    的頭像 發(fā)表于 01-24 10:51 ?492次閱讀

    嵌入式和人工智能究竟是什么關(guān)系?

    。 此外,嵌入式系統(tǒng)在人工智能算法優(yōu)化和部署中也起到了關(guān)鍵作用。通過將人工智能算法部署到嵌入式設(shè)備,我們可以實現(xiàn)對算法的靈活優(yōu)化和調(diào)整,以滿足不同應(yīng)用場景的需求。同時,嵌入式系統(tǒng)還為人工智能算法的
    發(fā)表于 11-14 16:39

    《AI for Science:人工智能驅(qū)動科學創(chuàng)新》第6章人AI與能源科學讀后感

    探討了人工智能如何通過技術(shù)創(chuàng)新推動能源科學的進步,為未來的可持續(xù)發(fā)展提供了強大的支持。 首先,書中通過深入淺出的語言,介紹了人工智能在能源領(lǐng)域的基本概念和技術(shù)原理。這使得我對
    發(fā)表于 10-14 09:27

    AI for Science:人工智能驅(qū)動科學創(chuàng)新》第4章-AI與生命科學讀后感

    農(nóng)業(yè)、環(huán)保等,為人類社會的可持續(xù)發(fā)展做出貢獻。 總結(jié) 《AI for Science:人工智能驅(qū)動科學創(chuàng)新》第4章關(guān)于AI與生命科學的部分,為我們展示了一個充滿希望和機遇的未來。在這個未來
    發(fā)表于 10-14 09:21

    《AI for Science:人工智能驅(qū)動科學創(chuàng)新》第一章人工智能驅(qū)動的科學創(chuàng)新學習心得

    的同時,確保其公正性、透明度和可持續(xù)性,是當前和未來科學研究必須面對的重要課題。此外,培養(yǎng)具備AI技能的科研人才,也是推動這一領(lǐng)域發(fā)展的關(guān)鍵。 4. 激發(fā)創(chuàng)新思維 閱讀這一章,我被深深啟發(fā)的是人工智能
    發(fā)表于 10-14 09:12

    risc-v在人工智能圖像處理應(yīng)用前景分析

    是一些未來發(fā)展趨勢: 市場規(guī)模持續(xù)增長 :據(jù)多家研究機構(gòu)和公司的預測,RISC-V的市場規(guī)模將持續(xù)增長。到2030年,RISC-V處理器有望占據(jù)全球市場近四分之一的份額。這將為RISC-V在
    發(fā)表于 09-28 11:00

    深圳特信電子 單臂螺旋天線:為何它能成為無線通信領(lǐng)域的佼佼者

    深圳特信電子|單臂螺旋天線:為何它能成為無線通信領(lǐng)域的佼佼者
    的頭像 發(fā)表于 09-05 09:05 ?511次閱讀

    報名開啟!深圳(國際)通用人工智能大會將啟幕,國內(nèi)外大咖齊聚話AI

    8月28日至30日,2024深圳(國際)通用人工智能大會暨深圳(國際)通用人工智能產(chǎn)業(yè)博覽會將在深圳國際會展中心(寶安)舉辦。大會以“魅力AI·無限未來”為主題,致力于打造全球通用人工智能
    發(fā)表于 08-22 15:00

    FPGA在人工智能中的應(yīng)用有哪些?

    FPGA(現(xiàn)場可編程門陣列)在人工智能領(lǐng)域的應(yīng)用非常廣泛,主要體現(xiàn)在以下幾個方面: 一、深度學習加速 訓練和推理過程加速:FPGA可以用來加速深度學習的訓練和推理過程。由于其高并行性和低延遲特性
    發(fā)表于 07-29 17:05

    神州數(shù)碼亮相2024世界人工智能大會,以生成式AI和智能算力共繪智能未來

    ? 在科技的最前沿,人工智能成為萬千目光匯聚的焦點,它與行業(yè)的深度融合,帶來顛覆性的變革與創(chuàng)新。7月4日,2024世界人工智能大會暨人工智能全球治理高級別會議(以下簡稱“WAIC 2024”)開幕
    的頭像 發(fā)表于 07-05 14:21 ?427次閱讀
    神州數(shù)碼亮相2024世界<b class='flag-5'>人工智能</b>大會,以生成式AI和<b class='flag-5'>智能</b>算力共繪<b class='flag-5'>智能</b><b class='flag-5'>未來</b>

    浪潮信息生態(tài)伙伴大會IPF2024:發(fā)展人工智能+,加速創(chuàng)新落地

    4月17日,浪潮信息在北京舉辦的生態(tài)伙伴大會IPF2024上提出,發(fā)展人工智能+,要堅持“以應(yīng)用為導向,以系統(tǒng)為核心”,著重激發(fā)創(chuàng)新活力、拓展創(chuàng)新路徑、加速創(chuàng)新落地,推動人工智能成為百行千業(yè)的生產(chǎn)力。
    的頭像 發(fā)表于 04-18 09:12 ?682次閱讀

    科達嘉電感器在大數(shù)據(jù)與人工智能領(lǐng)域被廣泛應(yīng)用

    近年來,大數(shù)據(jù)與人工智能成為科技領(lǐng)域的熱門話題。大數(shù)據(jù)為人工智能提供了大量的數(shù)據(jù)作為輸入,使得人工智能算法和模型能夠通過學習做出更準確的預測和決策。
    的頭像 發(fā)表于 02-29 13:56 ?546次閱讀

    嵌入式人工智能的就業(yè)方向有哪些?

    嵌入式人工智能的就業(yè)方向有哪些? 在新一輪科技革命與產(chǎn)業(yè)變革的時代背景下,嵌入式人工智能成為國家新型基礎(chǔ)建設(shè)與傳統(tǒng)產(chǎn)業(yè)升級的核心驅(qū)動力。同時在此背景驅(qū)動下,眾多名企也紛紛在嵌入式人工智能領(lǐng)域布局
    發(fā)表于 02-26 10:17

    科達嘉電感器廣泛應(yīng)用于大數(shù)據(jù)及人工智能領(lǐng)域為AI賦能

    近年來,大數(shù)據(jù)與人工智能成為科技領(lǐng)域的熱門話題。大數(shù)據(jù)為人工智能提供了大量的數(shù)據(jù)作為輸入,使得人工智能算法和模型能夠通過學習做出更準確的預測和決策。
    的頭像 發(fā)表于 02-23 17:29 ?906次閱讀

    關(guān)于人工智能的60條趨勢預測

    2023年是技術(shù)發(fā)展的分水嶺,生成式人工智能成為主流。2024年伊始,生成式AI的格局預計將迅速發(fā)展,帶來一系列有望改變技術(shù)及其應(yīng)用的趨勢。這些趨勢,從多模式人工智能模型的進步到小語言模型的興起
    的頭像 發(fā)表于 02-21 08:26 ?743次閱讀
    關(guān)于<b class='flag-5'>人工智能</b>的60條趨勢預測