1872年,斯坦福找到了一位科學(xué)家進(jìn)行連續(xù)攝影并由此創(chuàng)造了人類(lèi)歷史上第一個(gè)“視頻”。1877年,愛(ài)迪生在其“圓筒留聲機(jī)”上錄制了《瑪麗有只小羊羔》的幾秒鐘歌詞,標(biāo)志著人類(lèi)歷史上的第一條音頻記錄。由此,人類(lèi)正式進(jìn)入了音視頻時(shí)代。
在人類(lèi)漫長(zhǎng)的歷史長(zhǎng)河中,文字、圖畫(huà)是記錄和傳遞信息的主要方式,直到音視頻出現(xiàn),才將人類(lèi)記錄信息的方式升級(jí)到了一個(gè)更高維度。從黑白電視再到8K杜比全景聲超清音視頻,音視頻產(chǎn)業(yè)經(jīng)過(guò)一百多年的發(fā)展,已然成長(zhǎng)為萬(wàn)億級(jí)產(chǎn)業(yè)。
01
風(fēng)口之上的多重挑戰(zhàn)
在數(shù)字化浪潮的推動(dòng)下,AI、大模型與音視頻的結(jié)合正成為產(chǎn)業(yè)焦點(diǎn),引領(lǐng)著一場(chǎng)全新的內(nèi)容革命。從 AI 作曲到智能配音,從視頻生成到虛擬形象,AI 在音頻、視頻創(chuàng)作領(lǐng)域的應(yīng)用正在全面開(kāi)花。
不久前的2024中國(guó)新媒體大會(huì)上,一系列獲獎(jiǎng)的AI融媒精品案例彰顯了文化與科技的“雙向奔赴”,其中包括5G密集視音頻傳輸系統(tǒng)、視頻內(nèi)容生產(chǎn)與傳播一體化完整技術(shù)方案等,AI已重新定義音視頻生產(chǎn)力的“新范式”,人工智能和音視頻領(lǐng)域融合趨勢(shì)日漸顯著,同時(shí)音視頻服務(wù)已廣泛應(yīng)用于互娛、廣電傳媒、教育、金融等各種行業(yè),對(duì)場(chǎng)景的滲透愈發(fā)深入,“人工智能+音視頻”技術(shù)正加速賦能千行百業(yè)。
與此同時(shí),這一核心變革的背后,也對(duì)AI算力提出了更高要求。
視頻生成模型的數(shù)據(jù)處理挑戰(zhàn)
視頻生成模型需要處理包括圖像、音頻和視頻在內(nèi)的大量數(shù)據(jù),樣本數(shù)據(jù)模態(tài)多樣化、數(shù)據(jù)質(zhì)量參差不齊,導(dǎo)致數(shù)據(jù)處理鏈路環(huán)節(jié)多、工程復(fù)雜。另外大量的多模態(tài)數(shù)據(jù)處理也對(duì)數(shù)據(jù)存儲(chǔ)以及異構(gòu)算力資源調(diào)度提出了極高的需求。
算力需求及成本挑戰(zhàn)
音視頻AI技術(shù)快速發(fā)展伴隨著算力需求激增,隨之是高昂的算力成本。細(xì)膩的畫(huà)面質(zhì)感、流暢的幀率,還有精準(zhǔn)的特效處理,這一切都需要強(qiáng)大的算力支持,以某影片為例,該影片有1600個(gè)視覺(jué)特效鏡頭,用單機(jī)渲染,需要1700多年,即便用1000臺(tái)主機(jī),也要耗時(shí)約1.7年,算力需求及算力成本都將是天文數(shù)字。
02
軟硬協(xié)同,錨定性能升級(jí)
作為中國(guó)領(lǐng)先的國(guó)產(chǎn)軟硬一體產(chǎn)品及服務(wù)提供商,拓維信息持續(xù)深耕人工智能等前沿技術(shù)領(lǐng)域,長(zhǎng)期堅(jiān)持AI算力研發(fā)投入,自主研發(fā)的兆瀚CTS5301-L AI服務(wù)器作為一款專為 “AI+” 時(shí)代而生的算力新星,是音視頻行業(yè) “減負(fù)”與實(shí)現(xiàn)創(chuàng)意的最佳拍檔。
1
智能算力,多維賦能
兆瀚CTS5301-L AI服務(wù)器擁有卓越的AI性能和強(qiáng)大的異構(gòu)計(jì)算能力,全面支持昇騰Atlas 300I Duo等多款行業(yè)主流高性能加速卡,最大算力可達(dá)1.98PFlops@FP16,全面適用于大模型微調(diào)/推理、大模型訓(xùn)練、CV模型推理等多重場(chǎng)景,為支持多模態(tài)大模型、計(jì)算機(jī)視覺(jué)(CV)大模型推理等領(lǐng)域處理復(fù)雜音視頻制作任務(wù)提供強(qiáng)大的基礎(chǔ)設(shè)施支撐。
2
高效渲染,極致視效
兆瀚CTS5301-L AI服務(wù)器具備卓越的AI計(jì)算能力以及靈活的配置選項(xiàng),無(wú)論是文本生成圖像,數(shù)據(jù)傳輸還是復(fù)雜的圖形渲染、視頻解碼等需求,兆瀚CTS5301-L AI服務(wù)器皆能提供多樣化算力支撐,大幅縮短渲染時(shí)間、降低渲染成本,打造極致的視覺(jué)體驗(yàn)。此外兆瀚CTS5301-L AI服務(wù)器的整機(jī)功耗降低了30%,整機(jī)TCO提升了20%,大幅降低 AI 算力使用成本。
3
AIGC,創(chuàng)意無(wú)界
除了高質(zhì)量渲染與超強(qiáng)算力支撐,提升內(nèi)容制作的效率,兆瀚CTS5301-L AI服務(wù)器還支持多種行業(yè)主流的高性能加速卡,能夠適配多種AI模型和框架,包括但不限于盤(pán)古、GLM、GPT-3、STABLE Diffusion等,廣泛的兼容性能夠滿足不同的內(nèi)容生成類(lèi)場(chǎng)景對(duì)更強(qiáng)大計(jì)算資源的需求。
AI技術(shù)的進(jìn)步不斷拓展創(chuàng)意的疆界,無(wú)論是創(chuàng)造高品質(zhì)的視覺(jué)作品,還是實(shí)現(xiàn)精確的語(yǔ)音合成,兆瀚CTS5301-L AI服務(wù)器都是音視頻行業(yè)創(chuàng)意道路上的「硬」核后盾。
未來(lái),拓維信息將攜旗下“兆瀚”持續(xù)為醫(yī)療、金融、教育、娛樂(lè)等諸多領(lǐng)域的音視頻解決方案提供智能算力底座,助力各行業(yè)在數(shù)字化轉(zhuǎn)型的道路上實(shí)現(xiàn)更高效、更智能的音視頻內(nèi)容創(chuàng)作與傳播,攜手邁向一個(gè)創(chuàng)意無(wú)限、精彩紛呈的數(shù)字新紀(jì)元。
-
音視頻
+關(guān)注
關(guān)注
4文章
486瀏覽量
29992 -
算力
+關(guān)注
關(guān)注
1文章
1020瀏覽量
14965 -
AIGC
+關(guān)注
關(guān)注
1文章
367瀏覽量
1616
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論