當涉及到高質(zhì)量的合成語音開發(fā)和定制時,深度學習被證明是一個強大的工具。一家總部位于多倫多的初創(chuàng)公司, NVIDIA Inception 成員類似人工智能正在利用一種新的生成語音工具增加賭注,該工具能夠創(chuàng)建高質(zhì)量的合成人工智能語音。
這項技術(shù)可以在 50 多種最流行的語言中生成跨語言和自然說話的聲音,通過相似填充,用戶可以創(chuàng)建編程音頻,編輯和替換音頻片段中的單詞。
構(gòu)建、部署和擴展現(xiàn)實人工智能語音的能力將幫助眾多行業(yè)。應用范圍廣泛,從為廣告創(chuàng)建人工智能生成的文本,到交互式語音應答系統(tǒng),再到視頻游戲開發(fā)。
自 2020 年 7 月以來,相似人工智能團隊與 NVIDIA 的對話人工智能團隊密切合作,將 NVIDIA riva多模態(tài)對話人工智能 SDK 集成到他們的語音管道中。據(jù)人工智能創(chuàng)始人兼首席執(zhí)行官佐哈伊布·艾哈邁德( Zohaib Ahmed )稱,這種經(jīng)歷讓他們在整個人工智能對話管道中融入了獨特的 i NSight 。
“ NVIDIA Inception 計劃有助于為對話人工智能領(lǐng)域提供關(guān)鍵 i NSight 以及為我們作為產(chǎn)品的每項工作推薦 GPU 計算提供技術(shù)支持,” Ahmed 說。
為了訓練他們的語音模型和推理能力,該團隊正在使用 Amazon 彈性 Kubernetes 服務( Amazon EKS )和 NVIDIA T4 GPU s 集群。然后,他們使用 NVIDIA Triton 推理服務器在生產(chǎn)中大規(guī)模部署他們訓練有素的人工智能模型。
最近一個與 NVIDIA Omniverse Audio2Face集成的類似人工智能合成語音演示展示了組合技術(shù)如何從單一音頻源創(chuàng)建富有表情的面部動畫和聲音。
Ahmed 說:“ Audio2Face 是一個很好的例子,它是一個強大的工具,可以很容易地與生成性人工智能語音相結(jié)合,在幾秒鐘內(nèi)產(chǎn)生結(jié)果,否則需要幾天時間?!?。
公司 已經(jīng)發(fā)展到擁有超過 150000 個用戶,建立了超過 60000 個語音。迄今為止, 類似人工智能在電信、金融、通訊中心、教育、游戲、媒體和娛樂等行業(yè)擁有 240 多個付費客戶。
關(guān)于作者
Michelle Horton 是 NVIDIA 的高級開發(fā)人員通信經(jīng)理,擁有通信經(jīng)理和科學作家的背景。她在 NVIDIA 為開發(fā)者博客撰文,重點介紹了開發(fā)者使用 NVIDIA 技術(shù)的多種方式。
審核編輯:郭婷
-
NVIDIA
+關(guān)注
關(guān)注
14文章
5079瀏覽量
103822 -
人工智能
+關(guān)注
關(guān)注
1796文章
47770瀏覽量
240510
發(fā)布評論請先 登錄
相關(guān)推薦
嵌入式和人工智能究竟是什么關(guān)系?
LLM技術(shù)對人工智能發(fā)展的影響
未來智慧建筑:人工智能技術(shù)的無限可能
AI for Science:人工智能驅(qū)動科學創(chuàng)新》第4章-AI與生命科學讀后感
《AI for Science:人工智能驅(qū)動科學創(chuàng)新》第一章人工智能驅(qū)動的科學創(chuàng)新學習心得
risc-v在人工智能圖像處理應用前景分析
名單公布!【書籍評測活動NO.44】AI for Science:人工智能驅(qū)動科學創(chuàng)新
報名開啟!深圳(國際)通用人工智能大會將啟幕,國內(nèi)外大咖齊聚話AI
FPGA在人工智能中的應用有哪些?
Google開發(fā)專為視頻生成配樂的人工智能技術(shù)
研究人員利用人工智能提升超透鏡相機的圖像質(zhì)量
![研究人員利<b class='flag-5'>用人工智能</b>提升超透鏡相機的圖像<b class='flag-5'>質(zhì)量</b>](https://file1.elecfans.com//web2/M00/EC/96/wKgZomZnf4WANY8LAAOx39ohSPY736.jpg)
評論