新聞中心
News Center
11月26日消息,美國芯片制造商英偉達當?shù)貢r間周一展示了一種能生成音樂和音頻的人工智能新模型。這種人工智能模型主要面向音樂、電影和視頻游戲的制作人,可以修改聲音并產(chǎn)生新奇音效。
英偉達目前是全球最大的人工智能系統(tǒng)芯片和軟件供應商。公司表示,雖然這項名為“Fugatto”(Foundational Generative Audio Transformer Opus 1縮寫)的技術有發(fā)展?jié)摿?,但目前還沒有公開發(fā)布這項技術的計劃?!癋ugatto”與Runway等初創(chuàng)公司和Meta等大科技公司展示的技術類似,能夠根據(jù)文本提示內(nèi)容生成音頻或視頻。不過,英偉達的新模型有自己的獨到之處:其可以根據(jù)文本描述生成特定音效和音樂,比如讓小號發(fā)出像狗叫一樣的新奇聲音?!癋ugatto”與其他人工智能技術的不同之處在于,能夠消化和修改現(xiàn)有音頻。例如,它可以將鋼琴演奏的一段旋律轉(zhuǎn)換成人聲演唱,或者改變錄制音頻中的口音以及表達出來的情緒。
英偉達的新模型是用開源數(shù)據(jù)訓練的。公司表示,仍在討論是否以及如何公開發(fā)布這項技術。
生成式人工智能模型的開發(fā)者仍在探索如何防止用戶濫用技術,比如該怎么杜絕用戶生成虛假信息或創(chuàng)造出受版權保護的角色、造成侵犯版權的行為等等。同樣,OpenAI和Meta也沒有宣布他們計劃什么時候向公眾發(fā)布能生成音頻或視頻的模型。
13517270458