盧松松的個(gè)人空間 http://sysyfmy.com/?756899 [收藏] [復(fù)制] [RSS]

日志

一段音頻驅(qū)動(dòng)照片唱歌，EMO模型上線(xiàn)通義APP

已有 80908 次閱讀2024-4-25 20:20 |系統(tǒng)分類(lèi):營(yíng)銷(xiāo)實(shí)戰(zhàn)

把一段音頻,、一張照片輸入AI模型,，就能讓圖中人物開(kāi)口唱歌說(shuō)話(huà),，讓奧黛麗赫本唱《上春山》、陶俑仕女說(shuō)英文RAP,、愛(ài)因斯坦說(shuō)中文段子,。不久前，這款名為EMO的模型因?yàn)榘⒗锿x實(shí)驗(yàn)室的一篇論文火遍海內(nèi)外,，模型的產(chǎn)品化進(jìn)程也廣受關(guān)注,。4月25日，EMO終于上線(xiàn)通義APP,，開(kāi)放給所有用戶(hù)免費(fèi)使用,。

打開(kāi)通義APP，進(jìn)入“全民舞臺(tái)”頻道,，就可來(lái)到EMO產(chǎn)品頁(yè)面“全民唱演”,。在歌曲、熱梗,、表情包中任選一款模板,，上傳肖像照片，EMO隨即就能合成視頻,。

通義APP首批上線(xiàn)了80多個(gè)EMO模板,，包括熱門(mén)歌曲《上春山》《野狼disco》等，網(wǎng)絡(luò)熱�,！袄徖忞u”“回手掏”等,。目前通義APP暫不開(kāi)放用戶(hù)自定義音頻，用戶(hù)只能選擇APP預(yù)置的音頻來(lái)生成視頻,。

EMO是通義實(shí)驗(yàn)室研發(fā)的AI模型,，其背后的肖像說(shuō)話(huà)（Talking Head）技術(shù)是當(dāng)前大熱的AIGC領(lǐng)域。EMO之前的Talking Head技術(shù)都需針對(duì)人臉,、人頭或者身體部分做3D建模,，通義實(shí)驗(yàn)室在業(yè)界率先提出了弱控制設(shè)計(jì)，無(wú)需建模就可驅(qū)動(dòng)肖像開(kāi)口說(shuō)話(huà),，不僅降低視頻生成成本,，還大幅提升了視頻生成質(zhì)量。EMO學(xué)習(xí)并編碼了人類(lèi)表達(dá)情緒的能力,，能將音頻內(nèi)容和人物的表情,、嘴型匹配，還能把音頻的語(yǔ)氣特征和情緒色彩反映到人物微表情上,。

2月底,，通義實(shí)驗(yàn)室公布相關(guān)論文，EMO隨之成為繼SORA之后最受關(guān)注的AI模型之一�,，F(xiàn)在,，通義APP讓所有人都可免費(fèi)體驗(yàn)前沿模型的創(chuàng)造力,。未來(lái)，EMO技術(shù)有望應(yīng)用于數(shù)字人,、數(shù)字教育,、影視制作、虛擬陪伴,、電商直播等場(chǎng)景,。

通義APP近期爆款頻出，現(xiàn)象級(jí)應(yīng)用“全民舞王”曾在社交平臺(tái)掀起“兵馬俑跳科目三”“金毛跳舞”的熱潮,，全民舞王背后的模型Animate Anyone也出自通義實(shí)驗(yàn)室,。近期，通義APP還陸續(xù)推出了超長(zhǎng)文檔解析,、AI編碼助手,、AI會(huì)議助手等免費(fèi)實(shí)用功能。通義大模型正在成為越來(lái)越多用戶(hù)的超級(jí)AI助手,。