恭喜浙江大學(xué)金華研究院鄭雨婷獲國(guó)家專利權(quán)
買專利賣專利找龍圖騰,真高效! 查專利查商標(biāo)用IPTOP,全免費(fèi)!專利年費(fèi)監(jiān)控用IP管家,真方便!
龍圖騰網(wǎng)恭喜浙江大學(xué)金華研究院申請(qǐng)的專利基于音頻驅(qū)動(dòng)的人臉對(duì)話生成模型的人臉視頻生成方法獲國(guó)家發(fā)明授權(quán)專利權(quán),本發(fā)明授權(quán)專利權(quán)由國(guó)家知識(shí)產(chǎn)權(quán)局授予,授權(quán)公告號(hào)為:CN119028369B 。
龍圖騰網(wǎng)通過(guò)國(guó)家知識(shí)產(chǎn)權(quán)局官網(wǎng)在2025-06-17發(fā)布的發(fā)明授權(quán)授權(quán)公告中獲悉:該發(fā)明授權(quán)的專利申請(qǐng)?zhí)?專利號(hào)為:202411029024.X,技術(shù)領(lǐng)域涉及:G10L21/10;該發(fā)明授權(quán)基于音頻驅(qū)動(dòng)的人臉對(duì)話生成模型的人臉視頻生成方法是由鄭雨婷;徐新民;胡哲昊;張琪;鄭樂(lè);陳甜甜設(shè)計(jì)研發(fā)完成,并于2024-07-30向國(guó)家知識(shí)產(chǎn)權(quán)局提交的專利申請(qǐng)。
本基于音頻驅(qū)動(dòng)的人臉對(duì)話生成模型的人臉視頻生成方法在說(shuō)明書(shū)摘要公布了:本發(fā)明公開(kāi)了一種基于音頻驅(qū)動(dòng)的人臉對(duì)話生成模型的人臉視頻生成方法。方法包括:建立唇音同步判別網(wǎng)絡(luò)和基于質(zhì)量注意力的音頻驅(qū)動(dòng)唇形網(wǎng)絡(luò);使用唇音同步訓(xùn)練集對(duì)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,根據(jù)唇音同步判別網(wǎng)絡(luò)的判別損失函數(shù)構(gòu)建基于質(zhì)量注意力的音頻驅(qū)動(dòng)唇形網(wǎng)絡(luò)的整體損失函數(shù),直至整體損失函數(shù)收斂完成訓(xùn)練;根據(jù)待回復(fù)文字或音頻獲得回復(fù)音頻;將回復(fù)音頻以及待生成人物的人臉圖像輸入訓(xùn)練完成的網(wǎng)絡(luò)中,輸出當(dāng)前人物在讀取當(dāng)前回復(fù)音頻時(shí)的人臉視頻,最終在顯示器上顯示。本發(fā)明方法有效改善了唇形生成的同步效果和整體人臉的圖像質(zhì)量,并能夠與客戶進(jìn)行對(duì)話,旨在生成具有自然頭部運(yùn)動(dòng)、唇音同步效果良好的真實(shí)人臉視頻。
本發(fā)明授權(quán)基于音頻驅(qū)動(dòng)的人臉對(duì)話生成模型的人臉視頻生成方法在權(quán)利要求書(shū)中公布了:1.一種基于音頻驅(qū)動(dòng)的人臉對(duì)話生成模型的人臉視頻生成方法,其特征在于,包括: S1建立唇音同步判別網(wǎng)絡(luò)和基于質(zhì)量注意力的音頻驅(qū)動(dòng)唇形網(wǎng)絡(luò)QAW; S2采集若干人物在說(shuō)話時(shí)的視頻并將每個(gè)視頻劃分為人物音頻以及連續(xù)幀的人臉圖像,將各組人物音頻以及連續(xù)幀的人臉圖像共同構(gòu)建為唇音同步訓(xùn)練集; S3將唇音同步訓(xùn)練集輸入唇音同步判別網(wǎng)絡(luò)中進(jìn)行訓(xùn)練,直至唇音同步判別網(wǎng)絡(luò)的判別損失函數(shù)收斂,獲得訓(xùn)練完成的唇音同步判別網(wǎng)絡(luò); S4將唇音同步訓(xùn)練集輸入基于質(zhì)量注意力的音頻驅(qū)動(dòng)唇形網(wǎng)絡(luò)QAW中進(jìn)行訓(xùn)練,基于判別損失函數(shù)構(gòu)建基于質(zhì)量注意力的音頻驅(qū)動(dòng)唇形網(wǎng)絡(luò)QAW的整體損失函數(shù),獲得基于質(zhì)量注意力的音頻驅(qū)動(dòng)唇形網(wǎng)絡(luò)QAW的整體損失值并使用梯度下降法更新網(wǎng)絡(luò)參數(shù),直至整體損失函數(shù)的損失值收斂,獲得訓(xùn)練完成的基于質(zhì)量注意力的音頻驅(qū)動(dòng)唇形網(wǎng)絡(luò)QAW; S5將待回復(fù)文字或音頻輸入對(duì)話系統(tǒng)中,針對(duì)每段待回復(fù)文字或音頻,對(duì)話系統(tǒng)處理后輸出待回復(fù)文字或音頻的回復(fù)文字,并將回復(fù)文字轉(zhuǎn)換為回復(fù)音頻;將回復(fù)音頻以及待生成人物的人臉圖像輸入訓(xùn)練完成的基于質(zhì)量注意力的音頻驅(qū)動(dòng)唇形網(wǎng)絡(luò)QAW中,訓(xùn)練完成的基于質(zhì)量注意力的音頻驅(qū)動(dòng)唇形網(wǎng)絡(luò)QAW處理后輸出當(dāng)前人物在讀取當(dāng)前回復(fù)音頻時(shí)的人臉視頻,最終在顯示器上顯示,實(shí)現(xiàn)人臉視頻的生成; 所述的步驟S1中,基于質(zhì)量注意力的音頻驅(qū)動(dòng)唇形網(wǎng)絡(luò)QAW包括依次連接的人臉生成器和視頻質(zhì)量判別器,將唇音同步訓(xùn)練集輸入人臉生成器中,人臉生成器處理后輸出生成的人臉視頻,將生成的人臉視頻以及真實(shí)的人臉視頻共同輸入視頻質(zhì)量判別器中,獲得視頻質(zhì)量判別器的對(duì)抗損失函數(shù)和質(zhì)量評(píng)估損失函數(shù),當(dāng)視頻質(zhì)量判別器的對(duì)抗損失函數(shù)收斂時(shí),視頻質(zhì)量判別器訓(xùn)練完成;根據(jù)生成的人臉視頻以及真實(shí)的人臉視頻獲得重構(gòu)損失函數(shù),最終根據(jù)唇音同步判別網(wǎng)絡(luò)的判別損失函數(shù)、視頻質(zhì)量判別器的質(zhì)量評(píng)估損失、人臉對(duì)話生成模型的FSIM損失函數(shù)以及重構(gòu)損失函數(shù)構(gòu)建基于質(zhì)量注意力的音頻驅(qū)動(dòng)唇形網(wǎng)絡(luò)QAW的整體損失函數(shù); 人臉生成器包括音頻編碼器、人臉編碼器和人臉解碼器,人臉編碼器中包含九個(gè)空間注意力機(jī)制SA和三個(gè)位置注意力機(jī)制CA。
如需購(gòu)買、轉(zhuǎn)讓、實(shí)施、許可或投資類似專利技術(shù),可聯(lián)系本專利的申請(qǐng)人或?qū)@麢?quán)人浙江大學(xué)金華研究院,其通訊地址為:321000 浙江省金華市金義新區(qū)金華科技城浙大網(wǎng)新孵化園A1-b二層;或者聯(lián)系龍圖騰網(wǎng)官方客服,聯(lián)系龍圖騰網(wǎng)可撥打電話0551-65771310或微信搜索“龍圖騰網(wǎng)”。
1、本報(bào)告根據(jù)公開(kāi)、合法渠道獲得相關(guān)數(shù)據(jù)和信息,力求客觀、公正,但并不保證數(shù)據(jù)的最終完整性和準(zhǔn)確性。
2、報(bào)告中的分析和結(jié)論僅反映本公司于發(fā)布本報(bào)告當(dāng)日的職業(yè)理解,僅供參考使用,不能作為本公司承擔(dān)任何法律責(zé)任的依據(jù)或者憑證。
- 恭喜株式會(huì)社NTT都科摩松村祐輝獲國(guó)家專利權(quán)
- 恭喜歐若拉運(yùn)營(yíng)公司斯蒂芬·C·克勞奇獲國(guó)家專利權(quán)
- 恭喜華為技術(shù)有限公司袁璞獲國(guó)家專利權(quán)
- 恭喜天津艾康尼克新能源汽車有限公司許增獲國(guó)家專利權(quán)
- 恭喜加利福尼亞大學(xué)董事會(huì)才華獲國(guó)家專利權(quán)
- 恭喜半導(dǎo)體組件工業(yè)公司J·P·甘比諾獲國(guó)家專利權(quán)
- 恭喜杰尼索尼克斯公司克里斯多佛·邁克爾·歐文斯獲國(guó)家專利權(quán)
- 恭喜京東數(shù)字科技控股有限公司李偉獲國(guó)家專利權(quán)
- 恭喜華為技術(shù)有限公司淦明獲國(guó)家專利權(quán)
- 恭喜寧波韌和科技有限公司周酉林獲國(guó)家專利權(quán)


熱門推薦
- 恭喜浙江加力倉(cāng)儲(chǔ)設(shè)備股份有限公司戴肖肖獲國(guó)家專利權(quán)
- 恭喜大唐移動(dòng)通信設(shè)備有限公司李姣楓獲國(guó)家專利權(quán)
- 恭喜福建建利達(dá)工程技術(shù)有限公司郭阿明獲國(guó)家專利權(quán)
- 恭喜斯諾雷托克斯私人有限公司T·麥克林獲國(guó)家專利權(quán)
- 恭喜高通股份有限公司G.切里安獲國(guó)家專利權(quán)
- 恭喜南京熊貓電子股份有限公司于海獲國(guó)家專利權(quán)
- 恭喜沈邕獲國(guó)家專利權(quán)
- 恭喜中國(guó)鐵建高新裝備股份有限公司劉飛香獲國(guó)家專利權(quán)
- 恭喜浙江三花智能控制股份有限公司H-D·艾希霍爾茨獲國(guó)家專利權(quán)
- 恭喜精密種植有限責(zé)任公司T·斯旺森獲國(guó)家專利權(quán)