恭喜深圳愛莫科技有限公司楊恒獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網恭喜深圳愛莫科技有限公司申請的專利一種通過文字驅動的AIGC視頻生成方法及裝置獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN119255064B 。
龍圖騰網通過國家知識產權局官網在2025-05-09發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202411770572.8,技術領域涉及:H04N21/854;該發明授權一種通過文字驅動的AIGC視頻生成方法及裝置是由楊恒;龍濤;李娟;吳永杰;韋健文設計研發完成,并于2024-12-04向國家知識產權局提交的專利申請。
本一種通過文字驅動的AIGC視頻生成方法及裝置在說明書摘要公布了:本發明涉及人工智能技術領域,尤其涉及一種通過文字驅動的AIGC視頻生成方法,該方法包括:獲取驅動文字和人物圖像;根據所述驅動文字,生成目標語音特征;根據所述人物圖像,得到所述人物圖像的圖像特征和臉部特征;將所述目標語音特征、所述圖像特征和所述臉部特征進行融合,得到多幀視頻圖像;根據多幀所述視頻圖像,生成所述人物圖像對應的說話視頻,其中,所述說話視頻為AIGC視頻,所述說話視頻的說話內容為所述驅動文字的內容。該方法以驅動文字作為輸入,使得數字人說話視頻的生成速度較快,還能通過文字挖掘出語義信息,使得數字人說話視頻生成效果優異,數字人物逼真,數字人表情自然,提高用戶使用體驗度。
本發明授權一種通過文字驅動的AIGC視頻生成方法及裝置在權利要求書中公布了:1.一種通過文字驅動的AIGC視頻生成方法,其特征在于,包括:獲取驅動文字和人物圖像;根據所述驅動文字,生成目標語音特征,包括:根據所述驅動文字,得到所述驅動文字對應的語音和文字特征;根據所述語音,得到語音特征,其中,所述語音特征為包含語義特征的特征向量,所述語音特征為音頻信號;根據所述語音特征和所述文字特征,得到所述目標語音特征;所述根據所述語音特征和所述文字特征,得到所述目標語音特征,包括:通過LSTM網絡,從所述語音特征中提取出音頻特征,以及通過文本提取器,從所述文字特征中提取出文本特征,其中,所述音頻特征包括時序特征,以及所述語音的韻律、節奏和情感信息;將所述音頻特征和所述文本特征進行拼接,得到聯合特征;通過方差適配器,對所述聯合特征進行調整,得到調整后的聯合特征;通過編碼器,對所述調整后的聯合特征進行編碼,得到編碼后的聯合特征,并將所述編碼后的聯合特征與所述語音特征進行殘差連接,得到所述目標語音特征;根據所述人物圖像,得到所述人物圖像的圖像特征和臉部特征;將所述目標語音特征、所述圖像特征和所述臉部特征進行融合,得到多幀視頻圖像;根據多幀所述視頻圖像,生成所述人物圖像對應的說話視頻,其中,所述說話視頻為AIGC視頻,所述說話視頻的說話內容為所述驅動文字的內容。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人深圳愛莫科技有限公司,其通訊地址為:518055 廣東省深圳市南山區西麗街道西麗社區打石一路深圳國際創新谷2棟A座2304;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。