恭喜騰訊科技(深圳)有限公司馮鑫獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網恭喜騰訊科技(深圳)有限公司申請的專利一種多媒體數據處理方法、裝置以及可讀存儲介質獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN114329041B 。
龍圖騰網通過國家知識產權局官網在2025-06-10發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202111361702.9,技術領域涉及:G06F16/65;該發明授權一種多媒體數據處理方法、裝置以及可讀存儲介質是由馮鑫設計研發完成,并于2021-11-17向國家知識產權局提交的專利申請。
本一種多媒體數據處理方法、裝置以及可讀存儲介質在說明書摘要公布了:本申請公開了一種多媒體數據處理方法、裝置以及可讀存儲介質,該方法包括:在獲取到多媒體文件中的原始音頻數據時,獲取原始音頻數據相關聯的目標音頻識別模型;將原始音頻數據輸入至目標聲樂分離模型,由目標聲樂分離模型對原始音頻數據進行聲樂分離,得到與第一對象相關聯的第一類音軌以及與第二對象相關聯的第二類音軌;從第一類音軌中獲取第一對象的語音數據,將第一對象的語音數據輸入至目標語音識別模型,由目標語音識別模型對第一對象的語音數據進行文本識別,得到第一對象的文本識別結果;基于文本識別結果確定原始音頻數據的音頻類型,對第二類音軌中與第二對象相關聯的音頻數據進行存儲。采用本申請,可以提升音頻數據識別的準確性。
本發明授權一種多媒體數據處理方法、裝置以及可讀存儲介質在權利要求書中公布了:1.一種多媒體數據處理方法,其特征在于,包括:在獲取到多媒體文件中的原始音頻數據時,獲取用于對所述原始音頻數據進行音頻處理的目標音頻識別模型;所述目標音頻識別模型包括目標聲樂分離模型和目標語音識別模型;將所述原始音頻數據輸入至所述目標聲樂分離模型,由所述目標聲樂分離模型對所述原始音頻數據進行聲樂分離,得到與所述原始音頻數據中的第一對象相關聯的第一類音軌以及與所述原始音頻數據中的第二對象相關聯的第二類音軌;從所述第一類音軌中獲取所述第一對象的語音數據,將所述第一對象的語音數據輸入至所述目標語音識別模型,由所述目標語音識別模型對所述第一對象的語音數據進行文本識別,得到所述第一對象的文本識別結果;基于所述文本識別結果確定所述原始音頻數據的音頻類型,對所述第二類音軌中與所述第二對象相關聯的音頻數據進行存儲;其中,若所述多媒體文件為視頻類文件,則所述第一類音軌包含與所述視頻類文件中的角色對象相關聯的對象語音數據,所述第二類音軌包含與所述視頻類文件中的背景對象相關聯的音頻數據;所述背景對象包含第三配樂對象和伴奏對象;所述第三配樂對象是指所述視頻類文件中進行歌詞歌唱的演唱者,所述伴奏對象是指所述視頻類文件中產生伴奏的對象,且所述伴奏對象所產生的伴奏是指所述原始音頻數據中除人聲之外的其他音頻數據;所述方法還包括:將所述第二類音軌中與所述背景對象相關聯的音頻數據輸入至所述目標聲樂分離模型,通過所述目標聲樂分離模型對所述背景對象相關聯的音頻數據進行聲樂分離,得到與所述第三配樂對象相關聯的第三配樂語音數據以及與所述伴奏對象相關聯的伴奏音頻數據;將分離出的所述第三配樂語音數據添加至包含所述對象語音數據的所述第一類音軌,得到第一類更新音軌,且將分離出的所述伴奏音頻數據作為第二類更新音軌。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人騰訊科技(深圳)有限公司,其通訊地址為:518057 廣東省深圳市南山區高新區科技中一路騰訊大廈35層;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。