恭喜四川譯訊信息科技有限公司馬萬炯獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網恭喜四川譯訊信息科技有限公司申請的專利一種低延遲的實時語音轉錄方法及其系統獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN119811372B 。
龍圖騰網通過國家知識產權局官網在2025-05-16發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202510295239.4,技術領域涉及:G10L15/05;該發明授權一種低延遲的實時語音轉錄方法及其系統是由馬萬炯;薛志毅;蔣巧蘭;張藝設計研發完成,并于2025-03-13向國家知識產權局提交的專利申請。
本一種低延遲的實時語音轉錄方法及其系統在說明書摘要公布了:本發明提供了一種低延遲的實時語音轉錄方法及其系統,包括以下步驟:A、將客戶端采集到的原始音頻數據進行編碼壓縮,再將得到的音頻編碼數據通過實時傳輸協議傳輸到服務器,引入錯誤校正和丟包重傳機制,增加傳輸的可靠性;B、服務器端語音活動檢測算法檢測音頻數據中的語音,將判斷為語音的音頻數據分割成多個獨立的部分,并為每個部分添加時間順序標識;C、對分割后的音頻數據按時間順序進行實時轉錄,生成對應的文字內容。
本發明授權一種低延遲的實時語音轉錄方法及其系統在權利要求書中公布了:1.一種低延遲的實時語音轉錄方法,其特征在于,包括以下步驟:A、將客戶端采集到的原始音頻數據進行編碼壓縮,再將得到的音頻編碼數據通過實時傳輸協議傳輸到服務器,引入錯誤校正和丟包重傳機制,增加傳輸的可靠性;B、服務器端利用語音活動檢測算法檢測音頻數據中的語音,將判斷為語音的音頻數據分割成多個獨立的部分,并為每個部分添加時間戳;C、對分割后的音頻數據按時間順序進行實時轉錄,生成對應的文字內容;所述的A步驟包括:A1、創建一個數組A用于存儲待語音活動檢測的音頻;A2、每次從采集到的音頻中取256ms-512ms的音頻數據追加到數組A中,當前累計的音頻段時長L達到單次追加音頻時長的4倍以上,則進行語音活動檢測,為每個語音片段添加時間戳,所述音頻由若干個包含語音的語音片段和不包含語音的靜音片段組成,兩個相鄰語音片段之間的片段為靜音片段;A3、所述音頻段時長L與最后一個語音片段的結束時間的差為diff,如果diff1s,則將最后一個語音片段之前的音頻數據上傳給服務器端,并將數組A中已上傳的音頻數據刪除;如果diff=1s,則將所述音頻段數據全部上傳給服務器端,并清空數組A;所述靜音片段的Opus編碼傳輸比特率小于語音片段;A4、如果客戶端未結束采集工作,繼續從A2步驟開始循環執行。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人四川譯訊信息科技有限公司,其通訊地址為:610000 四川省成都市自由貿易試驗區高新區天府五街200號2棟A區10樓1011-2室;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。