恭喜上海喜馬拉雅科技有限公司羅歡獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網恭喜上海喜馬拉雅科技有限公司申請的專利文本向量生成方法及相關裝置獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN114611511B 。
龍圖騰網通過國家知識產權局官網在2025-05-30發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202210290851.9,技術領域涉及:G06F40/284;該發明授權文本向量生成方法及相關裝置是由羅歡;張炫;姚曉遠;未波波設計研發完成,并于2022-03-23向國家知識產權局提交的專利申請。
本文本向量生成方法及相關裝置在說明書摘要公布了:本申請提供的文本向量生成方法、模型訓練方法及相關裝置中,對于獲得的文本序列,文本處理設備將該文本序列的先驗向量以及該文本序列的字向量、位置向量、段向量一起輸入到文本向量模型的Bert層,使得該文本向量模型將文本序列的先驗向量作為參考,從中獲得文本序列中可能的詞匯知識,用于將文本序列轉換為文本向量。由于該先驗向量攜帶有文本序列中詞匯的先驗信息,從而實現在不依賴于詞典進行分詞的情況下,通過該先驗信息輔助文本向量模型對文本序列進行轉換,獲得文本序列更為準確的文本向量。
本發明授權文本向量生成方法及相關裝置在權利要求書中公布了:1.一種文本向量生成方法,其特征在于,應用于文本處理設備,所述文本處理設備配置有文本向量模型,所述文本向量模型包括Bert層,所述方法包括:獲取文本序列;根據所述文本序列,構建待初始化的多個方陣,其中,每個所述方陣的行與列分別與所述文本序列一一對應;從所述文本序列中為所述多個方陣分別選取互不相同的文本作為所述方陣的起始文本,其中,每個所述方陣的起始文本與所述方陣每一行對應的文本構成多個文本對;針對每個所述方陣,分別根據所述方陣每一行的文本對從所述文本序列中截取的文本片段,對所述方陣的每一行進行初始化,其中,若每一行的文本對從所述文本序列中截取的文本片段能夠組成詞匯,則將該行中與所述文本片段對應的位置初始化為第一預設數值,將該行中未與所述文本片段對應的位置初始化為第二預設數值;將所有初始化后的方陣作為所述文本序列的詞矩陣;將所述詞矩陣轉換為先驗向量,其中,所述先驗向量與所述文本序列的字向量、位置向量以及段向量具有相同的向量維度;根據所述Bert層對輸入向量的約定,生成所述文本序列的字向量、位置向量以及段向量;將所述文本序列的字向量、位置向量、段向量以及所述先驗向量輸入到所述Bert層,獲得所述文本序列的文本向量。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人上海喜馬拉雅科技有限公司,其通訊地址為:201100 上海市閔行區紫星路588號2幢2062室;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。