恭喜有米科技股份有限公司黃于晏獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網恭喜有米科技股份有限公司申請的專利文本的特征的確定方法及裝置獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN113868420B 。
龍圖騰網通過國家知識產權局官網在2025-05-30發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202111153504.3,技術領域涉及:G06F16/353;該發明授權文本的特征的確定方法及裝置是由黃于晏;陳瑩瑩;李展鏗設計研發完成,并于2021-09-29向國家知識產權局提交的專利申請。
本文本的特征的確定方法及裝置在說明書摘要公布了:本發明公開了一種文本的特征的確定方法及裝置,在確定出待識別行業的文本之后,通過先對待識別行業的文本執行標記操作,有利于提高執行文本的哈希值確定操作的準確性以及效率,再自動對確定出的文本的哈希值執行映射操作,且不依賴于固定的詞表,能夠在保證保留所需文本的詞語的情況下降低文本的詞語數據量,從而有利于提高快速確定出準確文本的特征向量,有利于提高識別出與文本匹配的行業類別的準確性及效率。
本發明授權文本的特征的確定方法及裝置在權利要求書中公布了:1.一種文本的特征的確定方法,其特征在于,所述方法包括:按照確定出的標記方式對待識別行業的文本執行標記操作,得到目標文本,所述目標文本為標記后的待識別行業的所述文本,待識別行業的所述文本包括中文文本或英文文本,所述中文文本和所述英文文本為從同一原始文本中提取出的文本;獲取所述目標文本的哈希值,并對所述目標文本的哈希值執行映射操作,得到所述目標文本的特征向量,所述目標文本的特征向量用于確定與待識別行業的所述文本匹配的行業類別;所述對所述目標文本的哈希值執行映射操作,得到所述目標文本的特征向量之后,所述方法還包括:在得到所述中文文本的特征向量和所述英文文本的特征向量之后,確定所述中文文本的特征向量的長度和所述英文文本的特征向量的長度;判斷所述中文文本的特征向量的長度和所述英文文本的特征向量的長度是否均小于對應的確定出的長度閾值,得到判斷結果;根據所述判斷結果匹配與所述判斷結果對應的行業識別模型,根據所述判斷結果對應的行業識別模型,分析待識別行業的所述文本,得到與待識別行業的所述文本匹配的行業類別;其中,所述根據所述判斷結果對應的行業識別模型,分析待識別行業的所述文本,得到與待識別行業的所述文本匹配的行業類別,包括:當所述判斷結果對應的行業識別模型為中文文本行業識別模型時,將所述中文文本的特征向量輸入所述中文文本行業識別模型進行分析,并獲取所述中文文本行業識別模型輸出的行業分析結果,作為與待識別行業的文本匹配的行業類別;當所述判斷結果對應的行業識別模型為英文文本行業識別模型時,將所述英文文本的特征向量輸入所述英文文本行業識別模型進行分析,并獲取所述英文文本行業識別模型輸出的行業分析結果,作為與待識別行業的文本匹配的行業類別;當所述判斷結果對應的行業識別模型為中文文本行業識別模型和英文文本行業識別模型時,若所述英文文本行業識別模型輸出的行業分析結果包括的行業標簽和所述中文文本行業識別模型輸出的行業分析結果包括的行業標簽相同,則確定兩者的行業標簽,作為與待識別行業的文本匹配的行業類別;若不相同,則確定所述中文文本行業識別模型輸出的行業分析結果對應的第一行業標簽分值和所述英文文本行業識別模型輸出的行業分析結果對應的第二行業標簽分值,從所述第一行業標簽分值和所述第二行業標簽分值中篩選分值高的行業標簽分值對應的行業標簽,作為與待識別行業的文本匹配的行業類別。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人有米科技股份有限公司,其通訊地址為:510006 廣東省廣州市番禺區小谷圍街青藍街26號1701;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。