恭喜中船凌久高科(武漢)有限公司;中國船舶集團有限公司第七〇九研究所楊志祥獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網恭喜中船凌久高科(武漢)有限公司;中國船舶集團有限公司第七〇九研究所申請的專利一種命名實體識別方法獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN119692352B 。
龍圖騰網通過國家知識產權局官網在2025-05-09發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202510211434.4,技術領域涉及:G06F40/295;該發明授權一種命名實體識別方法是由楊志祥;熊筠軻;劉育含;楊小濤;程佳斌;余將其;周子涵;汪家漩設計研發完成,并于2025-02-25向國家知識產權局提交的專利申請。
本一種命名實體識別方法在說明書摘要公布了:本發明適用于自然語言處理中命名實體識別領域,提供一種命名實體識別方法,根據掩蓋策略對文本數據進行掩蓋,得到多個掩蓋片段序列,生成合成跨度詞列表;基于合成跨度詞中每一個字符的字符特征和字符位置特征,提取每一個合成跨度詞的向量特征;根據所有合成跨度詞的向量特征,并基于掩碼語言任務和跨度邊界任務對命名實體識別模型進行訓練;基于訓練后的命名實體識別模型識別待識別文本數據中的命名實體。針對現有的掩碼語言模型訓練以中文字符粒度進行預測,預測訓練缺乏詞語級粒度,本發明引入跨度內合成詞的生成提取、位置標記方法和長度信息嵌入,實現中文詞粒度級別預測,提取跨度詞,獲得命名實體識別的長詞結果,適用于長詞識別。
本發明授權一種命名實體識別方法在權利要求書中公布了:1.一種命名實體識別方法,其特征在于,包括:步驟S1,對訓練數據集中的每一個文本數據進行字符切分,提取每一個字符的字符特征和字符位置特征;步驟S2,根據掩蓋策略對文本數據進行掩蓋,得到多個掩蓋片段序列,生成每一個掩蓋片段序列內部的合成跨度詞,構成每一個文本數據對應的合成跨度詞列表;步驟S3,基于合成跨度詞中每一個字符的字符特征和字符位置特征,提取所述合成跨度詞列表中每一個合成跨度詞的向量特征;步驟S4,根據所有合成跨度詞的向量特征,基于掩碼語言任務和跨度邊界任務對命名實體識別模型進行訓練;步驟S5,基于訓練后的命名實體識別模型對待識別文本數據中的命名實體進行識別。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人中船凌久高科(武漢)有限公司;中國船舶集團有限公司第七〇九研究所,其通訊地址為:430074 湖北省武漢市洪山區關山街珞瑜路718號;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。