恭喜浙江大學紀守領獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網恭喜浙江大學申請的專利一種基于問答模型的第三方組件文檔細粒度自動化提取方法及系統獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN114841124B 。
龍圖騰網通過國家知識產權局官網在2025-05-30發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202210331439.7,技術領域涉及:G06F40/14;該發明授權一種基于問答模型的第三方組件文檔細粒度自動化提取方法及系統是由紀守領;趙彬彬;王琴應;張旭鴻;鄧水光;王文海;祝羽艷;楊星設計研發完成,并于2022-03-30向國家知識產權局提交的專利申請。
本一種基于問答模型的第三方組件文檔細粒度自動化提取方法及系統在說明書摘要公布了:本發明公開了一種基于問答模型的第三方組件文檔細粒度自動化提取方法及系統,屬于第三方組件測試技術領域。系統包括:第三方組件文檔預處理模塊,對第三方組件文檔進行初步過濾,獲取粗粒度的第三方組件使用規則;文檔問答樹構建模塊,深度分析第三方組件誤用類型,為每一類誤用類型設計查詢問題,根據問題對待測文檔進行人工標記;基于問答的第三方組件使用規則提取模塊,采用基于RoBERTa模型的自然語言處理模型對文檔進行問答式信息提取,獲得與第三方組件相關的細粒度使用規則。本發明的系統解決了無統一格式的第三方組件文檔粗粒度提煉問題,能夠對第三方組件文檔中的使用規則進行細粒度自動化提取。
本發明授權一種基于問答模型的第三方組件文檔細粒度自動化提取方法及系統在權利要求書中公布了:1.一種基于問答模型的第三方組件文檔細粒度自動化提取方法,其特征在于,包括如下步驟:步驟1:收集多個不同第三方組件的文檔,對文檔進行預處理,構建文檔倉庫;使用注意力模型對文檔倉庫中的待測試文檔進行語句精煉,獲取第三方組件的粗粒度使用規則;步驟2:根據第三方組件的誤用種類,設計問答模型的相應問題;從文檔倉庫中的待測試文檔中挑選部分文檔,根據設計的問題標記出答案;所述的第三方組件的誤用種類包括過時函數誤用、返回值誤用、調用順序誤用和參數誤用;所述的問答模型的相應問題包括:a.函數是否過時;b.函數是否有返回值;c.函數哪些情況有返回值;d.函數的返回值在上述情況下分別是什么;e.是否有其他函數需要提前調用;f.是否有其他函數需要被之后調用;g.參數類型是什么;每個問題設有可選答案;步驟3:將標記好的待測試文檔分為訓練集和驗證集,利用訓練集對自然語言處理模型進行訓練,直至驗證集的測試準確率滿足預設要求;利用訓練好的自然語言處理模型對文檔倉庫中的剩余未標記答案文檔的粗粒度使用規則進行細粒度挖掘。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人浙江大學,其通訊地址為:310058 浙江省杭州市西湖區余杭塘路866號;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。