恭喜北京市燃氣集團有限責任公司王鐵強獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網恭喜北京市燃氣集團有限責任公司申請的專利一種抽取式摘要自動生成方法及裝置獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN117216244B 。
龍圖騰網通過國家知識產權局官網在2025-04-01發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202311296990.3,技術領域涉及:G06F16/34;該發明授權一種抽取式摘要自動生成方法及裝置是由王鐵強;王勛;劉宗奇;楊琳琳;王倩微;蔡昊;王馨培設計研發完成,并于2023-10-09向國家知識產權局提交的專利申請。
本一種抽取式摘要自動生成方法及裝置在說明書摘要公布了:本發明提供一種抽取式摘要自動生成方法及裝置。所述方法包括:獲取當前時刻i加入的由mi個文檔組成的文檔集合Di,得到文檔集合流DLi;將Di的每個文檔的每個句子表示成維度相等的向量,并通過對句子向量加權求和得到Di的每個文檔的向量表示,進而得到Di和DLi的向量表示;基于所述向量表示對Di的每個句子的重要性打分,并基于所述打分對上一時刻的文檔集合流DLi?1的摘要進行更新,生成DLi的摘要。本發明在新增文檔時,可以僅通過處理新增文檔實現摘要自動更新;本發明通過將每個文檔、每個文檔集合和文檔集合流表示成一個相同維度的向量,可以消除因文檔容量不同對摘要生成造成的不良影響。
本發明授權一種抽取式摘要自動生成方法及裝置在權利要求書中公布了:1.一種抽取式摘要自動生成方法,其特征在于,包括以下步驟:獲取當前時刻i加入的由mi個文檔組成的文檔集合Di,得到文檔集合流DLi={Dr},r=1,2,…,i;將Di的每個文檔的每個句子表示成維度相等的向量,并通過對句子向量加權求和得到Di的每個文檔的向量表示,進而得到Di和DLi的向量表示;基于Di的向量表示對Di的每個句子的重要性打分,并基于所述打分對上一時刻的文檔集合流DLi-1的摘要進行更新,生成DLi的摘要;采用開源的句向量工具模型CoSENT,將Di的第j個文檔表示為句向量集合所述句向量均為768維的列向量;其中,j=1,2,…,mi,k=1,2,…,mij,為中第k個句子的向量表示,mij為中句子的數量;Di中的第j個文檔的向量表示為: 式中,為基于已知量和可學習參數計算得到的標量,wα、bα為可學習參數,其中,wα為768維的行向量,bα為標量;Di的向量表示方法包括:對Di中的每個文檔的每個句子進行分詞處理得到為第q個詞,q=1,2,…,Q,Q為詞的總數;計算每個詞的得分: 式中,為的得分,為在Di中的出現次數,NWDi為Di中的全部詞出現的次數之和,為Di中含有的文檔數量;Di的向量表示為: 式中,Vi為Di的向量表示;DLi的向量表示為: 或: 式中,Ei為當前時刻i文檔集合流DLi={Dr}的向量表示,其中,r=1,2,…,i,i≥2;對Di的每個句子的重要性打分的方法包括:按下式計算Di的第j個文檔的第k個句子的得分: 式中,和分別為文檔級重要性得分、句子級重要性得分和詞級重要性得分,計算公式如下: 式中,“●”表示計算向量點積,“||”表示向量求模。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人北京市燃氣集團有限責任公司,其通訊地址為:100035 北京市西城區西直門南小街22號;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。