恭喜數(shù)力聚(北京)科技有限公司李樂平獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監(jiān)控用IP管家,真方便!
龍圖騰網(wǎng)恭喜數(shù)力聚(北京)科技有限公司申請的專利基于語言大模型的輔助報告快速生成方法及系統(tǒng)獲國家發(fā)明授權專利權,本發(fā)明授權專利權由國家知識產(chǎn)權局授予,授權公告號為:CN119443062B 。
龍圖騰網(wǎng)通過國家知識產(chǎn)權局官網(wǎng)在2025-05-09發(fā)布的發(fā)明授權授權公告中獲悉:該發(fā)明授權的專利申請?zhí)?專利號為:202510038405.2,技術領域涉及:G06F40/166;該發(fā)明授權基于語言大模型的輔助報告快速生成方法及系統(tǒng)是由李樂平;葉澤陽設計研發(fā)完成,并于2025-01-10向國家知識產(chǎn)權局提交的專利申請。
本基于語言大模型的輔助報告快速生成方法及系統(tǒng)在說明書摘要公布了:本發(fā)明公開了基于語言大模型的輔助報告快速生成方法及系統(tǒng),方法包括:數(shù)據(jù)采集、數(shù)據(jù)預處理、知識提取、信息壓縮和報告優(yōu)化。本發(fā)明屬于語言大模型技術領域,具體是指基于語言大模型的輔助報告快速生成方法及系統(tǒng),本方案采用知識提取,計算目標域中個體的質(zhì)心,然后計算源域中每個個體到目標域質(zhì)心的歐幾里得距離,衡量個體與質(zhì)心的差異程度,根據(jù)相似性,進行知識轉(zhuǎn)移;采用信息壓縮,利用卷積和下采樣降低數(shù)據(jù)維度,并將輸出作為LSTM層輸入提取長期依賴關系和處理重建數(shù)據(jù),解碼過程利用反卷積和上采樣生成近似原始輸入的輸出,訓練自動編碼器最小化輸入數(shù)據(jù)和重建數(shù)據(jù)之間的差異。
本發(fā)明授權基于語言大模型的輔助報告快速生成方法及系統(tǒng)在權利要求書中公布了:1.基于語言大模型的輔助報告快速生成方法,其特征在于:該方法包括以下步驟:步驟S1:數(shù)據(jù)采集,收集與報告主題相關的大量文本數(shù)據(jù);步驟S2:數(shù)據(jù)預處理,對收集到的文本數(shù)據(jù)進行清洗、分詞操作,得到預處理后的文本數(shù)據(jù);步驟S3:知識提取,基于預處理后的文本數(shù)據(jù)計算目標域中個體的質(zhì)心,然后計算源域中每個個體到目標域質(zhì)心的歐幾里得距離,衡量個體與質(zhì)心的差異程度,從源域中提取個體進行知識轉(zhuǎn)移,計算與質(zhì)心距離最接近的源域,進行更具有針對性的知識提取;步驟S4:信息壓縮,將提取到的知識作為原始輸入數(shù)據(jù),利用卷積和下采樣操作降低數(shù)據(jù)維度,并將卷積層的輸出作為LSTM層的輸入來提取長期依賴關系和處理重建數(shù)據(jù),解碼過程利用反卷積和上采樣生成近似原始輸入的輸出,訓練自動編碼器最小化輸入和重建數(shù)據(jù)差異;步驟S5:報告優(yōu)化,具體為審查報告內(nèi)容,確保知識提取和信息壓縮過程中沒有遺漏關鍵信息,根據(jù)報告質(zhì)量調(diào)整語言大模型參數(shù);在步驟S3中,所述知識提取,包括以下步驟:步驟S31:計算目標域中個體的質(zhì)心,基于預處理后的文本數(shù)據(jù)進行個體質(zhì)心計算時,先將文本數(shù)據(jù)進行向量化表示,將文本數(shù)據(jù)的向量化表示作為個體,將個體在各個維度上的值進行加權求平均,確定質(zhì)心在向量空間中的位置,所用公式如下: ;式中,C表示目標域中個體的質(zhì)心,表示滿足帕累托最優(yōu)條件的解的數(shù)量,用于確定在計算目標域個體質(zhì)心時的權重,j表示個體的索引,J表示個體的總數(shù),表示目標域中的第j個個體;步驟S32:計算從源域中每個個體到目標域質(zhì)心的歐幾里得距離,所用公式如下: ;式中,Ed表示計算得到的歐幾里得距離,i表示維度索引,n表示維度總數(shù),表示源域中第j個個體在第i個維度上的值,表示目標域質(zhì)心的第i維度上的值;步驟S33:定義與每個源域關聯(lián)的權重,從每個源域中提取個體進行知識轉(zhuǎn)移,考慮到不同源域和目標域之間的相似性,定義與每個源域關聯(lián)的權重,所用公式如下: ; ;式中,表示與第t個源域關聯(lián)的權重,t表示源域的索引,T表示源域的總數(shù),表示第t個源域的相似性度量,表示源域參數(shù),表示目標域參數(shù),f()表示將歐幾里得距離轉(zhuǎn)換為相似性度量的變換函數(shù);步驟S34:計算與質(zhì)心距離最接近的源域,用于在知識提取時,對與質(zhì)心距離最接近的源域進行重點關注,篩選出更重要的源域進行針對性的知識提取和分析,所用公式如下: ;式中,表示最接近質(zhì)心的源域,N表示源域特征值。
如需購買、轉(zhuǎn)讓、實施、許可或投資類似專利技術,可聯(lián)系本專利的申請人或?qū)@麢嗳?a target="_blank" rel="noopener noreferrer nofollow" >數(shù)力聚(北京)科技有限公司,其通訊地址為:100036 北京市海淀區(qū)翠微中里14號樓四層B567;或者聯(lián)系龍圖騰網(wǎng)官方客服,聯(lián)系龍圖騰網(wǎng)可撥打電話0551-65771310或微信搜索“龍圖騰網(wǎng)”。
1、本報告根據(jù)公開、合法渠道獲得相關數(shù)據(jù)和信息,力求客觀、公正,但并不保證數(shù)據(jù)的最終完整性和準確性。
2、報告中的分析和結(jié)論僅反映本公司于發(fā)布本報告當日的職業(yè)理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據(jù)或者憑證。