恭喜北京奇虎科技有限公司周航宇獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網恭喜北京奇虎科技有限公司申請的專利數據處理方法及終端獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN119250072B 。
龍圖騰網通過國家知識產權局官網在2025-05-16發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202411775315.3,技術領域涉及:G06F40/284;該發明授權數據處理方法及終端是由周航宇設計研發完成,并于2024-12-04向國家知識產權局提交的專利申請。
本數據處理方法及終端在說明書摘要公布了:本申請涉及計算機技術領域,本申請公開了一種數據處理方法及終端,該方法包括確定針對目標大模型的輸入文本以及輸入文本的模型詞元數信息,基于模型詞元數信息確定針對輸入文本的處理策略;當處理策略為第一處理策略時,確定輸入文本的詞匯單元以及詞匯單元的單元自信息值,通過單元自信息值從詞匯單元中確定目標詞匯單元,并生成目標詞匯單元對應的目標輸入文本;確定目標輸入文本的全局相對位置特征,利用全局相對位置特征控制目標大模型對目標輸入文本進行處理,得到第一模型輸出結果。從而解決大模型在對較長的文本進行處理時,較長的文本可能會超出大模型的處理范圍,從而使得在大模型的模型處理過程中出現信息丟失或出現錯誤的技術問題。
本發明授權數據處理方法及終端在權利要求書中公布了:1.一種數據處理方法,其中,所述方法包括:確定針對目標大模型的輸入文本以及所述輸入文本的模型詞元數信息,基于所述模型詞元數信息確定針對所述輸入文本的處理策略;當所述處理策略為第一處理策略時,確定所述輸入文本的詞匯單元以及所述詞匯單元的單元自信息值,通過所述單元自信息值從所述詞匯單元中確定目標詞匯單元,并生成所述目標詞匯單元對應的目標輸入文本;確定所述目標輸入文本的全局相對位置特征,利用所述全局相對位置特征控制所述目標大模型對所述目標輸入文本進行處理,得到第一模型輸出結果;其中,所述確定所述輸入文本的詞匯單元以及所述詞匯單元的單元自信息值,包括:對所述輸入文本進行詞匯單元劃分處理得到所述輸入文本的詞匯單元;確定所述詞匯單元對應的詞元序列,計算所述詞元序列中各詞元的詞元自信息值;其中,所述詞元自信息值用于表征所述詞元的信息量;基于所述詞元序列中各詞元的詞元自信息值,確定所述詞元序列對應的詞匯單元的單元自信息值;其中,所述計算所述詞元序列中各詞元的詞元自信息值,包括:采用第一計算式計算所述詞元序列中各詞元的詞元自信息值;所述第一計算式滿足以下公式:I(Ti)=-log2P(Ti|CT0~TN,Ti);其中,Ti為所述詞元序列中序列順序號為i的詞元,N≥i≥0且i為整數,N+1為所述詞元序列中的詞元總數;T0~TN為所述詞元序列中T0至TN的全部詞元;CT0~TN,Ti為T0至TN的全部詞元中剔除Ti后得到的詞元;I(Ti)為Ti的詞元自信息值;P(Ti|CT0~TN,Ti)為T0至TN的全部詞元中剔除Ti后余下詞元所對應的詞元生成事件發生的條件下,Ti對應的詞元生成事件的發生概率值;所述基于所述詞元序列中各詞元的詞元自信息值,確定所述詞元序列對應的詞匯單元的單元自信息值,包括:采用第二計算式對所述詞元序列中各詞元的詞元自信息值進行累加處理,得到所述詞元序列對應的詞匯單元的單元自信息值;所述第二計算式滿足以下公式:I(u)=;其中,u為所述詞匯單元,I(u)為u的單元自信息值。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人北京奇虎科技有限公司,其通訊地址為:100088 北京市西城區新街口外大街28號D座112室(德勝園區);或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。