恭喜湖南先匯智能科技有限公司楊富元獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網恭喜湖南先匯智能科技有限公司申請的專利一種用于邊緣設備大模型的提示詞壓縮方法和系統獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN119918678B 。
龍圖騰網通過國家知識產權局官網在2025-06-13發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202510409012.8,技術領域涉及:G06N5/04;該發明授權一種用于邊緣設備大模型的提示詞壓縮方法和系統是由楊富元;郭慧;陳潤澤;劉會鵬;余俊輝設計研發完成,并于2025-04-02向國家知識產權局提交的專利申請。
本一種用于邊緣設備大模型的提示詞壓縮方法和系統在說明書摘要公布了:本發明適用于提示詞壓縮技術領域,提供了一種用于邊緣設備大模型的提示詞壓縮方法和系統。本發明通過對邊緣設備大模型進行性能測試,建立輸入長度與處理時間的回歸模型,基于預設的預期處理時間,確定最長Prompt長度;將輸入Prompt劃分為多個關鍵段落和多個非關鍵段落,并計算多個非關鍵段落與多個關鍵段落的語義關聯度;計算多個關鍵段落的關鍵總長度,將關鍵總長度與最長Prompt長度進行比較,對輸入Prompt進行多輪Prompt壓縮。能夠通過關鍵段落導向的壓縮方法,減輕壓縮過程的工作量,兼顧推理精度與延遲需求,既能夠在語義保留方面表現優秀,又能夠限制內存消耗和推理延遲,有效支持后續的推理工作。
本發明授權一種用于邊緣設備大模型的提示詞壓縮方法和系統在權利要求書中公布了:1.一種用于邊緣設備大模型的提示詞壓縮方法,其特征在于,所述方法具體包括以下步驟: 對邊緣設備大模型進行性能測試,建立輸入長度與處理時間的回歸模型,基于預設的預期處理時間,確定最長Prompt長度; 接收輸入Prompt,將所述輸入Prompt劃分為多個關鍵段落和多個非關鍵段落,并計算多個所述非關鍵段落與多個所述關鍵段落的語義關聯度; 計算多個所述關鍵段落的關鍵總長度,將所述關鍵總長度與所述最長Prompt長度進行比較,對所述輸入Prompt進行多輪Prompt壓縮; 所述計算多個所述關鍵段落的關鍵總長度,將所述關鍵總長度與所述最長Prompt長度進行比較,對所述輸入Prompt進行多輪Prompt壓縮具體包括以下步驟: 計算多個所述關鍵段落的關鍵總長度; 將所述關鍵總長度與所述最長Prompt長度進行比較,計算分配總長度; 若所述分配總長度不大于0,則保留多個關鍵段落,對多個所述非關鍵段落進行壓縮; 若所述分配總長度大于0,則計算多個所述非關鍵段落的非關鍵總長度; 將所述非關鍵總長度與所述分配總長度進行比較; 若所述非關鍵總長度不小于0,則保留多個非關鍵段落; 若所述非關鍵總長度小于0,則按照多個所述語義關聯度,對多個所述非關鍵段落進行選擇壓縮。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人湖南先匯智能科技有限公司,其通訊地址為:410000 湖南省長沙市高新開發區麓谷街道青山路662號芯城科技園二期1棟201-8;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。