恭喜中科南京軟件技術研究院湯柯獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網恭喜中科南京軟件技術研究院申請的專利基于多模態大模型在人機協同環境中的意圖理解方法獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN119785276B 。
龍圖騰網通過國家知識產權局官網在2025-05-09發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202510289601.7,技術領域涉及:G06V20/40;該發明授權基于多模態大模型在人機協同環境中的意圖理解方法是由湯柯;李鵬;葉發萍設計研發完成,并于2025-03-12向國家知識產權局提交的專利申請。
本基于多模態大模型在人機協同環境中的意圖理解方法在說明書摘要公布了:本發明涉及人工智能技術領域,涉及一種基于多模態大模型在人機協同環境中的意圖理解方法。其包括以下具體步驟:視頻分析與任務規劃;采用關鍵幀提取和圖像分割方法對視頻進行預處理;構建任務的有向無環圖,記憶可行的任務路徑;實時意圖判斷;對多模態數據進行處理,將不同模態的數據截取圖片按照固定方式拼接在一起;使用任務有向無環圖篩選大模型一次判斷時需要面對的子任務,并且給大模型梳理一些更可能發生的子任務序列;機械臂指令生成與反饋;根據任務有向無環圖發出相應的指令、執行相應步驟,生成反饋數據。本發明通過結合視覺、聽覺等多模態信息,實時感知環境和任務執行過程,成功實現了對復雜環境中人物行為的精準識別與任務推斷。
本發明授權基于多模態大模型在人機協同環境中的意圖理解方法在權利要求書中公布了:1.一種基于多模態大模型在人機協同環境中的意圖理解方法,其特征在于,包括以下具體步驟:S1、視頻分析與任務規劃;S11、采用關鍵幀提取和圖像分割方法對視頻進行預處理;S12、構建任務的有向無環圖,記憶可行的任務路徑;任務有向無環圖中的結點用于表征任務中存在的眾多動作,箭頭用于表征動作之間的時間邏輯順序;構建任務有向無環圖包括以下具體步驟:通過向多模態智能體輸入指導視頻,根據視頻信息構建關于任務的任務結點和結點的時序序列;找到所有任務結點的依賴集合,無論沿著哪條路徑,任務都需要的前置條件;找到所有任務結點的被依賴集合,無論沿著哪條路徑,都會執行的任務結點;去除無關結點,即在同一個任務結點的依賴集合,又在其被依賴集合中的結點;標記潛在依賴和潛在被依賴,即在某條路徑中,存在的前置條件和后置條件;標記互斥結點;所有的被依賴、潛在被依賴和互斥關系被列為邏輯表達式中的非項,依賴被列為正項;S2、實時意圖判斷;S21、對多模態數據進行處理,將不同模態的數據截取圖片按照固定方式拼接在一起;S22、使用任務有向無環圖篩選大模型一次判斷時需要面對的子任務,并且給大模型梳理一些更可能發生的子任務序列;步驟S22中包括以下步驟:一、將任務有向無環圖中的入度為0的任務結點標記成可執行結點;二、當一個可執行結點被執行完畢之后,將這個結點從任務有向無環圖中剔除,然后從新的任務有向無環圖中重新選擇入度為0的結點;三、所有的結點被執行完畢,那么任務結束;否則回到步驟一;S3、機械臂動作指令的生成與反饋;S31、根據任務有向無環圖發出相應的指令、執行相應步驟,生成反饋數據。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人中科南京軟件技術研究院,其通訊地址為:211135 江蘇省南京市南京市麒麟科創園創研路266號人工智能產業園4號樓11樓;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。