国产精品天干天干在线播放,大尺度揉捏胸床戏视频,樱花草www日本在线观看,狠狠躁夜夜躁人人爽天天天天97

Document
拖動滑塊完成拼圖
個人中心

預訂訂單
服務訂單
發布專利 發布成果 人才入駐 發布商標 發布需求

在線咨詢

聯系我們

龍圖騰公眾號
首頁 專利交易 科技果 科技人才 科技服務 國際服務 商標交易 會員權益 IP管家助手 需求市場 關于龍圖騰
 /  免費注冊
到頂部 到底部
清空 搜索
當前位置 : 首頁 > 專利喜報 > 恭喜東北電力大學鮑松彬獲國家專利權

恭喜東北電力大學鮑松彬獲國家專利權

買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!

龍圖騰網恭喜東北電力大學申請的專利融合關聯信息的程式語識別系統及方法獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN114330338B

龍圖騰網通過國家知識產權局官網在2025-05-27發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202210037262.X,技術領域涉及:G06F40/289;該發明授權融合關聯信息的程式語識別系統及方法是由鮑松彬;鄭育杰;王敬東;孟凡奇設計研發完成,并于2022-01-13向國家知識產權局提交的專利申請。

融合關聯信息的程式語識別系統及方法在說明書摘要公布了:本發明公開了融合關聯信息的程式語識別系統及方法,其中的系統包括:基本特征提取模塊,用于使用Torch中的embedding層生成詞嵌入向量作為詞性特征、GloVe詞向量技術訓練的特征向量作為語義特征,經過晚融合的詞性特征和語義特征作為該模型的基本特征;關聯信息提取模塊,用于采用單詞間的互信息和句子的依存句法關系作為識別程式語的關聯信息;標簽表示模塊,用于表示標簽。本發明通過詞嵌入技術來表示特征向量,并融合了能夠代表程式語特征的關聯信息,使用圖卷積神經網絡獲取更深層次的語義特征,最后考慮到標簽之間含有依存關系,使用條件隨機場模型進行標簽解碼,達到識別程式語的目的。

本發明授權融合關聯信息的程式語識別系統及方法在權利要求書中公布了:1.融合關聯信息的程式語識別方法,其特征在于,包括:基本特征提取方法;關聯信息提取方法;標簽表示方法;所述基本特征提取方法包括:特征選擇;基于Bi-LSTM的特征表示;詞性特征和語義特征的晚融合;所述特征選擇包括使用Torch中的embedding層生成詞嵌入向量作為詞性特征、使用GloVe訓練的特征向量來表示程式語的語義特征:根據語料庫構建一個共現矩陣X,矩陣中的每一個元素Xij代表單詞i和上下文單詞j在特定大小的上下文窗口內共同出現的次數;構建詞向量和共現矩陣之間的近似關系,關系如下公式所示: 其中,上式的wi和wj是我們最終要求解的詞向量;而bi和bj則是兩個詞向量的bias項;構造損失函數,如式所示: 其中,fXij為權重函數,它的計算公式如下公式所示: 其中,x表示共現次數,而xmax表示最大共現次數;所述基于Bi-LSTM的特征表示包括:設句子si=[x1,x2,...,xt,...,xn],將其輸入到Bi-LSTM網絡中,得到句子si的隱藏層的表示{h1,h2,...,ht,...hn};每個單元根據前一個隱藏向量ht-1和當前輸入向量xt的計算,得到當前隱藏向量ht,其操作定義如下:it=σWxixt+Whiht-1+Wcict-1+bift=σWxfxt+Whfht-1+Wcfct-1+bfct=ftct-1+ittanhWxcxt+Whcht-1+bcot=σWx0xt+Whoht-1+Wcoct+boht=ottanhct式中:it,ft,ct,ot,ht分別為記憶門、隱藏層、遺忘門、細胞核和輸出門在輸入第t個文本時的狀態;W為模型的參數;b為偏置向量;σ為Sigmoid函數;tanh為雙曲正切函數;所述詞性特征和語義特征的晚融合包括:首先把詞性特征和語義特征分別輸入到Bi-LSTM中,再將兩個模型的結果進行拼接形成基本特征向量;所述關聯信息提取方法包括:1基于互信息的關聯信息:兩個離散隨機變量X和Y的互信息的定義為: 其中px,y是X和Y的聯合概率分布函數,px和py分別是X和Y的邊緣概率分布函數;如果要衡量某個數據集中任意兩個單詞x,y的關聯程度,這樣計算:其中,px,py為x,y在數據集中獨立出現的概率,直接統計詞頻后除以總的詞數就得到;px,y為x,y同時出現在數據集中的概率,直接統計二者同時出現的次數,再除以所有無序對的個數即可;2基于依存句法分析的關聯信息:依存句法揭示了句子中詞與詞之間的依存關系以及搭配關系,其中一個依存關系連接兩個詞,一個是核心詞,一個是修飾詞,這樣的關系與句子的語義關系是相互關聯的;3基于圖卷積神經網絡的特征表示:通過MI和依存句法分析將單詞間的關系用圖來表示,所以采用圖卷積神經網絡來處理關聯信息;給定一個圖G=V,E,V是包含N個節點的頂點集,E是包括自循環邊的邊集,圖GV,E的特征信息可由拉普拉斯矩陣L表示,如下公式所示:L=D-A或者使用對稱歸一化后的拉普拉斯矩陣:Lsys=IN-D-12AD-12式中:A為圖的鄰接矩陣;IN為N階單位矩陣;D=diagd為頂點的度矩陣; 基于圖的傅里葉變換,圖卷積公式表示為:g*x=U[UTg·UTx]式中:x為節點的基本特征向量;g為卷積核;U為拉普拉斯矩陣L的特征向量矩陣;采用Chebyshev多項式簡化圖卷積公式,最終圖卷積分層傳播公式可表示為: 式中:σ為激活函數;W為需要訓練的權重矩陣;所述標簽表示方法包括:在CRF中,每個句子X={x1,x2,…,xn}都有一個待選標簽序列集合,通過計算集合中每個標簽序列Y={y1,y2,…,yn}的得分來決定最終的標注序列,計算得分過程如式所示: 其中,P∈Rn×k是一個得分矩陣,k為所有標簽數量;A∈Rk+2×k+2是一個包含了句子開始與結束標簽的轉移矩陣;將每個標簽序列的分數進行歸一化得到概率,其中概率最大的標簽序列即為該句子的最終序列,歸一化過程如式所示:

如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人東北電力大學,其通訊地址為:132012 吉林省吉林市長春路169號;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。

免責聲明
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。
主站蜘蛛池模板: 临湘市| 罗甸县| 道真| 四子王旗| 专栏| 黔东| 文安县| 九龙城区| 滁州市| 仁化县| 班玛县| 斗六市| 正蓝旗| 绥芬河市| 胶南市| 泸溪县| 延安市| 融水| 汽车| 芮城县| 乌拉特前旗| 神池县| 喀喇| 买车| 若羌县| 仁布县| 东源县| 鹤壁市| 射阳县| 东丽区| 牟定县| 彭州市| 沅陵县| 平安县| 牡丹江市| 荃湾区| 嘉峪关市| 蓬安县| 务川| 敦煌市| 德兴市|