国产精品天干天干在线播放,大尺度揉捏胸床戏视频,樱花草www日本在线观看,狠狠躁夜夜躁人人爽天天天天97

Document
拖動(dòng)滑塊完成拼圖
個(gè)人中心

預(yù)訂訂單
服務(wù)訂單
發(fā)布專利 發(fā)布成果 人才入駐 發(fā)布商標(biāo) 發(fā)布需求

在線咨詢

聯(lián)系我們

龍圖騰公眾號(hào)
首頁 專利交易 科技果 科技人才 科技服務(wù) 國際服務(wù) 商標(biāo)交易 會(huì)員權(quán)益 IP管家助手 需求市場 關(guān)于龍圖騰
 /  免費(fèi)注冊(cè)
到頂部 到底部
清空 搜索
當(dāng)前位置 : 首頁 > 專利喜報(bào) > 恭喜北京科技大學(xué)柯紅巖獲國家專利權(quán)

恭喜北京科技大學(xué)柯紅巖獲國家專利權(quán)

買專利賣專利找龍圖騰,真高效! 查專利查商標(biāo)用IPTOP,全免費(fèi)!專利年費(fèi)監(jiān)控用IP管家,真方便!

龍圖騰網(wǎng)恭喜北京科技大學(xué)申請(qǐng)的專利一種中文不良言論檢測方法及系統(tǒng)獲國家發(fā)明授權(quán)專利權(quán),本發(fā)明授權(quán)專利權(quán)由國家知識(shí)產(chǎn)權(quán)局授予,授權(quán)公告號(hào)為:CN119377415B

龍圖騰網(wǎng)通過國家知識(shí)產(chǎn)權(quán)局官網(wǎng)在2025-05-20發(fā)布的發(fā)明授權(quán)授權(quán)公告中獲悉:該發(fā)明授權(quán)的專利申請(qǐng)?zhí)?專利號(hào)為:202411977154.6,技術(shù)領(lǐng)域涉及:G06F16/353;該發(fā)明授權(quán)一種中文不良言論檢測方法及系統(tǒng)是由柯紅巖;艾冬梅;郭遷遷;賀可太;徐晶設(shè)計(jì)研發(fā)完成,并于2024-12-31向國家知識(shí)產(chǎn)權(quán)局提交的專利申請(qǐng)。

一種中文不良言論檢測方法及系統(tǒng)在說明書摘要公布了:本發(fā)明提供一種中文不良言論檢測方法及系統(tǒng),涉及言論檢測技術(shù)領(lǐng)域,方法包括:獲取包含不良言論的初始推文數(shù)據(jù)集;對(duì)初始推文數(shù)據(jù)集進(jìn)行包括數(shù)據(jù)清洗和格式化的預(yù)處理;利用多模型一致性投票策略,對(duì)預(yù)處理后的初始推文數(shù)據(jù)集進(jìn)行分類標(biāo)注,獲得中文不良言論數(shù)據(jù)集;構(gòu)建中文不良言論檢測模型;將中文不良言論數(shù)據(jù)集輸入至中文不良言論檢測模型中進(jìn)行訓(xùn)練;獲取實(shí)時(shí)中文不良言論數(shù)據(jù)集;將中文不良言論數(shù)據(jù)集輸入至訓(xùn)練后的中文不良言論檢測模型,輸出中文不良言論檢測結(jié)果。本發(fā)明提升了中文不良言論的檢測效果,確保模型能夠從多角度全面捕捉輸入樣本的本質(zhì)特征。

本發(fā)明授權(quán)一種中文不良言論檢測方法及系統(tǒng)在權(quán)利要求書中公布了:1.一種中文不良言論檢測方法,其特征在于,包括:S1:獲取包含不良言論的初始推文數(shù)據(jù)集;S2:對(duì)所述初始推文數(shù)據(jù)集進(jìn)行預(yù)處理;S3:利用多模型一致性投票策略,對(duì)預(yù)處理后的初始推文數(shù)據(jù)集進(jìn)行分類標(biāo)注,獲得中文不良言論數(shù)據(jù)集;S4:構(gòu)建中文不良言論檢測模型,其中,所述中文不良言論檢測模型包括依次連接的數(shù)據(jù)增強(qiáng)模塊、R-Drop正則化模塊、雙通道分類任務(wù)模塊和對(duì)比學(xué)習(xí)模塊;S5:將所述中文不良言論數(shù)據(jù)集輸入至所述中文不良言論檢測模型中進(jìn)行訓(xùn)練;S6:獲取實(shí)時(shí)中文不良言論數(shù)據(jù)集;S7:將所述中文不良言論數(shù)據(jù)集輸入至訓(xùn)練后的中文不良言論檢測模型,輸出中文不良言論檢測結(jié)果;其中,所述數(shù)據(jù)增強(qiáng)模塊包括BERT單元,所述BERT單元包含Dropout算法;所述S5具體包括:S501:基于所述中文不良言論數(shù)據(jù)集,通過所述BERT單元進(jìn)行特征提取,得到數(shù)據(jù)特征;S502:利用所述Dropout算法,對(duì)所述數(shù)據(jù)特征進(jìn)行數(shù)據(jù)增強(qiáng),生成正樣本對(duì);所述S502具體包括:S5021:利用所述Dropout算法,對(duì)所述數(shù)據(jù)特征進(jìn)行雙重編碼,生成第一特征表示和第二特征表示,其中,表示第一特征表示,表示第二特征表示;S5022:將所述第一特征表示和所述第二特征表示作為所述中文不良言論數(shù)據(jù)集中同一個(gè)句子的不同增強(qiáng)特征,構(gòu)成對(duì)比學(xué)習(xí)的正樣本對(duì),其中,所述第一特征表示和所述第二特征表示具有相關(guān)性;S503:將所述正樣本對(duì)輸入至所述R-Drop正則化模塊的分類器中,輸出所述正樣本對(duì)的預(yù)測分布: ;其中,表示第一預(yù)測分布,表示歸一化指數(shù)函數(shù),表示第二預(yù)測分布,W表示分類器的權(quán)重矩陣,b表示分類器的偏置項(xiàng),表示第一特征表示,表示第二特征表示;S504:根據(jù)所述預(yù)測分布,計(jì)算KL散度損失和交叉熵?fù)p失;S505:將所述正樣本對(duì)輸入至所述雙通道分類任務(wù)模塊,生成最終分類結(jié)果;S506:通過所述對(duì)比學(xué)習(xí)模塊,生成對(duì)比學(xué)習(xí)損失: ;所述Lcl表示對(duì)比學(xué)習(xí)損失,sim表示特征間相似性,i=1,2,···,n,n表示中文不良言論數(shù)據(jù)集中參與損失計(jì)算的輸入句子數(shù)量τ表示溫度超參數(shù),J=1,2,···,N,N表示中文不良言論數(shù)據(jù)集中輸入句子的總數(shù)量,hj表示負(fù)樣本;S507:結(jié)合所述交叉熵?fù)p失、所述KL散度損失和所述對(duì)比學(xué)習(xí)損失,構(gòu)建總損失函數(shù): ;其中,Ltotal表示總損失函數(shù),Lkl表示KL散度損失,Lce表示交叉熵?fù)p失,表示超參數(shù);S508:利用梯度下降優(yōu)化算法調(diào)整所述中文不良言論檢測模型的參數(shù),直至總損失函數(shù)值小于預(yù)設(shè)損失函數(shù)值。

如需購買、轉(zhuǎn)讓、實(shí)施、許可或投資類似專利技術(shù),可聯(lián)系本專利的申請(qǐng)人或?qū)@麢?quán)人北京科技大學(xué),其通訊地址為:100083 北京市海淀區(qū)學(xué)院路30號(hào);或者聯(lián)系龍圖騰網(wǎng)官方客服,聯(lián)系龍圖騰網(wǎng)可撥打電話0551-65771310或微信搜索“龍圖騰網(wǎng)”。

免責(zé)聲明
1、本報(bào)告根據(jù)公開、合法渠道獲得相關(guān)數(shù)據(jù)和信息,力求客觀、公正,但并不保證數(shù)據(jù)的最終完整性和準(zhǔn)確性。
2、報(bào)告中的分析和結(jié)論僅反映本公司于發(fā)布本報(bào)告當(dāng)日的職業(yè)理解,僅供參考使用,不能作為本公司承擔(dān)任何法律責(zé)任的依據(jù)或者憑證。
主站蜘蛛池模板: 枞阳县| 辽宁省| 麻城市| 古交市| 富锦市| 连平县| 南丰县| 乳山市| 丰都县| 霍城县| 定远县| 灵宝市| 南丹县| 霍城县| 历史| 关岭| 玉溪市| 太康县| 阜新市| 新民市| 滦平县| 泸溪县| 马尔康县| 雷波县| 新巴尔虎左旗| 邮箱| 临武县| 阜宁县| 河北省| 册亨县| 镇平县| 耿马| 凤山县| 涿州市| 遂宁市| 怀宁县| 遂平县| 安阳市| 友谊县| 繁昌县| 来凤县|