恭喜北京科技大學(xué)柯紅巖獲國家專利權(quán)
買專利賣專利找龍圖騰,真高效! 查專利查商標(biāo)用IPTOP,全免費(fèi)!專利年費(fèi)監(jiān)控用IP管家,真方便!
龍圖騰網(wǎng)恭喜北京科技大學(xué)申請(qǐng)的專利一種中文不良言論檢測方法及系統(tǒng)獲國家發(fā)明授權(quán)專利權(quán),本發(fā)明授權(quán)專利權(quán)由國家知識(shí)產(chǎn)權(quán)局授予,授權(quán)公告號(hào)為:CN119377415B 。
龍圖騰網(wǎng)通過國家知識(shí)產(chǎn)權(quán)局官網(wǎng)在2025-05-20發(fā)布的發(fā)明授權(quán)授權(quán)公告中獲悉:該發(fā)明授權(quán)的專利申請(qǐng)?zhí)?專利號(hào)為:202411977154.6,技術(shù)領(lǐng)域涉及:G06F16/353;該發(fā)明授權(quán)一種中文不良言論檢測方法及系統(tǒng)是由柯紅巖;艾冬梅;郭遷遷;賀可太;徐晶設(shè)計(jì)研發(fā)完成,并于2024-12-31向國家知識(shí)產(chǎn)權(quán)局提交的專利申請(qǐng)。
本一種中文不良言論檢測方法及系統(tǒng)在說明書摘要公布了:本發(fā)明提供一種中文不良言論檢測方法及系統(tǒng),涉及言論檢測技術(shù)領(lǐng)域,方法包括:獲取包含不良言論的初始推文數(shù)據(jù)集;對(duì)初始推文數(shù)據(jù)集進(jìn)行包括數(shù)據(jù)清洗和格式化的預(yù)處理;利用多模型一致性投票策略,對(duì)預(yù)處理后的初始推文數(shù)據(jù)集進(jìn)行分類標(biāo)注,獲得中文不良言論數(shù)據(jù)集;構(gòu)建中文不良言論檢測模型;將中文不良言論數(shù)據(jù)集輸入至中文不良言論檢測模型中進(jìn)行訓(xùn)練;獲取實(shí)時(shí)中文不良言論數(shù)據(jù)集;將中文不良言論數(shù)據(jù)集輸入至訓(xùn)練后的中文不良言論檢測模型,輸出中文不良言論檢測結(jié)果。本發(fā)明提升了中文不良言論的檢測效果,確保模型能夠從多角度全面捕捉輸入樣本的本質(zhì)特征。
本發(fā)明授權(quán)一種中文不良言論檢測方法及系統(tǒng)在權(quán)利要求書中公布了:1.一種中文不良言論檢測方法,其特征在于,包括:S1:獲取包含不良言論的初始推文數(shù)據(jù)集;S2:對(duì)所述初始推文數(shù)據(jù)集進(jìn)行預(yù)處理;S3:利用多模型一致性投票策略,對(duì)預(yù)處理后的初始推文數(shù)據(jù)集進(jìn)行分類標(biāo)注,獲得中文不良言論數(shù)據(jù)集;S4:構(gòu)建中文不良言論檢測模型,其中,所述中文不良言論檢測模型包括依次連接的數(shù)據(jù)增強(qiáng)模塊、R-Drop正則化模塊、雙通道分類任務(wù)模塊和對(duì)比學(xué)習(xí)模塊;S5:將所述中文不良言論數(shù)據(jù)集輸入至所述中文不良言論檢測模型中進(jìn)行訓(xùn)練;S6:獲取實(shí)時(shí)中文不良言論數(shù)據(jù)集;S7:將所述中文不良言論數(shù)據(jù)集輸入至訓(xùn)練后的中文不良言論檢測模型,輸出中文不良言論檢測結(jié)果;其中,所述數(shù)據(jù)增強(qiáng)模塊包括BERT單元,所述BERT單元包含Dropout算法;所述S5具體包括:S501:基于所述中文不良言論數(shù)據(jù)集,通過所述BERT單元進(jìn)行特征提取,得到數(shù)據(jù)特征;S502:利用所述Dropout算法,對(duì)所述數(shù)據(jù)特征進(jìn)行數(shù)據(jù)增強(qiáng),生成正樣本對(duì);所述S502具體包括:S5021:利用所述Dropout算法,對(duì)所述數(shù)據(jù)特征進(jìn)行雙重編碼,生成第一特征表示和第二特征表示,其中,表示第一特征表示,表示第二特征表示;S5022:將所述第一特征表示和所述第二特征表示作為所述中文不良言論數(shù)據(jù)集中同一個(gè)句子的不同增強(qiáng)特征,構(gòu)成對(duì)比學(xué)習(xí)的正樣本對(duì),其中,所述第一特征表示和所述第二特征表示具有相關(guān)性;S503:將所述正樣本對(duì)輸入至所述R-Drop正則化模塊的分類器中,輸出所述正樣本對(duì)的預(yù)測分布: ;其中,表示第一預(yù)測分布,表示歸一化指數(shù)函數(shù),表示第二預(yù)測分布,W表示分類器的權(quán)重矩陣,b表示分類器的偏置項(xiàng),表示第一特征表示,表示第二特征表示;S504:根據(jù)所述預(yù)測分布,計(jì)算KL散度損失和交叉熵?fù)p失;S505:將所述正樣本對(duì)輸入至所述雙通道分類任務(wù)模塊,生成最終分類結(jié)果;S506:通過所述對(duì)比學(xué)習(xí)模塊,生成對(duì)比學(xué)習(xí)損失: ;所述Lcl表示對(duì)比學(xué)習(xí)損失,sim表示特征間相似性,i=1,2,···,n,n表示中文不良言論數(shù)據(jù)集中參與損失計(jì)算的輸入句子數(shù)量τ表示溫度超參數(shù),J=1,2,···,N,N表示中文不良言論數(shù)據(jù)集中輸入句子的總數(shù)量,hj表示負(fù)樣本;S507:結(jié)合所述交叉熵?fù)p失、所述KL散度損失和所述對(duì)比學(xué)習(xí)損失,構(gòu)建總損失函數(shù): ;其中,Ltotal表示總損失函數(shù),Lkl表示KL散度損失,Lce表示交叉熵?fù)p失,表示超參數(shù);S508:利用梯度下降優(yōu)化算法調(diào)整所述中文不良言論檢測模型的參數(shù),直至總損失函數(shù)值小于預(yù)設(shè)損失函數(shù)值。
如需購買、轉(zhuǎn)讓、實(shí)施、許可或投資類似專利技術(shù),可聯(lián)系本專利的申請(qǐng)人或?qū)@麢?quán)人北京科技大學(xué),其通訊地址為:100083 北京市海淀區(qū)學(xué)院路30號(hào);或者聯(lián)系龍圖騰網(wǎng)官方客服,聯(lián)系龍圖騰網(wǎng)可撥打電話0551-65771310或微信搜索“龍圖騰網(wǎng)”。
- 恭喜北京京東尚科信息技術(shù)有限公司董博獲國家專利權(quán)
- 恭喜納寶韋伯通有限會(huì)社樸相敏獲國家專利權(quán)
- 恭喜珠海格力節(jié)能環(huán)保制冷技術(shù)研究中心有限公司周博獲國家專利權(quán)
- 恭喜百時(shí)美施貴寶公司M·斯特拉瑟斯獲國家專利權(quán)
- 恭喜河南超力新能源有限公司王明煜獲國家專利權(quán)
- 恭喜海寧金豪機(jī)電有限公司俞崇喜獲國家專利權(quán)
- 恭喜北京小米移動(dòng)軟件有限公司常群獲國家專利權(quán)
- 恭喜先臨三維科技股份有限公司曾桂容獲國家專利權(quán)
- 恭喜珠海凌達(dá)壓縮機(jī)有限公司郭麗麗獲國家專利權(quán)
- 恭喜巴斯利爾藥物國際股份公司曾偉鵬獲國家專利權(quán)


熱門推薦
- 恭喜華為技術(shù)有限公司葉輝獲國家專利權(quán)
- 恭喜華沙整形外科股份有限公司D·L·戴維斯獲國家專利權(quán)
- 恭喜天津大學(xué)張孟倫獲國家專利權(quán)
- 恭喜北京沃東天駿信息技術(shù)有限公司張維獲國家專利權(quán)
- 恭喜深圳市中興微電子技術(shù)有限公司徐科獲國家專利權(quán)
- 恭喜高通股份有限公司黃敏獲國家專利權(quán)
- 恭喜斯馬特凱姆有限公司I·洛曼獲國家專利權(quán)
- 恭喜阿科亞生物科學(xué)股份有限公司P.J.米勒獲國家專利權(quán)
- 恭喜青島海爾空調(diào)器有限總公司路則鋒獲國家專利權(quán)
- 恭喜天通日進(jìn)精密技術(shù)有限公司盧建偉獲國家專利權(quán)