網(wǎng)絡(luò)語言管理
(資料圖片僅供參考)
近年來,網(wǎng)絡(luò)平臺(tái)“變體字”“諧音字”“新造詞”現(xiàn)象持續(xù)引發(fā)社會(huì)關(guān)注。長(zhǎng)期以來,博主、短視頻 UP 主、平臺(tái)用戶為了躲避平臺(tái)監(jiān)管,在內(nèi)容上采取“諧音”與“變種”等方式發(fā)布不良有害信息,例如將“人民幣”說成“軟妹幣”,把“傻逼”諧音為“傘兵”。
值得注意的是,“變體字”“諧音字”喬裝打扮,也為色情暴力內(nèi)容傳播提供了便利,為低俗曖昧內(nèi)容的傳播提供可乘之機(jī)。可見,頻繁使用“變體字”“諧音字”不但擾亂了平臺(tái)生態(tài),也與漢字的正常使用南轅北轍,誤導(dǎo)公眾,顯然有規(guī)范引導(dǎo)的必要。
不知道從什么時(shí)候開始,網(wǎng)絡(luò)遍地黑話,但網(wǎng)絡(luò)空間同樣需要使用規(guī)范漢字。互聯(lián)網(wǎng)平臺(tái)作為新媒體,應(yīng)與報(bào)刊、廣播、電視等傳統(tǒng)媒體一樣使用規(guī)范漢字,且有必要及時(shí)發(fā)現(xiàn)不良違規(guī)內(nèi)容,守護(hù)互聯(lián)網(wǎng)內(nèi)容信息生態(tài)。
·具體要求·
加強(qiáng)漢字使用的規(guī)范化、標(biāo)準(zhǔn)化、信息化勢(shì)在必行。今年 1 月,中宣部出版局在京召開規(guī)范使用漢字工作座談會(huì),就出版、影視、媒體等領(lǐng)域加強(qiáng)用字管理。
近期,不少平臺(tái)已經(jīng)采取了行動(dòng)。B 站呼吁廣大用戶,自覺遵守漢字使用規(guī)范,抵制拙劣字體、錯(cuò)誤字形等不規(guī)范漢字表達(dá)行為,共同維護(hù)清朗網(wǎng)絡(luò)空間。微博發(fā)布公告稱,將對(duì)站內(nèi)利用諧音字、變體字等“錯(cuò)別字”發(fā)布、傳播不良信息的違規(guī)行為開展集中整治。
對(duì)于互聯(lián)網(wǎng)平臺(tái)企業(yè)而言,平臺(tái)自身不僅要規(guī)范漢字使用,弘揚(yáng)中華文化,且有責(zé)任要求創(chuàng)作者糾正錯(cuò)別字內(nèi)容,嚴(yán)控錯(cuò)別字新增,尤其是對(duì) UGC 內(nèi)容的審核有了新的要求。在視頻、文章、動(dòng)態(tài)之外,評(píng)論、彈幕等二次創(chuàng)造內(nèi)容,如出現(xiàn)大量錯(cuò)別字須酌情處理,避免干預(yù)干擾青少年學(xué)習(xí)漢字。
·解決之道·
隨著人工智能技術(shù)的深入發(fā)展,自然語言處理(NLP)的難題不斷迎刃而解,智能化助力文本糾錯(cuò)。匯聚多種 NLP 算法模型,結(jié)合集成策略,易盾實(shí)現(xiàn)了對(duì)錯(cuò)誤文本的準(zhǔn)確識(shí)別及糾錯(cuò),并且基于海量文本內(nèi)容的積累持續(xù)優(yōu)化的識(shí)別效果。
易盾建議,自覺遵守漢字使用規(guī)范,抵制拙劣字體、錯(cuò)誤字形等不規(guī)范漢字表達(dá)行為,不僅有利于漢字的規(guī)范化和傳統(tǒng)文化的傳承,同時(shí)也有利于打造清朗的網(wǎng)絡(luò)空間。
提供針對(duì)字詞、語法、標(biāo)點(diǎn)、專有名詞、時(shí)間日期、數(shù)值等基礎(chǔ)錯(cuò)誤內(nèi)容的檢查與糾錯(cuò)能力外,也具備重要人物姓名、職位搭配與職位排序等政務(wù)相關(guān)錯(cuò)誤內(nèi)容的檢查與糾錯(cuò)能力,并將反垃圾和文本糾錯(cuò)能力融合,能夠更全面地識(shí)別違規(guī)有害內(nèi)容。
圖 | 更多功能請(qǐng)咨詢后臺(tái)
1
識(shí)別文本中的不規(guī)范應(yīng)用
易錯(cuò)詞檢查:易錯(cuò)詞檢查采用了統(tǒng)計(jì)學(xué)習(xí)與深度學(xué)習(xí)等較為前沿的自然語言處理技術(shù),利用多模型集成策略實(shí)現(xiàn)了對(duì)錯(cuò)誤文本的識(shí)別及糾錯(cuò)。
語法檢查:通過該能力,不僅可以實(shí)現(xiàn)對(duì)內(nèi)容中多字、少字、字序顛倒、詞序顛倒類的錯(cuò)誤進(jìn)行檢查,還能夠?qū)σ延衅磳戭愬e(cuò)字錯(cuò)詞檢查的效果進(jìn)行優(yōu)化,提升了易錯(cuò)詞檢查的準(zhǔn)確率和查全率。
時(shí)間日期檢查:通過該能力,可實(shí)現(xiàn)對(duì)時(shí)間日期的有效性、使用的數(shù)字表述方式是否正確、格式是否標(biāo)準(zhǔn)進(jìn)行檢查。
數(shù)字書寫規(guī)范性檢查:通過該能力,可實(shí)現(xiàn)對(duì)羅馬數(shù)字、阿拉伯?dāng)?shù)字“1”和“0”、書寫是否規(guī)范、是否使用了英文代替進(jìn)行檢查;對(duì)使用大寫字母替代羅馬數(shù)字表示序號(hào)的錯(cuò)誤進(jìn)行檢查。
繁簡(jiǎn)誤用:該能力適用于現(xiàn)代文檢查,可較為快速準(zhǔn)確地識(shí)別出內(nèi)容中的繁體字,并可提示繁體字對(duì)應(yīng)的簡(jiǎn)體字供用戶進(jìn)行修改。
譯文檢查:通過該能力,可以較為快速、準(zhǔn)確地識(shí)別出內(nèi)容中的中文及其譯文,并對(duì)譯文的翻譯是否錯(cuò)誤、拼寫是否錯(cuò)誤進(jìn)行檢查??蓹z查的范圍包括:專業(yè)名詞術(shù)語譯文、常見國(guó)家及地區(qū)、城市譯文。
2
加強(qiáng)不良敏感內(nèi)容審核
涉領(lǐng)土完整類敏感詞檢查:可實(shí)現(xiàn)對(duì)內(nèi)容中出現(xiàn)的與臺(tái)獨(dú)、港獨(dú)、藏獨(dú)、疆獨(dú)等以及與之相關(guān)的人物、事件進(jìn)行檢查。還可對(duì)內(nèi)容中是否存在將我國(guó)地區(qū)與國(guó)外國(guó)家及地區(qū)并列出現(xiàn)的問題進(jìn)行檢查。
敏感事件檢查:可實(shí)現(xiàn)對(duì)文中出現(xiàn)的政治敏感事件、社會(huì)敏感事件的關(guān)鍵詞進(jìn)行準(zhǔn)確識(shí)別。
民族宗教類敏感詞檢查:能夠?qū)崿F(xiàn)對(duì)內(nèi)容中涉及民族、宗教的敏感詞進(jìn)行快速識(shí)別。
不文明用語檢查:能夠?qū)崿F(xiàn)對(duì)內(nèi)容中出現(xiàn)的低俗色情、暴力恐怖、虛假?gòu)V告類用語、不文明用語,以及新華社發(fā)布的禁用詞進(jìn)行檢查。
·適用場(chǎng)景·
網(wǎng)易易盾深耕語義理解、方言識(shí)別、多語種識(shí)別等方向的研發(fā),面向互聯(lián)網(wǎng)、廣電、金融等企業(yè)以及政府企事業(yè)單位等提供文本糾錯(cuò)解決方案,尤其在不良有害內(nèi)容防范能力上具備優(yōu)勢(shì)效果。
互聯(lián)網(wǎng)內(nèi)容生態(tài)維護(hù)
應(yīng)用場(chǎng)景:違規(guī)內(nèi)容識(shí)別
需求點(diǎn):清查使用錯(cuò)別字規(guī)避監(jiān)管、傳播不良有害信息的行為。
易盾將反垃圾和文本糾錯(cuò)能力進(jìn)行融合,能夠覆蓋色情、謾罵、廣告、涉政等多個(gè)大類的違規(guī)問題,守護(hù)平臺(tái)內(nèi)容環(huán)境。
易盾檢查采用統(tǒng)計(jì)學(xué)習(xí)與深度學(xué)習(xí)等較為前沿的自然語言處理技術(shù),利用多模型集成策略實(shí)現(xiàn)了對(duì)字詞錯(cuò)誤文本的識(shí)別及糾錯(cuò),能夠有效降低錯(cuò)別字對(duì)用戶實(shí)際需求的影響。
官方文件發(fā)布
應(yīng)用場(chǎng)景:政務(wù)公文
需求點(diǎn):政務(wù)、宣傳文稿的編輯和校對(duì)。
易盾針對(duì)政務(wù)公文寫作場(chǎng)景,提供領(lǐng)導(dǎo)姓名、職位搭配以及領(lǐng)導(dǎo)排序等政務(wù)相關(guān)錯(cuò)誤內(nèi)容的檢查與糾錯(cuò)能力,同時(shí)也能夠針對(duì)字詞、語法、標(biāo)點(diǎn)、專有名詞、時(shí)間日期、數(shù)值等基礎(chǔ)錯(cuò)誤內(nèi)容進(jìn)行檢查與糾錯(cuò),保障政府公信力。
新聞媒體報(bào)道
應(yīng)用場(chǎng)景:新聞稿件
需求點(diǎn):媒體、出版社稿件的編輯和校對(duì)。
易盾針對(duì)新聞稿件寫作場(chǎng)景,提供針對(duì)字詞、語法、標(biāo)點(diǎn)、專有名詞、時(shí)間日期、數(shù)值等錯(cuò)誤內(nèi)容的檢查與糾錯(cuò)能力,避免出現(xiàn)技術(shù)性錯(cuò)誤,提升稿件寫作質(zhì)量。
效果總結(jié)
易盾的文本糾錯(cuò)功能識(shí)別準(zhǔn)確率高,通過幾十個(gè)方向的文字檢測(cè),達(dá)到專業(yè)編輯糾錯(cuò)能力的水平,為寫作者提供良好的糾錯(cuò)服務(wù),在提升寫作效率的同時(shí),自覺杜絕不良信息的傳播。
AI 技術(shù)將更高效、更經(jīng)濟(jì)、更準(zhǔn)確地助力互聯(lián)網(wǎng)平臺(tái)有的放矢,定向整治色情、暴力等內(nèi)容的諧音變體,兼顧平臺(tái)內(nèi)容的質(zhì)量與漢字語言的規(guī)范發(fā)展。
免責(zé)聲明:市場(chǎng)有風(fēng)險(xiǎn),選擇需謹(jǐn)慎!此文僅供參考,不作買賣依據(jù)。
【廣告】
(免責(zé)聲明:此文內(nèi)容為廣告,相關(guān)素材由廣告主提供,廣告主對(duì)本廣告內(nèi)容的真實(shí)性負(fù)責(zé)。本網(wǎng)發(fā)布目的在于傳遞更多信息,并不代表本網(wǎng)贊同其觀點(diǎn)和對(duì)其真實(shí)性負(fù)責(zé),請(qǐng)自行核實(shí)相關(guān)內(nèi)容。廣告內(nèi)容僅供讀者參考。)
關(guān)鍵詞: