對于資訊類產(chǎn)品和內(nèi)容內(nèi)產(chǎn)品來說,內(nèi)容審核是必不可少的環(huán)節(jié)之一。用戶發(fā)布的內(nèi)容不受平臺控制,而部分內(nèi)容會給平臺造成風(fēng)險,審核是阻斷內(nèi)容風(fēng)險的主要方式。
“目前市面上的內(nèi)容平臺主要是采用機審與人工審核相結(jié)合的方式,很少有只有單一審核的方式。” 數(shù)美科技高級產(chǎn)品經(jīng)理曉陽告訴記者。
曉陽說,最早出現(xiàn)的審核模式就是人工審核,但人工審核有三個明顯的缺點:監(jiān)管理解有難度、成本高、時效性差。
“大量腰部的中小型企業(yè)往往團隊規(guī)模比較小,成立年限比較短而且集中投入在產(chǎn)品上,沒有精力投入到合規(guī)研究中。所以在輿情關(guān)注以及對新規(guī)的理解層面,光靠一個經(jīng)驗豐富的人來審核是不行的,需要組建一支類似這樣的人工審核團隊,但是這種操作難度較大,一般只有大廠才會有這個能力與資源儲備。其次,人工審核在處理音視頻的時候內(nèi)容有多長,審核就要多久,甚至更久。這就會產(chǎn)生更多的衍生問題,比如固定的單人審核能效必將導(dǎo)致更加龐大的審核團隊,又或是等待審核時長過長導(dǎo)致的用戶流失。因此這既是效率問題,也是用戶體驗問題,但最終都會回到成本問題?!睍躁栒f。
2019年1月9日,中國網(wǎng)絡(luò)視聽節(jié)目服務(wù)協(xié)會發(fā)布了《網(wǎng)絡(luò)短視頻平臺管理規(guī)范》和《網(wǎng)絡(luò)短視頻內(nèi)容審核標(biāo)準(zhǔn)細則》。其中規(guī)定,短視頻平臺發(fā)布的節(jié)目、評論、彈幕等內(nèi)容,必須先審后發(fā);并且詳細列出了二十大類,100小條的禁止內(nèi)容。2022年3月2日,國家網(wǎng)信辦就《互聯(lián)網(wǎng)彈窗信息推送服務(wù)管理規(guī)定(征求意見稿)》公開征求意見。其中擬規(guī)定,配備與服務(wù)規(guī)模相適應(yīng)的人工力量,健全彈窗信息推送內(nèi)容管理規(guī)范,完善信息篩選、編輯、推送等工作流程,確保彈窗信息推送必須經(jīng)過人工審核。
審核新規(guī)落地,也就意味著互聯(lián)網(wǎng)平臺審核需要更細、范圍更廣,擴充審核隊伍成了各大互聯(lián)網(wǎng)公司的迫切需求。
資料顯示,2020年B站內(nèi)容篩選團隊約有2400名員工;小紅書審核員工有1000多人;字節(jié)跳動的內(nèi)容審核員更是超過2萬人。
根據(jù)某UGC(用戶原創(chuàng)內(nèi)容)平臺曾對外公布的武漢審核員的公開招聘信息顯示,審核專員月薪在4000—6000元。按照8%公積金繳納比例測算,用工成本在5344元—8016元之間。
粗略計算,該平臺內(nèi)容審核團隊一年的用工成本或在1.53億元—2.31億元之間。
不過,曉陽進一步告訴記者,就算監(jiān)管與成本方面可以通過投入大量的人力以及預(yù)算來解決,但時效性差的問題是無法用金錢來解決的。
他以應(yīng)對輿情的能力為例,當(dāng)平臺發(fā)現(xiàn)某種嚴(yán)格管控的風(fēng)險內(nèi)容,不僅要處理當(dāng)下的新發(fā)信息,也要同時檢查所有的數(shù)千萬甚至數(shù)億條歷史存量信息。想要短時間內(nèi)完成歷史存量的篩查,這是人工審核絕不可能完成的。
所以,在風(fēng)險和用戶體驗雙重重壓之下,僅依賴人工審核是不現(xiàn)實的,使用機器輔助人工審核才是最優(yōu)的選擇。
那么,在人工智能飛速發(fā)展的當(dāng)下,為什么還需要這么多內(nèi)容審核員?用AI技術(shù)難道不行嗎?
對此,曉陽表示,實際上現(xiàn)階段機審還有幾個無法逾越的鴻溝,比如目前的模型沒有辦法取代人,它不具備人的深度思考能力、聯(lián)想能力、聯(lián)系上下文能力等等。再比如機器在某些審核標(biāo)準(zhǔn)上很難把控,因為機器不具備主觀性,像是無法理解軟色情/色情/曖昧色情的定義和區(qū)別,這就需要人的介入。
“就目前而言,AI技術(shù)并不能完全替代人工審核,平臺還是需要借助人的經(jīng)驗和判斷來篩選內(nèi)容。”曉陽說,AI只能起到輔助作用,其重點主要是進行初篩,對明顯違規(guī)的問題內(nèi)容第一時間進行“刪除”,同時通過數(shù)據(jù)比對、對侵權(quán)的內(nèi)容(圖文、視頻特別是被剪短的影視?。┻M行有效遏制。大量內(nèi)容中的隱藏問題,常人尚且未必能秒懂,何況人工智能。
一些平臺的內(nèi)容創(chuàng)作者,手法、技巧都更上一層樓,比如將中心思想隱喻在歷史故事、將敏感信息加密等,機器很難識別到,二是這些平臺的影響范圍廣,稍有不慎就會讓輿論偏向,所以大平臺的內(nèi)容安全審核工作都需要人的協(xié)作。
《哈佛商業(yè)評論》做過一項涉及1500家企業(yè)的研究,結(jié)果顯示,當(dāng)人類和機器一起工作時,企業(yè)受益最大,調(diào)查同時指出,人類有某些特征,機器無法承擔(dān),反之亦然。一個簡單的例子是,一個人開玩笑諷刺某個人,我們輕易就能搞懂,但機器很難理解,而分析海量的數(shù)據(jù)對機器來說很容易,對人類來說幾乎是不可能。
“人工智能主要依賴的算法是深度學(xué)習(xí)的方法,只能從數(shù)據(jù)來學(xué)習(xí),而人類除了歸納學(xué)習(xí)之外,還可以演繹推理,機器并不具備該能力。因此在很多情況下內(nèi)容審核必須要依靠人工來完成審核?!睍躁栒f。
值得一提的是,目前一些低端、重復(fù)的審核工作或許很快會被AI技術(shù)所取代。2019年7月,今日頭條宣布正式推出新版“靈犬”反低俗助手;2020年9月,小紅書在“啄木鳥”計劃中,就加入了“多維度算法模型”的審核模式;快手也早將AI技術(shù)運用進了內(nèi)容審核中;阿里巴巴則是基于視覺分析技術(shù)和深度識別技術(shù)從而大幅度降低人工審核成本;2021年9月,數(shù)美科技推出了三級風(fēng)險內(nèi)容標(biāo)簽體系,下設(shè)1000多個細化標(biāo)簽并建立糾錯機制。
“各大廠商在機審層面引入AI技術(shù)也是為了盡可能精準(zhǔn)識別風(fēng)險,而人機結(jié)合的交接部分——人工審核平臺的設(shè)計也是非常重要的課題,它兼具重大的商業(yè)意義和社會意義。”曉陽說。“現(xiàn)在的人工智能審核技術(shù),仍然處于一個高速發(fā)展的時期。如果說AI機審?fù)耆軌虼嫒斯徍?,我認(rèn)為在現(xiàn)在這個階段很難做到,但是用人工智能技術(shù)解放人力,還有著十分廣闊的想象空間,值得數(shù)美乃至全球AI企業(yè)為之不懈努力?!?/p>
關(guān)鍵詞: