網(wǎng)易易盾正式發(fā)布AIGC內(nèi)容風(fēng)控解決方案
2023-05-14 16:13:22AI云資訊1244
2023年,注定是AIGC發(fā)展的關(guān)鍵一年,它標志著人工智能逐漸從學(xué)術(shù)研究走向產(chǎn)業(yè)化,并與商業(yè)融合形成互為支點的發(fā)展格局,進入產(chǎn)業(yè)商用期。
技術(shù)無罪,商用卻有風(fēng)險。不少AIGC平臺在上線后僅僅幾天時間內(nèi)就頻頻遭遇翻車。究其背后,是國家對人工智能技術(shù)發(fā)展的引導(dǎo)和規(guī)范體現(xiàn)。
4月11日,國家互聯(lián)網(wǎng)信息辦公室公布了《生成式人工智能服務(wù)管理辦法(征求意見稿)》(以下簡稱辦法)。這代表著,國內(nèi)即將迎來首個AIGC新規(guī)。其中,在《辦法》的21條政策中釋放出了一條的關(guān)鍵信號,國家支持AIGC的健康發(fā)展和商業(yè)應(yīng)用,前提必須是合法合規(guī),且有13條規(guī)定都明確指向了”AIGC提供商“。
在此背景下,網(wǎng)易易盾從AIGC提供商運營角度出發(fā),結(jié)合國家政策與豐富的行業(yè)經(jīng)驗,提供覆蓋事前—平臺運營前置的風(fēng)險、事中—平臺內(nèi)容合規(guī)風(fēng)險、事后—投訴與違規(guī)處理風(fēng)險的全流程解決方案。
01事前—平臺運營前置風(fēng)險
1.AI算法治理
從算法治理角度出發(fā),AIGC提供商有責(zé)任在平臺投入使用前對可能產(chǎn)生的問題進行預(yù)估、判定并制定相對應(yīng)的措施,對算法使用過程中的安全監(jiān)測、算法評估以及算法推薦對個人信息主體帶來的影響等內(nèi)容進行規(guī)范。
同時,《辦法》中明確規(guī)定,AIGC服務(wù)及生成內(nèi)容必須“符合社會主義的價值觀”,防止出現(xiàn)民族、信仰等歧視、尊重商業(yè)道德、尊重他人合法權(quán)益、“防止生成虛假信息”等意識形態(tài)與價值傾向問題。
因此,人工智能服務(wù)提供者應(yīng)當對生成式人工智能產(chǎn)品的預(yù)訓(xùn)練數(shù)據(jù)、優(yōu)化訓(xùn)練數(shù)據(jù)來源的合法性負責(zé),提供預(yù)訓(xùn)練和優(yōu)化訓(xùn)練數(shù)據(jù)的來源等描述,人工標注規(guī)則,人工標注數(shù)據(jù)的規(guī)模和類型等必要信息。
由于大模型依賴訓(xùn)練數(shù)據(jù),在數(shù)據(jù)輸入層面可能會存在惡意操縱的風(fēng)險,包括有毒輸入、偏見、意識形態(tài)攻擊、輿論操控、虛假信息、隱私泄露等。因此,模型訓(xùn)練語料庫基本決定AIGC生成內(nèi)容的價值觀。數(shù)據(jù)標注是AI數(shù)據(jù)訓(xùn)練流程中的“關(guān)鍵一步”,純凈、貼合AI應(yīng)用場景的數(shù)據(jù)源可解決數(shù)據(jù)訓(xùn)練中90%的問題。
對此,易盾可對模型訓(xùn)練語料庫提供人工標注服務(wù)。易盾擁有頭部企業(yè)海量數(shù)據(jù)的標注經(jīng)驗,可快速、準確地提供專業(yè)人工標注服務(wù),涵蓋文字、圖片、音視頻及特殊場景和人物,同時對激增數(shù)據(jù)量可建立應(yīng)急響應(yīng)流程,為模型訓(xùn)練提供貼合使用場景的高質(zhì)量數(shù)據(jù)。
2.安全管理制度
用戶認證管理
AIGC提供商需提供涵蓋用戶認證、重點群體保護和算法透明服務(wù)。按照《中華人民共和國網(wǎng)絡(luò)安全法》規(guī)定,提供生成式人工智能服務(wù)應(yīng)當要求用戶提供真實身份信息。
在強化信息認證能力方面,易盾提供多種身份驗證方式,靈活組合;創(chuàng)新算法能力,有效應(yīng)對AI技術(shù)合成人臉、3D面具等假體攻擊;同時在登錄注冊或使用AIGC服務(wù)前集成調(diào)用信息認證能力,減少惡意注冊的安全風(fēng)險。
技術(shù)安全評估
《互聯(lián)網(wǎng)信息服務(wù)深度合成管理規(guī)定》第二十條深度合成服務(wù)提供者開發(fā)上線具有輿論屬性或者社會動員能力的新產(chǎn)品、新應(yīng)用、新功能的,應(yīng)當按照國家有關(guān)規(guī)定開展安全評估。
易盾可協(xié)助AIGC提供商建立健全AIGC相關(guān)的安全管理制度及業(yè)務(wù)技術(shù)資料的支持,協(xié)助企業(yè)進行現(xiàn)場迎檢,包括文件準備,人員訪談,技術(shù)檢測,問題記錄,問題整改。
服務(wù)算法備案
AIGC提供商應(yīng)按照《互聯(lián)網(wǎng)信息服務(wù)算法推薦管理規(guī)定》履行算法備案和變更、注銷備案手續(xù)。易盾可提供算法備案咨詢?nèi)鞒谭?wù),協(xié)助企業(yè)完成備案信息填報。
02事中—平臺內(nèi)容合規(guī)風(fēng)險
1.AI實時交互內(nèi)容審核
為了遵守法律法規(guī)和體現(xiàn)社會主義核心價值觀,對于實時交互內(nèi)容審核和利用AI生成內(nèi)容,需要加強敏感內(nèi)容審核,例如涉政、涉黃、涉暴等內(nèi)容,以確保信息的安全和合規(guī)性。然而,特殊的prompt指令可能會繞過AI自身的安全機制,增加審核的難度和復(fù)雜度。
為了解決這個問題,網(wǎng)易易盾提供了針對AIGC+UGC場景下的機器審核能力,可根據(jù)業(yè)務(wù)場景配置審核的松緊程度,選擇適當?shù)膶徍瞬呗詠頋M足不同場景的合規(guī)要求。
如在語聊對話場景中,存在真實用戶和智能機器人兩種角色,這要求機審能夠快速識別不良信息,確保人機聊天的實時性。易盾的機審技術(shù)可根據(jù)業(yè)務(wù)場景不同,在UGC內(nèi)容和AIGC生成內(nèi)容配置不同的松緊度審核策略,兼顧用戶使用體驗和內(nèi)容安全合規(guī)性。
2.上下文關(guān)聯(lián)分析+人審
AI生成內(nèi)容由于算法機制原因,存在用戶利用敏感話題、循序誘導(dǎo)提問等方式輸出不當AIGC內(nèi)容的情況,特別是包含多條上下文內(nèi)容,單詞條閱讀沒有問題,關(guān)聯(lián)上下文多詞條閱讀會有違法違規(guī)的信息,違法人員常借用藏頭詩、情景劇本、歌詞等形式生成長文本(長圖)分享,來躲避平臺的審查機制。
網(wǎng)易易盾自主研發(fā)AI語義分析技術(shù),提供AI機審上下文關(guān)聯(lián)能力;并結(jié)合人工審核,對AI生成的長圖分享、記憶薄等內(nèi)容進行關(guān)聯(lián)檢測分析。另外易盾自主研發(fā)的人工審核系統(tǒng)能還原真實對話場景,區(qū)分AI機器人與真實用戶的會話,大幅提高審核精準度及審核效率,有效識別和防范用戶利用敏感話題、循序誘導(dǎo)提問等方式輸出不當信息。
3.AI偽造內(nèi)容識別
由于Deepfake等技術(shù)的濫用可能會導(dǎo)致嚴重的詐騙和欺詐行為,因此需要采取措施來打擊AI濫用行為。易盾基于深度偽造識別算法,打造了動態(tài)防御機制,可以識別由AI生成的視頻或音頻。這種技術(shù)可以識別Deepfake等虛假信息,從而保護社交網(wǎng)絡(luò)和其他在線平臺的用戶免受欺詐和詐騙的侵害。
根據(jù)《互聯(lián)網(wǎng)信息服務(wù)深度合成管理規(guī)定》對于由AI生成的圖片、視頻等內(nèi)容需要進行標識,以確保信息的真實性和準確性,避免虛假信息的傳播造成不良影響。網(wǎng)易易盾建議平臺提供深度合成內(nèi)容的顯著標識功能,用戶在創(chuàng)作AIGC內(nèi)容的時候可以自行完成顯著標識的標記操作。標識AI生成的內(nèi)容,以及采取防御措施來打擊AI濫用行為,是確保互聯(lián)網(wǎng)信息安全的重要措施。
03事后—投訴與違規(guī)處理風(fēng)險
網(wǎng)易易盾可協(xié)助用戶建立投訴接管機制,建議平臺提供用戶投訴舉報渠道,鼓勵用戶參與平臺內(nèi)容治理,易盾智能審核系統(tǒng)也將提供用戶投訴舉報審核機制,打通機器審核和平臺業(yè)務(wù)接口,及時對用戶投訴舉報內(nèi)容進行審核處置。
AIGC大大降低了創(chuàng)作門檻,為信息生產(chǎn)和傳播帶來了新的變革和機遇。對于AIGC提供商而言,與機遇并存更多的風(fēng)險與挑戰(zhàn)。
新技術(shù)與新行業(yè)的發(fā)展往往與政策合規(guī)相輔相成,如何在合規(guī)的基礎(chǔ)上穩(wěn)步實現(xiàn)應(yīng)用落地、推進產(chǎn)品迭代,是AIGC提供商入局后繞不開的一點。作為新一代數(shù)字內(nèi)容風(fēng)控服務(wù)商,網(wǎng)易易盾將幫助AIGC平臺合規(guī)發(fā)展,為新行業(yè)的可持續(xù)發(fā)展持續(xù)做貢獻。
相關(guān)文章
- 網(wǎng)易易盾牽頭編寫業(yè)內(nèi)首份行業(yè)標準,歷時三年終獲工信部批復(fù)
- 亞運會進入倒計時,網(wǎng)易易盾助力網(wǎng)絡(luò)空間“亞運清朗”
- 網(wǎng)易智企AIGC產(chǎn)業(yè)賦能大會盛大開幕,網(wǎng)易易盾發(fā)布《生成式人工智能(AIGC)內(nèi)容安全合規(guī)指引》
- 網(wǎng)易易盾發(fā)布出海數(shù)字內(nèi)容安全解決方案,助力中國企業(yè)安全出海
- 網(wǎng)易易盾正式發(fā)布AIGC內(nèi)容風(fēng)控解決方案
- 第四屆中國人工智能大賽正式啟動,網(wǎng)易易盾作為往屆優(yōu)秀參賽代表發(fā)言
- 網(wǎng)易易盾榮獲2021 InfoQ“技術(shù)發(fā)展驅(qū)動力獎”
- 網(wǎng)易易盾入選中國網(wǎng)絡(luò)安全能力100強
- 網(wǎng)易易盾四款產(chǎn)品入選嘶吼安全研究院《2020網(wǎng)絡(luò)安全產(chǎn)業(yè)鏈圖譜》
- 網(wǎng)易易盾三款產(chǎn)品入選2020中國網(wǎng)絡(luò)安全行業(yè)全景圖
- 疫情期間的居家辦公:網(wǎng)易易盾的遠程審核高效實踐
- 網(wǎng)易易盾升級內(nèi)容安全體系 發(fā)布智能審核管理系統(tǒng)
- 全面升級!網(wǎng)易易盾發(fā)布設(shè)備DNA指紋系統(tǒng)
- 網(wǎng)易易盾獲全國首個大型AI競賽最高獎項 相關(guān)技術(shù)每天應(yīng)用超十億次
- 網(wǎng)易易盾論文入選IEEE數(shù)據(jù)庫,中國這一AI技術(shù)取得國際領(lǐng)先
人工智能企業(yè)
更多>>人工智能硬件
更多>>- 當“銀發(fā)”遇見“智眼”——神眸亮相2025深圳智慧養(yǎng)老展
- 訊飛同傳助力亞布力夏季年會,打破語言壁壘促全球?qū)υ?/a>
- 低空賦能,跨越山河,大疆運載無人機的甘孜答卷
- 預(yù)制菜又吵起來了?優(yōu)特智廚炒菜機新品發(fā)布會掀起中餐“現(xiàn)炒”熱潮
- 場景化落地部署人形機器人將超2000臺,眾擎機器人與多倫科技達成戰(zhàn)略合作
- 275W極限性能+第二代乾坤散熱!拯救者R9000P 2025至尊版成就電競創(chuàng)作雙巔峰
- 百年聲學(xué)品牌再創(chuàng)新!拜雅新品AMIRON 200 & AMIRON ZERO定義開放聆聽新方式
- 筑牢安全芯基石,紫光同芯無線充電鑒權(quán)芯片T9系列亮相2025(秋季)亞洲充電展
人工智能產(chǎn)業(yè)
更多>>- 人機共生 · 智啟未來——2025高交會亞洲人工智能與機器人產(chǎn)業(yè)鏈展主題發(fā)布
- 北京數(shù)基建發(fā)布“知行IntAct”混合智能體產(chǎn)品,以AI定義城市治理新范式
- 新時達“精耕小腦”,與大腦協(xié)同,加速具身智能垂直落地
- 亞洲愿景論壇 東軟蓋龍佳談AI與數(shù)據(jù)價值化重構(gòu)醫(yī)療未來
- 破解AI落地難題!北大這場特訓(xùn)營,為企業(yè)找到轉(zhuǎn)型“最優(yōu)解”
- 腦神經(jīng)成像提速數(shù)倍、AI練就“遺忘術(shù)”!2025螞蟻InTech獎頒發(fā)
- 一句話生成圖表!天禧智能體接入ChatExcel MCP Server讓數(shù)據(jù)處理變得如此簡單
- 外灘大會重磅發(fā)布:螞蟻百寶箱Tbox超級智能體亮相,實現(xiàn)分鐘級專業(yè)軟件交付
人工智能技術(shù)
更多>>- 外灘大會首發(fā)! 螞蟻密算推出AI密態(tài)升級卡 實現(xiàn)零改動“即插即用”
- 騰訊優(yōu)圖攜Youtu-Agent開源項目亮相上海創(chuàng)智學(xué)院首屆TechFest大會
- 2025外灘大會:王堅暢談AI變革,普天科技錨定空天算力新賽道
- 騰訊正式開源Youtu-GraphRAG,圖檢索增強技術(shù)迎來落地新突破
- 聲網(wǎng)兄弟公司 Agora與OpenAI 攜手 助力多模態(tài) AI 智能體實現(xiàn)實時交互
- Qwen-Image-Edit 模型上線基石智算,圖像編輯更精準
- 火山引擎多模態(tài)數(shù)據(jù)湖落地深勢科技,提升科研數(shù)據(jù)處理效能
- 斑馬AI大模型:為每個孩子提供專屬學(xué)習(xí)方案