利用MongoDB進(jìn)行數(shù)據(jù)治理,防范構(gòu)建生成式AI應(yīng)用程序時的潛在安全風(fēng)險
2024-08-19 20:08:05AI云資訊2042
生成式人工智能(生成式AI)正在蓬勃發(fā)展,許多企業(yè)和初創(chuàng)公司正在運用AI工具來解決各自的用例問題。隨著企業(yè)逐漸適應(yīng)市場上的新技術(shù)范式轉(zhuǎn)移,開發(fā)者社區(qū)和開源模型也在不斷發(fā)展壯大。
構(gòu)建智能生成式AI應(yīng)用程序需要靈活運用數(shù)據(jù)。這其中涉及的一項核心要求就是數(shù)據(jù)治理,數(shù)據(jù)治理涵蓋各種有助于確保數(shù)據(jù)安全性、機(jī)密性、準(zhǔn)確性、可用性和可靠性的措施,涉及數(shù)據(jù)生命周期的流程、政策、措施、技術(shù)、工具和控制等方面。企業(yè)在構(gòu)建應(yīng)用程序并將其部署至生產(chǎn)環(huán)境時,常常需要處理個人身份信息或商業(yè)敏感數(shù)據(jù)(如與知識產(chǎn)權(quán)相關(guān)的數(shù)據(jù)),因此,企業(yè)需要確保所有必要的控制措施均已落實到位。
企業(yè)在構(gòu)建由生成式AI驅(qū)動的應(yīng)用程序時,需要具備以下關(guān)鍵能力才能打造智能化、現(xiàn)代化的應(yīng)用程序體驗:
·處理運營和分析工作負(fù)載的數(shù)據(jù)
·一個高度可擴(kuò)展、高性能的數(shù)據(jù)平臺
·一個能夠處理各種數(shù)據(jù)類型的表達(dá)式查詢API
·與各種成熟的開源LLM模型緊密集成
·原生向量搜索能力,如可實現(xiàn)語義搜索和檢索增強生成(RAG)等嵌入技術(shù)
本文詳細(xì)介紹MongoDB Atlas針對現(xiàn)代AI應(yīng)用程序需求的安全控制功能。
在構(gòu)建生成式AI應(yīng)用程序時,有哪些潛在的安全風(fēng)險?
根據(jù)Retool發(fā)布的2023年AI現(xiàn)狀報告,數(shù)據(jù)安全和數(shù)據(jù)準(zhǔn)確性是開發(fā)AI應(yīng)用時的兩大痛點。調(diào)查結(jié)果顯示,三分之一的受訪者認(rèn)為數(shù)據(jù)安全是主要痛點,人們對此的擔(dān)憂幾乎與公司規(guī)模呈線性增長。
(開發(fā)AI應(yīng)用程序的主要痛點。來源:Retool發(fā)布的2023年AI現(xiàn)狀報告)
企業(yè)在利用AI技術(shù)改善業(yè)務(wù)的同時,也應(yīng)警惕潛在的風(fēng)險。隨著企業(yè)開始廣泛嘗試各種模型和AI工具,生成式AI可能會給企業(yè)帶來意料之外的后果,增加上述風(fēng)險的暴露程度。盡管企業(yè)在開發(fā)能夠直接使用的生成式AI應(yīng)用程序時會遵循深思熟慮、有條不紊的最佳實踐,但企業(yè)必須同時部署嚴(yán)格的安全控制措施,以降低AI應(yīng)用程序可能帶來的重要安全風(fēng)險。
以下是保障AI應(yīng)用程序/系統(tǒng)安全的一些重要注意事項:
·數(shù)據(jù)安全和隱私: 生成式AI基礎(chǔ)模型依靠大量數(shù)據(jù)來訓(xùn)練和生成新內(nèi)容。如果訓(xùn)練數(shù)據(jù)或RAG(檢索增強生成)流程使用的數(shù)據(jù)包含個人數(shù)據(jù)或機(jī)密數(shù)據(jù),那么這些數(shù)據(jù)可能會以無法預(yù)測的方式出現(xiàn)在輸出結(jié)果中。因此,部署強有力的治理和控制措施至關(guān)重要,此舉有助于確保機(jī)密數(shù)據(jù)不會通過輸出結(jié)果泄露出去。
·知識產(chǎn)權(quán)侵權(quán): 企業(yè)需要避免未經(jīng)授權(quán)使用、復(fù)制或銷售知識產(chǎn)權(quán)受法律保護(hù)的作品。企業(yè)還需要確保在對AI模型進(jìn)行訓(xùn)練時,輸出結(jié)果中不含與現(xiàn)有作品相似的內(nèi)容,以免侵犯原創(chuàng)作品的版權(quán)。這是AI系統(tǒng)的一個全新領(lǐng)域,因此相關(guān)法律也在不斷完善中。
·監(jiān)管合規(guī)性: AI應(yīng)用程序必須遵守相關(guān)的行業(yè)標(biāo)準(zhǔn)和政策,如醫(yī)療領(lǐng)域的《健康保險可攜性和責(zé)任法案》(HIPAA)、金融領(lǐng)域的 PCI安全標(biāo)準(zhǔn)、保護(hù)歐盟境內(nèi)公民個人數(shù)據(jù)的《一般數(shù)據(jù)保護(hù)條例》(GDPR)、《加州消費者隱私法案》(CCPA)等。
·可解釋性: AI系統(tǒng)和算法有時并不透明,使得決策過程充滿不確定性??山忉屝允且粋€概念,指以人類能夠接受的方式來解釋機(jī)器學(xué)習(xí)模型及其輸出結(jié)果,并且能夠針對相同的輸入信息生成可重復(fù)的輸出結(jié)果??山忉屝允茿I應(yīng)用程序構(gòu)建信任和責(zé)任的關(guān)鍵,特別是在醫(yī)療、金融和安全等重要領(lǐng)域。
·AI幻覺: AI模型可能會生成不準(zhǔn)確的信息,也被稱為“幻覺”。幻覺通常是由訓(xùn)練數(shù)據(jù)和算法的局限性造成的。幻覺可能導(dǎo)致金融、醫(yī)療和保險行業(yè)違反監(jiān)管規(guī)定;還有可能導(dǎo)致個人名譽受損甚至誹謗。
以上僅列舉使用AI工具和系統(tǒng)時的部分注意事項。在實體安全、組織措施、人力資源(包括內(nèi)部員工和合作伙伴)技術(shù)控制及系統(tǒng)監(jiān)控和審計方面,還有更多需要注意的事項。逐一解決這些關(guān)鍵問題后,企業(yè)將可確保其在生產(chǎn)環(huán)境中部署的AI應(yīng)用程序的合規(guī)性和安全性。
接下來,本文將介紹MongoDB開發(fā)者數(shù)據(jù)平臺如何在安全控制和措施方面提供幫助。
MongoDB如何解決與生成式AI相關(guān)的安全風(fēng)險和數(shù)據(jù)治理問題?
MongoDB開發(fā)者數(shù)據(jù)平臺基于MongoDB Atlas構(gòu)建,統(tǒng)一了操作、分析和生成式AI數(shù)據(jù)服務(wù),讓智能應(yīng)用程序的構(gòu)建更加簡單易行。MongoDB Atlas的核心是其靈活的文檔數(shù)據(jù)模型和開發(fā)者原生查詢API。這兩者相結(jié)合可以顯著加快開發(fā)者的創(chuàng)新速度,使其能夠超越競爭對手,并把握生成式AI帶來的全新市場機(jī)遇。
全球范圍內(nèi)的開發(fā)者和數(shù)據(jù)科學(xué)團(tuán)隊正在利用依托MongoDB、以AI為驅(qū)動的應(yīng)用程序來推動創(chuàng)新。這些應(yīng)用程序涵蓋不同行業(yè)領(lǐng)域的眾多用例,并依托MongoDB Atlas提供的安全控制能力。點擊此處的資料庫來獲取有關(guān)MongoDB如何幫助客戶構(gòu)建AI驅(qū)動的應(yīng)用程序的用例示例、白皮書和其他資源。
(MongoDB的安全與合規(guī)能力)
MongoDB Atlas為所有組織數(shù)據(jù)提供嵌入式安全控制能力。這些數(shù)據(jù)可以是應(yīng)用程序數(shù)據(jù)、矢量嵌入數(shù)據(jù)和其相關(guān)的元數(shù)據(jù),為生成式AI驅(qū)動的應(yīng)用程序使用的所有數(shù)據(jù)提供全面的安全保護(hù)。Atlas可以將企業(yè)級特性與現(xiàn)有的安全協(xié)議和合規(guī)標(biāo)準(zhǔn)相集成。此外,Atlas還可簡化數(shù)據(jù)庫的部署和管理,同時為開發(fā)者構(gòu)建彈性應(yīng)用程序提供靈活性。MongoDB有助于安全管理員輕松與外部系統(tǒng)集成,使開發(fā)者能夠?qū)W⒂跐M足業(yè)務(wù)需求。除了默認(rèn)啟用的關(guān)鍵安全特性外,MongoDB Atlas 還設(shè)計了符合企業(yè)安全要求的安全控件。這些安全控件有助于企業(yè)在MongoDB平臺上安全地構(gòu)建AI應(yīng)用程序,同時兼顧了前述注意事項,具體如下:
數(shù)據(jù)安全
MongoDB默認(rèn)啟用訪問控制和身份驗證控制功能??蛻艨梢允褂肧CRAM、X.509證書、LDAP、AWS-IAM無密碼身份驗證和OpenID Connect等機(jī)制在平臺上進(jìn)行身份驗證。MongoDB采用基于角色的訪問控制(RBAC)來決定用戶對MongoDB平臺內(nèi)各項資源的訪問權(quán)限。在構(gòu)建AI應(yīng)用程序時,數(shù)據(jù)科學(xué)家和開發(fā)者可以在訓(xùn)練或調(diào)優(yōu)AI模型的同時,使用任意一種訪問控制機(jī)制來調(diào)整用戶訪問和權(quán)限。企業(yè)可以通過部署訪問控制機(jī)制,確保僅授權(quán)人員才可訪問數(shù)據(jù)。
端到端數(shù)據(jù)加密:MongoDB的數(shù)據(jù)加密工具可在數(shù)據(jù)傳輸(網(wǎng)絡(luò))、數(shù)據(jù)靜態(tài)存儲、數(shù)據(jù)使用過程(內(nèi)存和日志)中為您的數(shù)據(jù)提供強有力的保護(hù)。客戶可以使用自動加密功能對個人身份信息(PII)、受保護(hù)的健康信息(PHI)或其他敏感數(shù)據(jù)等關(guān)鍵數(shù)據(jù)字段進(jìn)行加密,確保數(shù)據(jù)在整個生命周期內(nèi)都得到加密處理保護(hù)。除了靜態(tài)加密和傳輸加密外,MongoDB還推出了可查詢加密(Queryable Encryption)功能,可以對正在使用的數(shù)據(jù)進(jìn)行加密??刹樵兗用芄δ苁箲?yīng)用程序能夠在客戶端對敏感數(shù)據(jù)進(jìn)行加密,將加密數(shù)據(jù)存儲在MongoDB數(shù)據(jù)庫中,并在服務(wù)器端對加密數(shù)據(jù)進(jìn)行查詢,且無需對數(shù)據(jù)進(jìn)行解密操作。
可查詢加密功能是一種卓越的匿名化技術(shù),可使敏感數(shù)據(jù)變得不可見。在RAG流程中使用MongoDB數(shù)據(jù)庫存儲的包含機(jī)密信息的公司專用數(shù)據(jù)時,可以使用可查詢加密功能對這些數(shù)據(jù)進(jìn)行匿名化處理,或者在數(shù)據(jù)庫中存儲敏感數(shù)據(jù)時也可以利用這一功能。
監(jiān)管合規(guī)和數(shù)據(jù)隱私
許多生成式AI的應(yīng)用都受到數(shù)據(jù)隱私、知識產(chǎn)權(quán)和其他相關(guān)領(lǐng)域現(xiàn)行法律法規(guī)的約束。目前,全球各國正在面向AI制定和實施新的法律法規(guī)。
MongoDB開發(fā)者數(shù)據(jù)平臺對平臺安全性、隱私和合規(guī)控制進(jìn)行獨立驗證,幫助客戶達(dá)成監(jiān)管和政策目標(biāo),包括滿足高度受監(jiān)管行業(yè)和政府機(jī)構(gòu)的特定合規(guī)需求等。欲了解我們當(dāng)前的認(rèn)證和評估計劃,請參閱MongoDB Atlas Trust Center。
定期安全審計
企業(yè)應(yīng)定期開展安全審計,以發(fā)現(xiàn)數(shù)據(jù)安全實踐中的潛在漏洞。此舉有助于企業(yè)及時發(fā)現(xiàn)并解決安全漏洞。審計有助于識別和減少AI模型和數(shù)據(jù)中的風(fēng)險和錯誤,并確保企業(yè)符合法規(guī)及標(biāo)準(zhǔn)要求。MongoDB支持粒度級別的審計功能,可以追蹤數(shù)據(jù)的使用情況和具體內(nèi)容,監(jiān)控并檢測任何未經(jīng)授權(quán)的數(shù)據(jù)訪問行為。
在使用AI模型時,還有哪些其他最佳實踐和注意事項?
使用可信的數(shù)據(jù)平臺固然重要,但優(yōu)先考慮安全性和數(shù)據(jù)治理同樣重要,這一點已在前文述及。除了前文提到的數(shù)據(jù)安全、合規(guī)性和數(shù)據(jù)隱私,以下是其他一些需要注意的最佳實踐和關(guān)注事項。
·數(shù)據(jù)質(zhì)量
監(jiān)測和評估輸入數(shù)據(jù)的質(zhì)量,有助于避免基礎(chǔ)模型出現(xiàn)偏差。在訓(xùn)練模型數(shù)據(jù)時,務(wù)必確保訓(xùn)練數(shù)據(jù)在模型應(yīng)用領(lǐng)域具有代表性。如果計劃將模型應(yīng)用于真實世界場景中,那么應(yīng)對訓(xùn)練數(shù)據(jù)或RAG流程使用的數(shù)據(jù)進(jìn)行監(jiān)控。
·安全部署
使用安全加密渠道部署基礎(chǔ)模型。部署強有力的身份驗證和授權(quán)機(jī)制,以確保只有經(jīng)過授權(quán)的用戶和系統(tǒng)才能訪問敏感數(shù)據(jù)和AI模型。實施敏感信息匿名化機(jī)制來保護(hù)用戶隱私。
·審計追蹤與監(jiān)控
對模型訓(xùn)練、評估和部署活動進(jìn)行周密的審計追蹤和日志記錄。持續(xù)監(jiān)控數(shù)據(jù)輸入和模型輸出,以便及時發(fā)現(xiàn)意外情況或偏差。
MongoDB會保留所有數(shù)據(jù)操作和數(shù)據(jù)處理的審計追蹤與日志記錄??蛻艨梢曰谶@些審計日志執(zhí)行監(jiān)控、故障排除和安全保障工作,包括入侵檢測。我們采用自動掃描、自動預(yù)警和人工審核相結(jié)合的方法對數(shù)據(jù)進(jìn)行監(jiān)控。
·數(shù)據(jù)存儲安全
遵循最佳實踐來安全地存儲原始數(shù)據(jù)和處理后的數(shù)據(jù)。如上所述,使用加密功能對靜態(tài)數(shù)據(jù)和傳輸數(shù)據(jù)進(jìn)行加密處理。
MongoDB服務(wù)器會自動啟用靜態(tài)數(shù)據(jù)加密功能。加密操作在存儲層以透明的方式進(jìn)行;這意味著文件系統(tǒng)中的所有數(shù)據(jù)文件都會被完全加密,只有在內(nèi)存中和傳輸過程中數(shù)據(jù)才會以未加密的形式存在。
總結(jié)
隨著生成式AI工具的廣泛應(yīng)用,企業(yè)對數(shù)據(jù)的理解、保護(hù)和使用(定義與數(shù)據(jù)交互的角色、控制、流程和策略)變得比以往任何時候都更加重要。隨著現(xiàn)代企業(yè)越來越多地采用生成式AI和LLM模型來更好地服務(wù)客戶并獲取更多數(shù)據(jù)洞察,強有力的數(shù)據(jù)治理變得不可或缺。只有了解潛在風(fēng)險,并對數(shù)據(jù)托管平臺的能力進(jìn)行審慎評估,企業(yè)才能安全無虞地發(fā)揮這些工具的強大功能。
相關(guān)文章
- 通過獨特的可查詢加密技術(shù),MongoDB為數(shù)據(jù)安全提供覆蓋全生命周期的保護(hù)
- 利用MongoDB進(jìn)行數(shù)據(jù)治理,防范構(gòu)建生成式AI應(yīng)用程序時的潛在安全風(fēng)險
- 多云應(yīng)用安全平臺RegData利用MongoDB簡化數(shù)據(jù)控制和合規(guī)流程
- Questflow借助MongoDB Atlas以AI重新定義未來工作方式
- MongoDB為提供MongoDB數(shù)據(jù)庫服務(wù)的云服務(wù)合作伙伴推出認(rèn)證計劃
- MongoDB Atlas Vector Search與Amazon Bedrock集成已全面可用
- MongoDB觀點:讓生成式AI成為業(yè)務(wù)增長的新動能,游戲公司可以這樣做
- 使用MongoDB 構(gòu)建AI:輕松應(yīng)對從預(yù)測式AI到生成式AI
- 構(gòu)建AI服務(wù)的秘密武器:MongoDB Atlas,4家企業(yè)案例為您揭曉
- MongoDB推出Atlas Stream Processing公共預(yù)覽版
- MongoDB助力西門子數(shù)字化工廠構(gòu)建下一代制造執(zhí)行系統(tǒng)
- MongoDB和阿里云攜手驅(qū)動WeLab,引領(lǐng)超千萬用戶邁向智能金融未來
- 阿里云數(shù)據(jù)庫MongoDB版助力吉比特《一念逍遙》游戲斬獲千萬玩家,運營效率成倍增長
- MongoDB與阿里云建立全新合作伙伴關(guān)系
人工智能企業(yè)
更多>>人工智能硬件
更多>>- 從心出發(fā),新品與新技術(shù)雙重進(jìn)化,技嘉2025線下產(chǎn)品發(fā)布會強勢來襲
- 當(dāng)“銀發(fā)”遇見“智眼”——神眸亮相2025深圳智慧養(yǎng)老展
- 訊飛同傳助力亞布力夏季年會,打破語言壁壘促全球?qū)υ?/a>
- 低空賦能,跨越山河,大疆運載無人機(jī)的甘孜答卷
- 預(yù)制菜又吵起來了?優(yōu)特智廚炒菜機(jī)新品發(fā)布會掀起中餐“現(xiàn)炒”熱潮
- 場景化落地部署人形機(jī)器人將超2000臺,眾擎機(jī)器人與多倫科技達(dá)成戰(zhàn)略合作
- 275W極限性能+第二代乾坤散熱!拯救者R9000P 2025至尊版成就電競創(chuàng)作雙巔峰
- 百年聲學(xué)品牌再創(chuàng)新!拜雅新品AMIRON 200 & AMIRON ZERO定義開放聆聽新方式
人工智能產(chǎn)業(yè)
更多>>- 人機(jī)共生 · 智啟未來——2025高交會亞洲人工智能與機(jī)器人產(chǎn)業(yè)鏈展主題發(fā)布
- 北京數(shù)基建發(fā)布“知行IntAct”混合智能體產(chǎn)品,以AI定義城市治理新范式
- 新時達(dá)“精耕小腦”,與大腦協(xié)同,加速具身智能垂直落地
- 亞洲愿景論壇 東軟蓋龍佳談AI與數(shù)據(jù)價值化重構(gòu)醫(yī)療未來
- 破解AI落地難題!北大這場特訓(xùn)營,為企業(yè)找到轉(zhuǎn)型“最優(yōu)解”
- 腦神經(jīng)成像提速數(shù)倍、AI練就“遺忘術(shù)”!2025螞蟻InTech獎頒發(fā)
- 一句話生成圖表!天禧智能體接入ChatExcel MCP Server讓數(shù)據(jù)處理變得如此簡單
- 外灘大會重磅發(fā)布:螞蟻百寶箱Tbox超級智能體亮相,實現(xiàn)分鐘級專業(yè)軟件交付
人工智能技術(shù)
更多>>- 外灘大會首發(fā)! 螞蟻密算推出AI密態(tài)升級卡 實現(xiàn)零改動“即插即用”
- 騰訊優(yōu)圖攜Youtu-Agent開源項目亮相上海創(chuàng)智學(xué)院首屆TechFest大會
- 2025外灘大會:王堅暢談AI變革,普天科技錨定空天算力新賽道
- 騰訊正式開源Youtu-GraphRAG,圖檢索增強技術(shù)迎來落地新突破
- 聲網(wǎng)兄弟公司 Agora與OpenAI 攜手 助力多模態(tài) AI 智能體實現(xiàn)實時交互
- Qwen-Image-Edit 模型上線基石智算,圖像編輯更精準(zhǔn)
- 火山引擎多模態(tài)數(shù)據(jù)湖落地深勢科技,提升科研數(shù)據(jù)處理效能
- 斑馬AI大模型:為每個孩子提供專屬學(xué)習(xí)方案