數(shù)據(jù)中心測點(diǎn)高達(dá)千萬級,騰訊云數(shù)據(jù)中心運(yùn)營進(jìn)入自動化時代
2022-08-13 08:44:40AI云資訊1080
隨著數(shù)據(jù)中心規(guī)模的快速擴(kuò)張,如何提升運(yùn)維效率成為行業(yè)共同關(guān)注。
8月11日,在CDCC第三屆數(shù)據(jù)中心綠色能源大會上,騰訊云公布了自身數(shù)據(jù)中心智能化運(yùn)維的系列落地技術(shù),并分享相關(guān)實(shí)踐。
作為國內(nèi)頭部的云計算廠商,騰訊云運(yùn)營著一百多萬臺服務(wù)器。面對千萬級的測點(diǎn)及千億級的日均消息量,基于數(shù)據(jù)中心自動化運(yùn)營的管理平臺“騰訊智維”,大規(guī)模落地基于AI、數(shù)字孿生等技術(shù),騰訊云數(shù)據(jù)中心顯著提升了運(yùn)營效率。
數(shù)據(jù)算法加持 走向“預(yù)測性維護(hù)”
目前,騰訊云已在數(shù)據(jù)中心規(guī)?;瘧?yīng)用AI和軟件機(jī)器人等技術(shù),基于數(shù)字孿生的智能化建模、基于數(shù)倉的數(shù)據(jù)治理等手段,實(shí)現(xiàn)數(shù)據(jù)和算法驅(qū)動的預(yù)測性維護(hù)、智能化告警。
“騰訊智維平臺基于圖模一體化推進(jìn)事前(風(fēng)險識別和預(yù)警)、事中(告警收斂和影響分析)、事后(事件回顧和設(shè)計優(yōu)化)管理,利用兩張圖(電力單線圖和暖通組態(tài)圖)融合物模型、實(shí)時數(shù)據(jù)、系統(tǒng)拓?fù)鋵?shí)現(xiàn)數(shù)據(jù)治理、容量管理、圖形可視化和仿真模擬,從系統(tǒng)角度實(shí)現(xiàn)自動化和智能化運(yùn)維?!彬v訊云數(shù)據(jù)中心相關(guān)負(fù)責(zé)人表示。
風(fēng)險識別和預(yù)警層面,AI 智能化技術(shù)已得到廣泛應(yīng)用。例如,騰訊云數(shù)據(jù)中心通過電池檢測模型,能實(shí)現(xiàn)對電池故障、壽命和容量的預(yù)測,提前14天發(fā)現(xiàn)隱患電池,在確??煽啃缘耐瑫r延長電池使用周期;基于震動/聲音/溫度/電流的頻譜分析和機(jī)器學(xué)習(xí),騰訊云數(shù)據(jù)中心能對電機(jī)和水泵進(jìn)行預(yù)警分析和故障診斷,例如底座不平衡、松動、匝間絕緣等,可提前預(yù)警和更換,避免宕機(jī)事故。
告警收斂和影響分析層面,在監(jiān)控事件、告警運(yùn)營和輔助決策等智能平臺的支持下,騰訊云數(shù)據(jù)中心的告警準(zhǔn)確率已達(dá)98%,重大運(yùn)營風(fēng)險主動監(jiān)控率和事件處理效率達(dá)99%以上,此外,“運(yùn)營吹哨人”機(jī)制可實(shí)現(xiàn)一分鐘內(nèi)同步告警的影響范圍。
同時,通過提升告警收斂技術(shù),騰訊云將能把99%的非高危風(fēng)險工單進(jìn)行準(zhǔn)確收斂和自動派單,極大降低運(yùn)維人員的心智負(fù)擔(dān),將重心轉(zhuǎn)移到故障分析、整改措施跟進(jìn)等工作中。
“未來,運(yùn)營人員軟技能的提升是數(shù)據(jù)中心運(yùn)營質(zhì)量的重要保證”,相關(guān)負(fù)責(zé)人表示。目前,騰訊云數(shù)據(jù)中心運(yùn)營團(tuán)隊(duì)正從“數(shù)據(jù)中心運(yùn)維工程師”向“基礎(chǔ)設(shè)施可靠性工程師(FRE)”轉(zhuǎn)型,不僅具備產(chǎn)品設(shè)計、數(shù)據(jù)分析和低代碼等技能,還能依托系統(tǒng)平臺和低碼平臺進(jìn)行管理,助力數(shù)據(jù)中心的運(yùn)維工作更加安全、智能和高效。
此外,面對千萬級的基礎(chǔ)設(shè)施測點(diǎn)規(guī)模,騰訊云通過AI實(shí)現(xiàn)了PUE自動調(diào)優(yōu)。能夠在沒有人力投入的情況下,每天自動完成對大規(guī)模集群的精準(zhǔn)調(diào)節(jié)。以南方某1000個機(jī)架的模組為例,每年節(jié)約電費(fèi)超過100萬。在具備冷源優(yōu)化條件的數(shù)據(jù)中心,騰訊云還在構(gòu)建風(fēng)冷系統(tǒng)的AI模型。
基于海量的經(jīng)驗(yàn)積累,通過將AI技術(shù)從標(biāo)桿項(xiàng)目推向全模組覆蓋,騰訊云數(shù)據(jù)中心將能基于更廣闊的場景和數(shù)據(jù),建立可長期演進(jìn)的數(shù)據(jù)中心可靠性模型。
建立物模型體系 推動行業(yè)標(biāo)準(zhǔn)建設(shè)
基于長期的運(yùn)營經(jīng)驗(yàn)積累,騰訊云數(shù)據(jù)中心正在將自身經(jīng)驗(yàn)輸出給行業(yè),并推動建立標(biāo)準(zhǔn)。
本次大會上,騰訊云數(shù)據(jù)中心發(fā)布了“達(dá)爾文物模型開放聯(lián)盟站點(diǎn)”。所謂“物模型”,指的是將數(shù)據(jù)中心型號繁多的設(shè)備進(jìn)行抽象歸納,形成行業(yè)標(biāo)準(zhǔn)。建立物模型體系,不僅能通過即插即用顯著減少接入工作量、實(shí)現(xiàn)規(guī)模效應(yīng),還能打通告警、變更等關(guān)鍵業(yè)務(wù)場景,拉通端、邊、云的整體鏈條。
“只有整個行業(yè)去推動標(biāo)準(zhǔn),才能實(shí)現(xiàn)真正的即插即用,減少現(xiàn)場監(jiān)控系統(tǒng)調(diào)試,做到成本的最優(yōu)解?!彬v訊云相關(guān)負(fù)責(zé)人表示,希望與物模型廠商合作,共同建立標(biāo)準(zhǔn),最大限度優(yōu)化部署成本和質(zhì)量。
據(jù)了解,騰訊云數(shù)據(jù)中心建立的物模型標(biāo)準(zhǔn),包含 IOT 物聯(lián)模型和DC業(yè)務(wù)模型,沉淀騰訊十多年海量運(yùn)營之道、安全策略和最佳實(shí)踐,將設(shè)備驅(qū)動、機(jī)理模型、數(shù)據(jù)治理、告警策略、控制規(guī)則、業(yè)務(wù)管理、大數(shù)據(jù)分析、AI 策略融合在一起,是實(shí)現(xiàn)系統(tǒng)高度自動化的必要條件。
值得注意的是,通過與設(shè)備廠商加強(qiáng)統(tǒng)一協(xié)議和標(biāo)準(zhǔn)化模板建設(shè),并自研新北向和智能傳感網(wǎng)絡(luò),騰訊云數(shù)據(jù)中心的多項(xiàng)性能得到提升。例如,監(jiān)控數(shù)據(jù)性能已從分鐘級提升至10秒,未來有望進(jìn)一步提升至1秒。
此外,騰訊云數(shù)據(jù)中心已經(jīng)在間接蒸發(fā)AHU上進(jìn)行了深度定制化嘗試,未來,還將在更多的數(shù)據(jù)中心基礎(chǔ)設(shè)施產(chǎn)品上持續(xù)投入,通過更精細(xì)化的產(chǎn)品定制,推動數(shù)據(jù)中心基礎(chǔ)設(shè)施向模塊化、標(biāo)準(zhǔn)化、簡單、高效方向發(fā)展。
在快速和海量集中自動運(yùn)營的的需求下,數(shù)據(jù)中心全鏈路正走向開放和快速創(chuàng)新。未來,騰訊云將與合作伙伴共同推動自動化運(yùn)營的更多探索,實(shí)現(xiàn)數(shù)據(jù)中心的精耕細(xì)作、智能運(yùn)營。
相關(guān)文章
- 海辰儲能AIDC儲能解決方案亮相RE+ 2025,以長時儲能賦能AI數(shù)據(jù)中心綠色轉(zhuǎn)型
- 容量可達(dá)245.76TB,鎧俠企業(yè)級與數(shù)據(jù)中心級SSD迎來全面升級
- 【9月ISSE國際智慧空間展】數(shù)據(jù)中心篇:數(shù)字基座 助力數(shù)字貿(mào)易生態(tài)
- 從電力保障到AI未來:科士達(dá)為馬來西亞國家級AI數(shù)據(jù)中心提供核心動力支持
- 元脈網(wǎng)絡(luò)發(fā)布AIDC解決方案 賦能AI時代數(shù)據(jù)中心建設(shè)
- 聚焦液冷痛點(diǎn):英特爾UQD互換性認(rèn)證助力數(shù)據(jù)中心高效發(fā)展
- 共鑄高質(zhì)量 智贏高價值 | 國家衛(wèi)星氣象中心風(fēng)云三號數(shù)據(jù)中心樣板點(diǎn)正式發(fā)布
- 神雲(yún)科技首次以全新品牌亮相WAIC 2025,展示AI計算與綠色數(shù)據(jù)中心創(chuàng)新方案
- 創(chuàng)新突破,以浸沒式技術(shù)重塑數(shù)據(jù)中心鋰電池本質(zhì)安全
- NO.3!科華數(shù)據(jù)微模塊數(shù)據(jù)中心位列全球第三
- 億達(dá)科創(chuàng)自研節(jié)能測試仿真解決方案,賦能數(shù)據(jù)中心綠色轉(zhuǎn)型
- 為數(shù)智化而生,華為商業(yè)市場極簡全閃數(shù)據(jù)中心Pro+引領(lǐng)全閃走向普惠
- 極簡全閃數(shù)據(jù)中心“再進(jìn)化”,華為賦予“閃存普惠”深層意義
- 華為發(fā)布極簡全閃數(shù)據(jù)中心 Pro+,引領(lǐng)商業(yè)市場數(shù)智化轉(zhuǎn)型新征程
- 閃存普惠,一步到位 | 華為商業(yè)市場極簡全閃數(shù)據(jù)中心Pro+重磅發(fā)布
- 數(shù)智加速 華為極簡全閃數(shù)據(jù)中心Pro+暨新品發(fā)布會即將舉行
人工智能企業(yè)
更多>>人工智能硬件
更多>>- 從心出發(fā),新品與新技術(shù)雙重進(jìn)化,技嘉2025線下產(chǎn)品發(fā)布會強(qiáng)勢來襲
- 當(dāng)“銀發(fā)”遇見“智眼”——神眸亮相2025深圳智慧養(yǎng)老展
- 訊飛同傳助力亞布力夏季年會,打破語言壁壘促全球?qū)υ?/a>
- 低空賦能,跨越山河,大疆運(yùn)載無人機(jī)的甘孜答卷
- 預(yù)制菜又吵起來了?優(yōu)特智廚炒菜機(jī)新品發(fā)布會掀起中餐“現(xiàn)炒”熱潮
- 場景化落地部署人形機(jī)器人將超2000臺,眾擎機(jī)器人與多倫科技達(dá)成戰(zhàn)略合作
- 275W極限性能+第二代乾坤散熱!拯救者R9000P 2025至尊版成就電競創(chuàng)作雙巔峰
- 百年聲學(xué)品牌再創(chuàng)新!拜雅新品AMIRON 200 & AMIRON ZERO定義開放聆聽新方式
人工智能產(chǎn)業(yè)
更多>>- 人機(jī)共生 · 智啟未來——2025高交會亞洲人工智能與機(jī)器人產(chǎn)業(yè)鏈展主題發(fā)布
- 北京數(shù)基建發(fā)布“知行IntAct”混合智能體產(chǎn)品,以AI定義城市治理新范式
- 新時達(dá)“精耕小腦”,與大腦協(xié)同,加速具身智能垂直落地
- 亞洲愿景論壇 東軟蓋龍佳談AI與數(shù)據(jù)價值化重構(gòu)醫(yī)療未來
- 破解AI落地難題!北大這場特訓(xùn)營,為企業(yè)找到轉(zhuǎn)型“最優(yōu)解”
- 腦神經(jīng)成像提速數(shù)倍、AI練就“遺忘術(shù)”!2025螞蟻InTech獎頒發(fā)
- 一句話生成圖表!天禧智能體接入ChatExcel MCP Server讓數(shù)據(jù)處理變得如此簡單
- 外灘大會重磅發(fā)布:螞蟻百寶箱Tbox超級智能體亮相,實(shí)現(xiàn)分鐘級專業(yè)軟件交付
人工智能技術(shù)
更多>>- 外灘大會首發(fā)! 螞蟻密算推出AI密態(tài)升級卡 實(shí)現(xiàn)零改動“即插即用”
- 騰訊優(yōu)圖攜Youtu-Agent開源項(xiàng)目亮相上海創(chuàng)智學(xué)院首屆TechFest大會
- 2025外灘大會:王堅(jiān)暢談AI變革,普天科技錨定空天算力新賽道
- 騰訊正式開源Youtu-GraphRAG,圖檢索增強(qiáng)技術(shù)迎來落地新突破
- 聲網(wǎng)兄弟公司 Agora與OpenAI 攜手 助力多模態(tài) AI 智能體實(shí)現(xiàn)實(shí)時交互
- Qwen-Image-Edit 模型上線基石智算,圖像編輯更精準(zhǔn)
- 火山引擎多模態(tài)數(shù)據(jù)湖落地深勢科技,提升科研數(shù)據(jù)處理效能
- 斑馬AI大模型:為每個孩子提供專屬學(xué)習(xí)方案