百分點(diǎn)科技:公眾環(huán)境滿意度與環(huán)境質(zhì)量的關(guān)聯(lián)分析研究
2021-12-03 10:26:44AI云資訊860
針對當(dāng)前公眾環(huán)境滿意度與環(huán)境質(zhì)量的關(guān)聯(lián)分析需求,百分點(diǎn)數(shù)據(jù)科學(xué)實(shí)驗(yàn)室基于機(jī)器學(xué)習(xí)、文本分析等建模技術(shù),從環(huán)境質(zhì)量公眾感受評價(jià)、敏感變化關(guān)聯(lián)分析、生態(tài)環(huán)境質(zhì)量改善成效評估三個(gè)角度進(jìn)行了深入分析,為加強(qiáng)生態(tài)環(huán)境公眾參與、提高生態(tài)環(huán)境管理決策能力提供技術(shù)支撐。
一、項(xiàng)目背景
近年來,環(huán)境污染事件對社會經(jīng)濟(jì)可持續(xù)發(fā)展和公眾個(gè)人的生活產(chǎn)生的影響一直存在,而公眾的環(huán)境意識也在不斷提升。生態(tài)環(huán)境保護(hù)既需要政府治理,也需要公眾參與,從公眾實(shí)際感受和反饋中提取意見有助于改進(jìn)和提高環(huán)境治理能力。
目前,環(huán)保部門僅通過環(huán)境監(jiān)測設(shè)備對能夠影響環(huán)境質(zhì)量的一些因素進(jìn)行測定,利用得到的具體數(shù)值,來評價(jià)環(huán)境質(zhì)量(或污染程度) 及其變化的趨勢,缺少了公眾參與。
為提升生態(tài)環(huán)境保護(hù)公眾參與程度,提高生態(tài)環(huán)境管理決策能力,重點(diǎn)關(guān)注生態(tài)環(huán)境質(zhì)量與公眾感受“兩張皮”現(xiàn)象,2021年5月,百分點(diǎn)科技通過環(huán)境質(zhì)量監(jiān)測大數(shù)據(jù),結(jié)合在線問卷調(diào)查及互聯(lián)網(wǎng)輿情數(shù)據(jù),形成大小數(shù)據(jù)融合,分析公眾環(huán)境空氣質(zhì)量滿意度、改善成效、政府治理措施等情況,為加強(qiáng)生態(tài)環(huán)境公眾參與、提高生態(tài)環(huán)境管理決策能力提供技術(shù)支撐。
二、解決方案
1. 模型數(shù)據(jù)
(1)生態(tài)環(huán)境監(jiān)測數(shù)據(jù)
中國環(huán)境監(jiān)測總站(以下簡稱總站)提供的2020-2021年至今環(huán)境空氣質(zhì)量監(jiān)測數(shù)據(jù),監(jiān)測指標(biāo)包括PM2.5、PM10、SO2、NO2、CO、O3等,共5000+個(gè)環(huán)境空氣質(zhì)量監(jiān)測站點(diǎn)。
(2)在線問卷調(diào)查數(shù)據(jù)
樣本來自全國400萬在線調(diào)研樣本庫隨機(jī)抽樣,面向全國339個(gè)地級以上城市,問卷調(diào)查結(jié)果共收集31個(gè)省的317個(gè)城市10,500個(gè)樣本,在對象選取上考慮了年齡性別、教育水平、行業(yè)職業(yè)等因素,盡量保證受訪對象的隨機(jī)性、均勻性。
(3)網(wǎng)絡(luò)輿情數(shù)據(jù)
本次研究選取2021年5月的網(wǎng)絡(luò)輿情數(shù)據(jù),包括各地生態(tài)環(huán)境主管部門官網(wǎng)、中國環(huán)境報(bào)、中國環(huán)境新聞網(wǎng)和微博等主流媒體網(wǎng)站數(shù)據(jù)。研究重點(diǎn)覆蓋26個(gè)關(guān)鍵詞,包括7個(gè)空氣相關(guān)關(guān)鍵詞、8個(gè)水相關(guān)關(guān)鍵詞、7個(gè)改善措施相關(guān)關(guān)鍵詞和4個(gè)其他關(guān)鍵詞,涉及微博1,309,188條、相關(guān)新聞網(wǎng)站15,026條數(shù)據(jù)。
2. 模型選擇
通過環(huán)境監(jiān)測數(shù)據(jù)與在線問卷調(diào)查數(shù)據(jù)、主流媒體相關(guān)輿情數(shù)據(jù)進(jìn)行對比分析,利用文本分析技術(shù)分析挖掘公眾感受與環(huán)境空氣質(zhì)量監(jiān)測結(jié)果存在偏差的原因,分析公眾不同時(shí)期對環(huán)保關(guān)注的重點(diǎn)、環(huán)境關(guān)注的熱詞、環(huán)境狀況的情感。
文本分析是指對文本的表示及其特征項(xiàng)的選取,它把從文本中抽取出的特征詞進(jìn)行量化來表示文本信息,文本分類的流程:文本預(yù)處理、特征提取、文本表示和分類器。
文本預(yù)處理:
(1)分詞
分詞就是將連續(xù)的字序列按照一定的規(guī)范重新組合成詞序列的過程。
“結(jié)巴”(jieba)分詞是Python語言的一個(gè)中文分詞包,它有如下三種模式:精確模式,試圖將句子最精確地切開,適合文本分析;全模式,把句子中所有的可以成詞的詞語都掃描出來, 速度非???但是不能解決歧義;搜索引擎模式,在精確模式的基礎(chǔ)上,對長詞再次切分,提高召回率,適合用于搜索引擎分詞。
LTP是哈工大開源的一套中文語言處理系統(tǒng),提供包括中文分詞、詞性標(biāo)注、命名實(shí)體識別、依存句法分析、語義角色標(biāo)注等豐富、高效、精準(zhǔn)的自然語言處理技術(shù)。LTP 已經(jīng)成為國內(nèi)外最具影響力的中文處理基礎(chǔ)平臺。
(2)去除停用詞
停用詞是指在信息檢索中,為節(jié)省存儲空間和提高搜索效率,在處理自然語言數(shù)據(jù)(或文本)之前或之后會自動(dòng)過濾掉某些字或詞,這些字或詞即被稱為停用詞。停用詞主要包括一些副詞、形容詞及其一些連接詞。通過維護(hù)一個(gè)停用詞表,實(shí)際上是一個(gè)特征提取的過程,本質(zhì)上是特征選擇的一部分。
特征提取:
a. 詞袋模型
建立一個(gè)詞典庫,該詞典庫包含訓(xùn)練語料庫的所有詞語,每個(gè)詞語對應(yīng)一個(gè)唯一識別的編號,利用One-Hot文本表示。文檔的詞向量維度與單詞向量的維度相同,每個(gè)位置的值是對應(yīng)位置詞語在文檔中出現(xiàn)的次數(shù),即詞袋模型。通過Scikit-learn的CountVectorizer類來完成,這個(gè)類可以幫我們完成文本的詞頻統(tǒng)計(jì)與向量化。
CountVectorizer特征提取
b. TF-IDF文本特征提取
利用TF和IDF兩個(gè)參數(shù)來表示詞語在文本中的重要程度。TF指的是一個(gè)詞語在一個(gè)文檔中出現(xiàn)的頻率,一般情況下,每一個(gè)文檔中出現(xiàn)的詞語的次數(shù)越多詞語的重要性更大,IDF是體現(xiàn)詞語在文檔間的重要性。即如果某個(gè)詞語出現(xiàn)在極少數(shù)的文檔中,說明該詞語對于文檔的區(qū)別性強(qiáng),對應(yīng)的特征值高,IDF值高。
當(dāng)計(jì)算出TF和IDF值后,兩數(shù)相乘即為TF-IDF:某詞的TF-IDF值越高,說明其在這篇文章中的重要性越高,越有可能是文章的關(guān)鍵詞。
TF-IDF文本特征提取
(3)建模分析
利用先構(gòu)建好的情感詞典,對預(yù)處理好的文本進(jìn)行字符串匹配,從而挖掘正面和負(fù)面信息。情感詞典包含正面詞語詞典、負(fù)面詞語詞典、否定詞語詞典、程度副詞詞典等四部分。情感詞典在整個(gè)情感分析中至關(guān)重要,所幸現(xiàn)在有很多開源的情感詞典,如BosonNLP情感詞典,它是基于微博、新聞、論壇等數(shù)據(jù)來源構(gòu)建的情感詞典,以及知網(wǎng)情感詞典等。
逐個(gè)遍歷分詞后的語句中的詞語,如果詞語命中詞典,則進(jìn)行相應(yīng)權(quán)重的處理。正面詞權(quán)重為加法,負(fù)面詞權(quán)重為減法,否定詞權(quán)重取相反數(shù),程度副詞權(quán)重則和它修飾的詞語權(quán)重相乘。利用最終輸出的權(quán)重值,就可以區(qū)分是正面、負(fù)面還是中性情感了。
基于情感詞典的文本分類
三、分析思路
1. 公眾環(huán)境質(zhì)量滿意度評價(jià)
運(yùn)用在線問卷調(diào)查結(jié)果,構(gòu)建公眾環(huán)境質(zhì)量滿意度評價(jià)體系,以空氣為重點(diǎn)、以城市為單位,分析公眾對于目前環(huán)境質(zhì)量滿意度情況,并與環(huán)境質(zhì)量狀況進(jìn)行對比分析。
2. 敏感變化關(guān)聯(lián)分析
利用各城市環(huán)境監(jiān)測數(shù)據(jù),分析環(huán)境監(jiān)測數(shù)據(jù)驟升/驟降的開始時(shí)間、維持天數(shù)及平均變化值,并利用在線問卷調(diào)查數(shù)據(jù)和主流媒體相關(guān)輿情數(shù)據(jù)進(jìn)行關(guān)聯(lián)分析,通過挖掘監(jiān)測數(shù)據(jù)和公眾感受存在顯著偏差的現(xiàn)象,研判各城市敏感變化的原因。
3. 輿情分析
運(yùn)用在線問卷調(diào)查結(jié)果和政府官網(wǎng)、主流媒體相關(guān)輿情信息,以空氣為重點(diǎn)、以城市為單位,分析公眾環(huán)保關(guān)注的重點(diǎn)領(lǐng)域,通過輿情數(shù)據(jù)收集環(huán)境不滿意的原因,提出針對性的改善建議。
四、成果展示
1. 社會公眾感受評價(jià)總體概覽
在本次全國范圍公眾滿意度調(diào)查問卷中,近九成受訪者對環(huán)境空氣質(zhì)量感到滿意。通過區(qū)域及省市層面對比發(fā)現(xiàn),公眾感受與環(huán)境監(jiān)測結(jié)果基本保持一致。
2. 敏感變化分析
針對各地市AQI敏感變化,將該區(qū)域群眾的反饋信息及網(wǎng)絡(luò)輿情信息進(jìn)行關(guān)聯(lián),就可以分析敏感變化原因。比如,對全國339個(gè)城市當(dāng)月AQI進(jìn)行分析,采集來自中國環(huán)境報(bào)、中國環(huán)境新聞網(wǎng)、微博的新聞,篩選出有關(guān)生態(tài)環(huán)境的新聞,并對應(yīng)上述AQI驟升的城市,就可以從新聞報(bào)道中發(fā)現(xiàn)部分地區(qū)AQI敏感變化的原因與影響公眾感受的霧霾,沙塵有關(guān)。
3. 輿情分析助力政府環(huán)保措施完善
選取各地生態(tài)環(huán)境主管部門官網(wǎng)及中國環(huán)境報(bào)、中國環(huán)境新聞網(wǎng)、微博等主流媒體網(wǎng)站,采集了與環(huán)保相關(guān)數(shù)據(jù),對數(shù)據(jù)進(jìn)行處理分析后從中得到的主要關(guān)鍵詞云如下:
輿情采集關(guān)鍵詞的詞云圖
從上圖可以看出,當(dāng)月公眾對環(huán)保比較關(guān)注的點(diǎn)為:霧霾、沙塵、惡臭、噪聲、水污染等。生態(tài)環(huán)境主管部門可從公眾關(guān)注的方向入手,解決環(huán)保工作中較為突出的問題,由此來提高公眾的環(huán)保滿意度。
案例分析
空氣質(zhì)量:A市5月份AQI在全國339個(gè)城市中排名305位,盡管排名靠后,但是和3月相比,在全國改善排名中上升至第13位,空氣質(zhì)量有較為突出的改善。
滿意度得到提升:A市5月份公眾環(huán)境空氣質(zhì)量滿意度77.8分,全國排名285名,3月份滿意度76.6分,全國排名310名,5月比3月提升1.2分,上升25名。
新聞輿情:5月份A市生態(tài)環(huán)境局對市各區(qū)揚(yáng)塵污染問題進(jìn)行檢查,并對12起典型揚(yáng)塵問題予以公開曝光。
五、研究和現(xiàn)實(shí)意義
近些年政府環(huán)保投入和治理力度不斷增強(qiáng),生態(tài)環(huán)境改善取得了明顯成效。然而政府環(huán)保監(jiān)測數(shù)據(jù)不足以全面反映環(huán)境質(zhì)量問題,需通過問卷、輿情數(shù)據(jù)挖掘監(jiān)測數(shù)據(jù)無法體現(xiàn)的問題。
與此同時(shí),問卷及輿情數(shù)據(jù)也包含公眾對當(dāng)?shù)卣h(huán)境治理成果的評價(jià),充分利用好問卷及輿情數(shù)據(jù)去了解公眾對環(huán)境的滿意度,能夠更好地捕捉他們的感受、需求、期待。
從公眾的角度反映環(huán)保工作的重點(diǎn)和難點(diǎn),以及主要影響因素,為環(huán)境監(jiān)測工作提供數(shù)據(jù)支撐、為生態(tài)文明建設(shè)提供決策依據(jù),具有重要的理論和現(xiàn)實(shí)意義。
六、未來研究方向
未來可以通過融合企業(yè)用電數(shù)據(jù)、污染源數(shù)據(jù)、交通數(shù)據(jù)等更多維度的數(shù)據(jù),進(jìn)一步提升環(huán)境治理水平、改善環(huán)境質(zhì)量、提高公眾滿意度。
(1)建立常態(tài)化環(huán)境與輿情關(guān)聯(lián)機(jī)制
探索建立業(yè)務(wù)化機(jī)制,及時(shí)發(fā)現(xiàn)環(huán)境治理工作落實(shí)滯后、治理效果不到位等問題,并發(fā)出預(yù)警信號;直觀體現(xiàn)地方環(huán)境治理工作成效,并進(jìn)一步加強(qiáng)環(huán)境治理經(jīng)驗(yàn)宣傳和推廣。建立生態(tài)環(huán)境質(zhì)量公眾滿意調(diào)查問卷定期更新機(jī)制,圍繞生態(tài)環(huán)境重大政策行動(dòng)設(shè)置專題,堅(jiān)持小切口,不搞大而全,切實(shí)反映環(huán)境管理關(guān)心的問題與信息。
(2)建立環(huán)境質(zhì)量輿情應(yīng)對機(jī)制
加強(qiáng)環(huán)保政策的正面宣傳和公眾輿情的正面引導(dǎo)。收集公眾意見反饋、個(gè)人訴求等,定期總結(jié)、及時(shí)反應(yīng),提高政府服務(wù)質(zhì)量。當(dāng)產(chǎn)生階段性環(huán)境治理成果等正面輿情時(shí),及時(shí)展開環(huán)保政策宣傳、科普活動(dòng);當(dāng)發(fā)現(xiàn)公眾感受與環(huán)境質(zhì)量出現(xiàn)長期異常偏離的現(xiàn)象,將開展專項(xiàng)調(diào)查,及時(shí)查找問題,避免對政府形象造成負(fù)面影響。
相關(guān)文章
- 費(fèi)率再降0.3個(gè)百分點(diǎn)!海爾智家:持續(xù)轉(zhuǎn)型,持續(xù)見效
- 海爾智家三季報(bào)費(fèi)率優(yōu)化0.3個(gè)百分點(diǎn)
- 百分點(diǎn)科技在共建“一帶一路”中的實(shí)踐
- 百分點(diǎn)科技&IDC聯(lián)合發(fā)布數(shù)據(jù)科學(xué)基礎(chǔ)平臺白皮書
- 聚焦數(shù)智化轉(zhuǎn)型 百分點(diǎn)科技2023數(shù)據(jù)科學(xué)峰會即將舉辦
- 百分點(diǎn)科技聯(lián)合召開《中國應(yīng)急管理發(fā)展報(bào)告(2022)》新書發(fā)布會
- 百分點(diǎn)科技榮獲“上合國家軟件產(chǎn)業(yè)國際合作優(yōu)秀案例獎(jiǎng)”
- 百分點(diǎn)科技數(shù)據(jù)科學(xué)產(chǎn)教融合計(jì)劃繼續(xù)擴(kuò)大招募
- IDC發(fā)布中國智慧應(yīng)急報(bào)告 大數(shù)據(jù)與人工智能市場百分點(diǎn)科技第二
- 2022年消費(fèi)維權(quán)重點(diǎn)曝光行業(yè)有哪些 百分點(diǎn)科技聯(lián)合數(shù)據(jù)猿發(fā)布預(yù)測報(bào)告
- 百分點(diǎn)科技:基于計(jì)算機(jī)視覺的語義分割技術(shù)如何在水域監(jiān)控上發(fā)揮作用
- 8個(gè)月大增6.9個(gè)百分點(diǎn),榮耀筆記本成2021中國輕薄本市場增速最快品牌
- 領(lǐng)先當(dāng)前國際最優(yōu)水平10.2個(gè)絕對百分點(diǎn) 這家企業(yè)再獲“中國智能科學(xué)技術(shù)最高獎(jiǎng)”
- 百分點(diǎn)感知智能實(shí)驗(yàn)室:計(jì)算機(jī)視覺理論和應(yīng)用研究
- 百分點(diǎn)科技:聲紋識別技術(shù)發(fā)展及未來趨勢研究
- 百分點(diǎn)科技:基于NL2SQL的問答技術(shù)與實(shí)踐
人工智能企業(yè)
更多>>人工智能硬件
更多>>- 神眸榮獲快手“品牌標(biāo)桿獎(jiǎng)”,以芯片級創(chuàng)新躋身行業(yè)前列
- AMD 推出 EPYC? 嵌入式 4005 處理器,助力低時(shí)延邊緣應(yīng)用
- 從心出發(fā),新品與新技術(shù)雙重進(jìn)化,技嘉2025線下產(chǎn)品發(fā)布會強(qiáng)勢來襲
- 當(dāng)“銀發(fā)”遇見“智眼”——神眸亮相2025深圳智慧養(yǎng)老展
- 訊飛同傳助力亞布力夏季年會,打破語言壁壘促全球?qū)υ?/a>
- 低空賦能,跨越山河,大疆運(yùn)載無人機(jī)的甘孜答卷
- 預(yù)制菜又吵起來了?優(yōu)特智廚炒菜機(jī)新品發(fā)布會掀起中餐“現(xiàn)炒”熱潮
- 場景化落地部署人形機(jī)器人將超2000臺,眾擎機(jī)器人與多倫科技達(dá)成戰(zhàn)略合作
人工智能產(chǎn)業(yè)
更多>>- 首都機(jī)場“AI繪空港”大賽完美收官,卓特視覺以技術(shù)賦能創(chuàng)意未來
- 打造張江人工智能創(chuàng)新小鎮(zhèn),全國首個(gè)人工智能創(chuàng)新應(yīng)用先導(dǎo)區(qū)再添發(fā)展新引擎
- 人機(jī)共生 · 智啟未來——2025高交會亞洲人工智能與機(jī)器人產(chǎn)業(yè)鏈展主題發(fā)布
- 北京數(shù)基建發(fā)布“知行IntAct”混合智能體產(chǎn)品,以AI定義城市治理新范式
- 新時(shí)達(dá)“精耕小腦”,與大腦協(xié)同,加速具身智能垂直落地
- 亞洲愿景論壇 東軟蓋龍佳談AI與數(shù)據(jù)價(jià)值化重構(gòu)醫(yī)療未來
- 破解AI落地難題!北大這場特訓(xùn)營,為企業(yè)找到轉(zhuǎn)型“最優(yōu)解”
- 腦神經(jīng)成像提速數(shù)倍、AI練就“遺忘術(shù)”!2025螞蟻InTech獎(jiǎng)?lì)C發(fā)
人工智能技術(shù)
更多>>- 外灘大會首發(fā)! 螞蟻密算推出AI密態(tài)升級卡 實(shí)現(xiàn)零改動(dòng)“即插即用”
- 騰訊優(yōu)圖攜Youtu-Agent開源項(xiàng)目亮相上海創(chuàng)智學(xué)院首屆TechFest大會
- 2025外灘大會:王堅(jiān)暢談AI變革,普天科技錨定空天算力新賽道
- 騰訊正式開源Youtu-GraphRAG,圖檢索增強(qiáng)技術(shù)迎來落地新突破
- 聲網(wǎng)兄弟公司 Agora與OpenAI 攜手 助力多模態(tài) AI 智能體實(shí)現(xiàn)實(shí)時(shí)交互
- Qwen-Image-Edit 模型上線基石智算,圖像編輯更精準(zhǔn)
- 火山引擎多模態(tài)數(shù)據(jù)湖落地深勢科技,提升科研數(shù)據(jù)處理效能
- 斑馬AI大模型:為每個(gè)孩子提供專屬學(xué)習(xí)方案