用大數據預測霧霾是如何做到的?
全球范圍里,有超過(guò)半數的人類(lèi)居住在城市之中,城市化的進(jìn)程也從未停止過(guò)。面對越來(lái)越龐大的城市,許多事情已經(jīng)超出了控制:擁堵的交通,嚴重的空氣污染,讓人煩躁的噪音等等。
沒(méi)有人真正了解城市中到底發(fā)生了什么,也沒(méi)有人真正了解城市里的居民、住戶(hù)每天在發(fā)生什么樣的故事。對于城市管理者來(lái)說(shuō),他們需要更多的信息化方式來(lái)了解動(dòng)態(tài)的城市,知曉正在發(fā)生的情況,并即時(shí)做出反應。
城市計算這門(mén)研究正在逐步解決上述的問(wèn)題。在微軟亞洲研究院主管研究員鄭宇的帶領(lǐng)下,他和他的團隊正在利用城市計算解決各類(lèi)問(wèn)題,比如霧霾、噪音、交通擁堵和能耗等問(wèn)題。尤其是在空氣質(zhì)量分析、監測這一領(lǐng)域里,已經(jīng)和國內部分政府機構簽約,目前預測范圍覆蓋了全國300多個(gè)城市。
所謂城市計算指的是計算機科學(xué)以城市為背景,跟城市規劃、交通、能源、環(huán)境、社會(huì )學(xué)和經(jīng)濟等學(xué)科融合的新興領(lǐng)域。更具體的說(shuō),城市計算是一個(gè)通過(guò)不斷獲取、整合和分析城市中多種異構大數據來(lái)解決城市所面臨的挑戰(如環(huán)境惡化、交通擁堵、能耗增加、規劃落后等)的過(guò)程。
用大數據預測霧霾
2016年11月30日,美國計算機學(xué)會(huì )(ACM)網(wǎng)站公布了2016年該學(xué)會(huì )在全球范圍內評選出的32名杰出科學(xué)家,鄭宇是入選的兩名中國大陸科學(xué)家之一。不僅如此,鄭宇還是2013年美國《麻省理工科技評論》(MIT Technology Review)評選出的35個(gè)35歲以下的全球杰出青年創(chuàng )新者之一。他還是人工智能領(lǐng)域國際頂尖學(xué)術(shù)期刊ACM Transactions on Intelligent Systems and Technology的主編 ,也是到目前為止ACM/IEEE 頂尖學(xué)術(shù)期刊里唯一在大陸獲得博士學(xué)位的主編。
微軟亞洲研究院主管研究員鄭宇
據鄭宇介紹,城市計算包括城市感知及數據捕獲、數據管理、城市數據分析、服務(wù)提供四個(gè)環(huán)節。與自然語(yǔ)言分析和圖像處理等“單數據單任務(wù)”系統相比,城市計算是一個(gè)“多數據多任務(wù)”的系統。城市計算中的任務(wù)涵蓋改進(jìn)城市規劃、緩解交通擁堵、保護自然環(huán)境、減少能源消耗等等。
“城市計算最后主要能幫助我們解決3個(gè)問(wèn)題,即理解問(wèn)題的現狀、預測未來(lái)和考究歷史。以空氣質(zhì)量為例,我們可以根據有限的空氣監測站點(diǎn)給出的數據,算出城市每個(gè)角落的空氣質(zhì)量分布,了解清楚現狀;也可以通過(guò)數據預測未來(lái)。當然也可以通過(guò)這些數據,分析歷史:霧霾產(chǎn)生的原因是什么?”鄭宇在接受澎湃新聞專(zhuān)訪(fǎng)時(shí)說(shuō)。
目前,微軟在利用城市計算預測空氣質(zhì)量上,已推出Urban Air系統,通過(guò)大數據來(lái)監測和預報細粒度空氣質(zhì)量,該服務(wù)覆蓋了中國的300多個(gè)城市,并被中國環(huán)境保護部采用。同時(shí),微軟也已經(jīng)和部分其他中國政府機構簽約,為不同的城市和地區提供所需的服務(wù)。該技術(shù)可以對京津冀、長(cháng)三角、珠三角、成渝城市群以及單獨的城市進(jìn)行未來(lái)48小時(shí)的空氣質(zhì)量預測。那具體是如何做到的?
首先霧霾的大數據主要包括當前空氣質(zhì)量數據、氣象條件、未來(lái)天氣預報3類(lèi)數據。在北京共有35個(gè)空氣質(zhì)量監測點(diǎn),外加上美國大使館的一個(gè)監測點(diǎn),共36個(gè)。
鄭宇介紹,要預測一個(gè)地方的空氣質(zhì)量,并不是指單純地只看這個(gè)地方本地的數據,而且要考慮到周邊地區的空氣及其他因素,比如空氣質(zhì)量站點(diǎn)數據、交通流數據、氣象數據、廠(chǎng)礦數據、人口流動(dòng)數據、路網(wǎng)結構等。
與傳統模擬空氣質(zhì)量不同,大數據預測空氣質(zhì)量依靠的是基于多源數據融合的機器學(xué)習方法,也就是說(shuō),空氣質(zhì)量的預測不僅僅看空氣質(zhì)量數據,還要看與之相關(guān)的氣象數據、交通流量數據、廠(chǎng)礦數據、城市路網(wǎng)結構等不同領(lǐng)域的數據,不同領(lǐng)域的數據互相疊加,相互補強,從而預測空氣質(zhì)量狀況。
“預測的準確率,我們現在已經(jīng)做到北京未來(lái)6個(gè)小時(shí)的準確率達到了75%,在深圳和廣州做到了80%。未來(lái)48個(gè)小時(shí)的預測準確率達到50%。大家不要小看50%的準確率,它其實(shí)已經(jīng)非常高了。相比之下,天氣預報24小時(shí)的準確率只有40%。”鄭宇說(shuō)。
預測未來(lái)空氣質(zhì)量情況,給在城市生活的居民出行帶來(lái)重要的提示信息,除了與環(huán)保部的合作外,微軟的空氣質(zhì)量監測系統Urban Air還為在2015年于福州舉辦的第一屆全國青運會(huì )的空氣質(zhì)量保障工作中提供了技術(shù)支持。另外一個(gè)科技巨頭IBM也推出了類(lèi)似的服務(wù)。IBM與北京市環(huán)保局共同創(chuàng )辦了“聯(lián)合環(huán)境創(chuàng )新中心”,使得政府官員可以在最?lèi)毫拥那闆r下更好地制定減排計劃。IBM還與張家口市簽訂了協(xié)議,在冬奧會(huì )之前作出一些前期規劃和應對方案。
除了政府部門(mén),城市計算還能幫助城市居民規劃出行安排。如果你約3-5個(gè)好友一起周末踢球,你就可以根據預測給出的空氣質(zhì)量情況進(jìn)行選擇。
在采訪(fǎng)的過(guò)程中,鄭宇還向澎湃新聞解釋了為什么中國政府部門(mén)給出的空氣質(zhì)量數據與美國大使館的數據不同。
“美國用的是自己站點(diǎn)的讀數。其實(shí)兩者的測量原理都是一樣的。美國大使館公布的是實(shí)時(shí)的PM2.5濃度,以及根據這個(gè)濃度換算的AQI(air quality index)值。中國政府的測點(diǎn)也公布了實(shí)時(shí)濃度,但發(fā)布的AQI是根據過(guò)去24小時(shí)的平均濃度。所以?xún)烧咧g換算方法不一樣,導致AQI看上去不一致。但實(shí)時(shí)濃度值其實(shí)是一致的,有時(shí)候中國政府公布的污染物濃度還會(huì )比美國大使館公布的高。”鄭宇說(shuō)。
用大數據解決美國紐約的噪音問(wèn)題
城市化發(fā)展進(jìn)程中,除了有空氣污染問(wèn)題,噪音問(wèn)題同樣值得關(guān)注。被譽(yù)為“世界中心”的紐約,噪音問(wèn)題尤為嚴重。已經(jīng)有研究證明,人如果長(cháng)時(shí)間處在噪音環(huán)境下,會(huì )對人的血壓、記憶和睡眠等都造成影響。
“用傳統的方面解決噪音問(wèn)題是非常困難的,因為傳統技術(shù)通過(guò)撞擊傳感器來(lái)監測噪音。但噪音是聲音上的變化,在時(shí)間和空間上的反應非常劇烈,并且可能是一瞬就消逝了。而另一個(gè)原因是,傳感器并不能讓你知道噪音污染的原因。”鄭宇告訴記者。
如果想要對噪音進(jìn)行監測,鄭宇認為需要在100平方米的范圍內,甚至更小的區域內裝一個(gè)傳感器。那整個(gè)紐約市可能需要裝約100萬(wàn)個(gè)傳感器。這既不可行,而且要花費的人工管理成本也很大。其次,對于噪音的定義和人的感受有著(zhù)非常緊密的聯(lián)系。白天時(shí)間里,人對噪音的容忍程度和夜里會(huì )有明顯地區別。
這樣一來(lái),在城市計算中,就需要考慮人的感受。鄭宇給出的解決方法是根據美國人工投訴熱線(xiàn)311,通過(guò)電話(huà)記錄人們投訴的原因和地點(diǎn),把人變成噪音監測的傳感器。這樣就能為噪音給出準確的定義和分析,政府也能及時(shí)給出限制措施。
除此之外,鄭宇還在用城市計算預測城市人流,為城市大型活動(dòng)的人流管控提供政策服務(wù)。目前,微軟已經(jīng)和貴陽(yáng)市共同做了研究項目。利用出租車(chē)的數據,可以知道每一平方公里內,有多少出租車(chē)進(jìn)入和有多少出租車(chē)駛出??梢宰屨块T(mén)提前2-3小時(shí)進(jìn)行備案,疏導人流,防患于未然。
“人流量控制其實(shí)在很多地方都非常需要,比如機場(chǎng)、地鐵站等。它能真正降低事故發(fā)生的概率。但預測人類(lèi)的行為其實(shí)是非常困難的,因為當你有重大事件或活動(dòng)發(fā)生的時(shí)候,很遠地方的人也會(huì )趕來(lái)參加。這就要求建立許多相關(guān)性,融合許多的數據。”鄭宇說(shuō)。他還舉了一個(gè)簡(jiǎn)單的例子,比如城市上班族出行的早高峰時(shí)間,會(huì )隨著(zhù)天氣的變化有所改變,那在預測人流量時(shí)就不能只考慮一個(gè)因素。
未來(lái),在人工智能、深度學(xué)習等算法的支持下,城市計算給大眾帶來(lái)的驚喜會(huì )更多,但鄭宇也向記者介紹了這門(mén)學(xué)科遇到的挑戰。
首先,數據的獲取。雖然并不是數據越多,對于城市計算就越有幫助。但如何更準確有效地獲取相關(guān)數據,還是值得思考的問(wèn)題。其次,數據融合。即打破各類(lèi)數據的壁壘,讓來(lái)自不同行業(yè)、領(lǐng)域的數據進(jìn)行融合。最后,還要向各個(gè)行業(yè)的專(zhuān)家進(jìn)行學(xué)習,進(jìn)行對比借鑒。
“有時(shí)候我們需要先用自己的能力證實(shí)一下,即你能做出東西來(lái),并展示給其他人看。在與行業(yè)對接時(shí),還需要用他們的語(yǔ)言把問(wèn)題講清楚,別人才會(huì )接受你。別人接受你之后,才有可能真的落地并真正推動(dòng)行業(yè)進(jìn)步。”鄭宇對記者說(shuō)。
編輯:lianqi
相關(guān)閱讀
成都二環(huán)橋下不再只有草坪 擬增灌木、花卉
二環(huán)路綠化景觀(guān)主題為“五彩綴景、濃綠環(huán)城”,以綠色為主基調,提煉東南西北各段區域特色和文化,分別點(diǎn)綴凸顯紅色、紫紅色、金色和綠色。【詳細】
摩拜大數據:開(kāi)啟城市規劃新想象
為城市統籌規劃提供依據【詳細】
大數據治污 濟寧智慧城市建設結出新碩果
根據2017年山東省環(huán)保廳公布的省內1月份、2月份空氣質(zhì)量排名顯示,濟寧市共有【詳細】