0
| 本文作者: 王德清 | 2020-09-15 14:38 |

作者 | 王德清
出品 | 雷鋒網(wǎng)產(chǎn)業(yè)組
德國人文地理學家F.拉采爾曾指出“交通是城市形成的力”。而擁堵的交通環(huán)境,則能讓一個城市“乏力”,處于亞健康的狀態(tài)。
在人口密度大、城市集聚效應明顯的亞洲和拉美地區(qū),交通擁堵更是阻礙城市發(fā)展的“老大難”問題。
“交通是一個城市的尊嚴,數(shù)據(jù)挖出看不見的路”。2018年的云棲大會上,中國工程院院士王堅這樣表示。
很多城市面臨著亟待解決的交通問題,而數(shù)據(jù)是實現(xiàn)交通立體化管理的基礎元素,然而目前城市交通數(shù)據(jù)普遍面臨數(shù)據(jù)少、質(zhì)量差、呈孤島分布等問題,導致模型構(gòu)建困難,阻礙了智慧城市的發(fā)展,這該如何“破題”?
“任何人工智能應用都需要大量真實數(shù)據(jù)進行訓練,才能投入實際應用,像計算機視覺技術(shù)可以發(fā)展到今天這個地步,和有海量高質(zhì)量真實數(shù)據(jù)的知名數(shù)據(jù)集ImageNet是有很大的關(guān)系的?!毕愀劭萍即髮W教授陳凱對雷鋒網(wǎng)表示道。

陳凱教授
“但在智慧城市領域,目前還沒有一個像ImageNet這樣高質(zhì)量的數(shù)據(jù)集,所以在我們項目計劃中,我們要打造一個智慧城市領域的數(shù)據(jù)集,我給它起名叫‘CityNet’”
“具體來說,我們計劃建設一個高性能的分布式AI云平臺,叫圖靈平臺,首先我們會將香港的交通數(shù)據(jù)(交通署、運輸署、天文臺等機構(gòu)的多模態(tài)數(shù)據(jù)),以隱私保護和數(shù)據(jù)脫敏的方式實時匯入圖靈平臺上的CityNet,然后利用圖靈平臺的算力,應用圖神經(jīng)網(wǎng)絡、遷移學習、聯(lián)邦學習等最新的人工智能技術(shù),對城市交通流量、人流量實現(xiàn)精準的預測,從而提供精細的、動態(tài)化的城市交通管理?!?/p>
在提出建設CityNet這一數(shù)據(jù)集的背后,是陳凱教授對于智慧交通建設現(xiàn)狀的清楚認識,他認為,目前智慧交通的建設存在兩個問題:
一是不同的數(shù)據(jù)源只能分開分析:現(xiàn)有研究工作多數(shù)只能同時對一種數(shù)據(jù)源進行分析,但不同類型的數(shù)據(jù)源之間存在關(guān)聯(lián),同時對多種數(shù)據(jù)進行分析可以提高預測系統(tǒng)的準確性和穩(wěn)定性;
二是不同城市的經(jīng)驗知識無法相互借鑒:每個城市使用自身數(shù)據(jù)構(gòu)建系統(tǒng)模型,不能有效利用先進城市的知識幫助其他城市構(gòu)建模型,在新城市部署交通流量預測系統(tǒng)要重新訓練模型,成本較高。
陳凱說道:“大家都在追求新技術(shù)這個是好事,但就智慧交通來說,目前并沒有一個頂層的架構(gòu)設計,也會出現(xiàn)同類技術(shù)重復開發(fā)的現(xiàn)象,我們希望用技術(shù)手段推動數(shù)據(jù)和算法層面合作,避免機器學習模型的重復訓練,這是我們要建設圖靈平臺和CityNet的初衷。”
“力”的作用是相互的。城市在為CityNet提供數(shù)據(jù)的同時,也可以應用CityNet中已有的模型,來建設智慧城市。
透過陳凱教授的介紹,我們不難發(fā)現(xiàn),CityNet數(shù)據(jù)庫的建設,會為城市智慧化建設帶來強有力的幫助。但CityNet數(shù)據(jù)庫要匯聚諸多城市的數(shù)據(jù),數(shù)據(jù)安全則是首要考慮的問題。
當前,歐洲、美國相繼頒布了數(shù)據(jù)隱私保護法,很多科技巨頭甚至因為數(shù)據(jù)安全問題被巨額罰款。
基于此,雷鋒網(wǎng)深入解了陳凱教授團隊是如何應對智慧交通建設中的隱私安全問題。
在陳凱教授看來,隱私問題不僅僅是一個監(jiān)管的問題,也是一個技術(shù)問題?!拔覀冊诎袰ityNet 數(shù)據(jù)庫建設成最大的智慧城市數(shù)據(jù)庫的規(guī)劃中,數(shù)據(jù)隱私安全是很關(guān)鍵的一個研究課題?!?/p>
陳凱繼續(xù)說道:“圖靈平臺會對CityNet 數(shù)據(jù)進行統(tǒng)一管理,應用聯(lián)邦學習和加密計算等技術(shù),以隱私保護的方式把 CityNet 數(shù)據(jù)提供給智慧城市的研究者使用,研究者在訓練機器學習算法的時候,無需知道原始數(shù)據(jù)里的私有和敏感信息?!?/p>
聯(lián)邦學習則可以讓數(shù)據(jù)不動,模型動,通過聯(lián)邦學習技術(shù),可以讓使用者不需要知道CityNet的原始數(shù)據(jù)是什么,但仍然能夠?qū)W到知識。
除了針對數(shù)據(jù)隱私安全的理論研究之外,經(jīng)過加密后的龐大數(shù)據(jù)對計算機算力的要求提高了十倍甚至更高,那么,這個時候,算力也成為了一個挑戰(zhàn),而這也是陳凱教授擅長的研究領域之一。

陳凱教授詳細講解《圖的數(shù)據(jù)流深度學習范式》
據(jù)雷鋒網(wǎng)了解,陳凱教授從事大規(guī)模數(shù)據(jù)中心的研究有十多年,在相關(guān)高水平國際會議和期刊發(fā)表學術(shù)論文的數(shù)量居亞洲第一,是系統(tǒng)和網(wǎng)絡性能優(yōu)化這一領域的帶頭人。
“我們的圖靈平臺是一個高性能分布式AI集群計算架構(gòu),通過高速通信技術(shù)RDMA,提高大型 GPU 集群吞吐量,降低通信延時,提升集群的整體計算效率,支撐大規(guī)模圖式流數(shù)據(jù)上的深度學習和遷移學習?!标悇P教授解釋道。
除此之外,陳凱教授還組織了一支集土木工程、信息科學、計算機科學等多個領域的專家團隊來共同推進項目的研究。
“為了這個項目我們組成了一支比較綜合的核心團隊,由香港科技大學、香港理工大學、香港中文大學的8位教授組成,我們還將組織一支50人左右的團隊,讓我們的研究成果可以從科研到展示到實現(xiàn)項目的真正落地”

陳凱教授和實驗室團隊
談起研究中更長遠的目標,陳凱教授對雷鋒網(wǎng)說道:“香港的交通比較復雜,如果我們可以將香港交通做好,其實對于其他城市的借鑒意義非常大。如果有成功的經(jīng)驗的話,我們會逐步延伸到粵港澳大灣區(qū)中另外一些交通網(wǎng)比較復雜的城市?!?/p>
2017年,香港特區(qū)政府擬斥資7億港元發(fā)展智慧城市建設,并公布了未來5年的香港智慧城市發(fā)展藍圖,其中涵蓋6個方面,包括智慧出行、智慧生活、智慧環(huán)境、智慧市民、智慧政府以及智慧經(jīng)濟。

在此次采訪的一個月前,陳凱教授提出的應用在智慧城市中的“高性能分布式基于圖的流數(shù)據(jù)機器學習框架”,獲得了2020/21年度香港政府高達3300萬「主題研究計劃」資助。
值得一提的是,「主題研究計劃」自2011年設立至今,共計52位項目統(tǒng)籌負責人在列,80%以上為資深講席教授,包括多位國內(nèi)外科學院/工程院院士。而陳凱教授是香港「主題研究計劃」有史以來最年輕的項目統(tǒng)籌負責人,
“我們的項目面向智慧城市藍圖中的三個場景:交通、健康和經(jīng)濟。首先落地在智慧交通場景上?!?,陳凱對雷鋒網(wǎng)解釋道,“據(jù)相關(guān)數(shù)據(jù)顯示,香港每一公里交通路段上面,有350輛車左右;香港每天乘坐公共交通可達1200萬人次。我們希望通過人工智能算法提高公共交通的運輸線路的效率,縮短人們上下班出行高峰的等待時間。”
此外,在陳凱教授團隊的規(guī)劃中,下一步還將整合城市交通、公共醫(yī)療、金融方面的真實的實時數(shù)據(jù)。基于這些數(shù)據(jù),就會為商業(yè)選址、基礎設施建設、商業(yè)廣告投放等多個產(chǎn)業(yè)提供智能化的幫助。
經(jīng)過陳凱教授的介紹,整個項目框架也逐漸清晰,雷鋒網(wǎng)將其總結(jié)為:
建設高質(zhì)量的智慧城市數(shù)據(jù)集:通過隱私計算,數(shù)據(jù)脫敏的方式將香港以及國內(nèi)外諸多城市的交通數(shù)據(jù)匯入到CityNet數(shù)據(jù)集中;
搭建圖靈平臺:對CityNet中的數(shù)據(jù)進行處理、分析來搭建深度圖神經(jīng)網(wǎng)絡模型;
通過深度圖神經(jīng)網(wǎng)絡模型、大數(shù)據(jù)分析與可視化工具,對城市運輸提供精細的、動態(tài)化、自動化的城市交通管理,例如: 1)對城市交通流量、人流量實現(xiàn)精準的預測,輔助實現(xiàn)精準交通調(diào)控;2)實現(xiàn)智能預警系統(tǒng),對預測車流量超出容量的區(qū)域作為潛在擁堵區(qū)域進行報警;3)分析預測城市出行需求與各路線與交通工具的預計到達時間(ETA),實現(xiàn)個性化的最佳出行建議與路線規(guī)劃。
基于在AI算力和數(shù)據(jù)安全領域的不斷探索,2018年,陳凱教授創(chuàng)辦了星云Clustar,持續(xù)在加速AI算力、提高集群計算效率、保護隱私安全等方面進行研究,致力于將聯(lián)邦學習,同態(tài)加密,高性能AI集群技術(shù)等最新研究成果應用到金融業(yè)、制造業(yè)等其他領域。
相信在不久的將來,我們就會迎來陳凱教授團隊的捷報。
在最后,我們也轉(zhuǎn)達一下陳凱教授對其智慧城市研究項目的期望:這是一個非盈利的科研項目,我們希望可以有更多的人能了解圖靈平臺和CityNet,來做一些貢獻,同時也會享受到CityNet帶來的回報。
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。