0

作者 | 王德清
出品 | 雷鋒網產業組
德國人文地理學家F.拉采爾曾指出“交通是城市形成的力”。而擁堵的交通環境,則能讓一個城市“乏力”,處于亞健康的狀態。
在人口密度大、城市集聚效應明顯的亞洲和拉美地區,交通擁堵更是阻礙城市發展的“老大難”問題。
“交通是一個城市的尊嚴,數據挖出看不見的路”。2018年的云棲大會上,中國工程院院士王堅這樣表示。
很多城市面臨著亟待解決的交通問題,而數據是實現交通立體化管理的基礎元素,然而目前城市交通數據普遍面臨數據少、質量差、呈孤島分布等問題,導致模型構建困難,阻礙了智慧城市的發展,這該如何“破題”?
“任何人工智能應用都需要大量真實數據進行訓練,才能投入實際應用,像計算機視覺技術可以發展到今天這個地步,和有海量高質量真實數據的知名數據集ImageNet是有很大的關系的。”香港科技大學教授陳凱對雷鋒網表示道。

陳凱教授
“但在智慧城市領域,目前還沒有一個像ImageNet這樣高質量的數據集,所以在我們項目計劃中,我們要打造一個智慧城市領域的數據集,我給它起名叫‘CityNet’”
“具體來說,我們計劃建設一個高性能的分布式AI云平臺,叫圖靈平臺,首先我們會將香港的交通數據(交通署、運輸署、天文臺等機構的多模態數據),以隱私保護和數據脫敏的方式實時匯入圖靈平臺上的CityNet,然后利用圖靈平臺的算力,應用圖神經網絡、遷移學習、聯邦學習等最新的人工智能技術,對城市交通流量、人流量實現精準的預測,從而提供精細的、動態化的城市交通管理。”
在提出建設CityNet這一數據集的背后,是陳凱教授對于智慧交通建設現狀的清楚認識,他認為,目前智慧交通的建設存在兩個問題:
一是不同的數據源只能分開分析:現有研究工作多數只能同時對一種數據源進行分析,但不同類型的數據源之間存在關聯,同時對多種數據進行分析可以提高預測系統的準確性和穩定性;
二是不同城市的經驗知識無法相互借鑒:每個城市使用自身數據構建系統模型,不能有效利用先進城市的知識幫助其他城市構建模型,在新城市部署交通流量預測系統要重新訓練模型,成本較高。
陳凱說道:“大家都在追求新技術這個是好事,但就智慧交通來說,目前并沒有一個頂層的架構設計,也會出現同類技術重復開發的現象,我們希望用技術手段推動數據和算法層面合作,避免機器學習模型的重復訓練,這是我們要建設圖靈平臺和CityNet的初衷。”
“力”的作用是相互的。城市在為CityNet提供數據的同時,也可以應用CityNet中已有的模型,來建設智慧城市。
透過陳凱教授的介紹,我們不難發現,CityNet數據庫的建設,會為城市智慧化建設帶來強有力的幫助。但CityNet數據庫要匯聚諸多城市的數據,數據安全則是首要考慮的問題。
當前,歐洲、美國相繼頒布了數據隱私保護法,很多科技巨頭甚至因為數據安全問題被巨額罰款。
基于此,雷鋒網深入解了陳凱教授團隊是如何應對智慧交通建設中的隱私安全問題。
在陳凱教授看來,隱私問題不僅僅是一個監管的問題,也是一個技術問題。“我們在把CityNet 數據庫建設成最大的智慧城市數據庫的規劃中,數據隱私安全是很關鍵的一個研究課題。”
陳凱繼續說道:“圖靈平臺會對CityNet 數據進行統一管理,應用聯邦學習和加密計算等技術,以隱私保護的方式把 CityNet 數據提供給智慧城市的研究者使用,研究者在訓練機器學習算法的時候,無需知道原始數據里的私有和敏感信息。”
聯邦學習則可以讓數據不動,模型動,通過聯邦學習技術,可以讓使用者不需要知道CityNet的原始數據是什么,但仍然能夠學到知識。
除了針對數據隱私安全的理論研究之外,經過加密后的龐大數據對計算機算力的要求提高了十倍甚至更高,那么,這個時候,算力也成為了一個挑戰,而這也是陳凱教授擅長的研究領域之一。

陳凱教授詳細講解《圖的數據流深度學習范式》
據雷鋒網了解,陳凱教授從事大規模數據中心的研究有十多年,在相關高水平國際會議和期刊發表學術論文的數量居亞洲第一,是系統和網絡性能優化這一領域的帶頭人。
“我們的圖靈平臺是一個高性能分布式AI集群計算架構,通過高速通信技術RDMA,提高大型 GPU 集群吞吐量,降低通信延時,提升集群的整體計算效率,支撐大規模圖式流數據上的深度學習和遷移學習。”陳凱教授解釋道。
除此之外,陳凱教授還組織了一支集土木工程、信息科學、計算機科學等多個領域的專家團隊來共同推進項目的研究。
“為了這個項目我們組成了一支比較綜合的核心團隊,由香港科技大學、香港理工大學、香港中文大學的8位教授組成,我們還將組織一支50人左右的團隊,讓我們的研究成果可以從科研到展示到實現項目的真正落地”

陳凱教授和實驗室團隊
談起研究中更長遠的目標,陳凱教授對雷鋒網說道:“香港的交通比較復雜,如果我們可以將香港交通做好,其實對于其他城市的借鑒意義非常大。如果有成功的經驗的話,我們會逐步延伸到粵港澳大灣區中另外一些交通網比較復雜的城市。”
2017年,香港特區政府擬斥資7億港元發展智慧城市建設,并公布了未來5年的香港智慧城市發展藍圖,其中涵蓋6個方面,包括智慧出行、智慧生活、智慧環境、智慧市民、智慧政府以及智慧經濟。

在此次采訪的一個月前,陳凱教授提出的應用在智慧城市中的“高性能分布式基于圖的流數據機器學習框架”,獲得了2020/21年度香港政府高達3300萬「主題研究計劃」資助。
值得一提的是,「主題研究計劃」自2011年設立至今,共計52位項目統籌負責人在列,80%以上為資深講席教授,包括多位國內外科學院/工程院院士。而陳凱教授是香港「主題研究計劃」有史以來最年輕的項目統籌負責人,
“我們的項目面向智慧城市藍圖中的三個場景:交通、健康和經濟。首先落地在智慧交通場景上。”,陳凱對雷鋒網解釋道,“據相關數據顯示,香港每一公里交通路段上面,有350輛車左右;香港每天乘坐公共交通可達1200萬人次。我們希望通過人工智能算法提高公共交通的運輸線路的效率,縮短人們上下班出行高峰的等待時間。”
此外,在陳凱教授團隊的規劃中,下一步還將整合城市交通、公共醫療、金融方面的真實的實時數據。基于這些數據,就會為商業選址、基礎設施建設、商業廣告投放等多個產業提供智能化的幫助。
經過陳凱教授的介紹,整個項目框架也逐漸清晰,雷鋒網將其總結為:
建設高質量的智慧城市數據集:通過隱私計算,數據脫敏的方式將香港以及國內外諸多城市的交通數據匯入到CityNet數據集中;
搭建圖靈平臺:對CityNet中的數據進行處理、分析來搭建深度圖神經網絡模型;
通過深度圖神經網絡模型、大數據分析與可視化工具,對城市運輸提供精細的、動態化、自動化的城市交通管理,例如: 1)對城市交通流量、人流量實現精準的預測,輔助實現精準交通調控;2)實現智能預警系統,對預測車流量超出容量的區域作為潛在擁堵區域進行報警;3)分析預測城市出行需求與各路線與交通工具的預計到達時間(ETA),實現個性化的最佳出行建議與路線規劃。
基于在AI算力和數據安全領域的不斷探索,2018年,陳凱教授創辦了星云Clustar,持續在加速AI算力、提高集群計算效率、保護隱私安全等方面進行研究,致力于將聯邦學習,同態加密,高性能AI集群技術等最新研究成果應用到金融業、制造業等其他領域。
相信在不久的將來,我們就會迎來陳凱教授團隊的捷報。
在最后,我們也轉達一下陳凱教授對其智慧城市研究項目的期望:這是一個非盈利的科研項目,我們希望可以有更多的人能了解圖靈平臺和CityNet,來做一些貢獻,同時也會享受到CityNet帶來的回報。
雷峰網原創文章,未經授權禁止轉載。詳情見轉載須知。