陳凱教授建構下一代人工智能計算中心並樹立新典範
計算機科學及工程學系副教授陳凱善於從零開始打造大型項目。在中國農村出生長大,今天,他晉身成為未來香港「大腦」的幕後推手,掌握整個城市下一代人工智能(AI)計算中心的設計,包括智能交通、颱風預警、醫療診斷和金融科技等。作為與政府合作為香港智慧城市發展構建資訊科技基礎設施的關鍵科學家,陳凱教授正在為未來幾十年的發展樹立新典範。
為香港的人工智能中心樹立新典範
2017年,香港政府公布《香港智慧城市藍圖》,旨在利用創新及科技解決都市挑戰,提升成效,並改善生活質素和增強可持續發展。該藍圖涵蓋智慧出行、智慧生活、智慧環境、智慧市民、智慧政府和智慧經濟六個範疇。
2020年7月,陳凱獲得研究資助局主題研究計劃的資助。目前,他正與政府合作建構香港人工智能中心的核心基礎設施。基於他就「一種高性能分佈式基於圖的流數據機器學習框架及其在智慧城市中的應用」的研究項目,陳凱將帶領其智能網絡和系統(iSING)實驗室,開展下一代人工智能計算的研究工作。基於此,研究人員和從業者將能夠借助高性能及具隱私保護的計算平台參與數據協作,從而推動香港的智慧城市應用。
下一代人工智能計算平台是陳凱教授為構建智慧香港的心血結晶,該平台擁有高性能和隱私保護等方面的優勢。「首先,它具有高性能。通過硬件和系統加速數據分析和機器學習訓練模型,我們可以在短時間內處理大數據,將某些流程的工作時間從幾週縮短到幾天甚至幾個小時。其次,它可以保護隱私。通過隱私計算和聯邦學習技術,我們可以從數據中學習知識,但不會洩露數據隱私。」
以醫院數據為例,每家醫院都有責任保護自己患者的數據,同時醫學界則需要結合不同醫院的數據來擴大研究樣本量。為釋除醫院的顧慮,陳凱和他的團隊能夠應用先進的加密技術,整合數據並建立集體學習和疾病診斷的機器學習模型。最為關鍵的是,患者的原始數據並不會離開原來的醫院。這項技術將會在醫學隱私保護方面起到關鍵作用,同樣的數據隱私保護方法也適用於各家銀行之間的金融服務。
陳凱教授以人工智能驅動的智慧城市基礎設施和應用,採用數百萬個節點代表流式數據流中的不同實體和位置(包括建築物和道路交叉口),有助提升計算效率和便利性。現時,他的團隊與運輸署和香港天文台合作,收集了智慧城市中各方面的時空數據。深度神經網絡(如圖卷積網絡)可以進一步利用這些數據,為不同的智能應用程式建立強大的模型。團隊計劃運用機器學習框架優化香港的交通系統,主要可應用於:通過智能巴士排程減少候車時間和交通堵塞,在高峰時段靈活安排行車道的方向,以及通過預測乘客熱點區域調整計程車派遣。
在政府的資助下,陳凱教授將繼續建構具有數據中心和雲計算能力的大規模人工智能系統,大力推進全港在交通優化、醫療和金融科技等領域的發展。在此之前,他一直和學生在實驗室裡搭建系統,其研究成果已被谷歌、輝達和華為等多家公司採用。「自2012年入職科大的時候,我們已經開始著手建設系統,當中硬件、軟件、設計、理論和實現等研究環節都相當耗時。我們預期這個人工智能計算平台系統將分別在今年及明年先後向科大院系以至全港大學開放,並最終於全港應用。」
人工智能的先驅
作為一個還未到40歲的年輕教授,陳教授是如何取得今天的成就?
他成長於安徽省一個只有七戶人家的小村莊,從小已經學會堅持和適應。「我每天都要走路來回鎮上上學,從村裡出發,要走十公里,也就是兩個小時,中間還要翻過一座小山。我家以前養山羊,放學後,我會和山羊玩。我父親是老師。小時候,我發現自己對數字很敏感。比如,只要看一遍,我就能記住11位的電話號碼。」
1990年代,父母帶著十幾歲的陳凱去上海旅遊。第一次去大城市,這趟旅行成了他一生難忘的經歷,也為後來出國留學埋下了種子。「我從小在群山環抱的農村長大,與我當時看到現代城市高樓林立和人山人海的面貌形成鮮明對比,我心裡激動萬分,留下了極其深刻的印象。當意識到這個世界原來是如此五彩繽紛,我決定長大後一定要去探索世界。」
陳凱是一名勤奮的優等生,在班上一直名列前茅。初中畢業時,他所在的年級只有兩名學生考進了省內知名的高中,他便是其中之一。後來,他在位於安徽省合肥市的中國科學技術大學獲得了計算機科學的學士和碩士學位。「當時,計算機科學開始流行,我非常看好它的應用前景。同時,對數學的興趣和敏感度也為我的學習打下了堅實的基礎。」
2007至2012年間,他在美國芝加哥的西北大學攻讀計算機科學博士學位,終於開始了探索世界的目標。2008年年底,他讀到了一篇關於數據中心和雲計算的早期論文,對於這個在當時才剛開始流行的新興領域,他表示很感興趣,「我知道它的規模會越來越大,也會更加有影響力」。此後,他開始在這一領域默默耕耘。正如他所說,在西北大學的這段求學經歷為他帶來很多改變。
2009年8月,在他第一個孩子剛滿月時,陳凱從芝加哥來到北京的微軟亞洲研究院,進行為期三個月的實習。他深受啟發,當年秋天一返回美國便立即投入到工作中,連續奮戰數月,甚至在聖誕節和新年假期,大學的計算機實驗室裡空無一人,他仍在埋頭苦幹,最後撰寫了一篇關於數據中心的論文。皇天不負有心人,2010年8月,這篇論文被業內知名的旗艦會議ACM SIGCOMM收錄,入選「最佳論文提名獎」,彼時,他還只是一名博士生。這次成功在以錄用率極低著稱的國際會議上發表論文成為他一生的轉捩點。
他表示,「太太非常支持我,也為這一切做出了很多犧牲」。每當提到三個分別11歲、8歲和1歲的孩子時,他臉上都會洋溢著幸福的笑容。在2016年的ACM SIGCOMM會議上,陳凱和他的團隊再下一城,一舉發表了兩篇論文,是該會議首次錄用由香港院校研究人員以第一作者身份發表的論文。提及研究背後的種種挑戰,他解釋道:「與理論研究不同,數據中心和雲計算的研究需要使用多台計算機搭建一個真實的系統,因此非常耗時。完整實現一篇論文所需要的系統動輒要花上兩至三年的時間。」(欲進一步了解研究歷程,可閱覽計算機科學及工程學系微信公眾號上的相關文章。)
陳凱早於2008年開始持續從事數據中心和雲計算領域的前沿研究,目前擔任香港人工智能與機器人學會(HKSAIR)的執行副理事長。隨著香港人工智能和機器人研究快速發展,加上政府對這一領域的重視,他希望藉高性能人工智能基礎設施的建設,為相關應用、算法和模型的提速奠定基礎,加快研究成果的轉化落地。
樹立目標
陳凱認為科大為研究工作提供了一個平靜的環境,而且離市中心也不遠,位置便利。「作為亞洲最優秀的大學,科大擁有頂尖的計算機科學及工程學系和工學院。我十分享受這裡亞洲和西方的文化交融,學術和研究環境,以及美麗的校園。而且,從香港回老家看望父母也很方便。」
秉持勤奮好學、目標為本的想法,陳教授鼓勵年輕人要樹立目標。 「從2008年開始,我就喜歡上了數據中心和雲計算的研究,並一直深耕這一領域。以我的個人經驗來看,一個人應追隨自己的熱忱,在不同的階段制定不同的目標,朝著定下的方向,努力奮鬥,永不言棄。」