9月8日,2023騰訊全球數字生態大會智慧交通專場在深圳舉行。東南大學交通學院教授、博導、副院長劉志遠發表了題為《多模式交通大模型的技術體系與應用方案》的主題演講。
東南大學交通學院教授、博導、副院長劉志遠
隨著人工智能行業掀起大模型的研發和應用熱潮,交通行業的從業者也非常關注大模型在本行業中的應用場景。
劉志遠認為,交通行業應該在通用大模型的基礎上發展專為交通領域規劃、優化的交通大模型體系。這一體系繼承了通用大模型的回答問題和創造能力兩大職能,同時在算力、算法和數據三大關鍵要素基礎上,實現對傳統交通模型的顯著精度提升。
劉志遠表示,交通大模型與專注于文本、視覺領域的通用大模型不同,應該以交通領域的各類參與要素為重心,關注單點、干線、路網的各類問題和挑戰。
劉志遠指出,交通行業各個管理部門之間的職能壁壘往往是交通應用的瓶頸所在,而大模型可以突破這樣的壁壘,為各部門提供一體化的解決方案,為交通應用搭建統一的底層基礎,從而實現降本增效、提升交通運輸效率的目標。
但劉志遠也強調,目前交通大模型還在發展初期,未來隨著算力、算法和數據的持續改進,以及交通應用數量的不斷增加,交通大模型也將助力交通行業更好實現智慧化的目標。
以下為劉志遠的演講全文:
非常感謝騰訊的邀請,很榮幸在這次盛會上交流我們在大模型方面的心得和體會。
數字化浪潮的背景下,大模型是今年產業的核心關鍵詞。我們認為交通行業應該在通用大模型的基礎上開發自己的交通大模型體系,那就要首先了解大模型的背景。
大模型之所以能帶來全新的范式和技術革命,來源于算力、算法和數據三大關鍵要素。大模型的重點在于生成式的概念,指的是產生人類的知識體系,在生產生活中沒有產生的各種結論和知識。能做到這一點,是因為大模型背后有著非常龐大的知識庫支撐。所以我們在構建自己的技術體系時,需要深入思考算力、算法、數據這三駕馬車,掌握里面的核心技術。
回到交通工程本身,我們現在通用的交通模型體現在建管、養運、規劃、設計等不同環節中,是以四階段和三參數模型為代表的傳統體系。它有著非常深度的理論支持,但它最大的問題在于精度不足。以三參數模型為例,在得到了豐富數據的前提下,它的客觀擬合誤差都可以達到26%;再以四階段模型為例,實踐中誤差可以高達150%。所以這樣的模型體系更多還是思辨的產物,不是一個過程可重復、結論可證偽的客觀環境下打造的體系。
今天我們要把算力、算法、數據真正地用到交通工程體系的深度架構里,就需要像ChatGPT一樣構造自己的交通工程大模型,我們叫它多模式交通大模型。它可以解決現有模型的假設不合理、模型參數較少的問題,最重要的目標是提升精度,帶來極大的智能提升。
ChatGPT有兩個核心功能,第一是回答問題,另一個是它有創造能力。交通大模型也一樣,比如可以回答我高速公路的管控方案,也可以針對現有的各種挑戰設計出全新的解決方案。
我們基于這樣的背景設計出了大模型的整體技術架構。大模型的訓練過程要花費非常多的計算資源和時間,模型訓練完后,方案評估也就是回答問題的這個環節,相當于是往前算的概念;方案生成,也就是優化問題的這個環節,相當于是往后算的概念。在這樣的技術體系下,我們旗幟鮮明地提出了我們的技術體系,就是融合各個數據、各個要素,打造的大模式交通的大模型體系。這個大模型體系還要從點、干線、網絡三個不同的角度去刻畫。
首先來看單點。簡而言之,我們可以認為只有一個檢測器時,怎樣基于大量的數據進行模型和方法的革新。在單點的大模型體系下,很重要的突破就是單點所面臨的人、車、路、環境,這交通的四要素應該全都是模型的參數,都是模型可以駕馭、可以優化的對象。現在的單點交通模型只把人和車,也就是需求本體作為變量,但大模型的體系就應該把所有這些要素作為變量和參數,最后模型自身就能夠計算出最優的交通管控和信號配時的方案。這和以往的交通體系有著本質的不同,也是大模型的算力、算法、數據所能夠帶給我們的精度提升,最后實現了實際的交通工程的職能。
這方面的模型和算法的構建,我們是以高斯過程為體系來打造交通的單點大模型。為什么要用高斯過程,非常重要的一點就是在于它的變量、參數是可拓展的。當我們面對實際的復雜問題時,它應該從原來的三參數拓展到1000個參數、10000個參數,可以有著非常彈性的可擴展性。
另外一個點在于干線。如果說高速公路上有兩個檢測器,兩個檢測器之間存在著不可監測的范圍。那么通過大模型,在檢測器覆蓋范圍有限的情況下,就可以利用模型本身把整個交通流運行的軌跡、過程進行深度刻畫。
這里面非常重要的模型體系體現在深度強化學習。深度強化學習現在往往只能分析有限個數的智能體,不超過1000個。但是交通問題中,深圳這樣一個城市可能就是上千萬個智能體。因此在今年年初,我們發表了一個新的體系叫做”集成強化學習”,解決了應用中大規模的深度強化學習如何同極具復雜性、隨機性的交通系統進行有機融合的問題。
第三點是在路網下如何分析。路網非常重要的特點是它的檢測器更加有限,大部分的路段是空白。針對這樣的問題,我們所提出來的解決方案是構建遷移學習,基于已有檢測器路段上獲取到的信息構建出來的模型,再遷移到路網上的每一寸土地。所以我們不需要大規模鋪設檢測器,現在的算力、算法、數據加上模型本身的能力完全可以實現整個網絡全覆蓋的感知水平。
在這樣的體系下,基于干線、單點、網絡的大模型構建,我們打造了全新的交通大模型的范式。我們所提出的技術體系,關鍵在于交通工程所涉及的不同物理問題、物理對象應該區別對待。所以當我們把這樣的模型體系放在騰訊云時,對外的界面是像ChatGPT一樣是一個統一的界面,但水面以下是單點、干線和路網的多任務學習的集成。
在這樣的技術體系下再來看具體的交通應用。交通應用中非常重要的一個特征是九龍治水,不同部門之間的數據壁壘和職能壁壘往往是實際問題的瓶頸所在。能不能讓大模型基于不同體系的數據,最后提供一體化的解決方案,讓大模型給各個部門帶來具體職能的支撐?
我們最終給出一個體系解決方案,第一個答卷還是放在智慧公路上,包含了智慧高速。智慧公路的體系是最為完備的,因此基于智慧公路的建、管、養、運、規劃、設計的六大職能,我們提出大模型可以發揮作用的十個不同體系。十大體系中,基于我們構建出來的大模型對于人流、車流、物流的運動規律的精準刻畫,從原來只有3類參數拓展到100類、上億個參數,這樣龐大的模型體系和技術工具的支撐,給整個應用體系帶來范式的革命。
這樣的范式落地在具體的規劃設計任務中有很多可以發揮作用的例子。第一點,單點大模型非常重要的應用在于公路的養護。智慧公路和機器視覺最經典的案例是利用巡檢車的機器視覺來做路面養護的自動化替代。但目前這些巡檢車往往是單體作戰,運行速度很慢,對各種復雜場景的識別精度也很差。但如果我們融合了各類交通大模型的工具,和巡檢車融為一體,就可以讓巡檢的車輛以現在4倍、5倍的速度來檢測,降本增效的同時帶來精度的巨大提升。干線大模型也是一樣。它可以把所有的人、車、路、環境的要素全部作為模型的一部分,經過計算就可以輸出高精度的最優管控方案。路網層面,現有的交通方案在做精細化調整時,往往是基于規范和標準發揮著人的能動性,帶來很多隨機性和不確定性。而大模型在城市路段、高速公路上發現交通流的異常狀況后,可以在交通流狀況的指引下,再基于無人機的地空巡航,對交通設計進行精細化的調整。
交通大模型就像新生嬰兒一樣,還在算力、算法、數據三個強力驅動要素下不斷成長?;A理論是它的根基,應用是它的生命力。在大模型的體系下,我們通過一體化的模型構建,最后實現智慧化的提升,謝謝大家。
近日,高德地圖聯合國家信息中心大數據發展部、清華大學土木水利學院、同濟大學智能交通運輸系統(ITS)研究中心、未來交通與城市計算聯合實驗室等機構共同發布《2024中國主要城市交通分析報告》(簡稱《報告》)。報告顯示,蘭州、合肥、濟南公共交通出行幸福指數領先,北京、上海、深圳綠色出行意愿指數位列前三。 公共交通出行幸福指數:蘭州、合肥、深圳領先 報告基于所監測的主要城市的公共交通數據,對城市公共交通的運行效率、可靠性以及用戶出行體驗進行了全面分析。數據顯示,蘭州市、合肥市、深圳市在公共交通出行幸福指數方面表現突出,分別位列大中城市、特大城市和超大城市的首位。蘭州市的公共交通出行幸福指數最高,達到81.48%,顯示出其公共交通系統的高效性和可靠性。 從換乘系數來看,2024年期間,城市公共交通平均換乘系數整體同比去年呈持平或下降趨勢。東莞市、沈陽市、??谑械墓粨Q乘系數分別在超大、特大、中大城市中最小,顯示出這些城市在公共交通系統設計上的便捷性。而在公交運行效率方面,臺州市城市核心區內的高峰期“社會車輛-公交車速度比”最小,小汽車速度是公交的1.95倍,顯示出其公共交通出行用戶體感良好。常州市的“全市全天線路運營速度...