發(fā)布時間:2025-09-14 來源:出淺入深網(wǎng)作者:半個橘子2
新智元報道
編輯:LRST
【新智元導(dǎo)讀】清華大學(xué)聯(lián)手MIT等機構(gòu)提出了一個「大語言模型+規(guī)劃師」新框架,AI像助手一樣全程陪跑,從聊需求、畫藍圖到用虛擬居民預(yù)演效果,讓城市規(guī)劃又快又科學(xué)。實驗顯示,AI已能考過九成人類規(guī)劃師,未來人機將各展所長,一起把城市設(shè)計得更宜居、更公平。
面對日益復(fù)雜的城市系統(tǒng)和多元化的社會需求,傳統(tǒng)城市規(guī)劃方法正遭遇瓶頸。
如今,人工智能(AI)正為這個古老而重要的領(lǐng)域帶來顛覆性的革新。
近日,由清華大學(xué)電子工程系城市科學(xué)與計算研究中心、建筑學(xué)院與麻省理工學(xué)院(MIT)感知城市實驗室、美國東北大學(xué)等頂尖機構(gòu)的學(xué)者組成的跨學(xué)科團隊,在國際前沿期刊《自然·計算科學(xué)》上發(fā)表觀點文章,首次系統(tǒng)性地提出了一個由大語言模型(LLM)驅(qū)動的智能城市規(guī)劃框架。
論文鏈接:https://www.nature.com/articles/s43588-025-00846-1
該框架將AI的強大計算、推理與生成能力,同人類規(guī)劃師的專業(yè)經(jīng)驗與創(chuàng)造力深度融合,旨在將AI打造為人類的「智能規(guī)劃助手」,共同應(yīng)對現(xiàn)代城市規(guī)劃中的復(fù)雜挑戰(zhàn),為實現(xiàn)更高效、創(chuàng)新和響應(yīng)迅速的城市設(shè)計流程,開啟了人機協(xié)同的新范式。
該論文第一作者為清華大學(xué)電子工程系博士生鄭瑜,通信作者為清華大學(xué)電子工程系李勇教授、清華大學(xué)建筑學(xué)院林雨銘助理教授以及美國東北大學(xué)環(huán)境工程系Qi R. Wang副教授。
合作者包括清華大學(xué)電子系的徐豐力助理教授,以及MIT感知城市實驗室的Paolo Santi研究員和Carlo Ratti教授。
城市規(guī)劃的演進與瓶頸
城市規(guī)劃的理論與實踐在不斷發(fā)展,從早期側(cè)重物理空間和美學(xué)形態(tài)的「藝術(shù)設(shè)計」,演變?yōu)槎?zhàn)后將其視為復(fù)雜系統(tǒng),并采用科學(xué)模型分析的「科學(xué)規(guī)劃」。
然而,這些方法在今天面臨著新的挑戰(zhàn):
一方面,規(guī)劃過程仍以規(guī)劃師為中心,公眾參與的廣度和深度有限;
另一方面,規(guī)劃方案的評估往往是定性、主觀且滯后的,難以進行科學(xué)的量化決策和快速迭代。
近年來,以生成對抗網(wǎng)絡(luò)(GANs)和強化學(xué)習(RL)為代表的傳統(tǒng)AI模型開始應(yīng)用于城市規(guī)劃,在生成街道網(wǎng)絡(luò)、功能分區(qū)等方面展現(xiàn)了潛力。
但這些模型通常是為特定任務(wù)設(shè)計的,知識面狹窄,難以應(yīng)對現(xiàn)代城市規(guī)劃與日俱增的跨學(xué)科復(fù)雜性。
大語言模型(LLM)的出現(xiàn),以其強大的知識整合、邏輯推理和多模態(tài)生成能力,為突破這一瓶頸帶來了歷史性機遇。
LLM驅(qū)動的城市規(guī)劃新流程
針對傳統(tǒng)方法的不足,研究團隊創(chuàng)新性地提出了一個包含概念設(shè)計(Conceptualization)、方案生成(Generation)和效果評估(Evaluation)三個核心階段的閉環(huán)框架。
該框架由大語言模型、視覺大模型(VLM)和大模型智能體(LLM Agent)協(xié)同驅(qū)動,為人類規(guī)劃師提供全流程的智能輔助。
圖1:提出的大語言模型驅(qū)動的城市規(guī)劃框架。該框架整合LLM、VLM和LLM智能體,形成「概念-生成-評估」的協(xié)同工作流
概念設(shè)計:LLM成為擁有跨學(xué)科知識的「規(guī)劃顧問」
在規(guī)劃初期,規(guī)劃師輸入需求、約束和指導(dǎo)方針等文本信息。
經(jīng)過海量數(shù)據(jù)預(yù)訓(xùn)練的LLM,能夠深度整合地理、社會、經(jīng)濟等多領(lǐng)域知識,與規(guī)劃師進行多輪「對話」。
它不僅能提出創(chuàng)新性的概念想法,還能根據(jù)復(fù)雜的上下文進行推理,生成詳細的規(guī)劃描述文本和初步的空間構(gòu)想草圖,極大地提升了概念設(shè)計階段的效率和深度。
圖2: 基于LLM的城市概念設(shè)計流程圖
方案生成:VLM化身「視覺設(shè)計師」,將文字轉(zhuǎn)化為藍圖
該框架利用視覺大模型(VLM)將抽象的文本概念轉(zhuǎn)化為具體的、可視化的城市設(shè)計方案。
規(guī)劃師可以通過文本指令(Prompt)精確描述規(guī)劃概念和約束條件,經(jīng)過城市設(shè)計數(shù)據(jù)微調(diào)的VLM能夠生成精細的視覺輸出,如土地利用布局、建筑輪廓,甚至是逼真的三維城市場景,同時還能確保設(shè)計符合地理等現(xiàn)實約束。
圖3:城市方案生成示意圖
效果評估:LLM智能體構(gòu)建「虛擬城市」,預(yù)演未來生活
為了對規(guī)劃方案進行科學(xué)評估,框架引入了LLM智能體進行城市動態(tài)模擬。
研究人員為智能體設(shè)定不同的人口統(tǒng)計學(xué)特征(如年齡、職業(yè)),讓它們在生成的虛擬城市中模擬居民的日常出行、設(shè)施使用等活動。
通過分析這些模擬行為,可以得到關(guān)于交通距離、設(shè)施使用率、碳排放、社會公平性等多維度的量化評估指標,為規(guī)劃方案的迭代優(yōu)化提供科學(xué)、前瞻性的反饋。
圖4:基于LLM&VLM智能體的城市規(guī)劃效果評估方案
初見成效
AI展現(xiàn)超越人類專家的潛力
為驗證該框架核心能力的可行性,清華大學(xué)電子系城市科學(xué)與計算研究中心持續(xù)發(fā)布CityGPT、CityBench、 UrbanLLaVA等系列語言視覺跨模態(tài)城市大模型及UrbanWord、EmbodiedCity、AgentSociety等城市具身仿真平臺與社會模擬系統(tǒng),為大模型時代的城市規(guī)劃與社會治理奠定了技術(shù)基礎(chǔ)。
針對LLM時代的城市規(guī)劃,研究團隊進行了一系列概念驗證實驗。
在一項測試中,研究者讓LLM回答城市規(guī)劃師專業(yè)資格考試的題目,結(jié)果顯示,最大規(guī)模的LLM在回答復(fù)雜規(guī)劃概念問題上的表現(xiàn),超過了排名前10%的人類規(guī)劃師,證明了其在概念化階段的巨大潛力。
在評估階段的模擬測試中,團隊利用LLM智能體在美國紐約和芝加哥的兩個社區(qū)中模擬居民的設(shè)施訪問行為。
模擬結(jié)果顯示,智能體訪問的熱點區(qū)域與真實的居民流動數(shù)據(jù)高度吻合,證明了LLM智能體在預(yù)測規(guī)劃方案實際影響方面的準確性和有效性。
圖5:LLM生成城市規(guī)劃效果示意圖
挑戰(zhàn)與展望
構(gòu)建人機協(xié)同的未來城市
研究團隊最后強調(diào),這一框架并非要取代人類規(guī)劃師,而是旨在建立一種人機協(xié)同的新工作流。
在這種模式下,規(guī)劃師可以從繁瑣的數(shù)據(jù)處理和繪圖工作中解放出來,更專注于創(chuàng)新、倫理考量以及與各方利益相關(guān)者的溝通,而AI則負責高效地完成概念整合、方案生成和模擬評估。
同時,文章也指出了該技術(shù)路線面臨的挑戰(zhàn),包括高質(zhì)量城市設(shè)計數(shù)據(jù)的稀缺性、巨大的計算資源需求,以及模型中潛在的地理和社會偏見等。
未來的研究需要建立開放的數(shù)據(jù)平臺,開發(fā)更高效的專用模型,并設(shè)計公平性算法,確保AI技術(shù)能夠公平、包容地服務(wù)于所有城市環(huán)境。
我們可以期待在不久的將來,城市規(guī)劃師借助強大的AI助手,能夠更快、更好地設(shè)計出高效宜居、可持續(xù)的城市,充分釋放人類的創(chuàng)造力來塑造我們共同的城市家園。
參考資料:
https://www.nature.com/articles/s43588-025-00846-1