日韩高清一区_国产亚洲一区二区三区四区_亚洲国产一二三_久热精品视频

登錄
首頁(yè) > 智駕游記 > 未來(lái)AI造的不僅是投石機(jī),而是能奔跑、搬運(yùn)、協(xié)作的各種復(fù)雜結(jié)構(gòu)——讓語(yǔ)言模型真正具備“造出會(huì)動(dòng)的東西”的能力

未來(lái)AI造的不僅是投石機(jī),而是能奔跑、搬運(yùn)、協(xié)作的各種復(fù)雜結(jié)構(gòu)——讓語(yǔ)言模型真正具備“造出會(huì)動(dòng)的東西”的能力

發(fā)布時(shí)間:2025-10-24 15:58:23

讓LLM扔塊石頭,結(jié)果它發(fā)明了投石機(jī)?

大模型接到任務(wù):“造一個(gè)能把石頭扔遠(yuǎn)的結(jié)構(gòu)。”

誰(shuí)成想,它真的開(kāi)始動(dòng)手造了,在一個(gè)真實(shí)的物理仿真世界里,一邊搭零件,一邊看效果,一邊修改。

最后,它造的投石機(jī),把石頭扔了出去。

這就是來(lái)自港中大(深圳)、港中大的研究團(tuán)隊(duì)(Wenqian Zhang, Weiyang Liu, Zhen Liu)帶來(lái)的最新研究——《Agentic Design of Compositional Machines》

他們推出了一個(gè)叫BesiegeField的新平臺(tái),它就像一個(gè)給大模型的“機(jī)械工程師訓(xùn)練場(chǎng)”,專門(mén)測(cè)試AI能不能像人一樣,從零開(kāi)始設(shè)計(jì)并造出能動(dòng)的、有功能的復(fù)雜機(jī)器。

這還沒(méi)完。BesiegeField支持上百次的并行實(shí)驗(yàn),一旦引入強(qiáng)化學(xué)習(xí)(Reinforcement Learning),大模型就能“自我進(jìn)化”:從反饋中調(diào)整策略,逐步學(xué)會(huì)結(jié)構(gòu)設(shè)計(jì)的物理邏輯,最終學(xué)會(huì)如何“造出能動(dòng)的結(jié)構(gòu)”

大模型怎么寫(xiě)出一個(gè)機(jī)械結(jié)構(gòu)

首先得明確,這不是讓大模型去畫(huà)CAD圖,它也控制不了三維細(xì)節(jié)。研究者提出了一種叫“組合式機(jī)械設(shè)計(jì)”(Compositional Machine Design)的方法。

說(shuō)白了,就是把機(jī)械結(jié)構(gòu)限定在“用標(biāo)準(zhǔn)零件組裝”這個(gè)范圍里。每個(gè)零件(比如支架、關(guān)節(jié))都有標(biāo)準(zhǔn)尺寸和接口,大模型只需要決定:

用哪些零件

它們之間怎么連

這樣,復(fù)雜的設(shè)計(jì)就被簡(jiǎn)化成一個(gè)“離散結(jié)構(gòu)組合問(wèn)題”。到底好不好用?能不能動(dòng)?穩(wěn)不穩(wěn)?交給物理仿真去驗(yàn)證。

為了讓模型好理解和修改,研究者用了一種類似XML的“結(jié)構(gòu)化表示機(jī)制”,設(shè)計(jì)機(jī)械就變成了一種語(yǔ)言模型擅長(zhǎng)的結(jié)構(gòu)生成任務(wù)。

一個(gè)自進(jìn)化訓(xùn)練場(chǎng)

上面說(shuō)的這一切,都發(fā)生在BesiegeField這個(gè)仿真平臺(tái)里。它跑在Linux集群上,能同時(shí)跑幾百個(gè)機(jī)械實(shí)驗(yàn),并給到完整的物理反饋——比如速度、受力、能量變化、投擲距離、穩(wěn)不穩(wěn)定、機(jī)械損壞度等等。

這些反饋不僅能驗(yàn)證設(shè)計(jì),還能作為強(qiáng)化學(xué)習(xí)的“獎(jiǎng)勵(lì)信號(hào)”,指導(dǎo)模型改進(jìn)策略。

在這個(gè)平臺(tái)里,模型的設(shè)計(jì)形成了閉環(huán):生成 → 仿真 → 拿反饋 → 調(diào)整 → 再來(lái)一次

就算不更新模型參數(shù),它也能靠反饋優(yōu)化輸出;如果引入強(qiáng)化學(xué)習(xí),模型就能通過(guò)這些量化的獎(jiǎng)勵(lì)信號(hào),系統(tǒng)性地提升設(shè)計(jì)能力和成功率。

平臺(tái)還設(shè)計(jì)了一系列從易到難的任務(wù),比如直線行駛、投擲、抓取,甚至還有過(guò)障礙、地形坡度、穿環(huán)投擲等更復(fù)雜的場(chǎng)景,構(gòu)成了一個(gè)多樣化的實(shí)驗(yàn)空間。

為什么造機(jī)器這么難

造機(jī)器的挑戰(zhàn),不在于零件多少,而在于它們能不能“在動(dòng)態(tài)中協(xié)同工作”來(lái)完成復(fù)雜功能。

拿投石機(jī)來(lái)說(shuō),配重、支點(diǎn)、發(fā)射臂必須在關(guān)鍵時(shí)刻協(xié)同發(fā)力,才能把能量精準(zhǔn)地扔出去。

只要一個(gè)地方偏差,整個(gè)機(jī)器就可能失效:沒(méi)配重,打不出去;缺支點(diǎn),原地轉(zhuǎn)圈;少了杠桿,石頭飛不起來(lái)。

這些問(wèn)題,只有在真實(shí)仿真中才能被發(fā)現(xiàn),也只有這樣,模型才能一步步搞懂“結(jié)構(gòu)到底是怎么動(dòng)起來(lái)的”

差距有多大?人類設(shè)計(jì)的投石機(jī)能投近200米,而大模型設(shè)計(jì)的,常常連30米都到不了。

這其中,差距就在于對(duì)“結(jié)構(gòu)協(xié)同”和“發(fā)力效率”的理解。

這也是BesiegeField要解決的核心問(wèn)題——讓它懂得結(jié)構(gòu)之間“如何協(xié)同去完成任務(wù)”。

模型真學(xué)會(huì)造結(jié)構(gòu)了嗎

為了解決單個(gè)模型“想不明白”的難題,研究團(tuán)隊(duì)構(gòu)建了一套“智能體工作流”(Agentic Workflow),讓多個(gè)AI協(xié)作。

這套系統(tǒng)里有不同角色:

總設(shè)計(jì)師(Meta-Designer): 負(fù)責(zé)拆解任務(wù)。

結(jié)構(gòu)設(shè)計(jì)師(Designer): 搭建初始方案。

審查員(Inspector + Refiner): 檢查結(jié)構(gòu)和連通性。

反饋查詢員(Active Env Querier): 跑仿真并從大量反饋數(shù)據(jù)內(nèi)抽取對(duì)任務(wù)最有用的信息報(bào)告。

分析/優(yōu)化員(Refiner): 解讀反饋,提出修改。

團(tuán)隊(duì)測(cè)試了多個(gè)主流模型,發(fā)現(xiàn)在這套工作流下,Gemini 2.5 Pro的表現(xiàn)很突出。

比如在優(yōu)化投石機(jī)時(shí),Gemini 2.5 Pro能根據(jù)仿真反饋,識(shí)別出“底座太小導(dǎo)致結(jié)構(gòu)失衡”、“旋轉(zhuǎn)軸方向錯(cuò)誤導(dǎo)致無(wú)法發(fā)力”等問(wèn)題,并提出“移除舊底座”、“重新定位手臂和容器”、“構(gòu)建新底座”等修改方案。

對(duì)比表格顯示,這套“多角色分層設(shè)計(jì)”(Hierarchical Design)策略,在投石機(jī)(Catapult)和小車(Car)任務(wù)上,其平均分(Mean)和最高分(Max)都顯著優(yōu)于以Gemini為代表的部分“單一模型”或簡(jiǎn)單的“迭代修改”策略。

關(guān)鍵這些成果是模型自己在真實(shí)反饋里逐步學(xué)會(huì)調(diào)整的

怎么讓AI越造越聰明?

有了工作流還不夠,還得讓模型能“自我進(jìn)化”。研究團(tuán)隊(duì)引入了強(qiáng)化學(xué)習(xí)(RL),具體用了一種叫RLVR(基于可驗(yàn)證反饋的強(qiáng)化學(xué)習(xí))的策略。

BesiegeField的仿真反饋就是現(xiàn)成的“獎(jiǎng)勵(lì)信號(hào)”(Reward):比如投擲距離多遠(yuǎn)?能不能成功執(zhí)行任務(wù)?能運(yùn)行多久?

研究團(tuán)隊(duì)用了Pass@k Training方法(即在k次嘗試中選獎(jiǎng)勵(lì)最大的那個(gè)樣本作為訓(xùn)練信號(hào)),對(duì)Qwen2.5-14B-Instruct這個(gè)模型進(jìn)行持續(xù)微調(diào)。

效果很明顯。隨著迭代次數(shù)增加,模型設(shè)計(jì)的結(jié)構(gòu)越來(lái)越好,投擲距離也越來(lái)越遠(yuǎn)。

定量數(shù)據(jù)也顯示,在“Cold-Start + RL”(用少量好例子啟動(dòng)+強(qiáng)化學(xué)習(xí))的策略下,模型在小車任務(wù)上的最高分達(dá)到了45.72,投石機(jī)任務(wù)的平均分和最高分也都是最優(yōu)的。

這是首次證明,LLM確實(shí)能借助RL,在仿真反饋中持續(xù)提升機(jī)械設(shè)計(jì)能力

AI創(chuàng)造力的新邊界

總的來(lái)說(shuō),BesiegeField帶來(lái)的不只是一個(gè)仿真平臺(tái),更像是一種新的“結(jié)構(gòu)創(chuàng)造范式”

它把復(fù)雜的機(jī)械設(shè)計(jì),轉(zhuǎn)變成了一個(gè)AI擅長(zhǎng)的“結(jié)構(gòu)化語(yǔ)言生成任務(wù)”;

它提供了一個(gè)閉環(huán),讓模型能在真實(shí)的物理反饋中,學(xué)會(huì)理解力學(xué)規(guī)律和結(jié)構(gòu)協(xié)同;

它支持任務(wù)難度可控、流程模塊化、結(jié)果可定量評(píng)估;

更重要的是,它提供了一個(gè)觀察AI如何獲得“空間智能”和“物理智能”的起點(diǎn)。

研究團(tuán)隊(duì)期待,未來(lái)AI造的不僅是投石機(jī),而是能奔跑、搬運(yùn)、協(xié)作的各種復(fù)雜結(jié)構(gòu)——讓語(yǔ)言模型真正具備“造出會(huì)動(dòng)的東西”的能力

Copyright 2017-2025 新車測(cè)評(píng)網(wǎng) 版權(quán)所有  ICP備18049689號(hào)-30
日韩高清一区_国产亚洲一区二区三区四区_亚洲国产一二三_久热精品视频
欧美在线综合视频| 午夜精品久久久久久久99樱桃| 国产在线拍偷自揄拍精品| 国产一区91| 在线国产精品播放| 亚洲国产精品久久久久婷婷884 | 欧美日韩一区二区国产| 欧美色图天堂网| 国产欧美高清| 国产精品成人观看视频免费| 国产一区二区按摩在线观看| 亚洲高清久久久| 伊人久久大香线蕉综合热线 | 亚洲精品久久在线| 国产精品99久久久久久久女警| 亚洲自拍三区| 另类欧美日韩国产在线| 欧美日韩另类一区| 国产欧美韩国高清| 亚洲国产精品999| 中日韩美女免费视频网站在线观看| 亚洲女ⅴideoshd黑人| 久久婷婷av| 欧美日韩一卡| 今天的高清视频免费播放成人 | 欧美在线3区| 欧美黑人在线观看| 国产精品久久久亚洲一区| 极品尤物久久久av免费看| 在线亚洲高清视频| 久久久噜噜噜久久中文字幕色伊伊| 欧美伦理影院| 韩日欧美一区二区| 亚洲深夜影院| 欧美69wwwcom| 国产视频综合在线| 亚洲手机在线| 欧美xxxx在线观看| 国产亚洲激情| 亚洲网址在线| 欧美精品在线免费播放| 国产视频在线观看一区| 一区二区三区四区国产| 免费h精品视频在线播放| 国产日产欧产精品推荐色| 99在线精品观看| 能在线观看的日韩av| 国产主播一区二区| 亚洲图片你懂的| 欧美大胆人体视频| 激情国产一区二区| 午夜精品影院| 欧美日韩在线免费视频| 亚洲激情婷婷| 久久偷看各类wc女厕嘘嘘偷窃| 国产精品啊v在线| 亚洲精品一区二区在线观看| 亚洲一区二区成人| 欧美日本精品一区二区三区| 在线观看一区二区精品视频| 欧美一区二区三区四区在线观看地址| 欧美日韩综合不卡| 久久精品人人做人人爽电影蜜月| 欧美日韩综合另类| 亚洲三级性片| 免费成人网www| 永久域名在线精品| 久久久久久久精| 国产一区日韩一区| 欧美一区二区三区播放老司机 | 国产欧美一区二区色老头| 中文一区字幕| 欧美日韩免费| 亚洲最新视频在线播放| 欧美另类高清视频在线| 亚洲毛片在线观看.| 男人的天堂亚洲在线| 伊人久久综合| 裸体歌舞表演一区二区| 狠狠色狠狠色综合日日小说 | 欧美日韩国产成人精品| 亚洲看片一区| 欧美日韩精品三区| 在线亚洲伦理| 国产精品日韩在线播放| 午夜激情综合网| 国产日韩精品一区二区三区| 欧美一区二区| 好吊日精品视频| 久久综合电影| 亚洲国产一成人久久精品| 欧美国产精品v| 亚洲人成网站777色婷婷| 欧美精品二区| 亚洲私人黄色宅男| 国产精品视频不卡| 欧美在线视频观看免费网站| 国产一区二区你懂的| 久久久久久久成人| 亚洲国产成人在线播放| 欧美国产一区在线| 在线视频亚洲欧美| 国产免费观看久久黄| 久久精品国产清自在天天线| 影音先锋成人资源站| 欧美.com| 中文在线一区| 国产日韩欧美一区二区| 久久久久久久久久久久久女国产乱 | **欧美日韩vr在线| 欧美激情一区二区三区| 中文国产成人精品久久一| 国产伦精品一区二区三区照片91| 久久国产视频网| 亚洲国产精品成人综合| 欧美日韩在线观看视频| 欧美一区二区三区免费看| 亚洲成人在线观看视频| 欧美日韩精品一区二区天天拍小说| 亚洲专区一区二区三区| 好吊日精品视频| 欧美日本亚洲韩国国产| 午夜精品久久久久久久久久久久| 国产一区二区三区自拍| 欧美成人中文| 午夜精品视频| 亚洲国产欧美久久| 国产精品久久久久影院色老大 | 国产一区欧美日韩| 免费亚洲电影在线观看| 国产精品99久久99久久久二8| 国产日韩精品在线| 欧美华人在线视频| 久久er精品视频| 99精品欧美一区| 国外成人网址| 欧美色网在线| 老司机午夜精品视频在线观看| 正在播放欧美视频| 在线观看日韩国产| 国产精品主播| 欧美人与性动交cc0o| 欧美综合国产| 一区二区冒白浆视频| 好看的日韩视频| 国产精品福利久久久| 蜜臀va亚洲va欧美va天堂 | 女主播福利一区| 欧美亚洲日本网站| 亚洲理伦在线| 黄色日韩在线| 国产精品久久久久aaaa| 欧美freesex8一10精品| 午夜精品一区二区三区四区| 亚洲精品视频中文字幕| 国产一区再线| 国产精品久久久久aaaa九色| 欧美成年人视频| 久久精品国产69国产精品亚洲| 在线视频你懂得一区二区三区| 樱桃成人精品视频在线播放| 国产麻豆视频精品| 欧美午夜www高清视频| 欧美大片免费观看| 国产乱人伦精品一区二区| 欧美日本在线| 蜜臀av性久久久久蜜臀aⅴ四虎 | 久久综合网络一区二区| 欧美在线高清| 亚洲制服少妇| 日韩亚洲欧美在线观看| 在线国产亚洲欧美| 国产亚洲精品久久久| 国产精品家庭影院| 欧美日韩精品二区第二页| 欧美成人综合网站| 久久久久一区| 久久aⅴ国产欧美74aaa| 亚洲欧美影院| 亚洲香蕉视频| 一本综合精品| 日韩视频一区| 亚洲区国产区| 亚洲国产一区二区三区在线播 | 黑人操亚洲美女惩罚| 国产日韩欧美在线看| 国产精品免费看片| 国产精品大片wwwwww| 欧美日韩裸体免费视频| 欧美激情一区二区三区蜜桃视频 | 免费观看日韩av| 久久一区二区精品| 久久久久久**毛片大全| 久久国产精品久久久久久久久久 | 日韩午夜激情av| 亚洲久久一区二区| 日韩天堂av| 日韩香蕉视频| 一本色道久久加勒比88综合| 日韩午夜三级在线| 一本一本大道香蕉久在线精品| 99re8这里有精品热视频免费| 亚洲精品国产系列| 最新中文字幕亚洲|