繼“大模型”之后,具身智能被業(yè)界認為將掀起人工智能領(lǐng)域的下一個浪潮。
日前,在北京市科學技術(shù)協(xié)會主辦的“互聯(lián)網(wǎng)3.0:未來互聯(lián)網(wǎng)產(chǎn)業(yè)發(fā)展論壇”上,北京航空航天大學機器人研究所名譽所長、中關(guān)村智友研究院院長王田苗提出,具身智能正在邁向“奇點”時刻,他預(yù)測到2035年,具身智能將達到380億美元的市場規(guī)模。不過在此之前,還需要解決一系列技術(shù)挑戰(zhàn)。
具身智能,是人工智能在物理世界的進一步延伸。它是實現(xiàn)思考、感知、行動三者有機智能融合的機器或系統(tǒng),既具有人機交互與自然語言理解的能力,同時又可以通過感知、認知、決策與時變環(huán)境及對象進行實時校準互動,協(xié)助人完成相應(yīng)的決策與行動任務(wù)。
王田苗介紹,近五年來,一些重要的科技進展為具身智能的發(fā)展提供了有利條件,諸如大模型實現(xiàn)了語義邏輯推理,使機器人執(zhí)行復(fù)雜任務(wù)成為可能;人形機器人的結(jié)構(gòu)、電機驅(qū)動、視覺感知等有了突破,使機器人有望在制造業(yè)、商業(yè)、危險作業(yè)、家庭養(yǎng)老等領(lǐng)域發(fā)揮作用;腦機接口技術(shù)通過對腦電信號進行編解碼,可以助力殘疾人實現(xiàn)對外部設(shè)備的控制,這些進展已經(jīng)將具身智能推向了技術(shù)爆發(fā)的門口。但他也毫不諱言地指出,當前,機器人在很多環(huán)境下還比較“智障”,不能理解場景需求,也無法排除干擾。
所以,人們試圖用“感知大模型”提高機器人在現(xiàn)實中的智能水平,試圖給各類機器人裝上一個通用的“大腦”。這在咨詢對話型具身智能上可以看到一定進展,不少人已經(jīng)在酒店、展覽等場景下體驗過。但是,這類“具身智能”還不能自主地行動和勞動,而要取得實質(zhì)性突破,在王田苗看來,還需要攻破一些難題。
“我們已經(jīng)在語言、視覺大模型上取得了進展,但在機器人領(lǐng)域還未找到類似的模型。而機器人大模型的突破,才能為通用人工智能機器人的研發(fā)奠定基礎(chǔ)?!蓖跆锩缯f。
他說,從進化的角度來看,如何協(xié)調(diào)語言認知智能、行為智能和視覺智能等三個計算空間,并高效地利用真實、優(yōu)質(zhì)、海量的數(shù)據(jù),也還需要突破。
如果突破了這些技術(shù)瓶頸,具身智能可能最先從哪些場景落地?
據(jù)王田苗了解,人們確實呼喚具身智能在不同場景上應(yīng)用。但目前學術(shù)界和工業(yè)界的共識是,具身智能的目的是提高生產(chǎn)力,不是為了替代人類的工作,未來其主要應(yīng)用場景可能更多聚焦于那些人類不愿做或難以勝任的任務(wù)。
他認為,學術(shù)界思考的是從解決復(fù)雜需求入手,而工業(yè)界強調(diào)生產(chǎn)的效率。為此,具身智能的應(yīng)用可能會先從商務(wù)場景開始,包括物流、低空經(jīng)濟等。此外,農(nóng)業(yè)勞作以及工業(yè)場景中的危險化工、核工業(yè)等也可能會較早落地。他說:“最后才有可能走向家庭,因為走向家庭涉及安全問題、成本問題、倫理問題等?!?/p>
中青報·中青網(wǎng)記者 張茜 來源:中國青年報
2024年05月13日 08 版
(責任編輯:梁艷)