
4月19日,2026北京亦庄东谈主形机器东谈主半程马拉松举行。算作全球首个东谈主形机器东谈主马拉松赛事的第二届,本届比赛的参赛“选手”已从旧年的蹒跚学步进化为全速奔波。本届冠军“闪电”机器东谈主和上一届冠军“天工”机器东谈主均搭载了奥比中光的Gemini 330系列双目3D相机。

全球首个东谈主形机器东谈主半程马拉松比赛冠军“天工Ultra”的“兄弟”——天工机器东谈主与现场不雅众碰头。
自2015年以来,奥比中光执续深耕机器东谈主赛谈,在行业诈欺与阛阓拓展方面积聚了最初上风。近两年,奥比中光也执续完善居品矩阵,推出Gemini 330系列双目3D相机,接受了特意为机器东谈主场景自研的深度引擎芯片MX6800。南边+记者邀请奥比中光泛机器东谈主居品中心居品总监李威进行访谈,筹商刻下东谈主形机器东谈主发展近况以及3D视觉在机器东谈主范围的要津发展标的。

从“能不成走”到“能不成稳”的可靠性解围
南边+:本年的东谈主形机器东谈主马拉松赛事和旧年比拟,有什么现实变化?
李威:2025年更多是在解说“东谈主形机器东谈主不错参与长距离通顺”,而2026年启动复兴“这种智力是否具备工程上的可靠性”。
夙昔人人更多关爱机器东谈主“能不成走”。但这类长距离、灵通环境的挑战,中枢磨真金不怕火是感知系统的安谧性、环境默契智力、系统永劫分运行的鲁棒性。
更蹙迫的是,这类赛事正在酿成一个变化:夙昔各家的智力更多是在各自设定的场景中展示,本年参赛机器东谈主数目增长近15倍,参赛队伍数目增长近5倍,人人在相对协调的律例、更接近真实宇宙的环境下进行逼近检会,使赛事成为了一个具有高可比性的“行业测试场”,也推动了行业加快逼近检会与时间竞争。
南边+:为什么马拉松会成为一个蹙迫的测试体式?
李威:马拉松的价值远超跑步本人,它被视为一个高强度、长周期的系统压力测试:
首先,它是一个非凡接近真实宇宙的“压力场”。马拉松同期具备永劫分相连运行、不可整个限定的灵通环境、以及感知/方案/通顺多系统协同这三个中枢特征,这与机器东谈主异日投入真实诈欺场景的挑战高度吻合。
其次,亦然一个实验室劣势的“放大镜”。在受控的实验室中,很多微弱的软硬件隐患可能不会裸露;但在马拉松这种严苛环境下,任何微弱的系统抖动或算法偏差齐会被时分放大,从而暴清醒底层绸缪的不及。
此外,它照旧个非结构化地形的严苛磨真金不怕火。赛谈不是平坦的测试时局,而是由幽谷、坡谈、弯谈、窄小径段等10余种地形组成的“简化版真实宇宙”,其中还包含了几条接近90度的弯谈。这要求机器东谈主必须在路况、光照、地形不休变化的过程中长久保执安谧在线。

争议是时间从实验室走进现实宇宙的必经阶段
南边+:你怎么看待刻下“东谈主形机器东谈主是否实用”的争议?
李威:这种争议是时间从实验室走进现实宇宙的必经阶段。
一方面,回望2025年首届比赛,现场曾因机器东谈主大面积“蹒跚”和颠仆被称为“社死现场”。关系词仅用一年时分,2026年的测试已达周全要素经由闭环,完赛率与自主性大幅进步。咱们在这一年里也看到了机器东谈主在不同地点证据出的超过。这种从“蹒跚学步”到“慎重奔波”的质变,解说了中国东谈主形机器东谈主产业的发展速率与全球最初的实力。
另一方面,东谈主形机器东谈主的落地是一个长跑,应当允许它在非结构化环境中偶尔犯错并给以修正的契机。争议时时源于对近况的疑望,而价值产生于对异日的工程化鼓舞。
我以为,东谈主形机器东谈主会沿着“分层鼓舞”的逻辑落地。
第一层是如故达成现实诈欺的单点智力落地,在截至环境作念指定任务,变量可控,比如简便搬运、固定阶梯巡检。
第二层是正在发生的场景级落地,要津变化是:环境不再整个可控、任务有一定变化、需要一定泛化智力,这一层的中枢门槛是机器东谈主是否具备“对环境变化的符合智力”。
买球投注平台app中国官方下载第三层是异日的通用落地,简略在高度不细目的环境下达成多场景多任务,博亚体育app官方网站经管通器用身智能问题。
南边+:从时间角度看,东谈主形机器东谈主现在最大的瓶颈在那里?
李威:从感知的角度看,我以为,东谈主形机器东谈主濒临从“短时演示”向“永劫安谧运行”以及“多场景符合”跨越的瓶颈。
一是永劫数行下的“安谧性赤字”。短时分演示时时能覆盖系统性劣势,但一朝投入永劫分运行,感知数据是否执续可靠、系统是否累积纰谬等问题就会透澈裸露。
在一些真实诈欺场景中,视觉感知需要24小时以至7x24小时执续安谧输出高质地的深度信息,这对感知硬件的系统可靠性和算法的鲁棒性建议了严苛要求。
二是复杂多场景的“泛化困局”。机器东谈主在走出实验室后,必须面对真实场景中的强光、逆光、复杂材质以及动态庇荫等不可控变量,这些环境要素会对感知系统产生剧烈纷扰。
“多场景符合”要求机器东谈主具备极高的环境默契智力,简略证据不同地形及时转出动态均衡与转向限定精度。
三是感知与通顺的“耦合”。在长距离通顺中,机器东谈主自身的振动、角度切换和动态暧昧会副作用于感知精度,怎么达成通顺景况下的感知安谧性是现在亟待经管的工程勤恳。

3D视觉模组优化助力具身智能量产落地
南边+:在你看来,3D视觉在刻下阶段的脚色是什么?
李威:我以为,机器东谈主系统频繁拆解为感知、方案、实施三层架构,而3D视觉正处于这一链条的最前端。
感知决定了方案的上限。淌若3D视觉提供的环境输入不安谧或存在纰谬,后端的AI方案大脑就会产生误判。举例在马拉松赛谈中,淌若视觉无法准确识别下坡斜度或升沉路面,机器东谈主即便有再雄伟的通顺均衡算法,也会因为“信息失真”而导致实施失效。
与此同期,3D视觉亦然长效运行“基石”。在长达几十分钟以至数小时的动态挑战中,3D视觉的脚色不再仅仅提供可用信息,而是需要在光照剧烈变化、动态庇荫以及复杂地形条目下,执续、安谧地为机器东谈主提供可靠的感知撑执。
在系统可靠性方面,在刻下从“考证可行性”转向“考证可用性”的要津期,感知系统的安谧性平直决定了整个这个词机器东谈主系统能否执续、重迭地高质地完成任务。莫得安谧且高鲁棒性的感知,东谈主形机器东谈主的“泛化智力”就无从谈起。
南边+:异日,在机器东谈主范围3D视觉的要津标的是什么?
李威:咱们以为会有以下几个趋势:
首先是“精度与安谧性兼顾”。夙昔行业倾向于追求极高的测量精度,但在出动机器东谈主范围,“能不成一直安谧责任”与“某一刻测得准”一样蹙迫。异日的3D视觉模组需要具备在时分、温度、通顺、迁徙、电磁等严苛环境下执续安谧输出高质地数据的智力。
其次是从单一传感到多模态深度会通。异日的感知不再是简便的“拍张深度图”,而是将RGB图像、深度数据以及AI语义默契深度有机聚拢。这意味着视觉系统不仅要看到“前线有退却”,还时势略那是“什么性质”的退却,扶植方案层进行更智能的成见。
3D视觉也正从室内受控环境走向全场景复杂环境。机器东谈主要竟然走入东谈主类糊口,必须驯服户外、工业、非结构化场景。这就要求3D视觉必须经管强光、逆光、户外复杂材质反射以及动态庇荫等挑战,在多变的环境中保执安谧可靠的感知智力。
此外,功耗、体积与算力也需要达到极致均衡。算作具身智能的传感器前端,3D视觉模组的功耗与体积优化是量产落地的先决条目。为了不霸占机器东谈主所需的算力,非凡是跟着3D视觉模组搭载数目的增多,还必须在保执高性能输出的同期,在3D视觉模组端及时生成3D数据。
异日,奥比中光将执续加大机器东谈主AI视觉与空间感知时间研发攻关,进一步深入机器东谈主“手—眼—脑”以及多传感器感知时间的改换会通,积极参与具身智能等机器东谈主产业演进。
南边+记者 许宁宁博亚(中国)体育app

备案号: