开云体育
开云体育旷视联创唐文斌再创业:今年具身智能有望跑通规模化闭环DeepSeek时刻也不是很远
具身智能的ChatGPT时刻,什么时候能够到来,业内还没有共识,机器人上春晚则有望延续这个行业的热度。
这也吸引了不少企业入局,原力灵机就是其中的新玩家。2月10日,在成立的第330天,这家公司举办了首次技术开放日,核心创始团队全员现身。
这家公司有着深深的旷视背景烙印,联合创始人&CEO唐文斌是身兼千里科技和阶跃星辰董事长的印奇在清华姚班的同学,也是印奇在旷视的创业伙伴之一。
旷视6号员工、原算法总监范浩强如今是原力灵机的联合创始人,旷视原核心研究员周而进和汪天才则是合伙人,这些在旷视深耕计算机视觉的天才团队希望为机器人造模型。
原力灵机成立不到一年,已完成三轮数亿元融资,旷视的老股东阿里、启明、联想创投等再支持,还吸引了君联资本、蔚来资本、洪泰基金和量化巨头九坤等机构。
唐文斌此次提出了具身原生的概念,即数据原生、训练原生和框架原生,表示要从第一行代码就为机器人而写,“今年将是具身原生的元年”。
原力灵机现场发布了全球首个具身原生大模型DM0,以及具身原生开发框架Dexbotic 2.0和具身原生应用量产工作流DFOL。
DM0模型具备2.4B参数,由原力灵机联合阶跃星辰从零开始训练的具身原生大模型,融合多类数据,具备跨机型的泛化与迁移能力,并对外开源。
“这不仅仅是一个能在机器人上运行的大模型,而是一个智能本质和形成机制都根植于物理交互的新AI范式。”唐文斌说。
智源研究院院长王仲远认为,机器人硬件进步很快,但具身智能模式还没到ChatGPT时刻,距离大规模应用还有比较大的gap。
清华大学电子工程系长聘教授汪玉则提到,目前机器人仍局限在单一工作台,在长程任务、跨模态等方面还有很大问题,需要从训练、基础设施、机器和物理环境交互等层面去解决。
至于中美目前在具身智能上的差异,汪玉则认为,美国在模型、数据等方面做得更早,中国有望在落地方面很快赶上。
“中国在具身上的投入强度已经比美国大,很多人说这是泡沫,但我觉得这可能是个好事。”汪玉表示。
具身智能的ChatGPT时刻什么时候能够到来?嘉宾们认为,这需要定义什么是ChatGPT时刻。
阶跃星辰创始人&CEO姜大昕认为,ChatGPT时刻的标志是零样本地去做泛化,具身智能的ChatGPT时刻将面临场景、任务和目标泛化挑战和计算机视觉等具身技术挑战。
在唐文斌看来,ChatGPT时刻是机器人变得有用可信赖,即在限定场景闭环解决所有问题,ROI算明白,实现批量化应用。“现在模型能力进展非常大,这个时刻并不是很远。”
“当然还有DeepSeek时刻,全民都感知,这就要从工业物流走向商用、走向TOC。这个时刻还要再晚一些,但我觉得也不会很远。 ”唐文斌说。
星海图创始人&CEO高继扬认为,具身智能今年会是智能爆发、应用闭环的一年。
“智能爆发的结果一定在某些领域形成应用的外溢,同时配合供应链和整机,尤其中国会显著比美国强得多,周期会快5到10倍,成本低5到10倍。”
王仲远:现在具身智能特别火热,但我看到蛮多隐忧。一方面,硬件确实进步很快,现在连干活也开始又快又稳了,但它连续工作的稳定性、安全性、电池等还有一系列的问题要解决。
在具身模型上,还远没有到ChatGPT时刻,尤其当具身智能模型和硬件真机部署之后,离大规模应用还是有比较大的gap。技术路线整体还处于发展当中,还没有到彻底突破的阶段。
汪玉:现在的机器人应用,虽然已经有很大进步,但还是局限在一个工作台上,把大小脑配合起来完成稍微长一点的任务,稍微跨多个模态,还是很难的问题。
这一方面是训练维度,比如强化学习,能有更多进步。另一维度,从物理环境和机器交互的过程中,怎么样更容易感知,去解决问题。
汪玉:美国在模型、数据的层面,更早地开始做。但到落地这个层面,中国可以很快跟上。中国在具身上已经有比美国更强的投入了,有很多人说这是泡沫,我个人觉得可能是好事。
中国整个产业链、供应链比较完整,如果把应用开放的再多,在模型和应用层面的投入再加大,有可能比美国有更快的突破。
王仲远:美国那边做具身智能,投资人会看创业团队里面有没有华人,有华人的话才能确保有可能成功。另外,硬件经常损坏,我们经常一修就得两个礼拜,但听说美国得三个月。
可以看到中国确实在制造业上有优势,也证明整个行业依然处在早期,都处在快速发展和迭代的阶段,所以远没有到谁优谁劣、谁领先谁落后。
姜大昕:怎么定义ChatGPT时刻?我觉得一个标志就是零样本地去做泛化。相较自然语言,我觉得具身智能的ChatGPT时刻会更加困难。
第一是具身的泛化,需要场景泛化,任务泛化,和目标泛化。泛化维度不一样,导致我们在哪个维度上定义ChatGPT时刻,不同人会有不同的看法。
第二是具身智能技术牵扯到计算机视觉。它有些非常根本性的问题,还没有形成共识,比如究竟怎么编码,怎么做自监督预训练,都需要突破,才能到ChatGPT时刻。
高继扬:对于具身智能的ChatGPT时刻,我觉得是真的看到了它在某些限定范围内具备商业价值的时刻,但它要具备的要素更多。
今年是应用闭环的一年,今年将迎智能爆发,结果一定是在某些领域形成应用外溢,同时配合供应链和整机,尤其中国会显著比美国强得多,周期会快5到10倍,成本低5到10倍。
唐文斌:我觉得姜大昕讲的ChatGPT时刻要求蛮高的,这已经是AGI时刻。我心中的定义,是它变得有用、可信赖。
它可以在限定场景,真正闭环解决所有的问题,ROI算明白,批量化应用。这个时候就是ChatGPT时刻,现在模型的能力进展非常大,这并不是很远。
当然还有DeepSeek时刻,全民都感知,这就要从工业物流走向商用、走向TOC。这个时刻还要再晚一些,但我觉得也不会很远。
提问:在具身智能领域,今年最期待看到的一个非常具体的事情或能解决的任务是什么?
汪玉:我希望能形成一套云边端配合的体系,改变楼的装修,以及所有建筑和基础设施的能力,去构建面向机器和人共生环境的基础设施,这套方案我觉得今年可能有一个雏形出来。
王仲远:我最期待的是标准,现在不管是硬件的标准、数据的标准,包括模型输出的标准,整个生态非常碎片化。如果标准能够有突破,它有可能极大促进整个产业的发展。
高继扬:我期待今年能够在生产力端看到一条明确的增长路径,让后两年之内能够有单一场景,比如上万台的出货,这是整个行业都迫切需要的。
唐文斌:我的目标是在一个场景、一千台持续运行,不要很多场景,不是靠加法做起来,某种程度上可以走通一个场景的规模化闭环,我觉得今年有机会。返回搜狐,查看更多


2026-02-11
浏览次数:
次
返回列表