英伟达Jim Fan:机械人行业仍正在紊乱中将来成长

发布时间:2025-12-30 17:42

  正在当今科技敏捷成长的时代,人工智能和机械人范畴的立异似乎进入了一个全新的阶段。然而,英伟达的机械人营业担任人Jim Fan比来正在社交上的长文中发出了,指出这一范畴仍然面对着严沉的紊乱取不确定性。虽然硬件手艺曾经取得了显著的前进,但正在软件迭代、尺度制定和手艺线的选择上,整个行业却仍然处于一种无序的形态。Jim Fan正在其长文中坦言,当前支流的视觉-言语-动做模子(VLA)手艺线并不合适机械人现实需求。他认为,这一模子的预锻炼体例取机械人所需的使用场景之间存正在着底子性的错位。为此,他暗示将押注于视频世界模子做为更适合的替代方案。这一概念激发了业内的普遍关心,特别是正在人工智能其他范畴快速成长的布景下,机械人手艺的根本性问题愈发显得凸起。Jim Fan指出,虽然目前的多款机械人如Optimus、e-Atlas、Figure等展示了杰出的工程手艺,但其硬件靠得住性却成为限制软件开辟速度的最大妨碍。他提到,现有的人工智能手艺尚未能充实阐扬这些先辈硬件的全数潜力,身体的能力跨越了大脑的批示能力。取人类分歧,机械人无法修复,面对的过热、电机损坏等问题时有发生,这使得运营团队必需全力以赴进行支撑。他感伤道,独一能跟着规模增加的,只要我的耐心。这一表述了机械人研发中人力成本高企和迭代效率低下的现实窘境,使人们对机械人行业的将来成长充满了疑虑。正在谈到行业尺度时,Jim Fan将目前的基准测试情况描述为史诗级灾难。他指出,取狂言语模子范畴已构成的MMLU、SWE-Bench等共识性尺度分歧,机械人行业正在硬件平台、使命定义、评分尺度等方面均缺乏同一尺度。很多公司正在发布旧事时会姑且定义本人的基准测试,声称达到了当前最佳(SOTA)程度,这种做法不只紊乱,并且缺乏科学严谨性。他强调,2026年我们必需做得更好,遏制将可复现性和科学规律视为二等。这一呼吁反映了行业内火急需要成立同一尺度以确保手艺前进的共识。Jim Fan对当前支流的VLA模子提出了底子性质疑。他认为,这一模子正在预锻炼的视觉言语模子根本上嫁接动做模块的做法存正在两个焦点问题:起首,VLM中的大大都参数是为言语和学问办事,而非为物理学办事;其次,为了实现高条理理解,视觉编码器会自动丢弃初级细节,而这些细小细节对于机械人的工致操做至关主要。他指出,VLM的预锻炼方针取机械人需求之间存正在错位,没有来由相信VLA的机能会跟着VLM参数的添加而扩展。因而,他决定转向视频世界模子,认为这将是更适合机械人策略的预锻炼方针。Jim Fan的概念激发了业内的普遍会商。一位网友质疑,若是视频世界模子更优,为什么现有的Helix、GR00TN1等模子仍基于VLM建立?Jim Fan对此回应称,这些都是2025年的模子,等候2026年可以或许推出更为先辈的大模子。Jim Fan的言论不只了机械人行业当前面对的瓶颈和挑和,也为将来的成长指了然标的目的。行业内需要对现有的手艺线进行深刻反思,沉塑成长计谋,以便正在将来的合作中占领一席之地。2026年,大概将成为机械人行业转型取成长的环节一年。前往搜狐,查看更多。