账号:
密码:
最新动态
 
产业快讯
 
CTIMES/SmartAuto / 新闻 /
AI实验再出包 顶尖 LLM操控机器人「递奶油」竟崩溃
 

【CTIMES / SMARTAUTO ABC_1 报导】    2025年11月02日 星期日

浏览人次:【2138】

继让AI操控自动贩卖机引发混乱後,AI研究机构Andon Labs近期再次进行新实验。他们将多个顶尖大型语言模型(LLM)植入一台扫地机器人,并命令它「递个奶油。」实验结果再次失败,结论是LLM 还没准备好成为机器人。

Andon Labs为测试LLM作为机器人「大脑」的决策能力,他们为此测试了 Gemini 2.5 Pro、Claude Opus 4.1、GPT-5 等顶尖模型。

测试任务要求扫地机器人:1.找到放在另一房间的奶油。2.从多个相似包装中准确辨识。3.找到可能已移动的人类并交付。4.等待人类囗头确认收货。

实验结果显示AI表现不隹。得分最高的Gemini 2.5 Pro总体准确率仅40%,Claude Opus 4.1仅37%。

作为对照的人类则获得95%高分。有趣的是,人类也非完美,他们在「等待确认收货」时因缺乏耐心而被扣分。

研究人员还总结了一个有趣的发现:AI 的「内心戏」(内部日志)远比它们对外的「公开发言」(如透过 Slack 讯息)要混乱得多。

關鍵字: 机器人 
相关新闻
中钢带头汇聚产学研能量 助攻机器人动力系统供应链
日本航空启动人形机器人试验 对抗高龄化引发的机场劳动力荒
2026汉诺威工业展闭幕 生成式AI与人形机器人成亮点
研华打造Edge AI关键基础建设 引领Physical AI渗透产业场域
现代汽车与DEEPX结盟 发表次世代实体AI运算平台
相关讨论
  相关文章
» AI晶片关键技术向下扎根 ASM携手淡江大学培育未来科技人才
» 量子安全新里程:新唐 NuMicro® M2354 成功实现後量子加密技术
» GaN与SiC如何解开AI能源封印?
» 电动车成长倍增 充电桩兼顾公共安全
» 12V极限与48V革命的必然性


刊登廣告 新聞信箱 读者信箱 著作權聲明 隱私權聲明 本站介紹

Copyright ©1999-2026 远播信息股份有限公司版权所有 Powered by O3  v3.20.1.HKA6FAECLHQSTACUKX
地址:台北数位产业园区(digiBlock Taipei) 103台北市大同区承德路三段287-2号A栋204室
电话 (02)2585-5526 #0 转接至总机 /  E-Mail: webmaster@ctimes.com.tw