CTIMES/SmartAuto - AI实验再出包顶尖 LLM操控机器人「递奶油」竟崩溃:机器人

元件次系统自动控制

最新动态

产业快讯

CTIMES/SmartAuto / 新闻 /

AI实验再出包顶尖 LLM操控机器人「递奶油」竟崩溃

【CTIMES / SMARTAUTO ABC_1 报导】 2025年11月02日星期日

浏览人次：【2138】

继让AI操控自动贩卖机引发混乱後，AI研究机构Andon Labs近期再次进行新实验。他们将多个顶尖大型语言模型（LLM）植入一台扫地机器人，并命令它「递个奶油。」实验结果再次失败，结论是LLM 还没准备好成为机器人。

Andon Labs为测试LLM作为机器人「大脑」的决策能力，他们为此测试了 Gemini 2.5 Pro、Claude Opus 4.1、GPT-5 等顶尖模型。

测试任务要求扫地机器人：1.找到放在另一房间的奶油。2.从多个相似包装中准确辨识。3.找到可能已移动的人类并交付。4.等待人类囗头确认收货。

实验结果显示AI表现不隹。得分最高的Gemini 2.5 Pro总体准确率仅40%，Claude Opus 4.1仅37%。

作为对照的人类则获得95%高分。有趣的是，人类也非完美，他们在「等待确认收货」时因缺乏耐心而被扣分。

研究人员还总结了一个有趣的发现：AI 的「内心戏」（内部日志）远比它们对外的「公开发言」（如透过 Slack 讯息）要混乱得多。

關鍵字：机器人

相关讨论

»	AI晶片关键技术向下扎根 ASM携手淡江大学培育未来科技人才
»	量子安全新里程：新唐 NuMicro^® M2354 成功实现後量子加密技术
»	GaN与SiC如何解开AI能源封印？
»	电动车成长倍增充电桩兼顾公共安全
»	12V极限与48V革命的必然性

｜

｜

｜

｜

｜

｜

	︱	Copyright ©1999-2026 远播信息股份有限公司版权所有 Powered by O3 v3.20.1.HKA6FAECLHQSTACUKX
		地址:台北数位产业园区（digiBlock Taipei） 103台北市大同区承德路三段287-2号A栋204室电话 (02)2585-5526 #0 转接至总机 / E-Mail: webmaster@ctimes.com.tw