AI对决超级玛丽！Claude 3.7强势登顶，Gemini与GPT-4o纷纷落败，谁将称霸游戏界？

在这场引人入胜的AI与经典游戏《超级马力欧兄弟》的巅峰对决中，加州大学圣地亚哥分校Hao人工智能实验室的战报揭示了AI技术的惊人进步。Anthropic的Claude 3.7模型在这场别开生面的“马力欧”大乱斗中，以其卓越的表现力压群雄，荣登“最强AI马力欧”的宝座，而Claude 3.5则紧随其后。相比之下，谷歌的Gemini 1.5 Pro和OpenAI的GPT-4o这两位AI界的重量级选手却意外失利，表现令人意外。

这场比赛的独特之处在于，它并非在传统的红白机上进行，而是通过一个名为GamingAgent的高科技模拟器展开。这个模拟器作为AI与游戏世界的桥梁，使得AI能够接收简洁的指令，如“跳”或“躲”，并实时响应游戏中的变化。此外，AI还能利用游戏截图来增强其对环境的理解，并编写Python代码来控制马力欧的行动，从而在游戏中展现出令人惊叹的操作技巧。

然而，赛场上的战况却出人意料。那些以推理能力著称的AI模型，如OpenAI的o1，竟然表现不如一些非推理型选手。原因在于，推理模型需要花费数秒钟进行深思熟虑才能做出决策，而在《超级马力欧兄弟》这种实时游戏中，反应速度才是关键。一秒钟的迟疑，就可能导致马力欧命丧黄泉。

尽管游戏已成为AI竞技的重要舞台，但也有专家对此持保留态度。他们认为，游戏世界毕竟是虚拟的，与真实世界相比，还是过于简单和抽象。AI可以从中无限量地刷经验值，积累理论数据，但这些AI模型的真实能力究竟如何，还有待实战检验。OpenAI的研究科学家安德烈・卡帕西甚至发出了评估危机的灵魂拷问，让人不禁陷入沉思。

尽管如此，围观AI花式玩转超级玛丽，依然是一场赏心悦目的技术秀，它生动地展现了AI技术的日新月异，也为我们打开了一扇窥探未来的窗口。谁能想到，曾经只能在棋盘上运筹帷幄的AI，如今也能在游戏世界里大显身手？或许在不久的将来，AI真的能统治游戏界，甚至超越人类玩家，成为游戏界的真・王者！让我们拭目以待！