AI对决超级玛丽!Claude 3.7强势登顶,Gemini与GPT-4o纷纷落败,谁将称霸游戏界?

AI新闻资讯2个月前更新 小悠
10 0

在这场引人入胜的AI与经典游戏《超级马力欧兄弟》的巅峰对决中,加州大学圣地亚哥分校Hao人工智能实验室的战报揭示了AI技术的惊人进步。Anthropic的Claude 3.7模型在这场别开生面的“马力欧”大乱斗中,以其卓越的表现力压群雄,荣登“最强AI马力欧”的宝座,而Claude 3.5则紧随其后。相比之下,谷歌的Gemini 1.5 Pro和OpenAI的GPT-4o这两位AI界的重量级选手却意外失利,表现令人意外。

这场比赛的独特之处在于,它并非在传统的红白机上进行,而是通过一个名为GamingAgent的高科技模拟器展开。这个模拟器作为AI与游戏世界的桥梁,使得AI能够接收简洁的指令,如“跳”或“躲”,并实时响应游戏中的变化。此外,AI还能利用游戏截图来增强其对环境的理解,并编写Python代码来控制马力欧的行动,从而在游戏中展现出令人惊叹的操作技巧。

然而,赛场上的战况却出人意料。那些以推理能力著称的AI模型,如OpenAI的o1,竟然表现不如一些非推理型选手。原因在于,推理模型需要花费数秒钟进行深思熟虑才能做出决策,而在《超级马力欧兄弟》这种实时游戏中,反应速度才是关键。一秒钟的迟疑,就可能导致马力欧命丧黄泉。

尽管游戏已成为AI竞技的重要舞台,但也有专家对此持保留态度。他们认为,游戏世界毕竟是虚拟的,与真实世界相比,还是过于简单和抽象。AI可以从中无限量地刷经验值,积累理论数据,但这些AI模型的真实能力究竟如何,还有待实战检验。OpenAI的研究科学家安德烈・卡帕西甚至发出了评估危机的灵魂拷问,让人不禁陷入沉思。

尽管如此,围观AI花式玩转超级玛丽,依然是一场赏心悦目的技术秀,它生动地展现了AI技术的日新月异,也为我们打开了一扇窥探未来的窗口。谁能想到,曾经只能在棋盘上运筹帷幄的AI,如今也能在游戏世界里大显身手?或许在不久的将来,AI真的能统治游戏界,甚至超越人类玩家,成为游戏界的真・王者!让我们拭目以待!

© 版权声明

相关文章