• 最近访问:
发表于 2025-02-25 15:34:50 股吧网页版
不会打游戏的大模型不是好AI?甲骨文最强模型用《宝可梦》当“期末考”
来源:财联社

K图 ORCL_0]

  甲骨文周一发布了其最强模型Claude 3.7 Sonnet,据甲骨文称,该模型同时具备推理能力和传统实时生成文本的能力,是市面上唯一的混合模型。

  Claude 3.7 Sonnet的一个独特功能是其能够进行拓展思考,与OpenAI的o3-mini和Deepseek R1一样,它可以在增加计算和时间成本的基础上来推理更具挑战性的问题。

  而测试Claude 3.7 Sonnet推理能力的一项重要测试就是打游戏。

  据甲骨文周一的博客文章显示,该公司在《精灵宝可梦(红)》测试了Claude 3.7 Sonnet,为模型配备了基本内存、屏幕像素输入和功能调用,以便模型可以连续闯关并不受模型的上下文限制。

  好消息是,3.7版本的模型与3.0版本相比“大有出息”。上一个版本3.0连离开游戏新手村都做不到,而3.7已经成功走到宝可梦道馆Boss身前,并击败道馆领袖赢得了徽章。

image

  不过,甲骨文并未公布3.7花费了多少计算能力才做到这一步,以及每闯完一关所耗费的时间。甲骨文只透露,3.7 Sonnet执行了35000次操作才打到最后一位道馆馆主Surge处。

  AI也得会打游戏

  利用游戏作为人工智能模型的基准测试实际上在业内也并不罕见,加州理工大学和英伟达的一支团队此前就推出过Voyager组件,与GPT-4交互来攻略另一款热门游戏《我的世界》。

image

  Voyager据介绍包括三个关键模块:最大化探索的自动课程;用于存储和检索复杂行为的技能库与生成可执行代码的新迭代提示机制。据研究团队介绍,Voyager表现出强大的情境学习能力,获得的独特物品、行近距离以及解锁成就的速度都优于基准人工智能模型。

  上周,微软也官宣加入了AI打游戏的潮流之中。微软推出了一款模型Muse可以生成游戏视觉效果和控制器输入,称其可以支持人们在设计游戏时的创造力,并已经在多人竞技战斗游戏《Bleeding Edge》中进行训练。

  Gaming AI公司副总裁Fatima Kardar表示,Muse的突破之处在于它对3D游戏的详细了解,包括游戏物理以及游戏如何对玩家的控制操作做出反应。这意味着该模型能够创建一致且多样化的游戏玩法,进一步帮助到游戏创作者。

郑重声明:用户在财富号/股吧/博客等社区发表的所有信息(包括但不限于文字、视频、音频、数据及图表)仅代表个人观点,与本网站立场无关,不对您构成任何投资建议,据此操作风险自担。请勿相信代客理财、免费荐股和炒股培训等宣传内容,远离非法证券活动。请勿添加发言用户的手机号码、公众号、微博、微信及QQ等信息,谨防上当受骗!
作者:您目前是匿名发表   登录 | 5秒注册 作者:,欢迎留言 退出发表新主题
郑重声明:用户在社区发表的所有资料、言论等仅代表个人观点,与本网站立场无关,不对您构成任何投资建议。用户应基于自己的独立判断,自行决定证券投资并承担相应风险。《东方财富社区管理规定》

扫一扫下载APP

扫一扫下载APP
信息网络传播视听节目许可证:0908328号 经营证券期货业务许可证编号:913101046312860336 违法和不良信息举报:021-34289898 举报邮箱:jubao@eastmoney.com
沪ICP证:沪B2-20070217 网站备案号:沪ICP备05006054号-11 沪公网安备 31010402000120号 版权所有:东方财富网 意见与建议:021-54509966/952500