• 最近访问:
发表于 2025-02-21 09:42:20 股吧网页版
山西证券:未来Grok 3有望在复杂推理场景深度应用
来源:财中社

  2月21日,事件描述:

  2月18日,Grok3(Beta版)正式发布,并面向X的PremiumPlus订阅用户率先开放,同时推出了每月30美元或每年300美元的SuperGrok单独订阅服务,订阅用户可解锁深度搜索等先进功能,而语音交互功能将在约一周后上线。

  山西证券发表研究报告称:

  Grok3和Grok3mini在多方面性能上均超过或媲美Gemini、DeepSeek和ChatGPT等对手。根据官方公布的测试数据,Grok3和Grok3mini在数学推理(AIME)、科学逻辑推理(GPQA)和代码写作(LCB)的基准测试上性能表现优于DeepSeekV3、GPT-4o、Gemini2Pro及Claude3.5Sonnet,其中,Grok3性能较DeepSeekV3提升了27%-43%。而在推理能力测试中,Grok3和Grok3mini推理模型的性能再次刷新了sota,其中,相较于DeepSeekR1,Grok3的性能表现提升了16%-22%。

  得益于思维链推理能力的引入,Grok3在解决复杂任务方面的表现较为突出。Grok3在发布会的演示上完成了多个复杂任务,包括正确编码并实现飞船从地球发射、登陆火星、到在下一个发射窗口返回地球的3D动画,其中Grok3经过114秒的思考成功求解了开普勒定律,以及Grok3融合俄罗斯方块和宝石迷阵的规则成功创作出新游戏。可以预计,未来Grok3有望在医疗诊断、法律分析等复杂推理场景中得到深度应用。

  Grok3总训练成本预计高达DeepSeekV3模型的数倍乃至数百倍。xAI公司为Grok3配备了拥有20万个上半年00GPU的Colossus超级计算机进行训练,Grok3累计训练时长达2亿GPU小时,根据vastai最新数据,上半年00租赁价格大约在1-3美元每GPU小时,因此估算Grok3的训练成本预计可达数亿美元,而DeepSeekV3论文中披露的模型正式训练阶段的成本仅557.6万美元。虽然Grok3的发布预示着预训练阶段的ScalingLaw仍在推动大模型的持续进步,但相较于DeepSeek,可以明显看出大模型在算法层面具备更大的进步空间。

郑重声明:用户在财富号/股吧/博客等社区发表的所有信息(包括但不限于文字、视频、音频、数据及图表)仅代表个人观点,与本网站立场无关,不对您构成任何投资建议,据此操作风险自担。请勿相信代客理财、免费荐股和炒股培训等宣传内容,远离非法证券活动。请勿添加发言用户的手机号码、公众号、微博、微信及QQ等信息,谨防上当受骗!
作者:您目前是匿名发表   登录 | 5秒注册 作者:,欢迎留言 退出发表新主题
温馨提示: 1.根据《证券法》规定,禁止编造、传播虚假信息或者误导性信息,扰乱证券市场;2.用户在本社区发表的所有资料、言论等仅代表个人观点,与本网站立场无关,不对您构成任何投资建议。用户应基于自己的独立判断,自行决定证券投资并承担相应风险。《东方财富社区管理规定》

扫一扫下载APP

扫一扫下载APP
信息网络传播视听节目许可证:0908328号 经营证券期货业务许可证编号:913101046312860336 违法和不良信息举报:021-34289898 举报邮箱:jubao@eastmoney.com
沪ICP证:沪B2-20070217 网站备案号:沪ICP备05006054号-11 沪公网安备 31010402000120号 版权所有:东方财富网 意见与建议:021-54509966/952500