当地时间周二,Alphabet旗下的谷歌宣布发布其最新的人工智能(AI)模型Gemini 3,在与OpenAI等公司的竞赛中加快追赶步伐。
Alphabet首席执行官桑达尔·皮查伊当天表示,新AI模型将针对更复杂的问题提供更优答案。"用户只需更少的提示,即可获得所需结果。"此外,新模型在编程、应用开发与图像生成方面的能力也大幅增强。
Gemini 3将被整合进Gemini应用、谷歌的AI搜索产品AI Mode和AI Overviews,以及其企业级产品。该模型将自周二起向部分订阅用户开放,并将在未来几周更大范围上线。
此次发布距离谷歌推出Gemini 2.5仅八个月,距离Gemini 2.0上线也仅11个月。引爆生成式AI热潮的OpenAI已于今年8月份发布GPT-5。
皮查伊写道:“令人惊叹的是,仅仅两年时间,AI已从单纯处理文本和图像,发展到能够读懂场景。从今天起,Gemini将在谷歌全系产品中全面铺开。”
据谷歌披露数据显示,Gemini应用目前月活跃用户已达6.5 亿,而AI Overviews拥有20亿月活用户。OpenAI则在8月表示,ChatGPT周活跃用户已突破7亿。
尽管谷歌在AI竞赛中起步较慢,但其仍拥有OpenAI等初创公司所没有的众多优势:自研专用芯片;在在线搜索中拥有约90%的市场份额;以及数以百万计的Gmail、Google Docs等用户,如今这些产品正逐步被注入AI功能。谷歌上月还公布了创纪录的收入,并计划在AI建设上投入数十亿美元。
皮查伊补充说,全新的Gemini 3专为把握深度与细微差别而构建,且Gemini 3更善于洞察请求背后的语境与意图,从而让用户以更少提示获得所需结果。谷歌表示,其他AI模型仍可用于处理简单任务。
随着Alphabet及其一众科技巨头大幅加码基础设施投入,以推动AI研发并迅速推出面向消费者与企业的新服务,这一竞争格局正不断升级。在上月的财报中,Alphabet、Meta、微软和亚马逊均上调了资本开支指引,预计今年合计支出将超过3800亿美元。
谷歌DeepMind首席执行官Demis Hassabis在声明中强调,基于Gemini 3的AI回答将不再依赖陈词滥调和奉承,而是提供真实洞见——告诉你需要听到的,而不是你想听的。
与此同时,谷歌发布了名为"Google Antigravity"的全新智能体平台,让开发者得以在更高抽象层级上进行任务导向型编程。
谷歌实验室与Gemini副总裁Josh Woodward表示,Gemini 3是谷歌有史以来最契合“氛围编程”的模型。氛围编程指一个快速兴起的AI工具市场,允许软件开发者通过提示词即可生成代码。
谷歌称,新模型将支持“生成式界面”,以类似数字杂志的方式呈现某些答案。例如,新模型被要求结合梵高生平背景解读其作品,系统为每幅画作生成了图文并茂、色彩丰富的阐释。
在AI Mode中,Gemini 3将首先向付费用户开放。它能够分析问题并自动生成包含图像、表格和网格布局的可视化回答。
开发者可以通过Gemini API使用新模型,企业客户则可通过谷歌云Vertex AI将其集成到业务流程中,
谷歌声称,对于企业客户,Gemini 3能够生成员工入职与培训内容,更准确地分析视频和工厂车间图像,并处理采购等业务流程。