• 最近访问:
发表于 2025-05-21 11:11:20 股吧网页版
四点速读2025谷歌开发者大会
来源:第一财经 作者:一财科技


K图 GOOGL_0


K图 GOOG_0

  北京时间5月21日,谷歌开发者大会(Google I/O)上公布了在AI技术上的最新进展,从基础模型升级到生成式内容工具推出,再到硬件更新,标志着谷歌将AI技术融入其生态系统的进程又迈出重要一步。

  一、Gemini模型升级,多模态能力显著提升

  核心亮点仍是Gemini模型。Gemini 2.5 Pro 和 Flash 模型全面支持视听输入和原生音频输出对话,开发者可通过Live API 预览版构建和微调对话体验的音调、口音和说话风格等。Gemini还可作为Chatbot登录Chrome浏览器,帮助用户快速理解页面上下文并完成任务。其中,Deep Think模式引入增强型推理机制,在处理数学、编程和多模态任务时,能够在回答前充分考虑多种可能性,显著提升了模型的推理能力。

  二、生成式内容工具再升级

  谷歌推出的Veo 3视频生成模型支持原生音频生成,不仅能够生成高清视频,还可为视频添加背景音乐、音效甚至对白,解决了以往AI视频生成中“有影无声”的问题,极大提升了AI视频的质量和真实感。

  Imagen 4图像生成模型在图像细节和文本输出质量上有了质的飞跃。谷歌表示,该模型能够渲染织物、水滴和动物皮毛等精细细节,支持照片级写实和抽象等多种风格,并可创建各种纵横比、高达2K分辨率的图像,为创作者提供了更强大的图像生成工具。

  三、AI代理助力生活便捷化

  谷歌的实验性AI代理工具Project Mariner迎来更新,其工作方式得到优化,可一次承担近十几项任务。例如,用户无须访问第三方网站,即可通过该工具购买棒球比赛门票或在线购买杂货,为用户的日常生活带来了极大的便利。

  谷歌还推出了全新视频通话平台Google Beam,硬件包括一个六摄像头阵列和定制的光场显示器,软件上一个AI模型将不同角度指向用户的摄像头视频转换为3D渲染,让用户可以像处于同一个会议室一样互相交谈。谷歌的Beam可实现毫米级头部跟踪和60fps视频流。当与Google Meet一起使用时,Beam提供实时语音翻译功能,可保留说话者的声音、语调和表情。

  四、XR智能眼镜亮相

  谷歌与Xreal、Samsung等品牌合作,推出了集成AI助手功能的Android XR智能眼镜。这款眼镜支持实时翻译、导航和信息提示等功能,是谷歌在可穿戴设备领域的新尝试,为用户提供了全新的交互体验和便捷的信息获取方式。

  针对各项AI升级功能,谷歌推出了每月249.99美元的AI Ultra订阅计划,为用户提供Gemini 2.5 Pro的Deep Think模式、Veo 3视频生成工具等高级AI功能的访问权限,并提供更高的使用限制和额外存储空间。

郑重声明:用户在财富号/股吧/博客等社区发表的所有信息(包括但不限于文字、视频、音频、数据及图表)仅代表个人观点,与本网站立场无关,不对您构成任何投资建议,据此操作风险自担。请勿相信代客理财、免费荐股和炒股培训等宣传内容,远离非法证券活动。请勿添加发言用户的手机号码、公众号、微博、微信及QQ等信息,谨防上当受骗!
作者:您目前是匿名发表   登录 | 5秒注册 作者:,欢迎留言 退出发表新主题
郑重声明:用户在社区发表的所有资料、言论等仅代表个人观点,与本网站立场无关,不对您构成任何投资建议。用户应基于自己的独立判断,自行决定证券投资并承担相应风险。《东方财富社区管理规定》

扫一扫下载APP

扫一扫下载APP
信息网络传播视听节目许可证:0908328号 经营证券期货业务许可证编号:913101046312860336 违法和不良信息举报:021-34289898 举报邮箱:jubao@eastmoney.com
沪ICP证:沪B2-20070217 网站备案号:沪ICP备05006054号-11 沪公网安备 31010402000120号 版权所有:东方财富网 意见与建议:021-54509966/952500