本报讯 (记者李乔宇)8月11日,昆仑万维科技股份有限公司(以下简称“昆仑万维”)SkyWorkAI技术发布周正式启动。8月11日至8月15日,昆仑万维每天发布一款新模型,连续五天,覆盖多模态AI核心场景的前沿模型。截至目前,昆仑万维已经发布SkyReels-A3、Matrix-Game2.0、Matrix-3D、SkyworkUniPic2.0模型。
8月14日,昆仑万维正式发布SkyworkDeepResearchAgentv2,它是天工超级智能体(SkyworkSuperAgents)的核心引擎。
SkyworkDeepResearchAgent自5月22日上线后,大幅重塑了大模型在AIOffice领域的角色,通过skywork.ai为用户产出了大量信息密度极高的优质文档、PPT、表格以及其他交付物。新一版本的SkyworkDeepResearchAgentv2推出“多模态深度调研”Agent,首次整合多模态检索、理解和生成,昆仑万维Skywork团队推出了业界首个“多模态深度调研”Agent,首次将多模态检索理解和跨模态生成能力完整整合到深度研究工作里。
为实现多模态信息检索这一能力的提升,昆仑万维Skywork团队在以下四个方面完成技术突破:多模态爬取技术MM-Crawler、长距离多模态信息收集、异步并行Multi-Agent多模态理解架构和多模态结果呈现能力。
通过以上技术创新,多模态SkyworkDeepResearchAgentv2把“读文字+看图片”这件看似简单却长期被忽视的事情真正做到位,让研究人员等用户一次拿到信息完整、节奏顺畅、视觉友好的深度报告。
SkyworkDeepResearchAgentv2推出“多模态深度浏览器智能体”,重塑社媒内容分析与数据洞察。
为实现传统浏览器所不具备的低延迟、高回复率、任务完成度高、决策灵活等功能,昆仑万维多模态深度浏览器智能体(SkyworkBrowserAgent)进行了多项关键自研技术优化,包括升级DOM+视觉推理方案、主流平台专项适配、并行搜索(ParallelSearch)、多动作规划机制(Multi-Action)、智能筛、人机无缝接管与隐私保护和安全承诺等。
当前,多模态深度浏览器智能体(SkyworkBrowserAgent),能够模拟人类浏览与交互方式,革新传统数据采集与分析模式。该智能体可精准高效地完成智能搜索、多模态信息分析与社区内容洞察,有效解决传统浏览器智能体的多项痛点,充分展示了天工智能体在长周期任务(Long-horizonTask)与VLA(Vision-LanguageAction)任务中的巨大潜力。
SkyworkDeepResearchAgentv2加强了深度信息搜索和复杂任务执行能力,在多个任务测评集上取得SOTA。
为了进一步加强Agent基础模型的复杂任务执行和信息检索、整理、总结能力,SkyworkDeepResearchAgentv2引入了多种提升机制,包括高质量数据合成及训练、端到端强化学习、高效的并行推理,以及多智能体自我学习演进系统。新版本的SkyworkDeepResearch在多项Agent任务评测上超越现有模型,达到行业SOTA水平。
在并行思考模式下,SkyworkDeepResearch的正确率会随着思考时间的增加而持续攀升,这充分展现了自研系统架构的潜力与扩展性。