• 最近访问:
发表于 2025-07-29 22:37:00 股吧网页版
安永大中华区人工智能与数据咨询服务联席主管合伙人陈剑光:衡量AI Agent“好用”的关键指标,需兼顾技术效能与业务价值
来源:每日经济新闻

  OpenAI发布具备自主思考能力的ChatGPT智能体;零一万物发布企业级Agent智能体“万仔”……一时之间,AI Agent(AI智能体)正从概念加速落地,国内外科技巨头纷纷布局。

  7月28日,在2025世界人工智能大会暨人工智能全球治理高级别会议(WAIC 2025)上,安永大中华区发布AI Agent产品——安永智能问答3.0。安永大中华区人工智能与数据咨询服务联席主管合伙人陈剑光在接受《每日经济新闻》记者(以下简称NBD)采访时表示,衡量AI Agent“好用”的关键指标,需兼顾技术效能与业务价值。

  陈剑光强调,AI Agent是否“好用”,技术上需关注准确性、响应速度等指标,业务上则需关注效率提升、成本优化、风控增强等实际价值,需体现对业务目标的支撑度。

  除此之外,不同行业的Agent 需求差异显著。

  不过,各行业在人事、行政等职能部门存在共性需求,核心是提升运营效率。

  谈Agent应用:存在两大核心痛点

  NBD:目前企业在落地Agent应用时,最常遇到的痛点是什么?从您的实践经验来看,这些痛点背后的核心原因是什么?

  陈剑光:目前,企业在部署Agent应用时,普遍面临的两大核心痛点是系统集成障碍与垂直领域适配度不足。

  Agent与企业现有的核心业务系统(如ERP、CRM、财务系统等)的协同困难是一个高频挑战。实践中经常看到,由于接口协议不一致、数据格式不兼容等问题,Agent难以顺畅地与这些系统进行数据交换和指令执行,从而造成任务中断、效率低下。比如,一个负责费用报销的财务Agent,可能因无法正确解析不同格式的票据信息而导致流程停滞。

  在面对特定行业的专业场景时,通用Agent模型常常显得“力不从心”,关键在于缺乏深度融入行业的知识库和数据来做支撑。例如,在金融风控领域,模型需要整合瞬息万变的监管规则和市场数据;在医疗诊断领域,则需要模型具备理解并融合影像和文本病历的能力。通用模型在这些高度专业化的环境中,精度往往难以达到业务要求。

  这些痛点的背后,核心原因在于双重壁垒。一是技术整合壁垒。打通异构系统的“最后一公里”,需要解决复杂的技术接口、数据映射和流程衔接问题,工程实施复杂度高。二是领域知识与数据治理壁垒。构建真正有效的垂直领域Agent,不仅需要引入深厚的行业专业知识,还需要高质量、结构化的领域数据进行持续训练与调优。然而,高质量数据的获取、清洗、标注及其所涉及的治理成本,构成了显著的障碍。这不仅是技术门槛,更是知识工程和数据资产管理的系统性挑战。

  NBD:不同行业(比如金融、零售、制造业)的企业在使用Agent时,需求和应用场景会有明显差异吗?能否举例说说典型行业的特色应用?

  陈剑光:行业间的差异化需求非常显著,主要体现在核心业务流程的差异和数据属性的专业性要求上。

  例如,金融业高度关注风险控制和合规管理,典型Agent的应用场景如面向客户经理的投资组合分析助手,提供合规建议,或者类似于提供自动化的实时交易监控Agent,用于识别交易异常模式。

  零售业的核心痛点围绕供应链优化、库存管理、精准营销与客户体验提升。典型场景如分析消费者行为数据的个性化推荐Agent;优化物流路线的动态规划Agent等。

  制造业的应用场景可能更关于设备维护管理、生产流程优化与质量控制等。典型应用包括预测性维护Agent,通过分析设备传感器数据提前预警故障;生产排程优化Agent,实时调整产线资源分配;整合视觉识别技术的质量检测Agent,自动化识别产品缺陷等。

  行业差异决定了Agent的核心使命:解决各自领域最关键的效率瓶颈或风险点。

  谈Agent核心价值:绝非简单地“替代人力”

  NBD:企业Agent的“智能化”程度往往是关注焦点,您认为衡量一个企业Agent“好用”的关键指标有哪些?

  陈剑光:衡量企业Agent是否真正好用,需要从技术效能与业务价值双维度综合评估,考量其对业务目标的支撑度。

  技术效能指标是Agent基础能力的量化体现,依据其具体目标设定,包括准确性、鲁棒性、响应速度、吞吐量等。以一个面向内部的客户服务查询Agent为例,技术指标包括用户咨询的意图识别准确度、后台信息查询的响应时间、调用客服系统接口的成功率等。

  业务价值指标则是证明Agent投入产出比的核心,体现实际落地效果,包括效率提升(是否缩短业务流程时长、节省人力操作时长)、成本优化(优化运营成本、识别潜在客户)、风控提升(降低合规风险/操作风险)、质量提升(提升产品/服务质量)等。

  在技术指标满足的基础上,能清晰量化其对实际业务的影响,是Agent价值的体现。

  NBD:对于还未尝试Agent应用的中小企业,您认为它们可以从哪些低成本、易落地的场景入手,逐步感受其价值?

  陈剑光:对于初次尝试的企业,我们建议采取“小步快跑”策略,可以先从轻量场景切入,即需求明确、技术轻量、能快速体现价值的“试点场景”。例如,文档摘要与信息检索,可以通过智能信息助手,针对企业内部政策/知识库问答,包括HR福利查询、IT常见问题解答;轻度的业务流程自动化,包括简单表单数据的自动化审核、标准化通知的定时发送等;以及协同增强工具,包括编程助手提升、智能文档翻译等。

  对中小企业而言,初期应当利用成熟的外部服务API(应用程序编程接口)来快速扩展Agent的功能,或选择提供Agent能力的SaaS(软件运营服务)产品或按需付费的模型服务,也可基于低代码/零代码平台构建属于自己的Agent应用,以降低硬件投入和初始维护成本。

  通过这些试点,企业能低成本验证技术价值,积累运营经验,培养团队信心,为后续更复杂、深度的应用打下基础。最重要的是深刻理解——Agent的核心价值,绝非简单地“替代人力”,而是通过承担规则性、重复性的流程执行任务,释放员工的时间和精力,使其能够投入到更富创造力的工作、更复杂的判断决策和更高价值的创新活动中。其终极目标是实现“人机协同、人智增强”,推动组织效能升级。

郑重声明:用户在财富号/股吧/博客等社区发表的所有信息(包括但不限于文字、视频、音频、数据及图表)仅代表个人观点,与本网站立场无关,不对您构成任何投资建议,据此操作风险自担。请勿相信代客理财、免费荐股和炒股培训等宣传内容,远离非法证券活动。请勿添加发言用户的手机号码、公众号、微博、微信及QQ等信息,谨防上当受骗!
作者:您目前是匿名发表   登录 | 5秒注册 作者:,欢迎留言 退出发表新主题
温馨提示: 1.根据《证券法》规定,禁止编造、传播虚假信息或者误导性信息,扰乱证券市场;2.用户在本社区发表的所有资料、言论等仅代表个人观点,与本网站立场无关,不对您构成任何投资建议。用户应基于自己的独立判断,自行决定证券投资并承担相应风险。《东方财富社区管理规定》

扫一扫下载APP

扫一扫下载APP
信息网络传播视听节目许可证:0908328号 经营证券期货业务许可证编号:913101046312860336 违法和不良信息举报:021-34289898 举报邮箱:jubao@eastmoney.com
沪ICP证:沪B2-20070217 网站备案号:沪ICP备05006054号-11 沪公网安备 31010402000120号 版权所有:东方财富网 意见与建议:021-54509966/952500