• 最近访问:
发表于 2025-03-09 23:16:44 天天基金网页版 发布于 广东
Manus只是昙花一现的中间态吗?

大家好,我是阿热。

前阵子一直聚焦美股和相关人士,今天咱重回科技赛道。相比之前每天热炒DeepSeek,这两天终于有了新“爆款”。

一支中国团队正式对外发布通用型AI Agent产品Manus。

AI Agent需要以大语言模型作为核心,并叠加规划、记忆、工具调用,从而通过解决任务逻辑连贯性的问题完成特定的跨系统任务。

与以前我们常接触的AIGC(生成式AI)或AGI(通用人工智能)相比,AIGC或AGI的特点在于广泛的适应性和自主智能,这两类虽然也能一定程度做到AI Agent的能力,但在提取分析文件、自动给出指令、跨系统协作上,自动生成结构化方案等几类角度不如AI Agent全面。

通俗来说,和ChatGPT、DeepSeek这类定位是"建议者"的AI相比,Manus作为通用 AI 智能体,定位更接近于"执行者"。实操上的区别昨天文章里也有提到,对于一句话需求,DeepSeek给的是一个纯文字的理论上的框架,而Manus可以给到一份200页的付图表的具体到执行的企划书。(例如这份特斯拉股票分析报表)

Manus AI突然大火,原因在于其在GAIA的跑分结果超过了OpenAI和DeepSeek,并取得了三个难度任务的SOTA(State-of-the-Art,指在某一领域任务中得分达到了参评基准模型中的最优),尤其在工具调用类任务中表现突出(例如简历筛选、股票分析等)。

简单介绍一下,GAIA(General AI Assistants)是一个面向通用AI助手能力的基准评测体系。传统的测试一般都是数学或者一些专业知识问答、编程等等,但是GAIA测试更多是概念简单,但是需要多步骤解决的实际问题。

其中分为三个级别,Lv.1、Lv.2、Lv.3,难度依次递增。想通过GAIA的测试,一般需要网络检索能力、工具调用能力、编程能力、文件处理能力等等。

在2023年的时候,人类一般能达到90%的成功率,而那时候的最强AI —— GPT4,在Lv1才勉强达到15%。

现在,OpenAI的DeepResearch在Lv1的成功率已经高达74.3%,而Manus是更高的86.5%,不但大幅超过OpenAI,并且已经非常接近人类的90%了。用更直白地说法是,在Lv1难度的绝大部分任务中,你下达命令后Manus就能直接给出一份可用的成果。

而在Lv3最高难度的任务中,Manus的成功率也超过了57%,且明显高于OpenAI的47%。

但实话说,这轮热度里有一半并非正面。

有网友拆解 Manus 后的判断是,它的能力是compute use + 虚拟机 + artifacts + 内置一批 agent 的综合产物。

从可行性来看,如果 agent 不能被模型内化,而 Manus 又想做通用领域中更专注编程任务的定位,这存在明显矛盾,逻辑上不太可能实现。

另外,Manus的任务执行依赖预设流程,在不同领域的泛化能力有限(来自MIT学者的评价),且实际体验并不理想。

其实半年前已经有类似的Agent发布,如国内的Flowith、国外的Devin等。之前OpenAI的 Operator、智谱AI 的 Phone Use也都展示过类似Manus的功能,本质上任何一个 Agent 能力强一点的模型就能干得了。

昨晚看了一个业内人士的直播,里面也提到Manus官方回复说“目前功能比较初级,复杂的任务做不出来,以demo展示为主。”Manus整体表现和其他Agent比差不多算持平,并没有很惊艳。还有任务动不动跑4小时可能和缺算力没啥关系,纯属功能不行。

从市场卡位角度,它可能是新型通用模式探索,但比 AI 搜索门槛高,未必能成为大众快速上手的产物。懂行的人可能因局限性不屑使用,除非有爆款场景;不懂的人又不会用,看市面上的观感似乎只可能会在自媒体圈子火起来。

Manus使用限制也很多。从官方信息来看,Manus当前运行环境仍然在官方调试的虚拟系统上,用户需要云端访问。Manus究竟能否在通用环境(例如我们常用的Windows、安卓或者iOS系统)中运行各种任务,至少从现在来看属于“伪命题”。

最后是营销痕迹太重。某天早上国内大量自媒体纷纷发文宣传 Manus。然而在国外视频平台上,关于 Manus 的视频仅有一条,且播放量仅几千。

并且此次热度由自媒体先行,专业人士滞后,通常对于 AI 模型这类产品,专业人士显然更具判断力,而由自媒体炒热的概念往往有炒作嫌疑。1月份那会儿DeepSeek也是先由专业人士各种测试体验后走红,随后才迎来媒体的广泛宣传,这对比一下观感就很微妙了。

虽然Manus本身争议不少,但AI Agent重回大众视野,可看到的更多是对算力需求的重构机会

AI Agent打破了传统AI模型的算力消耗模式。Manus的单任务执行相比GPT-4对话的算力资源要消耗多得多,因为agent是机器反复读token,推理算力需求是数量级的提升。

原因一是因为多任务并发压力。一般来说,Agent在处理中需进行规划、执行、验证三大流程。例如生成一份股票分析报告时,系统需运行调用API进行数据爬取、Python脚本编写、生成可视化图表等多个模块。对比传统AI模型,内存带宽需求至少需提升数倍。

二是实时性需求。比如金融交易、舆情监控等场景中,AI Agent需实现毫秒级响应。看网上数据实测显示,目前Manus在AWS 128GB实例上的任务中断率高达3.7%,这也暴露出现有算力架构的瓶颈。

中长期来看,AI核心仍然在算力硬件层,随着人工智能AGI的落地,海量的用户海量的数据需要处理,还有更多应用出世,都在提升对于算力的需求,比如Agent,比如多模态,比如下一代大模型等等,硬件仍然是最重要的基础设施。

就像现在DeepSeek常常连不上一样,本质是算力铺设还不够。即便软件效率升级再快,现在我们会发现比拼最后还是归咎到算力基础上。

看好英伟达的基本也是类似观点,认为英伟达仍然是未来的硬件之王,台积电一直到27年的产能都被预定完了。

长期看,在硬件上我们仍然和英伟达和美股存在较大的差距。软件侧现在有了打成55开的期望,但硬件上还比较难说。在AI的硬件和软件的总面积截面上,我们的差距还是有的,还需努力。

目前市场对于Manus还是旁观为主(虽然市场因此热炒了一波相关概念),但Manus的出现,更大的意义在于会给业内指明一条AI应用的前进方向。会有人来模仿竞争。例如这个才过了一天就在开源社区出现的仿版——OpenManus。 

目前调用AI Agent的普遍路径是在OpenAI高端定制服务(如月费2万美元的"博士级Agent"),有消息说腾讯5月份会推一个和Manus类似功能的产品出来,字节和阿里也会有类似的产品出来(阿里云目前已有智能体专用算力池)。产品一多,在大众市场间也会有更多差异化路径。虽然国内厂商经常扎堆往一个赛道挤造成行业竞争激烈的局面,但也能从侧面看出AI Agent确实是AI领域下一步的方向。

Gartner预测Agentic AI将成为十大技术趋势之一,2025年可看智能体商业化的元年。到2028年,预计15%的日常工作决策将由智能体完成,市场规模有望达到数百亿美元。有看好Manus的机构表示,Manus的发布标志着智能体从单一任务向复杂决策的跨越,AI Agent今后将向多模态交互(图像、语音、物联网)演进,推动应用场景的复杂度提升云云,当然这些都是后话,也是期许。

……

最后聊聊周五A股。

大盘收跌0.25%,下午冲高3390,但压力不小立马转头向下,还是积蓄力量等待下周是否有机会冲破3400吧。全市场成交额18618.47亿元,较上日缩量916亿元。市场交易活跃度有所下降,资金的入场意愿不高。

板块方面,前三有色金属+2.17%、小金属+1.92%、航空航天+1.54%,后三多元金融-2.93%、房地产服务-2.66%、电池-2.21%。昨天大涨,今天分歧一下属于正常的走势。全球科技股不断调整的情况下,A股这边做多科技股的力量也开始有点松动了,但人形机器人走得挺流畅。

#每日信息前沿##中国团队AI助手Manus性能超越OpenAI##女性基金经理突破千人大关# #王坚:AI正在将人类带入一个全新的时代# #中国资产爆发!摩根资管:重估才刚开始#

$易方达中证人工智能主题ETF联接A(OTCFUND|012733)$$华夏国证半导体芯片ETF联接C(OTCFUND|008888)$$天弘创业板ETF联接A(OTCFUND|001592)$$招商中证白酒指数(LOF)A(OTCFUND|161725)$$鹏华碳中和主题混合A(OTCFUND|016530)$$永赢先进制造智选混合发起A(OTCFUND|018124)$$国泰黄金ETF联接A(OTCFUND|000218)$

郑重声明:用户在财富号/股吧/博客等社区发表的所有信息(包括但不限于文字、视频、音频、数据及图表)仅代表个人观点,与本网站立场无关,不对您构成任何投资建议,据此操作风险自担。请勿相信代客理财、免费荐股和炒股培训等宣传内容,远离非法证券活动。请勿添加发言用户的手机号码、公众号、微博、微信及QQ等信息,谨防上当受骗!
作者:您目前是匿名发表   登录 | 5秒注册 作者:,欢迎留言 退出发表新主题
郑重声明:用户在社区发表的所有资料、言论等仅代表个人观点,与本网站立场无关,不对您构成任何投资建议。用户应基于自己的独立判断,自行决定证券投资并承担相应风险。《东方财富社区管理规定》

扫一扫下载APP

扫一扫下载APP
信息网络传播视听节目许可证:0908328号 经营证券期货业务许可证编号:913101046312860336 违法和不良信息举报:021-34289898 举报邮箱:jubao@eastmoney.com
沪ICP证:沪B2-20070217 网站备案号:沪ICP备05006054号-11 沪公网安备 31010402000120号 版权所有:东方财富网 意见与建议:021-54509966/952500