Manus只是昙花一现的中间态吗？_基金动态(jjdt)股吧

股吧首页 > 基金动态吧 > 正文

最近访问：

基金动态吧

返回基金动态吧>>

- 重要股东股权质押数据全览

热点辣评君

发表于 2025-03-09 23:16:44 天天基金网页版发布于广东

Manus只是昙花一现的中间态吗？

大家好，我是阿热。

前阵子一直聚焦美股和相关人士，今天咱重回科技赛道。相比之前每天热炒DeepSeek，这两天终于有了新“爆款”。

一支中国团队正式对外发布通用型AI Agent产品Manus。

AI Agent需要以大语言模型作为核心，并叠加规划、记忆、工具调用，从而通过解决任务逻辑连贯性的问题完成特定的跨系统任务。

与以前我们常接触的AIGC（生成式AI）或AGI（通用人工智能）相比，AIGC或AGI的特点在于广泛的适应性和自主智能，这两类虽然也能一定程度做到AI Agent的能力，但在提取分析文件、自动给出指令、跨系统协作上，自动生成结构化方案等几类角度不如AI Agent全面。

通俗来说，和ChatGPT、DeepSeek这类定位是"建议者"的AI相比，Manus作为通用 AI 智能体，定位更接近于"执行者"。实操上的区别昨天文章里也有提到，对于一句话需求，DeepSeek给的是一个纯文字的理论上的框架，而Manus可以给到一份200页的付图表的具体到执行的企划书。（例如这份特斯拉股票分析报表）

Manus AI突然大火，原因在于其在GAIA的跑分结果超过了OpenAI和DeepSeek，并取得了三个难度任务的SOTA（State-of-the-Art，指在某一领域任务中得分达到了参评基准模型中的最优），尤其在工具调用类任务中表现突出（例如简历筛选、股票分析等）。

简单介绍一下，GAIA（General AI Assistants）是一个面向通用AI助手能力的基准评测体系。传统的测试一般都是数学或者一些专业知识问答、编程等等，但是GAIA测试更多是概念简单，但是需要多步骤解决的实际问题。

其中分为三个级别，Lv.1、Lv.2、Lv.3，难度依次递增。想通过GAIA的测试，一般需要网络检索能力、工具调用能力、编程能力、文件处理能力等等。

在2023年的时候，人类一般能达到90%的成功率，而那时候的最强AI —— GPT4，在Lv1才勉强达到15%。

现在，OpenAI的DeepResearch在Lv1的成功率已经高达74.3%，而Manus是更高的86.5%，不但大幅超过OpenAI，并且已经非常接近人类的90%了。用更直白地说法是，在Lv1难度的绝大部分任务中，你下达命令后Manus就能直接给出一份可用的成果。

而在Lv3最高难度的任务中，Manus的成功率也超过了57%，且明显高于OpenAI的47%。

但实话说，这轮热度里有一半并非正面。

有网友拆解 Manus 后的判断是，它的能力是compute use + 虚拟机 + artifacts + 内置一批 agent 的综合产物。

从可行性来看，如果 agent 不能被模型内化，而 Manus 又想做通用领域中更专注编程任务的定位，这存在明显矛盾，逻辑上不太可能实现。

另外，Manus的任务执行依赖预设流程，在不同领域的泛化能力有限（来自MIT学者的评价），且实际体验并不理想。

其实半年前已经有类似的Agent发布，如国内的Flowith、国外的Devin等。之前OpenAI的 Operator、智谱AI 的 Phone Use也都展示过类似Manus的功能，本质上任何一个 Agent 能力强一点的模型就能干得了。

昨晚看了一个业内人士的直播，里面也提到Manus官方回复说“目前功能比较初级，复杂的任务做不出来，以demo展示为主。”Manus整体表现和其他Agent比差不多算持平，并没有很惊艳。还有任务动不动跑4小时可能和缺算力没啥关系，纯属功能不行。

从市场卡位角度，它可能是新型通用模式探索，但比 AI 搜索门槛高，未必能成为大众快速上手的产物。懂行的人可能因局限性不屑使用，除非有爆款场景；不懂的人又不会用，看市面上的观感似乎只可能会在自媒体圈子火起来。

Manus使用限制也很多。从官方信息来看，Manus当前运行环境仍然在官方调试的虚拟系统上，用户需要云端访问。Manus究竟能否在通用环境（例如我们常用的Windows、安卓或者iOS系统）中运行各种任务，至少从现在来看属于“伪命题”。

最后是营销痕迹太重。某天早上国内大量自媒体纷纷发文宣传 Manus。然而在国外视频平台上，关于 Manus 的视频仅有一条，且播放量仅几千。

并且此次热度由自媒体先行，专业人士滞后，通常对于 AI 模型这类产品，专业人士显然更具判断力，而由自媒体炒热的概念往往有炒作嫌疑。1月份那会儿DeepSeek也是先由专业人士各种测试体验后走红，随后才迎来媒体的广泛宣传，这对比一下观感就很微妙了。

虽然Manus本身争议不少，但AI Agent重回大众视野，可看到的更多是对算力需求的重构机会。

AI Agent打破了传统AI模型的算力消耗模式。Manus的单任务执行相比GPT-4对话的算力资源要消耗多得多，因为agent是机器反复读token，推理算力需求是数量级的提升。

原因一是因为多任务并发压力。一般来说，Agent在处理中需进行规划、执行、验证三大流程。例如生成一份股票分析报告时，系统需运行调用API进行数据爬取、Python脚本编写、生成可视化图表等多个模块。对比传统AI模型，内存带宽需求至少需提升数倍。

二是实时性需求。比如金融交易、舆情监控等场景中，AI Agent需实现毫秒级响应。看网上数据实测显示，目前Manus在AWS 128GB实例上的任务中断率高达3.7%，这也暴露出现有算力架构的瓶颈。

中长期来看，AI核心仍然在算力硬件层，随着人工智能AGI的落地，海量的用户海量的数据需要处理，还有更多应用出世，都在提升对于算力的需求，比如Agent，比如多模态，比如下一代大模型等等，硬件仍然是最重要的基础设施。

就像现在DeepSeek常常连不上一样，本质是算力铺设还不够。即便软件效率升级再快，现在我们会发现比拼最后还是归咎到算力基础上。

看好英伟达的基本也是类似观点，认为英伟达仍然是未来的硬件之王，台积电一直到27年的产能都被预定完了。

长期看，在硬件上我们仍然和英伟达和美股存在较大的差距。软件侧现在有了打成55开的期望，但硬件上还比较难说。在AI的硬件和软件的总面积截面上，我们的差距还是有的，还需努力。

目前市场对于Manus还是旁观为主（虽然市场因此热炒了一波相关概念），但Manus的出现，更大的意义在于会给业内指明一条AI应用的前进方向。会有人来模仿竞争。例如这个才过了一天就在开源社区出现的仿版——OpenManus。

目前调用AI Agent的普遍路径是在OpenAI高端定制服务（如月费2万美元的"博士级Agent"），有消息说腾讯5月份会推一个和Manus类似功能的产品出来，字节和阿里也会有类似的产品出来（阿里云目前已有智能体专用算力池）。产品一多，在大众市场间也会有更多差异化路径。虽然国内厂商经常扎堆往一个赛道挤造成行业竞争激烈的局面，但也能从侧面看出AI Agent确实是AI领域下一步的方向。

Gartner预测Agentic AI将成为十大技术趋势之一，2025年可看智能体商业化的元年。到2028年，预计15%的日常工作决策将由智能体完成，市场规模有望达到数百亿美元。有看好Manus的机构表示，Manus的发布标志着智能体从单一任务向复杂决策的跨越，AI Agent今后将向多模态交互（图像、语音、物联网）演进，推动应用场景的复杂度提升云云，当然这些都是后话，也是期许。

……

最后聊聊周五A股。

大盘收跌0.25%，下午冲高3390，但压力不小立马转头向下，还是积蓄力量等待下周是否有机会冲破3400吧。全市场成交额18618.47亿元，较上日缩量916亿元。市场交易活跃度有所下降，资金的入场意愿不高。

板块方面，前三有色金属+2.17%、小金属+1.92%、航空航天+1.54%，后三多元金融-2.93%、房地产服务-2.66%、电池-2.21%。昨天大涨，今天分歧一下属于正常的走势。全球科技股不断调整的情况下，A股这边做多科技股的力量也开始有点松动了，但人形机器人走得挺流畅。

#每日信息前沿##中国团队AI助手Manus性能超越OpenAI##女性基金经理突破千人大关# #王坚：AI正在将人类带入一个全新的时代# #中国资产爆发！摩根资管：重估才刚开始#

郑重声明：用户在财富号/股吧/博客等社区发表的所有信息（包括但不限于文字、视频、音频、数据及图表）仅代表个人观点，与本网站立场无关，不对您构成任何投资建议，据此操作风险自担。请勿相信代客理财、免费荐股和炒股培训等宣传内容，远离非法证券活动。请勿添加发言用户的手机号码、公众号、微博、微信及QQ等信息，谨防上当受骗！

评论该主题

帖子不见了！怎么办？

作者：您目前是匿名发表登录 | 5秒注册作者：，欢迎留言退出发表新主题

郑重声明：用户在社区发表的所有资料、言论等仅代表个人观点，与本网站立场无关，不对您构成任何投资建议。用户应基于自己的独立判断，自行决定证券投资并承担相应风险。《东方财富社区管理规定》