当前位置：前瞻产业研究院 » 经济学人 » 观察家专栏

解密Manus：靠垂直整合，抢在了AI大厂前头

分享到：

直面派 • 2025-03-10 18:18:22 　来源：直面AI　E5895G0

图源：摄图网

作者|麦思来源|直面AI(ID：faceaibang)

AI圈正迎接新一轮的技术爆发期，DeepSeek以深度推理模型R1震撼海内外，OpenAI、Anthropic、谷歌、阿里、字节、百度等纷纷推进自家大模型的新动态。模型层之外，应用层也开始多了些新变化。

最近的创新来自一家由中国90后创始团队推出的新产品——一款号称通用AI Agent的应用工具Manus。

Manus的官网（https://Manus.im/usecases）给出了一些例子可以供我们更加直观的了解Manus的能力，可以看到它的功能在官方演示中确实特别强大，目前Manus的使用需要提前获取邀请码。

有必要简单介绍一下Manus。与传统AI助手相比，类似豆包、Kimi、DeepSeek这些，其局限于信息检索与建议交互，而Manus首次实现“自主执行复杂任务→交付完整成果”的闭环能力，填补了当前市场空白‌。

另外一点是通用性定义的突破：跨领域处理复杂任务（如股票分析、旅行规划、代码生成等），打破垂直赛道AI的局限性‌，这是惊艳的前两点。第三点是Manus是继中国团队做出来DeepSeek之后的又一力作，定位为“手脑并用”的通用助手，强调“输入需求→输出结果”的无中介执行模式，命名源自拉丁语“Mens et Manus”（意为手脑并用），技术理念主张“Less structure, more intelligence”，减少预设流程依赖，强化模型自主进化能力。

Manus的优缺点

总结一下Manus的核心优势：

全流程自主执行：从需求分析（如简历筛选）、任务拆解（如房产选购规划）到成果交付（生成Excel/PPT报告）无需人工干预‌。

多工具链整合：支持浏览器操作、编程工具调用、跨平台数据抓取，实现复杂操作（如自动解压简历包并分析）‌。

覆盖教育（教学材料生成）、金融（股票关系分析）、人力资源（候选人分级）、企业服务（自动化周报）等多领域‌。

跨领域协同：可同时处理比如简历筛选与房产选购两类异构任务，体现通用Agent特性‌。

多Agent协作系统：规划、执行、验证三模块分立，云端虚拟机并行处理任务，提升容错率‌。

上面是Manus的优势，同样Manus也有一些劣势：

依赖预设流程框架：部分任务需在浏览器与操作系统间的“受限环境”执行，无法适配未预定义的应用程序‌。

执行稳定性问题：用户反馈存在崩溃前生成虚假结果（如伪造邀请码）等不可控行为‌。

高炒作热度导致早期用户预期与实际能力落差，部分场景仍需人工修正输出结果‌。

企业端部署成本：云端虚拟机运行模式对算力需求较高，限制中小型企业使用‌。

自主签署合同的法律效力尚未明确，隐私数据跨平台调用可能引发合规争议‌。

职场替代焦虑：80%中低频白领工作（如简历筛选、报表生成）面临被低成本AI替代的风险‌。

Manus究竟做了哪些技术创新？

说完优缺点之后，我们再重点看一下使得Manus这么强的背后技术创新，究竟是什么。

1. 多智能体协作系统（Multi-Agent Collaboration）

三层架构设计：

规划代理（Planning Agent）：采用蒙特卡洛树搜索（MCTS）算法动态拆解任务优先级，支持实时调整执行路径（例如在简历筛选中优先处理学历匹配度）。

执行代理（Execution Agent）：整合200+工具接口（浏览器、Office套件等），通过浏览器自动化引擎模拟人类操作（点击、滚动、表单填写），但受限于未开放API的CS架构应用。

验证代理（Validation Agent）：部署对抗性测试模块，检测逻辑矛盾（如财务数据与行业基准偏差超5%时触发复核流程）。

多重签名系统（Multisig System）：由多个独立模型协同处理子任务，通过交叉验证提升结果可靠性（例如股票分析中，3个模型独立计算行业关联度，取置信度最高值）。

2. 动态训练与优化机制

实时反馈迭代：用户可通过“动态培训”功能修正输出格式（如指定PPT模板）或调整执行路径（如跳过特定网站数据抓取），模型即时更新策略。

崩溃恢复技术：任务中断时自动生成替代方案（如简历解析失败后改用关键词匹配模式），并保留进度至本地缓存。

3. 工具链深度整合

浏览器沙箱技术：在隔离环境中运行跨平台操作（如自动登录招聘网站抓取简历），避免用户隐私数据泄露。

记忆偏好系统：持续学习用户习惯（如合同模板偏好），占用云端存储资源形成个性化执行策略。

4. 性能验证体系

GAIA基准测试(https://zhuanlan.zhihu.com/p/669652697)突破：在三级测试中分别达86.5%/70.1%/57.7%，超越OpenAI的DeepResearch模型，接近人类水平（90%）。

真实场景验证：在Upwork平台完成设计类任务（如Logo生成）、Kaggle竞赛中实现数据分析自动化，验证跨领域执行能力。

如果上面Manus的技术创新让你眼前一亮，这个时候你是不是会有一个疑问，为什么是Manus？其他AI厂商，尤其是科技大厂为什么没有做出这样的成果，是其他厂商不具备这样的能力吗？目前来看，原因或许有以下几种因素：

1. ‌技术路径依赖‌

‌模型规模优先策略‌：OpenAI等厂商聚焦于扩大模型参数量（如追求GPT-5），未将工具调用能力作为核心研发方向‌。

‌规则工程惯性‌：传统AI产品依赖预设流程（如客服对话树），难以适应Manus倡导的“Less structure, more intelligence”理念‌。

2. 工程化挑战

‌多工具接口适配成本‌：需为浏览器、办公软件等开发专用驱动，大厂不愿干脏活累活，其他小厂商又缺乏生态整合能力（如Manus团队耗时2年完成200+工具接口开发）‌。

‌长周期任务管理难题‌：传统模型受限于会话式交互，难以实现“用户离线后持续执行跨日任务”的异步工作机制‌。

3. 市场定位差异

‌B端服务壁垒‌：微软Copilot等产品聚焦Office场景，缺乏跨领域泛化能力（如同时处理简历筛选与股票分析）‌。

‌伦理风险规避‌：头部厂商忌惮自主决策引发的法律争议（如合同签署效力），选择保守技术路线‌。

Manus的后续改进和行业影响

针对目前Manus表现出的一些缺点，我们认为它未来的改进点如下：

增强环境适应性：突破浏览器/操作系统的“夹层”限制，实现更底层的系统权限调用‌。

降低算力依赖：通过模型压缩与边缘计算结合，推动中小型企业普及‌。

优先落地场景：企业自动化办公（智能客服、合同审核）、教育个性化教学（动态生成课件）‌。

开源生态建设：开放部分模型接口，吸引开发者构建插件生态（如第三方工具集成）‌。

建立AI执行审计机制：对自主决策过程留痕，明确错误结果的责任归属‌。

数据安全规范：限制敏感信息（如简历、财务报表）的跨平台流转权限‌。

但不容忽视的是，Manus的出现肯定会对其他厂商带来一些影响：倒逼OpenAI等厂商加速从“对话式交互”转向“任务执行型”产品开发的节奏，加速Agent技术迭代‌；推动多模态交互（文字/图表/代码混合输出）、工具调用API集成成为AI产品新基准‌。

根据Manus计划，后续官方还将开源推理模块，有望借此催生基于其技术栈的二次开发社区‌。

Manus需求爆火，还可能带动边缘计算设备需求激增，使得AI终端部署从云端向本地延伸‌，一批国产硬件厂商也有望从中受益。

AI的发展速度正推动各行各业重新洗牌，未来不是属于资产的时代，也不是属于权力的时代，未来将是属于科技的时代。

编者按：本文转载自微信公众号：直面AI(ID：faceaibang)，作者：麦思

本文来源直面AI，内容仅代表作者本人观点，不代表前瞻网的立场。本站只提供参考并不构成任何投资及应用建议。（若存在内容、版权或其它问题，请联系：service@qianzhan.com）　品牌合作与广告投放请联系：0755-33015062 或 hezuo@qianzhan.com

p28 q0 我要投稿

标签： Manus AI

品牌、内容合作请点这里：寻求合作 ››

前瞻经济学人

专注于中国各行业市场分析、未来发展趋势等。扫一扫立即关注。

前瞻产业研究院

中国产业咨询领导者，专业提供产业规划、产业申报、产业升级转型、产业园区规划、可行性报告等领域解决方案，扫一扫关注。

解密Manus：靠垂直整合，抢在了AI大厂前头

前瞻经济学人

前瞻产业研究院

相关阅读RELEVANT

咨询·服务

研究员周关注榜

决策精品报告

解密Manus：靠垂直整合，抢在了AI大厂前头

前瞻经济学人

前瞻产业研究院

相关阅读RELEVANT

咨询·服务

研究员周关注榜