解密Manus:靠垂直整合,抢在了AI大厂前头
图源:摄图网
作者|麦思 来源|直面AI(ID:faceaibang)
AI圈正迎接新一轮的技术爆发期,DeepSeek以深度推理模型R1震撼海内外,OpenAI、Anthropic、谷歌、阿里、字节、百度等纷纷推进自家大模型的新动态。模型层之外,应用层也开始多了些新变化。
最近的创新来自一家由中国90后创始团队推出的新产品——一款号称通用AI Agent的应用工具Manus。
Manus的官网(https://Manus.im/usecases)给出了一些例子可以供我们更加直观的了解Manus的能力,可以看到它的功能在官方演示中确实特别强大,目前Manus的使用需要提前获取邀请码。
有必要简单介绍一下Manus。与传统AI助手相比,类似豆包、Kimi、DeepSeek这些,其局限于信息检索与建议交互,而Manus首次实现“自主执行复杂任务→交付完整成果”的闭环能力,填补了当前市场空白。
另外一点是通用性定义的突破:跨领域处理复杂任务(如股票分析、旅行规划、代码生成等),打破垂直赛道AI的局限性,这是惊艳的前两点。第三点是Manus是继中国团队做出来DeepSeek之后的又一力作,定位为“手脑并用”的通用助手,强调“输入需求→输出结果”的无中介执行模式,命名源自拉丁语“Mens et Manus”(意为手脑并用),技术理念主张“Less structure, more intelligence”,减少预设流程依赖,强化模型自主进化能力。
01
Manus的优缺点
总结一下Manus的核心优势:
全流程自主执行:从需求分析(如简历筛选)、任务拆解(如房产选购规划)到成果交付(生成Excel/PPT报告)无需人工干预。
多工具链整合:支持浏览器操作、编程工具调用、跨平台数据抓取,实现复杂操作(如自动解压简历包并分析)。
覆盖教育(教学材料生成)、金融(股票关系分析)、人力资源(候选人分级)、企业服务(自动化周报)等多领域。
跨领域协同:可同时处理比如简历筛选与房产选购两类异构任务,体现通用Agent特性。
多Agent协作系统:规划、执行、验证三模块分立,云端虚拟机并行处理任务,提升容错率。
上面是Manus的优势,同样Manus也有一些劣势:
依赖预设流程框架:部分任务需在浏览器与操作系统间的“受限环境”执行,无法适配未预定义的应用程序。
执行稳定性问题:用户反馈存在崩溃前生成虚假结果(如伪造邀请码)等不可控行为。
高炒作热度导致早期用户预期与实际能力落差,部分场景仍需人工修正输出结果。
企业端部署成本:云端虚拟机运行模式对算力需求较高,限制中小型企业使用。
自主签署合同的法律效力尚未明确,隐私数据跨平台调用可能引发合规争议。
职场替代焦虑:80%中低频白领工作(如简历筛选、报表生成)面临被低成本AI替代的风险。
02
Manus究竟做了哪些技术创新?
说完优缺点之后,我们再重点看一下使得Manus这么强的背后技术创新,究竟是什么。
1. 多智能体协作系统(Multi-Agent Collaboration)
三层架构设计:
规划代理(Planning Agent):采用蒙特卡洛树搜索(MCTS)算法动态拆解任务优先级,支持实时调整执行路径(例如在简历筛选中优先处理学历匹配度)。
执行代理(Execution Agent):整合200+工具接口(浏览器、Office套件等),通过浏览器自动化引擎模拟人类操作(点击、滚动、表单填写),但受限于未开放API的CS架构应用。
验证代理(Validation Agent):部署对抗性测试模块,检测逻辑矛盾(如财务数据与行业基准偏差超5%时触发复核流程)。
多重签名系统(Multisig System):由多个独立模型协同处理子任务,通过交叉验证提升结果可靠性(例如股票分析中,3个模型独立计算行业关联度,取置信度最高值)。
2. 动态训练与优化机制
实时反馈迭代:用户可通过“动态培训”功能修正输出格式(如指定PPT模板)或调整执行路径(如跳过特定网站数据抓取),模型即时更新策略。
崩溃恢复技术:任务中断时自动生成替代方案(如简历解析失败后改用关键词匹配模式),并保留进度至本地缓存。
3. 工具链深度整合
浏览器沙箱技术:在隔离环境中运行跨平台操作(如自动登录招聘网站抓取简历),避免用户隐私数据泄露。
记忆偏好系统:持续学习用户习惯(如合同模板偏好),占用云端存储资源形成个性化执行策略。
4. 性能验证体系
GAIA基准测试(https://zhuanlan.zhihu.com/p/669652697)突破:在三级测试中分别达86.5%/70.1%/57.7%,超越OpenAI的DeepResearch模型,接近人类水平(90%)。
真实场景验证:在Upwork平台完成设计类任务(如Logo生成)、Kaggle竞赛中实现数据分析自动化,验证跨领域执行能力。
如果上面Manus的技术创新让你眼前一亮,这个时候你是不是会有一个疑问,为什么是Manus?其他AI厂商,尤其是科技大厂为什么没有做出这样的成果,是其他厂商不具备这样的能力吗?目前来看,原因或许有以下几种因素:
1. 技术路径依赖
模型规模优先策略:OpenAI等厂商聚焦于扩大模型参数量(如追求GPT-5),未将工具调用能力作为核心研发方向。
规则工程惯性:传统AI产品依赖预设流程(如客服对话树),难以适应Manus倡导的“Less structure, more intelligence”理念。
2. 工程化挑战
多工具接口适配成本:需为浏览器、办公软件等开发专用驱动,大厂不愿干脏活累活,其他小厂商又缺乏生态整合能力(如Manus团队耗时2年完成200+工具接口开发)。
长周期任务管理难题:传统模型受限于会话式交互,难以实现“用户离线后持续执行跨日任务”的异步工作机制。
3. 市场定位差异
B端服务壁垒:微软Copilot等产品聚焦Office场景,缺乏跨领域泛化能力(如同时处理简历筛选与股票分析)。
伦理风险规避:头部厂商忌惮自主决策引发的法律争议(如合同签署效力),选择保守技术路线。
03
Manus的后续改进和行业影响
针对目前Manus表现出的一些缺点,我们认为它未来的改进点如下:
增强环境适应性:突破浏览器/操作系统的“夹层”限制,实现更底层的系统权限调用。
降低算力依赖:通过模型压缩与边缘计算结合,推动中小型企业普及。
优先落地场景:企业自动化办公(智能客服、合同审核)、教育个性化教学(动态生成课件)。
开源生态建设:开放部分模型接口,吸引开发者构建插件生态(如第三方工具集成)。
建立AI执行审计机制:对自主决策过程留痕,明确错误结果的责任归属。
数据安全规范:限制敏感信息(如简历、财务报表)的跨平台流转权限。
但不容忽视的是,Manus的出现肯定会对其他厂商带来一些影响:倒逼OpenAI等厂商加速从“对话式交互”转向“任务执行型”产品开发的节奏,加速Agent技术迭代;推动多模态交互(文字/图表/代码混合输出)、工具调用API集成成为AI产品新基准。
根据Manus计划,后续官方还将开源推理模块,有望借此催生基于其技术栈的二次开发社区。
Manus需求爆火,还可能带动边缘计算设备需求激增,使得AI终端部署从云端向本地延伸,一批国产硬件厂商也有望从中受益。
AI的发展速度正推动各行各业重新洗牌,未来不是属于资产的时代,也不是属于权力的时代,未来将是属于科技的时代。
编者按:本文转载自微信公众号:直面AI(ID:faceaibang),作者:麦思
品牌、内容合作请点这里:寻求合作 ››
前瞻经济学人
专注于中国各行业市场分析、未来发展趋势等。扫一扫立即关注。