Jason

MiniMax Agent: 真正全能的智能体工具,一键云部署 OpenClaw + 预置专家模式,告别命令行!

下载文件

1. 技术概览与环境准备

1.1 核心组件说明

  • MiniMax Agent: 提供图形化界面的桌面端 AI 智能体应用。支持 Windows、macOS 和 Web 端跨平台运行。内置 MCP(模型上下文协议)集成与特定领域的专家系统。
  • MaxClaw: 由MiniMax发布的云端托管的OpenClaw,无需手动部署,直接上手使用,预置专家功能适用多种工作场景。
  • MiniMax M2.5: 底层驱动大语言模型。具备强大的代码编写、工具调用以及长文本处理能力,在 SWE-Bench 等基准测试中表现出色,API 调用成本极低。

1.2 安装与部署步骤

  1. 访问网页端 agent.minimax.io
  2. 在右上角选择对应操作系统(Windows/macOS)的安装包下载。
  3. 双击运行安装程序,完成本地客户端部署。
  4. 启动桌面端应用程序,登录账号。

2. 界面布局与基础配置

应用界面主要分为对话区与底部功能配置区。

2.1 目录访问授权 (Workspace)

点击界面左下角第三个文件夹图标,为智能体指定工作目录。

  • 操作逻辑: 指定目录后,智能体能够直接读取和写入目标文件夹内的文件。
  • 适配对象: 本地 Excel 报表文件夹、Obsidian 本地笔记库目录等。
  • 风险提示: 建议仅授权特定工作目录,并提前做好文件备份,防止文件被覆盖或误删。

2.2 MCP 与子代理配置

点击界面左下方第二个配置图标,接入外部服务。

  • Notion 接入: 在配置界面中找到 Notion 选项,直接填入 Notion 的集成密钥(Integration Token)就可以完成绑定。不需要编写 JSON 配置文件。

2.3 模型与响应模式选择

位于对话框右下方。

  • 模型选择: 推荐选择 MiniMax M2.5。
  • 任务模式: 支持在快速响应和复杂任务模式之间切换。

MiniMax M2.5模型

结合 2026 年最新的基准测试数据,MiniMax M2.5 在代码编写、工具调用和多轮复杂任务执行上,已经具备对标顶级闭源大模型的能力。

![[排行榜.jpg]]

  • 基准测试数据对比
    • 代码工程能力:在 SWE-Bench Verified 测试中,M2.5 得分为 80.2%,和 Claude Opus 4.6(80.8%)以及 GPT-5.2(80%)处于同一梯队。在 Multi-SWE-Bench 多库协同任务中,得分为 51.3%,超越了 Claude Opus 4.5 与 4.6。
    • 工具与环境调用:在 BrowseComp (w/ctx) 网页与上下文环境中得分 76.3%;在 BFCL multi-turn 多轮函数调用测试中得分 76.8%,全面领先 Claude Opus 4.5(68%)和 Gemini 3 Pro(61%),位列横向测评第一。
  • 处理速度与逻辑架构
    • 这个模型具备架构师级别的全局规划能力,在生成代码前会自动执行特征拆解与 UI 规划。
    • 原生推理速度最高可达 100 token/秒(Lightning 版本),执行复杂智能体任务的平均耗时比上一代 M2.1 缩短 37%,和 Claude Opus 4.6 的速度持平。
  • 极致的性价比
    • API 定价约为输入 $0.30 / 1M token,输出 $1.20 / 1M token。
    • 在相同的复杂任务处理流程下,M2.5 的总调用成本仅为 Claude Opus 4.6 的 10% 左右。对于需要长时间挂机运行、产生大量上下文消耗的桌面智能体而言,使用这个模型能彻底消除高昂的 API 账单风险。
  • 社区评价:OpenClaw的最优模型

3. 专家系统与应用场景实操

专家系统封装了特定领域的知识、工具链和操作逻辑,替代了传统的 Agent Skill 手动安装与 API 配置。在专家界面通过关键词搜索就可以直接调用。

3.1 场景一:生成结构化 PPT

调用 AI PPT 专家,通过子代理执行页面规划与样式设计。

操作步骤:

  1. 进入专家界面,搜索并选择 AI PPT 专家。
  2. 发送具体的主题与结构要求。
  3. 智能体将自动规划大纲、分配配色方案并生成 PPT 文件。

执行提示词 (Prompt):

# 任务目标
生成一份 10 页的 PPT。

# 核心参数
- 主题:AI Agent(人工智能智能体)技术深度分析
- 视觉风格:科技风

# 内容与排版规范
- 视觉呈现:每页提炼核心要点,拒绝大段文字堆砌,多使用层级列表或对比结构。
- 执行要求:不需要向我确认大纲,直接基于这个框架逻辑和参数要求,生成最终的 PPT 文件。

3.2 场景二:本地英文文献翻译与分析

调用 PDF 分析 专家,处理多篇本地文献。

操作步骤:

  1. 确保目标 PDF 文件(如从 Arxiv 下载的文献)已存放在授权的工作目录中。
  2. 搜索并选择与文档分析或学术论文相关的专家。
  3. 下达读取、翻译、提炼以及绘制结构图的指令。

执行提示词 (Prompt):

批量处理当前文件夹下的所有 PDF 文件。
对每一个 PDF 文件,执行以下操作:

1.  **内容读取与转化**
    *   提取文本内容。
    *   将内容翻译并整理为中文(若原文非中文)。
    *   提炼核心观点、关键数据和结论。

2.  **生成 Obsidian 笔记 (.md)**
    *   创建一个以PDF文章内容命名的 Markdown 文件。
    *   把提炼的核心知识点、数据与结论写入到markdown知识笔记中。

3.  **生成思维导图 (.canvas)**
    *   创建一个与markdown笔记同名的 Obsidian JSON Canvas 文件。
    *   基于提取的内容构建思维导图(中心主题 -> 主要论点 -> 细节)。
    *   **关键要求**:请务必在生成 JSON 时计算合理的 x,y 坐标,确保节点呈树状或发散状排列,**不要**重叠在一起。

4.  **输出**
    *   将生成的 .md 和 .canvas 文件保存在当前目录下。

3.3 场景三:生成个人网站 (代码生成)

调用 Landing Page Builder 专家,通过自然语言生成网站代码。

操作步骤:

  1. 在专家界面搜索 Landing Page Builder。
  2. 描述网站的用途、风格、功能需求与排版布局。
  3. 智能体将自动生成代码并在浏览器中预览生成的网页。

执行提示词 (Prompt):

为我创建一个现代极简风格的个人博客网站。

风格要求:
网站采用左侧固定侧边栏 + 右侧内容画布的结构,侧边栏简洁垂直导航(Logo、首页、文章、关于我、联系方式),整体视觉偏左布局,而非居中型 landing page。
整体视觉为浅色极简风格,使用浅灰或米白背景、深灰文字与低对比灰色分隔线,避免纯黑纯白的强对比。大量留白,界面干净克制,强调阅读体验与内容优先。
排版为编辑式(Editorial Style):大标题、宽松行距、清晰层级,通过字体大小与间距建立视觉重点,而不是依赖颜色或装饰。

首页顶部包含个人介绍区域:圆形头像、姓名标题、简短介绍文字,并配合低透明度背景图片作为氛围元素。
文章列表采用卡片或网格流布局,封面图片简洁,并带轻微 Hover 放大效果。

交互保持克制:平滑滚动、细微 hover 动效,不使用复杂动画或视觉特效。
整体气质:安静、理性、现代、像高质量个人博客或设计杂志网站,突出长期阅读体验。

3.4 场景四:自定义专家 - YouTube 视频转录与学习

如果预设专家无法满足需求,可以手动创建专属工作流。

创建步骤:

  1. 点击专家界面右上角的创建按钮。
  2. 输入专家名称(例如 YouTube 知识提取专家)。
  3. 指定底层大语言模型(选择 MiniMax M2.5)。
  4. 填入专家描述与系统指令。直接复制开源 YouTube-Transcript skill 的指令内容。
  5. 保存并在我的专家列表中发起对话。

执行提示词 (Prompt):

当我发送一个 YouTube 视频链接时,获取视频字幕,把字幕内容保存到文件夹。
然后,执行以下流程:
1.  **内容读取与转化**
    *   提取字幕内容。
    *   将内容翻译并整理为中文(若原文非中文)。
    *   提炼核心观点、关键数据和结论。

2.  **生成 Obsidian 笔记 (.md)**
    *   创建一个以内容主题命名的 Markdown 文件。
    *   把提炼的核心知识点、数据与结论写入到markdown知识笔记中。

3.  **生成思维导图 (.canvas)**
    *   创建一个与markdown笔记同名的 Obsidian JSON Canvas 文件。
    *   基于提取的内容构建思维导图。
    *   **关键要求**:请务必在生成 JSON 时计算合理的 x,y 坐标,确保节点**不要**重叠在一起。

4.  **输出**
    *   将生成的 .md 和 .canvas 文件保存在当前目录下。

接下来,按照我的要求处理这个YouTube视频链接:[视频url]

更多全栈开发场景尝试

  • AI驱动的全栈任务管理应用(Kanban / 待办)
你是一个高级全栈开发助手,我要构建一个完整可运行的 AI 驱动任务管理 Web 应用(类似看板/待办)。

**需求概况**
应用名称:AI 看板任务管理
核心功能:
1. 用户注册/登录/权限
2. 多看板/多任务列表
3. 拖拽排序卡片(Kanban)
4. 任务卡包含标题、描述、截止时间、标签
5. AI 自动建议任务优先级与分类
6. 后端保存用户数据并可导出为 JSON

**技术栈要求**
- 后端:Node.js + Express + 数据库(MongoDB 或 PostgreSQL)
- 前端:React(或 Vue3)+ Tailwind CSS
- 拖拽:React DnD 或 Vue Draggable
- AI部分:集成 AI 模型或 REST API 用于智能推荐

**输出要求**
1. 自动生成完整项目结构
2. 自动实现 REST API 和前后端联调
3. 自动生成前端页面(登录/看板/任务卡/统计)
4. 写好 README 和部署脚本(Docker + 启动说明)
5. 自动添加单元测试

请直接生成该项目完整代码,并解释每个主要部分用途。
  • AI 图像生成与用户画廊系统(多人协作)
你是全栈开发专家,我需要构建一个多人协作的 AI 图像生成与画廊 Web 平台。

**产品名称:AI 画廊协作平台**
核心功能:
1. 用户登录/注册/权限
2. 支持用户上传与生成图像
3. 集成图像生成模型 API(如 Stable Diffusion / Gemini 图像)
4. 多人协作:用户可对图像点赞/评论/变更提示词
5. 画廊展示页面支持筛选/排序
6. AI 自动生成图像标签与优化建议

**技术要求**
- 后端:Node.js + Express + 数据库(MongoDB)
- 前端:React/Vue + Vite + Tailwind CSS
- AI 接口:通过 REST 调用图像模型生成图像并保存 URL
- 文件存储:可用本地或云存储(S3/COS)

**输出要求**
1. 自动搭建完整可运行应用
2. 自动实现图像上传、生成与保存逻辑
3. 自动处理前后端 API 联调
4. 自动添加用户评论/点赞页面
5. 自动生成部署和测试脚本
6. 包含本地运行说明与部署说明

请生成该项目完整代码和部署说明。
  • 智能数据可视化仪表盘(BI Dashboard)
你是全栈开发助手,我要构建一个智能数据可视化仪表盘(BI Dashboard)Web 应用。

**项目名称:智能 BI 仪表盘**
核心功能:
1. 用户登录/权限管理
2. 可上传 CSV/Excel 数据
3. 自动分析数据结构与字段类型
4. 根据字段自动生成多种图表(折线/柱状/饼图等)
5. 支持实时筛选与过滤
6. AI 自动智能推荐图表类型与摘要分析
7. 用户可保存仪表盘视图配置

**技术栈**
- 后端:Node.js + Express + Python 数据分析服务(可选)
- 数据库:MongoDB / PostgreSQL
- 前端:React + Recharts / ECharts + Tailwind CSS
- AI 模型接口:通过 REST 调用分析和建议

**输出要求**
1. 自动创建完整项目目录与文件
2. 自动实现数据上传 API
3. 自动生成可交互式图表页面
4. 自动集成 AI 推荐引擎
5. 自动生成单元测试与部署说明

请直接生成完整项目代码、自动测试脚本以及 Docker 部署文档。

4. OpenClaw 自动化部署

4.1 一键部署OpenClaw到本地

针对 OpenClaw 终端部署报错率高的问题,MiniMax Agent 提供了图形化的一键部署功能。

部署步骤:

  1. 在 MiniMax Agent 桌面端主界面点击一键部署 OpenClaw 按钮。
  2. 在弹出的验证流程中,登录 MiniMax 账号。
  3. 授权智能体自动获取 API Key 并配置环境变量。
  4. 等待后台配置与安装流程结束,系统将自动打开 OpenClaw 的本地 Web 界面。
  5. 在 OpenClaw 界面中发送测试指令以确认连接成功。
  6. 模型选择方面,推荐在 OpenClaw 中配置 MiniMax M2.5 模型,平衡性能与 API 调用成本。

4.2 重磅更新:MaxClaw (云端托管模式)

MaxClaw 是 MiniMax 官方推出的 OpenClaw 云端托管版本,旨在彻底解决本地部署的硬件门槛与 API 成本问题。

核心特性

  • 一键部署: 一键部署到云端,免除 OpenClaw 原本繁琐的命令行部署方式。
  • 免运维: 无需本地 Docker 环境或 Python 依赖,云端环境 24/7 待命。
  • 全渠道控制: 支持绑定 Telegram / WhatsApp / Discord,国内支持飞书 / 钉钉,实现通过手机 IM 软件远程遥控 Agent 执行任务。
  • 预置专家:内置经过微调的垂直领域专家配置(如:爆款猎手、行业研报、热点追踪),开箱即用。

使用逻辑: 不再需要复杂的初始化流程,在 MiniMax Agent 界面顶部切换至 MaxClaw 模式,选择对应场景配置,即可直接通过自然语言驱动 OpenClaw 的全栈能力。

4.2.1 连接Whatsapp与MaxClaw

直接在对话框中输入连接Whatsapp,AI会返回一个二维码,打开手机Whatsapp扫码即可完成链接。

4.2.2 连接飞书与MaxClaw(最适合国内网络环境)

直接在对话框中输入连接飞书,AI会返回具体步骤,核心步骤是创建飞书企业自建应用

登录 飞书开放平台 -> 开发者后台。

  1. 创建应用: 点击“创建企业自建应用”,填写名称(如 MyBot),选择图标。
  2. 添加能力: 左侧菜单“添加应用能力” -> “机器人” -> 点击添加。
  3. 权限管理 (关键):
    • 进入“权限管理”。
    • 搜索并开通 im:message 相关权限 (收发消息)。
    • 也可批量导入: 点击“批量导入”,粘贴以下 JSON 配置 (参考模板):
{
  "scopes": {
    "tenant": [
      "im:chat.access_event.bot_p2p_chat:read",
      "im:chat.members:bot_access",
      "im:chat:read",
      "im:message",
      "im:message.group_at_msg:readonly",
      "im:message.p2p_msg:readonly",
      "im:message:readonly",
      "im:message:send_as_bot",
      "im:resource"
    ],
    "user": [
      "contact:contact.base:readonly"
    ]
  }
}
  1. 版本发布: 左侧“版本管理与发布” -> 创建版本 (v1.0.0) -> 发布。
  2. 获取凭证: 左侧“凭证与基础信息” -> 复制 App IDApp Secret。返回MaxClaw,把App ID和App Secret发送给AI,AI会打通链接。
  3. 开启事件订阅:返回飞书应用, 回到飞书开发者后台 -> “事件与回调”。配置订阅方式: 选择 长连接添加事件: 点击“添加事件” -> 搜索 receive -> 勾选 im.message.receive_v1 (接收消息) -> 确认。
  4. 重新发布: 修改配置后,必须再次去“版本管理”发布一个新版本才能生效。
  5. 手机APP测试: 打开飞书 App -> 搜索机器人名称 -> 发送 “你好”。(飞书桌面APP同理)

4.2.3 智能体使用案例

切换到行业研报模式,输入提示词,生成行业报告:

深度调研 2026 年“ AI Agent”工具的竞争格局

请生成一份对比报告,核心分析以下 3 点:

1. **控制深度**:谁对本地文件系统(Local File System)和非 API 软件的接管能力更强?
2. **成本经济性**:对比“长链路任务”(如连续工作 4 小时)时的预估成本。
3. **生态护城河**:目前哪家的第三方“专家/插件”生态最丰富?

最后,用表格总结优劣势,并给出结论:对于“一人公司”创业者,谁是目前的性价比之选?

5. 成本核算与系统限制

操作复杂任务时需要注意云端计算积分的消耗情况。

5.1 典型任务积分消耗参考

任务类型处理内容量级预估积分消耗
一键部署 OpenClaw系统级环境配置约 35 积分
个人网站代码生成完整单页应用源码约 600 积分
YouTube 视频转录10-20 分钟视频内容提取、翻译与绘图约 700 积分
多 PDF 联合分析4 篇学术论文全量读取、翻译与总结约 800 积分

补充说明:免费用户拥有 200 积分/日的额度;专业版订阅用户额度为 20,000 积分/月。

5.2 优化建议

  1. 结构化指令: 提示词的结构越清晰,要素定义越严格,智能体生成的代码与内容质量就越高,可以有效减少反复修正带来的积分损耗。
  2. 权限隔离: 执行最小权限原则。如果需要智能体清理或重构文件,务必提前将目标文件拷贝至独立的测试文件夹中进行操作。

5.3 与其他Agent工具对比

对比维度MiniMax AgentClaude CoworkClaude Code / OpenCode (命令行工具)
交互形态图形化独立客户端,内置专家组件广场Claude Desktop 客户端内的独立标签页纯文本终端界面 (CLI/TUI)
平台支持Windows, macOS, Web, 移动端macOS, Windows(2026年2月10日支持Windows)依赖终端模拟器与系统底层的全平台
技术门槛零门槛,直接双击运行,免系统配置较低门槛,依托沙盒虚拟机运行,需要基础的环境配置认知极高,需要熟悉终端指令、配置环境变量以及排查代码报错
使用成本极低,每天赠送免费积分,按需消耗极高,强制绑定 20 美元/月或更高阶的订阅套餐隐性成本极高,需要用户自己支付底层大语言模型的 API 调用账单
限制因素网络环境友好,无严格地区限制地区风控极严(容易封禁 IP),强制锁定 Claude 闭源生态模型缺乏图形界面的直观交互,对非程序员极度不友好;Claude Code 同样受限于严格的地区风控