光说概念太虚了,直接上场景。
场景一:帮我看看家里有没有人
你出门了,跟MiMo Claw说一句:"打开我家的摄像头,看看家里有没有人,截屏发给我。"
它会自己打开米家App,调取摄像头画面,分析画面内容,告诉你"未检测到人物",然后把截屏保存好发给你。
整个过程四步:打开米家、调取画面、AI分析、截图反馈。你只说了一句话,剩下的全是它干的。
场景二:一条短信搞定一堆事
你收到一条短信:"演唱会购票成功,时间3月28日19:30。"
MiMo Claw会自动识别这条短信里的信息,然后一气呵成帮你干三件事:创建日历事件、查询当天天气、设置提前两小时的出门闹钟。
不用你手动打开日历App,不用你切到天气App查一下,不用你设闹钟。一条短信,全自动链路,你什么都不用碰。
场景三:看看我最近吃得健不健康
你跟它说:"看看我最近的饮食,给我做个分析。"
它会扫描你相册里的食物照片,分析出"高油高糖为主,蔬菜严重不足",给出热量超标评估,然后直接生成一份减重计划——早餐吃什么、午餐吃什么、运动怎么安排,最后保存到你的备忘录里。
这不是聊天,这是实打实在帮你做健康管理。
看到没?这三个场景的共同特点就是:MiMo Claw不是在跟你对话,它是在帮你干活。 从感知(读短信、看摄像头、扫相册)到分析(识别内容、评估健康)到执行(建日历、设闹钟、生成计划),全链路自主完成。
这就是"系统级AI智能体"的意义所在。
模型实力:全球第三,价格只有Claude的十五分之一
说完场景,回到硬实力。
小米这次一共发了三款模型,各有分工:
MiMo-V2-Pro,旗舰基座模型,专门负责推理和执行。总参数量超过一万亿,上下文一百万token,Agent排名全球第三——仅次于Claude Opus 4.6和Claude Sonnet 4.6。
MiMo-V2-Omni,全模态基座模型,负责"感知"。能看图、看视频、听音频,音频理解能力超过Gemini 3 Pro,图像理解超过Claude Opus 4.6,还能处理十小时以上的长音频。
MiMo-V2-TTS,语音合成模型,负责"表达"。支持东北话、四川话、河南话、粤语等方言,能多角色配音,能唱歌,情感控制做到细粒度级别。号称要生成"有温度、有灵魂的声音"。
三款模型组合起来,就是一套完整的AI Agent能力栈:底座(Pro推理)+ 感知(Omni多模态)+ 表达(TTS语音)。
更关键的是价格。MiMo-V2-Pro的输入价格是每百万token一美元,而Claude Opus 4.6是十五美元。Agent能力逼近Opus,价格只有人家的十五分之一。
至于为什么能做到这么便宜——小米自研的模型,自己的算力基础设施,成本结构天然就有优势。这个价格放在全球大模型市场里,确实很有杀伤力。
竞品对比:小米、华为、字节,三条路线
现在做手机端AI智能体的,不止小米一家。华为有小艺Claw,字节有豆包手机。三家路线完全不同。
小米MiMo Claw的核心策略是"自研模型+系统克制"。自己训练万亿参数模型,系统级权限直接打通,但应用范围限定在系统级应用内。好处是深度够深,隐私风险相对可控。坏处是第三方App暂时还调不了。
华为小艺Claw走的是"全屋IoT融合"路线。依托鸿蒙生态,手机、平板、电视、智能家居全打通。四大功能模块深度融合,场景覆盖面很广。但模型能力目前还在内测阶段,实际效果有待观察。
字节豆包手机打的是"第三方App覆盖广度"。支持调用第三方App,场景覆盖面最广,什么App都能帮你操作。但用的不是自研模型,隐私风险相对更高一些。
三条路线各有取舍。小米押注自研深度,华为押注生态广度,字节押注应用覆盖。谁对谁错,现在下结论还为时过早。但有一点是确定的:小米在模型自研这件事上的投入,已经开始产出了。
适配机型:目前主要是新旗舰
MiMo Claw目前处于封测阶段,支持的机型还比较有限。
小米数字旗舰线:Xiaomi 17 Ultra徕卡版、Xiaomi 17 Ultra、Xiaomi 17 Pro Max、Xiaomi 17 Pro、Xiaomi 17,这五款是首批支持的。
上一代旗舰也照顾到了:Xiaomi 15S Pro也在支持列表里。
Redmi方面:REDMI K90 Pro Max和REDMI K90两款Redmi旗舰也支持。
注意,这些都是封测阶段的支持机型,后续会逐步扩大范围。而且MiMo Claw的主要算力跑在云端端,对手机本地硬件的要求没有想象中那么高,理论上未来支持更多老机型也是有可能的。
如果你手上有以上这些机型,可以去小米MiMo Studio官网申请免费体验。每次三十分钟,数据退出后自动销毁,不用有隐私顾虑。
还有一些值得注意的细节
金山办公生态集成。 MiMo Claw接入了金山办公,支持Word、Excel、PPT、PDF四大主流文档格式的在线预览。你让它帮你做PPT,它真的能在系统里直接给你生成一个PPT文件出来。这个集成程度在国内AI助手里面算是比较深的。
OpenClaw框架。 MiMo Claw的底层跑在OpenClaw上。这是一个开源的AI Agent框架,支持多模型接入、技能扩展、定时任务等功能。对开发者来说,这意味着可以通过OpenClaw给MiMo Claw装各种"技能",扩展它的能力边界。
免费体验。 目前小米MiMo Studio提供免费体验,每次三十分钟。地址是aistudio.xiaomimimo.com。过了免费期之后的定价还没公布,但参考模型API的价格(百万token一美元),应该不会太贵。
说点实在的
MiMo Claw是不是完美的?肯定不是。
封测阶段,支持机型有限,第三方App调用还没开放,这些都是客观存在的短板。而且系统级AI智能体这个品类本身也还在早期,各家都在摸索最佳实践。
但从产品方向来看,小米这步棋走得是对的。自研万亿参数模型+系统级权限+IoT生态联动,这三个要素组合在一起,确实是做AI助手最有想象空间的路线。模型实力已经到了全球第三的水平,价格只有头部竞品的十五分之一,这意味着大规模铺开的门槛很低。
如果你是小米生态的用户,尤其是手上有小米17系列的话,MiMo Claw值得去体验一下。至少感受一下"跟AI说一句话,它帮你把一整件事办完"是什么感觉。
这个方向一旦跑通了,手机AI助手这个词的含义,可能真的要变了。
免费体验地址: aistudio.xiaomimimo.com
数据来源: 小米官方发布、OpenClaw PinchBench、Claw-Eval、Artificial Analysis、2026年3月
以上内容全是我使用Mimo Claw让它自己按照我日常写作的风格,写一篇介绍它自己的内容,当然了,只是文字也太没意思了,我还让它把内容生成视频。
我本次就是通过网页端来实现以上操作的,美中不足的是每次体验就30分钟,用后即焚~所以我想让它生成特效很多的宣传视频,每次都会浪费很多时间在合成界面~不过30分钟结束就可以马上再创建使用,个人建议等低峰期使用更好~
返回搜狐,查看更多