2026 年 3 月,滴滴上线 AI 出行助手「小滴」。用户说一句「身体不舒服,有点晕车,尽快叫车」,AI 会把这句话拆成「驾驶平稳」「油车」「最近的车」等条件。[1]
6 月,支付宝开始测试 AI 版「阿宝」。按照支付宝的说法,用户可以在一个对话框里调用上万种服务。过去需要四处寻找的公积金、缴费、挂号和寄快递,现在说句话就能找到。[2]
两家公司讲的是同一个故事:以前是人找服务,现在由 AI 理解人,一句话把事情办完。
这套故事听起来当然很先进,但实际用一下又会觉得很诡异。
因为很多所谓 AI 化,并没有让用户少做一步,而是让用户多说一句话。
先说滴滴。小滴不是没有价值,打车确实存在许多难以用固定选项表达的需求:容易晕车、需要放婴儿车、临时增加途经点、每周固定预约。
让用户直接说,再由 AI 翻译成调度系统能处理的条件,比摆出几十个筛选项自然得多。
这正是自然语言适合的场景:目标大致明确,但条件多、组合复杂,产品很难提前穷举。
可滴滴公布的数据又很有意思。在小滴收到的个性化叫车需求中,「又快又便宜」排第一,占 57%;第二是「空气清新」,占 12.5%;第三是「最近的车」,占 9.9%。
打车用户想要又快又便宜,需要 AI 才能理解吗?
快、便宜、近,本来就是打车产品最基本的目标。用户打开滴滴,难道默认希望平台派一辆又慢又贵、离自己十公里远的车?
如果说一句「又快又便宜」真能明显改善结果,说明默认调度没有照顾最普遍的需求;如果说不说差别不大,AI 只是让用户重新描述了一遍系统早该知道的事情。
小滴真正有价值的部分,不一定要放进聊天框。
用户输入目的地,AI 完全有能力根据用户的目的地和历史行为推测用户是否有放婴儿车或者带老人出行的诉求,再结合价格、距离、车型和司机服务给出几个清楚的方案。
猜不准也没关系,用户可以再改。好的产品应该先替用户做一轮判断,再让用户确认和修正,而不是一开始就把空白输入框摆出来,让用户替系统完成理解工作。
AI 可以参与整个过程,却没必要站在首页等用户聊天。
滴滴的问题,主要是把一部分基础目标包装成了 AI 个性化。支付宝的问题更深:它承诺的是「办事」,现阶段最稳定的能力却更像「找路」。
公众号「饭后服用」的一篇群体内测记录中,阿宝推荐咖啡时列出了一批无法直接下单的品牌,规划路线时给出一段文字「路书」,没有顺畅调用现成的地图能力。让它转账,它只是打开转账页面;同一句「转 1000 块」,不同测试者还分别进入了转账和余额充值页面。
充话费,界面显示充值已经完成,但测试者称实际并未到账;基金推荐,基金名称与代码没有对应上。[3]
刺猬公社的一次内测中,它统计淘宝系支出时漏掉了一部分盒马消费;用户提出质疑后重新计算,又把山姆、小红书和天鹅到家算进了淘宝系。[4]
这些测试暴露出一类问题:阿宝不只会找错路,有时连执行状态和专业信息也会出错。
这些都只是内测案例,不能用来推导阿宝的整体准确率。
但支付宝和普通聊天机器人有一个根本区别:它管钱。
豆包聊历史时胡说八道,用户顶多笑笑就完了,撑死在小红书发个帖子调侃一下;转错一笔钱,问题立刻变成谁来赔。
阿宝因此陷入一个很难绕开的矛盾:如果 AI 不碰钱,只负责理解意图、寻找入口和准备流程,它更像语义搜索与智能导航;如果真让 AI 自主转账,替用户还款,甚至购买理财产品,大模型的不确定性又会撞上金融产品最重要的确定性。
支付宝自己也承认这条边界:涉及资金变动和支付的环节,必须由本人确认。
只要最后还要本人确认,关键一步就绕不开图形界面。
这件事让支付宝陷入一种很拧巴的困境:前面聊了半天,真正重要的金额和授权,仍然要由用户自己看、自己选、自己负责。
这种拧巴也说明,很多 AI 产品不愿意承认的一点是,GUI 仍然很有价值。
至少在这些高风险场景里,AI 版支付宝还没有证明自己比传统图形界面更有价值。最后退回老方案,不是因为老方案落后,而是因为老方案更合理。
所谓 AI 化如果只是加个聊天框,就没有真正给用户带来体验升级,甚至做不到对原有路径的平滑替换。
很多 AI 产品经理似乎太迷信自然语言交互,觉得产品里只要还有菜单、卡片和表单,就不够 AI Native;只有留一个空白输入框,让用户把需求从头说一遍,才算进入未来。
可是历史上图形界面取代命令行,不是因为图标比较可爱,而是因为人更擅长识别,不擅长凭空回忆。
选项、状态和操作路径摆在眼前,用户看一眼就知道能做什么;面对空白输入框,用户反而要先猜系统有什么能力,再琢磨应该怎么说。[5]
大模型确实把命令行翻译成了人话,但人话依然可能是命令行。用户仍要先理解系统,再组织一条指令交给机器。区别只是过去输入 taxi –cheap –fast,现在输入「帮忙叫一辆又快又便宜的车」。
过去产品经理总说要少让用户思考一步。现在有些 AI 产品反过来教育用户怎么提问,多少有点黑色幽默。
自然语言不是没有价值。用户目标模糊、条件很多、不知道入口在哪时,对话可以显著降低门槛。
但这件事要分场景看。
目标模糊、条件很多、风险不高,对话有价值。目标明确、路径成熟、操作只有一两步,再加一轮对话就未必是升级。目标明确但风险很高,尤其涉及钱和授权,AI 最多适合准备流程,最后还是应该回到清楚、可核对的界面。
很多 AI 产品的问题,是把第一种场景里的价值,硬套到了所有场景里。
这种交互迷信背后还有一个更大的误会:把 AI 带来的生产力提升,直接当成了用户价值提升。
几年前我在《GPT 只会让互联网行业更不值得卷》里写过,AI 首先是一场生产力革命,但许多行业真正缺少的不是生产能力,而是需求。[6]
移动互联网降低了接入成本,带来了更多用户和使用时长。AI 首先降低的却是生产成本:功能更容易做,Demo 更容易演示,故事也更容易包装。前者扩大市场,后者先扩大供给。
当聊天框越来越容易做出来,「能做」就很容易冒充「该做」。
这件事还有一个组织层面的诱惑:聊天框最容易展示 AI 化。它适合发布会截图,适合产品 PR,适合让老板、媒体和用户一眼看见“我们已经接入 AI 了”。这种诱惑会诱使人用愿望替代常识。
但真正有价值的东西,往往没有那么好展示。
后台调度、默认值、状态校验、履约治理、异常识别,这些东西更像脏活。它们不一定能在首页变成一个漂亮入口,却更可能真的减少用户麻烦。
模型能给所有 App 加上对话框,不代表所有 App 都需要对话;Agent 能替用户点击按钮,也不代表点击按钮本身是个问题。
真正好的 AI 产品往往没有那么强的「AI 味」。它可能只是自动填好一张表,提前发现一个错误,在后台完成一次更好的匹配,把十分钟机械操作压缩成一次确认,或者在用户不知道怎么办时,给出一个可以继续修改的结果。
判断产品的价值,可以回归俞军的用户价值公式:
用户价值 =(新体验 – 旧体验)- 替换成本。[7]
旧路径到底有几步?AI 理解错一次,用户要花多少时间检查和修正?它是在缩短任务,还是只增加了一轮对话?把「AI」两个字去掉,这个功能还值得做吗?
模型越强,越需要这些常识。过去一些蠢想法会因为技术做不到而自然死掉,现在却可以被迅速做成 Demo,包装得十分精致,再推到用户面前。
AI 产品真正应该消灭的是用户的麻烦,不是用户已经会用的按钮。
参考文献
[1] 滴滴公布 AI 打车数据,网约车进入个性化需求新阶段|新华网 https://www.xinhuanet.com/tech/20260323/7b1970fbe2484359bd595254b110be9a/c.html
[2] AI 版支付宝官宣开启邀测:右滑打开「阿宝」|IT之家 https://www.ithome.com/0/964/691.htm
[3] 史诗级支付宝 AI 改版,群友体验一秒就……|王二鹅 ERE https://mp.weixin.qq.com/s/QT6SDlYU1duz_Ulb9tDuJQ
[4] 实测 AI 版支付宝:一个半成品,和潜在的交互革命|虎嗅 / 刺猬公社 https://www.huxiu.com/article/4867841.html
[5] Memory Recognition and Recall in User Interfaces|Nielsen Norman Group https://www.nngroup.com/articles/recognition-and-recall/
[6] GPT 只会让互联网行业更不值得卷|最小可读 https://mvread.blog/archives/206
[7] 漫谈产品经理|俞军 https://www.bobinsun.cn/assets/pdf/%E6%BC%AB%E8%B0%88%E4%BA%A7%E5%93%81%E7%BB%8F%E7%90%86.pdf
精选评论