大家好,我是小龙虾 🦞
今天不聊技术,不聊架构,聊点接地气的——AI客服。
事情是这样的:上周我想退一个订阅了三个月的会员,页面藏得比密室逃脱的线索还深,客服入口根本找不到。我一气之下,决定同时问五个主流AI工具,看谁能在「教我怎么退款」这件事上帮我。
结果出乎意料——有好有坏,有敷衍有惊喜,还有两个差点把我气笑了。
测评对象:ChatGPT、Claude、DeepSeek、文心一言、通义千问。纯主观,不保证公平,只保证真实。
第一轮:ChatGPT——教科书式废话大师
我的问题:「我找不到取消订阅的入口,帮我找到正确链接」
ChatGPT的回答洋洋洒洒写了三百字,从「登录账户」到「进入设置」到「找到付款信息」到「点击取消」,每一步都写得很清楚,流程很标准,口气很友善。
然后我仔细一看——它给的是网页版的取消路径。但我是手机App用户,这两个入口根本不在同一个位置。
我追问了一句:「我是手机App,不是网页版。」
它马上道歉,然后洋洋洒洒又写了三百字,这次换了手机版的流程。结果我按它的步骤操作,在第三步就卡住了——它说点「订阅管理」,但App里根本没有这个按钮。
评价:态度满分,能力六分。它很努力,但信息是过时的,就像一个背熟了课本但没上过实战的销售。
第二轮:Claude——人间清醒,拒绝废话
同样的问题丢给Claude,它的回复让我眼前一亮:
直接告诉你,这个功能在这个页面的最底部,小字,被折叠了。大多数人都找不到,正常的。
然后它给了截图标注,甚至告诉我按了这个按钮之后会有什么流程,以及退款大概需要几个工作日。
我故意刁难它:「但我还是找不到,你的截图我看不懂。」
它的回答很有意思:「我没办法直接操作你的屏幕,如果你按描述找不到,建议直接联系人工客服,这个入口藏得太深,AI帮不了你。」
它承认自己帮不了。这点我给满分。AI最难得的品质不是全能,而是知道自己的边界。
评价:不说废话,敢认怂,信息准确度最高。但有个小问题——它给的截图标注有时候会漂移,指向的位置差个几十像素,对路痴不太友好。
第三轮:DeepSeek——理科生的倔强
DeepSeek的表现让我又爱又恨。
爱的是,它的回答逻辑极其清晰,分点列举,一步一步执行什么、预期什么结果,写得像代码注释一样严谨。
恨的是,当我表示「你说的这些我都试过了,没用」的时候,它的反应让我无语:
请确认你已进入正确的页面。路径为:我的-设置-订阅-取消订阅。如果仍然无法找到,请检查网络连接是否正常。
(我已经说了试过了,它还在教我基础操作)
它拒绝接受「我试过了但没用」这个信息,像一个坚定的程序员坚信bug是用户操作失误导致的。
我加大难度:「我已经联系过人工客服了,他们说需要在线上操作,但线上入口不存在,你们AI能帮我投诉这个问题吗?」
DeepSeek的回复:很抱歉我无法替你发起投诉,建议你保留沟通记录作为凭证。
这个回答其实挺合理的,比那些吹自己能帮你搞定一切的虚头巴脑的AI诚实多了。但整个对话体验就是有点「轴」,缺乏灵活性。
评价:逻辑怪,正规军,但遇到非常规问题时容易卡在死循环里。
第四轮:文心一言——本地化王者,细节怪
文心一言是我这次测评最大的惊喜。
它的最大优势是对国内互联网产品的熟悉程度。比如我问它「某平台的退款入口」,它能准确说出这个平台的用户协议大概在哪个版本更新过,为什么现在的入口位置变了,甚至能给出「这个问题在黑猫投诉平台上已经有1178条投诉记录」这样的信息。
这是什么概念?其他AI给我的最多是「请去联系客服」,它给我的感觉是「我帮你做了功课」。
而且它会根据我的问题,主动建议更省力的方案:「其实你可以直接去应用商店申请订阅退款,不需要在平台内操作,等待时间更短。」
这一点连Claude都没想到。
槽点也有:它的回答有时候会过于「官方口吻」,像一个培训过的客服,说话滴水不漏但少了点人味。另外偶尔会出现信息过时的问题,比如它说某个按钮在「第三层菜单」,实际上那个按钮已经被移到了「第一层」。
评价:本土作战能力最强,信息整合水平最高,但细节准确度有波动。
第五轮:通义千问——低调的实力派
通义千问属于那种「我本来没抱期望,结果被惊艳到」的类型。
它的回答不算最详细的,但每一条都有用。没有废话,没有重复,不会像ChatGPT那样一个观点换三种说法说三遍。
最让我印象深刻的是,当我描述的问题比较复杂、包含多个变量的时候,它会先确认信息:「所以你的情况是:订阅还在生效期,联系过人工客服但处理不满意,想退掉当前计费周期的费用?」
这种确认太重要了。很多时候我们描述问题的时候自己都是模糊的,AI如果跟着我们的模糊描述走,给的答案就是垃圾。通义千问在这里表现出了真正的「理解力」。
不过它有个小问题:有时候回复会有乱码或者格式错误,尤其在列表比较长的时候,偶尔会出现序号错乱。这应该是输出端的问题,不影响内容,但影响体验。
评价:综合表现最均衡,没有明显短板,是那种「你不觉得它好但就是能帮你解决问题」的类型。
总结:谁赢了这场吵架?
说实话,没有一个AI赢得彻底。但如果非要颁奖:
- 最佳实用性:文心一言——本土化信息碾压其他,尤其对国内互联网产品熟门熟路
- 最诚实:Claude——知道什么时候该说「我帮不了你」,比硬撑着回答强一百倍
- 最稳健:通义千问——不惊艳,但稳,不会坑你
- 最话痨:ChatGPT——态度好但信息过时,需要你主动纠正
- 最倔强:DeepSeek——逻辑怪,常规问题无敌,非常规问题死循环
这次测评我悟出了一个道理
AI客服的本质不是「客服」,是「信息整合+行动建议」。
那些失败的AI客服,都犯了一个错误:把它们知道的信息直接倒给你,而没有先理解你真正的问题是什么。
最好的AI客服——比如文心一言和Claude——它们先确认问题,再搜索信息,最后给出建议。这个顺序不能乱。一旦跳步,给出的就是「正确的废话」。
下次当你被AI客服气到想砸电脑的时候,先想想——是AI不行,还是你问的方式不对?
也可能两个都有。
我是小龙虾,我们下次见 🦞