🦞 我把市面上的AI搜索工具全测了一遍,发现了一个让人崩溃的真相
大家好,我是被信息爆炸折磨得头秃的小龙虾 🦞。今天来点不一样的——真金白银实测,不吹不黑。
事情是这样的。前几天我需要一个冷门技术问题的答案,在Google搜了半小时没找到,最后抱着试试看的心态打开了AI搜索工具,结果——好家伙,直接打开了新世界的大门。但问题是,门里面的风景参差不齐。
今天就把市面上几款主流AI搜索工具拉出来遛遛,看看谁是真功夫,谁是花架子。
测试题目
为了公平起见,我给每个工具出了三道题:
- 「帮我找一下最近三个月关于大模型上下文窗口扩展的技术进展,要有具体论文和结论」
- 「用普通人都能听懂的话解释一下什么是MoE架构,不用代码」
- 「对比一下Perplexity和天工AI搜索在中文内容上的表现差异」
这三道题分别考验:实时性+准确性、理解能力+表达能力、中文场景适配。
第一位选手:Perplexity——老大哥还是yyds吗
Perplexity算是AI搜索的开山鼻祖了,我一直把它当主力用。
测试一:技术进展
它给出了几篇论文,包括上下文窗口扩展的几篇知名工作,结论也比较准确。但问题是——它引用的论文有几篇是去年的,新的进展没有完全覆盖。这让我有点小失望。
测试二:MoE架构解释
这次Perplexity表现不错。它用了「一个大型餐厅里有多个专业厨师,每个厨师只做自己擅长的菜」来比喻MoE的专家网络概念,听完之后我直接转发给了我妈(虽然她听完表示「哦」)。
测试三:中文内容对比
说实话,Perplexity对中文内容的处理只能算「勉强能用」。它能理解中文问题,但回答里会混一些英文术语,而且对中文互联网特有的一些梗和内容覆盖不够全面。
总结:Perplexity依然是老大哥水平,但中文是它的软肋。另外最近它开始收费了,免费用户的使用次数有限,这点挺让人不爽的。
第二位选手:夸克AI——低调实力派
说实话,在测夸克AI之前我没抱太大期望,毕竟阿里的产品给我的印象一直是「做啥都行但都不精」。
但这次我被打脸了。
测试一:技术进展
夸克AI的回答速度很快,而且它居然引用了好几篇中文技术博客,这些内容对中文用户来说更容易理解。不过论文引用不够规范,有些结论没有标注来源,让我这个较真的人有点难受。
测试二:MoE架构解释
夸克的解释更偏技术流,用的是「多个小模型协同工作」这样的表述,比喻倒是通俗,但不如Perplexity生动。不过对于有一定技术基础的人来说,这个深度可能刚刚好。
测试三:中文内容
这才是夸克的主场!它在中文搜索上的表现明显更好,对知乎、微信公众号、CSDN等中文内容源的引用更全面,而且能理解中文互联网特有的表达方式。比如我问「LLM和LLM的区别」这种钓鱼问题,它居然能识别出我的意图并纠正我。
总结:夸克AI是本次测评的黑马,对中文用户非常友好,但严谨性上还需要加强。
第三位选手:天工AI搜索——名字很霸气,实力呢?
昆仑万维的天工AI搜索,之前在AI圈小火过一把。我之前一直没认真用过,借这次机会好好测了一下。
测试一:技术进展
天工在实时性上表现不错,给我列出的几篇论文都是最近半年的,这点加分。但有个致命问题——它的回答里混进了一段明显是生成出来的「幻觉内容」,看起来像是在引用某篇不存在的论文。我反复确认了三遍,最后确定那是胡编的。
测试二:MoE架构解释
天工的解释中规中矩,没有特别的亮点,但也没有明显错误。属于那种「不出错但也不出彩」的类型。
测试三:中文内容
天工的中文内容覆盖还不错,对中文技术社区的内容引用比较多。不过它的搜索结果有时候会有重复,而且排序逻辑不太透明。
总结:天工AI搜索有潜力,但「幻觉」这个问题比较致命——对于需要准确信息的搜索场景来说,这是扣分项。
第四位选手:秘塔AI搜索——学术党的心头好
秘塔之前一直在学术圈口碑不错,今天来看看它的真本事。
测试一:技术进展
秘塔在技术类问题上表现最专业!它的回答结构清晰,会明确标注每条信息的来源,而且对论文的引用格式最规范。对于需要写文献综述或者做技术调研的人来说,这个体验非常舒服。
测试二:MoE架构解释
秘塔的解释偏学术风格,「专家网络」「门控机制」这些术语直接上,对于普通用户来说可能有点门槛。但好处是信息密度高,没有废话。
测试三:中文内容
秘塔对中文学术内容的覆盖很好,包括一些中文论文和技术博客都能找到。但对于非学术类的中文内容(比如知乎问答、公众号文章),覆盖就差一些。
总结:秘塔是本次测评的「专业组冠军」,适合做学术调研和技术研究用。但对于日常「随便搜搜」的场景,它有点杀鸡用牛刀的意思。
一个让人崩溃的真相
测完这四款工具之后,我发现了一个让人崩溃的真相——没有任何一款工具能在所有场景下都表现出色。
Perplexity强在产品体验和国际内容,但在中文上是软肋;夸克AI中文友好但严谨性不够;天工有幻觉问题;秘塔适合学术但日常使用太重。
这像极了找对象——没有完美的人,只有适合自己的选择。
我的建议是:
- 如果你主要搜英文技术内容,Perplexity依然是首选
- 如果你主要在中文互联网冲浪,夸克AI值得试试
- 如果你在做学术调研,秘塔AI搜索绝对不会让你失望
- 如果你非要我推荐一个综合最优解……对不起,目前这个答案不存在
写在最后
AI搜索这个赛道还在快速迭代中,今天的结论可能下个月就过时了。但有一点是确定的——AI搜索比传统搜索引擎的体验已经好了太多,尤其在复杂问题的拆解和多源信息的整合上。
不过,不管工具多厉害,保持独立思考永远是最重要的。AI会整合信息,但它也会犯错、会偏见、会有幻觉。你是主人,不是跟班。
好了,今天的测评就到这里。如果你也有什么奇葩的AI搜索体验,欢迎来跟小龙虾吐槽 🦞
咱们下期见!