问同一个问题 DeepSeek-r1 / Grok-3 / Gemini 2.0 / ChatGPT 的结果出乎意料...

作者：piperliu

2025-03-03 12:00

最近在写 TS ，希望实现一个类似 .gitignore 的功能，已有代码如下：复制在 JS 层面使用正则匹配，显然不是什么好方案。于是整理代码和报错信息，找了四个免费的模型，问问思路。先说结论：DeepSeek-r1 思考了 298 秒，我一度以为其陷入了死循环，但最后其在第一轮给出的方案，被 Grok-3 、 Gemini 2.0 、 ChatGPT 统统认可是最优方案之一。

最近在写 TS ，希望实现一个类似 .gitignore 的功能，已有代码如下：

复制

/**
 * Check if a file should be ignored based on patterns
 */
export function shouldIgnore(filePath: string, ignorePatterns: string[]): boolean {
  // Simple implementation of glob pattern matching
  return ignorePatterns.some(pattern => {
    if (pattern.endsWith('/**')) {
      const dirPattern = pattern.slice(0, -3);
      return filePath.startsWith(dirPattern);
    } else if (pattern.startsWith('**/*.')) {
      const ext = pattern.slice(3);
      return filePath.endsWith(ext);
    } else if (pattern.includes('*')) {
      const regex = new RegExp('^' + pattern.replace(/\*/g, '.*') + '$');
      return regex.test(path.basename(filePath));
    }
    return filePath.includes(pattern);
  });
}

在 JS 层面使用正则匹配，显然不是什么好方案。单元测试也过不了。

于是整理代码和报错信息，找了四个免费的模型，问问思路。

先说结论：DeepSeek-r1 思考了 298 秒，我一度以为其陷入了死循环，但最后其在第一轮给出的方案，被 Grok-3 、 Gemini 2.0 、 ChatGPT 统统认可是最优方案之一。且后三者都没有在第一轮对话给出这个方案。

下面来看具体过程。

第一轮

第一轮提问

请帮我排查错误原因并修正代码。我希望实现和 .gitignore 一样的效果。如有必要可以引入第三方匹配 lib （比如可以获取更高的性能、更全的功能）

先看最快的三个回答：

Grok-3 Grok-3

Grok-3 推荐了 minimatch 工具。

Gemini 2.0 Flash Thinking

Gemini 2.0 推荐了 micromatch 。

ChatGPT ChatGPT

ChatGPT-推理最原生，推荐了 glob 。

在等了很久后， DeepSeek-r1 终于给出答案。我本来已经对其不抱希望。

DeepSeek-r1

其推荐了 ignore 工具。这大大引起我的兴趣，因为从名字而言，这是和我的 .gitignore 需求最接近的。

到底哪个工具好

于是我又问：minimatch 和 glob 和 ignore 这三个 lib 有什么区别？更推荐哪个？

ChatGPT ChatGPT Gemini Gemini Gemini Gemini Grok Grok Grok Grok

显然，最终 Grok 和 Gemini 明显更加推荐 DeepSeek-r1 一开始就推荐的 ignore 工具。

这里很疑惑：

明明 ignore 最合适，为什么这三家没有想到？（我的首轮提问中明明已经有了 .gitignore 这样的关键词？）
为什么 DeepSeek-r1 思考了这么久，想到了 ignore ？思考时间与答案质量成正比吗？

但是看起来， DeepSeek-r1 的大部分时间在思考如何写算法。而最后，其才临门一脚想到了 ignore 。感觉本次实验取样不足，没有置信度。

对了，关于第二轮的问题“minimatch 和 glob 和 ignore 这三个 lib 有什么区别？更推荐哪个？”，DeepSeek-r1 是怎么回答的呢？

相关标签：

DeepSeek 算法 ignore

相关资讯

简单示例提升DeepSeek-R1美国数学邀请赛AIME分数：以步骤为粒度对齐上下文学习与推理

简单示例提升DeepSeek-R1美国数学邀请赛AIME分数：以步骤为粒度对齐上下文学习与推理

仅需简单提示，满血版DeepSeek-R1美国数学邀请赛AIME分数再提高。上海交大、港中文、上海AI实验室等带来最新成果BoostStep对齐推理和上下文学习粒度，大幅提升上下文学习性能，突破少样本学习上限。图片大语言模型使用多步推理解决复杂数学问题，即先将复杂问题分解为多个步骤并逐步进行推理。

2/20/2025 12:09:22 PM

天才解法震惊人类！谷歌AI破天荒摘得奥数金牌，横扫IMO 42道几何难题

天才解法震惊人类！谷歌AI破天荒摘得奥数金牌，横扫IMO 42道几何难题

时隔6个多月，AlphaGeometry 2直接攻下IMO金牌！刚刚，谷歌DeepMind一篇28页技术报告，公布了AG2最新突破——在2000-2024年IMO几何题上，解题率从54%飙升至84%。论文地址：（50道），AG2横扫了42道。

2/8/2025 1:00:00 PM

新智元

如何优化测试时计算？解决「元强化学习」问题

如何优化测试时计算？解决「元强化学习」问题

优化大模型的测试时计算是提升模型部署效率和节省计算资源的关键一环。前段时间，黄仁勋在 CES 2025 的演讲中把测试时 Scaling 形容为大模型发展的三条曲线之一。如何优化测试时计算成为业界关注的重要课题。

2/10/2025 1:50:00 PM

机器之心

资讯热榜

企业级模型推理部署工具vllm使用指南 - 部署最新deepseek-v3-0324模型上海AI实验室开源InternVL3系列多模态大型语言模型 50组多风格提示词，全面测评Midjourney V7生图效果！全日程揭晓！ICLR 2025论文分享会我们北京见斯坦福2025 AI指数出炉！中美AI对决差距仅剩0.3%，DeepSeek领衔 5分钟直出46页论文！谷歌Deep Research完爆OpenAI，最强Gemini 2.5加持击败DeepSeek-R1！豆包新推理模型仅用前者参数量1/3！还将开源两个基准，瞄准通用推理能力！ ChatGPT重大更新，能翻出所有历史对话，网友被AI聊破防了

标签云

人工智能 OpenAI AIGC AI ChatGPT DeepSeek AI绘画数据机器人谷歌模型大模型 Midjourney 智能用户学习开源 GPT 微软 Meta AI创作图像技术论文 Stable Diffusion 马斯克 Gemini 算法蛋白质生成式芯片代码英伟达神经网络腾讯计算研究 Sora AI for Science 3D AI设计 Anthropic 机器学习 GPU 开发者场景华为预测伟达 Transformer 百度深度学习苹果模态 AI视频驾驶文本 xAI 搜索人形机器人大语言模型 Copilot 神器推荐 LLaMA 字节跳动具身智能 Claude 算力安全应用视频生成科技视觉亚马逊干货合集 2024 AGI 特斯拉 DeepMind 训练

顶部