LLM取代的第一个编程语言竟是SQL?网友吵翻天

SQL 即将被 AI 取代,这种说法你同意吗?一年前,AI 大牛 Andrej Karpathy 曾预言,最热门的新编程语言是英语。一年后,人工智能及机器学习研究商 Abacus.AI 首席执行官 Bindu Reddy 表示:「LLM 用英语取代的第一个编程语言是 SQL,SQL 生成准确率超过 95%,超过了人类 SQL 程序员(准确率为 92%)的平均水平,大多数数据库产品已经提供了一个 chatbox 接口来查询数据」。Bindu Reddy 口中的 Chatbox 是一个开源的桌面端程序,Prompt 的

SQL 即将被 AI 取代,这种说法你同意吗?

一年前,AI 大牛 Andrej Karpathy 曾预言,最热门的新编程语言是英语。

图片

一年后,人工智能及机器学习研究商 Abacus.AI 首席执行官 Bindu Reddy 表示:「LLM 用英语取代的第一个编程语言是 SQL,SQL 生成准确率超过 95%,超过了人类 SQL 程序员(准确率为 92%)的平均水平,大多数数据库产品已经提供了一个 chatbox 接口来查询数据」。

图片

Bindu Reddy 口中的 Chatbox 是一个开源的桌面端程序,Prompt 的调试与管理工具,支持 OpenAI 模型、Claude、Google Gemini 等。

从大模型出现以来,改变的不仅是文字、图片生成领域,还有编程领域。这些 AI 助手给句提示就能自主学习新技术、构建和部署应用程序、以及自主查找和修复代码中的 Bug。一时间,AI 取代程序员的争论不断。我们暂且不管这种说法结论如何,但 AI 已经确确实实的影响到了每一位开发者。

就连 Karpathy 都表示自己基本上无法再回到三年前那种「无辅助」编码的状态了。

英伟达首席执行官黄仁勋在一次关于人工智能未来的演讲中也曾表示,在过去 10 年、15 年的时间里,你会告诉自己的孩子学习计算机科学至关重要。但现在情况几乎相反,人工智能所带来的奇迹可以让每个人都成为程序员。

我们不难看出,黄仁勋的观点与 Reddy 言论不谋而合。

不过,Bindu Reddy 一言既出,不少质疑也冒了出来:「你声称(LLM 生成)SQL 准确率高达 95%,有什么文献或者统计支撑吗?」图片

图片

Bindu 立马给出了回击,她贴出了两个示例片段,片段展示的正是 Bindu 家的一款 AI 工具。如下所示要求 AI 筛选同时符合选中特征的店铺和销售,但不要统计店铺关闭时的数据:

图片

它就自动把代码都写好了,距离完成工作,只差一个复制到数据库的动作。

图片

稍微复杂的任务它也能搞定,只需要说清楚你想要的这组数不包含指定期间的数据,并统计每个港口的平均出发延误时间。不需要进一步提示,AI 助手自己就能分析出解题思路,并写出按条件过滤数据,并把几个表格关联起来计算平均值的 SQL 代码。图片

看完展示,有网友表示,AI 写 SQL 的效果这么好,似乎也合情合理。因为相比 Java、Python 等编程语言,SQL 中有 90% 是英语,它主要用于和数据库交互,在格式上相对固定,需要填空的部分比较少,模型产生「幻觉」的空间有限。

图片

然而,也有在日常工作中经常用大模型生成 SQL 代码的网友得到了另一番体验:「到目前为止,ChatGPT 或 Perplexity 生成的 SQL 查询还没有一个不需要大量重写的。」

图片

他表示,这和用 AI 写代码差不多:「确实可以节省时间,但远不能代替开发人员。」

图片

这是因为大模型经常犯错,并且「不长记性」,还总是在同一个地方翻车。常见错误有:语法问题,混淆了 SQL Server、Postgres 等不同平台的语法;使用了在某些平台无效的函数;缺少别名;在不同平台之间迁移代码时表现得很差。虽然挑了一堆错,这位网友还是认同 AI 写 SQL 的能力的:「尽管如此,它仍然比手写要好。」

不过他已经被 Bindu 拉黑了,这让人很难不怀疑,Bindu 只是在推广自家产品。

图片

这位网友进一步质疑道:「当脱离了基准测试里的简单任务,需要做比较复杂的查询时,不会所有 AI 工具都失效了吧。」

图片

评论区也有很多工作中常用 SQL 的网友与他有同感:

「AI 会写 SQL 与能写高效且性能优良的复杂 SQL 是两码事。」

图片

「写 SQL 查询很容易,但想要优化查询,需要在工作中积累经验和基于真实世界的知识,这是 AI 未能实现的。」

图片

「我每天都用大模型,它们无法进行复杂的查询。任何超过一个 CTE 的内容,我都必须手动拆分。拆起来需要你会编程,否则只会白费几天的时间。」

图片

甚至还引来了 Hacker News 官方下场发表评论:「SQL 的核心不在于语言本身,而在于它能够查询和操作复杂的数据结构。」在他看来,提出正确的问题和理解数据结构可能比语法本身更为关键。

图片

除了从亲身体验的角度对 Bindu 提出质疑之外,还有一些专业人员摆出了现成的数据。在基础测试集 Text-To-SQL on Spider 中,目前的 Sota 模型的准确度是 87.6%。

图片

                          图源:https://paperswithcode.com/sota/text-to-sql-on-spider

在另一个注重策略针对大型数据库的基准测试集中,最好的方法准确率也仅为 72.28%,远不及 95%。

图片

                            图源:https://bird-bench.github.io/

目前,也有不少科技公司推出了用大模型提升数据处理和查询分析的产品,比如火山引擎数智平台 VeDI—AI 助手、 Kyligence Copilot AI、ThoughtSpot 等。不过,这些企业解决方案面向的是专业用户和团队,而像 Abacus.AI 这样的个人 SQL 助手可能更侧重于帮助「小白」快速上手。

相关资讯

单GPU训练一天,Transformer在100位数字加法上就达能到99%准确率

乘法和排序也有效。自 2017 年被提出以来,Transformer 已成为 AI 大模型的主流架构,一直稳站 C 位。但所有研究者都不得不承认的是,Transformer 在算数任务中表现非常糟糕,尤其是加法,这一缺陷在很大程度上源于 Transformer 无法跟踪大范围数字中每个数字的确切位置。为了解决这个问题,来自马里兰大学、CMU 等机构的研究者向这一问题发起了挑战,他们通过在每个数字中添加一个嵌入来解决这个问题,该嵌入编码数字相对于开头的位置。该研究发现,只用一天时间在单个 GPU 上训练 20 位数字

揭秘Hologres如何支持超高QPS在线服务(点查)场景

Hologres(中文名交互式分析)是阿里云自研的一站式实时数仓,这个云原生系统融合了实时服务和分析大数据的场景,全面兼容PostgreSQL协议并与大数据生态无缝打通,能用同一套数据架构同时支持实时写入实时查询以及实时离线联邦分析。它的出现简化了业务的架构,为业务提供实时决策的能力,让大数据发挥出更大的商业价值。本期将为大家揭秘Hologres如何支持超高QPS点查。传统的 OLAP 系统在业务中往往扮演着比较静态的角色,以通过分析海量的数据得到业务的洞察(比如说预计算好的视图、模型等),从这些海量数据分析到的结

Spark 大数据处理最佳实践

开源大数据社区 & 阿里云 EMR 系列直播 第十一期主题:Spark 大数据处理最佳实践讲师:简锋,阿里云 EMR 数据开发平台 负责人内容框架:大数据概览如何摆脱技术小白Spark SQL 学习框架EMR Studio 上的大数据最佳实践直播回放:扫描文章底部二维码加入钉群观看回放,或进入链接、大数据概览大数据处理 ETL (Data  → Data)大数据分析 BI   (Data  →  Dashboard)机器学习    AI   (Data  →  Model)二、如何摆脱技术小白什么是技术小白?只懂表