作为近期作为大火的 AI 产品,Deepseek(简称DS) 已经成为现象级的爆款,朋友圈几乎都被刷屏,大家都在探索将 DS 深入千行百业,看如何能发挥出更大价值。作为数据库从业者,我也在思考这个问题,看 DS 能做点啥。圈里已经有几位朋友做了分享,我将从使用者的角度来谈谈对 DS 的使用印象。这里我将DBA的工作简单分为三个方向(数据库架构、开发DBA、运维DBA),每个方向提出若干场景,看看它的表现如何。
1. DeepSeek 是什么及如何用好
在我们开始之前,先看看什么是DeepSeek,这里部分引用来自清华大学的一篇DS入门文章《DeepSeek:从入门到精通》中的内容。
1).DeepSeek 是什么
DeepSeek是一家专注通用人工智能(AGI)的中国科技公司,主攻大模型研发与应用。其主要产品DeepSeek-R1,是其开源的推理模型,擅长处理复杂任务且可免费商用。在仅有极少标注数据的情况下,极大提升模型推理能力在数学、代码、自然语言推理等任务上表现出色。其面向用户或开发者,提供包括智能对话、文本生成、语义理解、计算推理、代码生成补全等应用场景,并支持联网搜索与深度思考模式;同时支持文件上传,能够读取各类文件及图片中的文字内容。
2).如何用好DeepSeek
DS 功能很强大,那么如何用好它呢?网上可以搜到很多教程,这里重点推荐使用优化提示词的方式来解决。提示词,是根据你输入给模型的问题或指令,为了让 DS 更好地理解你的需求并给出满意的发福,可以有一些技巧。这里推荐使用“四步提问法”,来设计好你的提示词。
在这一公式中,通过让 DS 扮演特定的角色,辅助以提供上下文信息;明确你的问题或任务,并引导 DS 需考虑的问题;最终设定回答形式。
2. DeepSeek 在数据库方向应用
1).面向数据库架构
作为数据库架构师,经常会面临架构选型、方案对比、难点攻关等工作。这里选择了两个常见的场景,一是对技术路线对比分析;二是针对数据库选型的一个场景。问题通过一个实际场景为出发点,考察 DS 对场景理解及对技术本身的了解程度。
Q:问题
作为一名数据库架构师,你所负责的ERP系统数据规模越来越大,你考虑将数据进行拆分。在技术路线上可选择分库分表的中间件路线或原生分布式数据库的方向。在综合考虑研发、运维、成本等方面的多种因素,如何做出设计?请根据上述问题,通过表格形式描述选择过程,并给出最终结论?
Q:问题
作为数据库架构师,你需要为企业的CRM系统做数据库改造选型。目前国产数据库有很多,请从通过国测的信创数据库中,选择一款分布式数据库,并给出选择理由。需包含针对其他分布式数据库的对比情况,通过表格形式呈现。
从 DS 的问题回答来看,无论是从广度和深度,DS 较真正的数据库架构师还有较大的距离,其对业务理解能力及对发散架构问题的收敛、归纳能力尚不足以承担这一能力。其输出内容,可作为部分参考来使用。
2).面向数据库开发
开发DBA,是DBA日常面临的最为繁重的工作,主要是来支持研发人员的各类数据库开发诉求,包括但不限于设计、优化、部分开发等等。这里选择两个场景,一是针对执行计划的解读及优化;二是针对数据库内计算逻辑的开发能力。
Q:问题
下面是Oracle数据库的一段执行计划,请帮我描述整个执行过程,并给出优化建议?
复制SQL> explain plan for select * from emp where emp_id=111; SQL> select * from table(dbms_xplan.display); --- | Id | Operation | Name | Rows | Bytes | Cost (%CPU)| Time | --- | 0 | SELECT STATEMENT | | 1 | 28 | 2 (0)| 00:00:01 | | 1 | TABLE ACCESS BY INDEX ROWID| EMP | 1 | 28 | 2 (0)| 00:00:01 | |* 2 | INDEX UNIQUE SCAN | EMP_PK | 1 | | 1 (0)| 00:00:01 |
4.png
Q:问题
要实现对一张Oracle数据库的t1表的state字段更新为1,这张表规模在1亿条,更新时需尽量减少表的锁定时间,考虑使用批量绑定技术来完成。具体表的结构如下:
create table t1( id int primary key,state int);
这部分 DS 的回答还是惊艳到我了,在针对具体问题的分析上,DS 的表现明显优于上面抽象归纳总结能力。通过其输出内容,很多原来需要DBA介入解决的问题,完全可以通过研发人员自己来解决。这些能力完全可以通过SQL IDE集成,方便并加速研发人员更快、更好地进行开发工作。
3).面向数据库运维
运维DBA,主要是为企业数据库平稳运行保驾护航的,这是一个比较考验经验的岗位,很多老DBA正是凭借多年丰富经验,可以快速定位、解决问题,也正是DBA的价值所在。这里选取了两个场景,一是在线DDL变更问题;二是运维脚本的开发工作。
Q:问题
作为一名DBA,需要针对线上生产环境的一张表增加字段,需要注意避免对业务造成影响,应该注意哪些问题,通过表格的形式反馈?
Q:问题
请使用shell脚本,编写一段程序,实现备份MySQL数据库,需包含全量备份、增量备份部分?
2.png
从 DS 的回答来看,其对数据库的理解达到了一定程度但较资深DBA尚有差距。针对问题,其会考虑方方面面的影响,这也是 DS 推理能力的强点;但对于技术本身理解程度尚有不足。在脚本开发中,其表现明显较好,会考虑诸多问题及解决。
3. DeepSeek 对个人、厂商及企业影响
DeepSeek 的出现,确实大大加速 AI 的应用,对行业、企业及个人都会带来深远的影响。下面谈谈我的理解
1).对个人的影响
通过上面的示例,可以看到 DS 确实能够起到一定作用,比较而言,对DBA的影响是“开发DBA>运维DBA>数据库架构师”。针对越明确、越具体的问题,DS 的表现越好;而对于需要理解业务、综合分析的问题,DS 的不足明显。这也对DBA的发展提出了更高的要求,一方面需要扩大知识范围,将知识体系化;另一方面需要加深对所处行业的理解,提高将业务与技术有效集合起来的能力。
2).对厂商的影响
对广大数据库厂商而言,DS 的出现在改变DBA部分工作方式的同时,也会对产品功能及生态构建带来影响。一方面,将AI能力与数据库相结合,提供内置的AI支持能力及AI辅助能力,即AI4DB、DB4AI两个方向;另一方面,针对国产数据库生态构建较晚的现状,也可以充分利用AI能力实现“弯道超车”,通过AI的方式降低数据库使用门槛,扩大生态效应。
3).对企业的影响
对于数据库最终用户的企业来说,可充分评估AI带来的能力,调整IT资源布局。充分利用AI、云等技术重塑底层技术栈。针对人员方面,也可有意识地引导更多向业务方向、数据方向倾斜,更多挖掘出数据的业务价值。