学习 AI 不再迷失方向。
AI 大时代,每天都有层出不穷的新技术、新方法、新模型、新应用…… 想要去学却又似乎无从下手?
这里正好有一个你需要的资源:开发者路线图资源库(developer-roadmap)!而这个资源库中有的还不仅仅是路线图,还有那些路线图中每一步中所需的资源,包括论文/文章、视频、教程、代码、示例等等。真的是不仅要领你进门,更要把你教会。
资源链接:https://github.com/kamranahmedse/developer-roadmap
官网:https://roadmap.sh
自 2017 年建议以来,这个资源库已经收获了超过 29.7 万 star(是 GitHub 上 star 数排名第七的项目),fork 数也达到了 3.91 万。其中包含前端、后端、AI、移动应用开发、网络安全、技术写作、交互设计等诸多主题的等超过 50 个路线图,并且还涉及不同的编程语言。
此外,其中还有许多社区创建的路线图,并且也支持用户创建自己的路线图。该资源库另一个有趣的探索是让生成式 AI 来生成路线图,这类路线图已经超过 12 万个,但整体并不很受欢迎。
AI 生成的大量路线图
几年来,该资源库帮助了无数开发者规划、开始和完成了自己的学习生涯。也因此,该资源库多年以来收获了无数赞誉,也经常出现在各种「开发者应该关注的 GitHub 库」榜单上。
当然,这个资源库也该入选 AI 开发者应该关注的榜单,其中提供的相关路线图包括 AI 工程师路线图、AI 与数据科学家路线图、提示词工程路线图、MLOps 路线图等,当然还有更加基础一些的计算机科学路线图和 Python 路线图。
AI 工程师路线图:https://roadmap.sh/ai-engineer
AI 与数据科学家路线图:https://roadmap.sh/ai-data-scientist
提示词工程路线图:https://roadmap.sh/prompt-engineering
MLOps 路线图:https://roadmap.sh/mlops
数据分析师路线图:https://roadmap.sh/data-analyst
除此之外,社区也创建了一些与 AI 相关的路线图,包括 LLM 工程师路线图、生成式 AI(GenAI)路线图、商业智能(BI)路线图、机器学习路线图等。详见其官网。
社区创建的生成式 AI 路线图概览
这个资源库的建立者和维护者 Kamran Ahmed 是英国的一位开发者,他在 2017 年开始建立这个库,并表示这是「一个为开发者提供学习路径和其它视觉内容以帮助他们事业成长的平台。」2022 年,他开始全职运营这个资源库(所以其官网上也有一些付费资源)。除了这个资源库,他还开发了多个软件工具,包括一些插件和实用工具。
下面我们就以 AI 工程师路线图为例,简单展示一下其用法,其它路线图就留给用户自行探索了。
按图索骥成为 AI 工程师
首先可以看到,这个路线图非常长。这也说明了一点,要成为一位合格的 AI 工程师,决非朝夕之功。
一开始,你需要对前端、后端以及全栈开发的知识有所了解。
之后,你可以简单了解 AI 工程师的概念以及工作内容。同时层层递进学习各种基础概念的含义,比如 AI、AGI、LLM、推理、训练、嵌入、向量数据库、AI 智能体、RAG、提示词工程等等。用户可以在点击该路线图上相应的概念直达一些相应的资源,比如下图展示了 AI 智能体概念对应的资源。当然,用户也可以只使用该路线图,然后自行寻找相关资源。
接下来,该路线图进入了了解预训练模型的阶段。在这里,你能了解什么是预训练模型及其好处和劣势。同时,你也可以开始尝试使用 OpenAI、Anthropic 和谷歌等提供商提供的现成 AI 服务。
当然,相信我们的读者已经经历过了上面大部分阶段。
接下来就可以开始尝试更高阶一点的 AI 应用了,包括通过 API 使用 LLM 以及从 Hugging Face 等模型托管网站下载模型自己部署。在这个过程中,你会接触到 AI 服务提供商的 token 计数和定价策略、提示词工程基础以及模型微调等概念。
同时,你也可以开始了解 AI 安全和道德伦理方面的议题,包括 AI 模型越狱攻击、提示词注入攻击、偏见与公平性等等。更进一步,你还可以学习最佳的安全实践,包括 OpenAI Moderation API、对抗测试、限制输入和输出的方法等。
当然,要成为专业的 AI 工程师,可不能止步于使用模型的程度。现在,你已经做好准备开始学习真正的技术了。
从了解嵌入开始,你将学习语义搜索、数据分类、推荐系统等嵌入用例,还将了解开放的 AI 嵌入 API 以及开源的嵌入工具。
更进一步,你将学习向量数据库以及 RAG 的概念和实现方法。这个过程中你将学习 Chroma、Pinecone、Supabase、MongoDB Atlas 等常用向量数据库以及 Langchain、Llama Index 等实现 RAG 的方法。
之后,你或许就可以尝试一下构建 AI 智能体了。这其中涉及到实现方法,如何使用函数和工具以及 OpenAI Assistant API。
再然后,该路线图将带你进入多模态 AI 阶段,让你学会如何让 AI 具备理解图像、声音、视频等非文本数据的能力,以及如何实现文生图、语音生成、图像和视频生成等应用。另外,你也会了解到实现这些应用的好用工具和 API。
该路线图的最后,你将学习如何使用和构建 AI 开发工具,比如 AI 代码编辑器、代码补全工具。在这里你将学会使用一些好用的服务和工具,包括 Cursor、GitHub Copilot 和 Replit 等。
总体而言,这个路线图可以为你从头开始的 AI 工程师之旅提供指引,让你不至于在探索和学习过程中迷茫乃至失去方向。而如果你已经是一位颇有经验的 AI 工程师了,也可以使用这份路线图来梳理自己的知识体系。
当然,诚如前文所言,除了 AI 工程师路线图,该资源库中还包含 AI 与数据科学家、数据分析师、提示词工程师等多个与 AI 相关的路线图。不仅如此,这个开发者路线图资源库中还包含大量与 AI 并不直接相关的路线图,感兴趣的读者请自行探索吧。