
前言直到2025年初我还觉得AI就是ChatGPT。无非是一个更聪明的搜索引擎。真正开始研究AI应用开发后我发现远远没有那么简单。那段时间我每天都在刷招聘网站。看AI应用开发岗位。看大模型相关岗位。看各种技术交流群里的讨论。然后我发现一个词出现频率特别高RAG。几乎所有AI应用开发岗位都会提到它。最开始我以为RAG一定是什么复杂算法。甚至以为要研究模型训练、深度学习才能搞懂。后来真正做完自己的第一个RAG项目后才发现RAG并没有想象中那么神秘。它本质上是在解决一个非常现实的问题如何让大模型拥有企业自己的知识。而这也是我AI转型过程中完成的第一个完整项目。为什么我选择先做RAG刚开始学习AI的时候。我也很迷茫。因为网上能看到的东西太多了。有人在讲AgentWorkflowMCPFunction Calling有人在讲LangChainSpring AIDifyFastGPT还有人在讲微调蒸馏推理优化看得越多。反而越不知道从哪里开始。后来我做了一件很简单的事去看招聘网站。看看企业到底在招什么人。结果发现大部分AI应用开发岗位都会提到几个关键词RAGAgentAI助手企业知识库而在这些方向里。RAG又是最容易落地也是应用最成熟的场景之一。于是我决定先别研究那些复杂概念。先做出一个真正能运行的RAG项目。我以为最难的是技术真正开始做项目之前。我以为最大的挑战会是大模型向量数据库AI算法后来发现完全不是。最难的其实是信息太多。概念太多。框架太多。每天打开B站。打开公众号。打开技术社区。都能看到各种新名词。有时候看了一天视频。反而越来越迷茫。后来我给自己定了一条原则不要一直学。边学边做。不会就查。查完就写代码。事实证明。这是我整个转型过程中做得最正确的一件事。我的20天学习路线很多朋友问RAG到底学了多久其实严格来说。从开始接触到项目跑通。大概用了20天左右。当然这20天并不是全天投入。而是边学习边开发。大概经历了几个阶段。第一阶段学会调用模型最开始甚至不会调用API。只知道使用ChatGPT网页版。后来开始学习API调用Message结构Prompt设计Token概念写出了自己的第一个AI聊天程序。第二阶段接触AI开发框架聊天程序跑通之后。开始接触Spring AILangChain4j这些AI开发框架。第一次意识到原来大模型并不只是聊天。还可以接入知识库搜索工作流业务系统开始有了AI应用开发的概念。第三阶段接触向量数据库然后开始接触EmbeddingMilvus向量检索这时候才发现企业知识库的核心并不是大模型。而是数据。如何让大模型找到正确的数据。远比选择哪个模型更重要。第四阶段完成第一个RAG项目最终完成文档上传文档解析文本切分向量化相似度检索智能问答整个链路打通。虽然只是第一版。但它已经能够真正回答知识库中的问题。这也是我第一个真正意义上的AI应用项目。做完之后我最大的收获完成项目后。我最大的感受其实不是我学会了RAG。而是AI并没有想象中那么遥不可及。很多人看到AgentRAG大模型会觉得这是一个非常高门槛的领域。但真正开始做之后会发现对于传统开发者来说。很多能力其实是共通的。例如系统设计数据处理接口开发架构设计这些经验并没有失效。只是服务的对象发生了变化。从传统业务系统。变成了AI系统。AI应用开发到底在做什么在做这个项目之前。我一直以为AI开发就是研究模型。做完之后我才发现。企业里的AI应用开发更多是在解决工程问题。例如如何组织知识如何管理数据如何控制成本如何降低幻觉如何让系统稳定运行而这些问题。恰恰是传统开发者最容易发挥价值的地方。这也是为什么我越来越坚定地认为AI应用开发会成为未来几年非常重要的方向之一。写在最后这一篇更多是在记录我的学习过程。而不是讨论具体技术实现。如果说这一篇是在回答“我是如何做出第一个RAG项目的”那么下一篇。我会详细拆解“这个RAG项目到底是怎么实现的”包括为什么采用 MySQL Milvus 双存储设计Chunk应该如何切分向量库如何设计检索策略如何优化Prompt如何组装为什么第一版没有引入Rerank以及整个项目的核心架构设计。另外在开发过程中我也一直在思考另一个问题对于Java开发者来说。面对Spring AI、LangChain4j、Dify、FastGPT等越来越多的AI框架到底应该如何选择Python生态如此强势。Java开发者还有机会吗这些也是我后续准备持续探索的话题。系列目录第1篇30岁、10年Java我决定转向AI应用开发第2篇公司裁员后我花了20天做出了第一个RAG项目本文如果这篇文章对你有帮助欢迎点赞、收藏、关注我会持续更新这个系列。