【HCIA-AI笔记(微认证2)】1.1 Deepseek基础知识 课程内容概述课程目标聚焦于基于Deepseek大模型通过代码实现并结合实际案例构建智能小助手的核心技术和方法。学习路径从Deepseek基础知识开始深入RAG原理上手实践代码实现最后进行案例分享。Deepseek模型基础基本定位由杭州深度求索人工智能基础有限公司自主研发的大语言模型代表中国在基础大模型领域的自主研发能力专注于自然语言处理及数学推理是强大的认知计算平台。核心能力文本生成支持多种文体风格在中文创作、代码编写、数学解题、多轮对话等方面表现出色。开源属性完全开源代码和模型权重向开发者开放有活跃的开发者社区、丰富的微调案例和持续更新的模型版本。技术架构与解析V3技术架构采用混合专家模型Moe6710亿参数的混合架构将任务分配给不同专家子网络提升计算效率降低能耗。算法优化应用人类反馈强化学习RLHF提升准确性和安全性采用模型蒸馏技术实现模型轻量化创新预训练策略减少训练数据量。发展历程与里程碑2025年突破发布开源旗舰模型21在多个国际基准测试中进入TOP3获业界广泛认可。技术演进从专注NLP到多模态发展从通用模型到垂直领域深耕从单纯模型提供到完整解决方案。异军突起原因技术突破解决传统AI对话痛点有人格化表达、超长记忆、情景感知能力开源模型性价比高有创新训练算法和自研框架。多场景渗透在金融、医疗、教育等领域有颠覆性应用提升各领域效率和准确率。开源生态与资本共振开源策略吸引开发者有众多延伸项目资本市场热烈追捧因商业化路径、成本控制和政策支持受看好。社交媒体引爆有自传播内容裂变和权威背书效应用户口碑病毒式传播增长数据行业震撼。两大核心模型差异规范性V3强规范约束操作路径明确R1弱规范约束操作路径灵活。结果导向V3目标确定性高结果可预期R1目标开放结果多样化。路径灵活性V3线性路径流程标准化R1网状路径多路径可选。响应模式V3被动适配按规则执行R1主动创新有自主决策能力。风险特征V3低风险稳定可控R1高风险不确定性强但可能带来高价值。