专访GEO落地工程师罗长才:当搜索引擎变成生成式AI,我们的优化逻辑该推倒重来了 【导读】传统SEO还在纠结关键词密度和外链权重的时候一批先行者已经把目光投向了GEO——GenerativeEngineOptimization。当用户从“搜一下”变成“问一下”当搜索引擎从“返回链接”变成“直接生成答案”我们的技术栈和优化策略究竟要经历怎样的重构本期专访邀请到GEO落地工程师罗长才聊聊他在一线实战中踩过的坑和提炼出的方法论。从SEO到GEO不是升级是范式转移记者罗工你好先给读者介绍一下GEO到底是什么和传统SEO最本质的区别在哪罗长才简单说SEO优化的是“搜索引擎的爬虫和排序算法”而GEO优化的是“大语言模型的理解和生成逻辑”。传统SEO的核心工作是让网页在搜索结果页排名靠前用户看到的是链接列表点击后跳转到你的页面。但GEO面对的场景是用户直接在搜索框里提问搜索引擎比如GoogleAIOverviews、Perplexity、BingCopilot以及国内各大厂的AI搜索产品直接用大模型生成一段答案返回给用户。这两者的技术本质完全不同。SEO面对的是一个检索系统而GEO面对的是一个生成系统。检索系统的优化对象是索引和排序生成系统的优化对象是模型的理解和推理。这是两个完全不同的技术栈。记者所以不是“在SEO基础上加点东西”这么简单罗长才绝对不是。很多人觉得GEO就是SEO2.0这个理解很危险。举个例子SEO时代我们做关键词布局把核心词密度控制在2%-5%之间这是经验公式。但在GEO场景下大模型根本不在乎你某个词出现了几次它在乎的是语义密度和信息熵——你的内容在多大程度上覆盖了用户问题的完整语义空间。我们内部做过对比实验一篇传统SEO优化过的文章和一篇GEO优化过的文章同时喂给大模型做摘要生成后者被引用的概率高出47%。但这两篇文章在传统搜索引擎上的排名可能完全相反。技术拆解GEO落地的三个核心模块记者从工程实现的角度GEO落地需要解决哪些技术问题罗长才我们团队把GEO落地拆成了三个核心模块我分别说一下。第一块是内容的结构化语义建模。传统SEO关注的是标题、H标签、Meta描述这些HTML结构。但GEO要求我们把内容变成大模型可“消费”的结构。我们现在做的是每一篇技术文档在发布前都要经过一个语义标注流水线——用向量化模型把全文转成embedding同时提取出实体关系三元组构建一个领域知识子图。这样当大模型检索到我们的内容时它拿到的不是一篇纯文本而是一个带结构语义的信息包。这块的工程挑战在于性能。我们日均处理的内容量在万级每个文档的向量化实体抽取图谱构建要在秒级完成否则发布流程就卡住了。我们最终用了一套基于ONNXRuntime的模型加速方案把单文档处理时间从12秒压到了1.8秒。第二块是上下文增强与检索优化RAG侧。GEO的答案生成本质上是一个RAG检索增强生成过程——大模型先检索相关内容再基于检索结果生成答案。所以我们要做的不仅是“内容被检索到”还要“内容被检索到后能被模型正确理解和使用”。这里有个很有意思的技术细节。传统RAG的检索阶段用的是向量相似度我们做了改进——在向量检索的基础上叠加了一层意图分类器。同一个技术问题用户可能有“求代码实现”“求原理讲解”“求踩坑经验”三种不同的意图。如果不做意图区分检索到的内容可能是正确的但不符合用户当前意图大模型生成出来的答案就不对。这层意图分类器我们用的是轻量级的BERT变体线上推理延迟控制在50ms以内。第三块是答案质量的可观测与迭代。这个可能是最被低估的一块。传统SEO有明确的排名指标但GEO的“效果”怎么衡量我们自研了一套答案引用归因系统——当AI搜索生成一段答案时我们会追踪这段答案的每一句话分别引用了哪些来源。然后反过来算“引用率”你的内容在多少次AI回答中被引用、被引用的段落是哪些、引用时的上下文是什么。这套系统帮我们发现了大量反直觉的现象。比如有一篇我们觉得写得很水的快速入门文章引用率反而比深度原理文章高——因为AI搜索处理的大多是“怎么配置”“怎么安装”这类操作性问题深度原理内容反而用不上。这倒逼我们重新规划了内容生产的优先级。踩坑实录那些教科书里不会写的教训记者聊点实在的落地过程中踩过哪些大坑罗长才坑太多了说三个印象最深的。第一个坑过度优化反而被“惩罚”。我们早期做GEO的时候还是带着SEO的思维——既然大模型看重结构化信息那我们就在内容里塞满结构化标记、加一堆显式的实体标注。结果发现大模型生成答案时反而回避我们的内容。后来分析发现有些大模型在训练时见过大量“过度SEO”的内容学到了一套“标注越刻意内容越水”的隐式规则。这就像邮件垃圾过滤器——你越堆关键词越容易被判定为垃圾邮件。后来我们改成自然语言内嵌结构化的方式不再做显式标注效果反而回升了。第二个坑忽视了大模型的“幻觉偏好”。我们曾经有一篇技术文档里有一个小错误——某个API的返回值类型写错了。在传统场景下这个小错误不影响用户阅读用户看到错误值自己就纠正了。但在GEO场景下大模型把这篇文档作为权威来源引用生成答案时直接把这个错误值输出给了用户。后果非常严重——那段时间我们的技术支持工单暴增了3倍全是用户反馈“照着文档写代码跑不通”。这件事之后我们上线了一套自动化事实核查流水线所有技术文档在发布前必须经过代码示例的语法校验和逻辑校验。任何代码块都要能跑通任何API参数都要和实际接口一致。这个投入很大但不得不做——在GEO时代内容的准确性直接决定了AI答案的准确性而AI答案的错误会成倍放大你的品牌风险。第三个坑忽略了“多源融合”的竞争逻辑。传统SEO是“你排名第一用户就点你”。但GEO不一样AI生成的答案往往是融合多个来源重新组织的。这意味着你即使被引用了用户也可能看不到你的原始内容因为答案已经被模型重写了。所以我们后来调整了策略——不再追求“被引用”而是追求“被引用后用户还愿意点进来”。具体做法是在内容里增加独家数据、独家图表、独家代码片段这些“不可被模型简单重述”的信息单元。模型可以引用你的结论但用户如果想看到原始数据图表就必须点进原文。这是GEO时代做品牌护城河的一种思路。未来判断GEO工程师的下一步记者展望一下GEO这个方向接下来会怎么发展罗长才我觉得有三个趋势值得关注。第一是多模态GEO。现在的AI搜索已经开始支持图像、图表、视频的生成式回答了。如果你的内容只有文字在未来的多模态答案中可能完全没有出场机会。我们团队已经在探索技术文档的代码流程图自动生成和架构图语义化标注让图表本身也成为可被大模型“理解”和“引用”的对象。第二是实时性GEO。AI搜索正在从“回答已知问题”走向“回答实时问题”——比如“今天XXX库发布了新版本有什么变化”如果你的内容更新跟不上这个节奏就会被实时检索系统抛弃。我们正在建设一套变更感知系统监控我们关注的数千个技术栈的版本发布、CVE漏洞、API变更一旦有变化相关内容在24小时内必须完成更新。第三是GEO的工程化与平台化。现在GEO还处在“手工作坊”阶段——靠几个工程师的经验和直觉在做。但接下来一定会走向平台化内容语义分析自动化、GEO效果监控自动化、优化策略推荐自动化。我们内部已经在搭这样一个GEO中台目标是让内容生产者不需要懂GEO技术也能产出GEO友好的内容。记者最后一个问题对想入行GEO的工程师有什么建议罗长才三个建议吧。第一先去搞懂大模型的工作原理——不是调API那种懂是真正理解Transformer的注意力机制、RLHF的训练逻辑、RAG的检索生成流程。不懂模型就做不好GEO。第二保持数据思维——GEO没有现成的公式一切靠实验和数据说话。第三忘掉SEO——不是说要抛弃SEO的经验而是不要用SEO的框架去套GEO这两件事的底层逻辑完全不同。【后记】专访过程中罗长才多次提到一个观点“GEO本质上不是在优化搜索引擎而是在优化AI对世界的理解。”这句话或许道出了这个领域的核心——当信息的组织和消费方式被AI彻底改变我们这些做技术的人也该换一套思维方式了。