AI 工程师 / 架构师面试题集 ——基于 DeepSeek、GLM 等国产大模型与国际一线大厂真实面试场景,严格遵循 STAR 法则这套题目专为高级 AI 工程师、AI 架构师、AGI 应用负责人设计。所有题目均要求候选人结合自身真实项目经历,按照Situation–Task–Action–Result框架回答。面试官可以根据回答深度,随时由浅入深追问,直至触及候选人理论边界与实战极限。一、基础能力层(考察扎实基本功)1. 大模型预训练数据工程情境:假设你正在为某垂直领域(如法律/医疗)从零构建一个百亿参数大模型。任务:请描述你的数据采集、清洗、去重、配比策略,并说明如何评估数据质量。追问:如何处理训练数据中的隐私信息?如何检测和避免 benchmark 数据泄露?期望回答要素:MinHash、LSH 去重,Heuristic 过滤、模型质检(如 fastText 分类器)、PII 脱敏、数据版本管理(DVC)、Shuffle 与混合比例实验。2. Transformer 核心机制手撕情境:你在面试一个 AI 基础设施岗位,需要快速验证候选人对 T