:高维空间的度量——距离与内积的工程取舍)
上文我们建立了一个核心认知:AI模型将世间万物映射为高维空间中的坐标点。有了坐标,接下来的问题是:如何判断两个实体“像不像”?在AI的实践中,“像不像”取决于你选择的度量方式。欧氏距离看重绝对位置,余弦相似度只看方向是否一致,点积则同时兼顾两者且计算最快。这三种度量在推荐系统、语义搜索、注意力机制中各有用武之地,且工程上的性能差异巨大。本篇文章从数学定义出发,手写三种度量的实现,在真实数据上对比它们的数值差异与计算耗时,最后给出工程场景下的选型建议。1. 三种核心度量方式的数学定义1.1 欧氏距离二维平面上两点间的直线距离,推广到 n 维空间:deuclidean(A,B)=∑i=1n(Ai−Bi)2deuclidean几何直觉:用尺子直接量。数值范围 [0, +∞),越小越相似。特性:对绝对值敏感。若两个向量整体平移(每个维度同时加一个常数),欧氏距离会改变,尽管它们的“形状”完全一样。1.2 余弦相似度衡量两个向量方向的吻合程度:cos(θ)=A⋅B∥A∥⋅∥B∥=∑i=1nAiBi∑i=1nAi2⋅∑i=1nBi2cos(θ)=∥A∥⋅∥B∥A⋅B=∑i=1nAi