搜索中的索引

简介

查询的基本步骤

索引结构

倒排索引

结构化数据

各垂类业务帖子的结构化数据包括:属性、标题、正文等。
正文通常会采取截断操作,更优的做法是征文做关键词提取、向量索引等,实现更充分的召回。

在索引层面提升召回:同义词、扩展词、语义向量。

查询

正排索引

向量索引

使用faiss、milvus等数据库。

faiss

faiss IVF

聚类中心的向量ID建到倒排索引。


搜索中的索引
https://summerchengh.github.io/tech-blog/2025/04/10/搜索-召回-倒排索引/
Author
Your Name
Posted on
April 10, 2025
Licensed under