搜索中的索引
简介
查询的基本步骤
索引结构
倒排索引
结构化数据
各垂类业务帖子的结构化数据包括:属性、标题、正文等。
正文通常会采取截断操作,更优的做法是征文做关键词提取、向量索引等,实现更充分的召回。
在索引层面提升召回:同义词、扩展词、语义向量。
查询
正排索引
向量索引
使用faiss、milvus等数据库。
faiss
faiss IVF
聚类中心的向量ID建到倒排索引。
搜索中的索引
https://summerchengh.github.io/tech-blog/2025/04/10/搜索-召回-倒排索引/