博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
isearch5 index,attribute和summary。
阅读量:4701 次
发布时间:2019-06-09

本文共 784 字,大约阅读时间需要 2 分钟。

索引

   isearch5 支持的索引分为:index,attribute和summary。

   Index指的是倒排索引,它存储了存储了从term到DocID的映射关系,形如:

term-->(Doc1,Doc2,...,DocN);倒排索引主要用在检索中,它能快速的定位用户查询到关键字对应的document。比如同事间经常说的”xx“进召回往往指的就是这个”xx“信息被建立了倒排索引。

   Attribute指的是正排索引,它存储从DocID到field的映射关系,形如:

DocID-->(term1,term2,...termn)。正排索引分单值和多值两种,单值attribute由于长度是固定的(不包括string类型),因此查找效率高,而且可以支持更新。多值attribute表示某个field中有多个数据(数量不固定),由于长度不确定,因此查找效率相较与单值更慢。正排索引主要是在查询到了某个Document后,根据docid值能快速获取到其attribute用来统计、排序、过滤中。比如我们经常听到的”xx“计算相关性,那么”xx“这个信息就往往建立了正排索引,需要注意的是ranker中使用的字段必须全部进正排,否则ranker取不到这些字段。

     summary的存储形式与attribute类似,但是summary是将一个Document对应的多个field存储在一起,并且建立映射,所以能很快从docid定位到对应的summary内容。summary主要是用于结果的展示。

     并不是所有的字段都需要建立索引,特别对于商品搜索,一些字段仅仅用于展示,而不用检索或者计算相关性,那么这些字段就存在Doc中,一起返回给前端供应用展示,比如商品的detail链接。

转载于:https://www.cnblogs.com/diegodu/p/8270056.html

你可能感兴趣的文章
Jquery radio选中
查看>>
memcached 细究(三)
查看>>
RSA System.Security.Cryptography.CryptographicException
查看>>
webservice整合spring cxf
查看>>
[解题报告] 100 - The 3n + 1 problem
查看>>
Entity Framework 学习高级篇1—改善EF代码的方法(上)
查看>>
Mybatis逆向工程配置文件详细介绍(转)
查看>>
String类的深入学习与理解
查看>>
不把DB放进容器的理由
查看>>
OnePage收集
查看>>
Java parseInt()方法
查看>>
yahoo的30条优化规则
查看>>
[CCF2015.09]题解
查看>>
[NYIST15]括号匹配(二)(区间dp)
查看>>
json_value.cpp : fatal error C1083: 无法打开编译器生成的文件:No such file or directory
查看>>
洛谷 P1101 单词方阵
查看>>
Swift DispatchQueue
查看>>
C#和JAVA 访问修饰符
查看>>
小甲鱼OD学习第1讲
查看>>
HDU-1085 Holding Bin-Laden Captive-母函数
查看>>