智能提示(三)facet 聚合属性(类别、标签)提示

前端之家收集整理的这篇文章主要介绍了智能提示(三)facet 聚合属性(类别、标签)提示前端之家小编觉得挺不错的,现在分享给大家,也给大家做个参考。

大概需求,solr实现以下类似京东的智能提示功能的方案,带有标签值、或者分类和短语的:

京东:


淘宝:



简单分析上图,在输入关键字部分商品含有特殊属性分类标签的时候 就给输入关键字提示 的下一个层级展示该标签

用过solr的朋友,看到这个 全球购 第一时间会想到facet。

大概思路:

存储的时候,把相关的标签值、属性值、分类值和商品名称等信息(简称为商品画像) 存储到一个多值域xxx_field中。 理想切词状态下,切出 类似 以上 词(类似:笔记本电

脑超薄本,衣服 夏天 热卖,等)。

查询的时候,采用solr的faect前缀匹配和pivot机制查询。facet.prefix、facet.pivot,piovt 的用法个人理解就是就是按照多个维度进行分组查询,把多次faect查询集合成一次。


demo: 参考:http://mall.crecgec.com/,实现了聚合物品所在分类



参考词干分词器:

KeywordTokenizerFactory:这个分词器不进行任何分词!整个字符流变为单个词元。String域类型也有类似的效果,但是它不能配置文本分析的其它处理组件,比如大小写转

换。任何用于排序和大部分Faceting功能的索引域,这个索引域只有能一个原始域值中的一个词元。

  1. <!-- 词干分词器 -->
  2. <fieldType name="suggest_text" class="solr.TextField" positionIncrementGap="100" >
  3. <analyzer>
  4. <tokenizer class="solr.WhitespaceTokenizerFactory"/>
  5. <filter class="solr.KeywordRepeatFilterFactory"/>
  6. <filter class="solr.PorterStemFilterFactory"/>
  7. <filter class="solr.LowerCaseFilterFactory" />
  8. <filter class="solr.RemoveDuplicatesTokenFilterFactory"/>
  9. </analyzer>
  10. </fieldType>
  11. <!-- 搜索建议分词 -->
  12. <fieldType name="Word_text" class="solr.TextField" positionIncrementGap="100" autoGeneratePhraseQueries="true">
  13. <analyzer type="index">
  14. <!-- 不管什么内容,整句当成一个关键字 -->
  15. <tokenizer class="solr.KeywordTokenizerFactory" />
  16. <!-- 同义词 -->
  17. <filter class="solr.SynonymFilterFactory" synonyms="synonyms.txt" ignoreCase="true" expand="true" />
  18. <!-- 停止词 -->
  19. <filter class="solr.StopFilterFactory" ignoreCase="true" words="stopword.dic" enablePositionIncrements="true" />
  20. <!-- 小写过滤 -->
  21. <filter class="solr.LowerCaseFilterFactory" />
  22. <!-- 关键字 -->
  23. <filter class="solr.KeywordMarkerFilterFactory" protected="protwords.txt" />
  24. <!-- 拆字 -->
  25. <filter class="solr.WordDelimiterFilterFactory"
  26. generateWordParts="1" generateNumberParts="1" catenateWords="1"
  27. catenateNumbers="1" catenateAll="0" />
  28. <!-- 词干抽取算法 -->
  29. <filter class="solr.PorterStemFilterFactory"/>
  30. </analyzer>
  31. <analyzer type="query">
  32. <tokenizer class="solr.KeywordTokenizerFactory" />
  33. <filter class="solr.StopFilterFactory" ignoreCase="true" words="stopword.dic" enablePositionIncrements="true" />
  34. <filter class="solr.LowerCaseFilterFactory" />
  35. <filter class="solr.KeywordMarkerFilterFactory" protected="protwords.txt" />
  36. <filter class="solr.WordDelimiterFilterFactory"
  37. generateWordParts="1" generateNumberParts="1" catenateWords="0"
  38. catenateNumbers="0" catenateAll="0" />
  39. <!-- 词干抽取算法 -->
  40. <filter class="solr.PorterStemFilterFactory"/>
  41. <!-- 去除重复词 -->
  42. <filter class="solr.RemoveDuplicatesTokenFilterFactory" />
  43. </analyzer>
  44. </fieldType>

简单solrj代码
  1. //设置查询参数
  2. SolrQuery query=new SolrQuery();
  3. query.setParam("q","*:*");
  4. query.setStart(0);
  5. query.setRows(0);
  6. query.setParam("facet.pivot","suggest,cate_id_3");
  7. query.setParam("f.suggest.facet.prefix",map.get("word").toString());
  8. query.setRequestHandler("/suggestFacet");
  9. QueryResponse rsp= server.query(query);
  10. NamedList<List<PivotField>> namedList=rsp.getFacetPivot();

猜你在找的设计模式相关文章