如何通过Edgengram匹配百分比对搜索结果进行排名

2024-05-08 • 问答

使用edge-ngram索引时，通常还希望按匹配百分比对结果进行排名。例如：输入是应用苹果， aa

如果查询为aa，则排名应为 aa> appl>苹果

但是默认排名使用的是tfidf，因此排名是相同的。

PUT my_index
{
  "settings": {
    "analysis": {
      "analyzer": {
        "autocomplete": {
          "tokenizer": "autocomplete","filter": [
            "lowercase"
          ]
        },"autocomplete_search": {
          "tokenizer": "lowercase"
        }
      },"tokenizer": {
        "autocomplete": {
          "type": "edge_ngram","min_gram": 2,"max_gram": 10,"token_chars": [
            "letter"
          ]
        }
      }
    }
  },"mappings": {
    "properties": {
      "title": {
        "type": "text","analyzer": "autocomplete","search_analyzer": "autocomplete_search"
      }
    }
  }
}

PUT my_index/_doc/1
{
  "title": "apple" 
}

PUT my_index/_doc/2
{
  "title": "appl" 
}

GET my_index/_search
{
  "query": {
    "match": {
      "title": {
        "query": "ap","operator": "and"
      }
    }
  }
}

结果是苹果和苹果，他们的分数都一样

cen12 回答：如何通过Edgengram匹配百分比对搜索结果进行排名

如果您使用与search_analyzer相同的分析器（自动完成），而不是“ autocomplete_search”，则应获得预期的分数。

编辑：要限制匹配项，可以使用带有2个子句的布尔查询。一个必须带，但不指定任何分析器（将使用search_analyzer）。应该用“ analyzer”：“ autocomplete”阻止另一个，以增加与更多令牌匹配的查询的分数。

elasticsearch

本文链接：https://www.f2er.com/3161866.html

如何通过Edgengram匹配百分比对搜索结果进行排名

cen12 回答：如何通过Edgengram匹配百分比对搜索结果进行排名

大家都在问