Elasticsearch“不得”使用 OR 运算符

Question

Amjed Omar

Asked: 2024-12-29 10:07:28 +0800 CST2024-12-29 10:07:28 +0800 CST 2024-12-29 10:07:28 +0800 CST

OpenSearch 阻止 script_score 多次运行

772

script_score在 OpenSearch 中，我使用 Painless 脚本语言实现了自定义。当我只使用query.bool.should它时，每个文档都会调用一次，并且返回的结果_score是正确的

但是，当我在查询中结合使用query.bool.should和时，每个文档会调用两次或三次，而最终得分是所有调用的总和。这会导致得分高于预期。query.bool.mustscript_score

should为什么会发生这种情况？当同时使用和must时，如何确保每个文档仅调用一次query？或者至少阻止 OpenSearch 对每个文档的所有调用结果求和，并仅返回其中一个调用的结果？

例如，参见下面的查询（我在这里简化了它，以便示例易于理解），您会看到来源script_source是，return Integer.parseInt(doc['_id'].value);但是因为我使用了两者should，并且在我的查询中，文档的must计算是（即）而不是_score6148184446148 * 36148

{
  "from": 0,
  "size": 10,
  "stored_fields": "_none_",
  "docvalue_fields": [
    "_id",
    "_score"
  ],
  "sort": [
    {
      "_score": {
        "order": "asc"
      }
    }
  ],
  "query": {
    "function_score": {
      "query": {
        "bool": {
          "must": [
            {
              "term": { "category_ids": "2" }
            },
            {
              "terms": { "visibility": ["3", "4"] }
            }
          ],
          "should": [
            {
              "ids": {
                "values": [
                  "6148"
                ]
              }
            }
          ],
          "minimum_should_match": 1
        }
      },
      "script_score": {
        "script": {
          "lang": "painless",
          "source": "return Integer.parseInt(doc['_id'].value);"
        }
      }
    }
  }
}

1 个回答

Voted

Amjed Omar · Answer 1 · 2024-12-30T04:36:23+08:00

回答我自己的问题是为了帮助将来可能遇到同样问题的人。虽然我仍然不明白为什么在某些情况下会多次调用script_score，但我能够修复得分。

为了防止得分被相加或相乘，我添加了boost_mode: replace如下参数：

{
  "query": {
    "function_score": {
      "query": { ... },
      "boost_mode": "replace", // Adding this fixed the issue for me
    }
}

我通过查看 OpenSearch 文档https://opensearch.org/docs/latest/query-dsl/compound/function-score找到了此解决方案

您可以指定如何将使用所有函数[1]计算的分数与boost_mode参数中的查询分数相结合，该参数采用以下值之一：

multiply：（默认）将查询分数乘以函数分数。

replace：忽略查询分数并使用函数分数。

sum：添加查询分数与函数分数。

avg：对查询分数和函数分数取平均值。

max：取查询分数和函数分数中较大的一个。

min：取查询分数与函数分数中较小者。

[1] 请注意，boost_mode在两种情况下都有效：无论您有一个函数（如我的情况）还是多个函数（在有多个函数的情况下，您可能也希望score_mode从我上面提供其链接的同一文档页面中查看参数）

OpenSearch 阻止 script_score 多次运行

Vue 3：创建时出错“预期标识符但发现‘导入’”[重复]

为什么这个简单而小的 Java 代码在所有 Graal JVM 上的运行速度都快 30 倍，但在任何 Oracle JVM 上却不行？

具有指定基础类型但没有枚举器的“枚举类”的用途是什么？

如何修复未手动导入的模块的 MODULE_NOT_FOUND 错误？

`(表达式，左值) = 右值` 在 C 或 C++ 中是有效的赋值吗？为什么有些编译器会接受/拒绝它？

何时应使用 std::inplace_vector 而不是 std::vector？

在 C++ 中，一个不执行任何操作的空程序需要 204KB 的堆，但在 C 中则不需要

PowerBI 目前与 BigQuery 不兼容：Simba 驱动程序与 Windows 更新有关

AdMob：MobileAds.initialize() - 对于某些设备，“java.lang.Integer 无法转换为 java.lang.String”

我正在尝试仅使用海龟随机和数学模块来制作吃豆人游戏

OpenSearch 阻止 script_score 多次运行

1 个回答

相关问题