検索スコアの閾値は絶対値でなく1位2位のギャップ等の相対指標を使う
検索
機械学習
OpenSearch等の検索スコアで判定閾値を決める際、絶対スコア単独で決めるのは危険。クエリを少し変えるだけでスコア分布が変わるため。代わりに top1-top2 のギャップ、top1/top2 の比、top1/topK合計、一致した項目数、email完全一致のような強い離散特徴を主に使う。特に1位と2位のギャップ閾値が効く。各検索clauseに名前(_name)を付けて matched_queries を取得すると、explainより軽量に「どの条件でヒットしたか」を特徴量として取得でき、評価レポートに一致理由を残せる。