汎用 zero-shot detector をそのまま特定用途のリアルタイム検出に使うのは筋が悪い
設計判断
機械学習
物体検出
学習データなしで試せるのが魅力で zero-shot detector (OWLv2 など) を選びがちだが、これは特定タスク専用に調整されたモデルではないため、精度も速度も不安定になりやすい。特にモバイル Web ではモデル初回ロードと推論が重すぎて体感が「止まっている」挙動になりやすい。「既製モデルをそのまま試す」PoC としては意味があるが、要件に合わない検出エンジンを本線にすると失敗する。選んだ detector と適用方法が要件に合っているかを先に検証すべき。