Holo3 Benchmark — 20260423_101524_qwen36-35b-v3_replay

patient=00000001 screens=6 time=2026-04-23T10:16:36.186563 • model=Qwen3.6-35B-A3B-GGUF:Q8_0 (MoE 3B active)
Grounding Hit: 0.09Mean Pixel Dist: 388OCR Recall: 1.00⏱ Avg grounding: 1.93s⏱ Avg OCR: 3.21s⏱ Total: 72s (35 calls)

login (DOM: 2 elements)

login
#TargetGT bboxPredResultDistLatency
#1ログイン[961, 606, 1041, 629](1000,615)HIT2.2px1.97s
#2キャンセル[1049, 606, 1132, 629](1094,616)HIT4.1px1.93s
Show grounding prompts & raw responses (2 items)
#1 ログイン [HIT] — prompt & raw response
Prompt
画像サイズは 1920 × 1080 ピクセルです。
画面のスクリーンショットを見てください。
「ログイン」の中心座標を返してください。
座標は 0〜1000 の正規化値でも、絶対ピクセル値でも構いません。
回答はこのJSON形式のみ: {"x": 整数, "y": 整数}
Raw response
{"x": 521, "y": 569}
#2 キャンセル [HIT] — prompt & raw response
Prompt
画像サイズは 1920 × 1080 ピクセルです。
画面のスクリーンショットを見てください。
「キャンセル」の中心座標を返してください。
座標は 0〜1000 の正規化値でも、絶対ピクセル値でも構いません。
回答はこのJSON形式のみ: {"x": 整数, "y": 整数}
Raw response
{"x": 570, "y": 570}

patient_list (DOM: 11 elements)

patient_list
#TargetGT bboxPredResultDistLatency
#1検索条件を入力...[130, 100, 410, 123](253,148)MISS40.7px1.94s
#2検索(S)[418, 100, 485, 123](451,148)MISS37.0px1.92s
#3📋 受付一覧[4, 45, 73, 72](54,72)HIT21.3px1.91s
#4🏥 受付管理[83, 45, 153, 72](54,70)MISS65.1px1.92s
#5🛏 入院管理[163, 45, 232, 72](192,81)MISS23.5px1.93s
#6📅 予約管理[242, 45, 312, 72](192,78)MISS87.3px1.92s
Show grounding prompts & raw responses (6 items)
#1 検索条件を入力... [MISS] — prompt & raw response
Prompt
画像サイズは 1920 × 1080 ピクセルです。
画面のスクリーンショットを見てください。
「検索条件を入力...」の中心座標を返してください。
座標は 0〜1000 の正規化値でも、絶対ピクセル値でも構いません。
回答はこのJSON形式のみ: {"x": 整数, "y": 整数}
Raw response
{"x": 132, "y": 137}
#2 検索(S) [MISS] — prompt & raw response
Prompt
画像サイズは 1920 × 1080 ピクセルです。
画面のスクリーンショットを見てください。
「検索(S)」の中心座標を返してください。
座標は 0〜1000 の正規化値でも、絶対ピクセル値でも構いません。
回答はこのJSON形式のみ: {"x": 整数, "y": 整数}
Raw response
{"x": 235, "y": 137}
#3 📋 受付一覧 [HIT] — prompt & raw response
Prompt
画像サイズは 1920 × 1080 ピクセルです。
画面のスクリーンショットを見てください。
「📋
受付一覧」の中心座標を返してください。
座標は 0〜1000 の正規化値でも、絶対ピクセル値でも構いません。
回答はこのJSON形式のみ: {"x": 整数, "y": 整数}
Raw response
{"x": 28, "y": 67}
#4 🏥 受付管理 [MISS] — prompt & raw response
Prompt
画像サイズは 1920 × 1080 ピクセルです。
画面のスクリーンショットを見てください。
「🏥
受付管理」の中心座標を返してください。
座標は 0〜1000 の正規化値でも、絶対ピクセル値でも構いません。
回答はこのJSON形式のみ: {"x": 整数, "y": 整数}
Raw response
{"x": 28, "y": 65}
#5 🛏 入院管理 [MISS] — prompt & raw response
Prompt
画像サイズは 1920 × 1080 ピクセルです。
画面のスクリーンショットを見てください。
「🛏
入院管理」の中心座標を返してください。
座標は 0〜1000 の正規化値でも、絶対ピクセル値でも構いません。
回答はこのJSON形式のみ: {"x": 整数, "y": 整数}
Raw response
{"x": 100, "y": 75}
#6 📅 予約管理 [MISS] — prompt & raw response
Prompt
画像サイズは 1920 × 1080 ピクセルです。
画面のスクリーンショットを見てください。
「📅
予約管理」の中心座標を返してください。
座標は 0〜1000 の正規化値でも、絶対ピクセル値でも構いません。
回答はこのJSON形式のみ: {"x": 整数, "y": 整数}
Raw response
{"x": 100, "y": 72}

karte (DOM: 23 elements)

karte
#TargetGT bboxPredResultDistLatency
#1カルテ記載[90, 45, 158, 66](192,45)MISS68.7px1.96s
#2処方[220, 45, 258, 66](518,121)MISS286.7px1.94s
#3検査[260, 45, 298, 66](733,108)MISS457.1px1.96s
#4病名[300, 45, 338, 66](860,117)MISS544.5px1.95s
#5検査結果窓[421, 45, 489, 66](1824,410)MISS1414.3px1.96s
#6処方一覧窓[491, 45, 559, 66](557,108)MISS61.9px1.94s
Show grounding prompts & raw responses (6 items)
#1 カルテ記載 [MISS] — prompt & raw response
Prompt
画像サイズは 1920 × 1080 ピクセルです。
画面のスクリーンショットを見てください。
「カルテ記載」の中心座標を返してください。
座標は 0〜1000 の正規化値でも、絶対ピクセル値でも構いません。
回答はこのJSON形式のみ: {"x": 整数, "y": 整数}
Raw response
{"x": 100, "y": 42}
#2 処方 [MISS] — prompt & raw response
Prompt
画像サイズは 1920 × 1080 ピクセルです。
画面のスクリーンショットを見てください。
「処方」の中心座標を返してください。
座標は 0〜1000 の正規化値でも、絶対ピクセル値でも構いません。
回答はこのJSON形式のみ: {"x": 整数, "y": 整数}
Raw response
{"x": 270, "y": 112}
#3 検査 [MISS] — prompt & raw response
Prompt
画像サイズは 1920 × 1080 ピクセルです。
画面のスクリーンショットを見てください。
「検査」の中心座標を返してください。
座標は 0〜1000 の正規化値でも、絶対ピクセル値でも構いません。
回答はこのJSON形式のみ: {"x": 整数, "y": 整数}
Raw response
{"x": 382, "y": 100}
#4 病名 [MISS] — prompt & raw response
Prompt
画像サイズは 1920 × 1080 ピクセルです。
画面のスクリーンショットを見てください。
「病名」の中心座標を返してください。
座標は 0〜1000 の正規化値でも、絶対ピクセル値でも構いません。
回答はこのJSON形式のみ: {"x": 整数, "y": 整数}
Raw response
{"x": 448, "y": 108}
#5 検査結果窓 [MISS] — prompt & raw response
Prompt
画像サイズは 1920 × 1080 ピクセルです。
画面のスクリーンショットを見てください。
「検査結果窓」の中心座標を返してください。
座標は 0〜1000 の正規化値でも、絶対ピクセル値でも構いません。
回答はこのJSON形式のみ: {"x": 整数, "y": 整数}
Raw response
{"x": 950, "y": 380}
#6 処方一覧窓 [MISS] — prompt & raw response
Prompt
画像サイズは 1920 × 1080 ピクセルです。
画面のスクリーンショットを見てください。
「処方一覧窓」の中心座標を返してください。
座標は 0〜1000 の正規化値でも、絶対ピクセル値でも構いません。
回答はこのJSON形式のみ: {"x": 整数, "y": 整数}
Raw response
{"x": 290, "y": 100}

labs (DOM: 26 elements)

labs
#TargetGT bboxPredResultDistLatency
#1カルテ記載[90, 45, 158, 66](284,108)MISS168.5px1.93s
#2処方[220, 45, 258, 66](576,203)MISS368.1px1.95s
#3検査[260, 45, 298, 66](791,189)MISS529.2px1.93s
#4病名[300, 45, 338, 66](768,216)MISS477.0px1.93s
#5検査結果窓[421, 45, 489, 66](1824,637)MISS1487.6px1.94s
#6処方一覧窓[491, 45, 559, 66](1440,162)MISS921.2px1.93s
OCR [lab_results]: 6/6 (recall 1.00) • 3.62s
GT
[
  {
    "name": "AST(GOT)",
    "value": "16.8"
  },
  {
    "name": "ALT(GPT)",
    "value": "19.3"
  },
  {
    "name": "クレアチニン(Cr)",
    "value": "0.8"
  },
  {
    "name": "白血球数(WBC)",
    "value": "5270.2"
  },
  {
    "name": "CRP定量",
    "value": "0.1"
  },
  {
    "name": "Na(ナトリウム)",
    "value": "139.6"
  }
]
Predicted
[
  {
    "name": "AST(GOT)",
    "value": "16.8",
    "unit": "U/L"
  },
  {
    "name": "ALT(GPT)",
    "value": "19.3",
    "unit": "U/L"
  },
  {
    "name": "クレアチニン(Cr)",
    "value": "0.8",
    "unit": "mg/dL"
  },
  {
    "name": "白血球数(WBC)",
    "value": "5270.2",
    "unit": "/μL"
  },
  {
    "name": "CRP定量",
    "value": "0.1",
    "unit": "mg/dL"
  },
  {
    "name": "Na(ナトリウム)",
    "value": "139.6",
    "unit": "mEq/L"
  }
]
prompt & raw response
Prompt
画面のスクリーンショットを見てください。
画面に表示されている検査値をJSON配列で取得。各項目: name, value, unit
回答はJSON配列のみ: [{...}, {...}]
markdown fence(```)は一切不要、JSONだけ返してください。
Raw response
[
  {
    "name": "AST(GOT)",
    "value": "16.8",
    "unit": "U/L"
  },
  {
    "name": "ALT(GPT)",
    "value": "19.3",
    "unit": "U/L"
  },
  {
    "name": "クレアチニン(Cr)",
    "value": "0.8",
    "unit": "mg/dL"
  },
  {
    "name": "白血球数(WBC)",
    "value": "5270.2",
    "unit": "/μL"
  },
  {
    "name": "CRP定量",
    "value": "0.1",
    "unit": "mg/dL"
  },
  {
    "name": "Na(ナトリウム)",
    "value": "139.6",
    "unit": "mEq/L"
  }
]
Show grounding prompts & raw responses (6 items)
#1 カルテ記載 [MISS] — prompt & raw response
Prompt
画像サイズは 1920 × 1080 ピクセルです。
画面のスクリーンショットを見てください。
「カルテ記載」の中心座標を返してください。
座標は 0〜1000 の正規化値でも、絶対ピクセル値でも構いません。
回答はこのJSON形式のみ: {"x": 整数, "y": 整数}
Raw response
{"x": 148, "y": 100}
#2 処方 [MISS] — prompt & raw response
Prompt
画像サイズは 1920 × 1080 ピクセルです。
画面のスクリーンショットを見てください。
「処方」の中心座標を返してください。
座標は 0〜1000 の正規化値でも、絶対ピクセル値でも構いません。
回答はこのJSON形式のみ: {"x": 整数, "y": 整数}
Raw response
{"x": 300, "y": 188}
#3 検査 [MISS] — prompt & raw response
Prompt
画像サイズは 1920 × 1080 ピクセルです。
画面のスクリーンショットを見てください。
「検査」の中心座標を返してください。
座標は 0〜1000 の正規化値でも、絶対ピクセル値でも構いません。
回答はこのJSON形式のみ: {"x": 整数, "y": 整数}
Raw response
{"x": 412, "y": 175}
#4 病名 [MISS] — prompt & raw response
Prompt
画像サイズは 1920 × 1080 ピクセルです。
画面のスクリーンショットを見てください。
「病名」の中心座標を返してください。
座標は 0〜1000 の正規化値でも、絶対ピクセル値でも構いません。
回答はこのJSON形式のみ: {"x": 整数, "y": 整数}
Raw response
{"x": 400, "y": 200}
#5 検査結果窓 [MISS] — prompt & raw response
Prompt
画像サイズは 1920 × 1080 ピクセルです。
画面のスクリーンショットを見てください。
「検査結果窓」の中心座標を返してください。
座標は 0〜1000 の正規化値でも、絶対ピクセル値でも構いません。
回答はこのJSON形式のみ: {"x": 整数, "y": 整数}
Raw response
{"x": 950, "y": 590}
#6 処方一覧窓 [MISS] — prompt & raw response
Prompt
画像サイズは 1920 × 1080 ピクセルです。
画面のスクリーンショットを見てください。
「処方一覧窓」の中心座標を返してください。
座標は 0〜1000 の正規化値でも、絶対ピクセル値でも構いません。
回答はこのJSON形式のみ: {"x": 整数, "y": 整数}
Raw response
{"x": 750, "y": 150}

meds (DOM: 30 elements)

meds
#TargetGT bboxPredResultDistLatency
#1カルテ記載[90, 45, 158, 66](255,92)MISS136.1px1.94s
#2処方[220, 45, 258, 66](553,360)MISS437.7px1.94s
#3検査[260, 45, 298, 66](384,108)MISS117.6px1.94s
#4病名[300, 45, 338, 66](960,583)MISS830.5px1.92s
#5検査結果窓[421, 45, 489, 66](941,540)MISS686.6px1.93s
#6処方一覧窓[491, 45, 559, 66](941,540)MISS639.0px1.93s
OCR [medications]: 1/1 (recall 1.00) • 3.91s
GT
[
  {
    "name": "ランソプラゾールOD錠15mg",
    "dosage": "1錠 1日1回 朝食前"
  }
]
Predicted
[
  {
    "name": "メトホルミン塩酸塩錠250mg",
    "dosage": "500mg/日"
  },
  {
    "name": "アムロジピンベシル酸塩錠5mg",
    "dosage": "5mg/日"
  },
  {
    "name": "カンデサルタンシレキセチル錠8mg",
    "dosage": "8mg/日"
  },
  {
    "name": "ロスバスタチンカルシウム錠2.5mg",
    "dosage": "2.5mg/日"
  },
  {
    "name": "ランソプラゾールOD錠15mg",
    "dosage": "15mg/日"
  },
  {
    "name": "アスピリン腸溶錠100mg",
    "dosage": "100mg/日"
  },
  {
    "name": "ワルファリンカリウム錠1mg",
    "dosage": "1-5mg/日"
  }
]
prompt & raw response
Prompt
画面のスクリーンショットを見てください。
画面に表示されている処方薬一覧をJSON配列で取得。各項目: name, dosage
回答はJSON配列のみ: [{...}, {...}]
markdown fence(```)は一切不要、JSONだけ返してください。
Raw response
[
  {
    "name": "メトホルミン塩酸塩錠250mg",
    "dosage": "500mg/日"
  },
  {
    "name": "アムロジピンベシル酸塩錠5mg",
    "dosage": "5mg/日"
  },
  {
    "name": "カンデサルタンシレキセチル錠8mg",
    "dosage": "8mg/日"
  },
  {
    "name": "ロスバスタチンカルシウム錠2.5mg",
    "dosage": "2.5mg/日"
  },
  {
    "name": "ランソプラゾールOD錠15mg",
    "dosage": "15mg/日"
  },
  {
    "name": "アスピリン腸溶錠100mg",
    "dosage": "100mg/日"
  },
  {
    "name": "ワルファリンカリウム錠1mg",
    "dosage": "1-5mg/日"
  }
]
Show grounding prompts & raw responses (6 items)
#1 カルテ記載 [MISS] — prompt & raw response
Prompt
画像サイズは 1920 × 1080 ピクセルです。
画面のスクリーンショットを見てください。
「カルテ記載」の中心座標を返してください。
座標は 0〜1000 の正規化値でも、絶対ピクセル値でも構いません。
回答はこのJSON形式のみ: {"x": 整数, "y": 整数}
Raw response
{"x": 133, "y": 85}
#2 処方 [MISS] — prompt & raw response
Prompt
画像サイズは 1920 × 1080 ピクセルです。
画面のスクリーンショットを見てください。
「処方」の中心座標を返してください。
座標は 0〜1000 の正規化値でも、絶対ピクセル値でも構いません。
回答はこのJSON形式のみ: {"x": 整数, "y": 整数}
Raw response
{"x": 288, "y": 333}
#3 検査 [MISS] — prompt & raw response
Prompt
画像サイズは 1920 × 1080 ピクセルです。
画面のスクリーンショットを見てください。
「検査」の中心座標を返してください。
座標は 0〜1000 の正規化値でも、絶対ピクセル値でも構いません。
回答はこのJSON形式のみ: {"x": 整数, "y": 整数}
Raw response
{"x": 200, "y": 100}
#4 病名 [MISS] — prompt & raw response
Prompt
画像サイズは 1920 × 1080 ピクセルです。
画面のスクリーンショットを見てください。
「病名」の中心座標を返してください。
座標は 0〜1000 の正規化値でも、絶対ピクセル値でも構いません。
回答はこのJSON形式のみ: {"x": 整数, "y": 整数}
Raw response
{"x": 500, "y": 540}
#5 検査結果窓 [MISS] — prompt & raw response
Prompt
画像サイズは 1920 × 1080 ピクセルです。
画面のスクリーンショットを見てください。
「検査結果窓」の中心座標を返してください。
座標は 0〜1000 の正規化値でも、絶対ピクセル値でも構いません。
回答はこのJSON形式のみ: {"x": 整数, "y": 整数}
Raw response
{"x": 490, "y": 500}
#6 処方一覧窓 [MISS] — prompt & raw response
Prompt
画像サイズは 1920 × 1080 ピクセルです。
画面のスクリーンショットを見てください。
「処方一覧窓」の中心座標を返してください。
座標は 0〜1000 の正規化値でも、絶対ピクセル値でも構いません。
回答はこのJSON形式のみ: {"x": 整数, "y": 整数}
Raw response
{"x": 490, "y": 500}

diagnoses (DOM: 32 elements)

diagnoses
#TargetGT bboxPredResultDistLatency
#1カルテ記載[90, 45, 158, 66](250,124)MISS143.7px1.92s
#2処方[220, 45, 258, 66](528,175)MISS312.9px1.92s
#3検査[260, 45, 298, 66](403,135)MISS147.6px1.92s
#4病名[300, 45, 338, 66](733,413)MISS547.3px1.93s
#5検査結果窓[421, 45, 489, 66](947,559)MISS704.3px1.92s
#6処方一覧窓[491, 45, 559, 66](954,559)MISS661.9px1.93s
OCR [diagnoses]: 2/2 (recall 1.00) • 2.11s
GT
[
  {
    "name": "うつ病エピソード",
    "icd10": "F32"
  },
  {
    "name": "背部痛",
    "icd10": "M54"
  }
]
Predicted
[
  {
    "name": "うつ病エピソード",
    "icd10": "F32"
  },
  {
    "name": "背部痛",
    "icd10": "M54.5"
  }
]
prompt & raw response
Prompt
画面のスクリーンショットを見てください。
画面に表示されている病名一覧をJSON配列で取得。各項目: name, icd10
回答はJSON配列のみ: [{...}, {...}]
markdown fence(```)は一切不要、JSONだけ返してください。
Raw response
[{"name": "うつ病エピソード", "icd10": "F32"}, {"name": "背部痛", "icd10": "M54.5"}]
Show grounding prompts & raw responses (6 items)
#1 カルテ記載 [MISS] — prompt & raw response
Prompt
画像サイズは 1920 × 1080 ピクセルです。
画面のスクリーンショットを見てください。
「カルテ記載」の中心座標を返してください。
座標は 0〜1000 の正規化値でも、絶対ピクセル値でも構いません。
回答はこのJSON形式のみ: {"x": 整数, "y": 整数}
Raw response
{"x": 130, "y": 115}
#2 処方 [MISS] — prompt & raw response
Prompt
画像サイズは 1920 × 1080 ピクセルです。
画面のスクリーンショットを見てください。
「処方」の中心座標を返してください。
座標は 0〜1000 の正規化値でも、絶対ピクセル値でも構いません。
回答はこのJSON形式のみ: {"x": 整数, "y": 整数}
Raw response
{"x": 275, "y": 162}
#3 検査 [MISS] — prompt & raw response
Prompt
画像サイズは 1920 × 1080 ピクセルです。
画面のスクリーンショットを見てください。
「検査」の中心座標を返してください。
座標は 0〜1000 の正規化値でも、絶対ピクセル値でも構いません。
回答はこのJSON形式のみ: {"x": 整数, "y": 整数}
Raw response
{"x": 210, "y": 125}
#4 病名 [MISS] — prompt & raw response
Prompt
画像サイズは 1920 × 1080 ピクセルです。
画面のスクリーンショットを見てください。
「病名」の中心座標を返してください。
座標は 0〜1000 の正規化値でも、絶対ピクセル値でも構いません。
回答はこのJSON形式のみ: {"x": 整数, "y": 整数}
Raw response
{"x": 382, "y": 382}
#5 検査結果窓 [MISS] — prompt & raw response
Prompt
画像サイズは 1920 × 1080 ピクセルです。
画面のスクリーンショットを見てください。
「検査結果窓」の中心座標を返してください。
座標は 0〜1000 の正規化値でも、絶対ピクセル値でも構いません。
回答はこのJSON形式のみ: {"x": 整数, "y": 整数}
Raw response
{"x": 493, "y": 518}
#6 処方一覧窓 [MISS] — prompt & raw response
Prompt
画像サイズは 1920 × 1080 ピクセルです。
画面のスクリーンショットを見てください。
「処方一覧窓」の中心座標を返してください。
座標は 0〜1000 の正規化値でも、絶対ピクセル値でも構いません。
回答はこのJSON形式のみ: {"x": 整数, "y": 整数}
Raw response
{"x": 497, "y": 518}