From 69d0b641e3dd2fda70e807b8181571e30da4e69d Mon Sep 17 00:00:00 2001
From: Yue Sun <yuesu@microsoft.com>
Date: Tue, 23 Jun 2026 14:11:50 +0800
Subject: [PATCH 1/2] Rename report to examples_compatibility_report.html

---
 dev/reference/supported-models/index.html  |   2 +-
 reports/README.md                          |  16 +-
 reports/download_report.py                 |  10 +-
 reports/examples_compatibility_report.html | 787 +++++++++++++++++++++
 reports/model_compatibility_report.html    | 618 ----------------
 5 files changed, 801 insertions(+), 632 deletions(-)
 create mode 100644 reports/examples_compatibility_report.html
 delete mode 100644 reports/model_compatibility_report.html
diff --git a/dev/reference/supported-models/index.html b/dev/reference/supported-models/index.html
index eb2ee0b41..63c2995b6 100644
--- a/dev/reference/supported-models/index.html
+++ b/dev/reference/supported-models/index.html
@@ -2978,7 +2978,7 @@
 <h1 id="supported-models">Supported Models<a class="headerlink" href="#supported-models" title="Permanent link">&para;</a></h1>
 <p>Windows ML CLI has validated a set of models for compatibility across all
 Execution Providers (EPs)—see the full
-<a href="https://microsoft.github.io/winml-cli/reports/model_compatibility_report.html">model compatibility report</a>.</p>
+<a href="https://microsoft.github.io/winml-cli/reports/examples_compatibility_report.html">models accuracy report</a>.</p>
 <p>winml-cli supports a wide range of model architectures and tasks. This page
 lists what's validated and how to discover model support.</p>
 <hr />
diff --git a/reports/README.md b/reports/README.md
index 197a442dd..736902bea 100644
--- a/reports/README.md
+++ b/reports/README.md
@@ -1,11 +1,11 @@
-# Model compatibility report
+# Examples compatibility report
 
-This folder hosts the **model compatibility report** published to the public
+This folder hosts the **examples compatibility report** published to the public
 winml-cli GitHub Pages site, plus the script used to refresh it.
 
 | File | Purpose |
 | --- | --- |
-| `model_compatibility_report.html` | The self-contained report page (all data embedded inline). |
+| `examples_compatibility_report.html` | The self-contained report page (all data embedded inline). |
 | `download_report.py` | Fetches the latest report from the private artifacts repo. |
 | `README.md` | This file. |
 
@@ -17,7 +17,7 @@ winml-cli GitHub Pages site, plus the script used to refresh it.
 ## Source
 
 The report is generated in the private `gim-home/ModelKitArtifacts` repo and
-lives at `e2e_model_coverage_result/model_compatibility_report.html` on its
+lives at `e2e_model_coverage_result/examples_compatibility_report.html` on its
 `site-src` branch. The page embeds all of its data inline, so only this one
 file needs to be published — no JSON or other assets are fetched at runtime.
 
@@ -42,7 +42,7 @@ cd ../wmlcli-ghpages/reports
 
 Then run the script from this `reports/` folder. It uses only the Python
 standard library — no project dependencies or `uv` required. By default it
-overwrites `model_compatibility_report.html` next to the script:
+overwrites `examples_compatibility_report.html` next to the script:
 
 ```powershell
 python download_report.py --account <your_gim-home_account>
@@ -57,12 +57,12 @@ fetches — it does not commit or push.
 Commit and push the refreshed report on `gh-pages`:
 
 ```powershell
-git add reports/model_compatibility_report.html
-git commit -m "Update model compatibility report"
+git add reports/examples_compatibility_report.html
+git commit -m "Update examples compatibility report"
 git push origin gh-pages
 ```
 
-The report is then available at `.../reports/model_compatibility_report.html`.
+The report is then available at `.../reports/examples_compatibility_report.html`.
 GitHub Pages redeploys automatically within a minute or two of the push.
 
 If you used a worktree, clean it up afterwards:
diff --git a/reports/download_report.py b/reports/download_report.py
index 999a978b8..afb5e45e7 100644
--- a/reports/download_report.py
+++ b/reports/download_report.py
@@ -25,14 +25,14 @@
     python download_report.py --account <account> --out <path>
 
 By default the report is written next to this script, overwriting the published
-copy (reports/model_compatibility_report.html on the gh-pages branch).
+copy (reports/examples_compatibility_report.html on the gh-pages branch).
 
 PUBLISHING (manual, done by a maintainer):
     See README.md (co-located in this folder) for full instructions. After
     fetching, commit and push the refreshed report on the gh-pages branch:
 
-        git add reports/model_compatibility_report.html
-        git commit -m "Update model compatibility report"
+        git add reports/examples_compatibility_report.html
+        git commit -m "Update examples compatibility report"
         git push origin gh-pages
 """
 
@@ -47,7 +47,7 @@
 
 SOURCE_REPO = "gim-home/ModelKitArtifacts"
 SOURCE_BRANCH = "site-src"
-SOURCE_FILE = "e2e_model_coverage_result/model_compatibility_report.html"
+SOURCE_FILE = "e2e_model_coverage_result/examples_compatibility_report.html"
 REPORT_FILENAME = SOURCE_FILE.rsplit("/", 1)[-1]
 DEFAULT_OUT = Path(__file__).resolve().parent / REPORT_FILENAME
 
@@ -122,7 +122,7 @@ def _sparse_clone(clone_url: str, dest: Path) -> bool:
 
 def main() -> None:
     parser = argparse.ArgumentParser(
-        description="Fetch the model compatibility report from gim-home/ModelKitArtifacts"
+        description="Fetch the examples compatibility report from gim-home/ModelKitArtifacts"
     )
     parser.add_argument("--account", type=str, help="gh CLI account with access to gim-home org")
     parser.add_argument(
diff --git a/reports/examples_compatibility_report.html b/reports/examples_compatibility_report.html
new file mode 100644
index 000000000..38b2b9f9a
--- /dev/null
+++ b/reports/examples_compatibility_report.html
@@ -0,0 +1,787 @@
+<!DOCTYPE html>
+<html lang="en">
+<head>
+<meta charset="UTF-8">
+<meta name="viewport" content="width=device-width, initial-scale=1.0">
+<title>Model Accuracy Report</title>
+<style>
+:root{
+  --bg:#faf9f8;--bg2:#f5f5f5;--bg3:#ffffff;--border:#e0e0e0;--border-strong:#d1d1d1;
+  --text:#242424;--text-dim:#616161;--accent:#0f6cbd;--accent2:#115ea3;--accent-soft:#eff6fc;
+  --pass:#0e700e;--pass-bg:#f1faf1;--pass-border:#9fd89f;
+  --regr:#9a5b00;--regr-bg:#fff4e3;--regr-border:#f0c38a;
+  --fail:#b10e1c;--fail-bg:#fdf3f4;--fail-border:#eeacb2;
+  --timeout:#5b3b8c;--timeout-bg:#f3effa;--timeout-border:#c9b8e6;
+  --na:#707070;--na-bg:#f0f0f0;
+  --pending:#835b00;--pending-bg:#fff4ce;--pending-border:#f2d680;
+  --shadow2:0 1px 2px rgba(0,0,0,.14),0 0 2px rgba(0,0,0,.12);--radius:4px;
+}
+*{box-sizing:border-box;margin:0;padding:0}
+body{background:var(--bg);color:var(--text);font-family:'Segoe UI Variable','Segoe UI',system-ui,-apple-system,'Helvetica Neue',Arial,sans-serif;font-size:16px;-webkit-font-smoothing:antialiased}
+.header{background:var(--bg3);border-bottom:1px solid var(--border);padding:18px 28px 16px}
+.header-top{display:flex;align-items:center;gap:12px;flex-wrap:wrap}
+.header h1{font-size:28px;font-weight:600;color:var(--text);letter-spacing:-.01em}
+.v2-badge{background:var(--accent);color:#fff;font-size:12px;font-weight:600;padding:3px 10px;border-radius:var(--radius)}
+.theme-toggle{margin-left:auto;width:32px;height:32px;display:inline-flex;align-items:center;justify-content:center;background:transparent;border:1px solid var(--border-strong);border-radius:var(--radius);color:var(--text-dim);cursor:pointer;transition:background .15s,color .15s,border-color .15s}
+.theme-toggle:hover{background:var(--bg2);color:var(--text);border-color:var(--accent)}
+.theme-toggle:focus-visible{outline:none;box-shadow:0 0 0 2px var(--accent)}
+.theme-toggle svg{width:18px;height:18px;fill:currentColor}
+.theme-toggle .icon-sun{display:none}
+.theme-toggle .icon-moon{display:inline-flex}
+body.dark .theme-toggle .icon-moon{display:none}
+body.dark .theme-toggle .icon-sun{display:inline-flex}
+body.dark{
+  --bg:#141414;--bg2:#1f1f1f;--bg3:#292929;--border:#404040;--border-strong:#525252;
+  --text:#f5f5f5;--text-dim:#adadad;--accent:#2886de;--accent2:#62abf5;--accent-soft:rgba(40,134,222,.16);
+  --pass:#5ec75e;--pass-bg:rgba(94,199,94,.13);--pass-border:rgba(94,199,94,.35);
+  --regr:#e6c84a;--regr-bg:rgba(230,200,74,.13);--regr-border:rgba(230,200,74,.35);
+  --fail:#f4868f;--fail-bg:rgba(244,134,143,.13);--fail-border:rgba(244,134,143,.35);
+  --timeout:#b79cf0;--timeout-bg:rgba(183,156,240,.15);--timeout-border:rgba(183,156,240,.38);
+  --na:#8a8a8a;--na-bg:rgba(255,255,255,.06);
+  --pending:#e6c84a;--pending-bg:rgba(230,200,74,.13);--pending-border:rgba(230,200,74,.35);
+  --shadow2:0 1px 2px rgba(0,0,0,.5),0 0 2px rgba(0,0,0,.4);
+}
+.header .subtitle{color:var(--text-dim);margin-top:6px;font-size:14px}
+.header-stats{display:flex;gap:12px;margin-top:16px;flex-wrap:wrap}
+.stat-card{background:var(--bg3);border:1px solid var(--border);border-radius:6px;padding:10px 18px;min-width:120px;box-shadow:var(--shadow2)}
+.stat-card .label{font-size:14px;color:var(--text-dim);letter-spacing:.01em}
+.stat-card .value{font-size:28px;font-weight:600;margin-top:2px}
+.stat-card .value.green{color:var(--pass)}.stat-card .value.blue{color:var(--accent)}
+.stat-card .value.amber{color:var(--regr)}.stat-card .value.red{color:var(--fail)}
+.stat-card .value.purple{color:var(--timeout)}
+.ep-bar{background:var(--bg2);border-bottom:1px solid var(--border);padding:12px 28px;display:flex;gap:10px;flex-wrap:wrap;align-items:flex-start}
+.ep-chip{background:var(--bg3);border:1px solid var(--border);border-radius:6px;padding:8px 14px;font-size:14px;min-width:120px;box-shadow:var(--shadow2);cursor:pointer;transition:box-shadow .15s,border-color .15s,transform .1s}
+.ep-chip:hover{border-color:var(--accent);transform:translateY(-1px)}
+.ep-chip.selected{border-color:var(--accent);box-shadow:0 0 0 2px var(--accent);background:var(--accent-soft)}
+.ep-chip .chip-name{font-weight:600;font-size:14px;margin-bottom:4px;display:flex;align-items:center;gap:5px;color:var(--pass)}
+.ep-chip .chip-stats{color:var(--text);font-weight:600}
+.legend-note{background:var(--bg2);border-bottom:1px solid var(--border);padding:10px 28px;display:flex;align-items:flex-start;gap:16px;flex-wrap:wrap;font-size:13px;color:var(--text-dim)}
+.legend-note code{font-family:'Cascadia Code','Consolas',monospace;font-size:12px;background:var(--bg3);border:1px solid var(--border);border-radius:3px;padding:1px 5px;color:var(--text)}
+.legend-note strong{color:var(--text)}
+.legend-note .legend-text{flex:1 1 320px;line-height:1.5}
+.legend-note .note-bullets{list-style:disc;margin:5px 0 4px;padding-left:20px;line-height:1.55}
+.legend-note .note-bullets li{margin:2px 0}
+.legend-note .note-bullets li.nb-compat::marker{color:var(--accent2)}
+.legend-note .note-bullets li.nb-acc::marker{color:var(--regr)}
+.legend-keys{display:flex;gap:14px;flex-wrap:wrap;margin-left:auto}
+.legend-key{display:inline-flex;align-items:center;gap:5px;white-space:nowrap}
+.lk-mark{display:inline-flex;align-items:center;justify-content:center;min-width:22px;height:22px;padding:0 5px;border-radius:var(--radius);font-weight:700;font-size:13px}
+.lk-mark.pass{background:var(--pass-bg);color:var(--pass)}
+.lk-mark.regr{background:var(--regr-bg);color:var(--regr)}
+.lk-mark.fail{background:var(--fail-bg);color:var(--fail)}
+.lk-mark.timeout{background:var(--timeout-bg);color:var(--timeout)}
+.lk-mark.na{background:var(--na-bg);color:var(--na)}
+.controls{background:var(--bg3);border-bottom:1px solid var(--border);padding:10px 28px;display:flex;gap:10px;align-items:center;flex-wrap:wrap}
+.filter-group{display:flex;align-items:center;gap:6px}
+.filter-group label{font-size:14px;color:var(--text-dim)}
+.controls input,.controls select{background:var(--bg3);border:1px solid var(--border-strong);border-radius:var(--radius);padding:6px 12px;color:var(--text);font-size:14px;font-family:inherit}
+.controls input{width:220px}
+.controls select{padding:6px 10px}
+.controls input:focus,.controls select:focus{outline:none;border-color:var(--accent);box-shadow:0 0 0 1px var(--accent)}
+.count-label{color:var(--text-dim);font-size:14px;margin-left:auto}
+.table-wrap{overflow-x:auto;padding:0 28px 28px;background:var(--bg3)}
+table{width:100%;border-collapse:collapse;min-width:1180px;table-layout:fixed}
+thead th{position:sticky;top:0;background:var(--bg3);border-bottom:1px solid var(--border-strong);padding:9px 6px;text-align:center;font-size:13px;font-weight:600;color:var(--text-dim);letter-spacing:.01em;white-space:nowrap;z-index:10;height:34px}
+thead th.model-col,thead th.task-col{text-align:left;vertical-align:middle}
+thead th.model-col{width:208px}
+thead th.task-col{width:132px}
+thead th[data-col]{width:auto}
+/* Second header row: per-EP "Comp | Acc" labels aligned to the tile halves. */
+thead tr.subhead-row th.subhead{top:34px;height:auto;padding:3px 6px 5px;border-bottom:1px solid var(--border-strong);z-index:9}
+.subhead-split{display:flex;width:100%;max-width:124px;margin:0 auto;align-items:center}
+.subhead-split .sh{flex:1 1 0;min-width:0;text-align:center;font-size:9px;font-weight:700;text-transform:uppercase;letter-spacing:.03em}
+.subhead-split .sh.sh-compat{color:var(--accent2)}
+.subhead-split .sh.sh-acc{color:var(--regr)}
+.subhead-split .sh-sep{flex:0 0 auto;width:6px;text-align:center;color:var(--border-strong);font-weight:400}
+tbody td{border-bottom:1px solid var(--border);padding:6px 4px;font-size:14px;text-align:center}
+tbody td.model-col{text-align:left;font-size:14px;font-weight:500;white-space:normal;overflow-wrap:break-word;word-break:normal;line-height:1.35}
+tbody td.task-col{text-align:left;color:var(--text-dim);font-size:13px;white-space:normal;overflow-wrap:break-word;line-height:1.35}
+tbody tr:hover{background:var(--accent-soft)}
+.cell{display:inline-flex;flex-direction:column;align-items:center;justify-content:center;gap:1px;width:88px;height:40px;border-radius:var(--radius);padding:3px 6px;cursor:default;position:relative;transition:transform .13s cubic-bezier(.2,.7,.3,1),box-shadow .13s ease,outline-color .13s ease;outline:1.5px solid transparent;outline-offset:-1.5px}
+.cell:hover{transform:scale(1.12);box-shadow:0 6px 18px rgba(0,0,0,.18);outline-color:currentColor;z-index:5}
+/* Animated floating tooltip (built in JS, appended to <body>) */
+#celltip{position:fixed;z-index:1000;pointer-events:none;background:var(--bg3);color:var(--text);border:1px solid var(--border-strong);border-radius:7px;box-shadow:0 8px 28px rgba(0,0,0,.20),0 2px 6px rgba(0,0,0,.12);padding:9px 11px;font-size:12px;min-width:158px;max-width:330px;opacity:0;transform:translateY(6px) scale(.95);transition:opacity .15s ease,transform .15s cubic-bezier(.2,.7,.3,1);will-change:transform,opacity}
+#celltip.show{opacity:1;transform:translateY(0) scale(1)}
+#celltip .ct-metric{color:var(--text);margin-bottom:2px;font-size:12px;line-height:1.4}
+#celltip .ct-metric .ct-mname{font-weight:700}
+#celltip .ct-metric .ct-lb{color:var(--text-dim);font-weight:400;font-size:11px}
+#celltip .ct-task{color:var(--text-dim);margin-bottom:6px;font-size:11px;line-height:1.4}
+#celltip .ct-logic{margin-top:6px;padding-top:5px;border-top:1px dashed var(--border);color:var(--text-dim);font-size:11px;line-height:1.4}
+#celltip .ct-row{display:flex;justify-content:space-between;gap:18px;line-height:1.7}
+#celltip .ct-row .k{color:var(--text-dim)}
+#celltip .ct-row .val{font-variant-numeric:tabular-nums;font-weight:600}
+#celltip .ct-diverged{color:var(--fail);font-weight:700;font-style:italic}
+#celltip .ct-variants{margin-top:7px;padding-top:6px;border-top:1px dashed var(--border)}
+#celltip .ct-vhead{color:var(--text-dim);font-size:10px;font-weight:700;text-transform:uppercase;letter-spacing:.04em;margin-bottom:3px}
+#celltip .ct-vrow{display:grid;grid-template-columns:96px 46px auto;align-items:baseline;gap:10px;line-height:1.7}
+#celltip .ct-vrow.best{font-weight:700}
+#celltip .ct-vrow.best .ct-prec::after{content:" \25c0";color:var(--accent);font-size:9px}
+#celltip .ct-prec{font-family:'Cascadia Code','Consolas',monospace;font-size:11px;color:var(--text);white-space:nowrap}
+#celltip .ct-vverdict{font-size:10px;font-weight:700}
+#celltip .ct-vverdict.pass{color:var(--pass)}
+#celltip .ct-vverdict.regr{color:var(--regr)}
+#celltip .ct-vverdict.timeout{color:var(--timeout)}
+#celltip .ct-vverdict.fail{color:var(--fail)}
+#celltip .ct-vverdict.na{color:var(--na)}
+#celltip .ct-vval{font-variant-numeric:tabular-nums;color:var(--text-dim);font-size:11px;margin-right:7px}
+#celltip .ct-vdelta{font-variant-numeric:tabular-nums;color:var(--text);font-size:11px}
+.cell.pass{background:var(--pass-bg);color:var(--pass)}
+.cell.regr{background:var(--regr-bg);color:var(--regr)}
+.cell.fail{background:var(--fail-bg);color:var(--fail)}
+.cell.timeout{background:var(--timeout-bg);color:var(--timeout)}
+.cell.na{background:var(--na-bg);color:var(--na)}
+.cell.nodata{background:transparent;color:var(--na)}
+/* Split tile: left half = Compatibility, right half = Accuracy, divided by "|".
+   Fills the whole cell so the EP columns aren't mostly empty space. */
+.cell.split{display:flex;width:100%;min-width:56px;max-width:124px;height:38px;flex-direction:row;gap:0;padding:0;background:transparent;margin:0 auto}
+.cell.split .half{flex:1 1 0;display:inline-flex;align-items:center;justify-content:center;min-width:0;height:100%;padding:2px 4px;font-weight:700;font-size:15px;line-height:1;white-space:nowrap}
+.cell.split .half.compat{border-radius:var(--radius) 0 0 var(--radius)}
+.cell.split .half.acc{border-radius:0 var(--radius) var(--radius) 0}
+.cell.split .sep{flex:0 0 auto;display:inline-flex;align-items:center;justify-content:center;width:6px;color:var(--border-strong);font-weight:400;font-size:12px}
+.cell.split .half.pass{background:var(--pass-bg);color:var(--pass)}
+.cell.split .half.regr{background:var(--regr-bg);color:var(--regr)}
+.cell.split .half.fail{background:var(--fail-bg);color:var(--fail)}
+.cell.split .half.timeout{background:var(--timeout-bg);color:var(--timeout)}
+.cell.split .half.na{background:var(--na-bg);color:var(--na)}
+.cell.split .half.nodata{background:transparent;color:var(--na)}
+/* Group header row: collapsible per-org summary with aggregate pass counts. */
+tr.group-row{cursor:pointer;background:var(--bg2)}
+tr.group-row:hover{background:var(--accent-soft)}
+tr.group-row td{padding:7px 4px;border-bottom:1px solid var(--border-strong);vertical-align:middle}
+tr.group-row td.model-col{vertical-align:middle}
+tr.group-row .group-toggle{display:inline-flex;align-items:center;gap:6px;font-size:14px}
+tr.group-row .twisty{display:inline-flex;width:14px;justify-content:center;color:var(--text-dim);font-size:10px;flex:0 0 auto;user-select:none}
+tr.group-row .group-name{font-weight:700;color:var(--text);overflow-wrap:break-word;word-break:normal}
+tr.group-row .group-meta{color:var(--text-dim);font-size:12px;white-space:nowrap}
+tr.child-row td.child-name{padding-left:20px;color:var(--text-dim)}
+/* Aggregate group cell: per-EP pass fractions, same split layout as a tile. */
+.gcell.split{display:flex;width:100%;min-width:56px;max-width:124px;height:30px;flex-direction:row;gap:0;background:transparent;margin:0 auto;cursor:default}
+.gcell.split .half{flex:1 1 0;display:inline-flex;align-items:center;justify-content:center;min-width:0;height:100%;padding:1px 3px;font-weight:700;font-size:11px;line-height:1;font-variant-numeric:tabular-nums;white-space:nowrap}
+.gcell.split .half.compat{border-radius:var(--radius) 0 0 var(--radius)}
+.gcell.split .half.acc{border-radius:0 var(--radius) var(--radius) 0}
+.gcell.split .sep{flex:0 0 auto;display:inline-flex;align-items:center;justify-content:center;width:6px;color:var(--border-strong);font-size:11px}
+.gcell.split .half.pass{background:var(--pass-bg);color:var(--pass)}
+.gcell.split .half.regr{background:var(--regr-bg);color:var(--regr)}
+.gcell.split .half.fail{background:var(--fail-bg);color:var(--fail)}
+.gcell.split .half.nodata{background:transparent;color:var(--na)}
+.ctl-btn{background:var(--bg3);border:1px solid var(--border-strong);border-radius:var(--radius);padding:6px 12px;color:var(--text);font-size:14px;font-family:inherit;cursor:pointer;transition:background .15s,border-color .15s}
+.ctl-btn:hover{background:var(--bg2);border-color:var(--accent)}
+.ctl-btn:focus-visible{outline:none;box-shadow:0 0 0 2px var(--accent)}
+/* Tooltip: a labelled Compatibility section above the Accuracy section. */
+#celltip .ct-sec{display:flex;align-items:center;justify-content:space-between;gap:16px}
+#celltip .ct-sec2{margin-top:8px;padding-top:7px;border-top:1px dashed var(--border)}
+#celltip .ct-seclabel{font-weight:700;font-size:10px;letter-spacing:.05em;text-transform:uppercase;color:var(--text-dim)}
+#celltip .ct-badge{font-weight:700;font-size:11px;padding:1px 8px;border-radius:var(--radius);letter-spacing:.02em}
+#celltip .ct-badge.pass{background:var(--pass-bg);color:var(--pass)}
+#celltip .ct-badge.regr{background:var(--regr-bg);color:var(--regr)}
+#celltip .ct-badge.fail{background:var(--fail-bg);color:var(--fail)}
+#celltip .ct-badge.timeout{background:var(--timeout-bg);color:var(--timeout)}
+#celltip .ct-badge.na{background:var(--na-bg);color:var(--na)}
+#celltip .ct-secdesc{color:var(--text-dim);font-size:11px;line-height:1.4;margin-top:3px}
+#celltip .ct-sa{color:var(--regr);font-style:italic}
+.footer{padding:16px 28px 32px;color:var(--text-dim);font-size:12px;line-height:1.6}
+</style>
+</head>
+<body>
+<script>try{if(localStorage.getItem('winml-theme')==='dark')document.body.classList.add('dark');}catch(e){}</script>
+<div class="header">
+  <div class="header-top">
+    <h1>Model Accuracy Report</h1>
+    
+    <button class="theme-toggle" type="button" onclick="toggleTheme()" title="Toggle dark mode" aria-label="Toggle dark mode">
+      <svg class="icon-moon" viewBox="0 0 24 24" aria-hidden="true"><path d="M12 3a9 9 0 1 0 9 9c0-.46-.04-.92-.1-1.36a5.39 5.39 0 0 1-4.4 2.26 5.4 5.4 0 0 1-3.14-9.8c-.44-.06-.9-.1-1.36-.1z"/></svg>
+      <svg class="icon-sun" viewBox="0 0 24 24" aria-hidden="true"><circle cx="12" cy="12" r="4.2"/><g stroke="currentColor" stroke-width="1.8" stroke-linecap="round"><line x1="12" y1="2.5" x2="12" y2="5"/><line x1="12" y1="19" x2="12" y2="21.5"/><line x1="2.5" y1="12" x2="5" y2="12"/><line x1="19" y1="12" x2="21.5" y2="12"/><line x1="5.1" y1="5.1" x2="6.8" y2="6.8"/><line x1="17.2" y1="17.2" x2="18.9" y2="18.9"/><line x1="18.9" y1="5.1" x2="17.2" y2="6.8"/><line x1="6.8" y1="17.2" x2="5.1" y2="18.9"/></g></svg>
+    </button>
+  </div>
+  <div class="subtitle">WinML CLI 0.1.0 &nbsp;·&nbsp; Windows ML 2.0</div>
+  <div class="header-stats"><div class="stat-card"><div class="label">Total Models</div><div class="value blue">199</div></div><div class="stat-card"><div class="label">Total Model · Task Pairs</div><div class="value blue">226</div></div><div class="stat-card"><div class="label">Compatible on All 10 EPs</div><div class="value green">69</div></div><div class="stat-card"><div class="label">Accuracy-Tested Models</div><div class="value blue">71</div></div><div class="stat-card"><div class="label">Accuracy Pass All 10 EPs</div><div class="value green">52</div></div></div>
+</div>
+<div class="ep-bar"><div class='ep-chip' data-ep="dml/gpu" role='button' tabindex='0' title="Show only the DML GPU column"><div class='chip-name'>✓ DML GPU</div><div class='chip-stats'>175/226 (77.4%)</div></div><div class='ep-chip' data-ep="migraphx/gpu" role='button' tabindex='0' title="Show only the MIGraph GPU column"><div class='chip-name'>✓ MIGraph GPU</div><div class='chip-stats'>182/226 (80.5%)</div></div><div class='ep-chip' data-ep="mlas/cpu" role='button' tabindex='0' title="Show only the MLAS CPU column"><div class='chip-name'>✓ MLAS CPU</div><div class='chip-stats'>177/226 (78.3%)</div></div><div class='ep-chip' data-ep="openvino/npu" role='button' tabindex='0' title="Show only the OV NPU column"><div class='chip-name'>✓ OV NPU</div><div class='chip-stats'>160/226 (70.8%)</div></div><div class='ep-chip' data-ep="openvino/gpu" role='button' tabindex='0' title="Show only the OV GPU column"><div class='chip-name'>✓ OV GPU</div><div class='chip-stats'>131/226 (58.0%)</div></div><div class='ep-chip' data-ep="openvino/cpu" role='button' tabindex='0' title="Show only the OV CPU column"><div class='chip-name'>✓ OV CPU</div><div class='chip-stats'>173/226 (76.5%)</div></div><div class='ep-chip' data-ep="qnn/npu" role='button' tabindex='0' title="Show only the QNN NPU column"><div class='chip-name'>✓ QNN NPU</div><div class='chip-stats'>145/226 (64.2%)</div></div><div class='ep-chip' data-ep="qnn/gpu" role='button' tabindex='0' title="Show only the QNN GPU column"><div class='chip-name'>✓ QNN GPU</div><div class='chip-stats'>127/226 (56.2%)</div></div><div class='ep-chip' data-ep="nv_tensorrt_rtx/gpu" role='button' tabindex='0' title="Show only the TRTRTX GPU column"><div class='chip-name'>✓ TRTRTX GPU</div><div class='chip-stats'>171/226 (75.7%)</div></div><div class='ep-chip' data-ep="vitisai/npu" role='button' tabindex='0' title="Show only the VitisAI NPU column"><div class='chip-name'>✓ VitisAI NPU</div><div class='chip-stats'>172/226 (76.1%)</div></div></div>
+<div class="controls">
+  <input id="search" type="text" placeholder="Search model name…">
+  <div class="filter-group"><label>Task:</label>
+    <select id="taskFilter"><option value="">All</option><option value="audio-text-to-text">audio-text-to-text</option><option value="depth-estimation">depth-estimation</option><option value="feature-extraction">feature-extraction</option><option value="fill-mask">fill-mask</option><option value="image-classification">image-classification</option><option value="image-feature-extraction">image-feature-extraction</option><option value="image-segmentation">image-segmentation</option><option value="image-to-text">image-to-text</option><option value="mask-generation">mask-generation</option><option value="masked-lm">masked-lm</option><option value="object-detection">object-detection</option><option value="question-answering">question-answering</option><option value="sentence-similarity">sentence-similarity</option><option value="summarization">summarization</option><option value="table-question-answering">table-question-answering</option><option value="text-classification">text-classification</option><option value="text-generation">text-generation</option><option value="text-to-speech">text-to-speech</option><option value="token-classification">token-classification</option><option value="translation">translation</option><option value="video-classification">video-classification</option><option value="visual-question-answering">visual-question-answering</option><option value="zero-shot-classification">zero-shot-classification</option><option value="zero-shot-image-classification">zero-shot-image-classification</option></select></div>
+  <div class="filter-group"><label>Type:</label>
+    <select id="typeFilter"><option value="">All</option><option value="bart">bart</option><option value="beit">beit</option><option value="bert">bert</option><option value="blip">blip</option><option value="blip-2">blip-2</option><option value="camembert">camembert</option><option value="clip">clip</option><option value="convnext">convnext</option><option value="deberta">deberta</option><option value="deberta-v2">deberta-v2</option><option value="depth_anything">depth_anything</option><option value="depth_pro">depth_pro</option><option value="detr">detr</option><option value="dinov2">dinov2</option><option value="distilbert">distilbert</option><option value="dpt">dpt</option><option value="electra">electra</option><option value="gpt2">gpt2</option><option value="gpt_oss">gpt_oss</option><option value="internlm2">internlm2</option><option value="m2m_100">m2m_100</option><option value="marian">marian</option><option value="mbart">mbart</option><option value="mgp-str">mgp-str</option><option value="mobilevit">mobilevit</option><option value="mpnet">mpnet</option><option value="pegasus">pegasus</option><option value="phi4mm">phi4mm</option><option value="pix2struct">pix2struct</option><option value="qwen2">qwen2</option><option value="qwen3">qwen3</option><option value="resnet">resnet</option><option value="roberta">roberta</option><option value="rt_detr">rt_detr</option><option value="rt_detr_v2">rt_detr_v2</option><option value="sam">sam</option><option value="sam2_video">sam2_video</option><option value="segformer">segformer</option><option value="siglip">siglip</option><option value="siglip_vision_model">siglip_vision_model</option><option value="speecht5">speecht5</option><option value="splinter">splinter</option><option value="swin">swin</option><option value="swinv2">swinv2</option><option value="t5">t5</option><option value="table-transformer">table-transformer</option><option value="timm_wrapper">timm_wrapper</option><option value="unknown">unknown</option><option value="vibevoice_asr">vibevoice_asr</option><option value="vibevoice_streaming">vibevoice_streaming</option><option value="vilt">vilt</option><option value="vision-encoder-decoder">vision-encoder-decoder</option><option value="vit">vit</option><option value="xclip">xclip</option><option value="xlm-roberta">xlm-roberta</option><option value="yolos">yolos</option><option value="zoedepth">zoedepth</option></select></div>
+  <div class="filter-group"><label>Show:</label>
+    <select id="statusFilter">
+      <option value="">All</option>
+      <optgroup label="Compatibility">
+        <option value="compat:all">Compatible on all EPs</option>
+        <option value="compat:some">Compatible on ≥1 EP</option>
+        <option value="compat:none">Incompatible on all EPs</option>
+      </optgroup>
+      <optgroup label="Accuracy">
+        <option value="acc:tested">Accuracy-tested</option>
+        <option value="acc:regr">Has REGRESSION</option>
+        <option value="acc:timeout">Has TIMEOUT</option>
+        <option value="acc:fail">Has FAIL</option>
+        <option value="acc:na">Has N/A</option>
+      </optgroup>
+    </select></div>
+  <div class="filter-group"><label>Sort:</label>
+    <select id="sortBy">
+      <option value="comp_acc">Comp + Acc pass first</option>
+      <option value="comp">Comp pass first</option>
+      <option value="acc">Acc pass first</option>
+      <option value="name">Model name</option>
+    </select></div>
+  <button id="expandAll" class="ctl-btn" type="button">Collapse all</button>
+  <span class="count-label" id="countLabel"></span>
+</div>
+<div class="legend-note"><div class="legend-text">Each tile is split by <code>|</code> into <strong>Compatibility</strong> (left) and <strong>Accuracy</strong> (right):<ul class="note-bullets"><li class="nb-compat"><strong>Compatibility</strong> — the WinML CLI built the model for that execution provider and completed the <code>winml perf</code> benchmark without errors or timeout (unquantized model).</li><li class="nb-acc"><strong>Accuracy</strong> — the model's output matches the PyTorch baseline within the metric threshold. A <code>—</code> accuracy half means that pair was not accuracy-tested.</li></ul>Hover any tile for the metric, task and per-precision results.</div><span class="legend-keys"><span class="legend-key"><span class="lk-mark pass">✓</span> pass</span><span class="legend-key"><span class="lk-mark fail">✗</span> fail</span><span class="legend-key"><span class="lk-mark regr">▼</span> accuracy regression</span><span class="legend-key"><span class="lk-mark timeout">◷</span> timed out</span><span class="legend-key"><span class="lk-mark na">∅</span> not applicable</span><span class="legend-key"><span class="lk-mark nodata">—</span> no data / not tested</span></span></div>
+<div class="table-wrap">
+  <table>
+    <thead><tr><th class="model-col" rowspan="2">Model</th><th class="task-col" rowspan="2">Task</th><th data-col="dml/gpu">DML GPU</th><th data-col="migraphx/gpu">MIGraph GPU</th><th data-col="mlas/cpu">MLAS CPU</th><th data-col="openvino/npu">OV NPU</th><th data-col="openvino/gpu">OV GPU</th><th data-col="openvino/cpu">OV CPU</th><th data-col="qnn/npu">QNN NPU</th><th data-col="qnn/gpu">QNN GPU</th><th data-col="nv_tensorrt_rtx/gpu">TRTRTX GPU</th><th data-col="vitisai/npu">VitisAI NPU</th></tr><tr class="subhead-row"><th class="subhead" data-col="dml/gpu"><span class="subhead-split"><span class="sh sh-compat">Comp</span><span class="sh-sep">|</span><span class="sh sh-acc">Acc</span></span></th><th class="subhead" data-col="migraphx/gpu"><span class="subhead-split"><span class="sh sh-compat">Comp</span><span class="sh-sep">|</span><span class="sh sh-acc">Acc</span></span></th><th class="subhead" data-col="mlas/cpu"><span class="subhead-split"><span class="sh sh-compat">Comp</span><span class="sh-sep">|</span><span class="sh sh-acc">Acc</span></span></th><th class="subhead" data-col="openvino/npu"><span class="subhead-split"><span class="sh sh-compat">Comp</span><span class="sh-sep">|</span><span class="sh sh-acc">Acc</span></span></th><th class="subhead" data-col="openvino/gpu"><span class="subhead-split"><span class="sh sh-compat">Comp</span><span class="sh-sep">|</span><span class="sh sh-acc">Acc</span></span></th><th class="subhead" data-col="openvino/cpu"><span class="subhead-split"><span class="sh sh-compat">Comp</span><span class="sh-sep">|</span><span class="sh sh-acc">Acc</span></span></th><th class="subhead" data-col="qnn/npu"><span class="subhead-split"><span class="sh sh-compat">Comp</span><span class="sh-sep">|</span><span class="sh sh-acc">Acc</span></span></th><th class="subhead" data-col="qnn/gpu"><span class="subhead-split"><span class="sh sh-compat">Comp</span><span class="sh-sep">|</span><span class="sh sh-acc">Acc</span></span></th><th class="subhead" data-col="nv_tensorrt_rtx/gpu"><span class="subhead-split"><span class="sh sh-compat">Comp</span><span class="sh-sep">|</span><span class="sh sh-acc">Acc</span></span></th><th class="subhead" data-col="vitisai/npu"><span class="subhead-split"><span class="sh sh-compat">Comp</span><span class="sh-sep">|</span><span class="sh sh-acc">Acc</span></span></th></tr></thead>
+    <tbody>
+<tr class="group-row" data-group="sentence-transformers"><td class="model-col"><span class="group-toggle"><span class="twisty">▼</span><span class="group-name">sentence-transformers</span></span></td><td class="task-col group-meta">5 models · 12 pairs</td><td data-col="dml/gpu"><span class="gcell split" title="Compatibility 12/12 pass · Accuracy 9/9 pass"><span class="half compat pass">12/12</span><span class="sep">|</span><span class="half acc pass">9/9</span></span></td><td data-col="migraphx/gpu"><span class="gcell split" title="Compatibility 12/12 pass · Accuracy 9/9 pass"><span class="half compat pass">12/12</span><span class="sep">|</span><span class="half acc pass">9/9</span></span></td><td data-col="mlas/cpu"><span class="gcell split" title="Compatibility 12/12 pass · Accuracy 9/9 pass"><span class="half compat pass">12/12</span><span class="sep">|</span><span class="half acc pass">9/9</span></span></td><td data-col="openvino/npu"><span class="gcell split" title="Compatibility 12/12 pass · Accuracy 9/9 pass"><span class="half compat pass">12/12</span><span class="sep">|</span><span class="half acc pass">9/9</span></span></td><td data-col="openvino/gpu"><span class="gcell split" title="Compatibility 12/12 pass · Accuracy 9/9 pass"><span class="half compat pass">12/12</span><span class="sep">|</span><span class="half acc pass">9/9</span></span></td><td data-col="openvino/cpu"><span class="gcell split" title="Compatibility 12/12 pass · Accuracy 9/9 pass"><span class="half compat pass">12/12</span><span class="sep">|</span><span class="half acc pass">9/9</span></span></td><td data-col="qnn/npu"><span class="gcell split" title="Compatibility 11/12 pass · Accuracy 9/9 pass"><span class="half compat regr">11/12</span><span class="sep">|</span><span class="half acc pass">9/9</span></span></td><td data-col="qnn/gpu"><span class="gcell split" title="Compatibility 12/12 pass · Accuracy 9/9 pass"><span class="half compat pass">12/12</span><span class="sep">|</span><span class="half acc pass">9/9</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="gcell split" title="Compatibility 12/12 pass · Accuracy 9/9 pass"><span class="half compat pass">12/12</span><span class="sep">|</span><span class="half acc pass">9/9</span></span></td><td data-col="vitisai/npu"><span class="gcell split" title="Compatibility 12/12 pass · Accuracy 9/9 pass"><span class="half compat pass">12/12</span><span class="sep">|</span><span class="half acc pass">9/9</span></span></td></tr>
+<tr class="child-row" data-group="sentence-transformers" data-model="sentence-transformers/all-minilm-l6-v2" data-task="feature-extraction" data-type="bert" data-passcount="10" data-compatall="1" data-accall="1" data-bothall="1" data-hasacc="1"><td class="model-col child-name" title="sentence-transformers/all-MiniLM-L6-v2">all-MiniLM-L6-v2</td><td class="task-col">feature-extraction</td><td data-col="dml/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Spearman Correlation" data-task="Sentence similarity / embeddings" data-logic="PASS if absolute delta &lt; 4.0" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.00&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="migraphx/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Spearman Correlation" data-task="Sentence similarity / embeddings" data-logic="PASS if absolute delta &lt; 4.0" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.00&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="mlas/cpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Spearman Correlation" data-task="Sentence similarity / embeddings" data-logic="PASS if absolute delta &lt; 4.0" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.00&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="openvino/npu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Spearman Correlation" data-task="Sentence similarity / embeddings" data-logic="PASS if absolute delta &lt; 4.0" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-0.02&quot;,&quot;best&quot;:true},{&quot;precision&quot;:&quot;w8a16&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-0.03&quot;}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="openvino/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Spearman Correlation" data-task="Sentence similarity / embeddings" data-logic="PASS if absolute delta &lt; 4.0" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.00&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="openvino/cpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Spearman Correlation" data-task="Sentence similarity / embeddings" data-logic="PASS if absolute delta &lt; 4.0" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.00&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="qnn/npu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Spearman Correlation" data-task="Sentence similarity / embeddings" data-logic="PASS if absolute delta &lt; 4.0" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-0.04&quot;,&quot;best&quot;:true},{&quot;precision&quot;:&quot;w8a16&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.06&quot;},{&quot;precision&quot;:&quot;w8a8&quot;,&quot;verdict&quot;:&quot;REGRESSION&quot;,&quot;delta&quot;:&quot;-10.72&quot;}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="qnn/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Spearman Correlation" data-task="Sentence similarity / embeddings" data-logic="PASS if absolute delta &lt; 4.0" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.00&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Spearman Correlation" data-task="Sentence similarity / embeddings" data-logic="PASS if absolute delta &lt; 4.0" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.00&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="vitisai/npu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Spearman Correlation" data-task="Sentence similarity / embeddings" data-logic="PASS if absolute delta &lt; 4.0" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-0.13&quot;,&quot;best&quot;:true},{&quot;precision&quot;:&quot;w8a16&quot;,&quot;verdict&quot;:&quot;REGRESSION&quot;,&quot;delta&quot;:&quot;-64.09&quot;},{&quot;precision&quot;:&quot;w8a8&quot;,&quot;verdict&quot;:&quot;REGRESSION&quot;,&quot;delta&quot;:&quot;-70.36&quot;}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td></tr>
+<tr class="child-row" data-group="sentence-transformers" data-model="sentence-transformers/all-minilm-l6-v2" data-task="sentence-similarity" data-type="bert" data-passcount="10" data-compatall="1" data-accall="1" data-bothall="1" data-hasacc="1"><td class="model-col child-name" title="sentence-transformers/all-MiniLM-L6-v2">all-MiniLM-L6-v2</td><td class="task-col">sentence-similarity</td><td data-col="dml/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Spearman Correlation" data-task="Sentence similarity / embeddings" data-logic="PASS if absolute delta &lt; 4.0" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.00&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="migraphx/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Spearman Correlation" data-task="Sentence similarity / embeddings" data-logic="PASS if absolute delta &lt; 4.0" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.00&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="mlas/cpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Spearman Correlation" data-task="Sentence similarity / embeddings" data-logic="PASS if absolute delta &lt; 4.0" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.00&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="openvino/npu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Spearman Correlation" data-task="Sentence similarity / embeddings" data-logic="PASS if absolute delta &lt; 4.0" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-0.02&quot;,&quot;best&quot;:true},{&quot;precision&quot;:&quot;w8a16&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-0.03&quot;}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="openvino/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Spearman Correlation" data-task="Sentence similarity / embeddings" data-logic="PASS if absolute delta &lt; 4.0" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.00&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="openvino/cpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Spearman Correlation" data-task="Sentence similarity / embeddings" data-logic="PASS if absolute delta &lt; 4.0" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.00&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="qnn/npu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Spearman Correlation" data-task="Sentence similarity / embeddings" data-logic="PASS if absolute delta &lt; 4.0" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-0.04&quot;,&quot;best&quot;:true},{&quot;precision&quot;:&quot;w8a16&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.06&quot;},{&quot;precision&quot;:&quot;w8a8&quot;,&quot;verdict&quot;:&quot;REGRESSION&quot;,&quot;delta&quot;:&quot;-10.72&quot;}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="qnn/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Spearman Correlation" data-task="Sentence similarity / embeddings" data-logic="PASS if absolute delta &lt; 4.0" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.00&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Spearman Correlation" data-task="Sentence similarity / embeddings" data-logic="PASS if absolute delta &lt; 4.0" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.00&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="vitisai/npu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Spearman Correlation" data-task="Sentence similarity / embeddings" data-logic="PASS if absolute delta &lt; 4.0" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-0.13&quot;,&quot;best&quot;:true},{&quot;precision&quot;:&quot;w8a16&quot;,&quot;verdict&quot;:&quot;REGRESSION&quot;,&quot;delta&quot;:&quot;-64.09&quot;},{&quot;precision&quot;:&quot;w8a8&quot;,&quot;verdict&quot;:&quot;REGRESSION&quot;,&quot;delta&quot;:&quot;-70.36&quot;}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td></tr>
+<tr class="child-row" data-group="sentence-transformers" data-model="sentence-transformers/all-mpnet-base-v2" data-task="feature-extraction" data-type="mpnet" data-passcount="10" data-compatall="1" data-accall="1" data-bothall="1" data-hasacc="1"><td class="model-col child-name" title="sentence-transformers/all-mpnet-base-v2">all-mpnet-base-v2</td><td class="task-col">feature-extraction</td><td data-col="dml/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Spearman Correlation" data-task="Sentence similarity / embeddings" data-logic="PASS if absolute delta &lt; 4.0" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-2.49&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="migraphx/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Spearman Correlation" data-task="Sentence similarity / embeddings" data-logic="PASS if absolute delta &lt; 4.0" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-2.49&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="mlas/cpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Spearman Correlation" data-task="Sentence similarity / embeddings" data-logic="PASS if absolute delta &lt; 4.0" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-2.49&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="openvino/npu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Spearman Correlation" data-task="Sentence similarity / embeddings" data-logic="PASS if absolute delta &lt; 4.0" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.05&quot;,&quot;best&quot;:true},{&quot;precision&quot;:&quot;w8a16&quot;,&quot;verdict&quot;:&quot;REGRESSION&quot;,&quot;delta&quot;:&quot;-85.20&quot;}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="openvino/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Spearman Correlation" data-task="Sentence similarity / embeddings" data-logic="PASS if absolute delta &lt; 4.0" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.00&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="openvino/cpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Spearman Correlation" data-task="Sentence similarity / embeddings" data-logic="PASS if absolute delta &lt; 4.0" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.00&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="qnn/npu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Spearman Correlation" data-task="Sentence similarity / embeddings" data-logic="PASS if absolute delta &lt; 4.0" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.06&quot;,&quot;best&quot;:true},{&quot;precision&quot;:&quot;w8a16&quot;,&quot;verdict&quot;:&quot;REGRESSION&quot;,&quot;delta&quot;:&quot;-52.27&quot;},{&quot;precision&quot;:&quot;w8a8&quot;,&quot;verdict&quot;:&quot;REGRESSION&quot;,&quot;delta&quot;:&quot;-88.24&quot;}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="qnn/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Spearman Correlation" data-task="Sentence similarity / embeddings" data-logic="PASS if absolute delta &lt; 4.0" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-2.49&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Spearman Correlation" data-task="Sentence similarity / embeddings" data-logic="PASS if absolute delta &lt; 4.0" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-2.49&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="vitisai/npu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Spearman Correlation" data-task="Sentence similarity / embeddings" data-logic="PASS if absolute delta &lt; 4.0" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.04&quot;,&quot;best&quot;:true},{&quot;precision&quot;:&quot;w8a16&quot;,&quot;verdict&quot;:&quot;REGRESSION&quot;,&quot;delta&quot;:&quot;-95.05&quot;},{&quot;precision&quot;:&quot;w8a8&quot;,&quot;verdict&quot;:&quot;REGRESSION&quot;,&quot;delta&quot;:&quot;-83.33&quot;}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td></tr>
+<tr class="child-row" data-group="sentence-transformers" data-model="sentence-transformers/all-mpnet-base-v2" data-task="sentence-similarity" data-type="mpnet" data-passcount="10" data-compatall="1" data-accall="1" data-bothall="1" data-hasacc="1"><td class="model-col child-name" title="sentence-transformers/all-mpnet-base-v2">all-mpnet-base-v2</td><td class="task-col">sentence-similarity</td><td data-col="dml/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Spearman Correlation" data-task="Sentence similarity / embeddings" data-logic="PASS if absolute delta &lt; 4.0" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.00&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="migraphx/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Spearman Correlation" data-task="Sentence similarity / embeddings" data-logic="PASS if absolute delta &lt; 4.0" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.00&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="mlas/cpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Spearman Correlation" data-task="Sentence similarity / embeddings" data-logic="PASS if absolute delta &lt; 4.0" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.00&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="openvino/npu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Spearman Correlation" data-task="Sentence similarity / embeddings" data-logic="PASS if absolute delta &lt; 4.0" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.05&quot;,&quot;best&quot;:true},{&quot;precision&quot;:&quot;w8a16&quot;,&quot;verdict&quot;:&quot;REGRESSION&quot;,&quot;delta&quot;:&quot;-83.07&quot;}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="openvino/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Spearman Correlation" data-task="Sentence similarity / embeddings" data-logic="PASS if absolute delta &lt; 4.0" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.00&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="openvino/cpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Spearman Correlation" data-task="Sentence similarity / embeddings" data-logic="PASS if absolute delta &lt; 4.0" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.00&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="qnn/npu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Spearman Correlation" data-task="Sentence similarity / embeddings" data-logic="PASS if absolute delta &lt; 4.0" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.06&quot;,&quot;best&quot;:true},{&quot;precision&quot;:&quot;w8a16&quot;,&quot;verdict&quot;:&quot;REGRESSION&quot;,&quot;delta&quot;:&quot;-62.81&quot;},{&quot;precision&quot;:&quot;w8a8&quot;,&quot;verdict&quot;:&quot;REGRESSION&quot;,&quot;delta&quot;:&quot;-82.75&quot;}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="qnn/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Spearman Correlation" data-task="Sentence similarity / embeddings" data-logic="PASS if absolute delta &lt; 4.0" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.00&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Spearman Correlation" data-task="Sentence similarity / embeddings" data-logic="PASS if absolute delta &lt; 4.0" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.00&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="vitisai/npu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Spearman Correlation" data-task="Sentence similarity / embeddings" data-logic="PASS if absolute delta &lt; 4.0" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.04&quot;,&quot;best&quot;:true},{&quot;precision&quot;:&quot;w8a16&quot;,&quot;verdict&quot;:&quot;REGRESSION&quot;,&quot;delta&quot;:&quot;-82.10&quot;},{&quot;precision&quot;:&quot;w8a8&quot;,&quot;verdict&quot;:&quot;REGRESSION&quot;,&quot;delta&quot;:&quot;-76.79&quot;}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td></tr>
+<tr class="child-row" data-group="sentence-transformers" data-model="sentence-transformers/multi-qa-mpnet-base-dot-v1" data-task="feature-extraction" data-type="mpnet" data-passcount="10" data-compatall="1" data-accall="1" data-bothall="1" data-hasacc="1"><td class="model-col child-name" title="sentence-transformers/multi-qa-mpnet-base-dot-v1">multi-qa-mpnet-base-dot-v1</td><td class="task-col">feature-extraction</td><td data-col="dml/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Spearman Correlation" data-task="Sentence similarity / embeddings" data-logic="PASS if absolute delta &lt; 4.0" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+1.84&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="migraphx/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Spearman Correlation" data-task="Sentence similarity / embeddings" data-logic="PASS if absolute delta &lt; 4.0" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+1.84&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="mlas/cpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Spearman Correlation" data-task="Sentence similarity / embeddings" data-logic="PASS if absolute delta &lt; 4.0" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.00&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="openvino/npu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Spearman Correlation" data-task="Sentence similarity / embeddings" data-logic="PASS if absolute delta &lt; 4.0" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.08&quot;,&quot;best&quot;:true},{&quot;precision&quot;:&quot;w8a16&quot;,&quot;verdict&quot;:&quot;REGRESSION&quot;,&quot;delta&quot;:&quot;-69.95&quot;}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="openvino/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Spearman Correlation" data-task="Sentence similarity / embeddings" data-logic="PASS if absolute delta &lt; 4.0" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.02&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="openvino/cpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Spearman Correlation" data-task="Sentence similarity / embeddings" data-logic="PASS if absolute delta &lt; 4.0" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.00&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="qnn/npu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Spearman Correlation" data-task="Sentence similarity / embeddings" data-logic="PASS if absolute delta &lt; 4.0" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.15&quot;,&quot;best&quot;:true},{&quot;precision&quot;:&quot;w8a16&quot;,&quot;verdict&quot;:&quot;REGRESSION&quot;,&quot;delta&quot;:&quot;-42.60&quot;},{&quot;precision&quot;:&quot;w8a8&quot;,&quot;verdict&quot;:&quot;REGRESSION&quot;,&quot;delta&quot;:&quot;-79.83&quot;}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="qnn/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Spearman Correlation" data-task="Sentence similarity / embeddings" data-logic="PASS if absolute delta &lt; 4.0" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+1.84&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Spearman Correlation" data-task="Sentence similarity / embeddings" data-logic="PASS if absolute delta &lt; 4.0" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+1.84&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="vitisai/npu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Spearman Correlation" data-task="Sentence similarity / embeddings" data-logic="PASS if absolute delta &lt; 4.0" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-0.12&quot;,&quot;best&quot;:true},{&quot;precision&quot;:&quot;w8a16&quot;,&quot;verdict&quot;:&quot;REGRESSION&quot;,&quot;delta&quot;:&quot;-49.52&quot;},{&quot;precision&quot;:&quot;w8a8&quot;,&quot;verdict&quot;:&quot;REGRESSION&quot;,&quot;delta&quot;:&quot;-53.29&quot;}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td></tr>
+<tr class="child-row" data-group="sentence-transformers" data-model="sentence-transformers/multi-qa-mpnet-base-dot-v1" data-task="sentence-similarity" data-type="mpnet" data-passcount="10" data-compatall="1" data-accall="1" data-bothall="1" data-hasacc="1"><td class="model-col child-name" title="sentence-transformers/multi-qa-mpnet-base-dot-v1">multi-qa-mpnet-base-dot-v1</td><td class="task-col">sentence-similarity</td><td data-col="dml/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Spearman Correlation" data-task="Sentence similarity / embeddings" data-logic="PASS if absolute delta &lt; 4.0" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.00&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="migraphx/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Spearman Correlation" data-task="Sentence similarity / embeddings" data-logic="PASS if absolute delta &lt; 4.0" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.00&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="mlas/cpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Spearman Correlation" data-task="Sentence similarity / embeddings" data-logic="PASS if absolute delta &lt; 4.0" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.00&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="openvino/npu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Spearman Correlation" data-task="Sentence similarity / embeddings" data-logic="PASS if absolute delta &lt; 4.0" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.08&quot;,&quot;best&quot;:true},{&quot;precision&quot;:&quot;w8a16&quot;,&quot;verdict&quot;:&quot;REGRESSION&quot;,&quot;delta&quot;:&quot;-72.71&quot;}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="openvino/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Spearman Correlation" data-task="Sentence similarity / embeddings" data-logic="PASS if absolute delta &lt; 4.0" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-0.00&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="openvino/cpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Spearman Correlation" data-task="Sentence similarity / embeddings" data-logic="PASS if absolute delta &lt; 4.0" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.00&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="qnn/npu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Spearman Correlation" data-task="Sentence similarity / embeddings" data-logic="PASS if absolute delta &lt; 4.0" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.15&quot;,&quot;best&quot;:true},{&quot;precision&quot;:&quot;w8a16&quot;,&quot;verdict&quot;:&quot;REGRESSION&quot;,&quot;delta&quot;:&quot;-60.73&quot;},{&quot;precision&quot;:&quot;w8a8&quot;,&quot;verdict&quot;:&quot;REGRESSION&quot;,&quot;delta&quot;:&quot;-71.65&quot;}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="qnn/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Spearman Correlation" data-task="Sentence similarity / embeddings" data-logic="PASS if absolute delta &lt; 4.0" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.00&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Spearman Correlation" data-task="Sentence similarity / embeddings" data-logic="PASS if absolute delta &lt; 4.0" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.00&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="vitisai/npu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Spearman Correlation" data-task="Sentence similarity / embeddings" data-logic="PASS if absolute delta &lt; 4.0" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-0.12&quot;,&quot;best&quot;:true},{&quot;precision&quot;:&quot;w8a16&quot;,&quot;verdict&quot;:&quot;REGRESSION&quot;,&quot;delta&quot;:&quot;-66.36&quot;},{&quot;precision&quot;:&quot;w8a8&quot;,&quot;verdict&quot;:&quot;REGRESSION&quot;,&quot;delta&quot;:&quot;-66.23&quot;}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td></tr>
+<tr class="child-row" data-group="sentence-transformers" data-model="sentence-transformers/paraphrase-multilingual-minilm-l12-v2" data-task="feature-extraction" data-type="bert" data-passcount="10" data-compatall="1" data-accall="1" data-bothall="1" data-hasacc="1"><td class="model-col child-name" title="sentence-transformers/paraphrase-multilingual-MiniLM-L12-v2">paraphrase-multilingual-MiniLM-L12-v2</td><td class="task-col">feature-extraction</td><td data-col="dml/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Spearman Correlation" data-task="Sentence similarity / embeddings" data-logic="PASS if absolute delta &lt; 4.0" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.00&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="migraphx/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Spearman Correlation" data-task="Sentence similarity / embeddings" data-logic="PASS if absolute delta &lt; 4.0" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.00&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="mlas/cpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Spearman Correlation" data-task="Sentence similarity / embeddings" data-logic="PASS if absolute delta &lt; 4.0" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.00&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="openvino/npu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Spearman Correlation" data-task="Sentence similarity / embeddings" data-logic="PASS if absolute delta &lt; 4.0" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.00&quot;,&quot;best&quot;:true},{&quot;precision&quot;:&quot;w8a16&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.08&quot;}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="openvino/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Spearman Correlation" data-task="Sentence similarity / embeddings" data-logic="PASS if absolute delta &lt; 4.0" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.00&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="openvino/cpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Spearman Correlation" data-task="Sentence similarity / embeddings" data-logic="PASS if absolute delta &lt; 4.0" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.00&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="qnn/npu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Spearman Correlation" data-task="Sentence similarity / embeddings" data-logic="PASS if absolute delta &lt; 4.0" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-0.04&quot;,&quot;best&quot;:true},{&quot;precision&quot;:&quot;w8a16&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.08&quot;},{&quot;precision&quot;:&quot;w8a8&quot;,&quot;verdict&quot;:&quot;REGRESSION&quot;,&quot;delta&quot;:&quot;-7.19&quot;}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="qnn/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Spearman Correlation" data-task="Sentence similarity / embeddings" data-logic="PASS if absolute delta &lt; 4.0" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.00&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Spearman Correlation" data-task="Sentence similarity / embeddings" data-logic="PASS if absolute delta &lt; 4.0" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.00&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="vitisai/npu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Spearman Correlation" data-task="Sentence similarity / embeddings" data-logic="PASS if absolute delta &lt; 4.0" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-0.19&quot;,&quot;best&quot;:true},{&quot;precision&quot;:&quot;w8a16&quot;,&quot;verdict&quot;:&quot;FAIL&quot;,&quot;delta&quot;:null},{&quot;precision&quot;:&quot;w8a8&quot;,&quot;verdict&quot;:&quot;REGRESSION&quot;,&quot;delta&quot;:&quot;-7.27&quot;}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td></tr>
+<tr class="child-row" data-group="sentence-transformers" data-model="sentence-transformers/paraphrase-multilingual-minilm-l12-v2" data-task="sentence-similarity" data-type="bert" data-passcount="10" data-compatall="1" data-accall="1" data-bothall="1" data-hasacc="1"><td class="model-col child-name" title="sentence-transformers/paraphrase-multilingual-MiniLM-L12-v2">paraphrase-multilingual-MiniLM-L12-v2</td><td class="task-col">sentence-similarity</td><td data-col="dml/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Spearman Correlation" data-task="Sentence similarity / embeddings" data-logic="PASS if absolute delta &lt; 4.0" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.00&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="migraphx/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Spearman Correlation" data-task="Sentence similarity / embeddings" data-logic="PASS if absolute delta &lt; 4.0" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.00&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="mlas/cpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Spearman Correlation" data-task="Sentence similarity / embeddings" data-logic="PASS if absolute delta &lt; 4.0" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.00&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="openvino/npu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Spearman Correlation" data-task="Sentence similarity / embeddings" data-logic="PASS if absolute delta &lt; 4.0" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.00&quot;,&quot;best&quot;:true},{&quot;precision&quot;:&quot;w8a16&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.08&quot;}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="openvino/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Spearman Correlation" data-task="Sentence similarity / embeddings" data-logic="PASS if absolute delta &lt; 4.0" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.00&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="openvino/cpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Spearman Correlation" data-task="Sentence similarity / embeddings" data-logic="PASS if absolute delta &lt; 4.0" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.00&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="qnn/npu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Spearman Correlation" data-task="Sentence similarity / embeddings" data-logic="PASS if absolute delta &lt; 4.0" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-0.04&quot;,&quot;best&quot;:true},{&quot;precision&quot;:&quot;w8a16&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.08&quot;},{&quot;precision&quot;:&quot;w8a8&quot;,&quot;verdict&quot;:&quot;REGRESSION&quot;,&quot;delta&quot;:&quot;-7.19&quot;}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="qnn/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Spearman Correlation" data-task="Sentence similarity / embeddings" data-logic="PASS if absolute delta &lt; 4.0" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.00&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Spearman Correlation" data-task="Sentence similarity / embeddings" data-logic="PASS if absolute delta &lt; 4.0" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.00&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="vitisai/npu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Spearman Correlation" data-task="Sentence similarity / embeddings" data-logic="PASS if absolute delta &lt; 4.0" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-0.19&quot;,&quot;best&quot;:true},{&quot;precision&quot;:&quot;w8a16&quot;,&quot;verdict&quot;:&quot;FAIL&quot;,&quot;delta&quot;:null},{&quot;precision&quot;:&quot;w8a8&quot;,&quot;verdict&quot;:&quot;REGRESSION&quot;,&quot;delta&quot;:&quot;-7.27&quot;}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td></tr>
+<tr class="child-row" data-group="sentence-transformers" data-model="sentence-transformers/paraphrase-multilingual-mpnet-base-v2" data-task="sentence-similarity" data-type="xlm-roberta" data-passcount="10" data-compatall="1" data-accall="1" data-bothall="1" data-hasacc="1"><td class="model-col child-name" title="sentence-transformers/paraphrase-multilingual-mpnet-base-v2">paraphrase-multilingual-mpnet-base-v2</td><td class="task-col">sentence-similarity</td><td data-col="dml/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Spearman Correlation" data-task="Sentence similarity / embeddings" data-logic="PASS if absolute delta &lt; 4.0" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.00&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="migraphx/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Spearman Correlation" data-task="Sentence similarity / embeddings" data-logic="PASS if absolute delta &lt; 4.0" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.00&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="mlas/cpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Spearman Correlation" data-task="Sentence similarity / embeddings" data-logic="PASS if absolute delta &lt; 4.0" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.00&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="openvino/npu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Spearman Correlation" data-task="Sentence similarity / embeddings" data-logic="PASS if absolute delta &lt; 4.0" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.00&quot;,&quot;best&quot;:true},{&quot;precision&quot;:&quot;w8a16&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.01&quot;}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="openvino/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Spearman Correlation" data-task="Sentence similarity / embeddings" data-logic="PASS if absolute delta &lt; 4.0" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.00&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="openvino/cpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Spearman Correlation" data-task="Sentence similarity / embeddings" data-logic="PASS if absolute delta &lt; 4.0" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.00&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="qnn/npu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Spearman Correlation" data-task="Sentence similarity / embeddings" data-logic="PASS if absolute delta &lt; 4.0" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-0.06&quot;,&quot;best&quot;:true},{&quot;precision&quot;:&quot;w8a16&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.01&quot;},{&quot;precision&quot;:&quot;w8a8&quot;,&quot;verdict&quot;:&quot;REGRESSION&quot;,&quot;delta&quot;:&quot;-5.60&quot;}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="qnn/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Spearman Correlation" data-task="Sentence similarity / embeddings" data-logic="PASS if absolute delta &lt; 4.0" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.00&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Spearman Correlation" data-task="Sentence similarity / embeddings" data-logic="PASS if absolute delta &lt; 4.0" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-0.00&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="vitisai/npu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Spearman Correlation" data-task="Sentence similarity / embeddings" data-logic="PASS if absolute delta &lt; 4.0" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.08&quot;,&quot;best&quot;:true},{&quot;precision&quot;:&quot;w8a16&quot;,&quot;verdict&quot;:&quot;REGRESSION&quot;,&quot;delta&quot;:&quot;-52.61&quot;},{&quot;precision&quot;:&quot;w8a8&quot;,&quot;verdict&quot;:&quot;REGRESSION&quot;,&quot;delta&quot;:&quot;-65.09&quot;}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td></tr>
+<tr class="child-row" data-group="sentence-transformers" data-model="sentence-transformers/all-mpnet-base-v2" data-task="fill-mask" data-type="mpnet" data-passcount="10" data-compatall="1" data-accall="0" data-bothall="0" data-hasacc="0"><td class="model-col child-name" title="sentence-transformers/all-mpnet-base-v2">all-mpnet-base-v2</td><td class="task-col">fill-mask</td><td data-col="dml/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="migraphx/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="mlas/cpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/npu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/cpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/npu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="vitisai/npu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td></tr>
+<tr class="child-row" data-group="sentence-transformers" data-model="sentence-transformers/multi-qa-mpnet-base-dot-v1" data-task="fill-mask" data-type="mpnet" data-passcount="10" data-compatall="1" data-accall="0" data-bothall="0" data-hasacc="0"><td class="model-col child-name" title="sentence-transformers/multi-qa-mpnet-base-dot-v1">multi-qa-mpnet-base-dot-v1</td><td class="task-col">fill-mask</td><td data-col="dml/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="migraphx/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="mlas/cpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/npu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/cpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/npu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="vitisai/npu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td></tr>
+<tr class="child-row" data-group="sentence-transformers" data-model="sentence-transformers/paraphrase-multilingual-mpnet-base-v2" data-task="feature-extraction" data-type="xlm-roberta" data-passcount="9" data-compatall="0" data-accall="0" data-bothall="0" data-hasacc="0"><td class="model-col child-name" title="sentence-transformers/paraphrase-multilingual-mpnet-base-v2">paraphrase-multilingual-mpnet-base-v2</td><td class="task-col">feature-extraction</td><td data-col="dml/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="migraphx/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="mlas/cpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/npu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/cpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/npu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="vitisai/npu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td></tr>
+<tr class="group-row" data-group="baai"><td class="model-col"><span class="group-toggle"><span class="twisty">▼</span><span class="group-name">BAAI</span></span></td><td class="task-col group-meta">6 models · 10 pairs</td><td data-col="dml/gpu"><span class="gcell split" title="Compatibility 10/10 pass · Accuracy 7/7 pass"><span class="half compat pass">10/10</span><span class="sep">|</span><span class="half acc pass">7/7</span></span></td><td data-col="migraphx/gpu"><span class="gcell split" title="Compatibility 10/10 pass · Accuracy 7/7 pass"><span class="half compat pass">10/10</span><span class="sep">|</span><span class="half acc pass">7/7</span></span></td><td data-col="mlas/cpu"><span class="gcell split" title="Compatibility 10/10 pass · Accuracy 7/7 pass"><span class="half compat pass">10/10</span><span class="sep">|</span><span class="half acc pass">7/7</span></span></td><td data-col="openvino/npu"><span class="gcell split" title="Compatibility 10/10 pass · Accuracy 7/7 pass"><span class="half compat pass">10/10</span><span class="sep">|</span><span class="half acc pass">7/7</span></span></td><td data-col="openvino/gpu"><span class="gcell split" title="Compatibility 10/10 pass · Accuracy 7/7 pass"><span class="half compat pass">10/10</span><span class="sep">|</span><span class="half acc pass">7/7</span></span></td><td data-col="openvino/cpu"><span class="gcell split" title="Compatibility 10/10 pass · Accuracy 7/7 pass"><span class="half compat pass">10/10</span><span class="sep">|</span><span class="half acc pass">7/7</span></span></td><td data-col="qnn/npu"><span class="gcell split" title="Compatibility 10/10 pass · Accuracy 7/7 pass"><span class="half compat pass">10/10</span><span class="sep">|</span><span class="half acc pass">7/7</span></span></td><td data-col="qnn/gpu"><span class="gcell split" title="Compatibility 10/10 pass · Accuracy 7/7 pass"><span class="half compat pass">10/10</span><span class="sep">|</span><span class="half acc pass">7/7</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="gcell split" title="Compatibility 10/10 pass · Accuracy 7/7 pass"><span class="half compat pass">10/10</span><span class="sep">|</span><span class="half acc pass">7/7</span></span></td><td data-col="vitisai/npu"><span class="gcell split" title="Compatibility 10/10 pass · Accuracy 7/7 pass"><span class="half compat pass">10/10</span><span class="sep">|</span><span class="half acc pass">7/7</span></span></td></tr>
+<tr class="child-row" data-group="baai" data-model="baai/bge-base-en-v1.5" data-task="feature-extraction" data-type="bert" data-passcount="10" data-compatall="1" data-accall="1" data-bothall="1" data-hasacc="1"><td class="model-col child-name" title="BAAI/bge-base-en-v1.5">bge-base-en-v1.5</td><td class="task-col">feature-extraction</td><td data-col="dml/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Spearman Correlation" data-task="Sentence similarity / embeddings" data-logic="PASS if absolute delta &lt; 4.0" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.00&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="migraphx/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Spearman Correlation" data-task="Sentence similarity / embeddings" data-logic="PASS if absolute delta &lt; 4.0" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.00&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="mlas/cpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Spearman Correlation" data-task="Sentence similarity / embeddings" data-logic="PASS if absolute delta &lt; 4.0" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.00&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="openvino/npu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Spearman Correlation" data-task="Sentence similarity / embeddings" data-logic="PASS if absolute delta &lt; 4.0" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.01&quot;,&quot;best&quot;:true},{&quot;precision&quot;:&quot;w8a16&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-0.07&quot;}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="openvino/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Spearman Correlation" data-task="Sentence similarity / embeddings" data-logic="PASS if absolute delta &lt; 4.0" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-0.00&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="openvino/cpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Spearman Correlation" data-task="Sentence similarity / embeddings" data-logic="PASS if absolute delta &lt; 4.0" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.00&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="qnn/npu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Spearman Correlation" data-task="Sentence similarity / embeddings" data-logic="PASS if absolute delta &lt; 4.0" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-0.06&quot;,&quot;best&quot;:true},{&quot;precision&quot;:&quot;w8a16&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-0.12&quot;},{&quot;precision&quot;:&quot;w8a8&quot;,&quot;verdict&quot;:&quot;REGRESSION&quot;,&quot;delta&quot;:&quot;-49.53&quot;}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="qnn/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Spearman Correlation" data-task="Sentence similarity / embeddings" data-logic="PASS if absolute delta &lt; 4.0" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.00&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Spearman Correlation" data-task="Sentence similarity / embeddings" data-logic="PASS if absolute delta &lt; 4.0" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.00&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="vitisai/npu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Spearman Correlation" data-task="Sentence similarity / embeddings" data-logic="PASS if absolute delta &lt; 4.0" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-0.00&quot;,&quot;best&quot;:true},{&quot;precision&quot;:&quot;w8a16&quot;,&quot;verdict&quot;:&quot;FAIL&quot;,&quot;delta&quot;:null},{&quot;precision&quot;:&quot;w8a8&quot;,&quot;verdict&quot;:&quot;REGRESSION&quot;,&quot;delta&quot;:&quot;-43.44&quot;}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td></tr>
+<tr class="child-row" data-group="baai" data-model="baai/bge-base-en-v1.5" data-task="sentence-similarity" data-type="bert" data-passcount="10" data-compatall="1" data-accall="1" data-bothall="1" data-hasacc="1"><td class="model-col child-name" title="BAAI/bge-base-en-v1.5">bge-base-en-v1.5</td><td class="task-col">sentence-similarity</td><td data-col="dml/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Spearman Correlation" data-task="Sentence similarity / embeddings" data-logic="PASS if absolute delta &lt; 4.0" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.00&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="migraphx/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Spearman Correlation" data-task="Sentence similarity / embeddings" data-logic="PASS if absolute delta &lt; 4.0" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.00&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="mlas/cpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Spearman Correlation" data-task="Sentence similarity / embeddings" data-logic="PASS if absolute delta &lt; 4.0" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.00&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="openvino/npu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Spearman Correlation" data-task="Sentence similarity / embeddings" data-logic="PASS if absolute delta &lt; 4.0" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.01&quot;,&quot;best&quot;:true},{&quot;precision&quot;:&quot;w8a16&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-0.07&quot;}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="openvino/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Spearman Correlation" data-task="Sentence similarity / embeddings" data-logic="PASS if absolute delta &lt; 4.0" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-0.00&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="openvino/cpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Spearman Correlation" data-task="Sentence similarity / embeddings" data-logic="PASS if absolute delta &lt; 4.0" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.00&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="qnn/npu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Spearman Correlation" data-task="Sentence similarity / embeddings" data-logic="PASS if absolute delta &lt; 4.0" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-0.06&quot;,&quot;best&quot;:true},{&quot;precision&quot;:&quot;w8a16&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-0.12&quot;},{&quot;precision&quot;:&quot;w8a8&quot;,&quot;verdict&quot;:&quot;REGRESSION&quot;,&quot;delta&quot;:&quot;-49.53&quot;}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="qnn/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Spearman Correlation" data-task="Sentence similarity / embeddings" data-logic="PASS if absolute delta &lt; 4.0" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.00&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Spearman Correlation" data-task="Sentence similarity / embeddings" data-logic="PASS if absolute delta &lt; 4.0" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.00&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="vitisai/npu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Spearman Correlation" data-task="Sentence similarity / embeddings" data-logic="PASS if absolute delta &lt; 4.0" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-0.00&quot;,&quot;best&quot;:true},{&quot;precision&quot;:&quot;w8a16&quot;,&quot;verdict&quot;:&quot;FAIL&quot;,&quot;delta&quot;:null},{&quot;precision&quot;:&quot;w8a8&quot;,&quot;verdict&quot;:&quot;REGRESSION&quot;,&quot;delta&quot;:&quot;-43.44&quot;}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td></tr>
+<tr class="child-row" data-group="baai" data-model="baai/bge-large-en-v1.5" data-task="sentence-similarity" data-type="bert" data-passcount="10" data-compatall="1" data-accall="1" data-bothall="1" data-hasacc="1"><td class="model-col child-name" title="BAAI/bge-large-en-v1.5">bge-large-en-v1.5</td><td class="task-col">sentence-similarity</td><td data-col="dml/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Spearman Correlation" data-task="Sentence similarity / embeddings" data-logic="PASS if absolute delta &lt; 4.0" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.00&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="migraphx/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Spearman Correlation" data-task="Sentence similarity / embeddings" data-logic="PASS if absolute delta &lt; 4.0" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.00&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="mlas/cpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Spearman Correlation" data-task="Sentence similarity / embeddings" data-logic="PASS if absolute delta &lt; 4.0" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.00&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="openvino/npu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Spearman Correlation" data-task="Sentence similarity / embeddings" data-logic="PASS if absolute delta &lt; 4.0" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-0.02&quot;,&quot;best&quot;:true},{&quot;precision&quot;:&quot;w8a16&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-0.32&quot;}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="openvino/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Spearman Correlation" data-task="Sentence similarity / embeddings" data-logic="PASS if absolute delta &lt; 4.0" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.00&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="openvino/cpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Spearman Correlation" data-task="Sentence similarity / embeddings" data-logic="PASS if absolute delta &lt; 4.0" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.00&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="qnn/npu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Spearman Correlation" data-task="Sentence similarity / embeddings" data-logic="PASS if absolute delta &lt; 4.0" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.01&quot;,&quot;best&quot;:true},{&quot;precision&quot;:&quot;w8a16&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-0.32&quot;},{&quot;precision&quot;:&quot;w8a8&quot;,&quot;verdict&quot;:&quot;REGRESSION&quot;,&quot;delta&quot;:&quot;-69.64&quot;}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="qnn/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Spearman Correlation" data-task="Sentence similarity / embeddings" data-logic="PASS if absolute delta &lt; 4.0" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.00&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Spearman Correlation" data-task="Sentence similarity / embeddings" data-logic="PASS if absolute delta &lt; 4.0" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.00&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="vitisai/npu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Spearman Correlation" data-task="Sentence similarity / embeddings" data-logic="PASS if absolute delta &lt; 4.0" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-0.12&quot;,&quot;best&quot;:true},{&quot;precision&quot;:&quot;w8a16&quot;,&quot;verdict&quot;:&quot;REGRESSION&quot;,&quot;delta&quot;:&quot;-83.10&quot;},{&quot;precision&quot;:&quot;w8a8&quot;,&quot;verdict&quot;:&quot;REGRESSION&quot;,&quot;delta&quot;:&quot;-79.58&quot;}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td></tr>
+<tr class="child-row" data-group="baai" data-model="baai/bge-m3" data-task="feature-extraction" data-type="xlm-roberta" data-passcount="10" data-compatall="1" data-accall="1" data-bothall="1" data-hasacc="1"><td class="model-col child-name" title="BAAI/bge-m3">bge-m3</td><td class="task-col">feature-extraction</td><td data-col="dml/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Spearman Correlation" data-task="Sentence similarity / embeddings" data-logic="PASS if absolute delta &lt; 4.0" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+2.70&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="migraphx/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Spearman Correlation" data-task="Sentence similarity / embeddings" data-logic="PASS if absolute delta &lt; 4.0" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+2.70&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="mlas/cpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Spearman Correlation" data-task="Sentence similarity / embeddings" data-logic="PASS if absolute delta &lt; 4.0" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+2.70&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="openvino/npu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Spearman Correlation" data-task="Sentence similarity / embeddings" data-logic="PASS if absolute delta &lt; 4.0" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+2.72&quot;,&quot;best&quot;:true},{&quot;precision&quot;:&quot;w8a16&quot;,&quot;verdict&quot;:&quot;REGRESSION&quot;,&quot;delta&quot;:&quot;-81.28&quot;}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="openvino/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Spearman Correlation" data-task="Sentence similarity / embeddings" data-logic="PASS if absolute delta &lt; 4.0" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+2.70&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="openvino/cpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Spearman Correlation" data-task="Sentence similarity / embeddings" data-logic="PASS if absolute delta &lt; 4.0" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+2.70&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="qnn/npu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Spearman Correlation" data-task="Sentence similarity / embeddings" data-logic="PASS if absolute delta &lt; 4.0" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+2.67&quot;,&quot;best&quot;:true},{&quot;precision&quot;:&quot;w8a16&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+2.71&quot;},{&quot;precision&quot;:&quot;w8a8&quot;,&quot;verdict&quot;:&quot;REGRESSION&quot;,&quot;delta&quot;:&quot;-68.99&quot;}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="qnn/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Spearman Correlation" data-task="Sentence similarity / embeddings" data-logic="PASS if absolute delta &lt; 4.0" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+2.70&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Spearman Correlation" data-task="Sentence similarity / embeddings" data-logic="PASS if absolute delta &lt; 4.0" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+2.70&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="vitisai/npu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Spearman Correlation" data-task="Sentence similarity / embeddings" data-logic="PASS if absolute delta &lt; 4.0" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+2.82&quot;,&quot;best&quot;:true},{&quot;precision&quot;:&quot;w8a16&quot;,&quot;verdict&quot;:&quot;REGRESSION&quot;,&quot;delta&quot;:&quot;-82.15&quot;},{&quot;precision&quot;:&quot;w8a8&quot;,&quot;verdict&quot;:&quot;REGRESSION&quot;,&quot;delta&quot;:&quot;-93.63&quot;}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td></tr>
+<tr class="child-row" data-group="baai" data-model="baai/bge-m3" data-task="sentence-similarity" data-type="xlm-roberta" data-passcount="10" data-compatall="1" data-accall="1" data-bothall="1" data-hasacc="1"><td class="model-col child-name" title="BAAI/bge-m3">bge-m3</td><td class="task-col">sentence-similarity</td><td data-col="dml/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Spearman Correlation" data-task="Sentence similarity / embeddings" data-logic="PASS if absolute delta &lt; 4.0" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+2.70&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="migraphx/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Spearman Correlation" data-task="Sentence similarity / embeddings" data-logic="PASS if absolute delta &lt; 4.0" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+2.70&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="mlas/cpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Spearman Correlation" data-task="Sentence similarity / embeddings" data-logic="PASS if absolute delta &lt; 4.0" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+2.70&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="openvino/npu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Spearman Correlation" data-task="Sentence similarity / embeddings" data-logic="PASS if absolute delta &lt; 4.0" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+2.72&quot;,&quot;best&quot;:true},{&quot;precision&quot;:&quot;w8a16&quot;,&quot;verdict&quot;:&quot;REGRESSION&quot;,&quot;delta&quot;:&quot;-81.28&quot;}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="openvino/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Spearman Correlation" data-task="Sentence similarity / embeddings" data-logic="PASS if absolute delta &lt; 4.0" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+2.70&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="openvino/cpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Spearman Correlation" data-task="Sentence similarity / embeddings" data-logic="PASS if absolute delta &lt; 4.0" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+2.70&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="qnn/npu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Spearman Correlation" data-task="Sentence similarity / embeddings" data-logic="PASS if absolute delta &lt; 4.0" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+2.67&quot;,&quot;best&quot;:true},{&quot;precision&quot;:&quot;w8a16&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+2.71&quot;},{&quot;precision&quot;:&quot;w8a8&quot;,&quot;verdict&quot;:&quot;REGRESSION&quot;,&quot;delta&quot;:&quot;-68.99&quot;}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="qnn/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Spearman Correlation" data-task="Sentence similarity / embeddings" data-logic="PASS if absolute delta &lt; 4.0" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+2.70&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Spearman Correlation" data-task="Sentence similarity / embeddings" data-logic="PASS if absolute delta &lt; 4.0" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+2.70&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="vitisai/npu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Spearman Correlation" data-task="Sentence similarity / embeddings" data-logic="PASS if absolute delta &lt; 4.0" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+2.82&quot;,&quot;best&quot;:true},{&quot;precision&quot;:&quot;w8a16&quot;,&quot;verdict&quot;:&quot;REGRESSION&quot;,&quot;delta&quot;:&quot;-82.15&quot;},{&quot;precision&quot;:&quot;w8a8&quot;,&quot;verdict&quot;:&quot;REGRESSION&quot;,&quot;delta&quot;:&quot;-93.63&quot;}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td></tr>
+<tr class="child-row" data-group="baai" data-model="baai/bge-small-en-v1.5" data-task="feature-extraction" data-type="bert" data-passcount="10" data-compatall="1" data-accall="1" data-bothall="1" data-hasacc="1"><td class="model-col child-name" title="BAAI/bge-small-en-v1.5">bge-small-en-v1.5</td><td class="task-col">feature-extraction</td><td data-col="dml/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Spearman Correlation" data-task="Sentence similarity / embeddings" data-logic="PASS if absolute delta &lt; 4.0" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.00&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="migraphx/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Spearman Correlation" data-task="Sentence similarity / embeddings" data-logic="PASS if absolute delta &lt; 4.0" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.00&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="mlas/cpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Spearman Correlation" data-task="Sentence similarity / embeddings" data-logic="PASS if absolute delta &lt; 4.0" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.00&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="openvino/npu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Spearman Correlation" data-task="Sentence similarity / embeddings" data-logic="PASS if absolute delta &lt; 4.0" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-0.00&quot;,&quot;best&quot;:true},{&quot;precision&quot;:&quot;w8a16&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.06&quot;}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="openvino/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Spearman Correlation" data-task="Sentence similarity / embeddings" data-logic="PASS if absolute delta &lt; 4.0" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-0.00&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="openvino/cpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Spearman Correlation" data-task="Sentence similarity / embeddings" data-logic="PASS if absolute delta &lt; 4.0" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.00&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="qnn/npu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Spearman Correlation" data-task="Sentence similarity / embeddings" data-logic="PASS if absolute delta &lt; 4.0" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-0.14&quot;,&quot;best&quot;:true},{&quot;precision&quot;:&quot;w8a16&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.00&quot;},{&quot;precision&quot;:&quot;w8a8&quot;,&quot;verdict&quot;:&quot;REGRESSION&quot;,&quot;delta&quot;:&quot;-13.78&quot;}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="qnn/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Spearman Correlation" data-task="Sentence similarity / embeddings" data-logic="PASS if absolute delta &lt; 4.0" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.00&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Spearman Correlation" data-task="Sentence similarity / embeddings" data-logic="PASS if absolute delta &lt; 4.0" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-0.00&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="vitisai/npu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Spearman Correlation" data-task="Sentence similarity / embeddings" data-logic="PASS if absolute delta &lt; 4.0" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-0.11&quot;,&quot;best&quot;:true},{&quot;precision&quot;:&quot;w8a16&quot;,&quot;verdict&quot;:&quot;FAIL&quot;,&quot;delta&quot;:null},{&quot;precision&quot;:&quot;w8a8&quot;,&quot;verdict&quot;:&quot;REGRESSION&quot;,&quot;delta&quot;:&quot;-12.74&quot;}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td></tr>
+<tr class="child-row" data-group="baai" data-model="baai/bge-small-en-v1.5" data-task="sentence-similarity" data-type="bert" data-passcount="10" data-compatall="1" data-accall="1" data-bothall="1" data-hasacc="1"><td class="model-col child-name" title="BAAI/bge-small-en-v1.5">bge-small-en-v1.5</td><td class="task-col">sentence-similarity</td><td data-col="dml/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Spearman Correlation" data-task="Sentence similarity / embeddings" data-logic="PASS if absolute delta &lt; 4.0" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.00&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="migraphx/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Spearman Correlation" data-task="Sentence similarity / embeddings" data-logic="PASS if absolute delta &lt; 4.0" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.00&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="mlas/cpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Spearman Correlation" data-task="Sentence similarity / embeddings" data-logic="PASS if absolute delta &lt; 4.0" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.00&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="openvino/npu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Spearman Correlation" data-task="Sentence similarity / embeddings" data-logic="PASS if absolute delta &lt; 4.0" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.00&quot;,&quot;best&quot;:true},{&quot;precision&quot;:&quot;w8a16&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.06&quot;}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="openvino/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Spearman Correlation" data-task="Sentence similarity / embeddings" data-logic="PASS if absolute delta &lt; 4.0" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-0.00&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="openvino/cpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Spearman Correlation" data-task="Sentence similarity / embeddings" data-logic="PASS if absolute delta &lt; 4.0" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.00&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="qnn/npu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Spearman Correlation" data-task="Sentence similarity / embeddings" data-logic="PASS if absolute delta &lt; 4.0" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-0.14&quot;,&quot;best&quot;:true},{&quot;precision&quot;:&quot;w8a16&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.00&quot;},{&quot;precision&quot;:&quot;w8a8&quot;,&quot;verdict&quot;:&quot;FAIL&quot;,&quot;delta&quot;:null}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="qnn/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Spearman Correlation" data-task="Sentence similarity / embeddings" data-logic="PASS if absolute delta &lt; 4.0" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.00&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Spearman Correlation" data-task="Sentence similarity / embeddings" data-logic="PASS if absolute delta &lt; 4.0" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-0.00&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="vitisai/npu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Spearman Correlation" data-task="Sentence similarity / embeddings" data-logic="PASS if absolute delta &lt; 4.0" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-0.11&quot;,&quot;best&quot;:true},{&quot;precision&quot;:&quot;w8a16&quot;,&quot;verdict&quot;:&quot;FAIL&quot;,&quot;delta&quot;:null},{&quot;precision&quot;:&quot;w8a8&quot;,&quot;verdict&quot;:&quot;REGRESSION&quot;,&quot;delta&quot;:&quot;-12.74&quot;}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td></tr>
+<tr class="child-row" data-group="baai" data-model="baai/bge-large-en-v1.5" data-task="feature-extraction" data-type="bert" data-passcount="10" data-compatall="1" data-accall="0" data-bothall="0" data-hasacc="0"><td class="model-col child-name" title="BAAI/bge-large-en-v1.5">bge-large-en-v1.5</td><td class="task-col">feature-extraction</td><td data-col="dml/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="migraphx/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="mlas/cpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/npu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/cpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/npu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="vitisai/npu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td></tr>
+<tr class="child-row" data-group="baai" data-model="baai/bge-reranker-base" data-task="text-classification" data-type="xlm-roberta" data-passcount="10" data-compatall="1" data-accall="0" data-bothall="0" data-hasacc="0"><td class="model-col child-name" title="BAAI/bge-reranker-base">bge-reranker-base</td><td class="task-col">text-classification</td><td data-col="dml/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="migraphx/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="mlas/cpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/npu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/cpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/npu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="vitisai/npu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td></tr>
+<tr class="child-row" data-group="baai" data-model="baai/bge-reranker-v2-m3" data-task="text-classification" data-type="xlm-roberta" data-passcount="10" data-compatall="1" data-accall="0" data-bothall="0" data-hasacc="0"><td class="model-col child-name" title="BAAI/bge-reranker-v2-m3">bge-reranker-v2-m3</td><td class="task-col">text-classification</td><td data-col="dml/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="migraphx/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="mlas/cpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/npu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/cpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/npu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="vitisai/npu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td></tr>
+<tr class="group-row" data-group="google-bert"><td class="model-col"><span class="group-toggle"><span class="twisty">▼</span><span class="group-name">google-bert</span></span></td><td class="task-col group-meta">4 models · 6 pairs</td><td data-col="dml/gpu"><span class="gcell split" title="Compatibility 6/6 pass · Accuracy 5/5 pass"><span class="half compat pass">6/6</span><span class="sep">|</span><span class="half acc pass">5/5</span></span></td><td data-col="migraphx/gpu"><span class="gcell split" title="Compatibility 6/6 pass · Accuracy 5/5 pass"><span class="half compat pass">6/6</span><span class="sep">|</span><span class="half acc pass">5/5</span></span></td><td data-col="mlas/cpu"><span class="gcell split" title="Compatibility 6/6 pass · Accuracy 5/5 pass"><span class="half compat pass">6/6</span><span class="sep">|</span><span class="half acc pass">5/5</span></span></td><td data-col="openvino/npu"><span class="gcell split" title="Compatibility 6/6 pass · Accuracy 5/5 pass"><span class="half compat pass">6/6</span><span class="sep">|</span><span class="half acc pass">5/5</span></span></td><td data-col="openvino/gpu"><span class="gcell split" title="Compatibility 6/6 pass · Accuracy 5/5 pass"><span class="half compat pass">6/6</span><span class="sep">|</span><span class="half acc pass">5/5</span></span></td><td data-col="openvino/cpu"><span class="gcell split" title="Compatibility 6/6 pass · Accuracy 5/5 pass"><span class="half compat pass">6/6</span><span class="sep">|</span><span class="half acc pass">5/5</span></span></td><td data-col="qnn/npu"><span class="gcell split" title="Compatibility 6/6 pass · Accuracy 5/5 pass"><span class="half compat pass">6/6</span><span class="sep">|</span><span class="half acc pass">5/5</span></span></td><td data-col="qnn/gpu"><span class="gcell split" title="Compatibility 6/6 pass · Accuracy 5/5 pass"><span class="half compat pass">6/6</span><span class="sep">|</span><span class="half acc pass">5/5</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="gcell split" title="Compatibility 6/6 pass · Accuracy 5/5 pass"><span class="half compat pass">6/6</span><span class="sep">|</span><span class="half acc pass">5/5</span></span></td><td data-col="vitisai/npu"><span class="gcell split" title="Compatibility 6/6 pass · Accuracy 5/5 pass"><span class="half compat pass">6/6</span><span class="sep">|</span><span class="half acc pass">5/5</span></span></td></tr>
+<tr class="child-row" data-group="google-bert" data-model="google-bert/bert-base-multilingual-cased" data-task="feature-extraction" data-type="bert" data-passcount="10" data-compatall="1" data-accall="1" data-bothall="1" data-hasacc="1"><td class="model-col child-name" title="google-bert/bert-base-multilingual-cased">bert-base-multilingual-cased</td><td class="task-col">feature-extraction</td><td data-col="dml/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Spearman Correlation" data-task="Sentence similarity / embeddings" data-logic="PASS if absolute delta &lt; 4.0" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-0.00&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="migraphx/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Spearman Correlation" data-task="Sentence similarity / embeddings" data-logic="PASS if absolute delta &lt; 4.0" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-0.00&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="mlas/cpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Spearman Correlation" data-task="Sentence similarity / embeddings" data-logic="PASS if absolute delta &lt; 4.0" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-0.00&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="openvino/npu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Spearman Correlation" data-task="Sentence similarity / embeddings" data-logic="PASS if absolute delta &lt; 4.0" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.05&quot;,&quot;best&quot;:true},{&quot;precision&quot;:&quot;w8a16&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.43&quot;}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="openvino/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Spearman Correlation" data-task="Sentence similarity / embeddings" data-logic="PASS if absolute delta &lt; 4.0" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.00&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="openvino/cpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Spearman Correlation" data-task="Sentence similarity / embeddings" data-logic="PASS if absolute delta &lt; 4.0" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-0.00&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="qnn/npu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Spearman Correlation" data-task="Sentence similarity / embeddings" data-logic="PASS if absolute delta &lt; 4.0" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.00&quot;,&quot;best&quot;:true},{&quot;precision&quot;:&quot;w8a16&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-0.43&quot;},{&quot;precision&quot;:&quot;w8a8&quot;,&quot;verdict&quot;:&quot;REGRESSION&quot;,&quot;delta&quot;:&quot;-33.37&quot;}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="qnn/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Spearman Correlation" data-task="Sentence similarity / embeddings" data-logic="PASS if absolute delta &lt; 4.0" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-0.00&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Spearman Correlation" data-task="Sentence similarity / embeddings" data-logic="PASS if absolute delta &lt; 4.0" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-0.00&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="vitisai/npu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Spearman Correlation" data-task="Sentence similarity / embeddings" data-logic="PASS if absolute delta &lt; 4.0" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-0.21&quot;,&quot;best&quot;:true},{&quot;precision&quot;:&quot;w8a16&quot;,&quot;verdict&quot;:&quot;FAIL&quot;,&quot;delta&quot;:null},{&quot;precision&quot;:&quot;w8a8&quot;,&quot;verdict&quot;:&quot;REGRESSION&quot;,&quot;delta&quot;:&quot;-31.98&quot;}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td></tr>
+<tr class="child-row" data-group="google-bert" data-model="google-bert/bert-base-multilingual-cased" data-task="fill-mask" data-type="bert" data-passcount="10" data-compatall="1" data-accall="1" data-bothall="1" data-hasacc="1"><td class="model-col child-name" title="google-bert/bert-base-multilingual-cased">bert-base-multilingual-cased</td><td class="task-col">fill-mask</td><td data-col="dml/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Pseudo-Perplexity" data-task="Masked language modeling" data-logic="PASS if delta &lt; 10% (lower metric is better)" data-lowerbetter="1" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="migraphx/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Pseudo-Perplexity" data-task="Masked language modeling" data-logic="PASS if delta &lt; 10% (lower metric is better)" data-lowerbetter="1" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="mlas/cpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Pseudo-Perplexity" data-task="Masked language modeling" data-logic="PASS if delta &lt; 10% (lower metric is better)" data-lowerbetter="1" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="openvino/npu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Pseudo-Perplexity" data-task="Masked language modeling" data-logic="PASS if delta &lt; 10% (lower metric is better)" data-lowerbetter="1" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true},{&quot;precision&quot;:&quot;w8a16&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+9.5%&quot;}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="openvino/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Pseudo-Perplexity" data-task="Masked language modeling" data-logic="PASS if delta &lt; 10% (lower metric is better)" data-lowerbetter="1" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="openvino/cpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Pseudo-Perplexity" data-task="Masked language modeling" data-logic="PASS if delta &lt; 10% (lower metric is better)" data-lowerbetter="1" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="qnn/npu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Pseudo-Perplexity" data-task="Masked language modeling" data-logic="PASS if delta &lt; 10% (lower metric is better)" data-lowerbetter="1" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.1%&quot;,&quot;best&quot;:true},{&quot;precision&quot;:&quot;w8a16&quot;,&quot;verdict&quot;:&quot;REGRESSION&quot;,&quot;delta&quot;:&quot;+10.5%&quot;},{&quot;precision&quot;:&quot;w8a8&quot;,&quot;verdict&quot;:&quot;REGRESSION&quot;,&quot;delta&quot;:&quot;diverged&quot;}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="qnn/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Pseudo-Perplexity" data-task="Masked language modeling" data-logic="PASS if delta &lt; 10% (lower metric is better)" data-lowerbetter="1" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Pseudo-Perplexity" data-task="Masked language modeling" data-logic="PASS if delta &lt; 10% (lower metric is better)" data-lowerbetter="1" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="vitisai/npu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Pseudo-Perplexity" data-task="Masked language modeling" data-logic="PASS if delta &lt; 10% (lower metric is better)" data-lowerbetter="1" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+1.0%&quot;,&quot;best&quot;:true},{&quot;precision&quot;:&quot;w8a16&quot;,&quot;verdict&quot;:&quot;REGRESSION&quot;,&quot;delta&quot;:&quot;diverged&quot;},{&quot;precision&quot;:&quot;w8a8&quot;,&quot;verdict&quot;:&quot;REGRESSION&quot;,&quot;delta&quot;:&quot;diverged&quot;}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td></tr>
+<tr class="child-row" data-group="google-bert" data-model="google-bert/bert-base-multilingual-uncased" data-task="fill-mask" data-type="bert" data-passcount="10" data-compatall="1" data-accall="1" data-bothall="1" data-hasacc="1"><td class="model-col child-name" title="google-bert/bert-base-multilingual-uncased">bert-base-multilingual-uncased</td><td class="task-col">fill-mask</td><td data-col="dml/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Pseudo-Perplexity" data-task="Masked language modeling" data-logic="PASS if delta &lt; 10% (lower metric is better)" data-lowerbetter="1" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="migraphx/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Pseudo-Perplexity" data-task="Masked language modeling" data-logic="PASS if delta &lt; 10% (lower metric is better)" data-lowerbetter="1" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="mlas/cpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Pseudo-Perplexity" data-task="Masked language modeling" data-logic="PASS if delta &lt; 10% (lower metric is better)" data-lowerbetter="1" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="openvino/npu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Pseudo-Perplexity" data-task="Masked language modeling" data-logic="PASS if delta &lt; 10% (lower metric is better)" data-lowerbetter="1" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-0.0%&quot;,&quot;best&quot;:true},{&quot;precision&quot;:&quot;w8a16&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+4.1%&quot;}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="openvino/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Pseudo-Perplexity" data-task="Masked language modeling" data-logic="PASS if delta &lt; 10% (lower metric is better)" data-lowerbetter="1" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="openvino/cpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Pseudo-Perplexity" data-task="Masked language modeling" data-logic="PASS if delta &lt; 10% (lower metric is better)" data-lowerbetter="1" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="qnn/npu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Pseudo-Perplexity" data-task="Masked language modeling" data-logic="PASS if delta &lt; 10% (lower metric is better)" data-lowerbetter="1" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-0.0%&quot;,&quot;best&quot;:true},{&quot;precision&quot;:&quot;w8a16&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+4.1%&quot;},{&quot;precision&quot;:&quot;w8a8&quot;,&quot;verdict&quot;:&quot;REGRESSION&quot;,&quot;delta&quot;:&quot;diverged&quot;}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="qnn/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Pseudo-Perplexity" data-task="Masked language modeling" data-logic="PASS if delta &lt; 10% (lower metric is better)" data-lowerbetter="1" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Pseudo-Perplexity" data-task="Masked language modeling" data-logic="PASS if delta &lt; 10% (lower metric is better)" data-lowerbetter="1" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="vitisai/npu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Pseudo-Perplexity" data-task="Masked language modeling" data-logic="PASS if delta &lt; 10% (lower metric is better)" data-lowerbetter="1" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.2%&quot;,&quot;best&quot;:true},{&quot;precision&quot;:&quot;w8a16&quot;,&quot;verdict&quot;:&quot;REGRESSION&quot;,&quot;delta&quot;:&quot;diverged&quot;},{&quot;precision&quot;:&quot;w8a8&quot;,&quot;verdict&quot;:&quot;REGRESSION&quot;,&quot;delta&quot;:&quot;diverged&quot;}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td></tr>
+<tr class="child-row" data-group="google-bert" data-model="google-bert/bert-base-uncased" data-task="fill-mask" data-type="bert" data-passcount="10" data-compatall="1" data-accall="1" data-bothall="1" data-hasacc="1"><td class="model-col child-name" title="google-bert/bert-base-uncased">bert-base-uncased</td><td class="task-col">fill-mask</td><td data-col="dml/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Pseudo-Perplexity" data-task="Masked language modeling" data-logic="PASS if delta &lt; 10% (lower metric is better)" data-lowerbetter="1" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="migraphx/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Pseudo-Perplexity" data-task="Masked language modeling" data-logic="PASS if delta &lt; 10% (lower metric is better)" data-lowerbetter="1" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="mlas/cpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Pseudo-Perplexity" data-task="Masked language modeling" data-logic="PASS if delta &lt; 10% (lower metric is better)" data-lowerbetter="1" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="openvino/npu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Pseudo-Perplexity" data-task="Masked language modeling" data-logic="PASS if delta &lt; 10% (lower metric is better)" data-lowerbetter="1" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-0.0%&quot;,&quot;best&quot;:true},{&quot;precision&quot;:&quot;w8a16&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+1.2%&quot;}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="openvino/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Pseudo-Perplexity" data-task="Masked language modeling" data-logic="PASS if delta &lt; 10% (lower metric is better)" data-lowerbetter="1" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="openvino/cpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Pseudo-Perplexity" data-task="Masked language modeling" data-logic="PASS if delta &lt; 10% (lower metric is better)" data-lowerbetter="1" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="qnn/npu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Pseudo-Perplexity" data-task="Masked language modeling" data-logic="PASS if delta &lt; 10% (lower metric is better)" data-lowerbetter="1" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-0.1%&quot;,&quot;best&quot;:true},{&quot;precision&quot;:&quot;w8a16&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+1.3%&quot;},{&quot;precision&quot;:&quot;w8a8&quot;,&quot;verdict&quot;:&quot;REGRESSION&quot;,&quot;delta&quot;:&quot;diverged&quot;}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="qnn/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Pseudo-Perplexity" data-task="Masked language modeling" data-logic="PASS if delta &lt; 10% (lower metric is better)" data-lowerbetter="1" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Pseudo-Perplexity" data-task="Masked language modeling" data-logic="PASS if delta &lt; 10% (lower metric is better)" data-lowerbetter="1" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="vitisai/npu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Pseudo-Perplexity" data-task="Masked language modeling" data-logic="PASS if delta &lt; 10% (lower metric is better)" data-lowerbetter="1" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.1%&quot;,&quot;best&quot;:true},{&quot;precision&quot;:&quot;w8a16&quot;,&quot;verdict&quot;:&quot;REGRESSION&quot;,&quot;delta&quot;:&quot;diverged&quot;},{&quot;precision&quot;:&quot;w8a8&quot;,&quot;verdict&quot;:&quot;REGRESSION&quot;,&quot;delta&quot;:&quot;diverged&quot;}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td></tr>
+<tr class="child-row" data-group="google-bert" data-model="google-bert/bert-large-uncased-whole-word-masking-finetuned-squad" data-task="question-answering" data-type="bert" data-passcount="10" data-compatall="1" data-accall="1" data-bothall="1" data-hasacc="1"><td class="model-col child-name" title="google-bert/bert-large-uncased-whole-word-masking-finetuned-squad">bert-large-uncased-whole-word-masking-finetuned-squad</td><td class="task-col">question-answering</td><td data-col="dml/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="F1 Score" data-task="Question answering" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="migraphx/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="F1 Score" data-task="Question answering" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.1%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="mlas/cpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="F1 Score" data-task="Question answering" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.1%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="openvino/npu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="F1 Score" data-task="Question answering" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true},{&quot;precision&quot;:&quot;w8a16&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-0.1%&quot;}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="openvino/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="F1 Score" data-task="Question answering" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.1%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="openvino/cpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="F1 Score" data-task="Question answering" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.1%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="qnn/npu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="F1 Score" data-task="Question answering" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true},{&quot;precision&quot;:&quot;w8a16&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-8.7%&quot;},{&quot;precision&quot;:&quot;w8a8&quot;,&quot;verdict&quot;:&quot;REGRESSION&quot;,&quot;delta&quot;:&quot;-16.8%&quot;}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="qnn/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="F1 Score" data-task="Question answering" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.1%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="F1 Score" data-task="Question answering" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.1%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="vitisai/npu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="F1 Score" data-task="Question answering" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.1%&quot;,&quot;best&quot;:true},{&quot;precision&quot;:&quot;w8a16&quot;,&quot;verdict&quot;:&quot;REGRESSION&quot;,&quot;delta&quot;:&quot;-92.1%&quot;},{&quot;precision&quot;:&quot;w8a8&quot;,&quot;verdict&quot;:&quot;REGRESSION&quot;,&quot;delta&quot;:&quot;-92.8%&quot;}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td></tr>
+<tr class="child-row" data-group="google-bert" data-model="google-bert/bert-base-multilingual-cased" data-task="masked-lm" data-type="bert" data-passcount="10" data-compatall="1" data-accall="0" data-bothall="0" data-hasacc="0"><td class="model-col child-name" title="google-bert/bert-base-multilingual-cased">bert-base-multilingual-cased</td><td class="task-col">masked-lm</td><td data-col="dml/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="migraphx/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="mlas/cpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/npu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/cpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/npu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="vitisai/npu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td></tr>
+<tr class="group-row" data-group="facebook"><td class="model-col"><span class="group-toggle"><span class="twisty">▼</span><span class="group-name">facebook</span></span></td><td class="task-col group-meta">19 models · 21 pairs</td><td data-col="dml/gpu"><span class="gcell split" title="Compatibility 17/21 pass · Accuracy 6/6 pass"><span class="half compat regr">17/21</span><span class="sep">|</span><span class="half acc pass">6/6</span></span></td><td data-col="migraphx/gpu"><span class="gcell split" title="Compatibility 18/21 pass · Accuracy 6/6 pass"><span class="half compat regr">18/21</span><span class="sep">|</span><span class="half acc pass">6/6</span></span></td><td data-col="mlas/cpu"><span class="gcell split" title="Compatibility 18/21 pass · Accuracy 6/6 pass"><span class="half compat regr">18/21</span><span class="sep">|</span><span class="half acc pass">6/6</span></span></td><td data-col="openvino/npu"><span class="gcell split" title="Compatibility 16/21 pass · Accuracy 6/6 pass"><span class="half compat regr">16/21</span><span class="sep">|</span><span class="half acc pass">6/6</span></span></td><td data-col="openvino/gpu"><span class="gcell split" title="Compatibility 9/21 pass · Accuracy 6/6 pass"><span class="half compat regr">9/21</span><span class="sep">|</span><span class="half acc pass">6/6</span></span></td><td data-col="openvino/cpu"><span class="gcell split" title="Compatibility 18/21 pass · Accuracy 6/6 pass"><span class="half compat regr">18/21</span><span class="sep">|</span><span class="half acc pass">6/6</span></span></td><td data-col="qnn/npu"><span class="gcell split" title="Compatibility 15/21 pass · Accuracy 6/6 pass"><span class="half compat regr">15/21</span><span class="sep">|</span><span class="half acc pass">6/6</span></span></td><td data-col="qnn/gpu"><span class="gcell split" title="Compatibility 9/21 pass · Accuracy 4/6 pass"><span class="half compat regr">9/21</span><span class="sep">|</span><span class="half acc regr">4/6</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="gcell split" title="Compatibility 17/21 pass · Accuracy 6/6 pass"><span class="half compat regr">17/21</span><span class="sep">|</span><span class="half acc pass">6/6</span></span></td><td data-col="vitisai/npu"><span class="gcell split" title="Compatibility 18/21 pass · Accuracy 6/6 pass"><span class="half compat regr">18/21</span><span class="sep">|</span><span class="half acc pass">6/6</span></span></td></tr>
+<tr class="child-row" data-group="facebook" data-model="facebook/convnext-tiny-224" data-task="image-classification" data-type="convnext" data-passcount="10" data-compatall="1" data-accall="1" data-bothall="1" data-hasacc="1"><td class="model-col child-name" title="facebook/convnext-tiny-224">convnext-tiny-224</td><td class="task-col">image-classification</td><td data-col="dml/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Accuracy" data-task="Image classification" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="migraphx/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Accuracy" data-task="Image classification" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="mlas/cpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Accuracy" data-task="Image classification" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="openvino/npu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Accuracy" data-task="Image classification" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true},{&quot;precision&quot;:&quot;w8a16&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.4%&quot;}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="openvino/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Accuracy" data-task="Image classification" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="openvino/cpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Accuracy" data-task="Image classification" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="qnn/npu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Accuracy" data-task="Image classification" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+1.3%&quot;,&quot;best&quot;:true},{&quot;precision&quot;:&quot;w8a16&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.1%&quot;},{&quot;precision&quot;:&quot;w8a8&quot;,&quot;verdict&quot;:&quot;REGRESSION&quot;,&quot;delta&quot;:&quot;-61.7%&quot;}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="qnn/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Accuracy" data-task="Image classification" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Accuracy" data-task="Image classification" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="vitisai/npu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Accuracy" data-task="Image classification" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+5.2%&quot;,&quot;best&quot;:true},{&quot;precision&quot;:&quot;w8a16&quot;,&quot;verdict&quot;:&quot;FAIL&quot;,&quot;delta&quot;:null},{&quot;precision&quot;:&quot;w8a8&quot;,&quot;verdict&quot;:&quot;REGRESSION&quot;,&quot;delta&quot;:&quot;-99.6%&quot;}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td></tr>
+<tr class="child-row" data-group="facebook" data-model="facebook/dino-vitb16" data-task="image-feature-extraction" data-type="vit" data-passcount="10" data-compatall="1" data-accall="1" data-bothall="1" data-hasacc="1"><td class="model-col child-name" title="facebook/dino-vitb16">dino-vitb16</td><td class="task-col">image-feature-extraction</td><td data-col="dml/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="KNN Top-1 Accuracy" data-task="Image embeddings" data-logic="PASS if delta &lt; 5%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="migraphx/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="KNN Top-1 Accuracy" data-task="Image embeddings" data-logic="PASS if delta &lt; 5%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="mlas/cpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="KNN Top-1 Accuracy" data-task="Image embeddings" data-logic="PASS if delta &lt; 5%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="openvino/npu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="KNN Top-1 Accuracy" data-task="Image embeddings" data-logic="PASS if delta &lt; 5%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true},{&quot;precision&quot;:&quot;w8a16&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-0.5%&quot;}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="openvino/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="KNN Top-1 Accuracy" data-task="Image embeddings" data-logic="PASS if delta &lt; 5%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="openvino/cpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="KNN Top-1 Accuracy" data-task="Image embeddings" data-logic="PASS if delta &lt; 5%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="qnn/npu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="KNN Top-1 Accuracy" data-task="Image embeddings" data-logic="PASS if delta &lt; 5%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true},{&quot;precision&quot;:&quot;w8a16&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-0.5%&quot;},{&quot;precision&quot;:&quot;w8a8&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-2.4%&quot;}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="qnn/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="KNN Top-1 Accuracy" data-task="Image embeddings" data-logic="PASS if delta &lt; 5%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="KNN Top-1 Accuracy" data-task="Image embeddings" data-logic="PASS if delta &lt; 5%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="vitisai/npu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="KNN Top-1 Accuracy" data-task="Image embeddings" data-logic="PASS if delta &lt; 5%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true},{&quot;precision&quot;:&quot;w8a16&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-0.6%&quot;},{&quot;precision&quot;:&quot;w8a8&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-1.4%&quot;}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td></tr>
+<tr class="child-row" data-group="facebook" data-model="facebook/dino-vits16" data-task="image-feature-extraction" data-type="vit" data-passcount="10" data-compatall="1" data-accall="1" data-bothall="1" data-hasacc="1"><td class="model-col child-name" title="facebook/dino-vits16">dino-vits16</td><td class="task-col">image-feature-extraction</td><td data-col="dml/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="KNN Top-1 Accuracy" data-task="Image embeddings" data-logic="PASS if delta &lt; 5%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="migraphx/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="KNN Top-1 Accuracy" data-task="Image embeddings" data-logic="PASS if delta &lt; 5%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="mlas/cpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="KNN Top-1 Accuracy" data-task="Image embeddings" data-logic="PASS if delta &lt; 5%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="openvino/npu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="KNN Top-1 Accuracy" data-task="Image embeddings" data-logic="PASS if delta &lt; 5%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true},{&quot;precision&quot;:&quot;w8a16&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="openvino/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="KNN Top-1 Accuracy" data-task="Image embeddings" data-logic="PASS if delta &lt; 5%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="openvino/cpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="KNN Top-1 Accuracy" data-task="Image embeddings" data-logic="PASS if delta &lt; 5%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="qnn/npu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="KNN Top-1 Accuracy" data-task="Image embeddings" data-logic="PASS if delta &lt; 5%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true},{&quot;precision&quot;:&quot;w8a16&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.3%&quot;},{&quot;precision&quot;:&quot;w8a8&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-4.0%&quot;}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="qnn/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="KNN Top-1 Accuracy" data-task="Image embeddings" data-logic="PASS if delta &lt; 5%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="KNN Top-1 Accuracy" data-task="Image embeddings" data-logic="PASS if delta &lt; 5%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="vitisai/npu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="KNN Top-1 Accuracy" data-task="Image embeddings" data-logic="PASS if delta &lt; 5%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true},{&quot;precision&quot;:&quot;w8a16&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.5%&quot;},{&quot;precision&quot;:&quot;w8a8&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-4.0%&quot;}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td></tr>
+<tr class="child-row" data-group="facebook" data-model="facebook/dinov2-small" data-task="image-feature-extraction" data-type="dinov2" data-passcount="10" data-compatall="1" data-accall="1" data-bothall="1" data-hasacc="1"><td class="model-col child-name" title="facebook/dinov2-small">dinov2-small</td><td class="task-col">image-feature-extraction</td><td data-col="dml/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="KNN Top-1 Accuracy" data-task="Image embeddings" data-logic="PASS if delta &lt; 5%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-0.8%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="migraphx/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="KNN Top-1 Accuracy" data-task="Image embeddings" data-logic="PASS if delta &lt; 5%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-0.8%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="mlas/cpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="KNN Top-1 Accuracy" data-task="Image embeddings" data-logic="PASS if delta &lt; 5%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-0.8%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="openvino/npu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="KNN Top-1 Accuracy" data-task="Image embeddings" data-logic="PASS if delta &lt; 5%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+5.9%&quot;,&quot;best&quot;:true},{&quot;precision&quot;:&quot;w8a16&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-0.7%&quot;}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="openvino/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="KNN Top-1 Accuracy" data-task="Image embeddings" data-logic="PASS if delta &lt; 5%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-0.8%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="openvino/cpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="KNN Top-1 Accuracy" data-task="Image embeddings" data-logic="PASS if delta &lt; 5%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-0.8%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="qnn/npu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="KNN Top-1 Accuracy" data-task="Image embeddings" data-logic="PASS if delta &lt; 5%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+8.8%&quot;,&quot;best&quot;:true},{&quot;precision&quot;:&quot;w8a16&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-0.6%&quot;},{&quot;precision&quot;:&quot;w8a8&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-5.0%&quot;}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="qnn/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="KNN Top-1 Accuracy" data-task="Image embeddings" data-logic="PASS if delta &lt; 5%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-0.8%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="KNN Top-1 Accuracy" data-task="Image embeddings" data-logic="PASS if delta &lt; 5%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-0.8%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="vitisai/npu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="KNN Top-1 Accuracy" data-task="Image embeddings" data-logic="PASS if delta &lt; 5%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+8.8%&quot;,&quot;best&quot;:true},{&quot;precision&quot;:&quot;w8a16&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-0.5%&quot;},{&quot;precision&quot;:&quot;w8a8&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-3.1%&quot;}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td></tr>
+<tr class="child-row" data-group="facebook" data-model="facebook/dinov2-base" data-task="image-feature-extraction" data-type="dinov2" data-passcount="10" data-compatall="1" data-accall="0" data-bothall="0" data-hasacc="1"><td class="model-col child-name" title="facebook/dinov2-base">dinov2-base</td><td class="task-col">image-feature-extraction</td><td data-col="dml/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="KNN Top-1 Accuracy" data-task="Image embeddings" data-logic="PASS if delta &lt; 5%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-0.4%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="migraphx/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="KNN Top-1 Accuracy" data-task="Image embeddings" data-logic="PASS if delta &lt; 5%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-0.4%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="mlas/cpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="KNN Top-1 Accuracy" data-task="Image embeddings" data-logic="PASS if delta &lt; 5%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-0.4%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="openvino/npu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="KNN Top-1 Accuracy" data-task="Image embeddings" data-logic="PASS if delta &lt; 5%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true},{&quot;precision&quot;:&quot;w8a16&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-0.6%&quot;}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="openvino/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="KNN Top-1 Accuracy" data-task="Image embeddings" data-logic="PASS if delta &lt; 5%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-0.4%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="openvino/cpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="KNN Top-1 Accuracy" data-task="Image embeddings" data-logic="PASS if delta &lt; 5%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-0.4%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="qnn/npu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="KNN Top-1 Accuracy" data-task="Image embeddings" data-logic="PASS if delta &lt; 5%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true},{&quot;precision&quot;:&quot;w8a16&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-0.4%&quot;},{&quot;precision&quot;:&quot;w8a8&quot;,&quot;verdict&quot;:&quot;REGRESSION&quot;,&quot;delta&quot;:&quot;-93.7%&quot;}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="qnn/gpu"><span class="cell split" data-compat="PASS" data-acc="REGRESSION" data-metric="KNN Top-1 Accuracy" data-task="Image embeddings" data-logic="PASS if delta &lt; 5%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;REGRESSION&quot;,&quot;delta&quot;:&quot;-98.5%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc regr">▼</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="KNN Top-1 Accuracy" data-task="Image embeddings" data-logic="PASS if delta &lt; 5%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-0.4%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="vitisai/npu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="KNN Top-1 Accuracy" data-task="Image embeddings" data-logic="PASS if delta &lt; 5%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+2.4%&quot;,&quot;best&quot;:true},{&quot;precision&quot;:&quot;w8a16&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.1%&quot;},{&quot;precision&quot;:&quot;w8a8&quot;,&quot;verdict&quot;:&quot;REGRESSION&quot;,&quot;delta&quot;:&quot;-93.4%&quot;}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td></tr>
+<tr class="child-row" data-group="facebook" data-model="facebook/dinov2-large" data-task="image-feature-extraction" data-type="dinov2" data-passcount="10" data-compatall="1" data-accall="0" data-bothall="0" data-hasacc="1"><td class="model-col child-name" title="facebook/dinov2-large">dinov2-large</td><td class="task-col">image-feature-extraction</td><td data-col="dml/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="KNN Top-1 Accuracy" data-task="Image embeddings" data-logic="PASS if delta &lt; 5%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-0.1%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="migraphx/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="KNN Top-1 Accuracy" data-task="Image embeddings" data-logic="PASS if delta &lt; 5%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-0.1%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="mlas/cpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="KNN Top-1 Accuracy" data-task="Image embeddings" data-logic="PASS if delta &lt; 5%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-0.1%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="openvino/npu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="KNN Top-1 Accuracy" data-task="Image embeddings" data-logic="PASS if delta &lt; 5%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true},{&quot;precision&quot;:&quot;w8a16&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-0.3%&quot;}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="openvino/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="KNN Top-1 Accuracy" data-task="Image embeddings" data-logic="PASS if delta &lt; 5%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-0.1%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="openvino/cpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="KNN Top-1 Accuracy" data-task="Image embeddings" data-logic="PASS if delta &lt; 5%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-0.1%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="qnn/npu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="KNN Top-1 Accuracy" data-task="Image embeddings" data-logic="PASS if delta &lt; 5%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true},{&quot;precision&quot;:&quot;w8a16&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-0.2%&quot;},{&quot;precision&quot;:&quot;w8a8&quot;,&quot;verdict&quot;:&quot;REGRESSION&quot;,&quot;delta&quot;:&quot;-91.0%&quot;}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="qnn/gpu"><span class="cell split" data-compat="PASS" data-acc="REGRESSION" data-metric="KNN Top-1 Accuracy" data-task="Image embeddings" data-logic="PASS if delta &lt; 5%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;REGRESSION&quot;,&quot;delta&quot;:&quot;-98.6%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc regr">▼</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="KNN Top-1 Accuracy" data-task="Image embeddings" data-logic="PASS if delta &lt; 5%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-0.1%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="vitisai/npu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="KNN Top-1 Accuracy" data-task="Image embeddings" data-logic="PASS if delta &lt; 5%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+5.1%&quot;,&quot;best&quot;:true},{&quot;precision&quot;:&quot;w8a16&quot;,&quot;verdict&quot;:&quot;REGRESSION&quot;,&quot;delta&quot;:&quot;-87.2%&quot;},{&quot;precision&quot;:&quot;w8a8&quot;,&quot;verdict&quot;:&quot;REGRESSION&quot;,&quot;delta&quot;:&quot;-95.4%&quot;}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td></tr>
+<tr class="child-row" data-group="facebook" data-model="facebook/bart-large-cnn" data-task="summarization" data-type="bart" data-passcount="8" data-compatall="0" data-accall="0" data-bothall="0" data-hasacc="0"><td class="model-col child-name" title="facebook/bart-large-cnn">bart-large-cnn</td><td class="task-col">summarization</td><td data-col="dml/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="migraphx/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="mlas/cpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/npu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/cpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/npu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-sa="1" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="vitisai/npu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td></tr>
+<tr class="child-row" data-group="facebook" data-model="facebook/bart-large-mnli" data-task="text-classification" data-type="bart" data-passcount="0" data-compatall="0" data-accall="0" data-bothall="0" data-hasacc="0"><td class="model-col child-name" title="facebook/bart-large-mnli">bart-large-mnli</td><td class="task-col">text-classification</td><td data-col="dml/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="migraphx/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="mlas/cpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/npu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/cpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/npu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-sa="1" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="vitisai/npu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td></tr>
+<tr class="child-row" data-group="facebook" data-model="facebook/bart-large-mnli" data-task="zero-shot-classification" data-type="bart" data-passcount="0" data-compatall="0" data-accall="0" data-bothall="0" data-hasacc="0"><td class="model-col child-name" title="facebook/bart-large-mnli">bart-large-mnli</td><td class="task-col">zero-shot-classification</td><td data-col="dml/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="migraphx/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="mlas/cpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/npu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/cpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/npu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="vitisai/npu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td></tr>
+<tr class="child-row" data-group="facebook" data-model="facebook/detr-resnet-50" data-task="feature-extraction" data-type="detr" data-passcount="7" data-compatall="0" data-accall="0" data-bothall="0" data-hasacc="0"><td class="model-col child-name" title="facebook/detr-resnet-50">detr-resnet-50</td><td class="task-col">feature-extraction</td><td data-col="dml/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="migraphx/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="mlas/cpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/npu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/cpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/npu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="vitisai/npu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td></tr>
+<tr class="child-row" data-group="facebook" data-model="facebook/detr-resnet-50" data-task="object-detection" data-type="detr" data-passcount="9" data-compatall="0" data-accall="0" data-bothall="0" data-hasacc="0"><td class="model-col child-name" title="facebook/detr-resnet-50">detr-resnet-50</td><td class="task-col">object-detection</td><td data-col="dml/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="migraphx/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="mlas/cpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/npu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/cpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/npu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="vitisai/npu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td></tr>
+<tr class="child-row" data-group="facebook" data-model="facebook/dinov2-giant" data-task="image-feature-extraction" data-type="dinov2" data-passcount="9" data-compatall="0" data-accall="0" data-bothall="0" data-hasacc="0"><td class="model-col child-name" title="facebook/dinov2-giant">dinov2-giant</td><td class="task-col">image-feature-extraction</td><td data-col="dml/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="migraphx/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="mlas/cpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/npu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/cpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/npu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="vitisai/npu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td></tr>
+<tr class="child-row" data-group="facebook" data-model="facebook/nllb-200-distilled-600m" data-task="translation" data-type="m2m_100" data-passcount="0" data-compatall="0" data-accall="0" data-bothall="0" data-hasacc="0"><td class="model-col child-name" title="facebook/nllb-200-distilled-600M">nllb-200-distilled-600M</td><td class="task-col">translation</td><td data-col="dml/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="migraphx/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="mlas/cpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/npu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/cpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/npu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="vitisai/npu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td></tr>
+<tr class="child-row" data-group="facebook" data-model="facebook/nougat-base" data-task="image-to-text" data-type="vision-encoder-decoder" data-passcount="8" data-compatall="0" data-accall="0" data-bothall="0" data-hasacc="0"><td class="model-col child-name" title="facebook/nougat-base">nougat-base</td><td class="task-col">image-to-text</td><td data-col="dml/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="migraphx/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="mlas/cpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/npu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/cpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/npu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-sa="1" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="vitisai/npu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td></tr>
+<tr class="child-row" data-group="facebook" data-model="facebook/sam-vit-base" data-task="mask-generation" data-type="sam" data-passcount="8" data-compatall="0" data-accall="0" data-bothall="0" data-hasacc="0"><td class="model-col child-name" title="facebook/sam-vit-base">sam-vit-base</td><td class="task-col">mask-generation</td><td data-col="dml/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="migraphx/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="mlas/cpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/npu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-sa="1" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/cpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/npu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="vitisai/npu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td></tr>
+<tr class="child-row" data-group="facebook" data-model="facebook/sam-vit-huge" data-task="mask-generation" data-type="sam" data-passcount="8" data-compatall="0" data-accall="0" data-bothall="0" data-hasacc="0"><td class="model-col child-name" title="facebook/sam-vit-huge">sam-vit-huge</td><td class="task-col">mask-generation</td><td data-col="dml/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="migraphx/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="mlas/cpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/npu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-sa="1" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/cpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/npu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="vitisai/npu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td></tr>
+<tr class="child-row" data-group="facebook" data-model="facebook/sam-vit-large" data-task="mask-generation" data-type="sam" data-passcount="8" data-compatall="0" data-accall="0" data-bothall="0" data-hasacc="0"><td class="model-col child-name" title="facebook/sam-vit-large">sam-vit-large</td><td class="task-col">mask-generation</td><td data-col="dml/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="migraphx/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="mlas/cpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/npu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-sa="1" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/cpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/npu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="vitisai/npu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td></tr>
+<tr class="child-row" data-group="facebook" data-model="facebook/sam2-hiera-large" data-task="mask-generation" data-type="sam2_video" data-passcount="8" data-compatall="0" data-accall="0" data-bothall="0" data-hasacc="0"><td class="model-col child-name" title="facebook/sam2-hiera-large">sam2-hiera-large</td><td class="task-col">mask-generation</td><td data-col="dml/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="migraphx/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="mlas/cpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/npu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-sa="1" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/cpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/npu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-sa="1" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="vitisai/npu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td></tr>
+<tr class="child-row" data-group="facebook" data-model="facebook/sam2.1-hiera-large" data-task="mask-generation" data-type="sam2_video" data-passcount="8" data-compatall="0" data-accall="0" data-bothall="0" data-hasacc="0"><td class="model-col child-name" title="facebook/sam2.1-hiera-large">sam2.1-hiera-large</td><td class="task-col">mask-generation</td><td data-col="dml/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="migraphx/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="mlas/cpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/npu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-sa="1" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/cpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/npu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-sa="1" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="vitisai/npu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td></tr>
+<tr class="child-row" data-group="facebook" data-model="facebook/sam2.1-hiera-small" data-task="mask-generation" data-type="sam2_video" data-passcount="7" data-compatall="0" data-accall="0" data-bothall="0" data-hasacc="0"><td class="model-col child-name" title="facebook/sam2.1-hiera-small">sam2.1-hiera-small</td><td class="task-col">mask-generation</td><td data-col="dml/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="migraphx/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="mlas/cpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/npu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-sa="1" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/cpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/npu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-sa="1" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="vitisai/npu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td></tr>
+<tr class="child-row" data-group="facebook" data-model="facebook/sam2.1-hiera-tiny" data-task="mask-generation" data-type="sam2_video" data-passcount="7" data-compatall="0" data-accall="0" data-bothall="0" data-hasacc="0"><td class="model-col child-name" title="facebook/sam2.1-hiera-tiny">sam2.1-hiera-tiny</td><td class="task-col">mask-generation</td><td data-col="dml/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="migraphx/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="mlas/cpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/npu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-sa="1" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/cpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/npu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-sa="1" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="vitisai/npu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td></tr>
+<tr class="group-row" data-group="distilbert"><td class="model-col"><span class="group-toggle"><span class="twisty">▼</span><span class="group-name">distilbert</span></span></td><td class="task-col group-meta">4 models</td><td data-col="dml/gpu"><span class="gcell split" title="Compatibility 4/4 pass · Accuracy 4/4 pass"><span class="half compat pass">4/4</span><span class="sep">|</span><span class="half acc pass">4/4</span></span></td><td data-col="migraphx/gpu"><span class="gcell split" title="Compatibility 4/4 pass · Accuracy 4/4 pass"><span class="half compat pass">4/4</span><span class="sep">|</span><span class="half acc pass">4/4</span></span></td><td data-col="mlas/cpu"><span class="gcell split" title="Compatibility 4/4 pass · Accuracy 4/4 pass"><span class="half compat pass">4/4</span><span class="sep">|</span><span class="half acc pass">4/4</span></span></td><td data-col="openvino/npu"><span class="gcell split" title="Compatibility 4/4 pass · Accuracy 4/4 pass"><span class="half compat pass">4/4</span><span class="sep">|</span><span class="half acc pass">4/4</span></span></td><td data-col="openvino/gpu"><span class="gcell split" title="Compatibility 4/4 pass · Accuracy 4/4 pass"><span class="half compat pass">4/4</span><span class="sep">|</span><span class="half acc pass">4/4</span></span></td><td data-col="openvino/cpu"><span class="gcell split" title="Compatibility 4/4 pass · Accuracy 4/4 pass"><span class="half compat pass">4/4</span><span class="sep">|</span><span class="half acc pass">4/4</span></span></td><td data-col="qnn/npu"><span class="gcell split" title="Compatibility 4/4 pass · Accuracy 4/4 pass"><span class="half compat pass">4/4</span><span class="sep">|</span><span class="half acc pass">4/4</span></span></td><td data-col="qnn/gpu"><span class="gcell split" title="Compatibility 4/4 pass · Accuracy 4/4 pass"><span class="half compat pass">4/4</span><span class="sep">|</span><span class="half acc pass">4/4</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="gcell split" title="Compatibility 4/4 pass · Accuracy 4/4 pass"><span class="half compat pass">4/4</span><span class="sep">|</span><span class="half acc pass">4/4</span></span></td><td data-col="vitisai/npu"><span class="gcell split" title="Compatibility 4/4 pass · Accuracy 4/4 pass"><span class="half compat pass">4/4</span><span class="sep">|</span><span class="half acc pass">4/4</span></span></td></tr>
+<tr class="child-row" data-group="distilbert" data-model="distilbert/distilbert-base-cased-distilled-squad" data-task="question-answering" data-type="distilbert" data-passcount="10" data-compatall="1" data-accall="1" data-bothall="1" data-hasacc="1"><td class="model-col child-name" title="distilbert/distilbert-base-cased-distilled-squad">distilbert-base-cased-distilled-squad</td><td class="task-col">question-answering</td><td data-col="dml/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="F1 Score" data-task="Question answering" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="migraphx/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="F1 Score" data-task="Question answering" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.2%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="mlas/cpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="F1 Score" data-task="Question answering" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.2%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="openvino/npu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="F1 Score" data-task="Question answering" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-0.0%&quot;,&quot;best&quot;:true},{&quot;precision&quot;:&quot;w8a16&quot;,&quot;verdict&quot;:&quot;REGRESSION&quot;,&quot;delta&quot;:&quot;-90.8%&quot;}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="openvino/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="F1 Score" data-task="Question answering" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.2%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="openvino/cpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="F1 Score" data-task="Question answering" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.2%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="qnn/npu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="F1 Score" data-task="Question answering" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-0.0%&quot;,&quot;best&quot;:true},{&quot;precision&quot;:&quot;w8a16&quot;,&quot;verdict&quot;:&quot;REGRESSION&quot;,&quot;delta&quot;:&quot;-88.6%&quot;},{&quot;precision&quot;:&quot;w8a8&quot;,&quot;verdict&quot;:&quot;REGRESSION&quot;,&quot;delta&quot;:&quot;-89.7%&quot;}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="qnn/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="F1 Score" data-task="Question answering" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.2%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="F1 Score" data-task="Question answering" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.3%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="vitisai/npu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="F1 Score" data-task="Question answering" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-0.1%&quot;,&quot;best&quot;:true},{&quot;precision&quot;:&quot;w8a16&quot;,&quot;verdict&quot;:&quot;REGRESSION&quot;,&quot;delta&quot;:&quot;-91.2%&quot;},{&quot;precision&quot;:&quot;w8a8&quot;,&quot;verdict&quot;:&quot;REGRESSION&quot;,&quot;delta&quot;:&quot;-91.8%&quot;}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td></tr>
+<tr class="child-row" data-group="distilbert" data-model="distilbert/distilbert-base-uncased" data-task="fill-mask" data-type="distilbert" data-passcount="10" data-compatall="1" data-accall="1" data-bothall="1" data-hasacc="1"><td class="model-col child-name" title="distilbert/distilbert-base-uncased">distilbert-base-uncased</td><td class="task-col">fill-mask</td><td data-col="dml/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Pseudo-Perplexity" data-task="Masked language modeling" data-logic="PASS if delta &lt; 10% (lower metric is better)" data-lowerbetter="1" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="migraphx/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Pseudo-Perplexity" data-task="Masked language modeling" data-logic="PASS if delta &lt; 10% (lower metric is better)" data-lowerbetter="1" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="mlas/cpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Pseudo-Perplexity" data-task="Masked language modeling" data-logic="PASS if delta &lt; 10% (lower metric is better)" data-lowerbetter="1" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="openvino/npu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Pseudo-Perplexity" data-task="Masked language modeling" data-logic="PASS if delta &lt; 10% (lower metric is better)" data-lowerbetter="1" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-0.0%&quot;,&quot;best&quot;:true},{&quot;precision&quot;:&quot;w8a16&quot;,&quot;verdict&quot;:&quot;REGRESSION&quot;,&quot;delta&quot;:&quot;diverged&quot;}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="openvino/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Pseudo-Perplexity" data-task="Masked language modeling" data-logic="PASS if delta &lt; 10% (lower metric is better)" data-lowerbetter="1" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="openvino/cpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Pseudo-Perplexity" data-task="Masked language modeling" data-logic="PASS if delta &lt; 10% (lower metric is better)" data-lowerbetter="1" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="qnn/npu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Pseudo-Perplexity" data-task="Masked language modeling" data-logic="PASS if delta &lt; 10% (lower metric is better)" data-lowerbetter="1" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-0.3%&quot;,&quot;best&quot;:true},{&quot;precision&quot;:&quot;w8a16&quot;,&quot;verdict&quot;:&quot;REGRESSION&quot;,&quot;delta&quot;:&quot;diverged&quot;},{&quot;precision&quot;:&quot;w8a8&quot;,&quot;verdict&quot;:&quot;REGRESSION&quot;,&quot;delta&quot;:&quot;diverged&quot;}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="qnn/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Pseudo-Perplexity" data-task="Masked language modeling" data-logic="PASS if delta &lt; 10% (lower metric is better)" data-lowerbetter="1" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Pseudo-Perplexity" data-task="Masked language modeling" data-logic="PASS if delta &lt; 10% (lower metric is better)" data-lowerbetter="1" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="vitisai/npu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Pseudo-Perplexity" data-task="Masked language modeling" data-logic="PASS if delta &lt; 10% (lower metric is better)" data-lowerbetter="1" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+2.0%&quot;,&quot;best&quot;:true},{&quot;precision&quot;:&quot;w8a16&quot;,&quot;verdict&quot;:&quot;REGRESSION&quot;,&quot;delta&quot;:&quot;diverged&quot;},{&quot;precision&quot;:&quot;w8a8&quot;,&quot;verdict&quot;:&quot;REGRESSION&quot;,&quot;delta&quot;:&quot;diverged&quot;}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td></tr>
+<tr class="child-row" data-group="distilbert" data-model="distilbert/distilbert-base-uncased-distilled-squad" data-task="question-answering" data-type="distilbert" data-passcount="10" data-compatall="1" data-accall="1" data-bothall="1" data-hasacc="1"><td class="model-col child-name" title="distilbert/distilbert-base-uncased-distilled-squad">distilbert-base-uncased-distilled-squad</td><td class="task-col">question-answering</td><td data-col="dml/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="F1 Score" data-task="Question answering" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="migraphx/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="F1 Score" data-task="Question answering" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.3%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="mlas/cpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="F1 Score" data-task="Question answering" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.3%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="openvino/npu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="F1 Score" data-task="Question answering" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true},{&quot;precision&quot;:&quot;w8a16&quot;,&quot;verdict&quot;:&quot;REGRESSION&quot;,&quot;delta&quot;:&quot;-92.3%&quot;}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="openvino/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="F1 Score" data-task="Question answering" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.3%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="openvino/cpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="F1 Score" data-task="Question answering" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.3%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="qnn/npu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="F1 Score" data-task="Question answering" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true},{&quot;precision&quot;:&quot;w8a16&quot;,&quot;verdict&quot;:&quot;REGRESSION&quot;,&quot;delta&quot;:&quot;-91.2%&quot;},{&quot;precision&quot;:&quot;w8a8&quot;,&quot;verdict&quot;:&quot;REGRESSION&quot;,&quot;delta&quot;:&quot;-91.6%&quot;}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="qnn/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="F1 Score" data-task="Question answering" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.3%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="F1 Score" data-task="Question answering" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.4%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="vitisai/npu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="F1 Score" data-task="Question answering" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.1%&quot;,&quot;best&quot;:true},{&quot;precision&quot;:&quot;w8a16&quot;,&quot;verdict&quot;:&quot;REGRESSION&quot;,&quot;delta&quot;:&quot;-90.8%&quot;},{&quot;precision&quot;:&quot;w8a8&quot;,&quot;verdict&quot;:&quot;REGRESSION&quot;,&quot;delta&quot;:&quot;-90.5%&quot;}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td></tr>
+<tr class="child-row" data-group="distilbert" data-model="distilbert/distilbert-base-uncased-finetuned-sst-2-english" data-task="text-classification" data-type="distilbert" data-passcount="10" data-compatall="1" data-accall="1" data-bothall="1" data-hasacc="1"><td class="model-col child-name" title="distilbert/distilbert-base-uncased-finetuned-sst-2-english">distilbert-base-uncased-finetuned-sst-2-english</td><td class="task-col">text-classification</td><td data-col="dml/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Accuracy" data-task="Text classification" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="migraphx/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Accuracy" data-task="Text classification" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="mlas/cpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Accuracy" data-task="Text classification" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="openvino/npu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Accuracy" data-task="Text classification" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true},{&quot;precision&quot;:&quot;w8a16&quot;,&quot;verdict&quot;:&quot;REGRESSION&quot;,&quot;delta&quot;:&quot;-46.1%&quot;}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="openvino/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Accuracy" data-task="Text classification" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="openvino/cpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Accuracy" data-task="Text classification" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="qnn/npu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Accuracy" data-task="Text classification" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true},{&quot;precision&quot;:&quot;w8a16&quot;,&quot;verdict&quot;:&quot;REGRESSION&quot;,&quot;delta&quot;:&quot;-15.1%&quot;},{&quot;precision&quot;:&quot;w8a8&quot;,&quot;verdict&quot;:&quot;REGRESSION&quot;,&quot;delta&quot;:&quot;-44.6%&quot;}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="qnn/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Accuracy" data-task="Text classification" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Accuracy" data-task="Text classification" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="vitisai/npu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Accuracy" data-task="Text classification" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+1.1%&quot;,&quot;best&quot;:true},{&quot;precision&quot;:&quot;w8a16&quot;,&quot;verdict&quot;:&quot;REGRESSION&quot;,&quot;delta&quot;:&quot;-45.3%&quot;},{&quot;precision&quot;:&quot;w8a8&quot;,&quot;verdict&quot;:&quot;REGRESSION&quot;,&quot;delta&quot;:&quot;-45.3%&quot;}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td></tr>
+<tr class="group-row" data-group="microsoft"><td class="model-col"><span class="group-toggle"><span class="twisty">▼</span><span class="group-name">microsoft</span></span></td><td class="task-col group-meta">28 models</td><td data-col="dml/gpu"><span class="gcell split" title="Compatibility 23/28 pass · Accuracy 10/10 pass"><span class="half compat regr">23/28</span><span class="sep">|</span><span class="half acc pass">10/10</span></span></td><td data-col="migraphx/gpu"><span class="gcell split" title="Compatibility 23/28 pass · Accuracy 9/10 pass"><span class="half compat regr">23/28</span><span class="sep">|</span><span class="half acc regr">9/10</span></span></td><td data-col="mlas/cpu"><span class="gcell split" title="Compatibility 23/28 pass · Accuracy 10/10 pass"><span class="half compat regr">23/28</span><span class="sep">|</span><span class="half acc pass">10/10</span></span></td><td data-col="openvino/npu"><span class="gcell split" title="Compatibility 15/28 pass · Accuracy 10/10 pass"><span class="half compat regr">15/28</span><span class="sep">|</span><span class="half acc pass">10/10</span></span></td><td data-col="openvino/gpu"><span class="gcell split" title="Compatibility 20/28 pass · Accuracy 9/10 pass"><span class="half compat regr">20/28</span><span class="sep">|</span><span class="half acc regr">9/10</span></span></td><td data-col="openvino/cpu"><span class="gcell split" title="Compatibility 23/28 pass · Accuracy 10/10 pass"><span class="half compat regr">23/28</span><span class="sep">|</span><span class="half acc pass">10/10</span></span></td><td data-col="qnn/npu"><span class="gcell split" title="Compatibility 14/28 pass · Accuracy 10/10 pass"><span class="half compat regr">14/28</span><span class="sep">|</span><span class="half acc pass">10/10</span></span></td><td data-col="qnn/gpu"><span class="gcell split" title="Compatibility 11/28 pass · Accuracy 7/10 pass"><span class="half compat regr">11/28</span><span class="sep">|</span><span class="half acc regr">7/10</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="gcell split" title="Compatibility 23/28 pass · Accuracy 9/10 pass"><span class="half compat regr">23/28</span><span class="sep">|</span><span class="half acc regr">9/10</span></span></td><td data-col="vitisai/npu"><span class="gcell split" title="Compatibility 22/28 pass · Accuracy 10/10 pass"><span class="half compat regr">22/28</span><span class="sep">|</span><span class="half acc pass">10/10</span></span></td></tr>
+<tr class="child-row" data-group="microsoft" data-model="microsoft/resnet-18" data-task="image-classification" data-type="resnet" data-passcount="10" data-compatall="1" data-accall="1" data-bothall="1" data-hasacc="1"><td class="model-col child-name" title="microsoft/resnet-18">resnet-18</td><td class="task-col">image-classification</td><td data-col="dml/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Accuracy" data-task="Image classification" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="migraphx/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Accuracy" data-task="Image classification" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="mlas/cpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Accuracy" data-task="Image classification" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="openvino/npu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Accuracy" data-task="Image classification" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true},{&quot;precision&quot;:&quot;w8a16&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+1.5%&quot;}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="openvino/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Accuracy" data-task="Image classification" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="openvino/cpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Accuracy" data-task="Image classification" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="qnn/npu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Accuracy" data-task="Image classification" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true},{&quot;precision&quot;:&quot;w8a16&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+1.5%&quot;},{&quot;precision&quot;:&quot;w8a8&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+1.5%&quot;}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="qnn/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Accuracy" data-task="Image classification" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Accuracy" data-task="Image classification" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="vitisai/npu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Accuracy" data-task="Image classification" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+3.0%&quot;,&quot;best&quot;:true},{&quot;precision&quot;:&quot;w8a16&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+3.0%&quot;},{&quot;precision&quot;:&quot;w8a8&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+1.5%&quot;}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td></tr>
+<tr class="child-row" data-group="microsoft" data-model="microsoft/resnet-50" data-task="image-classification" data-type="resnet" data-passcount="10" data-compatall="1" data-accall="1" data-bothall="1" data-hasacc="1"><td class="model-col child-name" title="microsoft/resnet-50">resnet-50</td><td class="task-col">image-classification</td><td data-col="dml/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Accuracy" data-task="Image classification" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="migraphx/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Accuracy" data-task="Image classification" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="mlas/cpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Accuracy" data-task="Image classification" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="openvino/npu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Accuracy" data-task="Image classification" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true},{&quot;precision&quot;:&quot;w8a16&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-6.6%&quot;}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="openvino/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Accuracy" data-task="Image classification" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.1%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="openvino/cpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Accuracy" data-task="Image classification" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="qnn/npu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Accuracy" data-task="Image classification" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true},{&quot;precision&quot;:&quot;w8a16&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-6.1%&quot;},{&quot;precision&quot;:&quot;w8a8&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-7.0%&quot;}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="qnn/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Accuracy" data-task="Image classification" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Accuracy" data-task="Image classification" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.1%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="vitisai/npu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Accuracy" data-task="Image classification" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-1.3%&quot;,&quot;best&quot;:true},{&quot;precision&quot;:&quot;w8a16&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-6.4%&quot;},{&quot;precision&quot;:&quot;w8a8&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-6.1%&quot;}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td></tr>
+<tr class="child-row" data-group="microsoft" data-model="microsoft/swin-large-patch4-window7-224" data-task="image-classification" data-type="swin" data-passcount="10" data-compatall="1" data-accall="1" data-bothall="1" data-hasacc="1"><td class="model-col child-name" title="microsoft/swin-large-patch4-window7-224">swin-large-patch4-window7-224</td><td class="task-col">image-classification</td><td data-col="dml/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Accuracy" data-task="Image classification" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="migraphx/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Accuracy" data-task="Image classification" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="mlas/cpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Accuracy" data-task="Image classification" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="openvino/npu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Accuracy" data-task="Image classification" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true},{&quot;precision&quot;:&quot;w8a16&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-0.1%&quot;}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="openvino/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Accuracy" data-task="Image classification" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.1%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="openvino/cpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Accuracy" data-task="Image classification" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="qnn/npu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Accuracy" data-task="Image classification" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true},{&quot;precision&quot;:&quot;w8a16&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.2%&quot;},{&quot;precision&quot;:&quot;w8a8&quot;,&quot;verdict&quot;:&quot;REGRESSION&quot;,&quot;delta&quot;:&quot;-15.7%&quot;}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="qnn/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Accuracy" data-task="Image classification" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Accuracy" data-task="Image classification" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.1%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="vitisai/npu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Accuracy" data-task="Image classification" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-1.3%&quot;,&quot;best&quot;:true},{&quot;precision&quot;:&quot;w8a16&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;},{&quot;precision&quot;:&quot;w8a8&quot;,&quot;verdict&quot;:&quot;REGRESSION&quot;,&quot;delta&quot;:&quot;-15.2%&quot;}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td></tr>
+<tr class="child-row" data-group="microsoft" data-model="microsoft/beit-base-patch16-224-pt22k-ft22k" data-task="image-classification" data-type="beit" data-passcount="10" data-compatall="1" data-accall="0" data-bothall="0" data-hasacc="0"><td class="model-col child-name" title="microsoft/beit-base-patch16-224-pt22k-ft22k">beit-base-patch16-224-pt22k-ft22k</td><td class="task-col">image-classification</td><td data-col="dml/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="migraphx/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="mlas/cpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/npu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/cpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/npu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="vitisai/npu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td></tr>
+<tr class="child-row" data-group="microsoft" data-model="microsoft/llmlingua-2-xlm-roberta-large-meetingbank" data-task="token-classification" data-type="xlm-roberta" data-passcount="10" data-compatall="1" data-accall="0" data-bothall="0" data-hasacc="0"><td class="model-col child-name" title="microsoft/llmlingua-2-xlm-roberta-large-meetingbank">llmlingua-2-xlm-roberta-large-meetingbank</td><td class="task-col">token-classification</td><td data-col="dml/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="migraphx/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="mlas/cpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/npu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/cpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/npu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="vitisai/npu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td></tr>
+<tr class="child-row" data-group="microsoft" data-model="microsoft/rad-dino" data-task="image-feature-extraction" data-type="dinov2" data-passcount="10" data-compatall="1" data-accall="0" data-bothall="0" data-hasacc="1"><td class="model-col child-name" title="microsoft/rad-dino">rad-dino</td><td class="task-col">image-feature-extraction</td><td data-col="dml/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="KNN Top-1 Accuracy" data-task="Image embeddings" data-logic="PASS if delta &lt; 5%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="migraphx/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="KNN Top-1 Accuracy" data-task="Image embeddings" data-logic="PASS if delta &lt; 5%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="mlas/cpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="KNN Top-1 Accuracy" data-task="Image embeddings" data-logic="PASS if delta &lt; 5%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="openvino/npu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="KNN Top-1 Accuracy" data-task="Image embeddings" data-logic="PASS if delta &lt; 5%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true},{&quot;precision&quot;:&quot;w8a16&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.4%&quot;}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="openvino/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="KNN Top-1 Accuracy" data-task="Image embeddings" data-logic="PASS if delta &lt; 5%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="openvino/cpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="KNN Top-1 Accuracy" data-task="Image embeddings" data-logic="PASS if delta &lt; 5%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="qnn/npu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="KNN Top-1 Accuracy" data-task="Image embeddings" data-logic="PASS if delta &lt; 5%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true},{&quot;precision&quot;:&quot;w8a16&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.2%&quot;},{&quot;precision&quot;:&quot;w8a8&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-3.3%&quot;}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="qnn/gpu"><span class="cell split" data-compat="PASS" data-acc="REGRESSION" data-metric="KNN Top-1 Accuracy" data-task="Image embeddings" data-logic="PASS if delta &lt; 5%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;REGRESSION&quot;,&quot;delta&quot;:&quot;-25.4%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc regr">▼</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="KNN Top-1 Accuracy" data-task="Image embeddings" data-logic="PASS if delta &lt; 5%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="vitisai/npu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="KNN Top-1 Accuracy" data-task="Image embeddings" data-logic="PASS if delta &lt; 5%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.4%&quot;,&quot;best&quot;:true},{&quot;precision&quot;:&quot;w8a16&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.4%&quot;},{&quot;precision&quot;:&quot;w8a8&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-2.5%&quot;}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td></tr>
+<tr class="child-row" data-group="microsoft" data-model="microsoft/swinv2-tiny-patch4-window16-256" data-task="image-classification" data-type="swinv2" data-passcount="10" data-compatall="1" data-accall="0" data-bothall="0" data-hasacc="1"><td class="model-col child-name" title="microsoft/swinv2-tiny-patch4-window16-256">swinv2-tiny-patch4-window16-256</td><td class="task-col">image-classification</td><td data-col="dml/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Accuracy" data-task="Image classification" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="migraphx/gpu"><span class="cell split" data-compat="PASS" data-acc="REGRESSION" data-metric="Accuracy" data-task="Image classification" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;REGRESSION&quot;,&quot;delta&quot;:&quot;-21.8%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc regr">▼</span></span></td><td data-col="mlas/cpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Accuracy" data-task="Image classification" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="openvino/npu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Accuracy" data-task="Image classification" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true},{&quot;precision&quot;:&quot;w8a16&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+1.3%&quot;}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="openvino/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Accuracy" data-task="Image classification" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="openvino/cpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Accuracy" data-task="Image classification" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="qnn/npu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Accuracy" data-task="Image classification" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true},{&quot;precision&quot;:&quot;w8a16&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+1.3%&quot;},{&quot;precision&quot;:&quot;w8a8&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-2.6%&quot;}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="qnn/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Accuracy" data-task="Image classification" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Accuracy" data-task="Image classification" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="vitisai/npu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Accuracy" data-task="Image classification" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+1.3%&quot;,&quot;best&quot;:true},{&quot;precision&quot;:&quot;w8a16&quot;,&quot;verdict&quot;:&quot;FAIL&quot;,&quot;delta&quot;:null},{&quot;precision&quot;:&quot;w8a8&quot;,&quot;verdict&quot;:&quot;REGRESSION&quot;,&quot;delta&quot;:&quot;-98.7%&quot;}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td></tr>
+<tr class="child-row" data-group="microsoft" data-model="microsoft/trocr-base-handwritten" data-task="image-to-text" data-type="vision-encoder-decoder" data-passcount="9" data-compatall="0" data-accall="1" data-bothall="0" data-hasacc="1"><td class="model-col child-name" title="microsoft/trocr-base-handwritten">trocr-base-handwritten</td><td class="task-col">image-to-text</td><td data-col="dml/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Character Error Rate (CER)" data-task="OCR / text recognition" data-logic="PASS if delta &lt; 10% (lower metric is better)" data-lowerbetter="1" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-0.2%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="migraphx/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Character Error Rate (CER)" data-task="OCR / text recognition" data-logic="PASS if delta &lt; 10% (lower metric is better)" data-lowerbetter="1" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-0.2%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="mlas/cpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Character Error Rate (CER)" data-task="OCR / text recognition" data-logic="PASS if delta &lt; 10% (lower metric is better)" data-lowerbetter="1" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-0.2%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="openvino/npu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Character Error Rate (CER)" data-task="OCR / text recognition" data-logic="PASS if delta &lt; 10% (lower metric is better)" data-lowerbetter="1" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-0.6%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="openvino/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Character Error Rate (CER)" data-task="OCR / text recognition" data-logic="PASS if delta &lt; 10% (lower metric is better)" data-lowerbetter="1" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-0.2%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="openvino/cpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Character Error Rate (CER)" data-task="OCR / text recognition" data-logic="PASS if delta &lt; 10% (lower metric is better)" data-lowerbetter="1" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-0.2%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="qnn/npu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Character Error Rate (CER)" data-task="OCR / text recognition" data-logic="PASS if delta &lt; 10% (lower metric is better)" data-lowerbetter="1" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-1.9%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="qnn/gpu"><span class="cell split" data-compat="FAIL" data-acc="PASS" data-sa="1" data-metric="Character Error Rate (CER)" data-task="OCR / text recognition" data-logic="PASS if delta &lt; 10% (lower metric is better)" data-lowerbetter="1" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-0.2%&quot;,&quot;best&quot;:true}]'><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Character Error Rate (CER)" data-task="OCR / text recognition" data-logic="PASS if delta &lt; 10% (lower metric is better)" data-lowerbetter="1" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="vitisai/npu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Character Error Rate (CER)" data-task="OCR / text recognition" data-logic="PASS if delta &lt; 10% (lower metric is better)" data-lowerbetter="1" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.8%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td></tr>
+<tr class="child-row" data-group="microsoft" data-model="microsoft/trocr-base-printed" data-task="image-to-text" data-type="vision-encoder-decoder" data-passcount="9" data-compatall="0" data-accall="1" data-bothall="0" data-hasacc="1"><td class="model-col child-name" title="microsoft/trocr-base-printed">trocr-base-printed</td><td class="task-col">image-to-text</td><td data-col="dml/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Character Error Rate (CER)" data-task="OCR / text recognition" data-logic="PASS if delta &lt; 10% (lower metric is better)" data-lowerbetter="1" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="migraphx/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Character Error Rate (CER)" data-task="OCR / text recognition" data-logic="PASS if delta &lt; 10% (lower metric is better)" data-lowerbetter="1" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="mlas/cpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Character Error Rate (CER)" data-task="OCR / text recognition" data-logic="PASS if delta &lt; 10% (lower metric is better)" data-lowerbetter="1" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="openvino/npu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Character Error Rate (CER)" data-task="OCR / text recognition" data-logic="PASS if delta &lt; 10% (lower metric is better)" data-lowerbetter="1" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="openvino/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Character Error Rate (CER)" data-task="OCR / text recognition" data-logic="PASS if delta &lt; 10% (lower metric is better)" data-lowerbetter="1" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="openvino/cpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Character Error Rate (CER)" data-task="OCR / text recognition" data-logic="PASS if delta &lt; 10% (lower metric is better)" data-lowerbetter="1" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="qnn/npu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Character Error Rate (CER)" data-task="OCR / text recognition" data-logic="PASS if delta &lt; 10% (lower metric is better)" data-lowerbetter="1" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="qnn/gpu"><span class="cell split" data-compat="FAIL" data-acc="PASS" data-sa="1" data-metric="Character Error Rate (CER)" data-task="OCR / text recognition" data-logic="PASS if delta &lt; 10% (lower metric is better)" data-lowerbetter="1" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Character Error Rate (CER)" data-task="OCR / text recognition" data-logic="PASS if delta &lt; 10% (lower metric is better)" data-lowerbetter="1" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="vitisai/npu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Character Error Rate (CER)" data-task="OCR / text recognition" data-logic="PASS if delta &lt; 10% (lower metric is better)" data-lowerbetter="1" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+3.5%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td></tr>
+<tr class="child-row" data-group="microsoft" data-model="microsoft/trocr-large-handwritten" data-task="image-to-text" data-type="vision-encoder-decoder" data-passcount="9" data-compatall="0" data-accall="1" data-bothall="0" data-hasacc="1"><td class="model-col child-name" title="microsoft/trocr-large-handwritten">trocr-large-handwritten</td><td class="task-col">image-to-text</td><td data-col="dml/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Character Error Rate (CER)" data-task="OCR / text recognition" data-logic="PASS if delta &lt; 10% (lower metric is better)" data-lowerbetter="1" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="migraphx/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Character Error Rate (CER)" data-task="OCR / text recognition" data-logic="PASS if delta &lt; 10% (lower metric is better)" data-lowerbetter="1" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="mlas/cpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Character Error Rate (CER)" data-task="OCR / text recognition" data-logic="PASS if delta &lt; 10% (lower metric is better)" data-lowerbetter="1" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="openvino/npu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Character Error Rate (CER)" data-task="OCR / text recognition" data-logic="PASS if delta &lt; 10% (lower metric is better)" data-lowerbetter="1" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.6%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="openvino/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Character Error Rate (CER)" data-task="OCR / text recognition" data-logic="PASS if delta &lt; 10% (lower metric is better)" data-lowerbetter="1" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-0.3%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="openvino/cpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Character Error Rate (CER)" data-task="OCR / text recognition" data-logic="PASS if delta &lt; 10% (lower metric is better)" data-lowerbetter="1" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="qnn/npu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Character Error Rate (CER)" data-task="OCR / text recognition" data-logic="PASS if delta &lt; 10% (lower metric is better)" data-lowerbetter="1" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+2.5%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="qnn/gpu"><span class="cell split" data-compat="FAIL" data-acc="PASS" data-sa="1" data-metric="Character Error Rate (CER)" data-task="OCR / text recognition" data-logic="PASS if delta &lt; 10% (lower metric is better)" data-lowerbetter="1" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Character Error Rate (CER)" data-task="OCR / text recognition" data-logic="PASS if delta &lt; 10% (lower metric is better)" data-lowerbetter="1" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-0.3%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="vitisai/npu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Character Error Rate (CER)" data-task="OCR / text recognition" data-logic="PASS if delta &lt; 10% (lower metric is better)" data-lowerbetter="1" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+1.1%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td></tr>
+<tr class="child-row" data-group="microsoft" data-model="microsoft/deberta-xlarge-mnli" data-task="text-classification" data-type="deberta" data-passcount="9" data-compatall="0" data-accall="0" data-bothall="0" data-hasacc="0"><td class="model-col child-name" title="microsoft/deberta-xlarge-mnli">deberta-xlarge-mnli</td><td class="task-col">text-classification</td><td data-col="dml/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="migraphx/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="mlas/cpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/npu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/cpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/npu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="vitisai/npu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td></tr>
+<tr class="child-row" data-group="microsoft" data-model="microsoft/phi-4-multimodal-instruct" data-task="visual-question-answering" data-type="phi4mm" data-passcount="0" data-compatall="0" data-accall="0" data-bothall="0" data-hasacc="0"><td class="model-col child-name" title="microsoft/Phi-4-multimodal-instruct">Phi-4-multimodal-instruct</td><td class="task-col">visual-question-answering</td><td data-col="dml/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="migraphx/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="mlas/cpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/npu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/cpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/npu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="vitisai/npu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td></tr>
+<tr class="child-row" data-group="microsoft" data-model="microsoft/speecht5_tts" data-task="text-to-speech" data-type="speecht5" data-passcount="0" data-compatall="0" data-accall="0" data-bothall="0" data-hasacc="0"><td class="model-col child-name" title="microsoft/speecht5_tts">speecht5_tts</td><td class="task-col">text-to-speech</td><td data-col="dml/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="migraphx/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="mlas/cpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/npu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/cpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/npu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="vitisai/npu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td></tr>
+<tr class="child-row" data-group="microsoft" data-model="microsoft/table-transformer-detection" data-task="object-detection" data-type="table-transformer" data-passcount="9" data-compatall="0" data-accall="0" data-bothall="0" data-hasacc="1"><td class="model-col child-name" title="microsoft/table-transformer-detection">table-transformer-detection</td><td class="task-col">object-detection</td><td data-col="dml/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Mean Average Precision (mAP)" data-task="Object detection" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-1.9%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="migraphx/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Mean Average Precision (mAP)" data-task="Object detection" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-0.7%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="mlas/cpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Mean Average Precision (mAP)" data-task="Object detection" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-0.7%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="openvino/npu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Mean Average Precision (mAP)" data-task="Object detection" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-1.7%&quot;,&quot;best&quot;:true},{&quot;precision&quot;:&quot;w8a16&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-0.7%&quot;}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="openvino/gpu"><span class="cell split" data-compat="FAIL" data-acc="FAIL" data-desc="Build or evaluation error."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc fail">✗</span></span></td><td data-col="openvino/cpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Mean Average Precision (mAP)" data-task="Object detection" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-0.7%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="qnn/npu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Mean Average Precision (mAP)" data-task="Object detection" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-0.6%&quot;,&quot;best&quot;:true},{&quot;precision&quot;:&quot;w8a16&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-8.7%&quot;},{&quot;precision&quot;:&quot;w8a8&quot;,&quot;verdict&quot;:&quot;FAIL&quot;,&quot;delta&quot;:null}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="qnn/gpu"><span class="cell split" data-compat="PASS" data-acc="FAIL" data-desc="Build or evaluation error."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc fail">✗</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="cell split" data-compat="PASS" data-acc="FAIL" data-desc="Build or evaluation error."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc fail">✗</span></span></td><td data-col="vitisai/npu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Mean Average Precision (mAP)" data-task="Object detection" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-4.7%&quot;,&quot;best&quot;:true},{&quot;precision&quot;:&quot;w8a16&quot;,&quot;verdict&quot;:&quot;FAIL&quot;,&quot;delta&quot;:null},{&quot;precision&quot;:&quot;w8a8&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-3.5%&quot;}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td></tr>
+<tr class="child-row" data-group="microsoft" data-model="microsoft/table-transformer-structure-recognition" data-task="object-detection" data-type="table-transformer" data-passcount="9" data-compatall="0" data-accall="0" data-bothall="0" data-hasacc="0"><td class="model-col child-name" title="microsoft/table-transformer-structure-recognition">table-transformer-structure-recognition</td><td class="task-col">object-detection</td><td data-col="dml/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="migraphx/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="mlas/cpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/npu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/cpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/npu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="vitisai/npu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td></tr>
+<tr class="child-row" data-group="microsoft" data-model="microsoft/table-transformer-structure-recognition-v1.1-all" data-task="object-detection" data-type="table-transformer" data-passcount="9" data-compatall="0" data-accall="0" data-bothall="0" data-hasacc="0"><td class="model-col child-name" title="microsoft/table-transformer-structure-recognition-v1.1-all">table-transformer-structure-recognition-v1.1-all</td><td class="task-col">object-detection</td><td data-col="dml/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="migraphx/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="mlas/cpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/npu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/cpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/npu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="vitisai/npu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td></tr>
+<tr class="child-row" data-group="microsoft" data-model="microsoft/tapex-base" data-task="table-question-answering" data-type="bart" data-passcount="7" data-compatall="0" data-accall="0" data-bothall="0" data-hasacc="0"><td class="model-col child-name" title="microsoft/tapex-base">tapex-base</td><td class="task-col">table-question-answering</td><td data-col="dml/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="migraphx/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="mlas/cpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/npu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/cpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/npu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-sa="1" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="vitisai/npu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td></tr>
+<tr class="child-row" data-group="microsoft" data-model="microsoft/tapex-base-finetuned-wikisql" data-task="table-question-answering" data-type="bart" data-passcount="7" data-compatall="0" data-accall="0" data-bothall="0" data-hasacc="0"><td class="model-col child-name" title="microsoft/tapex-base-finetuned-wikisql">tapex-base-finetuned-wikisql</td><td class="task-col">table-question-answering</td><td data-col="dml/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="migraphx/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="mlas/cpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/npu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/cpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/npu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-sa="1" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="vitisai/npu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td></tr>
+<tr class="child-row" data-group="microsoft" data-model="microsoft/tapex-base-finetuned-wtq" data-task="table-question-answering" data-type="bart" data-passcount="7" data-compatall="0" data-accall="0" data-bothall="0" data-hasacc="0"><td class="model-col child-name" title="microsoft/tapex-base-finetuned-wtq">tapex-base-finetuned-wtq</td><td class="task-col">table-question-answering</td><td data-col="dml/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="migraphx/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="mlas/cpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/npu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/cpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/npu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-sa="1" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="vitisai/npu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td></tr>
+<tr class="child-row" data-group="microsoft" data-model="microsoft/tapex-large" data-task="table-question-answering" data-type="bart" data-passcount="7" data-compatall="0" data-accall="0" data-bothall="0" data-hasacc="0"><td class="model-col child-name" title="microsoft/tapex-large">tapex-large</td><td class="task-col">table-question-answering</td><td data-col="dml/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="migraphx/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="mlas/cpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/npu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/cpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/npu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-sa="1" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="vitisai/npu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td></tr>
+<tr class="child-row" data-group="microsoft" data-model="microsoft/tapex-large-finetuned-tabfact" data-task="table-question-answering" data-type="bart" data-passcount="7" data-compatall="0" data-accall="0" data-bothall="0" data-hasacc="0"><td class="model-col child-name" title="microsoft/tapex-large-finetuned-tabfact">tapex-large-finetuned-tabfact</td><td class="task-col">table-question-answering</td><td data-col="dml/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="migraphx/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="mlas/cpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/npu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/cpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/npu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-sa="1" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="vitisai/npu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td></tr>
+<tr class="child-row" data-group="microsoft" data-model="microsoft/tapex-large-finetuned-wikisql" data-task="table-question-answering" data-type="bart" data-passcount="7" data-compatall="0" data-accall="0" data-bothall="0" data-hasacc="0"><td class="model-col child-name" title="microsoft/tapex-large-finetuned-wikisql">tapex-large-finetuned-wikisql</td><td class="task-col">table-question-answering</td><td data-col="dml/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="migraphx/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="mlas/cpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/npu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/cpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/npu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-sa="1" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="vitisai/npu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td></tr>
+<tr class="child-row" data-group="microsoft" data-model="microsoft/tapex-large-finetuned-wtq" data-task="table-question-answering" data-type="bart" data-passcount="7" data-compatall="0" data-accall="0" data-bothall="0" data-hasacc="0"><td class="model-col child-name" title="microsoft/tapex-large-finetuned-wtq">tapex-large-finetuned-wtq</td><td class="task-col">table-question-answering</td><td data-col="dml/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="migraphx/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="mlas/cpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/npu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/cpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/npu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-sa="1" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="vitisai/npu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td></tr>
+<tr class="child-row" data-group="microsoft" data-model="microsoft/tapex-large-sql-execution" data-task="table-question-answering" data-type="bart" data-passcount="7" data-compatall="0" data-accall="0" data-bothall="0" data-hasacc="0"><td class="model-col child-name" title="microsoft/tapex-large-sql-execution">tapex-large-sql-execution</td><td class="task-col">table-question-answering</td><td data-col="dml/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="migraphx/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="mlas/cpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/npu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/cpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/npu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-sa="1" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="vitisai/npu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td></tr>
+<tr class="child-row" data-group="microsoft" data-model="microsoft/trocr-large-printed" data-task="image-to-text" data-type="vision-encoder-decoder" data-passcount="8" data-compatall="0" data-accall="0" data-bothall="0" data-hasacc="1"><td class="model-col child-name" title="microsoft/trocr-large-printed">trocr-large-printed</td><td class="task-col">image-to-text</td><td data-col="dml/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Character Error Rate (CER)" data-task="OCR / text recognition" data-logic="PASS if delta &lt; 10% (lower metric is better)" data-lowerbetter="1" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="migraphx/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Character Error Rate (CER)" data-task="OCR / text recognition" data-logic="PASS if delta &lt; 10% (lower metric is better)" data-lowerbetter="1" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="mlas/cpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Character Error Rate (CER)" data-task="OCR / text recognition" data-logic="PASS if delta &lt; 10% (lower metric is better)" data-lowerbetter="1" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="openvino/npu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Character Error Rate (CER)" data-task="OCR / text recognition" data-logic="PASS if delta &lt; 10% (lower metric is better)" data-lowerbetter="1" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-13.5%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="openvino/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Character Error Rate (CER)" data-task="OCR / text recognition" data-logic="PASS if delta &lt; 10% (lower metric is better)" data-lowerbetter="1" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="openvino/cpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Character Error Rate (CER)" data-task="OCR / text recognition" data-logic="PASS if delta &lt; 10% (lower metric is better)" data-lowerbetter="1" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="qnn/npu"><span class="cell split" data-compat="FAIL" data-acc="PASS" data-metric="Character Error Rate (CER)" data-task="OCR / text recognition" data-logic="PASS if delta &lt; 10% (lower metric is better)" data-lowerbetter="1" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-13.5%&quot;,&quot;best&quot;:true}]'><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="qnn/gpu"><span class="cell split" data-compat="FAIL" data-acc="REGRESSION" data-sa="1" data-metric="Character Error Rate (CER)" data-task="OCR / text recognition" data-logic="PASS if delta &lt; 10% (lower metric is better)" data-lowerbetter="1" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;REGRESSION&quot;,&quot;delta&quot;:&quot;+13.5%&quot;,&quot;best&quot;:true}]'><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc regr">▼</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Character Error Rate (CER)" data-task="OCR / text recognition" data-logic="PASS if delta &lt; 10% (lower metric is better)" data-lowerbetter="1" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="vitisai/npu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Character Error Rate (CER)" data-task="OCR / text recognition" data-logic="PASS if delta &lt; 10% (lower metric is better)" data-lowerbetter="1" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td></tr>
+<tr class="child-row" data-group="microsoft" data-model="microsoft/vibevoice-asr-hf" data-task="audio-text-to-text" data-type="vibevoice_asr" data-passcount="0" data-compatall="0" data-accall="0" data-bothall="0" data-hasacc="0"><td class="model-col child-name" title="microsoft/VibeVoice-ASR-HF">VibeVoice-ASR-HF</td><td class="task-col">audio-text-to-text</td><td data-col="dml/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="migraphx/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="mlas/cpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/npu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/cpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/npu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="vitisai/npu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td></tr>
+<tr class="child-row" data-group="microsoft" data-model="microsoft/vibevoice-realtime-0.5b" data-task="text-to-speech" data-type="vibevoice_streaming" data-passcount="0" data-compatall="0" data-accall="0" data-bothall="0" data-hasacc="0"><td class="model-col child-name" title="microsoft/VibeVoice-Realtime-0.5B">VibeVoice-Realtime-0.5B</td><td class="task-col">text-to-speech</td><td data-col="dml/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="migraphx/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="mlas/cpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/npu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/cpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/npu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="vitisai/npu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td></tr>
+<tr class="child-row" data-group="microsoft" data-model="microsoft/xclip-base-patch32" data-task="video-classification" data-type="xclip" data-passcount="0" data-compatall="0" data-accall="0" data-bothall="0" data-hasacc="0"><td class="model-col child-name" title="microsoft/xclip-base-patch32">xclip-base-patch32</td><td class="task-col">video-classification</td><td data-col="dml/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="migraphx/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="mlas/cpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/npu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/cpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/npu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="vitisai/npu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td></tr>
+<tr class="group-row" data-group="deepset"><td class="model-col"><span class="group-toggle"><span class="twisty">▼</span><span class="group-name">deepset</span></span></td><td class="task-col group-meta">3 models</td><td data-col="dml/gpu"><span class="gcell split" title="Compatibility 3/3 pass · Accuracy 3/3 pass"><span class="half compat pass">3/3</span><span class="sep">|</span><span class="half acc pass">3/3</span></span></td><td data-col="migraphx/gpu"><span class="gcell split" title="Compatibility 3/3 pass · Accuracy 3/3 pass"><span class="half compat pass">3/3</span><span class="sep">|</span><span class="half acc pass">3/3</span></span></td><td data-col="mlas/cpu"><span class="gcell split" title="Compatibility 3/3 pass · Accuracy 3/3 pass"><span class="half compat pass">3/3</span><span class="sep">|</span><span class="half acc pass">3/3</span></span></td><td data-col="openvino/npu"><span class="gcell split" title="Compatibility 3/3 pass · Accuracy 3/3 pass"><span class="half compat pass">3/3</span><span class="sep">|</span><span class="half acc pass">3/3</span></span></td><td data-col="openvino/gpu"><span class="gcell split" title="Compatibility 3/3 pass · Accuracy 3/3 pass"><span class="half compat pass">3/3</span><span class="sep">|</span><span class="half acc pass">3/3</span></span></td><td data-col="openvino/cpu"><span class="gcell split" title="Compatibility 3/3 pass · Accuracy 3/3 pass"><span class="half compat pass">3/3</span><span class="sep">|</span><span class="half acc pass">3/3</span></span></td><td data-col="qnn/npu"><span class="gcell split" title="Compatibility 3/3 pass · Accuracy 3/3 pass"><span class="half compat pass">3/3</span><span class="sep">|</span><span class="half acc pass">3/3</span></span></td><td data-col="qnn/gpu"><span class="gcell split" title="Compatibility 3/3 pass · Accuracy 3/3 pass"><span class="half compat pass">3/3</span><span class="sep">|</span><span class="half acc pass">3/3</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="gcell split" title="Compatibility 3/3 pass · Accuracy 3/3 pass"><span class="half compat pass">3/3</span><span class="sep">|</span><span class="half acc pass">3/3</span></span></td><td data-col="vitisai/npu"><span class="gcell split" title="Compatibility 3/3 pass · Accuracy 3/3 pass"><span class="half compat pass">3/3</span><span class="sep">|</span><span class="half acc pass">3/3</span></span></td></tr>
+<tr class="child-row" data-group="deepset" data-model="deepset/bert-large-uncased-whole-word-masking-squad2" data-task="question-answering" data-type="bert" data-passcount="10" data-compatall="1" data-accall="1" data-bothall="1" data-hasacc="1"><td class="model-col child-name" title="deepset/bert-large-uncased-whole-word-masking-squad2">bert-large-uncased-whole-word-masking-squad2</td><td class="task-col">question-answering</td><td data-col="dml/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="F1 Score" data-task="Question answering" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="migraphx/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="F1 Score" data-task="Question answering" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="mlas/cpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="F1 Score" data-task="Question answering" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="openvino/npu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="F1 Score" data-task="Question answering" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true},{&quot;precision&quot;:&quot;w8a16&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.1%&quot;}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="openvino/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="F1 Score" data-task="Question answering" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="openvino/cpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="F1 Score" data-task="Question answering" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="qnn/npu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="F1 Score" data-task="Question answering" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true},{&quot;precision&quot;:&quot;w8a16&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-1.2%&quot;},{&quot;precision&quot;:&quot;w8a8&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-9.7%&quot;}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="qnn/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="F1 Score" data-task="Question answering" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="F1 Score" data-task="Question answering" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="vitisai/npu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="F1 Score" data-task="Question answering" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true},{&quot;precision&quot;:&quot;w8a16&quot;,&quot;verdict&quot;:&quot;REGRESSION&quot;,&quot;delta&quot;:&quot;-95.6%&quot;},{&quot;precision&quot;:&quot;w8a8&quot;,&quot;verdict&quot;:&quot;REGRESSION&quot;,&quot;delta&quot;:&quot;-96.0%&quot;}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td></tr>
+<tr class="child-row" data-group="deepset" data-model="deepset/roberta-base-squad2" data-task="question-answering" data-type="roberta" data-passcount="10" data-compatall="1" data-accall="1" data-bothall="1" data-hasacc="1"><td class="model-col child-name" title="deepset/roberta-base-squad2">roberta-base-squad2</td><td class="task-col">question-answering</td><td data-col="dml/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="F1 Score" data-task="Question answering" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="migraphx/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="F1 Score" data-task="Question answering" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="mlas/cpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="F1 Score" data-task="Question answering" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="openvino/npu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="F1 Score" data-task="Question answering" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-0.0%&quot;,&quot;best&quot;:true},{&quot;precision&quot;:&quot;w8a16&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.2%&quot;}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="openvino/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="F1 Score" data-task="Question answering" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="openvino/cpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="F1 Score" data-task="Question answering" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="qnn/npu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="F1 Score" data-task="Question answering" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-0.0%&quot;,&quot;best&quot;:true},{&quot;precision&quot;:&quot;w8a16&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-2.6%&quot;},{&quot;precision&quot;:&quot;w8a8&quot;,&quot;verdict&quot;:&quot;REGRESSION&quot;,&quot;delta&quot;:&quot;-38.8%&quot;}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="qnn/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="F1 Score" data-task="Question answering" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="F1 Score" data-task="Question answering" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="vitisai/npu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="F1 Score" data-task="Question answering" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-2.3%&quot;,&quot;best&quot;:true},{&quot;precision&quot;:&quot;w8a16&quot;,&quot;verdict&quot;:&quot;REGRESSION&quot;,&quot;delta&quot;:&quot;-79.9%&quot;},{&quot;precision&quot;:&quot;w8a8&quot;,&quot;verdict&quot;:&quot;REGRESSION&quot;,&quot;delta&quot;:&quot;-76.7%&quot;}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td></tr>
+<tr class="child-row" data-group="deepset" data-model="deepset/tinyroberta-squad2" data-task="question-answering" data-type="roberta" data-passcount="10" data-compatall="1" data-accall="1" data-bothall="1" data-hasacc="1"><td class="model-col child-name" title="deepset/tinyroberta-squad2">tinyroberta-squad2</td><td class="task-col">question-answering</td><td data-col="dml/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="F1 Score" data-task="Question answering" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-0.2%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="migraphx/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="F1 Score" data-task="Question answering" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-0.2%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="mlas/cpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="F1 Score" data-task="Question answering" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-0.2%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="openvino/npu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="F1 Score" data-task="Question answering" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true},{&quot;precision&quot;:&quot;w8a16&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-0.2%&quot;}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="openvino/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="F1 Score" data-task="Question answering" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-0.2%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="openvino/cpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="F1 Score" data-task="Question answering" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-0.2%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="qnn/npu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="F1 Score" data-task="Question answering" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true},{&quot;precision&quot;:&quot;w8a16&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-7.1%&quot;},{&quot;precision&quot;:&quot;w8a8&quot;,&quot;verdict&quot;:&quot;REGRESSION&quot;,&quot;delta&quot;:&quot;-19.4%&quot;}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="qnn/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="F1 Score" data-task="Question answering" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-0.2%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="F1 Score" data-task="Question answering" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-0.2%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="vitisai/npu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="F1 Score" data-task="Question answering" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true},{&quot;precision&quot;:&quot;w8a16&quot;,&quot;verdict&quot;:&quot;REGRESSION&quot;,&quot;delta&quot;:&quot;-94.6%&quot;},{&quot;precision&quot;:&quot;w8a8&quot;,&quot;verdict&quot;:&quot;REGRESSION&quot;,&quot;delta&quot;:&quot;-95.1%&quot;}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td></tr>
+<tr class="group-row" data-group="facebookai"><td class="model-col"><span class="group-toggle"><span class="twisty">▼</span><span class="group-name">FacebookAI</span></span></td><td class="task-col group-meta">4 models</td><td data-col="dml/gpu"><span class="gcell split" title="Compatibility 3/4 pass · Accuracy 3/4 pass"><span class="half compat regr">3/4</span><span class="sep">|</span><span class="half acc regr">3/4</span></span></td><td data-col="migraphx/gpu"><span class="gcell split" title="Compatibility 4/4 pass · Accuracy 4/4 pass"><span class="half compat pass">4/4</span><span class="sep">|</span><span class="half acc pass">4/4</span></span></td><td data-col="mlas/cpu"><span class="gcell split" title="Compatibility 4/4 pass · Accuracy 4/4 pass"><span class="half compat pass">4/4</span><span class="sep">|</span><span class="half acc pass">4/4</span></span></td><td data-col="openvino/npu"><span class="gcell split" title="Compatibility 4/4 pass · Accuracy 4/4 pass"><span class="half compat pass">4/4</span><span class="sep">|</span><span class="half acc pass">4/4</span></span></td><td data-col="openvino/gpu"><span class="gcell split" title="Compatibility 4/4 pass · Accuracy 4/4 pass"><span class="half compat pass">4/4</span><span class="sep">|</span><span class="half acc pass">4/4</span></span></td><td data-col="openvino/cpu"><span class="gcell split" title="Compatibility 4/4 pass · Accuracy 3/4 pass"><span class="half compat pass">4/4</span><span class="sep">|</span><span class="half acc regr">3/4</span></span></td><td data-col="qnn/npu"><span class="gcell split" title="Compatibility 4/4 pass · Accuracy 4/4 pass"><span class="half compat pass">4/4</span><span class="sep">|</span><span class="half acc pass">4/4</span></span></td><td data-col="qnn/gpu"><span class="gcell split" title="Compatibility 4/4 pass · Accuracy 3/4 pass"><span class="half compat pass">4/4</span><span class="sep">|</span><span class="half acc regr">3/4</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="gcell split" title="Compatibility 4/4 pass · Accuracy 4/4 pass"><span class="half compat pass">4/4</span><span class="sep">|</span><span class="half acc pass">4/4</span></span></td><td data-col="vitisai/npu"><span class="gcell split" title="Compatibility 4/4 pass · Accuracy 4/4 pass"><span class="half compat pass">4/4</span><span class="sep">|</span><span class="half acc pass">4/4</span></span></td></tr>
+<tr class="child-row" data-group="facebookai" data-model="facebookai/roberta-base" data-task="fill-mask" data-type="roberta" data-passcount="10" data-compatall="1" data-accall="1" data-bothall="1" data-hasacc="1"><td class="model-col child-name" title="FacebookAI/roberta-base">roberta-base</td><td class="task-col">fill-mask</td><td data-col="dml/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Pseudo-Perplexity" data-task="Masked language modeling" data-logic="PASS if delta &lt; 10% (lower metric is better)" data-lowerbetter="1" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="migraphx/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Pseudo-Perplexity" data-task="Masked language modeling" data-logic="PASS if delta &lt; 10% (lower metric is better)" data-lowerbetter="1" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="mlas/cpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Pseudo-Perplexity" data-task="Masked language modeling" data-logic="PASS if delta &lt; 10% (lower metric is better)" data-lowerbetter="1" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="openvino/npu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Pseudo-Perplexity" data-task="Masked language modeling" data-logic="PASS if delta &lt; 10% (lower metric is better)" data-lowerbetter="1" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true},{&quot;precision&quot;:&quot;w8a16&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+1.1%&quot;}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="openvino/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Pseudo-Perplexity" data-task="Masked language modeling" data-logic="PASS if delta &lt; 10% (lower metric is better)" data-lowerbetter="1" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="openvino/cpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Pseudo-Perplexity" data-task="Masked language modeling" data-logic="PASS if delta &lt; 10% (lower metric is better)" data-lowerbetter="1" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="qnn/npu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Pseudo-Perplexity" data-task="Masked language modeling" data-logic="PASS if delta &lt; 10% (lower metric is better)" data-lowerbetter="1" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-0.2%&quot;,&quot;best&quot;:true},{&quot;precision&quot;:&quot;w8a16&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+1.7%&quot;},{&quot;precision&quot;:&quot;w8a8&quot;,&quot;verdict&quot;:&quot;REGRESSION&quot;,&quot;delta&quot;:&quot;diverged&quot;}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="qnn/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Pseudo-Perplexity" data-task="Masked language modeling" data-logic="PASS if delta &lt; 10% (lower metric is better)" data-lowerbetter="1" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Pseudo-Perplexity" data-task="Masked language modeling" data-logic="PASS if delta &lt; 10% (lower metric is better)" data-lowerbetter="1" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="vitisai/npu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Pseudo-Perplexity" data-task="Masked language modeling" data-logic="PASS if delta &lt; 10% (lower metric is better)" data-lowerbetter="1" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+1.3%&quot;,&quot;best&quot;:true},{&quot;precision&quot;:&quot;w8a16&quot;,&quot;verdict&quot;:&quot;REGRESSION&quot;,&quot;delta&quot;:&quot;diverged&quot;},{&quot;precision&quot;:&quot;w8a8&quot;,&quot;verdict&quot;:&quot;REGRESSION&quot;,&quot;delta&quot;:&quot;diverged&quot;}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td></tr>
+<tr class="child-row" data-group="facebookai" data-model="facebookai/roberta-large" data-task="fill-mask" data-type="roberta" data-passcount="10" data-compatall="1" data-accall="1" data-bothall="1" data-hasacc="1"><td class="model-col child-name" title="FacebookAI/roberta-large">roberta-large</td><td class="task-col">fill-mask</td><td data-col="dml/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Pseudo-Perplexity" data-task="Masked language modeling" data-logic="PASS if delta &lt; 10% (lower metric is better)" data-lowerbetter="1" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="migraphx/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Pseudo-Perplexity" data-task="Masked language modeling" data-logic="PASS if delta &lt; 10% (lower metric is better)" data-lowerbetter="1" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="mlas/cpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Pseudo-Perplexity" data-task="Masked language modeling" data-logic="PASS if delta &lt; 10% (lower metric is better)" data-lowerbetter="1" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="openvino/npu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Pseudo-Perplexity" data-task="Masked language modeling" data-logic="PASS if delta &lt; 10% (lower metric is better)" data-lowerbetter="1" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.1%&quot;,&quot;best&quot;:true},{&quot;precision&quot;:&quot;w8a16&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+1.2%&quot;}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="openvino/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Pseudo-Perplexity" data-task="Masked language modeling" data-logic="PASS if delta &lt; 10% (lower metric is better)" data-lowerbetter="1" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="openvino/cpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Pseudo-Perplexity" data-task="Masked language modeling" data-logic="PASS if delta &lt; 10% (lower metric is better)" data-lowerbetter="1" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="qnn/npu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Pseudo-Perplexity" data-task="Masked language modeling" data-logic="PASS if delta &lt; 10% (lower metric is better)" data-lowerbetter="1" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-0.1%&quot;,&quot;best&quot;:true},{&quot;precision&quot;:&quot;w8a16&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+2.5%&quot;},{&quot;precision&quot;:&quot;w8a8&quot;,&quot;verdict&quot;:&quot;REGRESSION&quot;,&quot;delta&quot;:&quot;diverged&quot;}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="qnn/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Pseudo-Perplexity" data-task="Masked language modeling" data-logic="PASS if delta &lt; 10% (lower metric is better)" data-lowerbetter="1" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Pseudo-Perplexity" data-task="Masked language modeling" data-logic="PASS if delta &lt; 10% (lower metric is better)" data-lowerbetter="1" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="vitisai/npu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Pseudo-Perplexity" data-task="Masked language modeling" data-logic="PASS if delta &lt; 10% (lower metric is better)" data-lowerbetter="1" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.9%&quot;,&quot;best&quot;:true},{&quot;precision&quot;:&quot;w8a16&quot;,&quot;verdict&quot;:&quot;REGRESSION&quot;,&quot;delta&quot;:&quot;diverged&quot;},{&quot;precision&quot;:&quot;w8a8&quot;,&quot;verdict&quot;:&quot;REGRESSION&quot;,&quot;delta&quot;:&quot;diverged&quot;}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td></tr>
+<tr class="child-row" data-group="facebookai" data-model="facebookai/xlm-roberta-base" data-task="fill-mask" data-type="xlm-roberta" data-passcount="10" data-compatall="1" data-accall="1" data-bothall="1" data-hasacc="1"><td class="model-col child-name" title="FacebookAI/xlm-roberta-base">xlm-roberta-base</td><td class="task-col">fill-mask</td><td data-col="dml/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Pseudo-Perplexity" data-task="Masked language modeling" data-logic="PASS if delta &lt; 10% (lower metric is better)" data-lowerbetter="1" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="migraphx/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Pseudo-Perplexity" data-task="Masked language modeling" data-logic="PASS if delta &lt; 10% (lower metric is better)" data-lowerbetter="1" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="mlas/cpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Pseudo-Perplexity" data-task="Masked language modeling" data-logic="PASS if delta &lt; 10% (lower metric is better)" data-lowerbetter="1" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="openvino/npu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Pseudo-Perplexity" data-task="Masked language modeling" data-logic="PASS if delta &lt; 10% (lower metric is better)" data-lowerbetter="1" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-0.0%&quot;,&quot;best&quot;:true},{&quot;precision&quot;:&quot;w8a16&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+5.5%&quot;}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="openvino/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Pseudo-Perplexity" data-task="Masked language modeling" data-logic="PASS if delta &lt; 10% (lower metric is better)" data-lowerbetter="1" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="openvino/cpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Pseudo-Perplexity" data-task="Masked language modeling" data-logic="PASS if delta &lt; 10% (lower metric is better)" data-lowerbetter="1" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="qnn/npu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Pseudo-Perplexity" data-task="Masked language modeling" data-logic="PASS if delta &lt; 10% (lower metric is better)" data-lowerbetter="1" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-0.0%&quot;,&quot;best&quot;:true},{&quot;precision&quot;:&quot;w8a16&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+7.1%&quot;},{&quot;precision&quot;:&quot;w8a8&quot;,&quot;verdict&quot;:&quot;REGRESSION&quot;,&quot;delta&quot;:&quot;diverged&quot;}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="qnn/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Pseudo-Perplexity" data-task="Masked language modeling" data-logic="PASS if delta &lt; 10% (lower metric is better)" data-lowerbetter="1" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Pseudo-Perplexity" data-task="Masked language modeling" data-logic="PASS if delta &lt; 10% (lower metric is better)" data-lowerbetter="1" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="vitisai/npu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Pseudo-Perplexity" data-task="Masked language modeling" data-logic="PASS if delta &lt; 10% (lower metric is better)" data-lowerbetter="1" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+1.6%&quot;,&quot;best&quot;:true},{&quot;precision&quot;:&quot;w8a16&quot;,&quot;verdict&quot;:&quot;REGRESSION&quot;,&quot;delta&quot;:&quot;diverged&quot;},{&quot;precision&quot;:&quot;w8a8&quot;,&quot;verdict&quot;:&quot;REGRESSION&quot;,&quot;delta&quot;:&quot;diverged&quot;}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td></tr>
+<tr class="child-row" data-group="facebookai" data-model="facebookai/xlm-roberta-large" data-task="fill-mask" data-type="xlm-roberta" data-passcount="9" data-compatall="0" data-accall="0" data-bothall="0" data-hasacc="1"><td class="model-col child-name" title="FacebookAI/xlm-roberta-large">xlm-roberta-large</td><td class="task-col">fill-mask</td><td data-col="dml/gpu"><span class="cell split" data-compat="FAIL" data-acc="TIMEOUT" data-desc="Killed by the deadline before finishing (recoverable)."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc timeout">◷</span></span></td><td data-col="migraphx/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Pseudo-Perplexity" data-task="Masked language modeling" data-logic="PASS if delta &lt; 10% (lower metric is better)" data-lowerbetter="1" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="mlas/cpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Pseudo-Perplexity" data-task="Masked language modeling" data-logic="PASS if delta &lt; 10% (lower metric is better)" data-lowerbetter="1" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="openvino/npu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Pseudo-Perplexity" data-task="Masked language modeling" data-logic="PASS if delta &lt; 10% (lower metric is better)" data-lowerbetter="1" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true},{&quot;precision&quot;:&quot;w8a16&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+1.4%&quot;}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="openvino/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Pseudo-Perplexity" data-task="Masked language modeling" data-logic="PASS if delta &lt; 10% (lower metric is better)" data-lowerbetter="1" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="openvino/cpu"><span class="cell split" data-compat="PASS" data-acc="TIMEOUT" data-desc="Killed by the deadline before finishing (recoverable)."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc timeout">◷</span></span></td><td data-col="qnn/npu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Pseudo-Perplexity" data-task="Masked language modeling" data-logic="PASS if delta &lt; 10% (lower metric is better)" data-lowerbetter="1" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-0.1%&quot;,&quot;best&quot;:true},{&quot;precision&quot;:&quot;w8a16&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+1.5%&quot;},{&quot;precision&quot;:&quot;w8a8&quot;,&quot;verdict&quot;:&quot;REGRESSION&quot;,&quot;delta&quot;:&quot;diverged&quot;}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="qnn/gpu"><span class="cell split" data-compat="PASS" data-acc="REGRESSION" data-metric="Pseudo-Perplexity" data-task="Masked language modeling" data-logic="PASS if delta &lt; 10% (lower metric is better)" data-lowerbetter="1" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;REGRESSION&quot;,&quot;delta&quot;:&quot;diverged&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc regr">▼</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Pseudo-Perplexity" data-task="Masked language modeling" data-logic="PASS if delta &lt; 10% (lower metric is better)" data-lowerbetter="1" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="vitisai/npu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Pseudo-Perplexity" data-task="Masked language modeling" data-logic="PASS if delta &lt; 10% (lower metric is better)" data-lowerbetter="1" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+1.3%&quot;,&quot;best&quot;:true},{&quot;precision&quot;:&quot;w8a16&quot;,&quot;verdict&quot;:&quot;REGRESSION&quot;,&quot;delta&quot;:&quot;diverged&quot;},{&quot;precision&quot;:&quot;w8a8&quot;,&quot;verdict&quot;:&quot;REGRESSION&quot;,&quot;delta&quot;:&quot;diverged&quot;}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td></tr>
+<tr class="group-row" data-group="intel"><td class="model-col"><span class="group-toggle"><span class="twisty">▼</span><span class="group-name">Intel</span></span></td><td class="task-col group-meta">4 models · 5 pairs</td><td data-col="dml/gpu"><span class="gcell split" title="Compatibility 5/5 pass · Accuracy 2/2 pass"><span class="half compat pass">5/5</span><span class="sep">|</span><span class="half acc pass">2/2</span></span></td><td data-col="migraphx/gpu"><span class="gcell split" title="Compatibility 5/5 pass · Accuracy 2/2 pass"><span class="half compat pass">5/5</span><span class="sep">|</span><span class="half acc pass">2/2</span></span></td><td data-col="mlas/cpu"><span class="gcell split" title="Compatibility 5/5 pass · Accuracy 2/2 pass"><span class="half compat pass">5/5</span><span class="sep">|</span><span class="half acc pass">2/2</span></span></td><td data-col="openvino/npu"><span class="gcell split" title="Compatibility 5/5 pass · Accuracy 2/2 pass"><span class="half compat pass">5/5</span><span class="sep">|</span><span class="half acc pass">2/2</span></span></td><td data-col="openvino/gpu"><span class="gcell split" title="Compatibility 4/5 pass · Accuracy 2/2 pass"><span class="half compat regr">4/5</span><span class="sep">|</span><span class="half acc pass">2/2</span></span></td><td data-col="openvino/cpu"><span class="gcell split" title="Compatibility 4/5 pass · Accuracy 2/2 pass"><span class="half compat regr">4/5</span><span class="sep">|</span><span class="half acc pass">2/2</span></span></td><td data-col="qnn/npu"><span class="gcell split" title="Compatibility 4/5 pass · Accuracy 2/2 pass"><span class="half compat regr">4/5</span><span class="sep">|</span><span class="half acc pass">2/2</span></span></td><td data-col="qnn/gpu"><span class="gcell split" title="Compatibility 5/5 pass · Accuracy 2/2 pass"><span class="half compat pass">5/5</span><span class="sep">|</span><span class="half acc pass">2/2</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="gcell split" title="Compatibility 5/5 pass · Accuracy 2/2 pass"><span class="half compat pass">5/5</span><span class="sep">|</span><span class="half acc pass">2/2</span></span></td><td data-col="vitisai/npu"><span class="gcell split" title="Compatibility 4/5 pass · Accuracy 2/2 pass"><span class="half compat regr">4/5</span><span class="sep">|</span><span class="half acc pass">2/2</span></span></td></tr>
+<tr class="child-row" data-group="intel" data-model="intel/bert-base-uncased-mrpc" data-task="feature-extraction" data-type="bert" data-passcount="10" data-compatall="1" data-accall="1" data-bothall="1" data-hasacc="1"><td class="model-col child-name" title="Intel/bert-base-uncased-mrpc">bert-base-uncased-mrpc</td><td class="task-col">feature-extraction</td><td data-col="dml/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Spearman Correlation" data-task="Sentence similarity / embeddings" data-logic="PASS if absolute delta &lt; 4.0" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.00&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="migraphx/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Spearman Correlation" data-task="Sentence similarity / embeddings" data-logic="PASS if absolute delta &lt; 4.0" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.00&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="mlas/cpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Spearman Correlation" data-task="Sentence similarity / embeddings" data-logic="PASS if absolute delta &lt; 4.0" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.00&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="openvino/npu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Spearman Correlation" data-task="Sentence similarity / embeddings" data-logic="PASS if absolute delta &lt; 4.0" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-0.08&quot;,&quot;best&quot;:true},{&quot;precision&quot;:&quot;w8a16&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-0.40&quot;}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="openvino/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Spearman Correlation" data-task="Sentence similarity / embeddings" data-logic="PASS if absolute delta &lt; 4.0" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-0.00&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="openvino/cpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Spearman Correlation" data-task="Sentence similarity / embeddings" data-logic="PASS if absolute delta &lt; 4.0" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.00&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="qnn/npu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Spearman Correlation" data-task="Sentence similarity / embeddings" data-logic="PASS if absolute delta &lt; 4.0" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.03&quot;,&quot;best&quot;:true},{&quot;precision&quot;:&quot;w8a16&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-0.42&quot;},{&quot;precision&quot;:&quot;w8a8&quot;,&quot;verdict&quot;:&quot;REGRESSION&quot;,&quot;delta&quot;:&quot;-31.53&quot;}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="qnn/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Spearman Correlation" data-task="Sentence similarity / embeddings" data-logic="PASS if absolute delta &lt; 4.0" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.00&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Spearman Correlation" data-task="Sentence similarity / embeddings" data-logic="PASS if absolute delta &lt; 4.0" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-0.01&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="vitisai/npu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Spearman Correlation" data-task="Sentence similarity / embeddings" data-logic="PASS if absolute delta &lt; 4.0" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-0.03&quot;,&quot;best&quot;:true},{&quot;precision&quot;:&quot;w8a16&quot;,&quot;verdict&quot;:&quot;FAIL&quot;,&quot;delta&quot;:null},{&quot;precision&quot;:&quot;w8a8&quot;,&quot;verdict&quot;:&quot;REGRESSION&quot;,&quot;delta&quot;:&quot;-37.48&quot;}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td></tr>
+<tr class="child-row" data-group="intel" data-model="intel/bert-base-uncased-mrpc" data-task="text-classification" data-type="bert" data-passcount="10" data-compatall="1" data-accall="1" data-bothall="1" data-hasacc="1"><td class="model-col child-name" title="Intel/bert-base-uncased-mrpc">bert-base-uncased-mrpc</td><td class="task-col">text-classification</td><td data-col="dml/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Accuracy" data-task="Text classification" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="migraphx/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Accuracy" data-task="Text classification" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="mlas/cpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Accuracy" data-task="Text classification" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="openvino/npu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Accuracy" data-task="Text classification" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true},{&quot;precision&quot;:&quot;w8a16&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="openvino/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Accuracy" data-task="Text classification" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="openvino/cpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Accuracy" data-task="Text classification" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="qnn/npu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Accuracy" data-task="Text classification" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true},{&quot;precision&quot;:&quot;w8a16&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;},{&quot;precision&quot;:&quot;w8a8&quot;,&quot;verdict&quot;:&quot;REGRESSION&quot;,&quot;delta&quot;:&quot;-15.1%&quot;}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="qnn/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Accuracy" data-task="Text classification" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Accuracy" data-task="Text classification" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="vitisai/npu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Accuracy" data-task="Text classification" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-2.4%&quot;,&quot;best&quot;:true},{&quot;precision&quot;:&quot;w8a16&quot;,&quot;verdict&quot;:&quot;FAIL&quot;,&quot;delta&quot;:null},{&quot;precision&quot;:&quot;w8a8&quot;,&quot;verdict&quot;:&quot;REGRESSION&quot;,&quot;delta&quot;:&quot;-13.1%&quot;}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td></tr>
+<tr class="child-row" data-group="intel" data-model="intel/dpt-hybrid-midas" data-task="depth-estimation" data-type="dpt" data-passcount="10" data-compatall="1" data-accall="0" data-bothall="0" data-hasacc="0"><td class="model-col child-name" title="Intel/dpt-hybrid-midas">dpt-hybrid-midas</td><td class="task-col">depth-estimation</td><td data-col="dml/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="migraphx/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="mlas/cpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/npu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/cpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/npu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="vitisai/npu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td></tr>
+<tr class="child-row" data-group="intel" data-model="intel/dpt-large" data-task="depth-estimation" data-type="dpt" data-passcount="10" data-compatall="1" data-accall="0" data-bothall="0" data-hasacc="0"><td class="model-col child-name" title="Intel/dpt-large">dpt-large</td><td class="task-col">depth-estimation</td><td data-col="dml/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="migraphx/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="mlas/cpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/npu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/cpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/npu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="vitisai/npu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td></tr>
+<tr class="child-row" data-group="intel" data-model="intel/zoedepth-nyu-kitti" data-task="depth-estimation" data-type="zoedepth" data-passcount="6" data-compatall="0" data-accall="0" data-bothall="0" data-hasacc="0"><td class="model-col child-name" title="Intel/zoedepth-nyu-kitti">zoedepth-nyu-kitti</td><td class="task-col">depth-estimation</td><td data-col="dml/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="migraphx/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="mlas/cpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/npu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-sa="1" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/cpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/npu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="vitisai/npu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td></tr>
+<tr class="group-row" data-group="openai"><td class="model-col"><span class="group-toggle"><span class="twisty">▼</span><span class="group-name">openai</span></span></td><td class="task-col group-meta">5 models · 9 pairs</td><td data-col="dml/gpu"><span class="gcell split" title="Compatibility 6/9 pass · Accuracy 6/6 pass"><span class="half compat regr">6/9</span><span class="sep">|</span><span class="half acc pass">6/6</span></span></td><td data-col="migraphx/gpu"><span class="gcell split" title="Compatibility 6/9 pass · Accuracy 5/6 pass"><span class="half compat regr">6/9</span><span class="sep">|</span><span class="half acc regr">5/6</span></span></td><td data-col="mlas/cpu"><span class="gcell split" title="Compatibility 6/9 pass · Accuracy 6/6 pass"><span class="half compat regr">6/9</span><span class="sep">|</span><span class="half acc pass">6/6</span></span></td><td data-col="openvino/npu"><span class="gcell split" title="Compatibility 6/9 pass · Accuracy 6/6 pass"><span class="half compat regr">6/9</span><span class="sep">|</span><span class="half acc pass">6/6</span></span></td><td data-col="openvino/gpu"><span class="gcell split" title="Compatibility 6/9 pass · Accuracy 6/6 pass"><span class="half compat regr">6/9</span><span class="sep">|</span><span class="half acc pass">6/6</span></span></td><td data-col="openvino/cpu"><span class="gcell split" title="Compatibility 6/9 pass · Accuracy 6/6 pass"><span class="half compat regr">6/9</span><span class="sep">|</span><span class="half acc pass">6/6</span></span></td><td data-col="qnn/npu"><span class="gcell split" title="Compatibility 3/9 pass · Accuracy 6/6 pass"><span class="half compat regr">3/9</span><span class="sep">|</span><span class="half acc pass">6/6</span></span></td><td data-col="qnn/gpu"><span class="gcell split" title="Compatibility 6/9 pass · Accuracy 4/6 pass"><span class="half compat regr">6/9</span><span class="sep">|</span><span class="half acc regr">4/6</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="gcell split" title="Compatibility 6/9 pass · Accuracy 6/6 pass"><span class="half compat regr">6/9</span><span class="sep">|</span><span class="half acc pass">6/6</span></span></td><td data-col="vitisai/npu"><span class="gcell split" title="Compatibility 6/9 pass · Accuracy 3/6 pass"><span class="half compat regr">6/9</span><span class="sep">|</span><span class="half acc regr">3/6</span></span></td></tr>
+<tr class="child-row" data-group="openai" data-model="openai/clip-vit-base-patch16" data-task="feature-extraction" data-type="clip" data-passcount="10" data-compatall="1" data-accall="1" data-bothall="1" data-hasacc="1"><td class="model-col child-name" title="openai/clip-vit-base-patch16">clip-vit-base-patch16</td><td class="task-col">feature-extraction</td><td data-col="dml/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Spearman Correlation" data-task="Sentence similarity / embeddings" data-logic="PASS if absolute delta &lt; 4.0" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.00&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="migraphx/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Spearman Correlation" data-task="Sentence similarity / embeddings" data-logic="PASS if absolute delta &lt; 4.0" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.00&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="mlas/cpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Spearman Correlation" data-task="Sentence similarity / embeddings" data-logic="PASS if absolute delta &lt; 4.0" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.00&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="openvino/npu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Spearman Correlation" data-task="Sentence similarity / embeddings" data-logic="PASS if absolute delta &lt; 4.0" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.01&quot;,&quot;best&quot;:true},{&quot;precision&quot;:&quot;w8a16&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-0.31&quot;}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="openvino/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Spearman Correlation" data-task="Sentence similarity / embeddings" data-logic="PASS if absolute delta &lt; 4.0" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-0.00&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="openvino/cpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Spearman Correlation" data-task="Sentence similarity / embeddings" data-logic="PASS if absolute delta &lt; 4.0" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.00&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="qnn/npu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Spearman Correlation" data-task="Sentence similarity / embeddings" data-logic="PASS if absolute delta &lt; 4.0" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.01&quot;,&quot;best&quot;:true},{&quot;precision&quot;:&quot;w8a16&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-0.27&quot;},{&quot;precision&quot;:&quot;w8a8&quot;,&quot;verdict&quot;:&quot;REGRESSION&quot;,&quot;delta&quot;:&quot;-64.57&quot;}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="qnn/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Spearman Correlation" data-task="Sentence similarity / embeddings" data-logic="PASS if absolute delta &lt; 4.0" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.00&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Spearman Correlation" data-task="Sentence similarity / embeddings" data-logic="PASS if absolute delta &lt; 4.0" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-0.01&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="vitisai/npu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Spearman Correlation" data-task="Sentence similarity / embeddings" data-logic="PASS if absolute delta &lt; 4.0" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-0.53&quot;,&quot;best&quot;:true},{&quot;precision&quot;:&quot;w8a16&quot;,&quot;verdict&quot;:&quot;REGRESSION&quot;,&quot;delta&quot;:&quot;-60.33&quot;},{&quot;precision&quot;:&quot;w8a8&quot;,&quot;verdict&quot;:&quot;REGRESSION&quot;,&quot;delta&quot;:&quot;-64.57&quot;}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td></tr>
+<tr class="child-row" data-group="openai" data-model="openai/clip-vit-base-patch32" data-task="feature-extraction" data-type="clip" data-passcount="10" data-compatall="1" data-accall="1" data-bothall="1" data-hasacc="1"><td class="model-col child-name" title="openai/clip-vit-base-patch32">clip-vit-base-patch32</td><td class="task-col">feature-extraction</td><td data-col="dml/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Spearman Correlation" data-task="Sentence similarity / embeddings" data-logic="PASS if absolute delta &lt; 4.0" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.00&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="migraphx/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Spearman Correlation" data-task="Sentence similarity / embeddings" data-logic="PASS if absolute delta &lt; 4.0" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.00&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="mlas/cpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Spearman Correlation" data-task="Sentence similarity / embeddings" data-logic="PASS if absolute delta &lt; 4.0" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.00&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="openvino/npu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Spearman Correlation" data-task="Sentence similarity / embeddings" data-logic="PASS if absolute delta &lt; 4.0" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-0.01&quot;,&quot;best&quot;:true},{&quot;precision&quot;:&quot;w8a16&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-0.38&quot;}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="openvino/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Spearman Correlation" data-task="Sentence similarity / embeddings" data-logic="PASS if absolute delta &lt; 4.0" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.00&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="openvino/cpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Spearman Correlation" data-task="Sentence similarity / embeddings" data-logic="PASS if absolute delta &lt; 4.0" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.00&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="qnn/npu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Spearman Correlation" data-task="Sentence similarity / embeddings" data-logic="PASS if absolute delta &lt; 4.0" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-0.06&quot;,&quot;best&quot;:true},{&quot;precision&quot;:&quot;w8a16&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-0.14&quot;},{&quot;precision&quot;:&quot;w8a8&quot;,&quot;verdict&quot;:&quot;REGRESSION&quot;,&quot;delta&quot;:&quot;-53.77&quot;}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="qnn/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Spearman Correlation" data-task="Sentence similarity / embeddings" data-logic="PASS if absolute delta &lt; 4.0" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.00&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Spearman Correlation" data-task="Sentence similarity / embeddings" data-logic="PASS if absolute delta &lt; 4.0" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-0.00&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="vitisai/npu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Spearman Correlation" data-task="Sentence similarity / embeddings" data-logic="PASS if absolute delta &lt; 4.0" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+2.53&quot;,&quot;best&quot;:true},{&quot;precision&quot;:&quot;w8a16&quot;,&quot;verdict&quot;:&quot;REGRESSION&quot;,&quot;delta&quot;:&quot;-55.32&quot;},{&quot;precision&quot;:&quot;w8a8&quot;,&quot;verdict&quot;:&quot;REGRESSION&quot;,&quot;delta&quot;:&quot;-55.28&quot;}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td></tr>
+<tr class="child-row" data-group="openai" data-model="openai/clip-vit-base-patch32" data-task="zero-shot-image-classification" data-type="clip" data-passcount="10" data-compatall="1" data-accall="0" data-bothall="0" data-hasacc="1"><td class="model-col child-name" title="openai/clip-vit-base-patch32">clip-vit-base-patch32</td><td class="task-col">zero-shot-image-classification</td><td data-col="dml/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Accuracy" data-task="Image classification" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="migraphx/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="mlas/cpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Accuracy" data-task="Image classification" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="openvino/npu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Accuracy" data-task="Image classification" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true},{&quot;precision&quot;:&quot;w8a16&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+6.3%&quot;}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="openvino/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Accuracy" data-task="Image classification" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-0.2%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="openvino/cpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Accuracy" data-task="Image classification" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="qnn/npu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Accuracy" data-task="Image classification" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true},{&quot;precision&quot;:&quot;w8a16&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+3.9%&quot;},{&quot;precision&quot;:&quot;w8a8&quot;,&quot;verdict&quot;:&quot;REGRESSION&quot;,&quot;delta&quot;:&quot;-97.9%&quot;}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="qnn/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Accuracy" data-task="Image classification" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Accuracy" data-task="Image classification" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-0.2%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="vitisai/npu"><span class="cell split" data-compat="PASS" data-acc="REGRESSION" data-metric="Accuracy" data-task="Image classification" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;FAIL&quot;,&quot;delta&quot;:null},{&quot;precision&quot;:&quot;w8a16&quot;,&quot;verdict&quot;:&quot;FAIL&quot;,&quot;delta&quot;:null},{&quot;precision&quot;:&quot;w8a8&quot;,&quot;verdict&quot;:&quot;REGRESSION&quot;,&quot;delta&quot;:&quot;-98.5%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc regr">▼</span></span></td></tr>
+<tr class="child-row" data-group="openai" data-model="openai/clip-vit-base-patch16" data-task="zero-shot-image-classification" data-type="clip" data-passcount="9" data-compatall="0" data-accall="1" data-bothall="0" data-hasacc="1"><td class="model-col child-name" title="openai/clip-vit-base-patch16">clip-vit-base-patch16</td><td class="task-col">zero-shot-image-classification</td><td data-col="dml/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Accuracy" data-task="Image classification" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="migraphx/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Accuracy" data-task="Image classification" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="mlas/cpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Accuracy" data-task="Image classification" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="openvino/npu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Accuracy" data-task="Image classification" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-1.5%&quot;,&quot;best&quot;:true},{&quot;precision&quot;:&quot;w8a16&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+1.6%&quot;}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="openvino/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Accuracy" data-task="Image classification" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="openvino/cpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Accuracy" data-task="Image classification" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="qnn/npu"><span class="cell split" data-compat="FAIL" data-acc="PASS" data-metric="Accuracy" data-task="Image classification" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-1.5%&quot;,&quot;best&quot;:true},{&quot;precision&quot;:&quot;w8a16&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+1.0%&quot;},{&quot;precision&quot;:&quot;w8a8&quot;,&quot;verdict&quot;:&quot;REGRESSION&quot;,&quot;delta&quot;:&quot;-98.1%&quot;}]'><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="qnn/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Accuracy" data-task="Image classification" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Accuracy" data-task="Image classification" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="vitisai/npu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Accuracy" data-task="Image classification" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-7.6%&quot;,&quot;best&quot;:true},{&quot;precision&quot;:&quot;w8a16&quot;,&quot;verdict&quot;:&quot;FAIL&quot;,&quot;delta&quot;:null},{&quot;precision&quot;:&quot;w8a8&quot;,&quot;verdict&quot;:&quot;REGRESSION&quot;,&quot;delta&quot;:&quot;-98.1%&quot;}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td></tr>
+<tr class="child-row" data-group="openai" data-model="openai/clip-vit-base-patch16" data-task="zero-shot-classification" data-type="clip" data-passcount="0" data-compatall="0" data-accall="0" data-bothall="0" data-hasacc="0"><td class="model-col child-name" title="openai/clip-vit-base-patch16">clip-vit-base-patch16</td><td class="task-col">zero-shot-classification</td><td data-col="dml/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="migraphx/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="mlas/cpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/npu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/cpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/npu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="vitisai/npu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td></tr>
+<tr class="child-row" data-group="openai" data-model="openai/clip-vit-base-patch32" data-task="zero-shot-classification" data-type="clip" data-passcount="0" data-compatall="0" data-accall="0" data-bothall="0" data-hasacc="0"><td class="model-col child-name" title="openai/clip-vit-base-patch32">clip-vit-base-patch32</td><td class="task-col">zero-shot-classification</td><td data-col="dml/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="migraphx/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="mlas/cpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/npu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/cpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/npu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="vitisai/npu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td></tr>
+<tr class="child-row" data-group="openai" data-model="openai/clip-vit-large-patch14" data-task="zero-shot-image-classification" data-type="clip" data-passcount="9" data-compatall="0" data-accall="0" data-bothall="0" data-hasacc="1"><td class="model-col child-name" title="openai/clip-vit-large-patch14">clip-vit-large-patch14</td><td class="task-col">zero-shot-image-classification</td><td data-col="dml/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Accuracy" data-task="Image classification" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="migraphx/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Accuracy" data-task="Image classification" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="mlas/cpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Accuracy" data-task="Image classification" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="openvino/npu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Accuracy" data-task="Image classification" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true},{&quot;precision&quot;:&quot;w8a16&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-1.0%&quot;}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="openvino/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Accuracy" data-task="Image classification" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-0.3%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="openvino/cpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Accuracy" data-task="Image classification" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="qnn/npu"><span class="cell split" data-compat="FAIL" data-acc="PASS" data-metric="Accuracy" data-task="Image classification" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true},{&quot;precision&quot;:&quot;w8a16&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.3%&quot;},{&quot;precision&quot;:&quot;w8a8&quot;,&quot;verdict&quot;:&quot;REGRESSION&quot;,&quot;delta&quot;:&quot;-98.4%&quot;}]'><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="qnn/gpu"><span class="cell split" data-compat="PASS" data-acc="REGRESSION" data-metric="Accuracy" data-task="Image classification" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;REGRESSION&quot;,&quot;delta&quot;:&quot;-98.4%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc regr">▼</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Accuracy" data-task="Image classification" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-0.5%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="vitisai/npu"><span class="cell split" data-compat="PASS" data-acc="REGRESSION" data-metric="Accuracy" data-task="Image classification" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;REGRESSION&quot;,&quot;delta&quot;:&quot;-10.0%&quot;,&quot;best&quot;:true},{&quot;precision&quot;:&quot;w8a16&quot;,&quot;verdict&quot;:&quot;REGRESSION&quot;,&quot;delta&quot;:&quot;-98.9%&quot;},{&quot;precision&quot;:&quot;w8a8&quot;,&quot;verdict&quot;:&quot;REGRESSION&quot;,&quot;delta&quot;:&quot;-98.4%&quot;}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc regr">▼</span></span></td></tr>
+<tr class="child-row" data-group="openai" data-model="openai/clip-vit-large-patch14-336" data-task="zero-shot-image-classification" data-type="clip" data-passcount="9" data-compatall="0" data-accall="0" data-bothall="0" data-hasacc="1"><td class="model-col child-name" title="openai/clip-vit-large-patch14-336">clip-vit-large-patch14-336</td><td class="task-col">zero-shot-image-classification</td><td data-col="dml/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Accuracy" data-task="Image classification" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="migraphx/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Accuracy" data-task="Image classification" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="mlas/cpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Accuracy" data-task="Image classification" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="openvino/npu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Accuracy" data-task="Image classification" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true},{&quot;precision&quot;:&quot;w8a16&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.7%&quot;}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="openvino/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Accuracy" data-task="Image classification" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="openvino/cpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Accuracy" data-task="Image classification" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="qnn/npu"><span class="cell split" data-compat="FAIL" data-acc="PASS" data-metric="Accuracy" data-task="Image classification" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+1.3%&quot;,&quot;best&quot;:true},{&quot;precision&quot;:&quot;w8a16&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.3%&quot;},{&quot;precision&quot;:&quot;w8a8&quot;,&quot;verdict&quot;:&quot;REGRESSION&quot;,&quot;delta&quot;:&quot;-98.4%&quot;}]'><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="qnn/gpu"><span class="cell split" data-compat="PASS" data-acc="REGRESSION" data-metric="Accuracy" data-task="Image classification" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;REGRESSION&quot;,&quot;delta&quot;:&quot;-98.4%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc regr">▼</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Accuracy" data-task="Image classification" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-0.1%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="vitisai/npu"><span class="cell split" data-compat="PASS" data-acc="REGRESSION" data-metric="Accuracy" data-task="Image classification" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;REGRESSION&quot;,&quot;delta&quot;:&quot;-10.1%&quot;,&quot;best&quot;:true},{&quot;precision&quot;:&quot;w8a16&quot;,&quot;verdict&quot;:&quot;REGRESSION&quot;,&quot;delta&quot;:&quot;-98.6%&quot;},{&quot;precision&quot;:&quot;w8a8&quot;,&quot;verdict&quot;:&quot;REGRESSION&quot;,&quot;delta&quot;:&quot;-98.4%&quot;}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc regr">▼</span></span></td></tr>
+<tr class="child-row" data-group="openai" data-model="openai/gpt-oss-20b" data-task="text-generation" data-type="gpt_oss" data-passcount="0" data-compatall="0" data-accall="0" data-bothall="0" data-hasacc="0"><td class="model-col child-name" title="openai/gpt-oss-20b">gpt-oss-20b</td><td class="task-col">text-generation</td><td data-col="dml/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="migraphx/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="mlas/cpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/npu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/cpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/npu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="vitisai/npu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td></tr>
+<tr class="group-row" data-group="google"><td class="model-col"><span class="group-toggle"><span class="twisty">▼</span><span class="group-name">google</span></span></td><td class="task-col group-meta">10 models · 12 pairs</td><td data-col="dml/gpu"><span class="gcell split" title="Compatibility 7/12 pass · Accuracy 2/2 pass"><span class="half compat regr">7/12</span><span class="sep">|</span><span class="half acc pass">2/2</span></span></td><td data-col="migraphx/gpu"><span class="gcell split" title="Compatibility 9/12 pass · Accuracy 2/2 pass"><span class="half compat regr">9/12</span><span class="sep">|</span><span class="half acc pass">2/2</span></span></td><td data-col="mlas/cpu"><span class="gcell split" title="Compatibility 7/12 pass · Accuracy 2/2 pass"><span class="half compat regr">7/12</span><span class="sep">|</span><span class="half acc pass">2/2</span></span></td><td data-col="openvino/npu"><span class="gcell split" title="Compatibility 7/12 pass · Accuracy 2/2 pass"><span class="half compat regr">7/12</span><span class="sep">|</span><span class="half acc pass">2/2</span></span></td><td data-col="openvino/gpu"><span class="gcell split" title="Compatibility 5/12 pass · Accuracy 2/2 pass"><span class="half compat regr">5/12</span><span class="sep">|</span><span class="half acc pass">2/2</span></span></td><td data-col="openvino/cpu"><span class="gcell split" title="Compatibility 7/12 pass · Accuracy 2/2 pass"><span class="half compat regr">7/12</span><span class="sep">|</span><span class="half acc pass">2/2</span></span></td><td data-col="qnn/npu"><span class="gcell split" title="Compatibility 7/12 pass · Accuracy 2/2 pass"><span class="half compat regr">7/12</span><span class="sep">|</span><span class="half acc pass">2/2</span></span></td><td data-col="qnn/gpu"><span class="gcell split" title="Compatibility 2/12 pass · Accuracy 2/2 pass"><span class="half compat regr">2/12</span><span class="sep">|</span><span class="half acc pass">2/2</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="gcell split" title="Compatibility 5/12 pass · Accuracy 2/2 pass"><span class="half compat regr">5/12</span><span class="sep">|</span><span class="half acc pass">2/2</span></span></td><td data-col="vitisai/npu"><span class="gcell split" title="Compatibility 8/12 pass · Accuracy 2/2 pass"><span class="half compat regr">8/12</span><span class="sep">|</span><span class="half acc pass">2/2</span></span></td></tr>
+<tr class="child-row" data-group="google" data-model="google/vit-base-patch16-224" data-task="image-classification" data-type="vit" data-passcount="10" data-compatall="1" data-accall="1" data-bothall="1" data-hasacc="1"><td class="model-col child-name" title="google/vit-base-patch16-224">vit-base-patch16-224</td><td class="task-col">image-classification</td><td data-col="dml/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Accuracy" data-task="Image classification" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="migraphx/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Accuracy" data-task="Image classification" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="mlas/cpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Accuracy" data-task="Image classification" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="openvino/npu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Accuracy" data-task="Image classification" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true},{&quot;precision&quot;:&quot;w8a16&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.4%&quot;}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="openvino/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Accuracy" data-task="Image classification" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="openvino/cpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Accuracy" data-task="Image classification" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="qnn/npu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Accuracy" data-task="Image classification" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true},{&quot;precision&quot;:&quot;w8a16&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.1%&quot;},{&quot;precision&quot;:&quot;w8a8&quot;,&quot;verdict&quot;:&quot;REGRESSION&quot;,&quot;delta&quot;:&quot;-99.7%&quot;}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="qnn/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Accuracy" data-task="Image classification" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Accuracy" data-task="Image classification" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="vitisai/npu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Accuracy" data-task="Image classification" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true},{&quot;precision&quot;:&quot;w8a16&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.1%&quot;},{&quot;precision&quot;:&quot;w8a8&quot;,&quot;verdict&quot;:&quot;REGRESSION&quot;,&quot;delta&quot;:&quot;-99.9%&quot;}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td></tr>
+<tr class="child-row" data-group="google" data-model="google/vit-base-patch16-224-in21k" data-task="image-feature-extraction" data-type="vit" data-passcount="10" data-compatall="1" data-accall="1" data-bothall="1" data-hasacc="1"><td class="model-col child-name" title="google/vit-base-patch16-224-in21k">vit-base-patch16-224-in21k</td><td class="task-col">image-feature-extraction</td><td data-col="dml/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="KNN Top-1 Accuracy" data-task="Image embeddings" data-logic="PASS if delta &lt; 5%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="migraphx/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="KNN Top-1 Accuracy" data-task="Image embeddings" data-logic="PASS if delta &lt; 5%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="mlas/cpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="KNN Top-1 Accuracy" data-task="Image embeddings" data-logic="PASS if delta &lt; 5%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="openvino/npu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="KNN Top-1 Accuracy" data-task="Image embeddings" data-logic="PASS if delta &lt; 5%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true},{&quot;precision&quot;:&quot;w8a16&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.1%&quot;}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="openvino/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="KNN Top-1 Accuracy" data-task="Image embeddings" data-logic="PASS if delta &lt; 5%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="openvino/cpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="KNN Top-1 Accuracy" data-task="Image embeddings" data-logic="PASS if delta &lt; 5%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="qnn/npu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="KNN Top-1 Accuracy" data-task="Image embeddings" data-logic="PASS if delta &lt; 5%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true},{&quot;precision&quot;:&quot;w8a16&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.2%&quot;},{&quot;precision&quot;:&quot;w8a8&quot;,&quot;verdict&quot;:&quot;REGRESSION&quot;,&quot;delta&quot;:&quot;-92.9%&quot;}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="qnn/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="KNN Top-1 Accuracy" data-task="Image embeddings" data-logic="PASS if delta &lt; 5%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="KNN Top-1 Accuracy" data-task="Image embeddings" data-logic="PASS if delta &lt; 5%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="vitisai/npu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="KNN Top-1 Accuracy" data-task="Image embeddings" data-logic="PASS if delta &lt; 5%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true},{&quot;precision&quot;:&quot;w8a16&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.2%&quot;},{&quot;precision&quot;:&quot;w8a8&quot;,&quot;verdict&quot;:&quot;REGRESSION&quot;,&quot;delta&quot;:&quot;-93.7%&quot;}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td></tr>
+<tr class="child-row" data-group="google" data-model="google/deplot" data-task="visual-question-answering" data-type="pix2struct" data-passcount="0" data-compatall="0" data-accall="0" data-bothall="0" data-hasacc="0"><td class="model-col child-name" title="google/deplot">deplot</td><td class="task-col">visual-question-answering</td><td data-col="dml/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="migraphx/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="mlas/cpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/npu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/cpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/npu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="vitisai/npu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td></tr>
+<tr class="child-row" data-group="google" data-model="google/flan-t5-base" data-task="" data-type="t5" data-passcount="8" data-compatall="0" data-accall="0" data-bothall="0" data-hasacc="0"><td class="model-col child-name" title="google/flan-t5-base">flan-t5-base</td><td class="task-col"></td><td data-col="dml/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="migraphx/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="mlas/cpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/npu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/cpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/npu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-sa="1" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-sa="1" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="vitisai/npu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td></tr>
+<tr class="child-row" data-group="google" data-model="google/flan-t5-base" data-task="summarization" data-type="t5" data-passcount="8" data-compatall="0" data-accall="0" data-bothall="0" data-hasacc="0"><td class="model-col child-name" title="google/flan-t5-base">flan-t5-base</td><td class="task-col">summarization</td><td data-col="dml/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="migraphx/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="mlas/cpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/npu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/cpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/npu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-sa="1" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-sa="1" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="vitisai/npu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td></tr>
+<tr class="child-row" data-group="google" data-model="google/flan-t5-base" data-task="translation" data-type="t5" data-passcount="8" data-compatall="0" data-accall="0" data-bothall="0" data-hasacc="0"><td class="model-col child-name" title="google/flan-t5-base">flan-t5-base</td><td class="task-col">translation</td><td data-col="dml/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="migraphx/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="mlas/cpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/npu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/cpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/npu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-sa="1" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-sa="1" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="vitisai/npu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td></tr>
+<tr class="child-row" data-group="google" data-model="google/madlad400-3b-mt" data-task="translation" data-type="t5" data-passcount="2" data-compatall="0" data-accall="0" data-bothall="0" data-hasacc="0"><td class="model-col child-name" title="google/madlad400-3b-mt">madlad400-3b-mt</td><td class="task-col">translation</td><td data-col="dml/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="migraphx/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="mlas/cpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/npu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/cpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/npu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="vitisai/npu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td></tr>
+<tr class="child-row" data-group="google" data-model="google/pegasus-xsum" data-task="summarization" data-type="pegasus" data-passcount="2" data-compatall="0" data-accall="0" data-bothall="0" data-hasacc="0"><td class="model-col child-name" title="google/pegasus-xsum">pegasus-xsum</td><td class="task-col">summarization</td><td data-col="dml/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="migraphx/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="mlas/cpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/npu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/cpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/npu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="vitisai/npu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td></tr>
+<tr class="child-row" data-group="google" data-model="google/pix2struct-ai2d-base" data-task="visual-question-answering" data-type="pix2struct" data-passcount="0" data-compatall="0" data-accall="0" data-bothall="0" data-hasacc="0"><td class="model-col child-name" title="google/pix2struct-ai2d-base">pix2struct-ai2d-base</td><td class="task-col">visual-question-answering</td><td data-col="dml/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="migraphx/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="mlas/cpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/npu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/cpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/npu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="vitisai/npu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td></tr>
+<tr class="child-row" data-group="google" data-model="google/pix2struct-docvqa-base" data-task="visual-question-answering" data-type="pix2struct" data-passcount="0" data-compatall="0" data-accall="0" data-bothall="0" data-hasacc="0"><td class="model-col child-name" title="google/pix2struct-docvqa-base">pix2struct-docvqa-base</td><td class="task-col">visual-question-answering</td><td data-col="dml/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="migraphx/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="mlas/cpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/npu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/cpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/npu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="vitisai/npu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td></tr>
+<tr class="child-row" data-group="google" data-model="google/siglip-base-patch16-224" data-task="zero-shot-image-classification" data-type="siglip" data-passcount="8" data-compatall="0" data-accall="0" data-bothall="0" data-hasacc="0"><td class="model-col child-name" title="google/siglip-base-patch16-224">siglip-base-patch16-224</td><td class="task-col">zero-shot-image-classification</td><td data-col="dml/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="migraphx/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="mlas/cpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/npu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/cpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/npu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="vitisai/npu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td></tr>
+<tr class="child-row" data-group="google" data-model="google/siglip-so400m-patch14-384" data-task="zero-shot-image-classification" data-type="siglip" data-passcount="8" data-compatall="0" data-accall="0" data-bothall="0" data-hasacc="0"><td class="model-col child-name" title="google/siglip-so400m-patch14-384">siglip-so400m-patch14-384</td><td class="task-col">zero-shot-image-classification</td><td data-col="dml/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="migraphx/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="mlas/cpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/npu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/cpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/npu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="vitisai/npu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td></tr>
+<tr class="group-row" data-group="laion"><td class="model-col"><span class="group-toggle"><span class="twisty">▼</span><span class="group-name">laion</span></span></td><td class="task-col group-meta">2 models · 4 pairs</td><td data-col="dml/gpu"><span class="gcell split" title="Compatibility 3/4 pass · Accuracy 3/3 pass"><span class="half compat regr">3/4</span><span class="sep">|</span><span class="half acc pass">3/3</span></span></td><td data-col="migraphx/gpu"><span class="gcell split" title="Compatibility 3/4 pass · Accuracy 2/3 pass"><span class="half compat regr">3/4</span><span class="sep">|</span><span class="half acc regr">2/3</span></span></td><td data-col="mlas/cpu"><span class="gcell split" title="Compatibility 3/4 pass · Accuracy 2/3 pass"><span class="half compat regr">3/4</span><span class="sep">|</span><span class="half acc regr">2/3</span></span></td><td data-col="openvino/npu"><span class="gcell split" title="Compatibility 3/4 pass · Accuracy 3/3 pass"><span class="half compat regr">3/4</span><span class="sep">|</span><span class="half acc pass">3/3</span></span></td><td data-col="openvino/gpu"><span class="gcell split" title="Compatibility 3/4 pass · Accuracy 3/3 pass"><span class="half compat regr">3/4</span><span class="sep">|</span><span class="half acc pass">3/3</span></span></td><td data-col="openvino/cpu"><span class="gcell split" title="Compatibility 3/4 pass · Accuracy 2/3 pass"><span class="half compat regr">3/4</span><span class="sep">|</span><span class="half acc regr">2/3</span></span></td><td data-col="qnn/npu"><span class="gcell split" title="Compatibility 3/4 pass · Accuracy 3/3 pass"><span class="half compat regr">3/4</span><span class="sep">|</span><span class="half acc pass">3/3</span></span></td><td data-col="qnn/gpu"><span class="gcell split" title="Compatibility 3/4 pass · Accuracy 3/3 pass"><span class="half compat regr">3/4</span><span class="sep">|</span><span class="half acc pass">3/3</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="gcell split" title="Compatibility 3/4 pass · Accuracy 3/3 pass"><span class="half compat regr">3/4</span><span class="sep">|</span><span class="half acc pass">3/3</span></span></td><td data-col="vitisai/npu"><span class="gcell split" title="Compatibility 3/4 pass · Accuracy 2/3 pass"><span class="half compat regr">3/4</span><span class="sep">|</span><span class="half acc regr">2/3</span></span></td></tr>
+<tr class="child-row" data-group="laion" data-model="laion/clip-vit-b-32-laion2b-s34b-b79k" data-task="feature-extraction" data-type="clip" data-passcount="10" data-compatall="1" data-accall="1" data-bothall="1" data-hasacc="1"><td class="model-col child-name" title="laion/CLIP-ViT-B-32-laion2B-s34B-b79K">CLIP-ViT-B-32-laion2B-s34B-b79K</td><td class="task-col">feature-extraction</td><td data-col="dml/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Spearman Correlation" data-task="Sentence similarity / embeddings" data-logic="PASS if absolute delta &lt; 4.0" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-0.00&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="migraphx/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Spearman Correlation" data-task="Sentence similarity / embeddings" data-logic="PASS if absolute delta &lt; 4.0" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.00&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="mlas/cpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Spearman Correlation" data-task="Sentence similarity / embeddings" data-logic="PASS if absolute delta &lt; 4.0" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-0.00&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="openvino/npu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Spearman Correlation" data-task="Sentence similarity / embeddings" data-logic="PASS if absolute delta &lt; 4.0" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-0.05&quot;,&quot;best&quot;:true},{&quot;precision&quot;:&quot;w8a16&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-0.19&quot;}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="openvino/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Spearman Correlation" data-task="Sentence similarity / embeddings" data-logic="PASS if absolute delta &lt; 4.0" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-0.01&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="openvino/cpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Spearman Correlation" data-task="Sentence similarity / embeddings" data-logic="PASS if absolute delta &lt; 4.0" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-0.00&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="qnn/npu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Spearman Correlation" data-task="Sentence similarity / embeddings" data-logic="PASS if absolute delta &lt; 4.0" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.01&quot;,&quot;best&quot;:true},{&quot;precision&quot;:&quot;w8a16&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.52&quot;},{&quot;precision&quot;:&quot;w8a8&quot;,&quot;verdict&quot;:&quot;REGRESSION&quot;,&quot;delta&quot;:&quot;-69.51&quot;}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="qnn/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Spearman Correlation" data-task="Sentence similarity / embeddings" data-logic="PASS if absolute delta &lt; 4.0" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-0.00&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Spearman Correlation" data-task="Sentence similarity / embeddings" data-logic="PASS if absolute delta &lt; 4.0" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-0.01&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="vitisai/npu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Spearman Correlation" data-task="Sentence similarity / embeddings" data-logic="PASS if absolute delta &lt; 4.0" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-0.21&quot;,&quot;best&quot;:true},{&quot;precision&quot;:&quot;w8a16&quot;,&quot;verdict&quot;:&quot;REGRESSION&quot;,&quot;delta&quot;:&quot;-64.48&quot;},{&quot;precision&quot;:&quot;w8a8&quot;,&quot;verdict&quot;:&quot;REGRESSION&quot;,&quot;delta&quot;:&quot;-67.78&quot;}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td></tr>
+<tr class="child-row" data-group="laion" data-model="laion/clip-vit-b-32-laion2b-s34b-b79k" data-task="zero-shot-image-classification" data-type="clip" data-passcount="10" data-compatall="1" data-accall="0" data-bothall="0" data-hasacc="1"><td class="model-col child-name" title="laion/CLIP-ViT-B-32-laion2B-s34B-b79K">CLIP-ViT-B-32-laion2B-s34B-b79K</td><td class="task-col">zero-shot-image-classification</td><td data-col="dml/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Accuracy" data-task="Image classification" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="migraphx/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="mlas/cpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Accuracy" data-task="Image classification" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="openvino/npu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Accuracy" data-task="Image classification" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true},{&quot;precision&quot;:&quot;w8a16&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-4.1%&quot;}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="openvino/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Accuracy" data-task="Image classification" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.1%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="openvino/cpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Accuracy" data-task="Image classification" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="qnn/npu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Accuracy" data-task="Image classification" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-2.5%&quot;,&quot;best&quot;:true},{&quot;precision&quot;:&quot;w8a16&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-4.8%&quot;},{&quot;precision&quot;:&quot;w8a8&quot;,&quot;verdict&quot;:&quot;REGRESSION&quot;,&quot;delta&quot;:&quot;-99.5%&quot;}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="qnn/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Accuracy" data-task="Image classification" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Accuracy" data-task="Image classification" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.1%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="vitisai/npu"><span class="cell split" data-compat="PASS" data-acc="REGRESSION" data-metric="Accuracy" data-task="Image classification" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;FAIL&quot;,&quot;delta&quot;:null},{&quot;precision&quot;:&quot;w8a16&quot;,&quot;verdict&quot;:&quot;REGRESSION&quot;,&quot;delta&quot;:&quot;-98.8%&quot;,&quot;best&quot;:true},{&quot;precision&quot;:&quot;w8a8&quot;,&quot;verdict&quot;:&quot;REGRESSION&quot;,&quot;delta&quot;:&quot;-98.5%&quot;}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc regr">▼</span></span></td></tr>
+<tr class="child-row" data-group="laion" data-model="laion/clip-vit-h-14-laion2b-s32b-b79k" data-task="zero-shot-image-classification" data-type="clip" data-passcount="10" data-compatall="1" data-accall="0" data-bothall="0" data-hasacc="1"><td class="model-col child-name" title="laion/CLIP-ViT-H-14-laion2B-s32B-b79K">CLIP-ViT-H-14-laion2B-s32B-b79K</td><td class="task-col">zero-shot-image-classification</td><td data-col="dml/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Accuracy" data-task="Image classification" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="migraphx/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Accuracy" data-task="Image classification" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="mlas/cpu"><span class="cell split" data-compat="PASS" data-acc="TIMEOUT" data-desc="Killed by the deadline before finishing (recoverable)."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc timeout">◷</span></span></td><td data-col="openvino/npu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Accuracy" data-task="Image classification" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true},{&quot;precision&quot;:&quot;w8a16&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-0.8%&quot;}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="openvino/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Accuracy" data-task="Image classification" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="openvino/cpu"><span class="cell split" data-compat="PASS" data-acc="TIMEOUT" data-desc="Killed by the deadline before finishing (recoverable)."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc timeout">◷</span></span></td><td data-col="qnn/npu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Accuracy" data-task="Image classification" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-1.1%&quot;,&quot;best&quot;:true},{&quot;precision&quot;:&quot;w8a16&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;},{&quot;precision&quot;:&quot;w8a8&quot;,&quot;verdict&quot;:&quot;REGRESSION&quot;,&quot;delta&quot;:&quot;-97.6%&quot;}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="qnn/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Accuracy" data-task="Image classification" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Accuracy" data-task="Image classification" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="vitisai/npu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Accuracy" data-task="Image classification" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-2.3%&quot;,&quot;best&quot;:true},{&quot;precision&quot;:&quot;w8a16&quot;,&quot;verdict&quot;:&quot;REGRESSION&quot;,&quot;delta&quot;:&quot;-98.6%&quot;},{&quot;precision&quot;:&quot;w8a8&quot;,&quot;verdict&quot;:&quot;REGRESSION&quot;,&quot;delta&quot;:&quot;-98.9%&quot;}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td></tr>
+<tr class="child-row" data-group="laion" data-model="laion/clip-vit-b-32-laion2b-s34b-b79k" data-task="zero-shot-classification" data-type="clip" data-passcount="0" data-compatall="0" data-accall="0" data-bothall="0" data-hasacc="0"><td class="model-col child-name" title="laion/CLIP-ViT-B-32-laion2B-s34B-b79K">CLIP-ViT-B-32-laion2B-s34B-b79K</td><td class="task-col">zero-shot-classification</td><td data-col="dml/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="migraphx/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="mlas/cpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/npu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/cpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/npu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="vitisai/npu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td></tr>
+<tr class="group-row" data-group="apple"><td class="model-col"><span class="group-toggle"><span class="twisty">▼</span><span class="group-name">apple</span></span></td><td class="task-col group-meta">2 models</td><td data-col="dml/gpu"><span class="gcell split" title="Compatibility 1/2 pass · Accuracy 1/1 pass"><span class="half compat regr">1/2</span><span class="sep">|</span><span class="half acc pass">1/1</span></span></td><td data-col="migraphx/gpu"><span class="gcell split" title="Compatibility 1/2 pass · Accuracy 1/1 pass"><span class="half compat regr">1/2</span><span class="sep">|</span><span class="half acc pass">1/1</span></span></td><td data-col="mlas/cpu"><span class="gcell split" title="Compatibility 1/2 pass · Accuracy 1/1 pass"><span class="half compat regr">1/2</span><span class="sep">|</span><span class="half acc pass">1/1</span></span></td><td data-col="openvino/npu"><span class="gcell split" title="Compatibility 1/2 pass · Accuracy 1/1 pass"><span class="half compat regr">1/2</span><span class="sep">|</span><span class="half acc pass">1/1</span></span></td><td data-col="openvino/gpu"><span class="gcell split" title="Compatibility 1/2 pass · Accuracy 1/1 pass"><span class="half compat regr">1/2</span><span class="sep">|</span><span class="half acc pass">1/1</span></span></td><td data-col="openvino/cpu"><span class="gcell split" title="Compatibility 1/2 pass · Accuracy 1/1 pass"><span class="half compat regr">1/2</span><span class="sep">|</span><span class="half acc pass">1/1</span></span></td><td data-col="qnn/npu"><span class="gcell split" title="Compatibility 1/2 pass · Accuracy 1/1 pass"><span class="half compat regr">1/2</span><span class="sep">|</span><span class="half acc pass">1/1</span></span></td><td data-col="qnn/gpu"><span class="gcell split" title="Compatibility 1/2 pass · Accuracy 1/1 pass"><span class="half compat regr">1/2</span><span class="sep">|</span><span class="half acc pass">1/1</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="gcell split" title="Compatibility 1/2 pass · Accuracy 1/1 pass"><span class="half compat regr">1/2</span><span class="sep">|</span><span class="half acc pass">1/1</span></span></td><td data-col="vitisai/npu"><span class="gcell split" title="Compatibility 1/2 pass · Accuracy 1/1 pass"><span class="half compat regr">1/2</span><span class="sep">|</span><span class="half acc pass">1/1</span></span></td></tr>
+<tr class="child-row" data-group="apple" data-model="apple/mobilevit-small" data-task="image-classification" data-type="mobilevit" data-passcount="10" data-compatall="1" data-accall="1" data-bothall="1" data-hasacc="1"><td class="model-col child-name" title="apple/mobilevit-small">mobilevit-small</td><td class="task-col">image-classification</td><td data-col="dml/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Accuracy" data-task="Image classification" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="migraphx/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Accuracy" data-task="Image classification" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="mlas/cpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Accuracy" data-task="Image classification" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="openvino/npu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Accuracy" data-task="Image classification" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true},{&quot;precision&quot;:&quot;w8a16&quot;,&quot;verdict&quot;:&quot;REGRESSION&quot;,&quot;delta&quot;:&quot;-14.6%&quot;}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="openvino/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Accuracy" data-task="Image classification" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-0.3%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="openvino/cpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Accuracy" data-task="Image classification" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="qnn/npu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Accuracy" data-task="Image classification" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true},{&quot;precision&quot;:&quot;w8a16&quot;,&quot;verdict&quot;:&quot;REGRESSION&quot;,&quot;delta&quot;:&quot;-13.4%&quot;},{&quot;precision&quot;:&quot;w8a8&quot;,&quot;verdict&quot;:&quot;REGRESSION&quot;,&quot;delta&quot;:&quot;-79.4%&quot;}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="qnn/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Accuracy" data-task="Image classification" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Accuracy" data-task="Image classification" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-0.1%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="vitisai/npu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Accuracy" data-task="Image classification" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true},{&quot;precision&quot;:&quot;w8a16&quot;,&quot;verdict&quot;:&quot;REGRESSION&quot;,&quot;delta&quot;:&quot;-99.1%&quot;},{&quot;precision&quot;:&quot;w8a8&quot;,&quot;verdict&quot;:&quot;REGRESSION&quot;,&quot;delta&quot;:&quot;-99.6%&quot;}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td></tr>
+<tr class="child-row" data-group="apple" data-model="apple/depthpro-hf" data-task="depth-estimation" data-type="depth_pro" data-passcount="0" data-compatall="0" data-accall="0" data-bothall="0" data-hasacc="0"><td class="model-col child-name" title="apple/DepthPro-hf">DepthPro-hf</td><td class="task-col">depth-estimation</td><td data-col="dml/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="migraphx/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="mlas/cpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/npu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/cpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/npu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="vitisai/npu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td></tr>
+<tr class="group-row" data-group="babelscape"><td class="model-col"><span class="group-toggle"><span class="twisty">▼</span><span class="group-name">Babelscape</span></span></td><td class="task-col group-meta">1 model</td><td data-col="dml/gpu"><span class="gcell split" title="Compatibility 1/1 pass · Accuracy 1/1 pass"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc pass">1/1</span></span></td><td data-col="migraphx/gpu"><span class="gcell split" title="Compatibility 1/1 pass · Accuracy 1/1 pass"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc pass">1/1</span></span></td><td data-col="mlas/cpu"><span class="gcell split" title="Compatibility 1/1 pass · Accuracy 1/1 pass"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc pass">1/1</span></span></td><td data-col="openvino/npu"><span class="gcell split" title="Compatibility 1/1 pass · Accuracy 1/1 pass"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc pass">1/1</span></span></td><td data-col="openvino/gpu"><span class="gcell split" title="Compatibility 1/1 pass · Accuracy 1/1 pass"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc pass">1/1</span></span></td><td data-col="openvino/cpu"><span class="gcell split" title="Compatibility 1/1 pass · Accuracy 1/1 pass"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc pass">1/1</span></span></td><td data-col="qnn/npu"><span class="gcell split" title="Compatibility 1/1 pass · Accuracy 1/1 pass"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc pass">1/1</span></span></td><td data-col="qnn/gpu"><span class="gcell split" title="Compatibility 1/1 pass · Accuracy 1/1 pass"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc pass">1/1</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="gcell split" title="Compatibility 1/1 pass · Accuracy 1/1 pass"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc pass">1/1</span></span></td><td data-col="vitisai/npu"><span class="gcell split" title="Compatibility 1/1 pass · Accuracy 1/1 pass"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc pass">1/1</span></span></td></tr>
+<tr class="child-row" data-group="babelscape" data-model="babelscape/wikineural-multilingual-ner" data-task="token-classification" data-type="bert" data-passcount="10" data-compatall="1" data-accall="1" data-bothall="1" data-hasacc="1"><td class="model-col child-name" title="Babelscape/wikineural-multilingual-ner">wikineural-multilingual-ner</td><td class="task-col">token-classification</td><td data-col="dml/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="F1 Score" data-task="Token classification (NER)" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="migraphx/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="F1 Score" data-task="Token classification (NER)" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="mlas/cpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="F1 Score" data-task="Token classification (NER)" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="openvino/npu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="F1 Score" data-task="Token classification (NER)" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-0.0%&quot;,&quot;best&quot;:true},{&quot;precision&quot;:&quot;w8a16&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-0.4%&quot;}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="openvino/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="F1 Score" data-task="Token classification (NER)" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-0.1%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="openvino/cpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="F1 Score" data-task="Token classification (NER)" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="qnn/npu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="F1 Score" data-task="Token classification (NER)" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-0.0%&quot;,&quot;best&quot;:true},{&quot;precision&quot;:&quot;w8a16&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-3.3%&quot;},{&quot;precision&quot;:&quot;w8a8&quot;,&quot;verdict&quot;:&quot;REGRESSION&quot;,&quot;delta&quot;:&quot;-10.3%&quot;}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="qnn/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="F1 Score" data-task="Token classification (NER)" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="F1 Score" data-task="Token classification (NER)" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="vitisai/npu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="F1 Score" data-task="Token classification (NER)" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-0.0%&quot;,&quot;best&quot;:true},{&quot;precision&quot;:&quot;w8a16&quot;,&quot;verdict&quot;:&quot;FAIL&quot;,&quot;delta&quot;:null},{&quot;precision&quot;:&quot;w8a8&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-8.2%&quot;}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td></tr>
+<tr class="group-row" data-group="dbmdz"><td class="model-col"><span class="group-toggle"><span class="twisty">▼</span><span class="group-name">dbmdz</span></span></td><td class="task-col group-meta">1 model</td><td data-col="dml/gpu"><span class="gcell split" title="Compatibility 1/1 pass · Accuracy 1/1 pass"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc pass">1/1</span></span></td><td data-col="migraphx/gpu"><span class="gcell split" title="Compatibility 1/1 pass · Accuracy 1/1 pass"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc pass">1/1</span></span></td><td data-col="mlas/cpu"><span class="gcell split" title="Compatibility 1/1 pass · Accuracy 1/1 pass"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc pass">1/1</span></span></td><td data-col="openvino/npu"><span class="gcell split" title="Compatibility 1/1 pass · Accuracy 1/1 pass"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc pass">1/1</span></span></td><td data-col="openvino/gpu"><span class="gcell split" title="Compatibility 1/1 pass · Accuracy 1/1 pass"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc pass">1/1</span></span></td><td data-col="openvino/cpu"><span class="gcell split" title="Compatibility 1/1 pass · Accuracy 1/1 pass"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc pass">1/1</span></span></td><td data-col="qnn/npu"><span class="gcell split" title="Compatibility 1/1 pass · Accuracy 1/1 pass"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc pass">1/1</span></span></td><td data-col="qnn/gpu"><span class="gcell split" title="Compatibility 1/1 pass · Accuracy 1/1 pass"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc pass">1/1</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="gcell split" title="Compatibility 1/1 pass · Accuracy 1/1 pass"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc pass">1/1</span></span></td><td data-col="vitisai/npu"><span class="gcell split" title="Compatibility 1/1 pass · Accuracy 1/1 pass"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc pass">1/1</span></span></td></tr>
+<tr class="child-row" data-group="dbmdz" data-model="dbmdz/bert-large-cased-finetuned-conll03-english" data-task="token-classification" data-type="bert" data-passcount="10" data-compatall="1" data-accall="1" data-bothall="1" data-hasacc="1"><td class="model-col child-name" title="dbmdz/bert-large-cased-finetuned-conll03-english">bert-large-cased-finetuned-conll03-english</td><td class="task-col">token-classification</td><td data-col="dml/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="F1 Score" data-task="Token classification (NER)" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="migraphx/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="F1 Score" data-task="Token classification (NER)" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="mlas/cpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="F1 Score" data-task="Token classification (NER)" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="openvino/npu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="F1 Score" data-task="Token classification (NER)" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true},{&quot;precision&quot;:&quot;w8a16&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-0.1%&quot;}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="openvino/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="F1 Score" data-task="Token classification (NER)" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="openvino/cpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="F1 Score" data-task="Token classification (NER)" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="qnn/npu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="F1 Score" data-task="Token classification (NER)" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true},{&quot;precision&quot;:&quot;w8a16&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-0.1%&quot;},{&quot;precision&quot;:&quot;w8a8&quot;,&quot;verdict&quot;:&quot;REGRESSION&quot;,&quot;delta&quot;:&quot;-42.5%&quot;}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="qnn/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="F1 Score" data-task="Token classification (NER)" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="F1 Score" data-task="Token classification (NER)" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="vitisai/npu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="F1 Score" data-task="Token classification (NER)" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true},{&quot;precision&quot;:&quot;w8a16&quot;,&quot;verdict&quot;:&quot;REGRESSION&quot;,&quot;delta&quot;:&quot;-70.9%&quot;},{&quot;precision&quot;:&quot;w8a8&quot;,&quot;verdict&quot;:&quot;REGRESSION&quot;,&quot;delta&quot;:&quot;-95.8%&quot;}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td></tr>
+<tr class="group-row" data-group="dima806"><td class="model-col"><span class="group-toggle"><span class="twisty">▼</span><span class="group-name">dima806</span></span></td><td class="task-col group-meta">1 model</td><td data-col="dml/gpu"><span class="gcell split" title="Compatibility 1/1 pass · Accuracy 1/1 pass"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc pass">1/1</span></span></td><td data-col="migraphx/gpu"><span class="gcell split" title="Compatibility 1/1 pass · Accuracy 1/1 pass"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc pass">1/1</span></span></td><td data-col="mlas/cpu"><span class="gcell split" title="Compatibility 1/1 pass · Accuracy 1/1 pass"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc pass">1/1</span></span></td><td data-col="openvino/npu"><span class="gcell split" title="Compatibility 1/1 pass · Accuracy 1/1 pass"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc pass">1/1</span></span></td><td data-col="openvino/gpu"><span class="gcell split" title="Compatibility 1/1 pass · Accuracy 1/1 pass"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc pass">1/1</span></span></td><td data-col="openvino/cpu"><span class="gcell split" title="Compatibility 1/1 pass · Accuracy 1/1 pass"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc pass">1/1</span></span></td><td data-col="qnn/npu"><span class="gcell split" title="Compatibility 1/1 pass · Accuracy 1/1 pass"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc pass">1/1</span></span></td><td data-col="qnn/gpu"><span class="gcell split" title="Compatibility 1/1 pass · Accuracy 1/1 pass"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc pass">1/1</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="gcell split" title="Compatibility 1/1 pass · Accuracy 1/1 pass"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc pass">1/1</span></span></td><td data-col="vitisai/npu"><span class="gcell split" title="Compatibility 1/1 pass · Accuracy 1/1 pass"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc pass">1/1</span></span></td></tr>
+<tr class="child-row" data-group="dima806" data-model="dima806/fairface_age_image_detection" data-task="image-classification" data-type="vit" data-passcount="10" data-compatall="1" data-accall="1" data-bothall="1" data-hasacc="1"><td class="model-col child-name" title="dima806/fairface_age_image_detection">fairface_age_image_detection</td><td class="task-col">image-classification</td><td data-col="dml/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Accuracy" data-task="Image classification" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="migraphx/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Accuracy" data-task="Image classification" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="mlas/cpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Accuracy" data-task="Image classification" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="openvino/npu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Accuracy" data-task="Image classification" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-1.6%&quot;,&quot;best&quot;:true},{&quot;precision&quot;:&quot;w8a16&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-0.5%&quot;}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="openvino/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Accuracy" data-task="Image classification" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-0.2%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="openvino/cpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Accuracy" data-task="Image classification" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="qnn/npu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Accuracy" data-task="Image classification" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true},{&quot;precision&quot;:&quot;w8a16&quot;,&quot;verdict&quot;:&quot;REGRESSION&quot;,&quot;delta&quot;:&quot;-49.7%&quot;},{&quot;precision&quot;:&quot;w8a8&quot;,&quot;verdict&quot;:&quot;REGRESSION&quot;,&quot;delta&quot;:&quot;-85.2%&quot;}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="qnn/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Accuracy" data-task="Image classification" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Accuracy" data-task="Image classification" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-0.2%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="vitisai/npu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Accuracy" data-task="Image classification" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true},{&quot;precision&quot;:&quot;w8a16&quot;,&quot;verdict&quot;:&quot;REGRESSION&quot;,&quot;delta&quot;:&quot;-50.0%&quot;},{&quot;precision&quot;:&quot;w8a8&quot;,&quot;verdict&quot;:&quot;REGRESSION&quot;,&quot;delta&quot;:&quot;-81.5%&quot;}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td></tr>
+<tr class="group-row" data-group="dslim"><td class="model-col"><span class="group-toggle"><span class="twisty">▼</span><span class="group-name">dslim</span></span></td><td class="task-col group-meta">1 model</td><td data-col="dml/gpu"><span class="gcell split" title="Compatibility 1/1 pass · Accuracy 1/1 pass"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc pass">1/1</span></span></td><td data-col="migraphx/gpu"><span class="gcell split" title="Compatibility 1/1 pass · Accuracy 1/1 pass"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc pass">1/1</span></span></td><td data-col="mlas/cpu"><span class="gcell split" title="Compatibility 1/1 pass · Accuracy 1/1 pass"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc pass">1/1</span></span></td><td data-col="openvino/npu"><span class="gcell split" title="Compatibility 1/1 pass · Accuracy 1/1 pass"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc pass">1/1</span></span></td><td data-col="openvino/gpu"><span class="gcell split" title="Compatibility 1/1 pass · Accuracy 1/1 pass"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc pass">1/1</span></span></td><td data-col="openvino/cpu"><span class="gcell split" title="Compatibility 1/1 pass · Accuracy 1/1 pass"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc pass">1/1</span></span></td><td data-col="qnn/npu"><span class="gcell split" title="Compatibility 1/1 pass · Accuracy 1/1 pass"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc pass">1/1</span></span></td><td data-col="qnn/gpu"><span class="gcell split" title="Compatibility 1/1 pass · Accuracy 1/1 pass"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc pass">1/1</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="gcell split" title="Compatibility 1/1 pass · Accuracy 1/1 pass"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc pass">1/1</span></span></td><td data-col="vitisai/npu"><span class="gcell split" title="Compatibility 1/1 pass · Accuracy 1/1 pass"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc pass">1/1</span></span></td></tr>
+<tr class="child-row" data-group="dslim" data-model="dslim/bert-base-ner" data-task="token-classification" data-type="bert" data-passcount="10" data-compatall="1" data-accall="1" data-bothall="1" data-hasacc="1"><td class="model-col child-name" title="dslim/bert-base-NER">bert-base-NER</td><td class="task-col">token-classification</td><td data-col="dml/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="F1 Score" data-task="Token classification (NER)" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="migraphx/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="F1 Score" data-task="Token classification (NER)" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="mlas/cpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="F1 Score" data-task="Token classification (NER)" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="openvino/npu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="F1 Score" data-task="Token classification (NER)" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true},{&quot;precision&quot;:&quot;w8a16&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="openvino/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="F1 Score" data-task="Token classification (NER)" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="openvino/cpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="F1 Score" data-task="Token classification (NER)" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="qnn/npu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="F1 Score" data-task="Token classification (NER)" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true},{&quot;precision&quot;:&quot;w8a16&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;},{&quot;precision&quot;:&quot;w8a8&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-3.8%&quot;}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="qnn/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="F1 Score" data-task="Token classification (NER)" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="F1 Score" data-task="Token classification (NER)" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="vitisai/npu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="F1 Score" data-task="Token classification (NER)" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true},{&quot;precision&quot;:&quot;w8a16&quot;,&quot;verdict&quot;:&quot;FAIL&quot;,&quot;delta&quot;:null},{&quot;precision&quot;:&quot;w8a8&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-2.5%&quot;}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td></tr>
+<tr class="group-row" data-group="isotonic"><td class="model-col"><span class="group-toggle"><span class="twisty">▼</span><span class="group-name">Isotonic</span></span></td><td class="task-col group-meta">1 model</td><td data-col="dml/gpu"><span class="gcell split" title="Compatibility 1/1 pass · Accuracy 1/1 pass"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc pass">1/1</span></span></td><td data-col="migraphx/gpu"><span class="gcell split" title="Compatibility 1/1 pass · Accuracy 1/1 pass"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc pass">1/1</span></span></td><td data-col="mlas/cpu"><span class="gcell split" title="Compatibility 1/1 pass · Accuracy 1/1 pass"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc pass">1/1</span></span></td><td data-col="openvino/npu"><span class="gcell split" title="Compatibility 1/1 pass · Accuracy 1/1 pass"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc pass">1/1</span></span></td><td data-col="openvino/gpu"><span class="gcell split" title="Compatibility 1/1 pass · Accuracy 1/1 pass"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc pass">1/1</span></span></td><td data-col="openvino/cpu"><span class="gcell split" title="Compatibility 1/1 pass · Accuracy 1/1 pass"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc pass">1/1</span></span></td><td data-col="qnn/npu"><span class="gcell split" title="Compatibility 1/1 pass · Accuracy 1/1 pass"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc pass">1/1</span></span></td><td data-col="qnn/gpu"><span class="gcell split" title="Compatibility 1/1 pass · Accuracy 1/1 pass"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc pass">1/1</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="gcell split" title="Compatibility 1/1 pass · Accuracy 1/1 pass"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc pass">1/1</span></span></td><td data-col="vitisai/npu"><span class="gcell split" title="Compatibility 1/1 pass · Accuracy 1/1 pass"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc pass">1/1</span></span></td></tr>
+<tr class="child-row" data-group="isotonic" data-model="isotonic/distilbert_finetuned_ai4privacy_v2" data-task="token-classification" data-type="distilbert" data-passcount="10" data-compatall="1" data-accall="1" data-bothall="1" data-hasacc="1"><td class="model-col child-name" title="Isotonic/distilbert_finetuned_ai4privacy_v2">distilbert_finetuned_ai4privacy_v2</td><td class="task-col">token-classification</td><td data-col="dml/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="F1 Score" data-task="Token classification (NER)" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="migraphx/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="F1 Score" data-task="Token classification (NER)" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="mlas/cpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="F1 Score" data-task="Token classification (NER)" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="openvino/npu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="F1 Score" data-task="Token classification (NER)" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true},{&quot;precision&quot;:&quot;w8a16&quot;,&quot;verdict&quot;:&quot;REGRESSION&quot;,&quot;delta&quot;:&quot;-100.0%&quot;}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="openvino/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="F1 Score" data-task="Token classification (NER)" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="openvino/cpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="F1 Score" data-task="Token classification (NER)" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="qnn/npu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="F1 Score" data-task="Token classification (NER)" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-0.2%&quot;,&quot;best&quot;:true},{&quot;precision&quot;:&quot;w8a16&quot;,&quot;verdict&quot;:&quot;REGRESSION&quot;,&quot;delta&quot;:&quot;-99.9%&quot;},{&quot;precision&quot;:&quot;w8a8&quot;,&quot;verdict&quot;:&quot;REGRESSION&quot;,&quot;delta&quot;:&quot;-99.9%&quot;}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="qnn/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="F1 Score" data-task="Token classification (NER)" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="F1 Score" data-task="Token classification (NER)" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="vitisai/npu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="F1 Score" data-task="Token classification (NER)" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-0.2%&quot;,&quot;best&quot;:true},{&quot;precision&quot;:&quot;w8a16&quot;,&quot;verdict&quot;:&quot;REGRESSION&quot;,&quot;delta&quot;:&quot;-91.3%&quot;},{&quot;precision&quot;:&quot;w8a8&quot;,&quot;verdict&quot;:&quot;REGRESSION&quot;,&quot;delta&quot;:&quot;-91.9%&quot;}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td></tr>
+<tr class="group-row" data-group="joeddav"><td class="model-col"><span class="group-toggle"><span class="twisty">▼</span><span class="group-name">joeddav</span></span></td><td class="task-col group-meta">2 models</td><td data-col="dml/gpu"><span class="gcell split" title="Compatibility 1/2 pass · Accuracy 1/1 pass"><span class="half compat regr">1/2</span><span class="sep">|</span><span class="half acc pass">1/1</span></span></td><td data-col="migraphx/gpu"><span class="gcell split" title="Compatibility 1/2 pass · Accuracy 1/1 pass"><span class="half compat regr">1/2</span><span class="sep">|</span><span class="half acc pass">1/1</span></span></td><td data-col="mlas/cpu"><span class="gcell split" title="Compatibility 1/2 pass · Accuracy 1/1 pass"><span class="half compat regr">1/2</span><span class="sep">|</span><span class="half acc pass">1/1</span></span></td><td data-col="openvino/npu"><span class="gcell split" title="Compatibility 1/2 pass · Accuracy 1/1 pass"><span class="half compat regr">1/2</span><span class="sep">|</span><span class="half acc pass">1/1</span></span></td><td data-col="openvino/gpu"><span class="gcell split" title="Compatibility 1/2 pass · Accuracy 1/1 pass"><span class="half compat regr">1/2</span><span class="sep">|</span><span class="half acc pass">1/1</span></span></td><td data-col="openvino/cpu"><span class="gcell split" title="Compatibility 1/2 pass · Accuracy 1/1 pass"><span class="half compat regr">1/2</span><span class="sep">|</span><span class="half acc pass">1/1</span></span></td><td data-col="qnn/npu"><span class="gcell split" title="Compatibility 1/2 pass · Accuracy 1/1 pass"><span class="half compat regr">1/2</span><span class="sep">|</span><span class="half acc pass">1/1</span></span></td><td data-col="qnn/gpu"><span class="gcell split" title="Compatibility 1/2 pass · Accuracy 1/1 pass"><span class="half compat regr">1/2</span><span class="sep">|</span><span class="half acc pass">1/1</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="gcell split" title="Compatibility 1/2 pass · Accuracy 1/1 pass"><span class="half compat regr">1/2</span><span class="sep">|</span><span class="half acc pass">1/1</span></span></td><td data-col="vitisai/npu"><span class="gcell split" title="Compatibility 1/2 pass · Accuracy 1/1 pass"><span class="half compat regr">1/2</span><span class="sep">|</span><span class="half acc pass">1/1</span></span></td></tr>
+<tr class="child-row" data-group="joeddav" data-model="joeddav/xlm-roberta-large-xnli" data-task="zero-shot-classification" data-type="xlm-roberta" data-passcount="10" data-compatall="1" data-accall="1" data-bothall="1" data-hasacc="1"><td class="model-col child-name" title="joeddav/xlm-roberta-large-xnli">xlm-roberta-large-xnli</td><td class="task-col">zero-shot-classification</td><td data-col="dml/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Accuracy" data-task="Text classification" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+41.8%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="migraphx/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Accuracy" data-task="Text classification" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+41.8%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="mlas/cpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Accuracy" data-task="Text classification" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+41.8%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="openvino/npu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Accuracy" data-task="Text classification" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+38.0%&quot;,&quot;best&quot;:true},{&quot;precision&quot;:&quot;w8a16&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+44.3%&quot;}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="openvino/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Accuracy" data-task="Text classification" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+41.8%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="openvino/cpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Accuracy" data-task="Text classification" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+41.8%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="qnn/npu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Accuracy" data-task="Text classification" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+41.8%&quot;,&quot;best&quot;:true},{&quot;precision&quot;:&quot;w8a16&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+44.3%&quot;},{&quot;precision&quot;:&quot;w8a8&quot;,&quot;verdict&quot;:&quot;REGRESSION&quot;,&quot;delta&quot;:&quot;-35.4%&quot;}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="qnn/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Accuracy" data-task="Text classification" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+41.8%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Accuracy" data-task="Text classification" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+41.8%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="vitisai/npu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Accuracy" data-task="Text classification" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+41.8%&quot;,&quot;best&quot;:true},{&quot;precision&quot;:&quot;w8a16&quot;,&quot;verdict&quot;:&quot;REGRESSION&quot;,&quot;delta&quot;:&quot;-41.8%&quot;},{&quot;precision&quot;:&quot;w8a8&quot;,&quot;verdict&quot;:&quot;REGRESSION&quot;,&quot;delta&quot;:&quot;-43.0%&quot;}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td></tr>
+<tr class="child-row" data-group="joeddav" data-model="joeddav/bart-large-mnli-yahoo-answers" data-task="zero-shot-classification" data-type="bart" data-passcount="0" data-compatall="0" data-accall="0" data-bothall="0" data-hasacc="0"><td class="model-col child-name" title="joeddav/bart-large-mnli-yahoo-answers">bart-large-mnli-yahoo-answers</td><td class="task-col">zero-shot-classification</td><td data-col="dml/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="migraphx/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="mlas/cpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/npu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/cpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/npu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="vitisai/npu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td></tr>
+<tr class="group-row" data-group="prosusai"><td class="model-col"><span class="group-toggle"><span class="twisty">▼</span><span class="group-name">ProsusAI</span></span></td><td class="task-col group-meta">1 model</td><td data-col="dml/gpu"><span class="gcell split" title="Compatibility 1/1 pass · Accuracy 1/1 pass"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc pass">1/1</span></span></td><td data-col="migraphx/gpu"><span class="gcell split" title="Compatibility 1/1 pass · Accuracy 1/1 pass"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc pass">1/1</span></span></td><td data-col="mlas/cpu"><span class="gcell split" title="Compatibility 1/1 pass · Accuracy 1/1 pass"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc pass">1/1</span></span></td><td data-col="openvino/npu"><span class="gcell split" title="Compatibility 1/1 pass · Accuracy 1/1 pass"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc pass">1/1</span></span></td><td data-col="openvino/gpu"><span class="gcell split" title="Compatibility 1/1 pass · Accuracy 1/1 pass"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc pass">1/1</span></span></td><td data-col="openvino/cpu"><span class="gcell split" title="Compatibility 1/1 pass · Accuracy 1/1 pass"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc pass">1/1</span></span></td><td data-col="qnn/npu"><span class="gcell split" title="Compatibility 1/1 pass · Accuracy 1/1 pass"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc pass">1/1</span></span></td><td data-col="qnn/gpu"><span class="gcell split" title="Compatibility 1/1 pass · Accuracy 1/1 pass"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc pass">1/1</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="gcell split" title="Compatibility 1/1 pass · Accuracy 1/1 pass"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc pass">1/1</span></span></td><td data-col="vitisai/npu"><span class="gcell split" title="Compatibility 1/1 pass · Accuracy 1/1 pass"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc pass">1/1</span></span></td></tr>
+<tr class="child-row" data-group="prosusai" data-model="prosusai/finbert" data-task="text-classification" data-type="bert" data-passcount="10" data-compatall="1" data-accall="1" data-bothall="1" data-hasacc="1"><td class="model-col child-name" title="ProsusAI/finbert">finbert</td><td class="task-col">text-classification</td><td data-col="dml/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Accuracy" data-task="Text classification" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="migraphx/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Accuracy" data-task="Text classification" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="mlas/cpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Accuracy" data-task="Text classification" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="openvino/npu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Accuracy" data-task="Text classification" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true},{&quot;precision&quot;:&quot;w8a16&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.3%&quot;}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="openvino/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Accuracy" data-task="Text classification" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="openvino/cpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Accuracy" data-task="Text classification" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="qnn/npu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Accuracy" data-task="Text classification" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true},{&quot;precision&quot;:&quot;w8a16&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;},{&quot;precision&quot;:&quot;w8a8&quot;,&quot;verdict&quot;:&quot;REGRESSION&quot;,&quot;delta&quot;:&quot;-73.6%&quot;}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="qnn/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Accuracy" data-task="Text classification" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Accuracy" data-task="Text classification" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="vitisai/npu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Accuracy" data-task="Text classification" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true},{&quot;precision&quot;:&quot;w8a16&quot;,&quot;verdict&quot;:&quot;FAIL&quot;,&quot;delta&quot;:null},{&quot;precision&quot;:&quot;w8a8&quot;,&quot;verdict&quot;:&quot;REGRESSION&quot;,&quot;delta&quot;:&quot;-71.7%&quot;}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td></tr>
+<tr class="group-row" data-group="rizvandwiki"><td class="model-col"><span class="group-toggle"><span class="twisty">▼</span><span class="group-name">rizvandwiki</span></span></td><td class="task-col group-meta">1 model</td><td data-col="dml/gpu"><span class="gcell split" title="Compatibility 1/1 pass · Accuracy 1/1 pass"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc pass">1/1</span></span></td><td data-col="migraphx/gpu"><span class="gcell split" title="Compatibility 1/1 pass · Accuracy 1/1 pass"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc pass">1/1</span></span></td><td data-col="mlas/cpu"><span class="gcell split" title="Compatibility 1/1 pass · Accuracy 1/1 pass"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc pass">1/1</span></span></td><td data-col="openvino/npu"><span class="gcell split" title="Compatibility 1/1 pass · Accuracy 1/1 pass"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc pass">1/1</span></span></td><td data-col="openvino/gpu"><span class="gcell split" title="Compatibility 1/1 pass · Accuracy 1/1 pass"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc pass">1/1</span></span></td><td data-col="openvino/cpu"><span class="gcell split" title="Compatibility 1/1 pass · Accuracy 1/1 pass"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc pass">1/1</span></span></td><td data-col="qnn/npu"><span class="gcell split" title="Compatibility 1/1 pass · Accuracy 1/1 pass"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc pass">1/1</span></span></td><td data-col="qnn/gpu"><span class="gcell split" title="Compatibility 1/1 pass · Accuracy 1/1 pass"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc pass">1/1</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="gcell split" title="Compatibility 1/1 pass · Accuracy 1/1 pass"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc pass">1/1</span></span></td><td data-col="vitisai/npu"><span class="gcell split" title="Compatibility 1/1 pass · Accuracy 1/1 pass"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc pass">1/1</span></span></td></tr>
+<tr class="child-row" data-group="rizvandwiki" data-model="rizvandwiki/gender-classification" data-task="image-classification" data-type="vit" data-passcount="10" data-compatall="1" data-accall="1" data-bothall="1" data-hasacc="1"><td class="model-col child-name" title="rizvandwiki/gender-classification">gender-classification</td><td class="task-col">image-classification</td><td data-col="dml/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Accuracy" data-task="Image classification" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="migraphx/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Accuracy" data-task="Image classification" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="mlas/cpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Accuracy" data-task="Image classification" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="openvino/npu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Accuracy" data-task="Image classification" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true},{&quot;precision&quot;:&quot;w8a16&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-0.1%&quot;}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="openvino/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Accuracy" data-task="Image classification" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="openvino/cpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Accuracy" data-task="Image classification" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="qnn/npu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Accuracy" data-task="Image classification" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true},{&quot;precision&quot;:&quot;w8a16&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-0.1%&quot;},{&quot;precision&quot;:&quot;w8a8&quot;,&quot;verdict&quot;:&quot;REGRESSION&quot;,&quot;delta&quot;:&quot;-39.5%&quot;}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="qnn/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Accuracy" data-task="Image classification" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Accuracy" data-task="Image classification" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="vitisai/npu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Accuracy" data-task="Image classification" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true},{&quot;precision&quot;:&quot;w8a16&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.1%&quot;},{&quot;precision&quot;:&quot;w8a8&quot;,&quot;verdict&quot;:&quot;REGRESSION&quot;,&quot;delta&quot;:&quot;-40.3%&quot;}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td></tr>
+<tr class="group-row" data-group="w11wo"><td class="model-col"><span class="group-toggle"><span class="twisty">▼</span><span class="group-name">w11wo</span></span></td><td class="task-col group-meta">1 model</td><td data-col="dml/gpu"><span class="gcell split" title="Compatibility 1/1 pass · Accuracy 1/1 pass"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc pass">1/1</span></span></td><td data-col="migraphx/gpu"><span class="gcell split" title="Compatibility 1/1 pass · Accuracy 1/1 pass"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc pass">1/1</span></span></td><td data-col="mlas/cpu"><span class="gcell split" title="Compatibility 1/1 pass · Accuracy 1/1 pass"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc pass">1/1</span></span></td><td data-col="openvino/npu"><span class="gcell split" title="Compatibility 1/1 pass · Accuracy 1/1 pass"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc pass">1/1</span></span></td><td data-col="openvino/gpu"><span class="gcell split" title="Compatibility 1/1 pass · Accuracy 1/1 pass"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc pass">1/1</span></span></td><td data-col="openvino/cpu"><span class="gcell split" title="Compatibility 1/1 pass · Accuracy 1/1 pass"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc pass">1/1</span></span></td><td data-col="qnn/npu"><span class="gcell split" title="Compatibility 1/1 pass · Accuracy 1/1 pass"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc pass">1/1</span></span></td><td data-col="qnn/gpu"><span class="gcell split" title="Compatibility 1/1 pass · Accuracy 1/1 pass"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc pass">1/1</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="gcell split" title="Compatibility 1/1 pass · Accuracy 1/1 pass"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc pass">1/1</span></span></td><td data-col="vitisai/npu"><span class="gcell split" title="Compatibility 1/1 pass · Accuracy 1/1 pass"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc pass">1/1</span></span></td></tr>
+<tr class="child-row" data-group="w11wo" data-model="w11wo/indonesian-roberta-base-posp-tagger" data-task="token-classification" data-type="roberta" data-passcount="10" data-compatall="1" data-accall="1" data-bothall="1" data-hasacc="1"><td class="model-col child-name" title="w11wo/indonesian-roberta-base-posp-tagger">indonesian-roberta-base-posp-tagger</td><td class="task-col">token-classification</td><td data-col="dml/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="F1 Score" data-task="Token classification (NER)" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="migraphx/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="F1 Score" data-task="Token classification (NER)" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="mlas/cpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="F1 Score" data-task="Token classification (NER)" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="openvino/npu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="F1 Score" data-task="Token classification (NER)" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true},{&quot;precision&quot;:&quot;w8a16&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-0.0%&quot;}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="openvino/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="F1 Score" data-task="Token classification (NER)" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="openvino/cpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="F1 Score" data-task="Token classification (NER)" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="qnn/npu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="F1 Score" data-task="Token classification (NER)" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-0.0%&quot;,&quot;best&quot;:true},{&quot;precision&quot;:&quot;w8a16&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-0.0%&quot;},{&quot;precision&quot;:&quot;w8a8&quot;,&quot;verdict&quot;:&quot;REGRESSION&quot;,&quot;delta&quot;:&quot;-75.3%&quot;}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="qnn/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="F1 Score" data-task="Token classification (NER)" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="F1 Score" data-task="Token classification (NER)" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="vitisai/npu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="F1 Score" data-task="Token classification (NER)" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true},{&quot;precision&quot;:&quot;w8a16&quot;,&quot;verdict&quot;:&quot;REGRESSION&quot;,&quot;delta&quot;:&quot;-25.4%&quot;},{&quot;precision&quot;:&quot;w8a8&quot;,&quot;verdict&quot;:&quot;REGRESSION&quot;,&quot;delta&quot;:&quot;-78.6%&quot;}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td></tr>
+<tr class="group-row" data-group="cross-encoder"><td class="model-col"><span class="group-toggle"><span class="twisty">▼</span><span class="group-name">cross-encoder</span></span></td><td class="task-col group-meta">3 models</td><td data-col="dml/gpu"><span class="gcell split" title="Compatibility 3/3 pass · not accuracy-tested"><span class="half compat pass">3/3</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="migraphx/gpu"><span class="gcell split" title="Compatibility 3/3 pass · not accuracy-tested"><span class="half compat pass">3/3</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="mlas/cpu"><span class="gcell split" title="Compatibility 3/3 pass · not accuracy-tested"><span class="half compat pass">3/3</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/npu"><span class="gcell split" title="Compatibility 3/3 pass · not accuracy-tested"><span class="half compat pass">3/3</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/gpu"><span class="gcell split" title="Compatibility 2/3 pass · not accuracy-tested"><span class="half compat regr">2/3</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/cpu"><span class="gcell split" title="Compatibility 3/3 pass · not accuracy-tested"><span class="half compat pass">3/3</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/npu"><span class="gcell split" title="Compatibility 3/3 pass · not accuracy-tested"><span class="half compat pass">3/3</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/gpu"><span class="gcell split" title="Compatibility 3/3 pass · not accuracy-tested"><span class="half compat pass">3/3</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="gcell split" title="Compatibility 3/3 pass · not accuracy-tested"><span class="half compat pass">3/3</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="vitisai/npu"><span class="gcell split" title="Compatibility 3/3 pass · not accuracy-tested"><span class="half compat pass">3/3</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td></tr>
+<tr class="child-row" data-group="cross-encoder" data-model="cross-encoder/ms-marco-minilm-l4-v2" data-task="text-classification" data-type="bert" data-passcount="10" data-compatall="1" data-accall="0" data-bothall="0" data-hasacc="0"><td class="model-col child-name" title="cross-encoder/ms-marco-MiniLM-L4-v2">ms-marco-MiniLM-L4-v2</td><td class="task-col">text-classification</td><td data-col="dml/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="migraphx/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="mlas/cpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/npu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/cpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/npu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="vitisai/npu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td></tr>
+<tr class="child-row" data-group="cross-encoder" data-model="cross-encoder/ms-marco-minilm-l6-v2" data-task="text-classification" data-type="bert" data-passcount="10" data-compatall="1" data-accall="0" data-bothall="0" data-hasacc="0"><td class="model-col child-name" title="cross-encoder/ms-marco-MiniLM-L6-v2">ms-marco-MiniLM-L6-v2</td><td class="task-col">text-classification</td><td data-col="dml/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="migraphx/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="mlas/cpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/npu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/cpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/npu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="vitisai/npu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td></tr>
+<tr class="child-row" data-group="cross-encoder" data-model="cross-encoder/nli-deberta-v3-small" data-task="zero-shot-classification" data-type="deberta-v2" data-passcount="9" data-compatall="0" data-accall="0" data-bothall="0" data-hasacc="0"><td class="model-col child-name" title="cross-encoder/nli-deberta-v3-small">nli-deberta-v3-small</td><td class="task-col">zero-shot-classification</td><td data-col="dml/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="migraphx/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="mlas/cpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/npu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/cpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/npu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="vitisai/npu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td></tr>
+<tr class="group-row" data-group="stanfordaimi"><td class="model-col"><span class="group-toggle"><span class="twisty">▼</span><span class="group-name">StanfordAIMI</span></span></td><td class="task-col group-meta">2 models</td><td data-col="dml/gpu"><span class="gcell split" title="Compatibility 2/2 pass · Accuracy 1/1 pass"><span class="half compat pass">2/2</span><span class="sep">|</span><span class="half acc pass">1/1</span></span></td><td data-col="migraphx/gpu"><span class="gcell split" title="Compatibility 2/2 pass · Accuracy 1/1 pass"><span class="half compat pass">2/2</span><span class="sep">|</span><span class="half acc pass">1/1</span></span></td><td data-col="mlas/cpu"><span class="gcell split" title="Compatibility 2/2 pass · Accuracy 1/1 pass"><span class="half compat pass">2/2</span><span class="sep">|</span><span class="half acc pass">1/1</span></span></td><td data-col="openvino/npu"><span class="gcell split" title="Compatibility 2/2 pass · Accuracy 1/1 pass"><span class="half compat pass">2/2</span><span class="sep">|</span><span class="half acc pass">1/1</span></span></td><td data-col="openvino/gpu"><span class="gcell split" title="Compatibility 2/2 pass · Accuracy 1/1 pass"><span class="half compat pass">2/2</span><span class="sep">|</span><span class="half acc pass">1/1</span></span></td><td data-col="openvino/cpu"><span class="gcell split" title="Compatibility 2/2 pass · Accuracy 1/1 pass"><span class="half compat pass">2/2</span><span class="sep">|</span><span class="half acc pass">1/1</span></span></td><td data-col="qnn/npu"><span class="gcell split" title="Compatibility 2/2 pass · Accuracy 1/1 pass"><span class="half compat pass">2/2</span><span class="sep">|</span><span class="half acc pass">1/1</span></span></td><td data-col="qnn/gpu"><span class="gcell split" title="Compatibility 2/2 pass · Accuracy 0/1 pass"><span class="half compat pass">2/2</span><span class="sep">|</span><span class="half acc fail">0/1</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="gcell split" title="Compatibility 2/2 pass · Accuracy 1/1 pass"><span class="half compat pass">2/2</span><span class="sep">|</span><span class="half acc pass">1/1</span></span></td><td data-col="vitisai/npu"><span class="gcell split" title="Compatibility 2/2 pass · Accuracy 1/1 pass"><span class="half compat pass">2/2</span><span class="sep">|</span><span class="half acc pass">1/1</span></span></td></tr>
+<tr class="child-row" data-group="stanfordaimi" data-model="stanfordaimi/dinov2-base-xray-224" data-task="image-feature-extraction" data-type="dinov2" data-passcount="10" data-compatall="1" data-accall="0" data-bothall="0" data-hasacc="1"><td class="model-col child-name" title="StanfordAIMI/dinov2-base-xray-224">dinov2-base-xray-224</td><td class="task-col">image-feature-extraction</td><td data-col="dml/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="KNN Top-1 Accuracy" data-task="Image embeddings" data-logic="PASS if delta &lt; 5%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="migraphx/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="KNN Top-1 Accuracy" data-task="Image embeddings" data-logic="PASS if delta &lt; 5%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="mlas/cpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="KNN Top-1 Accuracy" data-task="Image embeddings" data-logic="PASS if delta &lt; 5%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="openvino/npu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="KNN Top-1 Accuracy" data-task="Image embeddings" data-logic="PASS if delta &lt; 5%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-0.2%&quot;,&quot;best&quot;:true},{&quot;precision&quot;:&quot;w8a16&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-0.4%&quot;}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="openvino/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="KNN Top-1 Accuracy" data-task="Image embeddings" data-logic="PASS if delta &lt; 5%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="openvino/cpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="KNN Top-1 Accuracy" data-task="Image embeddings" data-logic="PASS if delta &lt; 5%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="qnn/npu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="KNN Top-1 Accuracy" data-task="Image embeddings" data-logic="PASS if delta &lt; 5%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-0.2%&quot;,&quot;best&quot;:true},{&quot;precision&quot;:&quot;w8a16&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-0.2%&quot;},{&quot;precision&quot;:&quot;w8a8&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-0.6%&quot;}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="qnn/gpu"><span class="cell split" data-compat="PASS" data-acc="REGRESSION" data-metric="KNN Top-1 Accuracy" data-task="Image embeddings" data-logic="PASS if delta &lt; 5%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;REGRESSION&quot;,&quot;delta&quot;:&quot;-24.6%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc regr">▼</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="KNN Top-1 Accuracy" data-task="Image embeddings" data-logic="PASS if delta &lt; 5%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="vitisai/npu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="KNN Top-1 Accuracy" data-task="Image embeddings" data-logic="PASS if delta &lt; 5%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-0.4%&quot;,&quot;best&quot;:true},{&quot;precision&quot;:&quot;w8a16&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-0.4%&quot;},{&quot;precision&quot;:&quot;w8a8&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.6%&quot;}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td></tr>
+<tr class="child-row" data-group="stanfordaimi" data-model="stanfordaimi/stanford-deidentifier-base" data-task="token-classification" data-type="bert" data-passcount="10" data-compatall="1" data-accall="0" data-bothall="0" data-hasacc="0"><td class="model-col child-name" title="StanfordAIMI/stanford-deidentifier-base">stanford-deidentifier-base</td><td class="task-col">token-classification</td><td data-col="dml/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="migraphx/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="mlas/cpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/npu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/cpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/npu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="vitisai/npu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td></tr>
+<tr class="group-row" data-group="adamcodd"><td class="model-col"><span class="group-toggle"><span class="twisty">▼</span><span class="group-name">AdamCodd</span></span></td><td class="task-col group-meta">1 model</td><td data-col="dml/gpu"><span class="gcell split" title="Compatibility 1/1 pass · not accuracy-tested"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="migraphx/gpu"><span class="gcell split" title="Compatibility 1/1 pass · not accuracy-tested"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="mlas/cpu"><span class="gcell split" title="Compatibility 1/1 pass · not accuracy-tested"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/npu"><span class="gcell split" title="Compatibility 1/1 pass · not accuracy-tested"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/gpu"><span class="gcell split" title="Compatibility 1/1 pass · not accuracy-tested"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/cpu"><span class="gcell split" title="Compatibility 1/1 pass · not accuracy-tested"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/npu"><span class="gcell split" title="Compatibility 1/1 pass · not accuracy-tested"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/gpu"><span class="gcell split" title="Compatibility 1/1 pass · not accuracy-tested"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="gcell split" title="Compatibility 1/1 pass · not accuracy-tested"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="vitisai/npu"><span class="gcell split" title="Compatibility 1/1 pass · not accuracy-tested"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td></tr>
+<tr class="child-row" data-group="adamcodd" data-model="adamcodd/vit-base-nsfw-detector" data-task="image-classification" data-type="vit" data-passcount="10" data-compatall="1" data-accall="0" data-bothall="0" data-hasacc="0"><td class="model-col child-name" title="AdamCodd/vit-base-nsfw-detector">vit-base-nsfw-detector</td><td class="task-col">image-classification</td><td data-col="dml/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="migraphx/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="mlas/cpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/npu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/cpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/npu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="vitisai/npu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td></tr>
+<tr class="group-row" data-group="ahotrod"><td class="model-col"><span class="group-toggle"><span class="twisty">▼</span><span class="group-name">ahotrod</span></span></td><td class="task-col group-meta">1 model</td><td data-col="dml/gpu"><span class="gcell split" title="Compatibility 1/1 pass · Accuracy 1/1 pass"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc pass">1/1</span></span></td><td data-col="migraphx/gpu"><span class="gcell split" title="Compatibility 1/1 pass · Accuracy 0/1 pass"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc fail">0/1</span></span></td><td data-col="mlas/cpu"><span class="gcell split" title="Compatibility 1/1 pass · Accuracy 1/1 pass"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc pass">1/1</span></span></td><td data-col="openvino/npu"><span class="gcell split" title="Compatibility 1/1 pass · Accuracy 1/1 pass"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc pass">1/1</span></span></td><td data-col="openvino/gpu"><span class="gcell split" title="Compatibility 1/1 pass · Accuracy 1/1 pass"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc pass">1/1</span></span></td><td data-col="openvino/cpu"><span class="gcell split" title="Compatibility 1/1 pass · Accuracy 1/1 pass"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc pass">1/1</span></span></td><td data-col="qnn/npu"><span class="gcell split" title="Compatibility 1/1 pass · Accuracy 1/1 pass"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc pass">1/1</span></span></td><td data-col="qnn/gpu"><span class="gcell split" title="Compatibility 1/1 pass · Accuracy 1/1 pass"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc pass">1/1</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="gcell split" title="Compatibility 1/1 pass · Accuracy 1/1 pass"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc pass">1/1</span></span></td><td data-col="vitisai/npu"><span class="gcell split" title="Compatibility 1/1 pass · Accuracy 1/1 pass"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc pass">1/1</span></span></td></tr>
+<tr class="child-row" data-group="ahotrod" data-model="ahotrod/electra_large_discriminator_squad2_512" data-task="question-answering" data-type="electra" data-passcount="10" data-compatall="1" data-accall="0" data-bothall="0" data-hasacc="1"><td class="model-col child-name" title="ahotrod/electra_large_discriminator_squad2_512">electra_large_discriminator_squad2_512</td><td class="task-col">question-answering</td><td data-col="dml/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="F1 Score" data-task="Question answering" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="migraphx/gpu"><span class="cell split" data-compat="PASS" data-acc="REGRESSION" data-metric="F1 Score" data-task="Question answering" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;REGRESSION&quot;,&quot;delta&quot;:&quot;-15.9%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc regr">▼</span></span></td><td data-col="mlas/cpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="F1 Score" data-task="Question answering" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-0.1%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="openvino/npu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="F1 Score" data-task="Question answering" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-0.0%&quot;,&quot;best&quot;:true},{&quot;precision&quot;:&quot;w8a16&quot;,&quot;verdict&quot;:&quot;REGRESSION&quot;,&quot;delta&quot;:&quot;-44.3%&quot;}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="openvino/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="F1 Score" data-task="Question answering" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-0.1%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="openvino/cpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="F1 Score" data-task="Question answering" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-0.1%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="qnn/npu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="F1 Score" data-task="Question answering" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-0.5%&quot;,&quot;best&quot;:true},{&quot;precision&quot;:&quot;w8a16&quot;,&quot;verdict&quot;:&quot;REGRESSION&quot;,&quot;delta&quot;:&quot;-91.5%&quot;},{&quot;precision&quot;:&quot;w8a8&quot;,&quot;verdict&quot;:&quot;REGRESSION&quot;,&quot;delta&quot;:&quot;-88.0%&quot;}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="qnn/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="F1 Score" data-task="Question answering" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-0.1%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="F1 Score" data-task="Question answering" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-0.1%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="vitisai/npu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="F1 Score" data-task="Question answering" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+2.2%&quot;,&quot;best&quot;:true},{&quot;precision&quot;:&quot;w8a16&quot;,&quot;verdict&quot;:&quot;REGRESSION&quot;,&quot;delta&quot;:&quot;-94.0%&quot;},{&quot;precision&quot;:&quot;w8a8&quot;,&quot;verdict&quot;:&quot;REGRESSION&quot;,&quot;delta&quot;:&quot;-89.4%&quot;}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td></tr>
+<tr class="group-row" data-group="amunchet"><td class="model-col"><span class="group-toggle"><span class="twisty">▼</span><span class="group-name">amunchet</span></span></td><td class="task-col group-meta">1 model</td><td data-col="dml/gpu"><span class="gcell split" title="Compatibility 1/1 pass · not accuracy-tested"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="migraphx/gpu"><span class="gcell split" title="Compatibility 1/1 pass · not accuracy-tested"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="mlas/cpu"><span class="gcell split" title="Compatibility 1/1 pass · not accuracy-tested"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/npu"><span class="gcell split" title="Compatibility 1/1 pass · not accuracy-tested"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/gpu"><span class="gcell split" title="Compatibility 1/1 pass · not accuracy-tested"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/cpu"><span class="gcell split" title="Compatibility 1/1 pass · not accuracy-tested"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/npu"><span class="gcell split" title="Compatibility 1/1 pass · not accuracy-tested"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/gpu"><span class="gcell split" title="Compatibility 1/1 pass · not accuracy-tested"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="gcell split" title="Compatibility 1/1 pass · not accuracy-tested"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="vitisai/npu"><span class="gcell split" title="Compatibility 1/1 pass · not accuracy-tested"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td></tr>
+<tr class="child-row" data-group="amunchet" data-model="amunchet/rorshark-vit-base" data-task="image-classification" data-type="vit" data-passcount="10" data-compatall="1" data-accall="0" data-bothall="0" data-hasacc="0"><td class="model-col child-name" title="amunchet/rorshark-vit-base">rorshark-vit-base</td><td class="task-col">image-classification</td><td data-col="dml/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="migraphx/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="mlas/cpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/npu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/cpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/npu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="vitisai/npu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td></tr>
+<tr class="group-row" data-group="falconsai"><td class="model-col"><span class="group-toggle"><span class="twisty">▼</span><span class="group-name">Falconsai</span></span></td><td class="task-col group-meta">1 model</td><td data-col="dml/gpu"><span class="gcell split" title="Compatibility 1/1 pass · not accuracy-tested"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="migraphx/gpu"><span class="gcell split" title="Compatibility 1/1 pass · not accuracy-tested"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="mlas/cpu"><span class="gcell split" title="Compatibility 1/1 pass · not accuracy-tested"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/npu"><span class="gcell split" title="Compatibility 1/1 pass · not accuracy-tested"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/gpu"><span class="gcell split" title="Compatibility 1/1 pass · not accuracy-tested"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/cpu"><span class="gcell split" title="Compatibility 1/1 pass · not accuracy-tested"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/npu"><span class="gcell split" title="Compatibility 1/1 pass · not accuracy-tested"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/gpu"><span class="gcell split" title="Compatibility 1/1 pass · not accuracy-tested"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="gcell split" title="Compatibility 1/1 pass · not accuracy-tested"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="vitisai/npu"><span class="gcell split" title="Compatibility 1/1 pass · not accuracy-tested"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td></tr>
+<tr class="child-row" data-group="falconsai" data-model="falconsai/nsfw_image_detection" data-task="image-classification" data-type="vit" data-passcount="10" data-compatall="1" data-accall="0" data-bothall="0" data-hasacc="0"><td class="model-col child-name" title="Falconsai/nsfw_image_detection">nsfw_image_detection</td><td class="task-col">image-classification</td><td data-col="dml/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="migraphx/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="mlas/cpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/npu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/cpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/npu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="vitisai/npu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td></tr>
+<tr class="group-row" data-group="hustvl"><td class="model-col"><span class="group-toggle"><span class="twisty">▼</span><span class="group-name">hustvl</span></span></td><td class="task-col group-meta">1 model</td><td data-col="dml/gpu"><span class="gcell split" title="Compatibility 1/1 pass · Accuracy 0/1 pass"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc fail">0/1</span></span></td><td data-col="migraphx/gpu"><span class="gcell split" title="Compatibility 1/1 pass · Accuracy 0/1 pass"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc fail">0/1</span></span></td><td data-col="mlas/cpu"><span class="gcell split" title="Compatibility 1/1 pass · Accuracy 0/1 pass"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc fail">0/1</span></span></td><td data-col="openvino/npu"><span class="gcell split" title="Compatibility 1/1 pass · Accuracy 0/1 pass"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc fail">0/1</span></span></td><td data-col="openvino/gpu"><span class="gcell split" title="Compatibility 1/1 pass · Accuracy 0/1 pass"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc fail">0/1</span></span></td><td data-col="openvino/cpu"><span class="gcell split" title="Compatibility 1/1 pass · Accuracy 0/1 pass"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc fail">0/1</span></span></td><td data-col="qnn/npu"><span class="gcell split" title="Compatibility 1/1 pass · Accuracy 0/1 pass"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc fail">0/1</span></span></td><td data-col="qnn/gpu"><span class="gcell split" title="Compatibility 1/1 pass · Accuracy 0/1 pass"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc fail">0/1</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="gcell split" title="Compatibility 1/1 pass · Accuracy 0/1 pass"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc fail">0/1</span></span></td><td data-col="vitisai/npu"><span class="gcell split" title="Compatibility 1/1 pass · Accuracy 0/1 pass"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc fail">0/1</span></span></td></tr>
+<tr class="child-row" data-group="hustvl" data-model="hustvl/yolos-small" data-task="object-detection" data-type="yolos" data-passcount="10" data-compatall="1" data-accall="0" data-bothall="0" data-hasacc="1"><td class="model-col child-name" title="hustvl/yolos-small">yolos-small</td><td class="task-col">object-detection</td><td data-col="dml/gpu"><span class="cell split" data-compat="PASS" data-acc="REGRESSION" data-metric="Mean Average Precision (mAP)" data-task="Object detection" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;REGRESSION&quot;,&quot;delta&quot;:&quot;-10.7%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc regr">▼</span></span></td><td data-col="migraphx/gpu"><span class="cell split" data-compat="PASS" data-acc="REGRESSION" data-metric="Mean Average Precision (mAP)" data-task="Object detection" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;REGRESSION&quot;,&quot;delta&quot;:&quot;-12.8%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc regr">▼</span></span></td><td data-col="mlas/cpu"><span class="cell split" data-compat="PASS" data-acc="REGRESSION" data-metric="Mean Average Precision (mAP)" data-task="Object detection" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;REGRESSION&quot;,&quot;delta&quot;:&quot;-12.8%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc regr">▼</span></span></td><td data-col="openvino/npu"><span class="cell split" data-compat="PASS" data-acc="REGRESSION" data-metric="Mean Average Precision (mAP)" data-task="Object detection" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;REGRESSION&quot;,&quot;delta&quot;:&quot;-10.5%&quot;,&quot;best&quot;:true},{&quot;precision&quot;:&quot;w8a16&quot;,&quot;verdict&quot;:&quot;REGRESSION&quot;,&quot;delta&quot;:&quot;-16.3%&quot;}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc regr">▼</span></span></td><td data-col="openvino/gpu"><span class="cell split" data-compat="PASS" data-acc="REGRESSION" data-metric="Mean Average Precision (mAP)" data-task="Object detection" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;REGRESSION&quot;,&quot;delta&quot;:&quot;-12.8%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc regr">▼</span></span></td><td data-col="openvino/cpu"><span class="cell split" data-compat="PASS" data-acc="REGRESSION" data-metric="Mean Average Precision (mAP)" data-task="Object detection" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;REGRESSION&quot;,&quot;delta&quot;:&quot;-12.8%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc regr">▼</span></span></td><td data-col="qnn/npu"><span class="cell split" data-compat="PASS" data-acc="REGRESSION" data-metric="Mean Average Precision (mAP)" data-task="Object detection" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;FAIL&quot;,&quot;delta&quot;:null},{&quot;precision&quot;:&quot;w8a16&quot;,&quot;verdict&quot;:&quot;REGRESSION&quot;,&quot;delta&quot;:&quot;-17.6%&quot;,&quot;best&quot;:true},{&quot;precision&quot;:&quot;w8a8&quot;,&quot;verdict&quot;:&quot;REGRESSION&quot;,&quot;delta&quot;:&quot;-51.6%&quot;}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc regr">▼</span></span></td><td data-col="qnn/gpu"><span class="cell split" data-compat="PASS" data-acc="REGRESSION" data-metric="Mean Average Precision (mAP)" data-task="Object detection" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;REGRESSION&quot;,&quot;delta&quot;:&quot;-12.8%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc regr">▼</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="cell split" data-compat="PASS" data-acc="REGRESSION" data-metric="Mean Average Precision (mAP)" data-task="Object detection" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;REGRESSION&quot;,&quot;delta&quot;:&quot;-12.8%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc regr">▼</span></span></td><td data-col="vitisai/npu"><span class="cell split" data-compat="PASS" data-acc="REGRESSION" data-metric="Mean Average Precision (mAP)" data-task="Object detection" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;REGRESSION&quot;,&quot;delta&quot;:&quot;-33.3%&quot;,&quot;best&quot;:true},{&quot;precision&quot;:&quot;w8a16&quot;,&quot;verdict&quot;:&quot;REGRESSION&quot;,&quot;delta&quot;:&quot;-71.4%&quot;},{&quot;precision&quot;:&quot;w8a8&quot;,&quot;verdict&quot;:&quot;REGRESSION&quot;,&quot;delta&quot;:&quot;-100.0%&quot;}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc regr">▼</span></span></td></tr>
+<tr class="group-row" data-group="jean-baptiste"><td class="model-col"><span class="group-toggle"><span class="twisty">▼</span><span class="group-name">Jean-Baptiste</span></span></td><td class="task-col group-meta">1 model</td><td data-col="dml/gpu"><span class="gcell split" title="Compatibility 1/1 pass · not accuracy-tested"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="migraphx/gpu"><span class="gcell split" title="Compatibility 1/1 pass · not accuracy-tested"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="mlas/cpu"><span class="gcell split" title="Compatibility 1/1 pass · not accuracy-tested"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/npu"><span class="gcell split" title="Compatibility 1/1 pass · not accuracy-tested"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/gpu"><span class="gcell split" title="Compatibility 1/1 pass · not accuracy-tested"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/cpu"><span class="gcell split" title="Compatibility 1/1 pass · not accuracy-tested"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/npu"><span class="gcell split" title="Compatibility 1/1 pass · not accuracy-tested"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/gpu"><span class="gcell split" title="Compatibility 1/1 pass · not accuracy-tested"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="gcell split" title="Compatibility 1/1 pass · not accuracy-tested"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="vitisai/npu"><span class="gcell split" title="Compatibility 1/1 pass · not accuracy-tested"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td></tr>
+<tr class="child-row" data-group="jean-baptiste" data-model="jean-baptiste/camembert-ner-with-dates" data-task="token-classification" data-type="camembert" data-passcount="10" data-compatall="1" data-accall="0" data-bothall="0" data-hasacc="0"><td class="model-col child-name" title="Jean-Baptiste/camembert-ner-with-dates">camembert-ner-with-dates</td><td class="task-col">token-classification</td><td data-col="dml/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="migraphx/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="mlas/cpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/npu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/cpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/npu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="vitisai/npu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td></tr>
+<tr class="group-row" data-group="kredor"><td class="model-col"><span class="group-toggle"><span class="twisty">▼</span><span class="group-name">kredor</span></span></td><td class="task-col group-meta">1 model</td><td data-col="dml/gpu"><span class="gcell split" title="Compatibility 1/1 pass · not accuracy-tested"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="migraphx/gpu"><span class="gcell split" title="Compatibility 1/1 pass · not accuracy-tested"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="mlas/cpu"><span class="gcell split" title="Compatibility 1/1 pass · not accuracy-tested"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/npu"><span class="gcell split" title="Compatibility 1/1 pass · not accuracy-tested"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/gpu"><span class="gcell split" title="Compatibility 1/1 pass · not accuracy-tested"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/cpu"><span class="gcell split" title="Compatibility 1/1 pass · not accuracy-tested"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/npu"><span class="gcell split" title="Compatibility 1/1 pass · not accuracy-tested"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/gpu"><span class="gcell split" title="Compatibility 1/1 pass · not accuracy-tested"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="gcell split" title="Compatibility 1/1 pass · not accuracy-tested"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="vitisai/npu"><span class="gcell split" title="Compatibility 1/1 pass · not accuracy-tested"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td></tr>
+<tr class="child-row" data-group="kredor" data-model="kredor/punctuate-all" data-task="token-classification" data-type="xlm-roberta" data-passcount="10" data-compatall="1" data-accall="0" data-bothall="0" data-hasacc="0"><td class="model-col child-name" title="kredor/punctuate-all">punctuate-all</td><td class="task-col">token-classification</td><td data-col="dml/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="migraphx/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="mlas/cpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/npu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/cpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/npu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="vitisai/npu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td></tr>
+<tr class="group-row" data-group="lxyuan"><td class="model-col"><span class="group-toggle"><span class="twisty">▼</span><span class="group-name">lxyuan</span></span></td><td class="task-col group-meta">1 model</td><td data-col="dml/gpu"><span class="gcell split" title="Compatibility 1/1 pass · not accuracy-tested"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="migraphx/gpu"><span class="gcell split" title="Compatibility 1/1 pass · not accuracy-tested"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="mlas/cpu"><span class="gcell split" title="Compatibility 1/1 pass · not accuracy-tested"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/npu"><span class="gcell split" title="Compatibility 1/1 pass · not accuracy-tested"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/gpu"><span class="gcell split" title="Compatibility 1/1 pass · not accuracy-tested"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/cpu"><span class="gcell split" title="Compatibility 1/1 pass · not accuracy-tested"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/npu"><span class="gcell split" title="Compatibility 1/1 pass · not accuracy-tested"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/gpu"><span class="gcell split" title="Compatibility 1/1 pass · not accuracy-tested"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="gcell split" title="Compatibility 1/1 pass · not accuracy-tested"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="vitisai/npu"><span class="gcell split" title="Compatibility 1/1 pass · not accuracy-tested"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td></tr>
+<tr class="child-row" data-group="lxyuan" data-model="lxyuan/distilbert-base-multilingual-cased-sentiments-student" data-task="zero-shot-classification" data-type="distilbert" data-passcount="10" data-compatall="1" data-accall="0" data-bothall="0" data-hasacc="0"><td class="model-col child-name" title="lxyuan/distilbert-base-multilingual-cased-sentiments-student">distilbert-base-multilingual-cased-sentiments-student</td><td class="task-col">zero-shot-classification</td><td data-col="dml/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="migraphx/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="mlas/cpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/npu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/cpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/npu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="vitisai/npu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td></tr>
+<tr class="group-row" data-group="monologg"><td class="model-col"><span class="group-toggle"><span class="twisty">▼</span><span class="group-name">monologg</span></span></td><td class="task-col group-meta">1 model</td><td data-col="dml/gpu"><span class="gcell split" title="Compatibility 1/1 pass · Accuracy 1/1 pass"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc pass">1/1</span></span></td><td data-col="migraphx/gpu"><span class="gcell split" title="Compatibility 1/1 pass · Accuracy 0/1 pass"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc fail">0/1</span></span></td><td data-col="mlas/cpu"><span class="gcell split" title="Compatibility 1/1 pass · Accuracy 1/1 pass"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc pass">1/1</span></span></td><td data-col="openvino/npu"><span class="gcell split" title="Compatibility 1/1 pass · Accuracy 1/1 pass"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc pass">1/1</span></span></td><td data-col="openvino/gpu"><span class="gcell split" title="Compatibility 1/1 pass · Accuracy 1/1 pass"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc pass">1/1</span></span></td><td data-col="openvino/cpu"><span class="gcell split" title="Compatibility 1/1 pass · Accuracy 1/1 pass"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc pass">1/1</span></span></td><td data-col="qnn/npu"><span class="gcell split" title="Compatibility 1/1 pass · Accuracy 1/1 pass"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc pass">1/1</span></span></td><td data-col="qnn/gpu"><span class="gcell split" title="Compatibility 1/1 pass · Accuracy 1/1 pass"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc pass">1/1</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="gcell split" title="Compatibility 1/1 pass · Accuracy 1/1 pass"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc pass">1/1</span></span></td><td data-col="vitisai/npu"><span class="gcell split" title="Compatibility 1/1 pass · Accuracy 1/1 pass"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc pass">1/1</span></span></td></tr>
+<tr class="child-row" data-group="monologg" data-model="monologg/koelectra-small-v2-distilled-korquad-384" data-task="question-answering" data-type="electra" data-passcount="10" data-compatall="1" data-accall="0" data-bothall="0" data-hasacc="1"><td class="model-col child-name" title="monologg/koelectra-small-v2-distilled-korquad-384">koelectra-small-v2-distilled-korquad-384</td><td class="task-col">question-answering</td><td data-col="dml/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="F1 Score" data-task="Question answering" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+1.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="migraphx/gpu"><span class="cell split" data-compat="PASS" data-acc="REGRESSION" data-metric="F1 Score" data-task="Question answering" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;REGRESSION&quot;,&quot;delta&quot;:&quot;-20.5%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc regr">▼</span></span></td><td data-col="mlas/cpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="F1 Score" data-task="Question answering" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.6%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="openvino/npu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="F1 Score" data-task="Question answering" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+1.0%&quot;,&quot;best&quot;:true},{&quot;precision&quot;:&quot;w8a16&quot;,&quot;verdict&quot;:&quot;REGRESSION&quot;,&quot;delta&quot;:&quot;-100.0%&quot;}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="openvino/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="F1 Score" data-task="Question answering" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.6%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="openvino/cpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="F1 Score" data-task="Question answering" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.6%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="qnn/npu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="F1 Score" data-task="Question answering" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+1.0%&quot;,&quot;best&quot;:true},{&quot;precision&quot;:&quot;w8a16&quot;,&quot;verdict&quot;:&quot;REGRESSION&quot;,&quot;delta&quot;:&quot;-98.4%&quot;},{&quot;precision&quot;:&quot;w8a8&quot;,&quot;verdict&quot;:&quot;REGRESSION&quot;,&quot;delta&quot;:&quot;-97.6%&quot;}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="qnn/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="F1 Score" data-task="Question answering" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.6%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="F1 Score" data-task="Question answering" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.6%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="vitisai/npu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="F1 Score" data-task="Question answering" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-0.2%&quot;,&quot;best&quot;:true},{&quot;precision&quot;:&quot;w8a16&quot;,&quot;verdict&quot;:&quot;REGRESSION&quot;,&quot;delta&quot;:&quot;-97.0%&quot;},{&quot;precision&quot;:&quot;w8a8&quot;,&quot;verdict&quot;:&quot;REGRESSION&quot;,&quot;delta&quot;:&quot;-97.1%&quot;}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td></tr>
+<tr class="group-row" data-group="patrickjohncyh"><td class="model-col"><span class="group-toggle"><span class="twisty">▼</span><span class="group-name">patrickjohncyh</span></span></td><td class="task-col group-meta">1 model</td><td data-col="dml/gpu"><span class="gcell split" title="Compatibility 1/1 pass · Accuracy 1/1 pass"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc pass">1/1</span></span></td><td data-col="migraphx/gpu"><span class="gcell split" title="Compatibility 1/1 pass · Accuracy 0/1 pass"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc fail">0/1</span></span></td><td data-col="mlas/cpu"><span class="gcell split" title="Compatibility 1/1 pass · Accuracy 1/1 pass"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc pass">1/1</span></span></td><td data-col="openvino/npu"><span class="gcell split" title="Compatibility 1/1 pass · Accuracy 1/1 pass"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc pass">1/1</span></span></td><td data-col="openvino/gpu"><span class="gcell split" title="Compatibility 1/1 pass · Accuracy 1/1 pass"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc pass">1/1</span></span></td><td data-col="openvino/cpu"><span class="gcell split" title="Compatibility 1/1 pass · Accuracy 1/1 pass"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc pass">1/1</span></span></td><td data-col="qnn/npu"><span class="gcell split" title="Compatibility 1/1 pass · Accuracy 1/1 pass"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc pass">1/1</span></span></td><td data-col="qnn/gpu"><span class="gcell split" title="Compatibility 1/1 pass · Accuracy 1/1 pass"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc pass">1/1</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="gcell split" title="Compatibility 1/1 pass · Accuracy 1/1 pass"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc pass">1/1</span></span></td><td data-col="vitisai/npu"><span class="gcell split" title="Compatibility 1/1 pass · Accuracy 0/1 pass"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc fail">0/1</span></span></td></tr>
+<tr class="child-row" data-group="patrickjohncyh" data-model="patrickjohncyh/fashion-clip" data-task="zero-shot-image-classification" data-type="clip" data-passcount="10" data-compatall="1" data-accall="0" data-bothall="0" data-hasacc="1"><td class="model-col child-name" title="patrickjohncyh/fashion-clip">fashion-clip</td><td class="task-col">zero-shot-image-classification</td><td data-col="dml/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Accuracy" data-task="Image classification" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="migraphx/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="mlas/cpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Accuracy" data-task="Image classification" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="openvino/npu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Accuracy" data-task="Image classification" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true},{&quot;precision&quot;:&quot;w8a16&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-6.7%&quot;}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="openvino/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Accuracy" data-task="Image classification" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="openvino/cpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Accuracy" data-task="Image classification" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="qnn/npu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Accuracy" data-task="Image classification" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true},{&quot;precision&quot;:&quot;w8a16&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-5.9%&quot;},{&quot;precision&quot;:&quot;w8a8&quot;,&quot;verdict&quot;:&quot;REGRESSION&quot;,&quot;delta&quot;:&quot;-83.0%&quot;}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="qnn/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Accuracy" data-task="Image classification" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Accuracy" data-task="Image classification" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="vitisai/npu"><span class="cell split" data-compat="PASS" data-acc="REGRESSION" data-metric="Accuracy" data-task="Image classification" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;FAIL&quot;,&quot;delta&quot;:null},{&quot;precision&quot;:&quot;w8a16&quot;,&quot;verdict&quot;:&quot;FAIL&quot;,&quot;delta&quot;:null},{&quot;precision&quot;:&quot;w8a8&quot;,&quot;verdict&quot;:&quot;REGRESSION&quot;,&quot;delta&quot;:&quot;-83.6%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc regr">▼</span></span></td></tr>
+<tr class="group-row" data-group="tau"><td class="model-col"><span class="group-toggle"><span class="twisty">▼</span><span class="group-name">tau</span></span></td><td class="task-col group-meta">1 model</td><td data-col="dml/gpu"><span class="gcell split" title="Compatibility 1/1 pass · not accuracy-tested"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="migraphx/gpu"><span class="gcell split" title="Compatibility 1/1 pass · not accuracy-tested"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="mlas/cpu"><span class="gcell split" title="Compatibility 1/1 pass · not accuracy-tested"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/npu"><span class="gcell split" title="Compatibility 1/1 pass · not accuracy-tested"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/gpu"><span class="gcell split" title="Compatibility 1/1 pass · not accuracy-tested"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/cpu"><span class="gcell split" title="Compatibility 1/1 pass · not accuracy-tested"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/npu"><span class="gcell split" title="Compatibility 1/1 pass · not accuracy-tested"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/gpu"><span class="gcell split" title="Compatibility 1/1 pass · not accuracy-tested"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="gcell split" title="Compatibility 1/1 pass · not accuracy-tested"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="vitisai/npu"><span class="gcell split" title="Compatibility 1/1 pass · not accuracy-tested"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td></tr>
+<tr class="child-row" data-group="tau" data-model="tau/splinter-base" data-task="question-answering" data-type="splinter" data-passcount="10" data-compatall="1" data-accall="0" data-bothall="0" data-hasacc="0"><td class="model-col child-name" title="tau/splinter-base">splinter-base</td><td class="task-col">question-answering</td><td data-col="dml/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="migraphx/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="mlas/cpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/npu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/cpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/npu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="vitisai/npu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td></tr>
+<tr class="group-row" data-group="valentinafeve"><td class="model-col"><span class="group-toggle"><span class="twisty">▼</span><span class="group-name">valentinafeve</span></span></td><td class="task-col group-meta">1 model</td><td data-col="dml/gpu"><span class="gcell split" title="Compatibility 1/1 pass · Accuracy 1/1 pass"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc pass">1/1</span></span></td><td data-col="migraphx/gpu"><span class="gcell split" title="Compatibility 1/1 pass · Accuracy 1/1 pass"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc pass">1/1</span></span></td><td data-col="mlas/cpu"><span class="gcell split" title="Compatibility 1/1 pass · Accuracy 1/1 pass"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc pass">1/1</span></span></td><td data-col="openvino/npu"><span class="gcell split" title="Compatibility 1/1 pass · Accuracy 1/1 pass"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc pass">1/1</span></span></td><td data-col="openvino/gpu"><span class="gcell split" title="Compatibility 1/1 pass · Accuracy 1/1 pass"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc pass">1/1</span></span></td><td data-col="openvino/cpu"><span class="gcell split" title="Compatibility 1/1 pass · Accuracy 1/1 pass"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc pass">1/1</span></span></td><td data-col="qnn/npu"><span class="gcell split" title="Compatibility 1/1 pass · Accuracy 0/1 pass"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc fail">0/1</span></span></td><td data-col="qnn/gpu"><span class="gcell split" title="Compatibility 1/1 pass · Accuracy 1/1 pass"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc pass">1/1</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="gcell split" title="Compatibility 1/1 pass · Accuracy 1/1 pass"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc pass">1/1</span></span></td><td data-col="vitisai/npu"><span class="gcell split" title="Compatibility 1/1 pass · Accuracy 0/1 pass"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc fail">0/1</span></span></td></tr>
+<tr class="child-row" data-group="valentinafeve" data-model="valentinafeve/yolos-fashionpedia" data-task="object-detection" data-type="yolos" data-passcount="10" data-compatall="1" data-accall="0" data-bothall="0" data-hasacc="1"><td class="model-col child-name" title="valentinafeve/yolos-fashionpedia">yolos-fashionpedia</td><td class="task-col">object-detection</td><td data-col="dml/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Mean Average Precision (mAP)" data-task="Object detection" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-2.9%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="migraphx/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Mean Average Precision (mAP)" data-task="Object detection" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-4.2%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="mlas/cpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Mean Average Precision (mAP)" data-task="Object detection" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-4.2%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="openvino/npu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Mean Average Precision (mAP)" data-task="Object detection" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-4.8%&quot;,&quot;best&quot;:true},{&quot;precision&quot;:&quot;w8a16&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-7.1%&quot;}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="openvino/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Mean Average Precision (mAP)" data-task="Object detection" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-4.2%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="openvino/cpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Mean Average Precision (mAP)" data-task="Object detection" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-4.2%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="qnn/npu"><span class="cell split" data-compat="PASS" data-acc="REGRESSION" data-metric="Mean Average Precision (mAP)" data-task="Object detection" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;FAIL&quot;,&quot;delta&quot;:null},{&quot;precision&quot;:&quot;w8a16&quot;,&quot;verdict&quot;:&quot;REGRESSION&quot;,&quot;delta&quot;:&quot;-52.0%&quot;,&quot;best&quot;:true},{&quot;precision&quot;:&quot;w8a8&quot;,&quot;verdict&quot;:&quot;REGRESSION&quot;,&quot;delta&quot;:&quot;-49.3%&quot;}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc regr">▼</span></span></td><td data-col="qnn/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Mean Average Precision (mAP)" data-task="Object detection" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-4.2%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Mean Average Precision (mAP)" data-task="Object detection" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-4.3%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="vitisai/npu"><span class="cell split" data-compat="PASS" data-acc="REGRESSION" data-metric="Mean Average Precision (mAP)" data-task="Object detection" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;REGRESSION&quot;,&quot;delta&quot;:&quot;-18.5%&quot;,&quot;best&quot;:true},{&quot;precision&quot;:&quot;w8a16&quot;,&quot;verdict&quot;:&quot;REGRESSION&quot;,&quot;delta&quot;:&quot;-71.6%&quot;},{&quot;precision&quot;:&quot;w8a8&quot;,&quot;verdict&quot;:&quot;REGRESSION&quot;,&quot;delta&quot;:&quot;-100.0%&quot;}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc regr">▼</span></span></td></tr>
+<tr class="group-row" data-group="nvidia"><td class="model-col"><span class="group-toggle"><span class="twisty">▼</span><span class="group-name">nvidia</span></span></td><td class="task-col group-meta">6 models</td><td data-col="dml/gpu"><span class="gcell split" title="Compatibility 6/6 pass · Accuracy 3/3 pass"><span class="half compat pass">6/6</span><span class="sep">|</span><span class="half acc pass">3/3</span></span></td><td data-col="migraphx/gpu"><span class="gcell split" title="Compatibility 6/6 pass · Accuracy 3/3 pass"><span class="half compat pass">6/6</span><span class="sep">|</span><span class="half acc pass">3/3</span></span></td><td data-col="mlas/cpu"><span class="gcell split" title="Compatibility 6/6 pass · Accuracy 3/3 pass"><span class="half compat pass">6/6</span><span class="sep">|</span><span class="half acc pass">3/3</span></span></td><td data-col="openvino/npu"><span class="gcell split" title="Compatibility 5/6 pass · Accuracy 3/3 pass"><span class="half compat regr">5/6</span><span class="sep">|</span><span class="half acc pass">3/3</span></span></td><td data-col="openvino/gpu"><span class="gcell split" title="Compatibility 0/6 pass · Accuracy 3/3 pass"><span class="half compat fail">0/6</span><span class="sep">|</span><span class="half acc pass">3/3</span></span></td><td data-col="openvino/cpu"><span class="gcell split" title="Compatibility 6/6 pass · Accuracy 3/3 pass"><span class="half compat pass">6/6</span><span class="sep">|</span><span class="half acc pass">3/3</span></span></td><td data-col="qnn/npu"><span class="gcell split" title="Compatibility 4/6 pass · Accuracy 3/3 pass"><span class="half compat regr">4/6</span><span class="sep">|</span><span class="half acc pass">3/3</span></span></td><td data-col="qnn/gpu"><span class="gcell split" title="Compatibility 6/6 pass · Accuracy 3/3 pass"><span class="half compat pass">6/6</span><span class="sep">|</span><span class="half acc pass">3/3</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="gcell split" title="Compatibility 6/6 pass · Accuracy 3/3 pass"><span class="half compat pass">6/6</span><span class="sep">|</span><span class="half acc pass">3/3</span></span></td><td data-col="vitisai/npu"><span class="gcell split" title="Compatibility 6/6 pass · Accuracy 3/3 pass"><span class="half compat pass">6/6</span><span class="sep">|</span><span class="half acc pass">3/3</span></span></td></tr>
+<tr class="child-row" data-group="nvidia" data-model="nvidia/segformer-b1-finetuned-ade-512-512" data-task="image-segmentation" data-type="segformer" data-passcount="9" data-compatall="0" data-accall="1" data-bothall="0" data-hasacc="1"><td class="model-col child-name" title="nvidia/segformer-b1-finetuned-ade-512-512">segformer-b1-finetuned-ade-512-512</td><td class="task-col">image-segmentation</td><td data-col="dml/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Mean IoU" data-task="Semantic segmentation" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="migraphx/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Mean IoU" data-task="Semantic segmentation" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="mlas/cpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Mean IoU" data-task="Semantic segmentation" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="openvino/npu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Mean IoU" data-task="Semantic segmentation" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true},{&quot;precision&quot;:&quot;w8a16&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-0.9%&quot;}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="openvino/gpu"><span class="cell split" data-compat="FAIL" data-acc="PASS" data-sa="1" data-metric="Mean IoU" data-task="Semantic segmentation" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="openvino/cpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Mean IoU" data-task="Semantic segmentation" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="qnn/npu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Mean IoU" data-task="Semantic segmentation" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true},{&quot;precision&quot;:&quot;w8a16&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-0.8%&quot;},{&quot;precision&quot;:&quot;w8a8&quot;,&quot;verdict&quot;:&quot;REGRESSION&quot;,&quot;delta&quot;:&quot;-10.3%&quot;}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="qnn/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Mean IoU" data-task="Semantic segmentation" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Mean IoU" data-task="Semantic segmentation" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="vitisai/npu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Mean IoU" data-task="Semantic segmentation" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true},{&quot;precision&quot;:&quot;w8a16&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-0.9%&quot;},{&quot;precision&quot;:&quot;w8a8&quot;,&quot;verdict&quot;:&quot;REGRESSION&quot;,&quot;delta&quot;:&quot;-99.7%&quot;}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td></tr>
+<tr class="child-row" data-group="nvidia" data-model="nvidia/segformer-b2-finetuned-ade-512-512" data-task="image-segmentation" data-type="segformer" data-passcount="9" data-compatall="0" data-accall="1" data-bothall="0" data-hasacc="1"><td class="model-col child-name" title="nvidia/segformer-b2-finetuned-ade-512-512">segformer-b2-finetuned-ade-512-512</td><td class="task-col">image-segmentation</td><td data-col="dml/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Mean IoU" data-task="Semantic segmentation" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="migraphx/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Mean IoU" data-task="Semantic segmentation" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="mlas/cpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Mean IoU" data-task="Semantic segmentation" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="openvino/npu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Mean IoU" data-task="Semantic segmentation" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true},{&quot;precision&quot;:&quot;w8a16&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.2%&quot;}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="openvino/gpu"><span class="cell split" data-compat="FAIL" data-acc="PASS" data-sa="1" data-metric="Mean IoU" data-task="Semantic segmentation" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="openvino/cpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Mean IoU" data-task="Semantic segmentation" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="qnn/npu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Mean IoU" data-task="Semantic segmentation" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true},{&quot;precision&quot;:&quot;w8a16&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.1%&quot;},{&quot;precision&quot;:&quot;w8a8&quot;,&quot;verdict&quot;:&quot;REGRESSION&quot;,&quot;delta&quot;:&quot;-20.1%&quot;}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="qnn/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Mean IoU" data-task="Semantic segmentation" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Mean IoU" data-task="Semantic segmentation" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="vitisai/npu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Mean IoU" data-task="Semantic segmentation" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.7%&quot;,&quot;best&quot;:true},{&quot;precision&quot;:&quot;w8a16&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.2%&quot;},{&quot;precision&quot;:&quot;w8a8&quot;,&quot;verdict&quot;:&quot;REGRESSION&quot;,&quot;delta&quot;:&quot;-99.7%&quot;}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td></tr>
+<tr class="child-row" data-group="nvidia" data-model="nvidia/segformer-b5-finetuned-ade-640-640" data-task="image-segmentation" data-type="segformer" data-passcount="8" data-compatall="0" data-accall="1" data-bothall="0" data-hasacc="1"><td class="model-col child-name" title="nvidia/segformer-b5-finetuned-ade-640-640">segformer-b5-finetuned-ade-640-640</td><td class="task-col">image-segmentation</td><td data-col="dml/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Mean IoU" data-task="Semantic segmentation" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="migraphx/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Mean IoU" data-task="Semantic segmentation" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="mlas/cpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Mean IoU" data-task="Semantic segmentation" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="openvino/npu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Mean IoU" data-task="Semantic segmentation" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true},{&quot;precision&quot;:&quot;w8a16&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-0.2%&quot;}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="openvino/gpu"><span class="cell split" data-compat="FAIL" data-acc="PASS" data-sa="1" data-metric="Mean IoU" data-task="Semantic segmentation" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="openvino/cpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Mean IoU" data-task="Semantic segmentation" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="qnn/npu"><span class="cell split" data-compat="FAIL" data-acc="PASS" data-metric="Mean IoU" data-task="Semantic segmentation" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true},{&quot;precision&quot;:&quot;w8a16&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-0.2%&quot;},{&quot;precision&quot;:&quot;w8a8&quot;,&quot;verdict&quot;:&quot;FAIL&quot;,&quot;delta&quot;:null}]'><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="qnn/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Mean IoU" data-task="Semantic segmentation" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Mean IoU" data-task="Semantic segmentation" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="vitisai/npu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Mean IoU" data-task="Semantic segmentation" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-0.1%&quot;,&quot;best&quot;:true},{&quot;precision&quot;:&quot;w8a16&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-0.2%&quot;},{&quot;precision&quot;:&quot;w8a8&quot;,&quot;verdict&quot;:&quot;REGRESSION&quot;,&quot;delta&quot;:&quot;-99.7%&quot;}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td></tr>
+<tr class="child-row" data-group="nvidia" data-model="nvidia/segformer-b0-finetuned-ade-512-512" data-task="image-segmentation" data-type="segformer" data-passcount="9" data-compatall="0" data-accall="0" data-bothall="0" data-hasacc="0"><td class="model-col child-name" title="nvidia/segformer-b0-finetuned-ade-512-512">segformer-b0-finetuned-ade-512-512</td><td class="task-col">image-segmentation</td><td data-col="dml/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="migraphx/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="mlas/cpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/npu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-sa="1" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/cpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/npu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="vitisai/npu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td></tr>
+<tr class="child-row" data-group="nvidia" data-model="nvidia/segformer-b0-finetuned-cityscapes-1024-1024" data-task="image-segmentation" data-type="segformer" data-passcount="9" data-compatall="0" data-accall="0" data-bothall="0" data-hasacc="0"><td class="model-col child-name" title="nvidia/segformer-b0-finetuned-cityscapes-1024-1024">segformer-b0-finetuned-cityscapes-1024-1024</td><td class="task-col">image-segmentation</td><td data-col="dml/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="migraphx/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="mlas/cpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/npu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-sa="1" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/cpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/npu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="vitisai/npu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td></tr>
+<tr class="child-row" data-group="nvidia" data-model="nvidia/segformer-b5-finetuned-cityscapes-1024-1024" data-task="image-segmentation" data-type="segformer" data-passcount="7" data-compatall="0" data-accall="0" data-bothall="0" data-hasacc="0"><td class="model-col child-name" title="nvidia/segformer-b5-finetuned-cityscapes-1024-1024">segformer-b5-finetuned-cityscapes-1024-1024</td><td class="task-col">image-segmentation</td><td data-col="dml/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="migraphx/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="mlas/cpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/npu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-sa="1" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/cpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/npu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="vitisai/npu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td></tr>
+<tr class="group-row" data-group="cardiffnlp"><td class="model-col"><span class="group-toggle"><span class="twisty">▼</span><span class="group-name">cardiffnlp</span></span></td><td class="task-col group-meta">1 model</td><td data-col="dml/gpu"><span class="gcell split" title="Compatibility 1/1 pass · Accuracy 1/1 pass"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc pass">1/1</span></span></td><td data-col="migraphx/gpu"><span class="gcell split" title="Compatibility 1/1 pass · Accuracy 1/1 pass"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc pass">1/1</span></span></td><td data-col="mlas/cpu"><span class="gcell split" title="Compatibility 1/1 pass · Accuracy 1/1 pass"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc pass">1/1</span></span></td><td data-col="openvino/npu"><span class="gcell split" title="Compatibility 0/1 pass · Accuracy 1/1 pass"><span class="half compat fail">0/1</span><span class="sep">|</span><span class="half acc pass">1/1</span></span></td><td data-col="openvino/gpu"><span class="gcell split" title="Compatibility 1/1 pass · Accuracy 1/1 pass"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc pass">1/1</span></span></td><td data-col="openvino/cpu"><span class="gcell split" title="Compatibility 1/1 pass · Accuracy 1/1 pass"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc pass">1/1</span></span></td><td data-col="qnn/npu"><span class="gcell split" title="Compatibility 1/1 pass · Accuracy 1/1 pass"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc pass">1/1</span></span></td><td data-col="qnn/gpu"><span class="gcell split" title="Compatibility 1/1 pass · Accuracy 1/1 pass"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc pass">1/1</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="gcell split" title="Compatibility 1/1 pass · Accuracy 1/1 pass"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc pass">1/1</span></span></td><td data-col="vitisai/npu"><span class="gcell split" title="Compatibility 1/1 pass · Accuracy 1/1 pass"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc pass">1/1</span></span></td></tr>
+<tr class="child-row" data-group="cardiffnlp" data-model="cardiffnlp/twitter-roberta-base-sentiment-latest" data-task="text-classification" data-type="roberta" data-passcount="9" data-compatall="0" data-accall="1" data-bothall="0" data-hasacc="1"><td class="model-col child-name" title="cardiffnlp/twitter-roberta-base-sentiment-latest">twitter-roberta-base-sentiment-latest</td><td class="task-col">text-classification</td><td data-col="dml/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Accuracy" data-task="Text classification" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="migraphx/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Accuracy" data-task="Text classification" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="mlas/cpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Accuracy" data-task="Text classification" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="openvino/npu"><span class="cell split" data-compat="FAIL" data-acc="PASS" data-metric="Accuracy" data-task="Text classification" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-1.2%&quot;,&quot;best&quot;:true},{&quot;precision&quot;:&quot;w8a16&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-0.3%&quot;}]'><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="openvino/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Accuracy" data-task="Text classification" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="openvino/cpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Accuracy" data-task="Text classification" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="qnn/npu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Accuracy" data-task="Text classification" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-1.2%&quot;,&quot;best&quot;:true},{&quot;precision&quot;:&quot;w8a16&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-0.1%&quot;},{&quot;precision&quot;:&quot;w8a8&quot;,&quot;verdict&quot;:&quot;REGRESSION&quot;,&quot;delta&quot;:&quot;-32.0%&quot;}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="qnn/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Accuracy" data-task="Text classification" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Accuracy" data-task="Text classification" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="vitisai/npu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Accuracy" data-task="Text classification" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-2.5%&quot;,&quot;best&quot;:true},{&quot;precision&quot;:&quot;w8a16&quot;,&quot;verdict&quot;:&quot;REGRESSION&quot;,&quot;delta&quot;:&quot;-43.7%&quot;},{&quot;precision&quot;:&quot;w8a8&quot;,&quot;verdict&quot;:&quot;REGRESSION&quot;,&quot;delta&quot;:&quot;-45.4%&quot;}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td></tr>
+<tr class="group-row" data-group="mattmdjaga"><td class="model-col"><span class="group-toggle"><span class="twisty">▼</span><span class="group-name">mattmdjaga</span></span></td><td class="task-col group-meta">1 model</td><td data-col="dml/gpu"><span class="gcell split" title="Compatibility 1/1 pass · Accuracy 1/1 pass"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc pass">1/1</span></span></td><td data-col="migraphx/gpu"><span class="gcell split" title="Compatibility 1/1 pass · Accuracy 1/1 pass"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc pass">1/1</span></span></td><td data-col="mlas/cpu"><span class="gcell split" title="Compatibility 1/1 pass · Accuracy 1/1 pass"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc pass">1/1</span></span></td><td data-col="openvino/npu"><span class="gcell split" title="Compatibility 1/1 pass · Accuracy 1/1 pass"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc pass">1/1</span></span></td><td data-col="openvino/gpu"><span class="gcell split" title="Compatibility 0/1 pass · Accuracy 1/1 pass"><span class="half compat fail">0/1</span><span class="sep">|</span><span class="half acc pass">1/1</span></span></td><td data-col="openvino/cpu"><span class="gcell split" title="Compatibility 1/1 pass · Accuracy 1/1 pass"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc pass">1/1</span></span></td><td data-col="qnn/npu"><span class="gcell split" title="Compatibility 1/1 pass · Accuracy 1/1 pass"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc pass">1/1</span></span></td><td data-col="qnn/gpu"><span class="gcell split" title="Compatibility 1/1 pass · Accuracy 1/1 pass"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc pass">1/1</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="gcell split" title="Compatibility 1/1 pass · Accuracy 1/1 pass"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc pass">1/1</span></span></td><td data-col="vitisai/npu"><span class="gcell split" title="Compatibility 1/1 pass · Accuracy 1/1 pass"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc pass">1/1</span></span></td></tr>
+<tr class="child-row" data-group="mattmdjaga" data-model="mattmdjaga/segformer_b2_clothes" data-task="image-segmentation" data-type="segformer" data-passcount="9" data-compatall="0" data-accall="1" data-bothall="0" data-hasacc="1"><td class="model-col child-name" title="mattmdjaga/segformer_b2_clothes">segformer_b2_clothes</td><td class="task-col">image-segmentation</td><td data-col="dml/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Mean IoU" data-task="Semantic segmentation" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="migraphx/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Mean IoU" data-task="Semantic segmentation" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="mlas/cpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Mean IoU" data-task="Semantic segmentation" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="openvino/npu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Mean IoU" data-task="Semantic segmentation" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-0.0%&quot;,&quot;best&quot;:true},{&quot;precision&quot;:&quot;w8a16&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-0.2%&quot;}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="openvino/gpu"><span class="cell split" data-compat="FAIL" data-acc="PASS" data-sa="1" data-metric="Mean IoU" data-task="Semantic segmentation" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="openvino/cpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Mean IoU" data-task="Semantic segmentation" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="qnn/npu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Mean IoU" data-task="Semantic segmentation" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-0.0%&quot;,&quot;best&quot;:true},{&quot;precision&quot;:&quot;w8a16&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-0.2%&quot;},{&quot;precision&quot;:&quot;w8a8&quot;,&quot;verdict&quot;:&quot;REGRESSION&quot;,&quot;delta&quot;:&quot;-30.3%&quot;}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="qnn/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Mean IoU" data-task="Semantic segmentation" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Mean IoU" data-task="Semantic segmentation" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="vitisai/npu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="Mean IoU" data-task="Semantic segmentation" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-0.0%&quot;,&quot;best&quot;:true},{&quot;precision&quot;:&quot;w8a16&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-0.2%&quot;},{&quot;precision&quot;:&quot;w8a8&quot;,&quot;verdict&quot;:&quot;REGRESSION&quot;,&quot;delta&quot;:&quot;-94.5%&quot;}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td></tr>
+<tr class="group-row" data-group="ai-forever"><td class="model-col"><span class="group-toggle"><span class="twisty">▼</span><span class="group-name">ai-forever</span></span></td><td class="task-col group-meta">1 model</td><td data-col="dml/gpu"><span class="gcell split" title="Compatibility 0/1 pass · not accuracy-tested"><span class="half compat fail">0/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="migraphx/gpu"><span class="gcell split" title="Compatibility 0/1 pass · not accuracy-tested"><span class="half compat fail">0/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="mlas/cpu"><span class="gcell split" title="Compatibility 0/1 pass · not accuracy-tested"><span class="half compat fail">0/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/npu"><span class="gcell split" title="Compatibility 0/1 pass · not accuracy-tested"><span class="half compat fail">0/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/gpu"><span class="gcell split" title="Compatibility 0/1 pass · not accuracy-tested"><span class="half compat fail">0/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/cpu"><span class="gcell split" title="Compatibility 0/1 pass · not accuracy-tested"><span class="half compat fail">0/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/npu"><span class="gcell split" title="Compatibility 0/1 pass · not accuracy-tested"><span class="half compat fail">0/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/gpu"><span class="gcell split" title="Compatibility 0/1 pass · not accuracy-tested"><span class="half compat fail">0/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="gcell split" title="Compatibility 0/1 pass · not accuracy-tested"><span class="half compat fail">0/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="vitisai/npu"><span class="gcell split" title="Compatibility 0/1 pass · not accuracy-tested"><span class="half compat fail">0/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td></tr>
+<tr class="child-row" data-group="ai-forever" data-model="ai-forever/real-esrgan" data-task="" data-type="unknown" data-passcount="0" data-compatall="0" data-accall="0" data-bothall="0" data-hasacc="0"><td class="model-col child-name" title="ai-forever/Real-ESRGAN">Real-ESRGAN</td><td class="task-col"></td><td data-col="dml/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="migraphx/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="mlas/cpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/npu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/cpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/npu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="vitisai/npu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td></tr>
+<tr class="group-row" data-group="alibaba-damo"><td class="model-col"><span class="group-toggle"><span class="twisty">▼</span><span class="group-name">alibaba-damo</span></span></td><td class="task-col group-meta">1 model</td><td data-col="dml/gpu"><span class="gcell split" title="Compatibility 0/1 pass · not accuracy-tested"><span class="half compat fail">0/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="migraphx/gpu"><span class="gcell split" title="Compatibility 0/1 pass · not accuracy-tested"><span class="half compat fail">0/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="mlas/cpu"><span class="gcell split" title="Compatibility 0/1 pass · not accuracy-tested"><span class="half compat fail">0/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/npu"><span class="gcell split" title="Compatibility 0/1 pass · not accuracy-tested"><span class="half compat fail">0/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/gpu"><span class="gcell split" title="Compatibility 0/1 pass · not accuracy-tested"><span class="half compat fail">0/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/cpu"><span class="gcell split" title="Compatibility 0/1 pass · not accuracy-tested"><span class="half compat fail">0/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/npu"><span class="gcell split" title="Compatibility 0/1 pass · not accuracy-tested"><span class="half compat fail">0/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/gpu"><span class="gcell split" title="Compatibility 0/1 pass · not accuracy-tested"><span class="half compat fail">0/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="gcell split" title="Compatibility 0/1 pass · not accuracy-tested"><span class="half compat fail">0/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="vitisai/npu"><span class="gcell split" title="Compatibility 0/1 pass · not accuracy-tested"><span class="half compat fail">0/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td></tr>
+<tr class="child-row" data-group="alibaba-damo" data-model="alibaba-damo/mgp-str-base" data-task="image-to-text" data-type="mgp-str" data-passcount="0" data-compatall="0" data-accall="0" data-bothall="0" data-hasacc="0"><td class="model-col child-name" title="alibaba-damo/mgp-str-base">mgp-str-base</td><td class="task-col">image-to-text</td><td data-col="dml/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="migraphx/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="mlas/cpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/npu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/cpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/npu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="vitisai/npu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td></tr>
+<tr class="group-row" data-group="breezedeus"><td class="model-col"><span class="group-toggle"><span class="twisty">▼</span><span class="group-name">breezedeus</span></span></td><td class="task-col group-meta">1 model</td><td data-col="dml/gpu"><span class="gcell split" title="Compatibility 0/1 pass · not accuracy-tested"><span class="half compat fail">0/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="migraphx/gpu"><span class="gcell split" title="Compatibility 0/1 pass · not accuracy-tested"><span class="half compat fail">0/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="mlas/cpu"><span class="gcell split" title="Compatibility 0/1 pass · not accuracy-tested"><span class="half compat fail">0/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/npu"><span class="gcell split" title="Compatibility 0/1 pass · not accuracy-tested"><span class="half compat fail">0/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/gpu"><span class="gcell split" title="Compatibility 0/1 pass · not accuracy-tested"><span class="half compat fail">0/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/cpu"><span class="gcell split" title="Compatibility 0/1 pass · not accuracy-tested"><span class="half compat fail">0/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/npu"><span class="gcell split" title="Compatibility 0/1 pass · not accuracy-tested"><span class="half compat fail">0/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/gpu"><span class="gcell split" title="Compatibility 0/1 pass · not accuracy-tested"><span class="half compat fail">0/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="gcell split" title="Compatibility 0/1 pass · not accuracy-tested"><span class="half compat fail">0/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="vitisai/npu"><span class="gcell split" title="Compatibility 0/1 pass · not accuracy-tested"><span class="half compat fail">0/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td></tr>
+<tr class="child-row" data-group="breezedeus" data-model="breezedeus/pix2text-mfr" data-task="image-to-text" data-type="vision-encoder-decoder" data-passcount="0" data-compatall="0" data-accall="0" data-bothall="0" data-hasacc="0"><td class="model-col child-name" title="breezedeus/pix2text-mfr">pix2text-mfr</td><td class="task-col">image-to-text</td><td data-col="dml/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="migraphx/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="mlas/cpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/npu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/cpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/npu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="vitisai/npu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td></tr>
+<tr class="group-row" data-group="buildborderless"><td class="model-col"><span class="group-toggle"><span class="twisty">▼</span><span class="group-name">buildborderless</span></span></td><td class="task-col group-meta">1 model</td><td data-col="dml/gpu"><span class="gcell split" title="Compatibility 1/1 pass · not accuracy-tested"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="migraphx/gpu"><span class="gcell split" title="Compatibility 1/1 pass · not accuracy-tested"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="mlas/cpu"><span class="gcell split" title="Compatibility 1/1 pass · not accuracy-tested"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/npu"><span class="gcell split" title="Compatibility 0/1 pass · not accuracy-tested"><span class="half compat fail">0/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/gpu"><span class="gcell split" title="Compatibility 1/1 pass · not accuracy-tested"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/cpu"><span class="gcell split" title="Compatibility 1/1 pass · not accuracy-tested"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/npu"><span class="gcell split" title="Compatibility 0/1 pass · not accuracy-tested"><span class="half compat fail">0/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/gpu"><span class="gcell split" title="Compatibility 1/1 pass · not accuracy-tested"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="gcell split" title="Compatibility 1/1 pass · not accuracy-tested"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="vitisai/npu"><span class="gcell split" title="Compatibility 1/1 pass · not accuracy-tested"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td></tr>
+<tr class="child-row" data-group="buildborderless" data-model="buildborderless/communityforensics-deepfakedet-vit" data-task="image-classification" data-type="vit" data-passcount="8" data-compatall="0" data-accall="0" data-bothall="0" data-hasacc="0"><td class="model-col child-name" title="buildborderless/CommunityForensics-DeepfakeDet-ViT">CommunityForensics-DeepfakeDet-ViT</td><td class="task-col">image-classification</td><td data-col="dml/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="migraphx/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="mlas/cpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/npu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/cpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/npu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="vitisai/npu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td></tr>
+<tr class="group-row" data-group="dandelin"><td class="model-col"><span class="group-toggle"><span class="twisty">▼</span><span class="group-name">dandelin</span></span></td><td class="task-col group-meta">1 model</td><td data-col="dml/gpu"><span class="gcell split" title="Compatibility 0/1 pass · not accuracy-tested"><span class="half compat fail">0/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="migraphx/gpu"><span class="gcell split" title="Compatibility 0/1 pass · not accuracy-tested"><span class="half compat fail">0/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="mlas/cpu"><span class="gcell split" title="Compatibility 0/1 pass · not accuracy-tested"><span class="half compat fail">0/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/npu"><span class="gcell split" title="Compatibility 0/1 pass · not accuracy-tested"><span class="half compat fail">0/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/gpu"><span class="gcell split" title="Compatibility 0/1 pass · not accuracy-tested"><span class="half compat fail">0/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/cpu"><span class="gcell split" title="Compatibility 0/1 pass · not accuracy-tested"><span class="half compat fail">0/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/npu"><span class="gcell split" title="Compatibility 0/1 pass · not accuracy-tested"><span class="half compat fail">0/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/gpu"><span class="gcell split" title="Compatibility 0/1 pass · not accuracy-tested"><span class="half compat fail">0/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="gcell split" title="Compatibility 0/1 pass · not accuracy-tested"><span class="half compat fail">0/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="vitisai/npu"><span class="gcell split" title="Compatibility 0/1 pass · not accuracy-tested"><span class="half compat fail">0/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td></tr>
+<tr class="child-row" data-group="dandelin" data-model="dandelin/vilt-b32-finetuned-vqa" data-task="visual-question-answering" data-type="vilt" data-passcount="0" data-compatall="0" data-accall="0" data-bothall="0" data-hasacc="0"><td class="model-col child-name" title="dandelin/vilt-b32-finetuned-vqa">vilt-b32-finetuned-vqa</td><td class="task-col">visual-question-answering</td><td data-col="dml/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="migraphx/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="mlas/cpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/npu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/cpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/npu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="vitisai/npu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td></tr>
+<tr class="group-row" data-group="depth-anything"><td class="model-col"><span class="group-toggle"><span class="twisty">▼</span><span class="group-name">depth-anything</span></span></td><td class="task-col group-meta">3 models</td><td data-col="dml/gpu"><span class="gcell split" title="Compatibility 3/3 pass · not accuracy-tested"><span class="half compat pass">3/3</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="migraphx/gpu"><span class="gcell split" title="Compatibility 3/3 pass · not accuracy-tested"><span class="half compat pass">3/3</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="mlas/cpu"><span class="gcell split" title="Compatibility 3/3 pass · not accuracy-tested"><span class="half compat pass">3/3</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/npu"><span class="gcell split" title="Compatibility 3/3 pass · not accuracy-tested"><span class="half compat pass">3/3</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/gpu"><span class="gcell split" title="Compatibility 0/3 pass · not accuracy-tested"><span class="half compat fail">0/3</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/cpu"><span class="gcell split" title="Compatibility 3/3 pass · not accuracy-tested"><span class="half compat pass">3/3</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/npu"><span class="gcell split" title="Compatibility 3/3 pass · not accuracy-tested"><span class="half compat pass">3/3</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/gpu"><span class="gcell split" title="Compatibility 3/3 pass · not accuracy-tested"><span class="half compat pass">3/3</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="gcell split" title="Compatibility 3/3 pass · not accuracy-tested"><span class="half compat pass">3/3</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="vitisai/npu"><span class="gcell split" title="Compatibility 3/3 pass · not accuracy-tested"><span class="half compat pass">3/3</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td></tr>
+<tr class="child-row" data-group="depth-anything" data-model="depth-anything/depth-anything-v2-base-hf" data-task="depth-estimation" data-type="depth_anything" data-passcount="9" data-compatall="0" data-accall="0" data-bothall="0" data-hasacc="0"><td class="model-col child-name" title="depth-anything/Depth-Anything-V2-Base-hf">Depth-Anything-V2-Base-hf</td><td class="task-col">depth-estimation</td><td data-col="dml/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="migraphx/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="mlas/cpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/npu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-sa="1" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/cpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/npu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="vitisai/npu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td></tr>
+<tr class="child-row" data-group="depth-anything" data-model="depth-anything/depth-anything-v2-large-hf" data-task="depth-estimation" data-type="depth_anything" data-passcount="9" data-compatall="0" data-accall="0" data-bothall="0" data-hasacc="0"><td class="model-col child-name" title="depth-anything/Depth-Anything-V2-Large-hf">Depth-Anything-V2-Large-hf</td><td class="task-col">depth-estimation</td><td data-col="dml/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="migraphx/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="mlas/cpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/npu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-sa="1" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/cpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/npu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="vitisai/npu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td></tr>
+<tr class="child-row" data-group="depth-anything" data-model="depth-anything/depth-anything-v2-small-hf" data-task="depth-estimation" data-type="depth_anything" data-passcount="9" data-compatall="0" data-accall="0" data-bothall="0" data-hasacc="0"><td class="model-col child-name" title="depth-anything/Depth-Anything-V2-Small-hf">Depth-Anything-V2-Small-hf</td><td class="task-col">depth-estimation</td><td data-col="dml/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="migraphx/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="mlas/cpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/npu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-sa="1" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/cpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/npu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="vitisai/npu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td></tr>
+<tr class="group-row" data-group="fashn-ai"><td class="model-col"><span class="group-toggle"><span class="twisty">▼</span><span class="group-name">fashn-ai</span></span></td><td class="task-col group-meta">1 model</td><td data-col="dml/gpu"><span class="gcell split" title="Compatibility 1/1 pass · not accuracy-tested"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="migraphx/gpu"><span class="gcell split" title="Compatibility 1/1 pass · not accuracy-tested"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="mlas/cpu"><span class="gcell split" title="Compatibility 1/1 pass · not accuracy-tested"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/npu"><span class="gcell split" title="Compatibility 1/1 pass · not accuracy-tested"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/gpu"><span class="gcell split" title="Compatibility 0/1 pass · not accuracy-tested"><span class="half compat fail">0/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/cpu"><span class="gcell split" title="Compatibility 1/1 pass · not accuracy-tested"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/npu"><span class="gcell split" title="Compatibility 1/1 pass · not accuracy-tested"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/gpu"><span class="gcell split" title="Compatibility 1/1 pass · not accuracy-tested"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="gcell split" title="Compatibility 1/1 pass · not accuracy-tested"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="vitisai/npu"><span class="gcell split" title="Compatibility 1/1 pass · not accuracy-tested"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td></tr>
+<tr class="child-row" data-group="fashn-ai" data-model="fashn-ai/fashn-human-parser" data-task="image-segmentation" data-type="segformer" data-passcount="9" data-compatall="0" data-accall="0" data-bothall="0" data-hasacc="0"><td class="model-col child-name" title="fashn-ai/fashn-human-parser">fashn-human-parser</td><td class="task-col">image-segmentation</td><td data-col="dml/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="migraphx/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="mlas/cpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/npu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-sa="1" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/cpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/npu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="vitisai/npu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td></tr>
+<tr class="group-row" data-group="flaviagiammarino"><td class="model-col"><span class="group-toggle"><span class="twisty">▼</span><span class="group-name">flaviagiammarino</span></span></td><td class="task-col group-meta">1 model</td><td data-col="dml/gpu"><span class="gcell split" title="Compatibility 1/1 pass · not accuracy-tested"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="migraphx/gpu"><span class="gcell split" title="Compatibility 1/1 pass · not accuracy-tested"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="mlas/cpu"><span class="gcell split" title="Compatibility 1/1 pass · not accuracy-tested"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/npu"><span class="gcell split" title="Compatibility 1/1 pass · not accuracy-tested"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/gpu"><span class="gcell split" title="Compatibility 0/1 pass · not accuracy-tested"><span class="half compat fail">0/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/cpu"><span class="gcell split" title="Compatibility 1/1 pass · not accuracy-tested"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/npu"><span class="gcell split" title="Compatibility 1/1 pass · not accuracy-tested"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/gpu"><span class="gcell split" title="Compatibility 0/1 pass · not accuracy-tested"><span class="half compat fail">0/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="gcell split" title="Compatibility 1/1 pass · not accuracy-tested"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="vitisai/npu"><span class="gcell split" title="Compatibility 1/1 pass · not accuracy-tested"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td></tr>
+<tr class="child-row" data-group="flaviagiammarino" data-model="flaviagiammarino/medsam-vit-base" data-task="mask-generation" data-type="sam" data-passcount="8" data-compatall="0" data-accall="0" data-bothall="0" data-hasacc="0"><td class="model-col child-name" title="flaviagiammarino/medsam-vit-base">medsam-vit-base</td><td class="task-col">mask-generation</td><td data-col="dml/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="migraphx/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="mlas/cpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/npu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-sa="1" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/cpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/npu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="vitisai/npu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td></tr>
+<tr class="group-row" data-group="google-t5"><td class="model-col"><span class="group-toggle"><span class="twisty">▼</span><span class="group-name">google-t5</span></span></td><td class="task-col group-meta">4 models · 7 pairs</td><td data-col="dml/gpu"><span class="gcell split" title="Compatibility 5/7 pass · not accuracy-tested"><span class="half compat regr">5/7</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="migraphx/gpu"><span class="gcell split" title="Compatibility 7/7 pass · not accuracy-tested"><span class="half compat pass">7/7</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="mlas/cpu"><span class="gcell split" title="Compatibility 5/7 pass · not accuracy-tested"><span class="half compat regr">5/7</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/npu"><span class="gcell split" title="Compatibility 5/7 pass · not accuracy-tested"><span class="half compat regr">5/7</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/gpu"><span class="gcell split" title="Compatibility 5/7 pass · not accuracy-tested"><span class="half compat regr">5/7</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/cpu"><span class="gcell split" title="Compatibility 5/7 pass · not accuracy-tested"><span class="half compat regr">5/7</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/npu"><span class="gcell split" title="Compatibility 5/7 pass · not accuracy-tested"><span class="half compat regr">5/7</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/gpu"><span class="gcell split" title="Compatibility 0/7 pass · not accuracy-tested"><span class="half compat fail">0/7</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="gcell split" title="Compatibility 0/7 pass · not accuracy-tested"><span class="half compat fail">0/7</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="vitisai/npu"><span class="gcell split" title="Compatibility 7/7 pass · not accuracy-tested"><span class="half compat pass">7/7</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td></tr>
+<tr class="child-row" data-group="google-t5" data-model="google-t5/t5-3b" data-task="summarization" data-type="t5" data-passcount="2" data-compatall="0" data-accall="0" data-bothall="0" data-hasacc="0"><td class="model-col child-name" title="google-t5/t5-3b">t5-3b</td><td class="task-col">summarization</td><td data-col="dml/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="migraphx/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="mlas/cpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/npu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/cpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/npu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="vitisai/npu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td></tr>
+<tr class="child-row" data-group="google-t5" data-model="google-t5/t5-3b" data-task="translation" data-type="t5" data-passcount="2" data-compatall="0" data-accall="0" data-bothall="0" data-hasacc="0"><td class="model-col child-name" title="google-t5/t5-3b">t5-3b</td><td class="task-col">translation</td><td data-col="dml/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="migraphx/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="mlas/cpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/npu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/cpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/npu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="vitisai/npu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td></tr>
+<tr class="child-row" data-group="google-t5" data-model="google-t5/t5-base" data-task="summarization" data-type="t5" data-passcount="8" data-compatall="0" data-accall="0" data-bothall="0" data-hasacc="0"><td class="model-col child-name" title="google-t5/t5-base">t5-base</td><td class="task-col">summarization</td><td data-col="dml/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="migraphx/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="mlas/cpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/npu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/cpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/npu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-sa="1" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-sa="1" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="vitisai/npu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td></tr>
+<tr class="child-row" data-group="google-t5" data-model="google-t5/t5-base" data-task="translation" data-type="t5" data-passcount="8" data-compatall="0" data-accall="0" data-bothall="0" data-hasacc="0"><td class="model-col child-name" title="google-t5/t5-base">t5-base</td><td class="task-col">translation</td><td data-col="dml/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="migraphx/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="mlas/cpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/npu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/cpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/npu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-sa="1" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-sa="1" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="vitisai/npu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td></tr>
+<tr class="child-row" data-group="google-t5" data-model="google-t5/t5-large" data-task="summarization" data-type="t5" data-passcount="8" data-compatall="0" data-accall="0" data-bothall="0" data-hasacc="0"><td class="model-col child-name" title="google-t5/t5-large">t5-large</td><td class="task-col">summarization</td><td data-col="dml/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="migraphx/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="mlas/cpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/npu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/cpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/npu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-sa="1" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-sa="1" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="vitisai/npu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td></tr>
+<tr class="child-row" data-group="google-t5" data-model="google-t5/t5-small" data-task="summarization" data-type="t5" data-passcount="8" data-compatall="0" data-accall="0" data-bothall="0" data-hasacc="0"><td class="model-col child-name" title="google-t5/t5-small">t5-small</td><td class="task-col">summarization</td><td data-col="dml/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="migraphx/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="mlas/cpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/npu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/cpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/npu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-sa="1" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-sa="1" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="vitisai/npu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td></tr>
+<tr class="child-row" data-group="google-t5" data-model="google-t5/t5-small" data-task="translation" data-type="t5" data-passcount="8" data-compatall="0" data-accall="0" data-bothall="0" data-hasacc="0"><td class="model-col child-name" title="google-t5/t5-small">t5-small</td><td class="task-col">translation</td><td data-col="dml/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="migraphx/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="mlas/cpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/npu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/cpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/npu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-sa="1" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-sa="1" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="vitisai/npu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td></tr>
+<tr class="group-row" data-group="helsinki-nlp"><td class="model-col"><span class="group-toggle"><span class="twisty">▼</span><span class="group-name">Helsinki-NLP</span></span></td><td class="task-col group-meta">5 models</td><td data-col="dml/gpu"><span class="gcell split" title="Compatibility 3/5 pass · not accuracy-tested"><span class="half compat regr">3/5</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="migraphx/gpu"><span class="gcell split" title="Compatibility 3/5 pass · not accuracy-tested"><span class="half compat regr">3/5</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="mlas/cpu"><span class="gcell split" title="Compatibility 3/5 pass · not accuracy-tested"><span class="half compat regr">3/5</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/npu"><span class="gcell split" title="Compatibility 3/5 pass · not accuracy-tested"><span class="half compat regr">3/5</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/gpu"><span class="gcell split" title="Compatibility 3/5 pass · not accuracy-tested"><span class="half compat regr">3/5</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/cpu"><span class="gcell split" title="Compatibility 3/5 pass · not accuracy-tested"><span class="half compat regr">3/5</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/npu"><span class="gcell split" title="Compatibility 3/5 pass · not accuracy-tested"><span class="half compat regr">3/5</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/gpu"><span class="gcell split" title="Compatibility 0/5 pass · not accuracy-tested"><span class="half compat fail">0/5</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="gcell split" title="Compatibility 3/5 pass · not accuracy-tested"><span class="half compat regr">3/5</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="vitisai/npu"><span class="gcell split" title="Compatibility 3/5 pass · not accuracy-tested"><span class="half compat regr">3/5</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td></tr>
+<tr class="child-row" data-group="helsinki-nlp" data-model="helsinki-nlp/opus-mt-en-ru" data-task="translation" data-type="marian" data-passcount="0" data-compatall="0" data-accall="0" data-bothall="0" data-hasacc="0"><td class="model-col child-name" title="Helsinki-NLP/opus-mt-en-ru">opus-mt-en-ru</td><td class="task-col">translation</td><td data-col="dml/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="migraphx/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="mlas/cpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/npu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/cpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/npu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="vitisai/npu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td></tr>
+<tr class="child-row" data-group="helsinki-nlp" data-model="helsinki-nlp/opus-mt-es-en" data-task="translation" data-type="marian" data-passcount="9" data-compatall="0" data-accall="0" data-bothall="0" data-hasacc="0"><td class="model-col child-name" title="Helsinki-NLP/opus-mt-es-en">opus-mt-es-en</td><td class="task-col">translation</td><td data-col="dml/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="migraphx/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="mlas/cpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/npu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/cpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/npu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-sa="1" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="vitisai/npu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td></tr>
+<tr class="child-row" data-group="helsinki-nlp" data-model="helsinki-nlp/opus-mt-fr-en" data-task="translation" data-type="marian" data-passcount="0" data-compatall="0" data-accall="0" data-bothall="0" data-hasacc="0"><td class="model-col child-name" title="Helsinki-NLP/opus-mt-fr-en">opus-mt-fr-en</td><td class="task-col">translation</td><td data-col="dml/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="migraphx/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="mlas/cpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/npu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/cpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/npu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="vitisai/npu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td></tr>
+<tr class="child-row" data-group="helsinki-nlp" data-model="helsinki-nlp/opus-mt-nl-en" data-task="translation" data-type="marian" data-passcount="9" data-compatall="0" data-accall="0" data-bothall="0" data-hasacc="0"><td class="model-col child-name" title="Helsinki-NLP/opus-mt-nl-en">opus-mt-nl-en</td><td class="task-col">translation</td><td data-col="dml/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="migraphx/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="mlas/cpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/npu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/cpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/npu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-sa="1" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="vitisai/npu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td></tr>
+<tr class="child-row" data-group="helsinki-nlp" data-model="helsinki-nlp/opus-mt-tr-en" data-task="translation" data-type="marian" data-passcount="9" data-compatall="0" data-accall="0" data-bothall="0" data-hasacc="0"><td class="model-col child-name" title="Helsinki-NLP/opus-mt-tr-en">opus-mt-tr-en</td><td class="task-col">translation</td><td data-col="dml/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="migraphx/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="mlas/cpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/npu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/cpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/npu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-sa="1" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="vitisai/npu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td></tr>
+<tr class="group-row" data-group="hi-wesley"><td class="model-col"><span class="group-toggle"><span class="twisty">▼</span><span class="group-name">hi-wesley</span></span></td><td class="task-col group-meta">1 model</td><td data-col="dml/gpu"><span class="gcell split" title="Compatibility 0/1 pass · not accuracy-tested"><span class="half compat fail">0/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="migraphx/gpu"><span class="gcell split" title="Compatibility 0/1 pass · not accuracy-tested"><span class="half compat fail">0/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="mlas/cpu"><span class="gcell split" title="Compatibility 0/1 pass · not accuracy-tested"><span class="half compat fail">0/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/npu"><span class="gcell split" title="Compatibility 0/1 pass · not accuracy-tested"><span class="half compat fail">0/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/gpu"><span class="gcell split" title="Compatibility 0/1 pass · not accuracy-tested"><span class="half compat fail">0/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/cpu"><span class="gcell split" title="Compatibility 0/1 pass · not accuracy-tested"><span class="half compat fail">0/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/npu"><span class="gcell split" title="Compatibility 0/1 pass · not accuracy-tested"><span class="half compat fail">0/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/gpu"><span class="gcell split" title="Compatibility 0/1 pass · not accuracy-tested"><span class="half compat fail">0/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="gcell split" title="Compatibility 0/1 pass · not accuracy-tested"><span class="half compat fail">0/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="vitisai/npu"><span class="gcell split" title="Compatibility 0/1 pass · not accuracy-tested"><span class="half compat fail">0/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td></tr>
+<tr class="child-row" data-group="hi-wesley" data-model="hi-wesley/gemma3-vision-encoder" data-task="image-feature-extraction" data-type="siglip_vision_model" data-passcount="0" data-compatall="0" data-accall="0" data-bothall="0" data-hasacc="0"><td class="model-col child-name" title="hi-wesley/gemma3-vision-encoder">gemma3-vision-encoder</td><td class="task-col">image-feature-extraction</td><td data-col="dml/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="migraphx/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="mlas/cpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/npu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/cpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/npu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="vitisai/npu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td></tr>
+<tr class="group-row" data-group="internlm"><td class="model-col"><span class="group-toggle"><span class="twisty">▼</span><span class="group-name">internlm</span></span></td><td class="task-col group-meta">1 model</td><td data-col="dml/gpu"><span class="gcell split" title="Compatibility 0/1 pass · not accuracy-tested"><span class="half compat fail">0/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="migraphx/gpu"><span class="gcell split" title="Compatibility 0/1 pass · not accuracy-tested"><span class="half compat fail">0/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="mlas/cpu"><span class="gcell split" title="Compatibility 0/1 pass · not accuracy-tested"><span class="half compat fail">0/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/npu"><span class="gcell split" title="Compatibility 0/1 pass · not accuracy-tested"><span class="half compat fail">0/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/gpu"><span class="gcell split" title="Compatibility 0/1 pass · not accuracy-tested"><span class="half compat fail">0/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/cpu"><span class="gcell split" title="Compatibility 0/1 pass · not accuracy-tested"><span class="half compat fail">0/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/npu"><span class="gcell split" title="Compatibility 0/1 pass · not accuracy-tested"><span class="half compat fail">0/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/gpu"><span class="gcell split" title="Compatibility 0/1 pass · not accuracy-tested"><span class="half compat fail">0/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="gcell split" title="Compatibility 0/1 pass · not accuracy-tested"><span class="half compat fail">0/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="vitisai/npu"><span class="gcell split" title="Compatibility 0/1 pass · not accuracy-tested"><span class="half compat fail">0/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td></tr>
+<tr class="child-row" data-group="internlm" data-model="internlm/internlm-xcomposer2d5-7b" data-task="visual-question-answering" data-type="internlm2" data-passcount="0" data-compatall="0" data-accall="0" data-bothall="0" data-hasacc="0"><td class="model-col child-name" title="internlm/internlm-xcomposer2d5-7b">internlm-xcomposer2d5-7b</td><td class="task-col">visual-question-answering</td><td data-col="dml/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="migraphx/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="mlas/cpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/npu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/cpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/npu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="vitisai/npu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td></tr>
+<tr class="group-row" data-group="intfloat"><td class="model-col"><span class="group-toggle"><span class="twisty">▼</span><span class="group-name">intfloat</span></span></td><td class="task-col group-meta">1 model</td><td data-col="dml/gpu"><span class="gcell split" title="Compatibility 1/1 pass · not accuracy-tested"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="migraphx/gpu"><span class="gcell split" title="Compatibility 1/1 pass · not accuracy-tested"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="mlas/cpu"><span class="gcell split" title="Compatibility 1/1 pass · not accuracy-tested"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/npu"><span class="gcell split" title="Compatibility 1/1 pass · not accuracy-tested"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/gpu"><span class="gcell split" title="Compatibility 1/1 pass · not accuracy-tested"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/cpu"><span class="gcell split" title="Compatibility 1/1 pass · not accuracy-tested"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/npu"><span class="gcell split" title="Compatibility 1/1 pass · not accuracy-tested"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/gpu"><span class="gcell split" title="Compatibility 0/1 pass · not accuracy-tested"><span class="half compat fail">0/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="gcell split" title="Compatibility 1/1 pass · not accuracy-tested"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="vitisai/npu"><span class="gcell split" title="Compatibility 1/1 pass · not accuracy-tested"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td></tr>
+<tr class="child-row" data-group="intfloat" data-model="intfloat/multilingual-e5-large" data-task="sentence-similarity" data-type="xlm-roberta" data-passcount="9" data-compatall="0" data-accall="0" data-bothall="0" data-hasacc="0"><td class="model-col child-name" title="intfloat/multilingual-e5-large">multilingual-e5-large</td><td class="task-col">sentence-similarity</td><td data-col="dml/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="migraphx/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="mlas/cpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/npu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/cpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/npu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="vitisai/npu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td></tr>
+<tr class="group-row" data-group="jonathandinu"><td class="model-col"><span class="group-toggle"><span class="twisty">▼</span><span class="group-name">jonathandinu</span></span></td><td class="task-col group-meta">1 model</td><td data-col="dml/gpu"><span class="gcell split" title="Compatibility 1/1 pass · not accuracy-tested"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="migraphx/gpu"><span class="gcell split" title="Compatibility 1/1 pass · not accuracy-tested"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="mlas/cpu"><span class="gcell split" title="Compatibility 1/1 pass · not accuracy-tested"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/npu"><span class="gcell split" title="Compatibility 1/1 pass · not accuracy-tested"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/gpu"><span class="gcell split" title="Compatibility 0/1 pass · not accuracy-tested"><span class="half compat fail">0/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/cpu"><span class="gcell split" title="Compatibility 1/1 pass · not accuracy-tested"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/npu"><span class="gcell split" title="Compatibility 1/1 pass · not accuracy-tested"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/gpu"><span class="gcell split" title="Compatibility 1/1 pass · not accuracy-tested"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="gcell split" title="Compatibility 1/1 pass · not accuracy-tested"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="vitisai/npu"><span class="gcell split" title="Compatibility 1/1 pass · not accuracy-tested"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td></tr>
+<tr class="child-row" data-group="jonathandinu" data-model="jonathandinu/face-parsing" data-task="image-segmentation" data-type="segformer" data-passcount="9" data-compatall="0" data-accall="0" data-bothall="0" data-hasacc="0"><td class="model-col child-name" title="jonathandinu/face-parsing">face-parsing</td><td class="task-col">image-segmentation</td><td data-col="dml/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="migraphx/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="mlas/cpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/npu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-sa="1" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/cpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/npu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="vitisai/npu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td></tr>
+<tr class="group-row" data-group="kha-white"><td class="model-col"><span class="group-toggle"><span class="twisty">▼</span><span class="group-name">kha-white</span></span></td><td class="task-col group-meta">1 model</td><td data-col="dml/gpu"><span class="gcell split" title="Compatibility 1/1 pass · not accuracy-tested"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="migraphx/gpu"><span class="gcell split" title="Compatibility 1/1 pass · not accuracy-tested"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="mlas/cpu"><span class="gcell split" title="Compatibility 1/1 pass · not accuracy-tested"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/npu"><span class="gcell split" title="Compatibility 1/1 pass · not accuracy-tested"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/gpu"><span class="gcell split" title="Compatibility 1/1 pass · not accuracy-tested"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/cpu"><span class="gcell split" title="Compatibility 1/1 pass · not accuracy-tested"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/npu"><span class="gcell split" title="Compatibility 0/1 pass · not accuracy-tested"><span class="half compat fail">0/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/gpu"><span class="gcell split" title="Compatibility 0/1 pass · not accuracy-tested"><span class="half compat fail">0/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="gcell split" title="Compatibility 1/1 pass · not accuracy-tested"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="vitisai/npu"><span class="gcell split" title="Compatibility 1/1 pass · not accuracy-tested"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td></tr>
+<tr class="child-row" data-group="kha-white" data-model="kha-white/manga-ocr-base" data-task="image-to-text" data-type="vision-encoder-decoder" data-passcount="8" data-compatall="0" data-accall="0" data-bothall="0" data-hasacc="0"><td class="model-col child-name" title="kha-white/manga-ocr-base">manga-ocr-base</td><td class="task-col">image-to-text</td><td data-col="dml/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="migraphx/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="mlas/cpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/npu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/cpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/npu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-sa="1" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="vitisai/npu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td></tr>
+<tr class="group-row" data-group="knkarthick"><td class="model-col"><span class="group-toggle"><span class="twisty">▼</span><span class="group-name">knkarthick</span></span></td><td class="task-col group-meta">1 model</td><td data-col="dml/gpu"><span class="gcell split" title="Compatibility 0/1 pass · not accuracy-tested"><span class="half compat fail">0/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="migraphx/gpu"><span class="gcell split" title="Compatibility 0/1 pass · not accuracy-tested"><span class="half compat fail">0/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="mlas/cpu"><span class="gcell split" title="Compatibility 0/1 pass · not accuracy-tested"><span class="half compat fail">0/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/npu"><span class="gcell split" title="Compatibility 0/1 pass · not accuracy-tested"><span class="half compat fail">0/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/gpu"><span class="gcell split" title="Compatibility 0/1 pass · not accuracy-tested"><span class="half compat fail">0/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/cpu"><span class="gcell split" title="Compatibility 0/1 pass · not accuracy-tested"><span class="half compat fail">0/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/npu"><span class="gcell split" title="Compatibility 0/1 pass · not accuracy-tested"><span class="half compat fail">0/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/gpu"><span class="gcell split" title="Compatibility 0/1 pass · not accuracy-tested"><span class="half compat fail">0/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="gcell split" title="Compatibility 0/1 pass · not accuracy-tested"><span class="half compat fail">0/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="vitisai/npu"><span class="gcell split" title="Compatibility 0/1 pass · not accuracy-tested"><span class="half compat fail">0/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td></tr>
+<tr class="child-row" data-group="knkarthick" data-model="knkarthick/meeting_summary" data-task="summarization" data-type="bart" data-passcount="0" data-compatall="0" data-accall="0" data-bothall="0" data-hasacc="0"><td class="model-col child-name" title="knkarthick/MEETING_SUMMARY">MEETING_SUMMARY</td><td class="task-col">summarization</td><td data-col="dml/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="migraphx/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="mlas/cpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/npu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/cpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/npu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="vitisai/npu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td></tr>
+<tr class="group-row" data-group="liheyoung"><td class="model-col"><span class="group-toggle"><span class="twisty">▼</span><span class="group-name">LiheYoung</span></span></td><td class="task-col group-meta">3 models</td><td data-col="dml/gpu"><span class="gcell split" title="Compatibility 2/3 pass · not accuracy-tested"><span class="half compat regr">2/3</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="migraphx/gpu"><span class="gcell split" title="Compatibility 2/3 pass · not accuracy-tested"><span class="half compat regr">2/3</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="mlas/cpu"><span class="gcell split" title="Compatibility 2/3 pass · not accuracy-tested"><span class="half compat regr">2/3</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/npu"><span class="gcell split" title="Compatibility 2/3 pass · not accuracy-tested"><span class="half compat regr">2/3</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/gpu"><span class="gcell split" title="Compatibility 0/3 pass · not accuracy-tested"><span class="half compat fail">0/3</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/cpu"><span class="gcell split" title="Compatibility 2/3 pass · not accuracy-tested"><span class="half compat regr">2/3</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/npu"><span class="gcell split" title="Compatibility 2/3 pass · not accuracy-tested"><span class="half compat regr">2/3</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/gpu"><span class="gcell split" title="Compatibility 2/3 pass · not accuracy-tested"><span class="half compat regr">2/3</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="gcell split" title="Compatibility 2/3 pass · not accuracy-tested"><span class="half compat regr">2/3</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="vitisai/npu"><span class="gcell split" title="Compatibility 2/3 pass · not accuracy-tested"><span class="half compat regr">2/3</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td></tr>
+<tr class="child-row" data-group="liheyoung" data-model="liheyoung/depth-anything-base-hf" data-task="depth-estimation" data-type="depth_anything" data-passcount="0" data-compatall="0" data-accall="0" data-bothall="0" data-hasacc="0"><td class="model-col child-name" title="LiheYoung/depth-anything-base-hf">depth-anything-base-hf</td><td class="task-col">depth-estimation</td><td data-col="dml/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="migraphx/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="mlas/cpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/npu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/cpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/npu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="vitisai/npu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td></tr>
+<tr class="child-row" data-group="liheyoung" data-model="liheyoung/depth-anything-large-hf" data-task="depth-estimation" data-type="depth_anything" data-passcount="9" data-compatall="0" data-accall="0" data-bothall="0" data-hasacc="0"><td class="model-col child-name" title="LiheYoung/depth-anything-large-hf">depth-anything-large-hf</td><td class="task-col">depth-estimation</td><td data-col="dml/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="migraphx/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="mlas/cpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/npu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-sa="1" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/cpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/npu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="vitisai/npu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td></tr>
+<tr class="child-row" data-group="liheyoung" data-model="liheyoung/depth-anything-small-hf" data-task="depth-estimation" data-type="depth_anything" data-passcount="9" data-compatall="0" data-accall="0" data-bothall="0" data-hasacc="0"><td class="model-col child-name" title="LiheYoung/depth-anything-small-hf">depth-anything-small-hf</td><td class="task-col">depth-estimation</td><td data-col="dml/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="migraphx/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="mlas/cpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/npu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-sa="1" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/cpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/npu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="vitisai/npu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td></tr>
+<tr class="group-row" data-group="marqo"><td class="model-col"><span class="group-toggle"><span class="twisty">▼</span><span class="group-name">Marqo</span></span></td><td class="task-col group-meta">1 model</td><td data-col="dml/gpu"><span class="gcell split" title="Compatibility 0/1 pass · not accuracy-tested"><span class="half compat fail">0/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="migraphx/gpu"><span class="gcell split" title="Compatibility 0/1 pass · not accuracy-tested"><span class="half compat fail">0/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="mlas/cpu"><span class="gcell split" title="Compatibility 0/1 pass · not accuracy-tested"><span class="half compat fail">0/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/npu"><span class="gcell split" title="Compatibility 0/1 pass · not accuracy-tested"><span class="half compat fail">0/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/gpu"><span class="gcell split" title="Compatibility 0/1 pass · not accuracy-tested"><span class="half compat fail">0/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/cpu"><span class="gcell split" title="Compatibility 0/1 pass · not accuracy-tested"><span class="half compat fail">0/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/npu"><span class="gcell split" title="Compatibility 0/1 pass · not accuracy-tested"><span class="half compat fail">0/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/gpu"><span class="gcell split" title="Compatibility 0/1 pass · not accuracy-tested"><span class="half compat fail">0/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="gcell split" title="Compatibility 0/1 pass · not accuracy-tested"><span class="half compat fail">0/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="vitisai/npu"><span class="gcell split" title="Compatibility 0/1 pass · not accuracy-tested"><span class="half compat fail">0/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td></tr>
+<tr class="child-row" data-group="marqo" data-model="marqo/marqo-fashionsiglip" data-task="zero-shot-image-classification" data-type="siglip" data-passcount="0" data-compatall="0" data-accall="0" data-bothall="0" data-hasacc="0"><td class="model-col child-name" title="Marqo/marqo-fashionSigLIP">marqo-fashionSigLIP</td><td class="task-col">zero-shot-image-classification</td><td data-col="dml/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="migraphx/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="mlas/cpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/npu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/cpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/npu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="vitisai/npu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td></tr>
+<tr class="group-row" data-group="mixedbread-ai"><td class="model-col"><span class="group-toggle"><span class="twisty">▼</span><span class="group-name">mixedbread-ai</span></span></td><td class="task-col group-meta">1 model</td><td data-col="dml/gpu"><span class="gcell split" title="Compatibility 1/1 pass · not accuracy-tested"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="migraphx/gpu"><span class="gcell split" title="Compatibility 1/1 pass · not accuracy-tested"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="mlas/cpu"><span class="gcell split" title="Compatibility 1/1 pass · not accuracy-tested"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/npu"><span class="gcell split" title="Compatibility 1/1 pass · not accuracy-tested"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/gpu"><span class="gcell split" title="Compatibility 0/1 pass · not accuracy-tested"><span class="half compat fail">0/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/cpu"><span class="gcell split" title="Compatibility 1/1 pass · not accuracy-tested"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/npu"><span class="gcell split" title="Compatibility 1/1 pass · not accuracy-tested"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/gpu"><span class="gcell split" title="Compatibility 1/1 pass · not accuracy-tested"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="gcell split" title="Compatibility 1/1 pass · not accuracy-tested"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="vitisai/npu"><span class="gcell split" title="Compatibility 1/1 pass · not accuracy-tested"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td></tr>
+<tr class="child-row" data-group="mixedbread-ai" data-model="mixedbread-ai/mxbai-rerank-xsmall-v1" data-task="text-classification" data-type="deberta-v2" data-passcount="9" data-compatall="0" data-accall="0" data-bothall="0" data-hasacc="0"><td class="model-col child-name" title="mixedbread-ai/mxbai-rerank-xsmall-v1">mxbai-rerank-xsmall-v1</td><td class="task-col">text-classification</td><td data-col="dml/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="migraphx/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="mlas/cpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/npu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/cpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/npu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="vitisai/npu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td></tr>
+<tr class="group-row" data-group="moritzlaurer"><td class="model-col"><span class="group-toggle"><span class="twisty">▼</span><span class="group-name">MoritzLaurer</span></span></td><td class="task-col group-meta">4 models</td><td data-col="dml/gpu"><span class="gcell split" title="Compatibility 4/4 pass · not accuracy-tested"><span class="half compat pass">4/4</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="migraphx/gpu"><span class="gcell split" title="Compatibility 4/4 pass · not accuracy-tested"><span class="half compat pass">4/4</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="mlas/cpu"><span class="gcell split" title="Compatibility 4/4 pass · not accuracy-tested"><span class="half compat pass">4/4</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/npu"><span class="gcell split" title="Compatibility 4/4 pass · not accuracy-tested"><span class="half compat pass">4/4</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/gpu"><span class="gcell split" title="Compatibility 0/4 pass · not accuracy-tested"><span class="half compat fail">0/4</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/cpu"><span class="gcell split" title="Compatibility 4/4 pass · not accuracy-tested"><span class="half compat pass">4/4</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/npu"><span class="gcell split" title="Compatibility 4/4 pass · not accuracy-tested"><span class="half compat pass">4/4</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/gpu"><span class="gcell split" title="Compatibility 4/4 pass · not accuracy-tested"><span class="half compat pass">4/4</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="gcell split" title="Compatibility 4/4 pass · not accuracy-tested"><span class="half compat pass">4/4</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="vitisai/npu"><span class="gcell split" title="Compatibility 2/4 pass · not accuracy-tested"><span class="half compat regr">2/4</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td></tr>
+<tr class="child-row" data-group="moritzlaurer" data-model="moritzlaurer/deberta-v3-large-mnli-fever-anli-ling-wanli" data-task="zero-shot-classification" data-type="deberta-v2" data-passcount="8" data-compatall="0" data-accall="0" data-bothall="0" data-hasacc="0"><td class="model-col child-name" title="MoritzLaurer/DeBERTa-v3-large-mnli-fever-anli-ling-wanli">DeBERTa-v3-large-mnli-fever-anli-ling-wanli</td><td class="task-col">zero-shot-classification</td><td data-col="dml/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="migraphx/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="mlas/cpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/npu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/cpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/npu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="vitisai/npu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td></tr>
+<tr class="child-row" data-group="moritzlaurer" data-model="moritzlaurer/deberta-v3-large-zeroshot-v2.0" data-task="zero-shot-classification" data-type="deberta-v2" data-passcount="8" data-compatall="0" data-accall="0" data-bothall="0" data-hasacc="0"><td class="model-col child-name" title="MoritzLaurer/deberta-v3-large-zeroshot-v2.0">deberta-v3-large-zeroshot-v2.0</td><td class="task-col">zero-shot-classification</td><td data-col="dml/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="migraphx/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="mlas/cpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/npu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/cpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/npu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="vitisai/npu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td></tr>
+<tr class="child-row" data-group="moritzlaurer" data-model="moritzlaurer/mdeberta-v3-base-mnli-xnli" data-task="zero-shot-classification" data-type="deberta-v2" data-passcount="9" data-compatall="0" data-accall="0" data-bothall="0" data-hasacc="0"><td class="model-col child-name" title="MoritzLaurer/mDeBERTa-v3-base-mnli-xnli">mDeBERTa-v3-base-mnli-xnli</td><td class="task-col">zero-shot-classification</td><td data-col="dml/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="migraphx/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="mlas/cpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/npu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/cpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/npu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="vitisai/npu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td></tr>
+<tr class="child-row" data-group="moritzlaurer" data-model="moritzlaurer/mdeberta-v3-base-xnli-multilingual-nli-2mil7" data-task="zero-shot-classification" data-type="deberta-v2" data-passcount="9" data-compatall="0" data-accall="0" data-bothall="0" data-hasacc="0"><td class="model-col child-name" title="MoritzLaurer/mDeBERTa-v3-base-xnli-multilingual-nli-2mil7">mDeBERTa-v3-base-xnli-multilingual-nli-2mil7</td><td class="task-col">zero-shot-classification</td><td data-col="dml/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="migraphx/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="mlas/cpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/npu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/cpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/npu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="vitisai/npu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td></tr>
+<tr class="group-row" data-group="moussakam"><td class="model-col"><span class="group-toggle"><span class="twisty">▼</span><span class="group-name">moussaKam</span></span></td><td class="task-col group-meta">1 model</td><td data-col="dml/gpu"><span class="gcell split" title="Compatibility 0/1 pass · not accuracy-tested"><span class="half compat fail">0/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="migraphx/gpu"><span class="gcell split" title="Compatibility 0/1 pass · not accuracy-tested"><span class="half compat fail">0/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="mlas/cpu"><span class="gcell split" title="Compatibility 0/1 pass · not accuracy-tested"><span class="half compat fail">0/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/npu"><span class="gcell split" title="Compatibility 0/1 pass · not accuracy-tested"><span class="half compat fail">0/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/gpu"><span class="gcell split" title="Compatibility 0/1 pass · not accuracy-tested"><span class="half compat fail">0/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/cpu"><span class="gcell split" title="Compatibility 0/1 pass · not accuracy-tested"><span class="half compat fail">0/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/npu"><span class="gcell split" title="Compatibility 0/1 pass · not accuracy-tested"><span class="half compat fail">0/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/gpu"><span class="gcell split" title="Compatibility 0/1 pass · not accuracy-tested"><span class="half compat fail">0/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="gcell split" title="Compatibility 0/1 pass · not accuracy-tested"><span class="half compat fail">0/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="vitisai/npu"><span class="gcell split" title="Compatibility 0/1 pass · not accuracy-tested"><span class="half compat fail">0/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td></tr>
+<tr class="child-row" data-group="moussakam" data-model="moussakam/mbarthez" data-task="summarization" data-type="mbart" data-passcount="0" data-compatall="0" data-accall="0" data-bothall="0" data-hasacc="0"><td class="model-col child-name" title="moussaKam/mbarthez">mbarthez</td><td class="task-col">summarization</td><td data-col="dml/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="migraphx/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="mlas/cpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/npu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/cpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/npu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="vitisai/npu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td></tr>
+<tr class="group-row" data-group="naver-clova-ix"><td class="model-col"><span class="group-toggle"><span class="twisty">▼</span><span class="group-name">naver-clova-ix</span></span></td><td class="task-col group-meta">2 models</td><td data-col="dml/gpu"><span class="gcell split" title="Compatibility 2/2 pass · not accuracy-tested"><span class="half compat pass">2/2</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="migraphx/gpu"><span class="gcell split" title="Compatibility 2/2 pass · not accuracy-tested"><span class="half compat pass">2/2</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="mlas/cpu"><span class="gcell split" title="Compatibility 2/2 pass · not accuracy-tested"><span class="half compat pass">2/2</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/npu"><span class="gcell split" title="Compatibility 1/2 pass · not accuracy-tested"><span class="half compat regr">1/2</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/gpu"><span class="gcell split" title="Compatibility 2/2 pass · not accuracy-tested"><span class="half compat pass">2/2</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/cpu"><span class="gcell split" title="Compatibility 2/2 pass · not accuracy-tested"><span class="half compat pass">2/2</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/npu"><span class="gcell split" title="Compatibility 0/2 pass · not accuracy-tested"><span class="half compat fail">0/2</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/gpu"><span class="gcell split" title="Compatibility 0/2 pass · not accuracy-tested"><span class="half compat fail">0/2</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="gcell split" title="Compatibility 2/2 pass · not accuracy-tested"><span class="half compat pass">2/2</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="vitisai/npu"><span class="gcell split" title="Compatibility 2/2 pass · not accuracy-tested"><span class="half compat pass">2/2</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td></tr>
+<tr class="child-row" data-group="naver-clova-ix" data-model="naver-clova-ix/donut-base" data-task="image-to-text" data-type="vision-encoder-decoder" data-passcount="7" data-compatall="0" data-accall="0" data-bothall="0" data-hasacc="0"><td class="model-col child-name" title="naver-clova-ix/donut-base">donut-base</td><td class="task-col">image-to-text</td><td data-col="dml/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="migraphx/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="mlas/cpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/npu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/cpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/npu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-sa="1" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="vitisai/npu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td></tr>
+<tr class="child-row" data-group="naver-clova-ix" data-model="naver-clova-ix/donut-base-finetuned-cord-v2" data-task="image-to-text" data-type="vision-encoder-decoder" data-passcount="8" data-compatall="0" data-accall="0" data-bothall="0" data-hasacc="0"><td class="model-col child-name" title="naver-clova-ix/donut-base-finetuned-cord-v2">donut-base-finetuned-cord-v2</td><td class="task-col">image-to-text</td><td data-col="dml/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="migraphx/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="mlas/cpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/npu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/cpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/npu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-sa="1" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="vitisai/npu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td></tr>
+<tr class="group-row" data-group="nlpconnect"><td class="model-col"><span class="group-toggle"><span class="twisty">▼</span><span class="group-name">nlpconnect</span></span></td><td class="task-col group-meta">1 model</td><td data-col="dml/gpu"><span class="gcell split" title="Compatibility 1/1 pass · not accuracy-tested"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="migraphx/gpu"><span class="gcell split" title="Compatibility 1/1 pass · not accuracy-tested"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="mlas/cpu"><span class="gcell split" title="Compatibility 1/1 pass · not accuracy-tested"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/npu"><span class="gcell split" title="Compatibility 1/1 pass · not accuracy-tested"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/gpu"><span class="gcell split" title="Compatibility 1/1 pass · not accuracy-tested"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/cpu"><span class="gcell split" title="Compatibility 1/1 pass · not accuracy-tested"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/npu"><span class="gcell split" title="Compatibility 0/1 pass · not accuracy-tested"><span class="half compat fail">0/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/gpu"><span class="gcell split" title="Compatibility 0/1 pass · not accuracy-tested"><span class="half compat fail">0/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="gcell split" title="Compatibility 1/1 pass · not accuracy-tested"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="vitisai/npu"><span class="gcell split" title="Compatibility 0/1 pass · not accuracy-tested"><span class="half compat fail">0/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td></tr>
+<tr class="child-row" data-group="nlpconnect" data-model="nlpconnect/vit-gpt2-image-captioning" data-task="image-to-text" data-type="vision-encoder-decoder" data-passcount="7" data-compatall="0" data-accall="0" data-bothall="0" data-hasacc="0"><td class="model-col child-name" title="nlpconnect/vit-gpt2-image-captioning">vit-gpt2-image-captioning</td><td class="task-col">image-to-text</td><td data-col="dml/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="migraphx/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="mlas/cpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/npu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/cpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/npu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-sa="1" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="vitisai/npu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td></tr>
+<tr class="group-row" data-group="obi"><td class="model-col"><span class="group-toggle"><span class="twisty">▼</span><span class="group-name">obi</span></span></td><td class="task-col group-meta">1 model</td><td data-col="dml/gpu"><span class="gcell split" title="Compatibility 1/1 pass · not accuracy-tested"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="migraphx/gpu"><span class="gcell split" title="Compatibility 1/1 pass · not accuracy-tested"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="mlas/cpu"><span class="gcell split" title="Compatibility 1/1 pass · not accuracy-tested"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/npu"><span class="gcell split" title="Compatibility 1/1 pass · not accuracy-tested"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/gpu"><span class="gcell split" title="Compatibility 1/1 pass · not accuracy-tested"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/cpu"><span class="gcell split" title="Compatibility 1/1 pass · not accuracy-tested"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/npu"><span class="gcell split" title="Compatibility 0/1 pass · not accuracy-tested"><span class="half compat fail">0/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/gpu"><span class="gcell split" title="Compatibility 1/1 pass · not accuracy-tested"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="gcell split" title="Compatibility 1/1 pass · not accuracy-tested"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="vitisai/npu"><span class="gcell split" title="Compatibility 1/1 pass · not accuracy-tested"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td></tr>
+<tr class="child-row" data-group="obi" data-model="obi/deid_roberta_i2b2" data-task="token-classification" data-type="roberta" data-passcount="9" data-compatall="0" data-accall="0" data-bothall="0" data-hasacc="0"><td class="model-col child-name" title="obi/deid_roberta_i2b2">deid_roberta_i2b2</td><td class="task-col">token-classification</td><td data-col="dml/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="migraphx/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="mlas/cpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/npu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/cpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/npu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="vitisai/npu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td></tr>
+<tr class="group-row" data-group="oliverguhr"><td class="model-col"><span class="group-toggle"><span class="twisty">▼</span><span class="group-name">oliverguhr</span></span></td><td class="task-col group-meta">1 model</td><td data-col="dml/gpu"><span class="gcell split" title="Compatibility 1/1 pass · not accuracy-tested"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="migraphx/gpu"><span class="gcell split" title="Compatibility 1/1 pass · not accuracy-tested"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="mlas/cpu"><span class="gcell split" title="Compatibility 1/1 pass · not accuracy-tested"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/npu"><span class="gcell split" title="Compatibility 1/1 pass · not accuracy-tested"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/gpu"><span class="gcell split" title="Compatibility 1/1 pass · not accuracy-tested"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/cpu"><span class="gcell split" title="Compatibility 1/1 pass · not accuracy-tested"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/npu"><span class="gcell split" title="Compatibility 0/1 pass · not accuracy-tested"><span class="half compat fail">0/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/gpu"><span class="gcell split" title="Compatibility 1/1 pass · not accuracy-tested"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="gcell split" title="Compatibility 1/1 pass · not accuracy-tested"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="vitisai/npu"><span class="gcell split" title="Compatibility 1/1 pass · not accuracy-tested"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td></tr>
+<tr class="child-row" data-group="oliverguhr" data-model="oliverguhr/fullstop-punctuation-multilang-large" data-task="token-classification" data-type="xlm-roberta" data-passcount="9" data-compatall="0" data-accall="0" data-bothall="0" data-hasacc="0"><td class="model-col child-name" title="oliverguhr/fullstop-punctuation-multilang-large">fullstop-punctuation-multilang-large</td><td class="task-col">token-classification</td><td data-col="dml/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="migraphx/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="mlas/cpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/npu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/cpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/npu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="vitisai/npu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td></tr>
+<tr class="group-row" data-group="openai-community"><td class="model-col"><span class="group-toggle"><span class="twisty">▼</span><span class="group-name">openai-community</span></span></td><td class="task-col group-meta">1 model</td><td data-col="dml/gpu"><span class="gcell split" title="Compatibility 1/1 pass · not accuracy-tested"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="migraphx/gpu"><span class="gcell split" title="Compatibility 1/1 pass · not accuracy-tested"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="mlas/cpu"><span class="gcell split" title="Compatibility 1/1 pass · not accuracy-tested"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/npu"><span class="gcell split" title="Compatibility 0/1 pass · not accuracy-tested"><span class="half compat fail">0/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/gpu"><span class="gcell split" title="Compatibility 0/1 pass · not accuracy-tested"><span class="half compat fail">0/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/cpu"><span class="gcell split" title="Compatibility 0/1 pass · not accuracy-tested"><span class="half compat fail">0/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/npu"><span class="gcell split" title="Compatibility 0/1 pass · not accuracy-tested"><span class="half compat fail">0/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/gpu"><span class="gcell split" title="Compatibility 0/1 pass · not accuracy-tested"><span class="half compat fail">0/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="gcell split" title="Compatibility 1/1 pass · not accuracy-tested"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="vitisai/npu"><span class="gcell split" title="Compatibility 0/1 pass · not accuracy-tested"><span class="half compat fail">0/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td></tr>
+<tr class="child-row" data-group="openai-community" data-model="openai-community/gpt2" data-task="text-generation" data-type="gpt2" data-passcount="4" data-compatall="0" data-accall="0" data-bothall="0" data-hasacc="0"><td class="model-col child-name" title="openai-community/gpt2">gpt2</td><td class="task-col">text-generation</td><td data-col="dml/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="migraphx/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="mlas/cpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/npu"><span class="cell split" data-compat="FAIL" data-acc="" data-sa="1" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-sa="1" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/cpu"><span class="cell split" data-compat="FAIL" data-acc="" data-sa="1" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/npu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-sa="1" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="vitisai/npu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td></tr>
+<tr class="group-row" data-group="pekingu"><td class="model-col"><span class="group-toggle"><span class="twisty">▼</span><span class="group-name">PekingU</span></span></td><td class="task-col group-meta">3 models</td><td data-col="dml/gpu"><span class="gcell split" title="Compatibility 3/3 pass · not accuracy-tested"><span class="half compat pass">3/3</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="migraphx/gpu"><span class="gcell split" title="Compatibility 2/3 pass · not accuracy-tested"><span class="half compat regr">2/3</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="mlas/cpu"><span class="gcell split" title="Compatibility 3/3 pass · not accuracy-tested"><span class="half compat pass">3/3</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/npu"><span class="gcell split" title="Compatibility 3/3 pass · not accuracy-tested"><span class="half compat pass">3/3</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/gpu"><span class="gcell split" title="Compatibility 0/3 pass · not accuracy-tested"><span class="half compat fail">0/3</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/cpu"><span class="gcell split" title="Compatibility 3/3 pass · not accuracy-tested"><span class="half compat pass">3/3</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/npu"><span class="gcell split" title="Compatibility 3/3 pass · not accuracy-tested"><span class="half compat pass">3/3</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/gpu"><span class="gcell split" title="Compatibility 0/3 pass · not accuracy-tested"><span class="half compat fail">0/3</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="gcell split" title="Compatibility 3/3 pass · not accuracy-tested"><span class="half compat pass">3/3</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="vitisai/npu"><span class="gcell split" title="Compatibility 3/3 pass · not accuracy-tested"><span class="half compat pass">3/3</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td></tr>
+<tr class="child-row" data-group="pekingu" data-model="pekingu/rtdetr_r101vd_coco_o365" data-task="object-detection" data-type="rt_detr" data-passcount="8" data-compatall="0" data-accall="0" data-bothall="0" data-hasacc="0"><td class="model-col child-name" title="PekingU/rtdetr_r101vd_coco_o365">rtdetr_r101vd_coco_o365</td><td class="task-col">object-detection</td><td data-col="dml/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="migraphx/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="mlas/cpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/npu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-sa="1" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/cpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/npu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-sa="1" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="vitisai/npu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td></tr>
+<tr class="child-row" data-group="pekingu" data-model="pekingu/rtdetr_r50vd_coco_o365" data-task="object-detection" data-type="rt_detr" data-passcount="8" data-compatall="0" data-accall="0" data-bothall="0" data-hasacc="0"><td class="model-col child-name" title="PekingU/rtdetr_r50vd_coco_o365">rtdetr_r50vd_coco_o365</td><td class="task-col">object-detection</td><td data-col="dml/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="migraphx/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="mlas/cpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/npu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-sa="1" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/cpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/npu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-sa="1" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="vitisai/npu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td></tr>
+<tr class="child-row" data-group="pekingu" data-model="pekingu/rtdetr_v2_r18vd" data-task="object-detection" data-type="rt_detr_v2" data-passcount="7" data-compatall="0" data-accall="0" data-bothall="0" data-hasacc="0"><td class="model-col child-name" title="PekingU/rtdetr_v2_r18vd">rtdetr_v2_r18vd</td><td class="task-col">object-detection</td><td data-col="dml/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="migraphx/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="mlas/cpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/npu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-sa="1" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/cpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/npu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-sa="1" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="vitisai/npu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td></tr>
+<tr class="group-row" data-group="philschmid"><td class="model-col"><span class="group-toggle"><span class="twisty">▼</span><span class="group-name">philschmid</span></span></td><td class="task-col group-meta">1 model</td><td data-col="dml/gpu"><span class="gcell split" title="Compatibility 0/1 pass · not accuracy-tested"><span class="half compat fail">0/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="migraphx/gpu"><span class="gcell split" title="Compatibility 0/1 pass · not accuracy-tested"><span class="half compat fail">0/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="mlas/cpu"><span class="gcell split" title="Compatibility 0/1 pass · not accuracy-tested"><span class="half compat fail">0/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/npu"><span class="gcell split" title="Compatibility 0/1 pass · not accuracy-tested"><span class="half compat fail">0/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/gpu"><span class="gcell split" title="Compatibility 0/1 pass · not accuracy-tested"><span class="half compat fail">0/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/cpu"><span class="gcell split" title="Compatibility 0/1 pass · not accuracy-tested"><span class="half compat fail">0/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/npu"><span class="gcell split" title="Compatibility 0/1 pass · not accuracy-tested"><span class="half compat fail">0/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/gpu"><span class="gcell split" title="Compatibility 0/1 pass · not accuracy-tested"><span class="half compat fail">0/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="gcell split" title="Compatibility 0/1 pass · not accuracy-tested"><span class="half compat fail">0/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="vitisai/npu"><span class="gcell split" title="Compatibility 0/1 pass · not accuracy-tested"><span class="half compat fail">0/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td></tr>
+<tr class="child-row" data-group="philschmid" data-model="philschmid/bart-large-cnn-samsum" data-task="summarization" data-type="bart" data-passcount="0" data-compatall="0" data-accall="0" data-bothall="0" data-hasacc="0"><td class="model-col child-name" title="philschmid/bart-large-cnn-samsum">bart-large-cnn-samsum</td><td class="task-col">summarization</td><td data-col="dml/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="migraphx/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="mlas/cpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/npu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/cpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/npu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="vitisai/npu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td></tr>
+<tr class="group-row" data-group="qwen"><td class="model-col"><span class="group-toggle"><span class="twisty">▼</span><span class="group-name">Qwen</span></span></td><td class="task-col group-meta">7 models</td><td data-col="dml/gpu"><span class="gcell split" title="Compatibility 1/7 pass · not accuracy-tested"><span class="half compat regr">1/7</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="migraphx/gpu"><span class="gcell split" title="Compatibility 3/7 pass · not accuracy-tested"><span class="half compat regr">3/7</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="mlas/cpu"><span class="gcell split" title="Compatibility 1/7 pass · not accuracy-tested"><span class="half compat regr">1/7</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/npu"><span class="gcell split" title="Compatibility 0/7 pass · not accuracy-tested"><span class="half compat fail">0/7</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/gpu"><span class="gcell split" title="Compatibility 0/7 pass · not accuracy-tested"><span class="half compat fail">0/7</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/cpu"><span class="gcell split" title="Compatibility 0/7 pass · not accuracy-tested"><span class="half compat fail">0/7</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/npu"><span class="gcell split" title="Compatibility 0/7 pass · not accuracy-tested"><span class="half compat fail">0/7</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/gpu"><span class="gcell split" title="Compatibility 0/7 pass · not accuracy-tested"><span class="half compat fail">0/7</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="gcell split" title="Compatibility 2/7 pass · not accuracy-tested"><span class="half compat regr">2/7</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="vitisai/npu"><span class="gcell split" title="Compatibility 0/7 pass · not accuracy-tested"><span class="half compat fail">0/7</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td></tr>
+<tr class="child-row" data-group="qwen" data-model="qwen/qwen2.5-0.5b-instruct" data-task="text-generation" data-type="qwen2" data-passcount="4" data-compatall="0" data-accall="0" data-bothall="0" data-hasacc="0"><td class="model-col child-name" title="Qwen/Qwen2.5-0.5B-Instruct">Qwen2.5-0.5B-Instruct</td><td class="task-col">text-generation</td><td data-col="dml/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="migraphx/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="mlas/cpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/npu"><span class="cell split" data-compat="FAIL" data-acc="" data-sa="1" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-sa="1" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/cpu"><span class="cell split" data-compat="FAIL" data-acc="" data-sa="1" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/npu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-sa="1" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="vitisai/npu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td></tr>
+<tr class="child-row" data-group="qwen" data-model="qwen/qwen2.5-1.5b-instruct" data-task="text-generation" data-type="qwen2" data-passcount="2" data-compatall="0" data-accall="0" data-bothall="0" data-hasacc="0"><td class="model-col child-name" title="Qwen/Qwen2.5-1.5B-Instruct">Qwen2.5-1.5B-Instruct</td><td class="task-col">text-generation</td><td data-col="dml/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="migraphx/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="mlas/cpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/npu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/cpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/npu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-sa="1" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="vitisai/npu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td></tr>
+<tr class="child-row" data-group="qwen" data-model="qwen/qwen2.5-3b-instruct" data-task="text-generation" data-type="qwen2" data-passcount="1" data-compatall="0" data-accall="0" data-bothall="0" data-hasacc="0"><td class="model-col child-name" title="Qwen/Qwen2.5-3B-Instruct">Qwen2.5-3B-Instruct</td><td class="task-col">text-generation</td><td data-col="dml/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="migraphx/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="mlas/cpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/npu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/cpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/npu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="vitisai/npu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td></tr>
+<tr class="child-row" data-group="qwen" data-model="qwen/qwen2.5-7b-instruct" data-task="text-generation" data-type="qwen2" data-passcount="0" data-compatall="0" data-accall="0" data-bothall="0" data-hasacc="0"><td class="model-col child-name" title="Qwen/Qwen2.5-7B-Instruct">Qwen2.5-7B-Instruct</td><td class="task-col">text-generation</td><td data-col="dml/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="migraphx/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="mlas/cpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/npu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/cpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/npu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="vitisai/npu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td></tr>
+<tr class="child-row" data-group="qwen" data-model="qwen/qwen3-0.6b" data-task="text-generation" data-type="qwen3" data-passcount="0" data-compatall="0" data-accall="0" data-bothall="0" data-hasacc="0"><td class="model-col child-name" title="Qwen/Qwen3-0.6B">Qwen3-0.6B</td><td class="task-col">text-generation</td><td data-col="dml/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="migraphx/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="mlas/cpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/npu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/cpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/npu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="vitisai/npu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td></tr>
+<tr class="child-row" data-group="qwen" data-model="qwen/qwen3-1.7b" data-task="text-generation" data-type="qwen3" data-passcount="0" data-compatall="0" data-accall="0" data-bothall="0" data-hasacc="0"><td class="model-col child-name" title="Qwen/Qwen3-1.7B">Qwen3-1.7B</td><td class="task-col">text-generation</td><td data-col="dml/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="migraphx/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="mlas/cpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/npu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/cpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/npu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="vitisai/npu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td></tr>
+<tr class="child-row" data-group="qwen" data-model="qwen/qwen3-8b" data-task="text-generation" data-type="qwen3" data-passcount="0" data-compatall="0" data-accall="0" data-bothall="0" data-hasacc="0"><td class="model-col child-name" title="Qwen/Qwen3-8B">Qwen3-8B</td><td class="task-col">text-generation</td><td data-col="dml/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="migraphx/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="mlas/cpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/npu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/cpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/npu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="vitisai/npu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td></tr>
+<tr class="group-row" data-group="salesforce"><td class="model-col"><span class="group-toggle"><span class="twisty">▼</span><span class="group-name">Salesforce</span></span></td><td class="task-col group-meta">5 models</td><td data-col="dml/gpu"><span class="gcell split" title="Compatibility 1/5 pass · Accuracy 1/1 pass"><span class="half compat regr">1/5</span><span class="sep">|</span><span class="half acc pass">1/1</span></span></td><td data-col="migraphx/gpu"><span class="gcell split" title="Compatibility 1/5 pass · Accuracy 0/1 pass"><span class="half compat regr">1/5</span><span class="sep">|</span><span class="half acc fail">0/1</span></span></td><td data-col="mlas/cpu"><span class="gcell split" title="Compatibility 1/5 pass · Accuracy 1/1 pass"><span class="half compat regr">1/5</span><span class="sep">|</span><span class="half acc pass">1/1</span></span></td><td data-col="openvino/npu"><span class="gcell split" title="Compatibility 1/5 pass · Accuracy 1/1 pass"><span class="half compat regr">1/5</span><span class="sep">|</span><span class="half acc pass">1/1</span></span></td><td data-col="openvino/gpu"><span class="gcell split" title="Compatibility 1/5 pass · Accuracy 1/1 pass"><span class="half compat regr">1/5</span><span class="sep">|</span><span class="half acc pass">1/1</span></span></td><td data-col="openvino/cpu"><span class="gcell split" title="Compatibility 1/5 pass · Accuracy 1/1 pass"><span class="half compat regr">1/5</span><span class="sep">|</span><span class="half acc pass">1/1</span></span></td><td data-col="qnn/npu"><span class="gcell split" title="Compatibility 0/5 pass · Accuracy 1/1 pass"><span class="half compat fail">0/5</span><span class="sep">|</span><span class="half acc pass">1/1</span></span></td><td data-col="qnn/gpu"><span class="gcell split" title="Compatibility 0/5 pass · Accuracy 0/1 pass"><span class="half compat fail">0/5</span><span class="sep">|</span><span class="half acc fail">0/1</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="gcell split" title="Compatibility 1/5 pass · Accuracy 1/1 pass"><span class="half compat regr">1/5</span><span class="sep">|</span><span class="half acc pass">1/1</span></span></td><td data-col="vitisai/npu"><span class="gcell split" title="Compatibility 1/5 pass · Accuracy 1/1 pass"><span class="half compat regr">1/5</span><span class="sep">|</span><span class="half acc pass">1/1</span></span></td></tr>
+<tr class="child-row" data-group="salesforce" data-model="salesforce/blip-image-captioning-base" data-task="image-to-text" data-type="blip" data-passcount="8" data-compatall="0" data-accall="0" data-bothall="0" data-hasacc="1"><td class="model-col child-name" title="Salesforce/blip-image-captioning-base">blip-image-captioning-base</td><td class="task-col">image-to-text</td><td data-col="dml/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="CIDEr Score" data-task="Image captioning" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="migraphx/gpu"><span class="cell split" data-compat="PASS" data-acc="REGRESSION" data-metric="CIDEr Score" data-task="Image captioning" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;REGRESSION&quot;,&quot;delta&quot;:&quot;-99.6%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc regr">▼</span></span></td><td data-col="mlas/cpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="CIDEr Score" data-task="Image captioning" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="openvino/npu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="CIDEr Score" data-task="Image captioning" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.2%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="openvino/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="CIDEr Score" data-task="Image captioning" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-0.7%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="openvino/cpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="CIDEr Score" data-task="Image captioning" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;+0.0%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="qnn/npu"><span class="cell split" data-compat="FAIL" data-acc="PASS" data-metric="CIDEr Score" data-task="Image captioning" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-1.6%&quot;,&quot;best&quot;:true}]'><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="qnn/gpu"><span class="cell split" data-compat="FAIL" data-acc="REGRESSION" data-sa="1" data-metric="CIDEr Score" data-task="Image captioning" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;REGRESSION&quot;,&quot;delta&quot;:&quot;-100.0%&quot;,&quot;best&quot;:true}]'><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc regr">▼</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="CIDEr Score" data-task="Image captioning" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-0.6%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td><td data-col="vitisai/npu"><span class="cell split" data-compat="PASS" data-acc="PASS" data-metric="CIDEr Score" data-task="Image captioning" data-logic="PASS if delta &lt; 10%" data-variants='[{&quot;precision&quot;:&quot;unquantized&quot;,&quot;verdict&quot;:&quot;PASS&quot;,&quot;delta&quot;:&quot;-1.9%&quot;,&quot;best&quot;:true}]'><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc pass">✓</span></span></td></tr>
+<tr class="child-row" data-group="salesforce" data-model="salesforce/blip-vqa-base" data-task="visual-question-answering" data-type="blip" data-passcount="0" data-compatall="0" data-accall="0" data-bothall="0" data-hasacc="0"><td class="model-col child-name" title="Salesforce/blip-vqa-base">blip-vqa-base</td><td class="task-col">visual-question-answering</td><td data-col="dml/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="migraphx/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="mlas/cpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/npu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/cpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/npu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="vitisai/npu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td></tr>
+<tr class="child-row" data-group="salesforce" data-model="salesforce/blip2-flan-t5-xl" data-task="visual-question-answering" data-type="blip-2" data-passcount="0" data-compatall="0" data-accall="0" data-bothall="0" data-hasacc="0"><td class="model-col child-name" title="Salesforce/blip2-flan-t5-xl">blip2-flan-t5-xl</td><td class="task-col">visual-question-answering</td><td data-col="dml/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="migraphx/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="mlas/cpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/npu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/cpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/npu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="vitisai/npu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td></tr>
+<tr class="child-row" data-group="salesforce" data-model="salesforce/blip2-opt-2.7b" data-task="visual-question-answering" data-type="blip-2" data-passcount="0" data-compatall="0" data-accall="0" data-bothall="0" data-hasacc="0"><td class="model-col child-name" title="Salesforce/blip2-opt-2.7b">blip2-opt-2.7b</td><td class="task-col">visual-question-answering</td><td data-col="dml/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="migraphx/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="mlas/cpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/npu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/cpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/npu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="vitisai/npu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td></tr>
+<tr class="child-row" data-group="salesforce" data-model="salesforce/blip2-opt-2.7b-coco" data-task="visual-question-answering" data-type="blip-2" data-passcount="0" data-compatall="0" data-accall="0" data-bothall="0" data-hasacc="0"><td class="model-col child-name" title="Salesforce/blip2-opt-2.7b-coco">blip2-opt-2.7b-coco</td><td class="task-col">visual-question-answering</td><td data-col="dml/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="migraphx/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="mlas/cpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/npu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/cpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/npu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="vitisai/npu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td></tr>
+<tr class="group-row" data-group="sshleifer"><td class="model-col"><span class="group-toggle"><span class="twisty">▼</span><span class="group-name">sshleifer</span></span></td><td class="task-col group-meta">1 model</td><td data-col="dml/gpu"><span class="gcell split" title="Compatibility 1/1 pass · not accuracy-tested"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="migraphx/gpu"><span class="gcell split" title="Compatibility 1/1 pass · not accuracy-tested"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="mlas/cpu"><span class="gcell split" title="Compatibility 1/1 pass · not accuracy-tested"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/npu"><span class="gcell split" title="Compatibility 1/1 pass · not accuracy-tested"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/gpu"><span class="gcell split" title="Compatibility 1/1 pass · not accuracy-tested"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/cpu"><span class="gcell split" title="Compatibility 1/1 pass · not accuracy-tested"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/npu"><span class="gcell split" title="Compatibility 0/1 pass · not accuracy-tested"><span class="half compat fail">0/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/gpu"><span class="gcell split" title="Compatibility 0/1 pass · not accuracy-tested"><span class="half compat fail">0/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="gcell split" title="Compatibility 0/1 pass · not accuracy-tested"><span class="half compat fail">0/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="vitisai/npu"><span class="gcell split" title="Compatibility 1/1 pass · not accuracy-tested"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td></tr>
+<tr class="child-row" data-group="sshleifer" data-model="sshleifer/distilbart-cnn-12-6" data-task="summarization" data-type="bart" data-passcount="7" data-compatall="0" data-accall="0" data-bothall="0" data-hasacc="0"><td class="model-col child-name" title="sshleifer/distilbart-cnn-12-6">distilbart-cnn-12-6</td><td class="task-col">summarization</td><td data-col="dml/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="migraphx/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="mlas/cpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/npu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/cpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/npu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-sa="1" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="vitisai/npu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td></tr>
+<tr class="group-row" data-group="tahadouaji"><td class="model-col"><span class="group-toggle"><span class="twisty">▼</span><span class="group-name">TahaDouaji</span></span></td><td class="task-col group-meta">1 model</td><td data-col="dml/gpu"><span class="gcell split" title="Compatibility 1/1 pass · not accuracy-tested"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="migraphx/gpu"><span class="gcell split" title="Compatibility 1/1 pass · not accuracy-tested"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="mlas/cpu"><span class="gcell split" title="Compatibility 1/1 pass · not accuracy-tested"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/npu"><span class="gcell split" title="Compatibility 1/1 pass · not accuracy-tested"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/gpu"><span class="gcell split" title="Compatibility 0/1 pass · not accuracy-tested"><span class="half compat fail">0/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/cpu"><span class="gcell split" title="Compatibility 1/1 pass · not accuracy-tested"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/npu"><span class="gcell split" title="Compatibility 1/1 pass · not accuracy-tested"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/gpu"><span class="gcell split" title="Compatibility 1/1 pass · not accuracy-tested"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="gcell split" title="Compatibility 1/1 pass · not accuracy-tested"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="vitisai/npu"><span class="gcell split" title="Compatibility 1/1 pass · not accuracy-tested"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td></tr>
+<tr class="child-row" data-group="tahadouaji" data-model="tahadouaji/detr-doc-table-detection" data-task="object-detection" data-type="detr" data-passcount="9" data-compatall="0" data-accall="0" data-bothall="0" data-hasacc="0"><td class="model-col child-name" title="TahaDouaji/detr-doc-table-detection">detr-doc-table-detection</td><td class="task-col">object-detection</td><td data-col="dml/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="migraphx/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="mlas/cpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/npu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/cpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/npu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="vitisai/npu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td></tr>
+<tr class="group-row" data-group="timm"><td class="model-col"><span class="group-toggle"><span class="twisty">▼</span><span class="group-name">timm</span></span></td><td class="task-col group-meta">2 models</td><td data-col="dml/gpu"><span class="gcell split" title="Compatibility 0/0 pass · not accuracy-tested"><span class="half compat nodata">—</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="migraphx/gpu"><span class="gcell split" title="Compatibility 0/0 pass · not accuracy-tested"><span class="half compat nodata">—</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="mlas/cpu"><span class="gcell split" title="Compatibility 0/0 pass · not accuracy-tested"><span class="half compat nodata">—</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/npu"><span class="gcell split" title="Compatibility 0/0 pass · not accuracy-tested"><span class="half compat nodata">—</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/gpu"><span class="gcell split" title="Compatibility 0/0 pass · not accuracy-tested"><span class="half compat nodata">—</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/cpu"><span class="gcell split" title="Compatibility 0/0 pass · not accuracy-tested"><span class="half compat nodata">—</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/npu"><span class="gcell split" title="Compatibility 0/0 pass · not accuracy-tested"><span class="half compat nodata">—</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/gpu"><span class="gcell split" title="Compatibility 0/0 pass · not accuracy-tested"><span class="half compat nodata">—</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="gcell split" title="Compatibility 2/2 pass · not accuracy-tested"><span class="half compat pass">2/2</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="vitisai/npu"><span class="gcell split" title="Compatibility 0/0 pass · not accuracy-tested"><span class="half compat nodata">—</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td></tr>
+<tr class="child-row" data-group="timm" data-model="timm/mobilenetv3_small_100.lamb_in1k" data-task="image-classification" data-type="timm_wrapper" data-passcount="1" data-compatall="0" data-accall="0" data-bothall="0" data-hasacc="0"><td class="model-col child-name" title="timm/mobilenetv3_small_100.lamb_in1k">mobilenetv3_small_100.lamb_in1k</td><td class="task-col">image-classification</td><td data-col="dml/gpu"><span class="cell split" data-compat="N/A" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat na">∅</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="migraphx/gpu"><span class="cell split" data-compat="N/A" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat na">∅</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="mlas/cpu"><span class="cell split" data-compat="N/A" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat na">∅</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/npu"><span class="cell split" data-compat="N/A" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat na">∅</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/gpu"><span class="cell split" data-compat="N/A" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat na">∅</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/cpu"><span class="cell split" data-compat="N/A" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat na">∅</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/npu"><span class="cell split" data-compat="N/A" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat na">∅</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/gpu"><span class="cell split" data-compat="N/A" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat na">∅</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="vitisai/npu"><span class="cell split" data-compat="N/A" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat na">∅</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td></tr>
+<tr class="child-row" data-group="timm" data-model="timm/repghostnet_200.in1k" data-task="image-classification" data-type="timm_wrapper" data-passcount="1" data-compatall="0" data-accall="0" data-bothall="0" data-hasacc="0"><td class="model-col child-name" title="timm/repghostnet_200.in1k">repghostnet_200.in1k</td><td class="task-col">image-classification</td><td data-col="dml/gpu"><span class="cell split" data-compat="N/A" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat na">∅</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="migraphx/gpu"><span class="cell split" data-compat="N/A" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat na">∅</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="mlas/cpu"><span class="cell split" data-compat="N/A" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat na">∅</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/npu"><span class="cell split" data-compat="N/A" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat na">∅</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/gpu"><span class="cell split" data-compat="N/A" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat na">∅</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/cpu"><span class="cell split" data-compat="N/A" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat na">∅</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/npu"><span class="cell split" data-compat="N/A" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat na">∅</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/gpu"><span class="cell split" data-compat="N/A" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat na">∅</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="vitisai/npu"><span class="cell split" data-compat="N/A" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat na">∅</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td></tr>
+<tr class="group-row" data-group="timpal0l"><td class="model-col"><span class="group-toggle"><span class="twisty">▼</span><span class="group-name">timpal0l</span></span></td><td class="task-col group-meta">1 model</td><td data-col="dml/gpu"><span class="gcell split" title="Compatibility 1/1 pass · not accuracy-tested"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="migraphx/gpu"><span class="gcell split" title="Compatibility 1/1 pass · not accuracy-tested"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="mlas/cpu"><span class="gcell split" title="Compatibility 1/1 pass · not accuracy-tested"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/npu"><span class="gcell split" title="Compatibility 1/1 pass · not accuracy-tested"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/gpu"><span class="gcell split" title="Compatibility 0/1 pass · not accuracy-tested"><span class="half compat fail">0/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/cpu"><span class="gcell split" title="Compatibility 1/1 pass · not accuracy-tested"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/npu"><span class="gcell split" title="Compatibility 0/1 pass · not accuracy-tested"><span class="half compat fail">0/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/gpu"><span class="gcell split" title="Compatibility 1/1 pass · not accuracy-tested"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="gcell split" title="Compatibility 1/1 pass · not accuracy-tested"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="vitisai/npu"><span class="gcell split" title="Compatibility 1/1 pass · not accuracy-tested"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td></tr>
+<tr class="child-row" data-group="timpal0l" data-model="timpal0l/mdeberta-v3-base-squad2" data-task="question-answering" data-type="deberta-v2" data-passcount="8" data-compatall="0" data-accall="0" data-bothall="0" data-hasacc="0"><td class="model-col child-name" title="timpal0l/mdeberta-v3-base-squad2">mdeberta-v3-base-squad2</td><td class="task-col">question-answering</td><td data-col="dml/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="migraphx/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="mlas/cpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/npu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/cpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/npu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="vitisai/npu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td></tr>
+<tr class="group-row" data-group="trl-internal-testing"><td class="model-col"><span class="group-toggle"><span class="twisty">▼</span><span class="group-name">trl-internal-testing</span></span></td><td class="task-col group-meta">1 model</td><td data-col="dml/gpu"><span class="gcell split" title="Compatibility 1/1 pass · not accuracy-tested"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="migraphx/gpu"><span class="gcell split" title="Compatibility 1/1 pass · not accuracy-tested"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="mlas/cpu"><span class="gcell split" title="Compatibility 1/1 pass · not accuracy-tested"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/npu"><span class="gcell split" title="Compatibility 0/1 pass · not accuracy-tested"><span class="half compat fail">0/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/gpu"><span class="gcell split" title="Compatibility 0/1 pass · not accuracy-tested"><span class="half compat fail">0/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/cpu"><span class="gcell split" title="Compatibility 0/1 pass · not accuracy-tested"><span class="half compat fail">0/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/npu"><span class="gcell split" title="Compatibility 0/1 pass · not accuracy-tested"><span class="half compat fail">0/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/gpu"><span class="gcell split" title="Compatibility 0/1 pass · not accuracy-tested"><span class="half compat fail">0/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="gcell split" title="Compatibility 1/1 pass · not accuracy-tested"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="vitisai/npu"><span class="gcell split" title="Compatibility 0/1 pass · not accuracy-tested"><span class="half compat fail">0/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td></tr>
+<tr class="child-row" data-group="trl-internal-testing" data-model="trl-internal-testing/tiny-qwen2forcausallm-2.5" data-task="text-generation" data-type="qwen2" data-passcount="4" data-compatall="0" data-accall="0" data-bothall="0" data-hasacc="0"><td class="model-col child-name" title="trl-internal-testing/tiny-Qwen2ForCausalLM-2.5">tiny-Qwen2ForCausalLM-2.5</td><td class="task-col">text-generation</td><td data-col="dml/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="migraphx/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="mlas/cpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/npu"><span class="cell split" data-compat="FAIL" data-acc="" data-sa="1" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-sa="1" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/cpu"><span class="cell split" data-compat="FAIL" data-acc="" data-sa="1" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/npu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-sa="1" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="vitisai/npu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td></tr>
+<tr class="group-row" data-group="valhalla"><td class="model-col"><span class="group-toggle"><span class="twisty">▼</span><span class="group-name">valhalla</span></span></td><td class="task-col group-meta">1 model</td><td data-col="dml/gpu"><span class="gcell split" title="Compatibility 0/1 pass · not accuracy-tested"><span class="half compat fail">0/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="migraphx/gpu"><span class="gcell split" title="Compatibility 0/1 pass · not accuracy-tested"><span class="half compat fail">0/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="mlas/cpu"><span class="gcell split" title="Compatibility 0/1 pass · not accuracy-tested"><span class="half compat fail">0/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/npu"><span class="gcell split" title="Compatibility 0/1 pass · not accuracy-tested"><span class="half compat fail">0/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/gpu"><span class="gcell split" title="Compatibility 0/1 pass · not accuracy-tested"><span class="half compat fail">0/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/cpu"><span class="gcell split" title="Compatibility 0/1 pass · not accuracy-tested"><span class="half compat fail">0/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/npu"><span class="gcell split" title="Compatibility 0/1 pass · not accuracy-tested"><span class="half compat fail">0/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/gpu"><span class="gcell split" title="Compatibility 0/1 pass · not accuracy-tested"><span class="half compat fail">0/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="gcell split" title="Compatibility 0/1 pass · not accuracy-tested"><span class="half compat fail">0/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="vitisai/npu"><span class="gcell split" title="Compatibility 0/1 pass · not accuracy-tested"><span class="half compat fail">0/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td></tr>
+<tr class="child-row" data-group="valhalla" data-model="valhalla/distilbart-mnli-12-3" data-task="zero-shot-classification" data-type="bart" data-passcount="0" data-compatall="0" data-accall="0" data-bothall="0" data-hasacc="0"><td class="model-col child-name" title="valhalla/distilbart-mnli-12-3">distilbart-mnli-12-3</td><td class="task-col">zero-shot-classification</td><td data-col="dml/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="migraphx/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="mlas/cpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/npu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/cpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/npu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="vitisai/npu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td></tr>
+<tr class="group-row" data-group="wanglab"><td class="model-col"><span class="group-toggle"><span class="twisty">▼</span><span class="group-name">wanglab</span></span></td><td class="task-col group-meta">1 model</td><td data-col="dml/gpu"><span class="gcell split" title="Compatibility 1/1 pass · not accuracy-tested"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="migraphx/gpu"><span class="gcell split" title="Compatibility 1/1 pass · not accuracy-tested"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="mlas/cpu"><span class="gcell split" title="Compatibility 1/1 pass · not accuracy-tested"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/npu"><span class="gcell split" title="Compatibility 1/1 pass · not accuracy-tested"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/gpu"><span class="gcell split" title="Compatibility 0/1 pass · not accuracy-tested"><span class="half compat fail">0/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/cpu"><span class="gcell split" title="Compatibility 1/1 pass · not accuracy-tested"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/npu"><span class="gcell split" title="Compatibility 1/1 pass · not accuracy-tested"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/gpu"><span class="gcell split" title="Compatibility 0/1 pass · not accuracy-tested"><span class="half compat fail">0/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="gcell split" title="Compatibility 1/1 pass · not accuracy-tested"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="vitisai/npu"><span class="gcell split" title="Compatibility 1/1 pass · not accuracy-tested"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td></tr>
+<tr class="child-row" data-group="wanglab" data-model="wanglab/medsam-vit-base" data-task="mask-generation" data-type="sam" data-passcount="8" data-compatall="0" data-accall="0" data-bothall="0" data-hasacc="0"><td class="model-col child-name" title="wanglab/medsam-vit-base">medsam-vit-base</td><td class="task-col">mask-generation</td><td data-col="dml/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="migraphx/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="mlas/cpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/npu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-sa="1" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/cpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/npu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="vitisai/npu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td></tr>
+<tr class="group-row" data-group="xenova"><td class="model-col"><span class="group-toggle"><span class="twisty">▼</span><span class="group-name">Xenova</span></span></td><td class="task-col group-meta">2 models</td><td data-col="dml/gpu"><span class="gcell split" title="Compatibility 0/2 pass · not accuracy-tested"><span class="half compat fail">0/2</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="migraphx/gpu"><span class="gcell split" title="Compatibility 0/2 pass · not accuracy-tested"><span class="half compat fail">0/2</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="mlas/cpu"><span class="gcell split" title="Compatibility 0/2 pass · not accuracy-tested"><span class="half compat fail">0/2</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/npu"><span class="gcell split" title="Compatibility 0/2 pass · not accuracy-tested"><span class="half compat fail">0/2</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/gpu"><span class="gcell split" title="Compatibility 0/2 pass · not accuracy-tested"><span class="half compat fail">0/2</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/cpu"><span class="gcell split" title="Compatibility 0/2 pass · not accuracy-tested"><span class="half compat fail">0/2</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/npu"><span class="gcell split" title="Compatibility 0/2 pass · not accuracy-tested"><span class="half compat fail">0/2</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/gpu"><span class="gcell split" title="Compatibility 0/2 pass · not accuracy-tested"><span class="half compat fail">0/2</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="gcell split" title="Compatibility 0/2 pass · not accuracy-tested"><span class="half compat fail">0/2</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="vitisai/npu"><span class="gcell split" title="Compatibility 0/2 pass · not accuracy-tested"><span class="half compat fail">0/2</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td></tr>
+<tr class="child-row" data-group="xenova" data-model="xenova/paraphrase-multilingual-minilm-l12-v2" data-task="feature-extraction" data-type="bert" data-passcount="0" data-compatall="0" data-accall="0" data-bothall="0" data-hasacc="0"><td class="model-col child-name" title="Xenova/paraphrase-multilingual-MiniLM-L12-v2">paraphrase-multilingual-MiniLM-L12-v2</td><td class="task-col">feature-extraction</td><td data-col="dml/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="migraphx/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="mlas/cpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/npu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/cpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/npu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="vitisai/npu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td></tr>
+<tr class="child-row" data-group="xenova" data-model="xenova/segformer-b0-finetuned-ade-512-512" data-task="image-segmentation" data-type="segformer" data-passcount="0" data-compatall="0" data-accall="0" data-bothall="0" data-hasacc="0"><td class="model-col child-name" title="Xenova/segformer-b0-finetuned-ade-512-512">segformer-b0-finetuned-ade-512-512</td><td class="task-col">image-segmentation</td><td data-col="dml/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="migraphx/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="mlas/cpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/npu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/cpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/npu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="vitisai/npu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td></tr>
+<tr class="group-row" data-group="zigeng"><td class="model-col"><span class="group-toggle"><span class="twisty">▼</span><span class="group-name">Zigeng</span></span></td><td class="task-col group-meta">1 model</td><td data-col="dml/gpu"><span class="gcell split" title="Compatibility 1/1 pass · not accuracy-tested"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="migraphx/gpu"><span class="gcell split" title="Compatibility 1/1 pass · not accuracy-tested"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="mlas/cpu"><span class="gcell split" title="Compatibility 1/1 pass · not accuracy-tested"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/npu"><span class="gcell split" title="Compatibility 1/1 pass · not accuracy-tested"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/gpu"><span class="gcell split" title="Compatibility 0/1 pass · not accuracy-tested"><span class="half compat fail">0/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/cpu"><span class="gcell split" title="Compatibility 1/1 pass · not accuracy-tested"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/npu"><span class="gcell split" title="Compatibility 1/1 pass · not accuracy-tested"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/gpu"><span class="gcell split" title="Compatibility 0/1 pass · not accuracy-tested"><span class="half compat fail">0/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="gcell split" title="Compatibility 1/1 pass · not accuracy-tested"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="vitisai/npu"><span class="gcell split" title="Compatibility 1/1 pass · not accuracy-tested"><span class="half compat pass">1/1</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td></tr>
+<tr class="child-row" data-group="zigeng" data-model="zigeng/slimsam-uniform-77" data-task="mask-generation" data-type="sam" data-passcount="8" data-compatall="0" data-accall="0" data-bothall="0" data-hasacc="0"><td class="model-col child-name" title="Zigeng/SlimSAM-uniform-77">SlimSAM-uniform-77</td><td class="task-col">mask-generation</td><td data-col="dml/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="migraphx/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="mlas/cpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/npu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-sa="1" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="openvino/cpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/npu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="qnn/gpu"><span class="cell split" data-compat="FAIL" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat fail">✗</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="nv_tensorrt_rtx/gpu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td><td data-col="vitisai/npu"><span class="cell split" data-compat="PASS" data-acc="" data-desc="Not evaluated on this execution provider."><span class="half compat pass">✓</span><span class="sep">|</span><span class="half acc nodata">—</span></span></td></tr>
+    </tbody>
+  </table>
+</div>
+<div class="footer">Compatibility (build &amp; run) across 10 execution providers for 226 model · task pairs; accuracy graded against the PyTorch baseline for 83 of them. · 69/199 models run on every EP.</div>
+<script>
+const search=document.getElementById('search');
+const taskFilter=document.getElementById('taskFilter');
+const typeFilter=document.getElementById('typeFilter');
+const statusFilter=document.getElementById('statusFilter');
+const sortBy=document.getElementById('sortBy');
+const expandAllBtn=document.getElementById('expandAll');
+const tbody=document.querySelector('tbody');
+const groupRows=[...document.querySelectorAll('tr.group-row')];
+const childRows=[...document.querySelectorAll('tr.child-row')];
+const childrenByGroup={};
+for(const r of childRows){(childrenByGroup[r.dataset.group]=childrenByGroup[r.dataset.group]||[]).push(r);}
+const countLabel=document.getElementById('countLabel');
+// Collapse state per group (expanded by default -- every group opens showing its
+// individual models; collapse a group to hide them).
+const collapsed={};
+for(const g of groupRows)collapsed[g.dataset.group]=false;
+
+// Show-filter predicates. Compatibility options act on the row's compat pass
+// count / per-EP Pass halves; accuracy options act on the accuracy halves. This
+// is the union of the two source reports' "Show" menus.
+function matchStatus(r,sf){
+  if(!sf)return true;
+  const passCount=+r.dataset.passcount||0;
+  switch(sf){
+    case 'compat:all':  return r.dataset.compatall==='1';
+    case 'compat:some': return passCount>0;
+    case 'compat:none': return r.querySelector('.half.compat.pass')===null
+                              && r.querySelector('.half.compat.fail')!==null;
+    case 'acc:tested':  return r.dataset.hasacc==='1';
+    default:            return r.querySelector('.half.acc.'+sf.split(':')[1])!==null;
+  }
+}
+function apply(){
+  const q=search.value.toLowerCase();
+  const tf=taskFilter.value;
+  const yf=typeFilter.value;
+  const sf=statusFilter.value;
+  const active=!!(q||tf||yf||sf);   // any filter active -> force-expand matches
+  let shown=0;
+  for(const g of groupRows){
+    const grp=g.dataset.group;
+    const kids=childrenByGroup[grp]||[];
+    let anyMatch=false;
+    for(const k of kids){
+      const model=k.dataset.model, task=k.dataset.task, type=k.dataset.type||'';
+      const match=(!q||model.includes(q)||task.includes(q))
+            &&(!tf||task===tf)&&(!yf||type===yf)&&matchStatus(k,sf);
+      k._match=match;
+      if(match){anyMatch=true;shown++;}
+    }
+    g.style.display=anyMatch?'':'none';
+    const expanded=active?anyMatch:!collapsed[grp];
+    const tw=g.querySelector('.twisty');
+    if(tw)tw.textContent=expanded?'\u25bc':'\u25b6';
+    for(const k of kids){
+      k.style.display=(k._match&&expanded)?'':'none';
+    }
+  }
+  const ng=groupRows.filter(g=>g.style.display!=='none').length;
+  countLabel.textContent=shown+' / '+childRows.length+' pairs \u00b7 '+ng+' groups';
+}
+function setAll(state){
+  for(const g of groupRows)collapsed[g.dataset.group]=state;
+  expandAllBtn.textContent=state?'Expand all':'Collapse all';
+  apply();
+}
+// --- Sorting -----------------------------------------------------------------
+// Reorders both the groups and the member rows within each group. The "pass
+// first" modes bubble all-pass rows/orgs to the top; ties break alphabetically.
+function cmp(a,b){
+  for(let i=0;i<Math.min(a.length,b.length);i++){
+    if(a[i]<b[i])return -1; if(a[i]>b[i])return 1;
+  }
+  return 0;
+}
+function rowKey(r,mode){
+  const both=r.dataset.bothall==='1', comp=r.dataset.compatall==='1', acc=r.dataset.accall==='1';
+  const nm=r.dataset.model, tk=r.dataset.task;
+  if(mode==='name')return [nm,tk];
+  if(mode==='comp')return [comp?0:1,nm,tk];
+  if(mode==='acc') return [acc?0:1,nm,tk];
+  return [both?0:1,comp?0:1,acc?0:1,nm,tk];   // comp_acc (default)
+}
+function groupKey(grp,mode){
+  const kids=childrenByGroup[grp]||[];
+  let nBoth=0,nComp=0,nAcc=0;
+  for(const k of kids){
+    if(k.dataset.bothall==='1')nBoth++;
+    if(k.dataset.compatall==='1')nComp++;
+    if(k.dataset.accall==='1')nAcc++;
+  }
+  if(mode==='name')return [grp];
+  if(mode==='comp')return [-nComp,grp];
+  if(mode==='acc') return [-nAcc,grp];
+  return [-nBoth,-nComp,-nAcc,grp];           // comp_acc (default)
+}
+function applySort(){
+  const mode=sortBy.value;
+  const gOrder=groupRows.slice().sort((A,B)=>cmp(groupKey(A.dataset.group,mode),groupKey(B.dataset.group,mode)));
+  for(const g of gOrder){
+    tbody.appendChild(g);
+    const kids=(childrenByGroup[g.dataset.group]||[]).slice()
+      .sort((a,b)=>cmp(rowKey(a,mode),rowKey(b,mode)));
+    for(const k of kids)tbody.appendChild(k);
+  }
+  apply();
+}
+search.addEventListener('input',apply);
+taskFilter.addEventListener('change',apply);
+typeFilter.addEventListener('change',apply);
+statusFilter.addEventListener('change',apply);
+sortBy.addEventListener('change',applySort);
+expandAllBtn.addEventListener('click',()=>{
+  // If every group is currently collapsed, expand all; otherwise collapse all.
+  const anyOpen=groupRows.some(g=>!collapsed[g.dataset.group]);
+  setAll(anyOpen);
+});
+for(const g of groupRows){
+  g.addEventListener('click',()=>{
+    collapsed[g.dataset.group]=!collapsed[g.dataset.group];
+    apply();
+  });
+}
+// Default is expanded -> the button collapses everything first.
+expandAllBtn.textContent='Collapse all';
+apply();
+
+// --- Dark mode toggle --------------------------------------------------------
+function toggleTheme(){
+  const dark=document.body.classList.toggle('dark');
+  try{localStorage.setItem('winml-theme',dark?'dark':'light');}catch(e){}
+}
+
+// --- EP tile (column) filter -------------------------------------------------
+let selectedEP=null;
+function applyEPFilter(){
+  document.querySelectorAll('th[data-col],td[data-col]').forEach(el=>{
+    el.style.display=(!selectedEP||el.dataset.col===selectedEP)?'':'none';
+  });
+  document.querySelectorAll('.ep-chip[data-ep]').forEach(c=>{
+    c.classList.toggle('selected',c.dataset.ep===selectedEP);
+  });
+}
+function toggleEPFilter(ep){
+  selectedEP=(selectedEP===ep)?null:ep;
+  applyEPFilter();
+}
+for(const chip of document.querySelectorAll('.ep-chip[data-ep]')){
+  chip.addEventListener('click',()=>toggleEPFilter(chip.dataset.ep));
+  chip.addEventListener('keydown',ev=>{
+    if(ev.key==='Enter'||ev.key===' '){ev.preventDefault();toggleEPFilter(chip.dataset.ep);}
+  });
+}
+
+// --- Animated hover tooltip --------------------------------------------------
+const tip=document.createElement('div');
+tip.id='celltip';
+document.body.appendChild(tip);
+let tipHideTimer=null;
+
+const VCLS={PASS:'pass',REGRESSION:'regr',TIMEOUT:'timeout',FAIL:'fail','N/A':'na'};
+const VSHORT={PASS:'PASS',REGRESSION:'REGR',TIMEOUT:'TO',FAIL:'FAIL','N/A':'N/A'};
+const VLABEL={PASS:'Pass',REGRESSION:'Regr',TIMEOUT:'Timeout',FAIL:'Fail','N/A':'N/A'};
+const CCLS={PASS:'pass',FAIL:'fail','N/A':'na'};
+const CLABEL={PASS:'Pass',FAIL:'Fail','N/A':'N/A'};
+const CDESC={PASS:'Model builds and runs on this execution provider.',FAIL:'Model fails to build or run on this execution provider.','N/A':'Not applicable on this execution provider.'};
+
+function buildTip(el){
+  const d=el.dataset;
+  const cv=d.compat||'',av=d.acc||'';
+  let h='<div class="ct-sec"><span class="ct-seclabel">Compatibility</span>'
+    +'<span class="ct-badge '+(CCLS[cv]||'na')+'">'+(CLABEL[cv]||'\u2014')+'</span></div>';
+  if(CDESC[cv])h+='<div class="ct-secdesc">'+CDESC[cv]+'</div>';
+  if(d.sa)h+='<div class="ct-secdesc ct-sa">Flagged by the static analyzer.</div>';
+  else if(d.failreason)h+='<div class="ct-secdesc ct-sa">'+d.failreason+'</div>';
+  h+='<div class="ct-sec ct-sec2"><span class="ct-seclabel">Accuracy</span>'
+    +'<span class="ct-badge '+(VCLS[av]||'na')+'">'+(VLABEL[av]||'\u2014')+'</span></div>';
+  if(d.metric){
+    h+='<div class="ct-metric"><span class="ct-mname">'+d.metric+'</span>'
+      +(d.lowerbetter?' <span class="ct-lb">\u00b7 lower is better</span>':'')+'</div>';
+    if(d.task){h+='<div class="ct-task">'+d.task+'</div>';}
+    if(d.value!==undefined){
+      h+='<div class="ct-row"><span class="k">Measured</span><span class="val">'+d.value+'</span></div>';
+      if(d.baseline!==undefined){
+        h+='<div class="ct-row"><span class="k">Baseline</span><span class="val">'+d.baseline+'</span></div>';
+      }else{
+        h+='<div class="ct-task">No baseline to compare against.</div>';
+      }
+    }
+    if(d.logic){h+='<div class="ct-logic">'+d.logic+'</div>';}
+    // Per-precision breakdown: one row per precision, each "precision VERDICT
+    // Δdelta". Single-precision cells get a one-row block too, so the layout
+    // is identical everywhere. The best (shown) variant is flagged.
+    if(d.variants){
+      let vs=null;
+      try{vs=JSON.parse(d.variants);}catch(e){vs=null;}
+      if(vs&&vs.length){
+        h+='<div class="ct-variants"><div class="ct-vhead">Precisions</div>';
+        for(const v of vs){
+          const dv=v.delta?(v.delta==='diverged'?'<span class="ct-diverged">diverged</span>':'\u0394'+v.delta):'';
+          const sc=v.value!==undefined?'<span class="ct-vval">'+v.value+'</span>':'';
+          h+='<div class="ct-vrow'+(v.best?' best':'')+'">'
+            +'<span class="ct-prec">'+v.precision+'</span>'
+            +'<span class="ct-vverdict '+(VCLS[v.verdict]||'')+'">'+(VSHORT[v.verdict]||v.verdict||'')+'</span>'
+            +'<span class="ct-vdelta">'+sc+dv+'</span></div>';
+        }
+        h+='</div>';
+      }
+    }
+  }else if(d.desc){
+    h+='<div class="ct-secdesc">'+d.desc+'</div>';
+  }
+  return h;
+}
+
+function showTip(el){
+  if(tipHideTimer){clearTimeout(tipHideTimer);tipHideTimer=null;}
+  tip.className='';
+  tip.innerHTML=buildTip(el);
+  const r=el.getBoundingClientRect();
+  const tw=tip.offsetWidth, th=tip.offsetHeight;
+  let left=r.left+r.width/2-tw/2;
+  let top=r.top-th-9;
+  let origin='center bottom';
+  if(top<6){top=r.bottom+9;origin='center top';}
+  left=Math.max(6,Math.min(left,window.innerWidth-tw-6));
+  tip.style.left=left+'px';
+  tip.style.top=top+'px';
+  tip.style.transformOrigin=origin;
+  requestAnimationFrame(()=>tip.classList.add('show'));
+}
+function hideTip(){
+  tip.classList.remove('show');
+  tipHideTimer=setTimeout(()=>{tip.className='';tip.innerHTML='';},160);
+}
+for(const el of document.querySelectorAll('.cell:not(.gcell)')){
+  el.addEventListener('mouseenter',()=>showTip(el));
+  el.addEventListener('mouseleave',hideTip);
+}
+</script>
+</body>
+</html>
diff --git a/reports/model_compatibility_report.html b/reports/model_compatibility_report.html
deleted file mode 100644
index 1befea534..000000000
--- a/reports/model_compatibility_report.html
+++ /dev/null
@@ -1,618 +0,0 @@
-<!DOCTYPE html>
-<html lang="en">
-<head>
-<meta charset="UTF-8">
-<meta name="viewport" content="width=device-width, initial-scale=1.0">
-<title>Model Compatibility Cross All EPs</title>
-<style>
-  :root {
-    /* Fluent 2 — light theme (webLightTheme tokens) */
-    --bg:            #faf9f8;   /* canvas */
-    --bg2:           #f5f5f5;   /* NeutralBackground3 */
-    --bg3:           #ffffff;   /* NeutralBackground1 (surface) */
-    --border:        #e0e0e0;   /* NeutralStroke2 */
-    --border-strong: #d1d1d1;   /* NeutralStroke1 */
-    --text:          #242424;   /* NeutralForeground1 */
-    --text-dim:      #616161;   /* NeutralForeground3 */
-    --accent:        #0f6cbd;   /* brand (communication blue) */
-    --accent-hover:  #115ea3;
-    --accent2:       #115ea3;   /* link */
-    --accent-soft:   #eff6fc;   /* brand tint bg */
-    --accent-soft-border: #c7e0f4;
-    --pass:          #0e700e;   /* success fg */
-    --pass-bg:       #f1faf1;   /* success bg */
-    --pass-border:   #9fd89f;
-    --fail:          #b10e1c;   /* danger fg */
-    --fail-bg:       #fdf3f4;   /* danger bg */
-    --fail-border:   #eeacb2;
-    --na:            #707070;   /* NeutralForeground4 */
-    --na-bg:         #f0f0f0;
-    --pending:       #835b00;   /* warning fg */
-    --pending-bg:    #fff4ce;   /* warning bg */
-    --pending-border:#f2d680;
-    --pending-accent:#c19c00;
-    --gold:          #c19c00;
-    --shadow2:       0 1px 2px rgba(0,0,0,.14), 0 0 2px rgba(0,0,0,.12);
-    --shadow4:       0 2px 4px rgba(0,0,0,.14), 0 0 2px rgba(0,0,0,.12);
-    --radius:        4px;
-  }
-  * { box-sizing: border-box; margin: 0; padding: 0; }
-  body { background: var(--bg); color: var(--text); font-family: 'Segoe UI Variable', 'Segoe UI', system-ui, -apple-system, 'Helvetica Neue', Arial, sans-serif; font-size: 16px; -webkit-font-smoothing: antialiased; }
-
-  /* ── Header ── */
-  .header {
-    background: var(--bg3);
-    border-bottom: 1px solid var(--border);
-    padding: 18px 28px 16px;
-  }
-  .header-top { display: flex; align-items: center; gap: 12px; flex-wrap: wrap; }
-  .header h1 { font-size: 28px; font-weight: 600; color: var(--text); letter-spacing: -0.01em; }
-  .v2-badge {
-    background: var(--accent);
-    color: #fff;
-    font-size: 12px;
-    font-weight: 600;
-    padding: 3px 10px;
-    border-radius: var(--radius);
-    letter-spacing: 0.02em;
-    white-space: nowrap;
-  }
-  .header .subtitle { color: var(--text-dim); margin-top: 6px; font-size: 14px; }
-  .header-stats { display: flex; gap: 12px; margin-top: 16px; flex-wrap: wrap; }
-  .stat-card {
-    background: var(--bg3);
-    border: 1px solid var(--border);
-    border-radius: 6px;
-    padding: 10px 18px;
-    min-width: 120px;
-    box-shadow: var(--shadow2);
-  }
-  .stat-card .label { font-size: 14px; color: var(--text-dim); letter-spacing: 0.01em; }
-  .stat-card .value { font-size: 28px; font-weight: 600; margin-top: 2px; }
-  .stat-card .value.green  { color: var(--pass); }
-  .stat-card .value.blue   { color: var(--accent); }
-  .stat-card .value.amber  { color: var(--pending); }
-  .stat-card .value.red    { color: var(--fail); }
-
-  /* ── Pending banner ── */
-  .pending-banner {
-    background: var(--pending-bg);
-    border-bottom: 1px solid var(--pending-border);
-    padding: 10px 28px;
-    display: flex;
-    align-items: center;
-    gap: 10px;
-    font-size: 14px;
-    color: #6b4a00;
-  }
-  .pending-banner .icon { font-size: 18px; }
-  .pending-banner strong { color: #563c00; }
-
-  /* ── Legend / pass-definition note ── */
-  .legend-note {
-    background: var(--bg2);
-    border-bottom: 1px solid var(--border);
-    padding: 10px 28px;
-    display: flex;
-    align-items: center;
-    gap: 16px;
-    flex-wrap: wrap;
-    font-size: 13px;
-    color: var(--text-dim);
-  }
-  .legend-note strong { color: var(--text); font-weight: 600; }
-  .legend-note a { color: var(--accent2); text-decoration: none; font-weight: 600; }
-  .legend-note a:hover { text-decoration: underline; }
-  .legend-note code { font-family: 'Cascadia Code', 'Consolas', monospace; font-size: 12px; background: var(--bg3); border: 1px solid var(--border); border-radius: 3px; padding: 1px 5px; color: var(--text); }
-  .legend-note .legend-text { max-width: 880px; line-height: 1.5; }
-  .legend-note .legend-sub { flex-basis: 100%; line-height: 1.5; }
-  .legend-note .legend-keys { display: flex; gap: 14px; flex-wrap: wrap; margin-left: auto; }
-  .legend-note .legend-key { display: inline-flex; align-items: center; gap: 5px; white-space: nowrap; }
-  .legend-note .lk-mark {
-    display: inline-flex; align-items: center; justify-content: center;
-    width: 20px; height: 20px; border-radius: var(--radius);
-    font-weight: 600; font-size: 13px;
-  }
-  .legend-note .lk-mark.pass { background: var(--pass-bg); color: var(--pass); }
-  .legend-note .lk-mark.fail { background: var(--fail-bg); color: var(--fail); }
-  .legend-note .lk-mark.na   { background: var(--na-bg);   color: var(--na); }
-
-  /* ── EP chips bar ── */
-  .ep-bar {
-    background: var(--bg2);
-    border-bottom: 1px solid var(--border);
-    padding: 12px 28px;
-    display: flex;
-    gap: 10px;
-    flex-wrap: wrap;
-    align-items: flex-start;
-  }
-  .ep-chip {
-    background: var(--bg3);
-    border: 1px solid var(--border);
-    border-radius: 6px;
-    padding: 8px 14px;
-    font-size: 14px;
-    min-width: 120px;
-    box-shadow: var(--shadow2);
-  }
-  .ep-chip.confirmed { border-color: var(--pass-border); cursor: pointer; transition: box-shadow .15s, border-color .15s; }
-  .ep-chip.confirmed:hover { border-color: var(--accent); box-shadow: var(--shadow4); }
-  .ep-chip.selected { border-color: var(--accent); box-shadow: 0 0 0 2px var(--accent); background: var(--accent-soft); }
-  .ep-chip.pending   { border-color: var(--pending-border); background: var(--pending-bg); }
-  .ep-chip .chip-name {
-    font-weight: 600;
-    font-size: 14px;
-    margin-bottom: 4px;
-    display: flex;
-    align-items: center;
-    gap: 5px;
-  }
-  .ep-chip.confirmed .chip-name { color: var(--pass); }
-  .ep-chip.pending   .chip-name { color: var(--pending); }
-  .ep-chip .chip-date { color: var(--text-dim); font-size: 12px; margin-bottom: 3px; }
-  .ep-chip .chip-stats { color: var(--text); font-weight: 600; }
-  .ep-chip .chip-delta { font-size: 12px; margin-top: 3px; }
-  .chip-delta.up   { color: var(--pass); }
-  .chip-delta.down { color: var(--fail); }
-  .chip-delta.same { color: var(--text-dim); }
-  .chip-partial { font-size: 12px; color: var(--pending); margin-top: 2px; }
-
-  /* ── Controls ── */
-  .controls {
-    background: var(--bg3);
-    border-bottom: 1px solid var(--border);
-    padding: 10px 28px;
-    display: flex;
-    gap: 10px;
-    align-items: center;
-    flex-wrap: wrap;
-  }
-  .controls input {
-    background: var(--bg3);
-    border: 1px solid var(--border-strong);
-    border-radius: var(--radius);
-    padding: 6px 12px;
-    color: var(--text);
-    font-size: 14px;
-    font-family: inherit;
-    width: 220px;
-  }
-  .controls input::placeholder { color: var(--text-dim); }
-  .controls input:focus { outline: none; border-color: var(--accent); box-shadow: 0 0 0 1px var(--accent); }
-  .controls select {
-    background: var(--bg3);
-    border: 1px solid var(--border-strong);
-    border-radius: var(--radius);
-    padding: 6px 10px;
-    color: var(--text);
-    font-size: 14px;
-    font-family: inherit;
-  }
-  .controls select:focus { outline: none; border-color: var(--accent); box-shadow: 0 0 0 1px var(--accent); }
-  .controls select option { background: var(--bg3); color: var(--text); }
-  .controls label { color: var(--text-dim); font-size: 14px; }
-  .filter-group { display: flex; align-items: center; gap: 6px; }
-  .count-label { color: var(--text-dim); font-size: 14px; margin-left: auto; }
-
-  /* ── Table ── */
-  .table-wrap { overflow-x: auto; padding: 0 28px 24px; background: var(--bg3); }
-  table {
-    width: 100%;
-    border-collapse: collapse;
-    min-width: 1300px;
-  }
-  thead th {
-    background: var(--bg3);
-    border-bottom: 1px solid var(--border-strong);
-    padding: 9px 7px;
-    text-align: center;
-    font-size: 14px;
-    font-weight: 600;
-    color: var(--text-dim);
-    letter-spacing: 0.01em;
-    white-space: nowrap;
-    position: sticky;
-    top: 0;
-    z-index: 10;
-  }
-  thead th.model-col { text-align: left; min-width: 220px; }
-  thead th.meta-col  { min-width: 80px; }
-  thead th.task-col, thead th.type-col { text-align: left; }
-  thead th.ep-col    { min-width: 64px; }
-  thead th.ep-confirmed { border-top: 2px solid var(--pass-border); }
-  thead th.ep-pending   { border-top: 2px solid var(--pending-border); color: var(--pending); }
-  .th-date { display: block; font-size: 10px; font-weight: 400; opacity: 0.7; margin-top: 2px; }
-
-  tbody tr { border-bottom: 1px solid var(--border); transition: background 0.1s; }
-  tbody tr:hover { background: var(--bg2); }
-  td { padding: 7px 7px; vertical-align: middle; }
-  td.model-col { font-size: 16px; word-break: break-all; max-width: 240px; }
-  td.model-col a { color: var(--accent2); text-decoration: none; }
-  td.model-col a:hover { text-decoration: underline; color: var(--accent-hover); }
-  td.task-col  { color: var(--text-dim); font-size: 14px; white-space: nowrap; }
-  td.type-col  { color: var(--text-dim); font-size: 14px; }
-  td.pri-col   { text-align: center; }
-  td.pass-col  { text-align: center; font-weight: 600; }
-
-  .pri-badge { display: inline-block; border-radius: var(--radius); padding: 1px 6px; font-size: 12px; font-weight: 600; }
-  .pri-P0 { background: var(--fail-bg);    color: var(--fail);    border: 1px solid var(--fail-border); }
-  .pri-P1 { background: var(--pending-bg); color: var(--pending); border: 1px solid var(--pending-border); }
-  .pri-P2 { background: var(--accent-soft); color: var(--accent2); border: 1px solid var(--accent-soft-border); }
-
-  /* EP cells */
-  .ep-cell {
-    text-align: center;
-    border-radius: var(--radius);
-    padding: 5px 4px;
-    font-size: 16px;
-    font-weight: 600;
-  }
-  .ep-cell.pass         { background: var(--pass-bg);    color: var(--pass); }
-  .ep-cell.fail         { background: var(--fail-bg);    color: var(--fail); }
-  .ep-cell.na           { background: var(--na-bg);      color: var(--na); }
-  .ep-cell.pass.pending { background: var(--pending-bg);  color: var(--pending); }
-  .ep-cell.fail.pending { background: #fdeef0;            color: #9a3a16; }
-  .ep-cell.na.pending   { background: #fbf6e6;            color: #8a7a52; }
-
-  .pass-badge { display:inline-block; background:var(--pass-bg); color:var(--pass); border:1px solid var(--pass-border); border-radius:var(--radius); padding:2px 8px; font-size:14px; font-weight:600; }
-  .conf-badge { display:inline-block; background:var(--accent-soft); color:var(--accent2); border:1px solid var(--accent-soft-border); border-radius:var(--radius); padding:2px 8px; font-size:14px; font-weight:600; }
-  .fail-badge { display:inline-block; background:var(--fail-bg); color:var(--fail); border:1px solid var(--fail-border); border-radius:var(--radius); padding:2px 8px; font-size:14px; font-weight:600; }
-
-  .no-results { text-align:center; padding:40px; color:var(--text-dim); font-size:16px; }
-
-  /* ── Theme toggle (top-right icon) ── */
-  .theme-toggle {
-    margin-left: auto;
-    width: 32px; height: 32px;
-    display: inline-flex; align-items: center; justify-content: center;
-    background: transparent;
-    border: 1px solid var(--border-strong);
-    border-radius: var(--radius);
-    color: var(--text-dim);
-    cursor: pointer;
-    transition: background .15s, color .15s, border-color .15s;
-  }
-  .theme-toggle:hover { background: var(--bg2); color: var(--text); border-color: var(--accent); }
-  .theme-toggle:focus-visible { outline: none; box-shadow: 0 0 0 2px var(--accent); }
-  .theme-toggle svg { width: 18px; height: 18px; fill: currentColor; }
-  .theme-toggle .icon-sun { display: none; }
-  .theme-toggle .icon-moon { display: inline-flex; }
-  body.dark .theme-toggle .icon-moon { display: none; }
-  body.dark .theme-toggle .icon-sun { display: inline-flex; }
-
-  /* ── Dark theme (Fluent 2 webDarkTheme tokens) ── */
-  body.dark {
-    --bg:            #141414;
-    --bg2:           #1f1f1f;
-    --bg3:           #292929;
-    --border:        #404040;
-    --border-strong: #525252;
-    --text:          #f5f5f5;
-    --text-dim:      #adadad;
-    --accent:        #2886de;
-    --accent-hover:  #4aa0f0;
-    --accent2:       #62abf5;
-    --accent-soft:   rgba(40,134,222,0.16);
-    --accent-soft-border: rgba(71,158,245,0.32);
-    --pass:          #5ec75e;
-    --pass-bg:       rgba(94,199,94,0.13);
-    --pass-border:   rgba(94,199,94,0.35);
-    --fail:          #f4868f;
-    --fail-bg:       rgba(244,134,143,0.13);
-    --fail-border:   rgba(244,134,143,0.35);
-    --na:            #8a8a8a;
-    --na-bg:         rgba(255,255,255,0.06);
-    --pending:       #e6c84a;
-    --pending-bg:    rgba(230,200,74,0.13);
-    --pending-border:rgba(230,200,74,0.35);
-    --pending-accent:#e6c84a;
-    --gold:          #e6c84a;
-    --shadow2:       0 1px 2px rgba(0,0,0,.5), 0 0 2px rgba(0,0,0,.4);
-    --shadow4:       0 2px 4px rgba(0,0,0,.5), 0 0 2px rgba(0,0,0,.4);
-  }
-  body.dark .ep-cell.fail.pending { background: rgba(244,134,143,0.10); color: #f0a36a; }
-  body.dark .ep-cell.na.pending { background: rgba(230,200,74,0.08); color: #c9b38a; }
-  body.dark .pending-banner { color: #f3d98a; }
-  body.dark .pending-banner strong { color: #ffe9a8; }
-</style>
-</head>
-<body>
-<script>try { if (localStorage.getItem('winml-theme') === 'dark') document.body.classList.add('dark'); } catch (e) {}</script>
-
-<!-- ── Header ── -->
-<div class="header">
-  <div class="header-top">
-    <h1>Model Compatibility Cross All EPs</h1>
-    
-    <button class="theme-toggle" type="button" onclick="toggleTheme()" title="Toggle dark mode" aria-label="Toggle dark mode">
-      <svg class="icon-moon" viewBox="0 0 24 24" aria-hidden="true"><path d="M12 3a9 9 0 1 0 9 9c0-.46-.04-.92-.1-1.36a5.39 5.39 0 0 1-4.4 2.26 5.4 5.4 0 0 1-3.14-9.8c-.44-.06-.9-.1-1.36-.1z"/></svg>
-      <svg class="icon-sun" viewBox="0 0 24 24" aria-hidden="true"><circle cx="12" cy="12" r="4.2"/><g stroke="currentColor" stroke-width="1.8" stroke-linecap="round"><line x1="12" y1="2.5" x2="12" y2="5"/><line x1="12" y1="19" x2="12" y2="21.5"/><line x1="2.5" y1="12" x2="5" y2="12"/><line x1="19" y1="12" x2="21.5" y2="12"/><line x1="5.1" y1="5.1" x2="6.8" y2="6.8"/><line x1="17.2" y1="17.2" x2="18.9" y2="18.9"/><line x1="18.9" y1="5.1" x2="17.2" y2="6.8"/><line x1="6.8" y1="17.2" x2="5.1" y2="18.9"/></g></svg>
-    </button>
-  </div>
-  <div class="subtitle">WinML CLI 0.1.0 &nbsp;·&nbsp; Windows ML 2.0</div>
-  <div class="header-stats" id="header-stats"></div>
-</div>
-
-<!-- ── Pending warning banner ── -->
-<div class="pending-banner" id="pending-banner"></div>
-
-<!-- ── EP chips ── -->
-<div class="ep-bar" id="ep-bar"></div>
-
-<!-- ── Controls ── -->
-<div class="controls">
-  <input type="text" id="search" placeholder="Search model name…" oninput="render()">
-  <div class="filter-group">
-    <label>Task:</label>
-    <select id="task-filter" onchange="render()"><option value="">All</option></select>
-  </div>
-  <div class="filter-group">
-    <label>Type:</label>
-    <select id="type-filter" onchange="render()"><option value="">All</option></select>
-  </div>
-  
-  <div class="filter-group">
-    <label>Show:</label>
-    <select id="pass-filter" onchange="render()">
-      <option value="">All models</option>
-      <option value="conf_all">Pass all EPs</option>
-      <option value="some">Pass ≥1 EP</option>
-      <option value="none">Fail all EPs</option>
-    </select>
-  </div>
-  <div class="filter-group">
-    <label>Sort:</label>
-    <select id="sort-by" onchange="render()">
-      <option value="pass_desc">Pass count ↓</option>
-      <option value="pass_asc">Pass count ↑</option>
-      <option value="model">Model name</option>
-    </select>
-  </div>
-  <span class="count-label" id="count-label"></span>
-</div>
-
-<!-- ── Pass-definition note ── -->
-<div class="legend-note">
-  <span class="legend-text">All results in this report are produced by the <a href="https://github.com/microsoft/winml-cli" target="_blank" rel="noopener">WinML CLI</a>. <strong>Pass</strong> = the CLI successfully built the model for that execution provider (EP) — compiling it for the target hardware — and completed the inference performance benchmark (<code>winml perf</code>) without errors or timeout, using the unquantized model.</span>
-  <span class="legend-keys">
-    <span class="legend-key"><span class="lk-mark pass">✓</span> pass</span>
-    <span class="legend-key"><span class="lk-mark fail">✗</span> fail</span>
-    <span class="legend-key"><span class="lk-mark na">—</span> not available</span>
-  </span>
-  <span class="legend-sub">An accuracy table is coming soon.</span>
-</div>
-
-<!-- ── Table ── -->
-<div class="table-wrap">
-  <table id="main-table">
-    <thead id="table-head"></thead>
-    <tbody id="table-body"></tbody>
-  </table>
-</div>
-
-<script>
-const PUBLIC             = true;
-const EP_LABELS          = ["DML GPU", "MLAS CPU", "OV CPU", "OV GPU", "OV NPU", "QNN GPU", "QNN NPU", "VitisAI NPU", "TRTRTX GPU", "MIGraph GPU"];
-const EP_DATES           = {};
-const EP_PREV_DATES      = {};
-const EP_SUMMARIES       = {"DML GPU": {"passed": 175, "total": 224, "sa_failures": 0}, "MLAS CPU": {"passed": 177, "total": 224, "sa_failures": 0}, "OV CPU": {"passed": 173, "total": 224, "sa_failures": 3}, "OV GPU": {"passed": 131, "total": 224, "sa_failures": 31}, "OV NPU": {"passed": 160, "total": 224, "sa_failures": 3}, "QNN GPU": {"passed": 127, "total": 224, "sa_failures": 43}, "QNN NPU": {"passed": 145, "total": 224, "sa_failures": 0}, "VitisAI NPU": {"passed": 172, "total": 224, "sa_failures": 0}, "TRTRTX GPU": {"passed": 171, "total": 226, "sa_failures": 8}, "MIGraph GPU": {"passed": 182, "total": 224, "sa_failures": 0}};
-const EP_PREV_SUMMARIES  = {};
-const EP_IS_PENDING      = {"DML GPU": false, "MLAS CPU": false, "OV CPU": false, "OV GPU": false, "OV NPU": false, "QNN GPU": false, "QNN NPU": false, "VitisAI NPU": false, "TRTRTX GPU": false, "MIGraph GPU": false};
-const ALL_ROWS           = [{"model": "AdamCodd/vit-base-nsfw-detector", "task": "image-classification", "model_type": "vit", "group": "", "priority": "", "pass_count": 10, "confirmed_pass": 10, "all_confirmed_passed": true, "eps": [{"status": "PASS", "p50": 53.42, "elapsed": 2.4, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 204.7, "elapsed": 3.5, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 267.06, "elapsed": 4.7, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 41.41, "elapsed": 2.6, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 42.61, "elapsed": 14.8, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 105.95, "elapsed": 19.3, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 29.19, "elapsed": 13.4, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 60.73, "elapsed": 105.2, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 7.59, "elapsed": 9.3, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 86.57, "elapsed": 75.4, "is_pending": false, "prev_status": null, "fail_reason": ""}]}, {"model": "BAAI/bge-base-en-v1.5", "task": "feature-extraction", "model_type": "bert", "group": "", "priority": "", "pass_count": 10, "confirmed_pass": 10, "all_confirmed_passed": true, "eps": [{"status": "PASS", "p50": 45.17, "elapsed": 2.2, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 183.6, "elapsed": 3.3, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 226.92, "elapsed": 4.2, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 35.05, "elapsed": 2.7, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 24.76, "elapsed": 14.4, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 94.08, "elapsed": 14.5, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 14.42, "elapsed": 10.4, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 57.05, "elapsed": 194.6, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "PASS", "p50": 5.3, "elapsed": 8.2, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 74.78, "elapsed": 55.3, "is_pending": false, "prev_status": null, "fail_reason": ""}]}, {"model": "BAAI/bge-base-en-v1.5", "task": "sentence-similarity", "model_type": "bert", "group": "", "priority": "", "pass_count": 10, "confirmed_pass": 10, "all_confirmed_passed": true, "eps": [{"status": "PASS", "p50": 46.56, "elapsed": 2.2, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 181.04, "elapsed": 3.2, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 231.66, "elapsed": 4.2, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 36.66, "elapsed": 2.8, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 24.77, "elapsed": 14.8, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 91.72, "elapsed": 11.1, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 14.49, "elapsed": 10.6, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 55.79, "elapsed": 198.1, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "PASS", "p50": 5.33, "elapsed": 8.0, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 76.32, "elapsed": 53.5, "is_pending": false, "prev_status": null, "fail_reason": ""}]}, {"model": "BAAI/bge-large-en-v1.5", "task": "feature-extraction", "model_type": "bert", "group": "", "priority": "", "pass_count": 10, "confirmed_pass": 10, "all_confirmed_passed": true, "eps": [{"status": "PASS", "p50": 138.82, "elapsed": 5.1, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 615.84, "elapsed": 10.1, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 797.18, "elapsed": 13.0, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 40.72, "elapsed": 6.1, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "PASS", "p50": 67.13, "elapsed": 63.5, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 321.54, "elapsed": 40.2, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 38.39, "elapsed": 34.5, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 170.48, "elapsed": 184.5, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 12.69, "elapsed": 16.0, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 324.11, "elapsed": 95.3, "is_pending": false, "prev_status": null, "fail_reason": ""}]}, {"model": "BAAI/bge-large-en-v1.5", "task": "sentence-similarity", "model_type": "bert", "group": "", "priority": "", "pass_count": 10, "confirmed_pass": 10, "all_confirmed_passed": true, "eps": [{"status": "PASS", "p50": 139.55, "elapsed": 5.3, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 622.3, "elapsed": 10.1, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 800.52, "elapsed": 13.0, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 32.13, "elapsed": 5.3, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 66.98, "elapsed": 62.1, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 307.43, "elapsed": 61.0, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 37.86, "elapsed": 36.5, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 167.52, "elapsed": 187.3, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 14.49, "elapsed": 19.1, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 268.81, "elapsed": 102.0, "is_pending": false, "prev_status": null, "fail_reason": ""}]}, {"model": "BAAI/bge-m3", "task": "feature-extraction", "model_type": "xlm-roberta", "group": "", "priority": "", "pass_count": 10, "confirmed_pass": 10, "all_confirmed_passed": true, "eps": [{"status": "PASS", "p50": 388.03, "elapsed": 10.3, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "PASS", "p50": 1424.11, "elapsed": 19.6, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 1766.28, "elapsed": 25.6, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 78.03, "elapsed": 9.5, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 253.6, "elapsed": 67.8, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 632.16, "elapsed": 43.4, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 121.04, "elapsed": 77.1, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 516.22, "elapsed": 219.6, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 30.65, "elapsed": 19.2, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 614.3, "elapsed": 209.2, "is_pending": false, "prev_status": null, "fail_reason": ""}]}, {"model": "BAAI/bge-m3", "task": "sentence-similarity", "model_type": "xlm-roberta", "group": "", "priority": "", "pass_count": 10, "confirmed_pass": 10, "all_confirmed_passed": true, "eps": [{"status": "PASS", "p50": 377.8, "elapsed": 9.4, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "PASS", "p50": 1451.28, "elapsed": 20.1, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 1765.18, "elapsed": 25.7, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 73.0, "elapsed": 9.6, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 270.33, "elapsed": 67.9, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 665.44, "elapsed": 45.6, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 118.07, "elapsed": 79.7, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 434.78, "elapsed": 218.9, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 32.66, "elapsed": 20.7, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 618.9, "elapsed": 167.7, "is_pending": false, "prev_status": null, "fail_reason": ""}]}, {"model": "BAAI/bge-reranker-base", "task": "text-classification", "model_type": "xlm-roberta", "group": "", "priority": "", "pass_count": 10, "confirmed_pass": 10, "all_confirmed_passed": true, "eps": [{"status": "PASS", "p50": 52.92, "elapsed": 4.2, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 184.19, "elapsed": 3.7, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 230.75, "elapsed": 5.4, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 10.27, "elapsed": 5.0, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 23.85, "elapsed": 16.7, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 93.66, "elapsed": 19.4, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 14.72, "elapsed": 11.1, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 57.36, "elapsed": 111.3, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 15.56, "elapsed": 10.9, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "PASS", "p50": 74.2, "elapsed": 61.5, "is_pending": false, "prev_status": null, "fail_reason": ""}]}, {"model": "BAAI/bge-reranker-v2-m3", "task": "text-classification", "model_type": "xlm-roberta", "group": "", "priority": "", "pass_count": 10, "confirmed_pass": 10, "all_confirmed_passed": true, "eps": [{"status": "PASS", "p50": 375.69, "elapsed": 9.5, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "PASS", "p50": 1420.22, "elapsed": 19.8, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 1748.64, "elapsed": 25.6, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 76.91, "elapsed": 9.3, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 266.63, "elapsed": 67.9, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 668.63, "elapsed": 51.6, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 117.64, "elapsed": 81.9, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 507.9, "elapsed": 219.5, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 25.37, "elapsed": 21.1, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 617.57, "elapsed": 168.2, "is_pending": false, "prev_status": null, "fail_reason": ""}]}, {"model": "BAAI/bge-small-en-v1.5", "task": "feature-extraction", "model_type": "bert", "group": "", "priority": "", "pass_count": 10, "confirmed_pass": 10, "all_confirmed_passed": true, "eps": [{"status": "PASS", "p50": 22.9, "elapsed": 1.6, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 65.01, "elapsed": 1.6, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 69.84, "elapsed": 2.0, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 6.9, "elapsed": 1.7, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 14.76, "elapsed": 8.6, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 61.15, "elapsed": 5.0, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 9.52, "elapsed": 5.8, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 49.7, "elapsed": 79.6, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "PASS", "p50": 2.78, "elapsed": 7.7, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 32.57, "elapsed": 39.8, "is_pending": false, "prev_status": null, "fail_reason": ""}]}, {"model": "BAAI/bge-small-en-v1.5", "task": "sentence-similarity", "model_type": "bert", "group": "", "priority": "", "pass_count": 10, "confirmed_pass": 10, "all_confirmed_passed": true, "eps": [{"status": "PASS", "p50": 22.88, "elapsed": 1.6, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 63.73, "elapsed": 1.6, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 70.27, "elapsed": 2.0, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 7.34, "elapsed": 1.7, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 16.15, "elapsed": 8.7, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 56.53, "elapsed": 7.7, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 9.37, "elapsed": 5.8, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 41.6, "elapsed": 80.6, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 2.79, "elapsed": 7.6, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 34.87, "elapsed": 41.9, "is_pending": false, "prev_status": null, "fail_reason": ""}]}, {"model": "Babelscape/wikineural-multilingual-ner", "task": "token-classification", "model_type": "bert", "group": "", "priority": "", "pass_count": 10, "confirmed_pass": 10, "all_confirmed_passed": true, "eps": [{"status": "PASS", "p50": 44.43, "elapsed": 2.8, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 190.49, "elapsed": 3.6, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 230.33, "elapsed": 4.7, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 10.3, "elapsed": 3.6, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 24.78, "elapsed": 15.3, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 97.19, "elapsed": 19.5, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 14.24, "elapsed": 11.3, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 57.74, "elapsed": 106.1, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "PASS", "p50": 3.37, "elapsed": 9.1, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 82.67, "elapsed": 63.8, "is_pending": false, "prev_status": null, "fail_reason": ""}]}, {"model": "FacebookAI/roberta-base", "task": "fill-mask", "model_type": "roberta", "group": "", "priority": "", "pass_count": 10, "confirmed_pass": 10, "all_confirmed_passed": true, "eps": [{"status": "PASS", "p50": 84.51, "elapsed": 3.3, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 259.57, "elapsed": 4.5, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 315.49, "elapsed": 5.5, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 20.06, "elapsed": 2.8, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 38.82, "elapsed": 19.0, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 127.11, "elapsed": 20.6, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 33.3, "elapsed": 19.2, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 74.0, "elapsed": 109.0, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 130.38, "elapsed": 10.6, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 104.5, "elapsed": 154.1, "is_pending": false, "prev_status": null, "fail_reason": ""}]}, {"model": "FacebookAI/roberta-large", "task": "fill-mask", "model_type": "roberta", "group": "", "priority": "", "pass_count": 10, "confirmed_pass": 10, "all_confirmed_passed": true, "eps": [{"status": "PASS", "p50": 185.35, "elapsed": 6.1, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 724.57, "elapsed": 11.4, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 922.29, "elapsed": 14.8, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 42.01, "elapsed": 6.3, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 83.28, "elapsed": 68.1, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 328.8, "elapsed": 59.6, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 60.7, "elapsed": 67.9, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 186.99, "elapsed": 189.8, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 137.24, "elapsed": 18.5, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "PASS", "p50": 356.98, "elapsed": 232.9, "is_pending": false, "prev_status": null, "fail_reason": ""}]}, {"model": "FacebookAI/xlm-roberta-base", "task": "fill-mask", "model_type": "xlm-roberta", "group": "", "priority": "", "pass_count": 10, "confirmed_pass": 10, "all_confirmed_passed": true, "eps": [{"status": "PASS", "p50": 230.94, "elapsed": 7.5, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 588.17, "elapsed": 9.9, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 656.58, "elapsed": 11.8, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 56.09, "elapsed": 8.1, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 101.8, "elapsed": 36.7, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 727.63, "elapsed": 53.8, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 88.31, "elapsed": 59.4, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 153.52, "elapsed": 145.9, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 634.39, "elapsed": 21.4, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 249.54, "elapsed": 567.9, "is_pending": false, "prev_status": null, "fail_reason": ""}]}, {"model": "Falconsai/nsfw_image_detection", "task": "image-classification", "model_type": "vit", "group": "", "priority": "", "pass_count": 10, "confirmed_pass": 10, "all_confirmed_passed": true, "eps": [{"status": "PASS", "p50": 17.85, "elapsed": 1.8, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 67.78, "elapsed": 1.8, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 83.38, "elapsed": 2.4, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 6.4, "elapsed": 1.9, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 15.42, "elapsed": 7.9, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 39.92, "elapsed": 15.2, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 7.01, "elapsed": 8.9, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 24.71, "elapsed": 59.2, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 3.07, "elapsed": 8.8, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 30.74, "elapsed": 57.3, "is_pending": false, "prev_status": null, "fail_reason": ""}]}, {"model": "Intel/bert-base-uncased-mrpc", "task": "feature-extraction", "model_type": "bert", "group": "", "priority": "", "pass_count": 10, "confirmed_pass": 10, "all_confirmed_passed": true, "eps": [{"status": "PASS", "p50": 45.31, "elapsed": 2.1, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 184.37, "elapsed": 3.3, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 229.28, "elapsed": 4.2, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 10.82, "elapsed": 2.1, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 24.78, "elapsed": 14.5, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 114.85, "elapsed": 10.8, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 14.34, "elapsed": 10.6, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 57.66, "elapsed": 104.8, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "PASS", "p50": 5.28, "elapsed": 8.5, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 75.81, "elapsed": 52.2, "is_pending": false, "prev_status": null, "fail_reason": ""}]}, {"model": "Intel/bert-base-uncased-mrpc", "task": "text-classification", "model_type": "bert", "group": "", "priority": "", "pass_count": 10, "confirmed_pass": 10, "all_confirmed_passed": true, "eps": [{"status": "PASS", "p50": 44.34, "elapsed": 2.1, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 182.89, "elapsed": 3.2, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 229.05, "elapsed": 4.2, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 10.61, "elapsed": 2.2, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 24.56, "elapsed": 14.6, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 103.04, "elapsed": 16.7, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 14.55, "elapsed": 11.0, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 68.09, "elapsed": 106.6, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "PASS", "p50": 14.79, "elapsed": 13.0, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 75.59, "elapsed": 53.3, "is_pending": false, "prev_status": null, "fail_reason": ""}]}, {"model": "Intel/dpt-hybrid-midas", "task": "depth-estimation", "model_type": "dpt", "group": "", "priority": "", "pass_count": 10, "confirmed_pass": 10, "all_confirmed_passed": true, "eps": [{"status": "PASS", "p50": 123.73, "elapsed": 3.5, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 446.65, "elapsed": 6.7, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 594.52, "elapsed": 9.1, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 25.02, "elapsed": 3.3, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 70.68, "elapsed": 23.5, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 234.99, "elapsed": 17.5, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 57.75, "elapsed": 23.4, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 349.86, "elapsed": 1033.1, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 15.39, "elapsed": 20.3, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 184.04, "elapsed": 581.2, "is_pending": false, "prev_status": null, "fail_reason": ""}]}, {"model": "Intel/dpt-large", "task": "depth-estimation", "model_type": "dpt", "group": "", "priority": "", "pass_count": 10, "confirmed_pass": 10, "all_confirmed_passed": true, "eps": [{"status": "PASS", "p50": 237.56, "elapsed": 6.6, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 909.02, "elapsed": 13.6, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 1212.15, "elapsed": 18.2, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 42.86, "elapsed": 6.0, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 129.28, "elapsed": 46.4, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 367.2, "elapsed": 46.7, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 95.54, "elapsed": 76.9, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 363.47, "elapsed": 681.7, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 28.32, "elapsed": 21.5, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "PASS", "p50": 414.5, "elapsed": 753.0, "is_pending": false, "prev_status": null, "fail_reason": ""}]}, {"model": "Isotonic/distilbert_finetuned_ai4privacy_v2", "task": "token-classification", "model_type": "distilbert", "group": "", "priority": "", "pass_count": 10, "confirmed_pass": 10, "all_confirmed_passed": true, "eps": [{"status": "PASS", "p50": 23.02, "elapsed": 1.7, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 92.15, "elapsed": 2.0, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 115.13, "elapsed": 2.5, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 5.58, "elapsed": 1.8, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 17.36, "elapsed": 6.0, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 49.24, "elapsed": 9.5, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 18.83, "elapsed": 6.0, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 30.07, "elapsed": 85.4, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 2.29, "elapsed": 7.0, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 37.57, "elapsed": 44.7, "is_pending": false, "prev_status": null, "fail_reason": ""}]}, {"model": "Jean-Baptiste/camembert-ner-with-dates", "task": "token-classification", "model_type": "camembert", "group": "", "priority": "", "pass_count": 10, "confirmed_pass": 10, "all_confirmed_passed": true, "eps": [{"status": "PASS", "p50": 45.03, "elapsed": 2.1, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 183.29, "elapsed": 3.2, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 228.05, "elapsed": 4.3, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 10.51, "elapsed": 2.1, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 24.07, "elapsed": 14.4, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 86.06, "elapsed": 10.7, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 14.7, "elapsed": 10.9, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 67.71, "elapsed": 118.4, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 3.39, "elapsed": 8.9, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 80.37, "elapsed": 54.4, "is_pending": false, "prev_status": null, "fail_reason": ""}]}, {"model": "ProsusAI/finbert", "task": "text-classification", "model_type": "bert", "group": "", "priority": "", "pass_count": 10, "confirmed_pass": 10, "all_confirmed_passed": true, "eps": [{"status": "PASS", "p50": 44.34, "elapsed": 2.1, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 183.31, "elapsed": 3.2, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 232.71, "elapsed": 4.2, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 12.84, "elapsed": 2.1, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 24.48, "elapsed": 14.4, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 97.1, "elapsed": 15.1, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 13.79, "elapsed": 11.1, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 68.66, "elapsed": 152.9, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "PASS", "p50": 14.98, "elapsed": 9.5, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 82.84, "elapsed": 53.5, "is_pending": false, "prev_status": null, "fail_reason": ""}]}, {"model": "StanfordAIMI/dinov2-base-xray-224", "task": "image-feature-extraction", "model_type": "dinov2", "group": "", "priority": "", "pass_count": 10, "confirmed_pass": 10, "all_confirmed_passed": true, "eps": [{"status": "PASS", "p50": 25.63, "elapsed": 2.0, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 89.38, "elapsed": 2.2, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 114.48, "elapsed": 2.8, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 6.96, "elapsed": 2.5, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 21.12, "elapsed": 9.0, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 54.31, "elapsed": 14.1, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "PASS", "p50": 10.13, "elapsed": 13.5, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 45.03, "elapsed": 170.9, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 14.85, "elapsed": 9.5, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "PASS", "p50": 38.55, "elapsed": 57.3, "is_pending": false, "prev_status": null, "fail_reason": ""}]}, {"model": "StanfordAIMI/stanford-deidentifier-base", "task": "token-classification", "model_type": "bert", "group": "", "priority": "", "pass_count": 10, "confirmed_pass": 10, "all_confirmed_passed": true, "eps": [{"status": "PASS", "p50": 44.62, "elapsed": 2.3, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 183.79, "elapsed": 3.3, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 230.26, "elapsed": 4.3, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 10.83, "elapsed": 2.1, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 24.47, "elapsed": 14.4, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 89.4, "elapsed": 14.3, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 15.69, "elapsed": 14.3, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 57.95, "elapsed": 153.7, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "PASS", "p50": 15.1, "elapsed": 9.4, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "PASS", "p50": 77.11, "elapsed": 52.0, "is_pending": false, "prev_status": null, "fail_reason": ""}]}, {"model": "ahotrod/electra_large_discriminator_squad2_512", "task": "question-answering", "model_type": "electra", "group": "", "priority": "", "pass_count": 10, "confirmed_pass": 10, "all_confirmed_passed": true, "eps": [{"status": "PASS", "p50": 136.08, "elapsed": 5.6, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 622.26, "elapsed": 10.0, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 796.74, "elapsed": 13.3, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 34.22, "elapsed": 5.0, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 360.82, "elapsed": 10.8, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 325.94, "elapsed": 61.5, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 119.66, "elapsed": 49.6, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 161.21, "elapsed": 136.6, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 11.19, "elapsed": 20.5, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 237.3, "elapsed": 89.1, "is_pending": false, "prev_status": null, "fail_reason": ""}]}, {"model": "amunchet/rorshark-vit-base", "task": "image-classification", "model_type": "vit", "group": "", "priority": "", "pass_count": 10, "confirmed_pass": 10, "all_confirmed_passed": true, "eps": [{"status": "PASS", "p50": 18.77, "elapsed": 1.9, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 67.52, "elapsed": 1.8, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 84.13, "elapsed": 2.4, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 6.41, "elapsed": 1.7, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 15.78, "elapsed": 8.0, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 38.32, "elapsed": 13.0, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 7.02, "elapsed": 9.2, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 27.0, "elapsed": 87.1, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 3.31, "elapsed": 9.1, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 31.6, "elapsed": 52.9, "is_pending": false, "prev_status": null, "fail_reason": ""}]}, {"model": "apple/mobilevit-small", "task": "image-classification", "model_type": "mobilevit", "group": "", "priority": "", "pass_count": 10, "confirmed_pass": 10, "all_confirmed_passed": true, "eps": [{"status": "PASS", "p50": 4.35, "elapsed": 1.5, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 19.4, "elapsed": 1.0, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 13.42, "elapsed": 1.2, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 3.48, "elapsed": 1.6, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 9.81, "elapsed": 5.1, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 19.17, "elapsed": 4.6, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 5.27, "elapsed": 3.6, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 15.35, "elapsed": 664.8, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 7.07, "elapsed": 12.8, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 7.25, "elapsed": 145.5, "is_pending": false, "prev_status": null, "fail_reason": ""}]}, {"model": "cross-encoder/ms-marco-MiniLM-L4-v2", "task": "text-classification", "model_type": "bert", "group": "", "priority": "", "pass_count": 10, "confirmed_pass": 10, "all_confirmed_passed": true, "eps": [{"status": "PASS", "p50": 8.61, "elapsed": 1.5, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 22.45, "elapsed": 1.1, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 23.45, "elapsed": 1.2, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 3.43, "elapsed": 1.2, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 7.31, "elapsed": 3.0, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 15.2, "elapsed": 3.1, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 3.75, "elapsed": 2.7, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 8.22, "elapsed": 85.9, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 0.73, "elapsed": 5.9, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 10.48, "elapsed": 26.7, "is_pending": false, "prev_status": null, "fail_reason": ""}]}, {"model": "cross-encoder/ms-marco-MiniLM-L6-v2", "task": "text-classification", "model_type": "bert", "group": "", "priority": "", "pass_count": 10, "confirmed_pass": 10, "all_confirmed_passed": true, "eps": [{"status": "PASS", "p50": 12.07, "elapsed": 1.5, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 32.36, "elapsed": 1.2, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 35.33, "elapsed": 1.4, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 4.67, "elapsed": 1.3, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 9.81, "elapsed": 4.2, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 22.52, "elapsed": 3.5, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 5.45, "elapsed": 3.9, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 10.97, "elapsed": 102.3, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 1.01, "elapsed": 6.1, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 15.63, "elapsed": 28.7, "is_pending": false, "prev_status": null, "fail_reason": ""}]}, {"model": "dbmdz/bert-large-cased-finetuned-conll03-english", "task": "token-classification", "model_type": "bert", "group": "", "priority": "", "pass_count": 10, "confirmed_pass": 10, "all_confirmed_passed": true, "eps": [{"status": "PASS", "p50": 137.75, "elapsed": 5.7, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 623.65, "elapsed": 10.1, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 797.14, "elapsed": 12.9, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 32.09, "elapsed": 4.9, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 68.22, "elapsed": 62.7, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 355.35, "elapsed": 65.5, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 39.93, "elapsed": 40.0, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 163.51, "elapsed": 172.0, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 11.23, "elapsed": 16.2, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "PASS", "p50": 241.4, "elapsed": 90.7, "is_pending": false, "prev_status": null, "fail_reason": ""}]}, {"model": "deepset/bert-large-uncased-whole-word-masking-squad2", "task": "question-answering", "model_type": "bert", "group": "", "priority": "", "pass_count": 10, "confirmed_pass": 10, "all_confirmed_passed": true, "eps": [{"status": "PASS", "p50": 137.35, "elapsed": 5.7, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 617.64, "elapsed": 10.0, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 804.94, "elapsed": 13.1, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 32.08, "elapsed": 5.1, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 68.03, "elapsed": 63.7, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 311.36, "elapsed": 65.6, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 41.0, "elapsed": 73.9, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 165.5, "elapsed": 173.3, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 15.92, "elapsed": 15.5, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 259.07, "elapsed": 91.7, "is_pending": false, "prev_status": null, "fail_reason": ""}]}, {"model": "deepset/roberta-base-squad2", "task": "question-answering", "model_type": "roberta", "group": "", "priority": "", "pass_count": 10, "confirmed_pass": 10, "all_confirmed_passed": true, "eps": [{"status": "PASS", "p50": 44.63, "elapsed": 2.3, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 184.06, "elapsed": 3.3, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 231.27, "elapsed": 4.3, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 10.62, "elapsed": 2.3, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 24.9, "elapsed": 14.4, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 94.37, "elapsed": 18.7, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 14.52, "elapsed": 11.2, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 56.11, "elapsed": 99.5, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 15.37, "elapsed": 9.9, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 75.25, "elapsed": 52.9, "is_pending": false, "prev_status": null, "fail_reason": ""}]}, {"model": "deepset/tinyroberta-squad2", "task": "question-answering", "model_type": "roberta", "group": "", "priority": "", "pass_count": 10, "confirmed_pass": 10, "all_confirmed_passed": true, "eps": [{"status": "PASS", "p50": 23.45, "elapsed": 1.8, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 91.72, "elapsed": 2.0, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 115.29, "elapsed": 2.5, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 6.16, "elapsed": 1.8, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 15.87, "elapsed": 8.5, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 59.88, "elapsed": 11.9, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 8.69, "elapsed": 5.8, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 30.61, "elapsed": 76.6, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 1.85, "elapsed": 6.9, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 38.82, "elapsed": 43.6, "is_pending": false, "prev_status": null, "fail_reason": ""}]}, {"model": "dima806/fairface_age_image_detection", "task": "image-classification", "model_type": "vit", "group": "", "priority": "", "pass_count": 10, "confirmed_pass": 10, "all_confirmed_passed": true, "eps": [{"status": "PASS", "p50": 18.16, "elapsed": 1.8, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 67.24, "elapsed": 1.8, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 84.8, "elapsed": 2.4, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 6.36, "elapsed": 1.9, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 15.43, "elapsed": 7.8, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 36.63, "elapsed": 17.2, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 7.26, "elapsed": 9.1, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 30.98, "elapsed": 88.8, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 3.32, "elapsed": 9.0, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 33.78, "elapsed": 52.8, "is_pending": false, "prev_status": null, "fail_reason": ""}]}, {"model": "distilbert/distilbert-base-cased-distilled-squad", "task": "question-answering", "model_type": "distilbert", "group": "", "priority": "", "pass_count": 10, "confirmed_pass": 10, "all_confirmed_passed": true, "eps": [{"status": "PASS", "p50": 22.98, "elapsed": 5.9, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 92.03, "elapsed": 2.0, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 113.35, "elapsed": 2.5, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 6.07, "elapsed": 1.6, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 17.49, "elapsed": 6.1, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 57.78, "elapsed": 9.3, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 19.43, "elapsed": 6.7, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 29.59, "elapsed": 101.8, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 1.78, "elapsed": 6.4, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 37.71, "elapsed": 44.0, "is_pending": false, "prev_status": null, "fail_reason": ""}]}, {"model": "distilbert/distilbert-base-uncased", "task": "fill-mask", "model_type": "distilbert", "group": "", "priority": "", "pass_count": 10, "confirmed_pass": 10, "all_confirmed_passed": true, "eps": [{"status": "PASS", "p50": 47.25, "elapsed": 2.3, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 134.79, "elapsed": 2.6, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 167.55, "elapsed": 3.3, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 10.68, "elapsed": 1.9, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 27.31, "elapsed": 8.3, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 77.08, "elapsed": 18.0, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 30.98, "elapsed": 9.9, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 44.99, "elapsed": 75.6, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 78.98, "elapsed": 8.1, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 57.39, "elapsed": 100.0, "is_pending": false, "prev_status": null, "fail_reason": ""}]}, {"model": "distilbert/distilbert-base-uncased-distilled-squad", "task": "question-answering", "model_type": "distilbert", "group": "", "priority": "", "pass_count": 10, "confirmed_pass": 10, "all_confirmed_passed": true, "eps": [{"status": "PASS", "p50": 22.73, "elapsed": 1.8, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 91.4, "elapsed": 2.0, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 113.74, "elapsed": 2.5, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 6.05, "elapsed": 1.6, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 18.06, "elapsed": 6.1, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 55.11, "elapsed": 8.6, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 19.24, "elapsed": 6.1, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 32.46, "elapsed": 89.0, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 1.78, "elapsed": 7.2, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 38.74, "elapsed": 43.9, "is_pending": false, "prev_status": null, "fail_reason": ""}]}, {"model": "distilbert/distilbert-base-uncased-finetuned-sst-2-english", "task": "text-classification", "model_type": "distilbert", "group": "", "priority": "", "pass_count": 10, "confirmed_pass": 10, "all_confirmed_passed": true, "eps": [{"status": "PASS", "p50": 23.06, "elapsed": 1.7, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 92.91, "elapsed": 2.0, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 114.73, "elapsed": 2.5, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 5.67, "elapsed": 1.6, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 17.62, "elapsed": 6.1, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 58.68, "elapsed": 9.2, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 19.37, "elapsed": 5.9, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 34.89, "elapsed": 86.3, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 1.82, "elapsed": 6.7, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 38.68, "elapsed": 44.9, "is_pending": false, "prev_status": null, "fail_reason": ""}]}, {"model": "dslim/bert-base-NER", "task": "token-classification", "model_type": "bert", "group": "", "priority": "", "pass_count": 10, "confirmed_pass": 10, "all_confirmed_passed": true, "eps": [{"status": "PASS", "p50": 44.59, "elapsed": 2.2, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 185.13, "elapsed": 3.2, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 228.33, "elapsed": 4.2, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 10.56, "elapsed": 2.1, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 24.19, "elapsed": 14.4, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 114.15, "elapsed": 19.3, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 14.2, "elapsed": 11.0, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 69.15, "elapsed": 113.3, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "PASS", "p50": 3.34, "elapsed": 8.5, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 75.82, "elapsed": 53.0, "is_pending": false, "prev_status": null, "fail_reason": ""}]}, {"model": "facebook/convnext-tiny-224", "task": "image-classification", "model_type": "convnext", "group": "", "priority": "", "pass_count": 10, "confirmed_pass": 10, "all_confirmed_passed": true, "eps": [{"status": "PASS", "p50": 6.55, "elapsed": 1.4, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 25.47, "elapsed": 1.1, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 25.05, "elapsed": 1.4, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 4.52, "elapsed": 1.4, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 8.34, "elapsed": 3.7, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 20.6, "elapsed": 6.9, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 2.84, "elapsed": 4.7, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 12.06, "elapsed": 150.9, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "PASS", "p50": 1.92, "elapsed": 8.6, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 10.83, "elapsed": 71.9, "is_pending": false, "prev_status": null, "fail_reason": ""}]}, {"model": "facebook/dino-vitb16", "task": "image-feature-extraction", "model_type": "vit", "group": "", "priority": "", "pass_count": 10, "confirmed_pass": 10, "all_confirmed_passed": true, "eps": [{"status": "PASS", "p50": 18.15, "elapsed": 1.7, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 67.78, "elapsed": 1.8, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 83.56, "elapsed": 2.4, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 6.68, "elapsed": 1.8, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 15.49, "elapsed": 7.8, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 38.35, "elapsed": 15.2, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 20.17, "elapsed": 16.7, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 29.86, "elapsed": 67.1, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 3.82, "elapsed": 8.7, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 31.56, "elapsed": 54.8, "is_pending": false, "prev_status": null, "fail_reason": ""}]}, {"model": "facebook/dino-vits16", "task": "image-feature-extraction", "model_type": "vit", "group": "", "priority": "", "pass_count": 10, "confirmed_pass": 10, "all_confirmed_passed": true, "eps": [{"status": "PASS", "p50": 6.34, "elapsed": 1.4, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 23.66, "elapsed": 1.1, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 24.9, "elapsed": 1.5, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 2.97, "elapsed": 1.4, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 11.89, "elapsed": 4.3, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 18.27, "elapsed": 5.7, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 3.37, "elapsed": 4.6, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 6.71, "elapsed": 49.9, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 2.59, "elapsed": 7.9, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 19.99, "elapsed": 45.6, "is_pending": false, "prev_status": null, "fail_reason": ""}]}, {"model": "facebook/dinov2-base", "task": "image-feature-extraction", "model_type": "dinov2", "group": "", "priority": "", "pass_count": 10, "confirmed_pass": 10, "all_confirmed_passed": true, "eps": [{"status": "PASS", "p50": 24.44, "elapsed": 1.8, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 89.35, "elapsed": 2.1, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 114.51, "elapsed": 2.8, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 6.83, "elapsed": 1.7, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 22.27, "elapsed": 9.1, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 51.75, "elapsed": 15.7, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 8.81, "elapsed": 9.7, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 45.24, "elapsed": 128.6, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 4.31, "elapsed": 8.6, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 38.19, "elapsed": 56.7, "is_pending": false, "prev_status": null, "fail_reason": ""}]}, {"model": "facebook/dinov2-large", "task": "image-feature-extraction", "model_type": "dinov2", "group": "", "priority": "", "pass_count": 10, "confirmed_pass": 10, "all_confirmed_passed": true, "eps": [{"status": "PASS", "p50": 86.22, "elapsed": 4.3, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 291.51, "elapsed": 5.9, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 401.4, "elapsed": 8.1, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 18.0, "elapsed": 4.5, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 47.84, "elapsed": 31.5, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 149.7, "elapsed": 60.6, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 72.93, "elapsed": 33.9, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 110.41, "elapsed": 361.2, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 10.29, "elapsed": 16.6, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 138.08, "elapsed": 104.7, "is_pending": false, "prev_status": null, "fail_reason": ""}]}, {"model": "facebook/dinov2-small", "task": "image-feature-extraction", "model_type": "dinov2", "group": "", "priority": "", "pass_count": 10, "confirmed_pass": 10, "all_confirmed_passed": true, "eps": [{"status": "PASS", "p50": 9.32, "elapsed": 1.5, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 30.07, "elapsed": 1.2, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 32.46, "elapsed": 1.6, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 4.07, "elapsed": 1.4, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 16.45, "elapsed": 5.4, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 28.45, "elapsed": 5.6, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 4.5, "elapsed": 5.4, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 11.27, "elapsed": 123.8, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 2.61, "elapsed": 8.0, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 11.84, "elapsed": 61.8, "is_pending": false, "prev_status": null, "fail_reason": ""}]}, {"model": "google-bert/bert-base-multilingual-cased", "task": "feature-extraction", "model_type": "bert", "group": "", "priority": "", "pass_count": 10, "confirmed_pass": 10, "all_confirmed_passed": true, "eps": [{"status": "PASS", "p50": 45.57, "elapsed": 2.8, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 186.16, "elapsed": 3.5, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 232.91, "elapsed": 4.4, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 10.87, "elapsed": 3.0, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 24.64, "elapsed": 16.3, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 101.73, "elapsed": 19.3, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 44.36, "elapsed": 18.2, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 61.54, "elapsed": 100.9, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "PASS", "p50": 19.09, "elapsed": 10.1, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 76.61, "elapsed": 51.9, "is_pending": false, "prev_status": null, "fail_reason": ""}]}, {"model": "google-bert/bert-base-multilingual-cased", "task": "fill-mask", "model_type": "bert", "group": "", "priority": "", "pass_count": 10, "confirmed_pass": 10, "all_confirmed_passed": true, "eps": [{"status": "PASS", "p50": 140.7, "elapsed": 4.9, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 358.9, "elapsed": 6.3, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 434.86, "elapsed": 7.9, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 32.44, "elapsed": 4.5, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 70.45, "elapsed": 24.9, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 411.98, "elapsed": 42.9, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 55.95, "elapsed": 31.2, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 102.69, "elapsed": 121.3, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 305.0, "elapsed": 15.4, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 155.15, "elapsed": 290.9, "is_pending": false, "prev_status": null, "fail_reason": ""}]}, {"model": "google-bert/bert-base-multilingual-cased", "task": "masked-lm", "model_type": "bert", "group": "", "priority": "", "pass_count": 10, "confirmed_pass": 10, "all_confirmed_passed": true, "eps": [{"status": "PASS", "p50": 138.89, "elapsed": 4.6, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 359.32, "elapsed": 6.1, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 431.69, "elapsed": 7.6, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 33.02, "elapsed": 4.4, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 66.16, "elapsed": 25.5, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 397.73, "elapsed": 44.2, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 55.0, "elapsed": 31.2, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 104.7, "elapsed": 265.0, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 304.95, "elapsed": 14.0, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 182.32, "elapsed": 300.8, "is_pending": false, "prev_status": null, "fail_reason": ""}]}, {"model": "google-bert/bert-base-multilingual-uncased", "task": "fill-mask", "model_type": "bert", "group": "", "priority": "", "pass_count": 10, "confirmed_pass": 10, "all_confirmed_passed": true, "eps": [{"status": "PASS", "p50": 128.73, "elapsed": 4.3, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 341.65, "elapsed": 5.8, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 410.93, "elapsed": 7.3, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 29.73, "elapsed": 4.0, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 57.2, "elapsed": 25.2, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 383.18, "elapsed": 42.6, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 47.42, "elapsed": 28.2, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 94.21, "elapsed": 181.7, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 270.62, "elapsed": 20.4, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 177.61, "elapsed": 297.8, "is_pending": false, "prev_status": null, "fail_reason": ""}]}, {"model": "google-bert/bert-base-uncased", "task": "fill-mask", "model_type": "bert", "group": "", "priority": "", "pass_count": 10, "confirmed_pass": 10, "all_confirmed_passed": true, "eps": [{"status": "PASS", "p50": 68.85, "elapsed": 2.8, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 229.16, "elapsed": 3.9, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 286.11, "elapsed": 5.0, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 16.2, "elapsed": 2.3, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 32.15, "elapsed": 17.3, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 124.03, "elapsed": 23.6, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 25.39, "elapsed": 17.3, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 70.69, "elapsed": 168.8, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 80.62, "elapsed": 10.8, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 95.06, "elapsed": 111.2, "is_pending": false, "prev_status": null, "fail_reason": ""}]}, {"model": "google-bert/bert-large-uncased-whole-word-masking-finetuned-squad", "task": "question-answering", "model_type": "bert", "group": "", "priority": "", "pass_count": 10, "confirmed_pass": 10, "all_confirmed_passed": true, "eps": [{"status": "PASS", "p50": 137.29, "elapsed": 5.3, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 615.15, "elapsed": 9.9, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 792.68, "elapsed": 12.7, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 32.24, "elapsed": 5.0, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 68.2, "elapsed": 63.8, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 346.98, "elapsed": 61.7, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 37.85, "elapsed": 34.8, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 179.23, "elapsed": 270.8, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 11.17, "elapsed": 18.0, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "PASS", "p50": 229.93, "elapsed": 90.5, "is_pending": false, "prev_status": null, "fail_reason": ""}]}, {"model": "google/vit-base-patch16-224", "task": "image-classification", "model_type": "vit", "group": "", "priority": "", "pass_count": 10, "confirmed_pass": 10, "all_confirmed_passed": true, "eps": [{"status": "PASS", "p50": 18.5, "elapsed": 1.7, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 74.88, "elapsed": 1.9, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 90.47, "elapsed": 2.5, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 6.43, "elapsed": 1.8, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 14.6, "elapsed": 7.9, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 31.72, "elapsed": 16.7, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 7.07, "elapsed": 9.9, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 24.14, "elapsed": 56.4, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 13.4, "elapsed": 9.2, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 31.58, "elapsed": 54.2, "is_pending": false, "prev_status": null, "fail_reason": ""}]}, {"model": "google/vit-base-patch16-224-in21k", "task": "image-feature-extraction", "model_type": "vit", "group": "", "priority": "", "pass_count": 10, "confirmed_pass": 10, "all_confirmed_passed": true, "eps": [{"status": "PASS", "p50": 18.92, "elapsed": 1.7, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 67.73, "elapsed": 1.8, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 84.08, "elapsed": 2.4, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 6.75, "elapsed": 1.8, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 14.99, "elapsed": 7.8, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 38.07, "elapsed": 17.4, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 7.0, "elapsed": 9.1, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 27.28, "elapsed": 55.4, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 3.85, "elapsed": 8.1, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 32.85, "elapsed": 54.5, "is_pending": false, "prev_status": null, "fail_reason": ""}]}, {"model": "hustvl/yolos-small", "task": "object-detection", "model_type": "yolos", "group": "", "priority": "", "pass_count": 10, "confirmed_pass": 10, "all_confirmed_passed": true, "eps": [{"status": "PASS", "p50": 108.48, "elapsed": 2.7, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 301.73, "elapsed": 4.4, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 353.92, "elapsed": 5.4, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 18.5, "elapsed": 1.6, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 315.32, "elapsed": 23.8, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 190.54, "elapsed": 7.9, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 52.87, "elapsed": 27.8, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 256.41, "elapsed": 67.0, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 25.18, "elapsed": 8.9, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 127.27, "elapsed": 92.1, "is_pending": false, "prev_status": null, "fail_reason": ""}]}, {"model": "joeddav/xlm-roberta-large-xnli", "task": "zero-shot-classification", "model_type": "xlm-roberta", "group": "", "priority": "", "pass_count": 10, "confirmed_pass": 10, "all_confirmed_passed": true, "eps": [{"status": "PASS", "p50": 139.74, "elapsed": 6.3, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 639.23, "elapsed": 10.4, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 800.5, "elapsed": 14.1, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 31.4, "elapsed": 8.6, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 66.85, "elapsed": 64.0, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 349.69, "elapsed": 52.3, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 125.62, "elapsed": 49.5, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 160.12, "elapsed": 199.5, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 11.25, "elapsed": 20.5, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "PASS", "p50": 238.81, "elapsed": 94.7, "is_pending": false, "prev_status": null, "fail_reason": ""}]}, {"model": "kredor/punctuate-all", "task": "token-classification", "model_type": "xlm-roberta", "group": "", "priority": "", "pass_count": 10, "confirmed_pass": 10, "all_confirmed_passed": true, "eps": [{"status": "PASS", "p50": 44.11, "elapsed": 3.6, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 184.43, "elapsed": 3.9, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 228.83, "elapsed": 5.3, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 10.15, "elapsed": 4.9, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 23.74, "elapsed": 16.6, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 93.36, "elapsed": 19.0, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 43.85, "elapsed": 14.2, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 55.93, "elapsed": 111.6, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 3.31, "elapsed": 10.2, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 75.61, "elapsed": 55.3, "is_pending": false, "prev_status": null, "fail_reason": ""}]}, {"model": "laion/CLIP-ViT-B-32-laion2B-s34B-b79K", "task": "feature-extraction", "model_type": "clip", "group": "", "priority": "", "pass_count": 10, "confirmed_pass": 10, "all_confirmed_passed": true, "eps": [{"status": "PASS", "p50": 4.99, "elapsed": 1.5, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 18.9, "elapsed": 1.1, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 15.17, "elapsed": 1.5, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 2.94, "elapsed": 1.7, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 6.15, "elapsed": 5.2, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 11.07, "elapsed": 7.6, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 2.72, "elapsed": 6.2, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 6.89, "elapsed": 69.0, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 1.22, "elapsed": 8.3, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 7.88, "elapsed": 29.3, "is_pending": false, "prev_status": null, "fail_reason": ""}]}, {"model": "laion/CLIP-ViT-B-32-laion2B-s34B-b79K", "task": "zero-shot-image-classification", "model_type": "clip", "group": "", "priority": "", "pass_count": 10, "confirmed_pass": 10, "all_confirmed_passed": true, "eps": [{"status": "PASS", "p50": 6.65, "elapsed": 3.1, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 21.24, "elapsed": 2.4, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 22.67, "elapsed": 3.1, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 3.68, "elapsed": 3.4, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 9.57, "elapsed": 12.3, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 18.38, "elapsed": 22.1, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 3.05, "elapsed": 21.0, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 6.62, "elapsed": 135.8, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 2.69, "elapsed": 17.4, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 11.62, "elapsed": 75.1, "is_pending": false, "prev_status": null, "fail_reason": ""}]}, {"model": "laion/CLIP-ViT-H-14-laion2B-s32B-b79K", "task": "zero-shot-image-classification", "model_type": "clip", "group": "", "priority": "", "pass_count": 10, "confirmed_pass": 10, "all_confirmed_passed": true, "eps": [{"status": "PASS", "p50": 431.99, "elapsed": 14.2, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "PASS", "p50": 604.24, "elapsed": 20.6, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 792.65, "elapsed": 20.0, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 41.76, "elapsed": 12.4, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 80.96, "elapsed": 73.7, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "PASS", "p50": 276.79, "elapsed": 136.8, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 189.73, "elapsed": 177.5, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 177.59, "elapsed": 426.5, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 15.93, "elapsed": 42.2, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "PASS", "p50": 242.71, "elapsed": 193.9, "is_pending": false, "prev_status": null, "fail_reason": ""}]}, {"model": "lxyuan/distilbert-base-multilingual-cased-sentiments-student", "task": "zero-shot-classification", "model_type": "distilbert", "group": "", "priority": "", "pass_count": 10, "confirmed_pass": 10, "all_confirmed_passed": true, "eps": [{"status": "PASS", "p50": 23.04, "elapsed": 2.0, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 93.86, "elapsed": 2.0, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 116.63, "elapsed": 2.7, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 5.72, "elapsed": 2.4, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 17.22, "elapsed": 6.4, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 45.38, "elapsed": 8.4, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 19.16, "elapsed": 7.2, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 29.95, "elapsed": 80.0, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 1.77, "elapsed": 8.4, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 37.62, "elapsed": 45.1, "is_pending": false, "prev_status": null, "fail_reason": ""}]}, {"model": "microsoft/beit-base-patch16-224-pt22k-ft22k", "task": "image-classification", "model_type": "beit", "group": "", "priority": "", "pass_count": 10, "confirmed_pass": 10, "all_confirmed_passed": true, "eps": [{"status": "PASS", "p50": 19.5, "elapsed": 1.9, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 69.22, "elapsed": 1.9, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 84.66, "elapsed": 2.5, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 12.62, "elapsed": 1.9, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 18.51, "elapsed": 8.5, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 45.86, "elapsed": 17.4, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 26.71, "elapsed": 24.8, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 33.1, "elapsed": 120.3, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "PASS", "p50": 16.41, "elapsed": 10.2, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 31.31, "elapsed": 82.0, "is_pending": false, "prev_status": null, "fail_reason": ""}]}, {"model": "microsoft/llmlingua-2-xlm-roberta-large-meetingbank", "task": "token-classification", "model_type": "xlm-roberta", "group": "", "priority": "", "pass_count": 10, "confirmed_pass": 10, "all_confirmed_passed": true, "eps": [{"status": "PASS", "p50": 138.87, "elapsed": 6.5, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 628.57, "elapsed": 10.3, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 823.12, "elapsed": 14.3, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 31.59, "elapsed": 8.2, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 65.77, "elapsed": 64.8, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 300.2, "elapsed": 51.2, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 130.47, "elapsed": 84.6, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 162.88, "elapsed": 200.5, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 11.18, "elapsed": 19.9, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "PASS", "p50": 246.51, "elapsed": 94.4, "is_pending": false, "prev_status": null, "fail_reason": ""}]}, {"model": "microsoft/rad-dino", "task": "image-feature-extraction", "model_type": "dinov2", "group": "", "priority": "", "pass_count": 10, "confirmed_pass": 10, "all_confirmed_passed": true, "eps": [{"status": "PASS", "p50": 181.0, "elapsed": 3.8, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 582.89, "elapsed": 8.1, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 740.2, "elapsed": 10.4, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 28.14, "elapsed": 2.1, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 121.01, "elapsed": 28.3, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 326.84, "elapsed": 20.4, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 102.65, "elapsed": 71.9, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 290.25, "elapsed": 164.4, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 25.51, "elapsed": 9.4, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 239.27, "elapsed": 148.1, "is_pending": false, "prev_status": null, "fail_reason": ""}]}, {"model": "microsoft/resnet-18", "task": "image-classification", "model_type": "resnet", "group": "", "priority": "", "pass_count": 10, "confirmed_pass": 10, "all_confirmed_passed": true, "eps": [{"status": "PASS", "p50": 2.38, "elapsed": 1.4, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 6.06, "elapsed": 0.9, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 8.3, "elapsed": 1.0, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 1.91, "elapsed": 1.1, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 1.41, "elapsed": 1.3, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 4.54, "elapsed": 3.0, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 0.93, "elapsed": 2.1, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 3.5, "elapsed": 254.0, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 1.62, "elapsed": 5.3, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 3.97, "elapsed": 46.4, "is_pending": false, "prev_status": null, "fail_reason": ""}]}, {"model": "microsoft/resnet-50", "task": "image-classification", "model_type": "resnet", "group": "", "priority": "", "pass_count": 10, "confirmed_pass": 10, "all_confirmed_passed": true, "eps": [{"status": "PASS", "p50": 4.57, "elapsed": 1.5, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "PASS", "p50": 13.67, "elapsed": 1.1, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 18.38, "elapsed": 1.2, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 2.41, "elapsed": 1.4, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 3.65, "elapsed": 2.2, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 11.74, "elapsed": 4.8, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 4.07, "elapsed": 4.3, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 5.34, "elapsed": 496.9, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 2.12, "elapsed": 6.3, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "PASS", "p50": 9.05, "elapsed": 103.8, "is_pending": false, "prev_status": null, "fail_reason": ""}]}, {"model": "microsoft/swin-large-patch4-window7-224", "task": "image-classification", "model_type": "swin", "group": "", "priority": "", "pass_count": 10, "confirmed_pass": 10, "all_confirmed_passed": true, "eps": [{"status": "PASS", "p50": 37.95, "elapsed": 3.4, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "PASS", "p50": 151.46, "elapsed": 3.9, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 180.25, "elapsed": 4.9, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 17.8, "elapsed": 3.8, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 33.94, "elapsed": 24.2, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 120.53, "elapsed": 33.8, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 186.78, "elapsed": 114.4, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 113.12, "elapsed": 266.4, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 6.24, "elapsed": 24.9, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 62.04, "elapsed": 156.6, "is_pending": false, "prev_status": null, "fail_reason": ""}]}, {"model": "microsoft/swinv2-tiny-patch4-window16-256", "task": "image-classification", "model_type": "swinv2", "group": "", "priority": "", "pass_count": 10, "confirmed_pass": 10, "all_confirmed_passed": true, "eps": [{"status": "PASS", "p50": 15.04, "elapsed": 1.6, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 48.71, "elapsed": 1.5, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 39.52, "elapsed": 1.8, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 6.33, "elapsed": 1.7, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 62.95, "elapsed": 9.4, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 63.48, "elapsed": 14.0, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 54.23, "elapsed": 11.4, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 37.49, "elapsed": 339.4, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "PASS", "p50": 20.15, "elapsed": 13.0, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 17.72, "elapsed": 104.0, "is_pending": false, "prev_status": null, "fail_reason": ""}]}, {"model": "monologg/koelectra-small-v2-distilled-korquad-384", "task": "question-answering", "model_type": "electra", "group": "", "priority": "", "pass_count": 10, "confirmed_pass": 10, "all_confirmed_passed": true, "eps": [{"status": "PASS", "p50": 8.55, "elapsed": 1.4, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 32.68, "elapsed": 1.2, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 34.13, "elapsed": 1.5, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 5.58, "elapsed": 1.4, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 11.0, "elapsed": 4.5, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 31.25, "elapsed": 3.6, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 15.04, "elapsed": 3.8, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 10.12, "elapsed": 49.3, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 1.2, "elapsed": 7.9, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 16.45, "elapsed": 36.4, "is_pending": false, "prev_status": null, "fail_reason": ""}]}, {"model": "openai/clip-vit-base-patch16", "task": "feature-extraction", "model_type": "clip", "group": "", "priority": "", "pass_count": 10, "confirmed_pass": 10, "all_confirmed_passed": true, "eps": [{"status": "PASS", "p50": 5.22, "elapsed": 1.5, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 18.53, "elapsed": 1.1, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 14.89, "elapsed": 1.5, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 3.04, "elapsed": 1.7, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 7.75, "elapsed": 5.5, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 11.48, "elapsed": 11.4, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 3.11, "elapsed": 5.6, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 6.1, "elapsed": 68.6, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 1.28, "elapsed": 8.8, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 6.52, "elapsed": 32.1, "is_pending": false, "prev_status": null, "fail_reason": ""}]}, {"model": "openai/clip-vit-base-patch32", "task": "feature-extraction", "model_type": "clip", "group": "", "priority": "", "pass_count": 10, "confirmed_pass": 10, "all_confirmed_passed": true, "eps": [{"status": "PASS", "p50": 5.37, "elapsed": 1.5, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 18.35, "elapsed": 1.1, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 15.06, "elapsed": 1.4, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 3.14, "elapsed": 1.7, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 6.57, "elapsed": 5.4, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 14.33, "elapsed": 13.5, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 2.69, "elapsed": 5.6, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 6.21, "elapsed": 68.6, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 1.29, "elapsed": 8.7, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 5.98, "elapsed": 31.2, "is_pending": false, "prev_status": null, "fail_reason": ""}]}, {"model": "openai/clip-vit-base-patch32", "task": "zero-shot-image-classification", "model_type": "clip", "group": "", "priority": "", "pass_count": 10, "confirmed_pass": 10, "all_confirmed_passed": true, "eps": [{"status": "PASS", "p50": 6.94, "elapsed": 3.2, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 21.92, "elapsed": 2.4, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 22.61, "elapsed": 3.1, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 3.89, "elapsed": 3.4, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 11.18, "elapsed": 12.7, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 18.98, "elapsed": 33.7, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 2.83, "elapsed": 14.3, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 6.76, "elapsed": 142.1, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "PASS", "p50": 2.58, "elapsed": 17.3, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 11.17, "elapsed": 95.3, "is_pending": false, "prev_status": null, "fail_reason": ""}]}, {"model": "patrickjohncyh/fashion-clip", "task": "zero-shot-image-classification", "model_type": "clip", "group": "", "priority": "", "pass_count": 10, "confirmed_pass": 10, "all_confirmed_passed": true, "eps": [{"status": "PASS", "p50": 6.86, "elapsed": 3.4, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 21.16, "elapsed": 2.4, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 22.96, "elapsed": 3.3, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 3.87, "elapsed": 3.5, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 10.19, "elapsed": 13.5, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 19.03, "elapsed": 26.3, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 2.86, "elapsed": 16.2, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 7.69, "elapsed": 132.4, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "PASS", "p50": 2.57, "elapsed": 17.1, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 11.3, "elapsed": 88.8, "is_pending": false, "prev_status": null, "fail_reason": ""}]}, {"model": "rizvandwiki/gender-classification", "task": "image-classification", "model_type": "vit", "group": "", "priority": "", "pass_count": 10, "confirmed_pass": 10, "all_confirmed_passed": true, "eps": [{"status": "PASS", "p50": 17.59, "elapsed": 1.7, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 69.85, "elapsed": 1.9, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 84.09, "elapsed": 2.4, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 6.75, "elapsed": 1.8, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 14.91, "elapsed": 7.9, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 38.79, "elapsed": 18.8, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 7.03, "elapsed": 9.3, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 27.56, "elapsed": 58.4, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 3.08, "elapsed": 8.3, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 29.59, "elapsed": 66.7, "is_pending": false, "prev_status": null, "fail_reason": ""}]}, {"model": "sentence-transformers/all-MiniLM-L6-v2", "task": "feature-extraction", "model_type": "bert", "group": "", "priority": "", "pass_count": 10, "confirmed_pass": 10, "all_confirmed_passed": true, "eps": [{"status": "PASS", "p50": 12.07, "elapsed": 1.5, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 32.35, "elapsed": 1.2, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 34.76, "elapsed": 1.5, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 4.5, "elapsed": 1.3, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 9.64, "elapsed": 4.1, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 24.12, "elapsed": 3.4, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 5.36, "elapsed": 3.6, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 10.63, "elapsed": 71.7, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 2.13, "elapsed": 6.2, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 16.78, "elapsed": 30.3, "is_pending": false, "prev_status": null, "fail_reason": ""}]}, {"model": "sentence-transformers/all-MiniLM-L6-v2", "task": "sentence-similarity", "model_type": "bert", "group": "", "priority": "", "pass_count": 10, "confirmed_pass": 10, "all_confirmed_passed": true, "eps": [{"status": "PASS", "p50": 12.1, "elapsed": 1.5, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 33.11, "elapsed": 1.3, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 35.39, "elapsed": 1.4, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 4.2, "elapsed": 1.3, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 10.27, "elapsed": 4.1, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 27.03, "elapsed": 3.7, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 5.41, "elapsed": 3.4, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 11.8, "elapsed": 66.9, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 2.06, "elapsed": 5.8, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 16.77, "elapsed": 31.6, "is_pending": false, "prev_status": null, "fail_reason": ""}]}, {"model": "sentence-transformers/all-mpnet-base-v2", "task": "feature-extraction", "model_type": "mpnet", "group": "", "priority": "", "pass_count": 10, "confirmed_pass": 10, "all_confirmed_passed": true, "eps": [{"status": "PASS", "p50": 48.04, "elapsed": 2.2, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 193.45, "elapsed": 3.4, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 229.6, "elapsed": 4.2, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 12.51, "elapsed": 2.1, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 36.82, "elapsed": 12.4, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 108.29, "elapsed": 20.7, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 47.85, "elapsed": 13.7, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 90.28, "elapsed": 94.7, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 24.87, "elapsed": 9.4, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 75.47, "elapsed": 57.6, "is_pending": false, "prev_status": null, "fail_reason": ""}]}, {"model": "sentence-transformers/all-mpnet-base-v2", "task": "fill-mask", "model_type": "mpnet", "group": "", "priority": "", "pass_count": 10, "confirmed_pass": 10, "all_confirmed_passed": true, "eps": [{"status": "PASS", "p50": 71.28, "elapsed": 2.7, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 232.13, "elapsed": 3.9, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 282.16, "elapsed": 5.0, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 16.82, "elapsed": 2.3, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 46.02, "elapsed": 14.8, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 126.93, "elapsed": 28.9, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 56.13, "elapsed": 15.4, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 98.83, "elapsed": 101.8, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 80.8, "elapsed": 9.6, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 98.25, "elapsed": 111.7, "is_pending": false, "prev_status": null, "fail_reason": ""}]}, {"model": "sentence-transformers/all-mpnet-base-v2", "task": "sentence-similarity", "model_type": "mpnet", "group": "", "priority": "", "pass_count": 10, "confirmed_pass": 10, "all_confirmed_passed": true, "eps": [{"status": "PASS", "p50": 47.64, "elapsed": 2.2, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 186.84, "elapsed": 3.3, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 229.37, "elapsed": 4.2, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 12.89, "elapsed": 2.1, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 35.71, "elapsed": 12.5, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 103.19, "elapsed": 17.2, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 47.83, "elapsed": 13.3, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 89.68, "elapsed": 95.1, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 5.49, "elapsed": 8.3, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 77.01, "elapsed": 59.1, "is_pending": false, "prev_status": null, "fail_reason": ""}]}, {"model": "sentence-transformers/multi-qa-mpnet-base-dot-v1", "task": "feature-extraction", "model_type": "mpnet", "group": "", "priority": "", "pass_count": 10, "confirmed_pass": 10, "all_confirmed_passed": true, "eps": [{"status": "PASS", "p50": 48.42, "elapsed": 2.2, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 186.87, "elapsed": 3.3, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 231.5, "elapsed": 4.2, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 12.39, "elapsed": 2.1, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 35.72, "elapsed": 12.3, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 117.08, "elapsed": 18.2, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 47.75, "elapsed": 13.2, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 83.41, "elapsed": 94.0, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 5.47, "elapsed": 8.2, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 90.67, "elapsed": 57.5, "is_pending": false, "prev_status": null, "fail_reason": ""}]}, {"model": "sentence-transformers/multi-qa-mpnet-base-dot-v1", "task": "fill-mask", "model_type": "mpnet", "group": "", "priority": "", "pass_count": 10, "confirmed_pass": 10, "all_confirmed_passed": true, "eps": [{"status": "PASS", "p50": 72.88, "elapsed": 2.7, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 241.9, "elapsed": 6.0, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 282.62, "elapsed": 5.0, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 17.62, "elapsed": 2.3, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 47.01, "elapsed": 14.9, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 123.54, "elapsed": 30.2, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 56.67, "elapsed": 15.7, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 102.82, "elapsed": 101.0, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 80.69, "elapsed": 11.3, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 105.89, "elapsed": 139.1, "is_pending": false, "prev_status": null, "fail_reason": ""}]}, {"model": "sentence-transformers/multi-qa-mpnet-base-dot-v1", "task": "sentence-similarity", "model_type": "mpnet", "group": "", "priority": "", "pass_count": 10, "confirmed_pass": 10, "all_confirmed_passed": true, "eps": [{"status": "PASS", "p50": 46.86, "elapsed": 2.2, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 187.67, "elapsed": 3.3, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 228.77, "elapsed": 4.2, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 12.84, "elapsed": 2.1, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 35.97, "elapsed": 12.6, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 105.17, "elapsed": 17.0, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 47.7, "elapsed": 13.9, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 91.28, "elapsed": 95.8, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 5.53, "elapsed": 8.4, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 84.04, "elapsed": 66.1, "is_pending": false, "prev_status": null, "fail_reason": ""}]}, {"model": "sentence-transformers/paraphrase-multilingual-MiniLM-L12-v2", "task": "feature-extraction", "model_type": "bert", "group": "", "priority": "", "pass_count": 10, "confirmed_pass": 10, "all_confirmed_passed": true, "eps": [{"status": "PASS", "p50": 22.86, "elapsed": 1.9, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 69.86, "elapsed": 1.7, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 69.29, "elapsed": 2.2, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 7.31, "elapsed": 2.6, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 15.51, "elapsed": 9.2, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 63.98, "elapsed": 10.6, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 9.83, "elapsed": 6.4, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 48.9, "elapsed": 81.5, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "PASS", "p50": 3.0, "elapsed": 8.8, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 33.84, "elapsed": 49.4, "is_pending": false, "prev_status": null, "fail_reason": ""}]}, {"model": "sentence-transformers/paraphrase-multilingual-MiniLM-L12-v2", "task": "sentence-similarity", "model_type": "bert", "group": "", "priority": "", "pass_count": 10, "confirmed_pass": 10, "all_confirmed_passed": true, "eps": [{"status": "PASS", "p50": 23.13, "elapsed": 1.9, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 64.72, "elapsed": 1.6, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 69.44, "elapsed": 2.2, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 7.59, "elapsed": 2.6, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 16.06, "elapsed": 9.4, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 58.32, "elapsed": 12.1, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 9.41, "elapsed": 6.5, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 41.73, "elapsed": 82.1, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 2.82, "elapsed": 8.1, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 37.03, "elapsed": 44.8, "is_pending": false, "prev_status": null, "fail_reason": ""}]}, {"model": "sentence-transformers/paraphrase-multilingual-mpnet-base-v2", "task": "sentence-similarity", "model_type": "xlm-roberta", "group": "", "priority": "", "pass_count": 10, "confirmed_pass": 10, "all_confirmed_passed": true, "eps": [{"status": "PASS", "p50": 45.54, "elapsed": 3.3, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 188.53, "elapsed": 3.9, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 233.39, "elapsed": 5.3, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 10.68, "elapsed": 5.0, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 24.81, "elapsed": 16.6, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 95.32, "elapsed": 23.6, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 15.0, "elapsed": 11.5, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 58.97, "elapsed": 109.9, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 5.36, "elapsed": 11.5, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 75.84, "elapsed": 61.1, "is_pending": false, "prev_status": null, "fail_reason": ""}]}, {"model": "tau/splinter-base", "task": "question-answering", "model_type": "splinter", "group": "", "priority": "", "pass_count": 10, "confirmed_pass": 10, "all_confirmed_passed": true, "eps": [{"status": "PASS", "p50": 44.85, "elapsed": 2.2, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 186.1, "elapsed": 3.3, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 230.98, "elapsed": 4.3, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 10.0, "elapsed": 2.1, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 28.04, "elapsed": 11.8, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 98.14, "elapsed": 21.4, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 43.96, "elapsed": 11.8, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 70.88, "elapsed": 71.7, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "PASS", "p50": 11.38, "elapsed": 9.5, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 69.92, "elapsed": 67.7, "is_pending": false, "prev_status": null, "fail_reason": ""}]}, {"model": "valentinafeve/yolos-fashionpedia", "task": "object-detection", "model_type": "yolos", "group": "", "priority": "", "pass_count": 10, "confirmed_pass": 10, "all_confirmed_passed": true, "eps": [{"status": "PASS", "p50": 114.22, "elapsed": 2.8, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 289.75, "elapsed": 4.4, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 348.86, "elapsed": 5.4, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 18.24, "elapsed": 1.6, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 320.24, "elapsed": 24.0, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 210.29, "elapsed": 15.7, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 57.92, "elapsed": 26.8, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 243.26, "elapsed": 72.7, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 25.15, "elapsed": 8.9, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 132.59, "elapsed": 103.9, "is_pending": false, "prev_status": null, "fail_reason": ""}]}, {"model": "w11wo/indonesian-roberta-base-posp-tagger", "task": "token-classification", "model_type": "roberta", "group": "", "priority": "", "pass_count": 10, "confirmed_pass": 10, "all_confirmed_passed": true, "eps": [{"status": "PASS", "p50": 57.98, "elapsed": 2.4, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 184.0, "elapsed": 3.2, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 229.91, "elapsed": 4.3, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 10.4, "elapsed": 2.3, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 24.2, "elapsed": 14.5, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 100.18, "elapsed": 22.8, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 14.87, "elapsed": 10.7, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 58.8, "elapsed": 104.4, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 3.41, "elapsed": 8.7, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 86.11, "elapsed": 59.6, "is_pending": false, "prev_status": null, "fail_reason": ""}]}, {"model": "FacebookAI/xlm-roberta-large", "task": "fill-mask", "model_type": "xlm-roberta", "group": "", "priority": "", "pass_count": 9, "confirmed_pass": 9, "all_confirmed_passed": false, "eps": [{"status": "FAIL", "p50": null, "elapsed": 7.8, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "PASS", "p50": 1138.91, "elapsed": 17.4, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 1353.07, "elapsed": 22.9, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 81.8, "elapsed": 13.2, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 116.36, "elapsed": 94.3, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 1130.7, "elapsed": 118.1, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 116.9, "elapsed": 119.4, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 264.05, "elapsed": 249.9, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 642.16, "elapsed": 30.4, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "PASS", "p50": 471.53, "elapsed": 731.1, "is_pending": false, "prev_status": null, "fail_reason": ""}]}, {"model": "Helsinki-NLP/opus-mt-es-en", "task": "translation", "model_type": "marian", "group": "", "priority": "", "pass_count": 9, "confirmed_pass": 9, "all_confirmed_passed": false, "eps": [{"status": "PASS", "p50": 6.35, "elapsed": 3.3, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 12.24, "elapsed": 2.5, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 12.46, "elapsed": 3.4, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 6.68, "elapsed": 3.9, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 12.83, "elapsed": 11.7, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 140.4, "is_pending": false, "prev_status": "FAIL", "fail_reason": "SA"}, {"status": "PASS", "p50": 9.34, "elapsed": 12.4, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 11.95, "elapsed": 184.9, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 19.62, "elapsed": 17.6, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 10.52, "elapsed": 86.6, "is_pending": false, "prev_status": null, "fail_reason": ""}]}, {"model": "Helsinki-NLP/opus-mt-nl-en", "task": "translation", "model_type": "marian", "group": "", "priority": "", "pass_count": 9, "confirmed_pass": 9, "all_confirmed_passed": false, "eps": [{"status": "PASS", "p50": 6.32, "elapsed": 3.2, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 12.79, "elapsed": 2.5, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 12.7, "elapsed": 3.4, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 6.57, "elapsed": 3.9, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 11.81, "elapsed": 12.0, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 169.7, "is_pending": false, "prev_status": "FAIL", "fail_reason": "SA"}, {"status": "PASS", "p50": 9.95, "elapsed": 12.7, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 9.12, "elapsed": 186.6, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 19.7, "elapsed": 15.8, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 10.8, "elapsed": 85.4, "is_pending": false, "prev_status": null, "fail_reason": ""}]}, {"model": "Helsinki-NLP/opus-mt-tr-en", "task": "translation", "model_type": "marian", "group": "", "priority": "", "pass_count": 9, "confirmed_pass": 9, "all_confirmed_passed": false, "eps": [{"status": "PASS", "p50": 6.1, "elapsed": 3.2, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 12.06, "elapsed": 2.5, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 12.24, "elapsed": 3.3, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 6.61, "elapsed": 3.9, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 11.48, "elapsed": 11.5, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 162.3, "is_pending": false, "prev_status": "FAIL", "fail_reason": "SA"}, {"status": "PASS", "p50": 9.7, "elapsed": 12.4, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 9.77, "elapsed": 184.8, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 20.06, "elapsed": 16.0, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 9.66, "elapsed": 78.2, "is_pending": false, "prev_status": null, "fail_reason": ""}]}, {"model": "LiheYoung/depth-anything-large-hf", "task": "depth-estimation", "model_type": "depth_anything", "group": "", "priority": "", "pass_count": 9, "confirmed_pass": 9, "all_confirmed_passed": false, "eps": [{"status": "PASS", "p50": 665.62, "elapsed": 12.0, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "PASS", "p50": 2357.45, "elapsed": 31.2, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 3124.78, "elapsed": 41.4, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 347.0, "is_pending": false, "prev_status": "FAIL", "fail_reason": "SA"}, {"status": "PASS", "p50": 412.78, "elapsed": 104.2, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 1719.24, "elapsed": 74.6, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 271.09, "elapsed": 194.1, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 1277.88, "elapsed": 981.8, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 60.83, "elapsed": 22.0, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "PASS", "p50": 1201.01, "elapsed": 1404.3, "is_pending": false, "prev_status": null, "fail_reason": ""}]}, {"model": "LiheYoung/depth-anything-small-hf", "task": "depth-estimation", "model_type": "depth_anything", "group": "", "priority": "", "pass_count": 9, "confirmed_pass": 9, "all_confirmed_passed": false, "eps": [{"status": "PASS", "p50": 86.48, "elapsed": 2.7, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 239.2, "elapsed": 3.8, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 283.84, "elapsed": 4.7, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 54.4, "is_pending": false, "prev_status": "FAIL", "fail_reason": "SA"}, {"status": "PASS", "p50": 106.13, "elapsed": 20.6, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 165.95, "elapsed": 10.5, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 43.94, "elapsed": 18.9, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 239.23, "elapsed": 636.4, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 12.29, "elapsed": 12.8, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 103.53, "elapsed": 366.8, "is_pending": false, "prev_status": null, "fail_reason": ""}]}, {"model": "MoritzLaurer/mDeBERTa-v3-base-mnli-xnli", "task": "zero-shot-classification", "model_type": "deberta-v2", "group": "", "priority": "", "pass_count": 9, "confirmed_pass": 9, "all_confirmed_passed": false, "eps": [{"status": "PASS", "p50": 89.88, "elapsed": 4.7, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 278.24, "elapsed": 5.1, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 398.53, "elapsed": 7.6, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 4.9, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "PASS", "p50": 72.27, "elapsed": 20.1, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 372.22, "elapsed": 17.0, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 670.74, "elapsed": 39.2, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 244.47, "elapsed": 2689.3, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 22.31, "elapsed": 12.8, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 110.38, "elapsed": 77.6, "is_pending": false, "prev_status": null, "fail_reason": ""}]}, {"model": "MoritzLaurer/mDeBERTa-v3-base-xnli-multilingual-nli-2mil7", "task": "zero-shot-classification", "model_type": "deberta-v2", "group": "", "priority": "", "pass_count": 9, "confirmed_pass": 9, "all_confirmed_passed": false, "eps": [{"status": "PASS", "p50": 89.9, "elapsed": 4.5, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 281.61, "elapsed": 5.1, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 393.8, "elapsed": 7.5, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 4.8, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "PASS", "p50": 74.08, "elapsed": 20.0, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 702.59, "elapsed": 28.3, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 675.42, "elapsed": 39.3, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 238.72, "elapsed": 1887.6, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 33.64, "elapsed": 12.9, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "PASS", "p50": 111.05, "elapsed": 76.3, "is_pending": false, "prev_status": null, "fail_reason": ""}]}, {"model": "TahaDouaji/detr-doc-table-detection", "task": "object-detection", "model_type": "detr", "group": "", "priority": "", "pass_count": 9, "confirmed_pass": 9, "all_confirmed_passed": false, "eps": [{"status": "PASS", "p50": 73.46, "elapsed": 2.6, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 200.55, "elapsed": 3.4, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 269.33, "elapsed": 4.7, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 2.0, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "PASS", "p50": 32.77, "elapsed": 14.3, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 194.08, "elapsed": 13.7, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 35.57, "elapsed": 15.4, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 103.57, "elapsed": 723.9, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 17.2, "elapsed": 15.9, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "PASS", "p50": 79.73, "elapsed": 437.4, "is_pending": false, "prev_status": null, "fail_reason": ""}]}, {"model": "cardiffnlp/twitter-roberta-base-sentiment-latest", "task": "text-classification", "model_type": "roberta", "group": "", "priority": "", "pass_count": 9, "confirmed_pass": 9, "all_confirmed_passed": false, "eps": [{"status": "PASS", "p50": 45.3, "elapsed": 2.4, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 183.92, "elapsed": 3.2, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 229.0, "elapsed": 4.3, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 10.35, "elapsed": 2.3, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 194.9, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 108.98, "elapsed": 17.5, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 14.25, "elapsed": 11.0, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 60.07, "elapsed": 160.5, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 15.45, "elapsed": 10.2, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 74.42, "elapsed": 54.2, "is_pending": false, "prev_status": null, "fail_reason": ""}]}, {"model": "cross-encoder/nli-deberta-v3-small", "task": "zero-shot-classification", "model_type": "deberta-v2", "group": "", "priority": "", "pass_count": 9, "confirmed_pass": 9, "all_confirmed_passed": false, "eps": [{"status": "PASS", "p50": 45.27, "elapsed": 2.5, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 136.68, "elapsed": 2.5, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 195.74, "elapsed": 3.8, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 2.5, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "PASS", "p50": 36.41, "elapsed": 9.8, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 203.3, "elapsed": 10.1, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 225.87, "elapsed": 22.3, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 128.03, "elapsed": 676.8, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 17.48, "elapsed": 9.6, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 57.18, "elapsed": 56.9, "is_pending": false, "prev_status": null, "fail_reason": ""}]}, {"model": "depth-anything/Depth-Anything-V2-Base-hf", "task": "depth-estimation", "model_type": "depth_anything", "group": "", "priority": "", "pass_count": 9, "confirmed_pass": 9, "all_confirmed_passed": false, "eps": [{"status": "PASS", "p50": 221.08, "elapsed": 4.8, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "PASS", "p50": 702.93, "elapsed": 9.6, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 914.72, "elapsed": 12.5, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 88.1, "is_pending": false, "prev_status": "FAIL", "fail_reason": "SA"}, {"status": "PASS", "p50": 140.18, "elapsed": 33.9, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 405.92, "elapsed": 25.4, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 108.54, "elapsed": 69.2, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 465.91, "elapsed": 874.7, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 23.33, "elapsed": 15.8, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 293.94, "elapsed": 655.9, "is_pending": false, "prev_status": null, "fail_reason": ""}]}, {"model": "depth-anything/Depth-Anything-V2-Large-hf", "task": "depth-estimation", "model_type": "depth_anything", "group": "", "priority": "", "pass_count": 9, "confirmed_pass": 9, "all_confirmed_passed": false, "eps": [{"status": "PASS", "p50": 648.07, "elapsed": 12.2, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "PASS", "p50": 2366.09, "elapsed": 31.3, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 3138.31, "elapsed": 41.5, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 161.7, "is_pending": false, "prev_status": "FAIL", "fail_reason": "SA"}, {"status": "PASS", "p50": 415.85, "elapsed": 97.3, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 1161.91, "elapsed": 77.6, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 266.72, "elapsed": 285.8, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 1376.28, "elapsed": 1093.9, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 60.89, "elapsed": 21.8, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "PASS", "p50": 896.0, "elapsed": 1393.9, "is_pending": false, "prev_status": null, "fail_reason": ""}]}, {"model": "depth-anything/Depth-Anything-V2-Small-hf", "task": "depth-estimation", "model_type": "depth_anything", "group": "", "priority": "", "pass_count": 9, "confirmed_pass": 9, "all_confirmed_passed": false, "eps": [{"status": "PASS", "p50": 90.72, "elapsed": 2.9, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 244.88, "elapsed": 3.8, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 282.2, "elapsed": 4.7, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 54.6, "is_pending": false, "prev_status": "FAIL", "fail_reason": "SA"}, {"status": "PASS", "p50": 102.15, "elapsed": 20.8, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 145.44, "elapsed": 9.9, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 45.23, "elapsed": 19.6, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 263.9, "elapsed": 905.4, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 12.3, "elapsed": 12.9, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 109.22, "elapsed": 373.5, "is_pending": false, "prev_status": null, "fail_reason": ""}]}, {"model": "facebook/detr-resnet-50", "task": "object-detection", "model_type": "detr", "group": "", "priority": "", "pass_count": 9, "confirmed_pass": 9, "all_confirmed_passed": false, "eps": [{"status": "PASS", "p50": 68.84, "elapsed": 2.4, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 199.96, "elapsed": 3.4, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 269.22, "elapsed": 4.6, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 1.9, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "PASS", "p50": 33.47, "elapsed": 14.0, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 202.49, "elapsed": 15.8, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 51.08, "elapsed": 13.7, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 101.93, "elapsed": 775.9, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 17.19, "elapsed": 14.4, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 77.91, "elapsed": 440.5, "is_pending": false, "prev_status": null, "fail_reason": ""}]}, {"model": "facebook/dinov2-giant", "task": "image-feature-extraction", "model_type": "dinov2", "group": "", "priority": "", "pass_count": 9, "confirmed_pass": 9, "all_confirmed_passed": false, "eps": [{"status": "FAIL", "p50": null, "elapsed": 9.2, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "PASS", "p50": 1035.75, "elapsed": 18.4, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 1374.33, "elapsed": 26.5, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 60.94, "elapsed": 14.9, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 173.46, "elapsed": 88.0, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 6625.97, "elapsed": 319.9, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 257.34, "elapsed": 242.8, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 321.82, "elapsed": 916.6, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 26.53, "elapsed": 39.0, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "PASS", "p50": 426.65, "elapsed": 189.4, "is_pending": false, "prev_status": null, "fail_reason": ""}]}, {"model": "fashn-ai/fashn-human-parser", "task": "image-segmentation", "model_type": "segformer", "group": "", "priority": "", "pass_count": 9, "confirmed_pass": 9, "all_confirmed_passed": false, "eps": [{"status": "PASS", "p50": 93.14, "elapsed": 3.0, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 419.63, "elapsed": 6.4, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 397.74, "elapsed": 7.2, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 101.6, "is_pending": false, "prev_status": "FAIL", "fail_reason": "SA"}, {"status": "PASS", "p50": 72.94, "elapsed": 36.2, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 287.93, "elapsed": 24.6, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 166.56, "elapsed": 55.3, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 475.43, "elapsed": 445.4, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 15.53, "elapsed": 35.5, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "PASS", "p50": 174.97, "elapsed": 663.5, "is_pending": false, "prev_status": null, "fail_reason": ""}]}, {"model": "intfloat/multilingual-e5-large", "task": "sentence-similarity", "model_type": "xlm-roberta", "group": "", "priority": "", "pass_count": 9, "confirmed_pass": 9, "all_confirmed_passed": false, "eps": [{"status": "PASS", "p50": 137.23, "elapsed": 6.5, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 630.51, "elapsed": 10.6, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 806.32, "elapsed": 14.4, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 31.57, "elapsed": 10.9, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 66.68, "elapsed": 63.7, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 3600.1, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 125.88, "elapsed": 53.8, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 181.84, "elapsed": 196.8, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 13.92, "elapsed": 19.1, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "PASS", "p50": 239.26, "elapsed": 93.4, "is_pending": false, "prev_status": null, "fail_reason": ""}]}, {"model": "jonathandinu/face-parsing", "task": "image-segmentation", "model_type": "segformer", "group": "", "priority": "", "pass_count": 9, "confirmed_pass": 9, "all_confirmed_passed": false, "eps": [{"status": "PASS", "p50": 153.42, "elapsed": 3.9, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "PASS", "p50": 689.0, "elapsed": 9.6, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 570.69, "elapsed": 9.8, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 118.9, "is_pending": false, "prev_status": "FAIL", "fail_reason": "SA"}, {"status": "PASS", "p50": 96.86, "elapsed": 51.7, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 2203.94, "elapsed": 49.7, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 267.25, "elapsed": 68.2, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 546.17, "elapsed": 546.0, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 21.46, "elapsed": 43.5, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 229.15, "elapsed": 813.0, "is_pending": false, "prev_status": null, "fail_reason": ""}]}, {"model": "mattmdjaga/segformer_b2_clothes", "task": "image-segmentation", "model_type": "segformer", "group": "", "priority": "", "pass_count": 9, "confirmed_pass": 9, "all_confirmed_passed": false, "eps": [{"status": "PASS", "p50": 74.2, "elapsed": 2.4, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 422.3, "elapsed": 5.9, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 330.19, "elapsed": 5.4, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 48.0, "is_pending": false, "prev_status": "FAIL", "fail_reason": "SA"}, {"status": "PASS", "p50": 56.39, "elapsed": 18.7, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 368.03, "elapsed": 12.3, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 42.18, "elapsed": 13.4, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 362.91, "elapsed": 240.3, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 14.14, "elapsed": 19.9, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 124.09, "elapsed": 621.4, "is_pending": false, "prev_status": null, "fail_reason": ""}]}, {"model": "microsoft/deberta-xlarge-mnli", "task": "text-classification", "model_type": "deberta", "group": "", "priority": "", "pass_count": 9, "confirmed_pass": 9, "all_confirmed_passed": false, "eps": [{"status": "PASS", "p50": 480.69, "elapsed": 12.5, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "PASS", "p50": 1822.55, "elapsed": 26.1, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 2558.84, "elapsed": 37.8, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 199.74, "elapsed": 12.8, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 432.28, "elapsed": 119.9, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 2334.45, "elapsed": 135.1, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 7208.1, "elapsed": 477.8, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 3600.7, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 34.43, "elapsed": 38.0, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "PASS", "p50": 678.4, "elapsed": 224.3, "is_pending": false, "prev_status": null, "fail_reason": ""}]}, {"model": "microsoft/table-transformer-detection", "task": "object-detection", "model_type": "table-transformer", "group": "", "priority": "", "pass_count": 9, "confirmed_pass": 9, "all_confirmed_passed": false, "eps": [{"status": "PASS", "p50": 46.77, "elapsed": 2.1, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 103.25, "elapsed": 2.3, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 134.55, "elapsed": 3.0, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 1.9, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "PASS", "p50": 23.9, "elapsed": 9.2, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 93.06, "elapsed": 10.0, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 33.19, "elapsed": 12.1, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 56.28, "elapsed": 441.0, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "PASS", "p50": 14.01, "elapsed": 14.9, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 43.09, "elapsed": 193.8, "is_pending": false, "prev_status": null, "fail_reason": ""}]}, {"model": "microsoft/table-transformer-structure-recognition", "task": "object-detection", "model_type": "table-transformer", "group": "", "priority": "", "pass_count": 9, "confirmed_pass": 9, "all_confirmed_passed": false, "eps": [{"status": "PASS", "p50": 46.81, "elapsed": 2.1, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 109.54, "elapsed": 2.3, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 140.8, "elapsed": 3.1, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 1.8, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "PASS", "p50": 25.56, "elapsed": 9.7, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 98.11, "elapsed": 13.2, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 36.17, "elapsed": 11.0, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 58.02, "elapsed": 447.1, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 32.31, "elapsed": 16.0, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 45.71, "elapsed": 204.5, "is_pending": false, "prev_status": null, "fail_reason": ""}]}, {"model": "microsoft/table-transformer-structure-recognition-v1.1-all", "task": "object-detection", "model_type": "table-transformer", "group": "", "priority": "", "pass_count": 9, "confirmed_pass": 9, "all_confirmed_passed": false, "eps": [{"status": "PASS", "p50": 4.0, "elapsed": 1.5, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 11.58, "elapsed": 1.1, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 8.16, "elapsed": 1.4, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 1.5, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "PASS", "p50": 4.2, "elapsed": 6.2, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 17.36, "elapsed": 10.7, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 3.75, "elapsed": 5.4, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 7.12, "elapsed": 195.8, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "PASS", "p50": 10.13, "elapsed": 14.0, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 5.58, "elapsed": 83.5, "is_pending": false, "prev_status": null, "fail_reason": ""}]}, {"model": "microsoft/trocr-base-handwritten", "task": "image-to-text", "model_type": "vision-encoder-decoder", "group": "", "priority": "", "pass_count": 9, "confirmed_pass": 9, "all_confirmed_passed": false, "eps": [{"status": "PASS", "p50": 26.91, "elapsed": 5.4, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 54.53, "elapsed": 5.7, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 64.92, "elapsed": 8.0, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 16.9, "elapsed": 6.1, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 78.19, "elapsed": 36.0, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 263.2, "is_pending": false, "prev_status": "PASS", "fail_reason": "SA"}, {"status": "PASS", "p50": 66.48, "elapsed": 172.9, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 46.76, "elapsed": 188.7, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 71.1, "elapsed": 25.9, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 46.59, "elapsed": 235.6, "is_pending": false, "prev_status": null, "fail_reason": ""}]}, {"model": "microsoft/trocr-base-printed", "task": "image-to-text", "model_type": "vision-encoder-decoder", "group": "", "priority": "", "pass_count": 9, "confirmed_pass": 9, "all_confirmed_passed": false, "eps": [{"status": "PASS", "p50": 26.32, "elapsed": 5.4, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 54.91, "elapsed": 5.9, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 63.69, "elapsed": 8.1, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 17.7, "elapsed": 6.0, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 78.74, "elapsed": 36.0, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 260.6, "is_pending": false, "prev_status": "PASS", "fail_reason": "SA"}, {"status": "PASS", "p50": 66.36, "elapsed": 170.4, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 47.59, "elapsed": 190.5, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 71.06, "elapsed": 26.2, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 44.04, "elapsed": 237.8, "is_pending": false, "prev_status": null, "fail_reason": ""}]}, {"model": "microsoft/trocr-large-handwritten", "task": "image-to-text", "model_type": "vision-encoder-decoder", "group": "", "priority": "", "pass_count": 9, "confirmed_pass": 9, "all_confirmed_passed": false, "eps": [{"status": "PASS", "p50": 28.5, "elapsed": 9.0, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 68.0, "elapsed": 15.1, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 80.49, "elapsed": 18.7, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 17.33, "elapsed": 9.5, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 58.99, "elapsed": 62.1, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 276.0, "is_pending": false, "prev_status": "PASS", "fail_reason": "SA"}, {"status": "PASS", "p50": 55.14, "elapsed": 157.8, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 58.5, "elapsed": 268.2, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 72.0, "elapsed": 32.5, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 42.89, "elapsed": 317.5, "is_pending": false, "prev_status": null, "fail_reason": ""}]}, {"model": "mixedbread-ai/mxbai-rerank-xsmall-v1", "task": "text-classification", "model_type": "deberta-v2", "group": "", "priority": "", "pass_count": 9, "confirmed_pass": 9, "all_confirmed_passed": false, "eps": [{"status": "PASS", "p50": 38.06, "elapsed": 2.0, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 105.15, "elapsed": 2.1, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 148.25, "elapsed": 3.1, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 1.9, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "PASS", "p50": 34.85, "elapsed": 10.1, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 352.46, "elapsed": 14.9, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 339.84, "elapsed": 16.7, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 121.95, "elapsed": 1035.0, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 8.88, "elapsed": 11.8, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 44.37, "elapsed": 61.4, "is_pending": false, "prev_status": null, "fail_reason": ""}]}, {"model": "nvidia/segformer-b0-finetuned-ade-512-512", "task": "image-segmentation", "model_type": "segformer", "group": "", "priority": "", "pass_count": 9, "confirmed_pass": 9, "all_confirmed_passed": false, "eps": [{"status": "PASS", "p50": 20.61, "elapsed": 1.6, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 76.14, "elapsed": 1.7, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 58.25, "elapsed": 1.7, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 25.0, "is_pending": false, "prev_status": "FAIL", "fail_reason": "SA"}, {"status": "PASS", "p50": 19.72, "elapsed": 5.8, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 68.96, "elapsed": 4.4, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 16.09, "elapsed": 4.3, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 78.24, "elapsed": 131.2, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 18.1, "elapsed": 12.2, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 30.98, "elapsed": 194.8, "is_pending": false, "prev_status": null, "fail_reason": ""}]}, {"model": "nvidia/segformer-b0-finetuned-cityscapes-1024-1024", "task": "image-segmentation", "model_type": "segformer", "group": "", "priority": "", "pass_count": 9, "confirmed_pass": 9, "all_confirmed_passed": false, "eps": [{"status": "PASS", "p50": 19.19, "elapsed": 1.6, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 74.28, "elapsed": 1.7, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 56.03, "elapsed": 1.7, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 24.6, "is_pending": false, "prev_status": "FAIL", "fail_reason": "SA"}, {"status": "PASS", "p50": 21.25, "elapsed": 5.6, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 54.36, "elapsed": 4.3, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 14.88, "elapsed": 4.1, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 79.87, "elapsed": 129.8, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 23.15, "elapsed": 11.7, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 30.01, "elapsed": 174.3, "is_pending": false, "prev_status": null, "fail_reason": ""}]}, {"model": "nvidia/segformer-b1-finetuned-ade-512-512", "task": "image-segmentation", "model_type": "segformer", "group": "", "priority": "", "pass_count": 9, "confirmed_pass": 9, "all_confirmed_passed": false, "eps": [{"status": "PASS", "p50": 31.68, "elapsed": 1.8, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 110.43, "elapsed": 2.2, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 93.5, "elapsed": 2.2, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 45.1, "is_pending": false, "prev_status": "FAIL", "fail_reason": "SA"}, {"status": "PASS", "p50": 20.79, "elapsed": 6.9, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 86.78, "elapsed": 7.9, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 20.05, "elapsed": 5.2, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 112.53, "elapsed": 176.0, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 18.9, "elapsed": 12.4, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 47.57, "elapsed": 210.2, "is_pending": false, "prev_status": null, "fail_reason": ""}]}, {"model": "nvidia/segformer-b2-finetuned-ade-512-512", "task": "image-segmentation", "model_type": "segformer", "group": "", "priority": "", "pass_count": 9, "confirmed_pass": 9, "all_confirmed_passed": false, "eps": [{"status": "PASS", "p50": 80.04, "elapsed": 2.5, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 382.64, "elapsed": 5.6, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 334.94, "elapsed": 5.4, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 51.3, "is_pending": false, "prev_status": "FAIL", "fail_reason": "SA"}, {"status": "PASS", "p50": 58.13, "elapsed": 19.4, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 356.7, "elapsed": 12.1, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 42.86, "elapsed": 12.8, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 365.59, "elapsed": 233.6, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 24.75, "elapsed": 16.3, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 127.26, "elapsed": 684.2, "is_pending": false, "prev_status": null, "fail_reason": ""}]}, {"model": "obi/deid_roberta_i2b2", "task": "token-classification", "model_type": "roberta", "group": "", "priority": "", "pass_count": 9, "confirmed_pass": 9, "all_confirmed_passed": false, "eps": [{"status": "PASS", "p50": 138.19, "elapsed": 5.3, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 616.88, "elapsed": 10.0, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 794.83, "elapsed": 13.1, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 30.96, "elapsed": 5.1, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 66.23, "elapsed": 62.2, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 306.84, "elapsed": 65.5, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 323.6, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 186.2, "elapsed": 182.9, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 11.4, "elapsed": 18.7, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 236.27, "elapsed": 103.0, "is_pending": false, "prev_status": null, "fail_reason": ""}]}, {"model": "oliverguhr/fullstop-punctuation-multilang-large", "task": "token-classification", "model_type": "xlm-roberta", "group": "", "priority": "", "pass_count": 9, "confirmed_pass": 9, "all_confirmed_passed": false, "eps": [{"status": "PASS", "p50": 137.31, "elapsed": 6.1, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 626.92, "elapsed": 10.2, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 802.82, "elapsed": 14.1, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 31.67, "elapsed": 8.3, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 66.63, "elapsed": 64.2, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 330.03, "elapsed": 67.5, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 426.3, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 181.66, "elapsed": 192.0, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 11.18, "elapsed": 20.1, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "PASS", "p50": 242.38, "elapsed": 102.9, "is_pending": false, "prev_status": null, "fail_reason": ""}]}, {"model": "openai/clip-vit-base-patch16", "task": "zero-shot-image-classification", "model_type": "clip", "group": "", "priority": "", "pass_count": 9, "confirmed_pass": 9, "all_confirmed_passed": false, "eps": [{"status": "PASS", "p50": 18.36, "elapsed": 3.3, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 67.08, "elapsed": 2.9, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 80.25, "elapsed": 3.8, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 6.8, "elapsed": 3.5, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 15.58, "elapsed": 13.6, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 42.15, "elapsed": 25.1, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 418.8, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 25.61, "elapsed": 132.5, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "PASS", "p50": 14.86, "elapsed": 17.9, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 27.08, "elapsed": 94.6, "is_pending": false, "prev_status": null, "fail_reason": ""}]}, {"model": "openai/clip-vit-large-patch14", "task": "zero-shot-image-classification", "model_type": "clip", "group": "", "priority": "", "pass_count": 9, "confirmed_pass": 9, "all_confirmed_passed": false, "eps": [{"status": "PASS", "p50": 78.89, "elapsed": 5.5, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 286.91, "elapsed": 6.7, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 385.96, "elapsed": 9.3, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 17.65, "elapsed": 6.1, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 50.44, "elapsed": 39.1, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 137.69, "elapsed": 76.4, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 270.1, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 93.86, "elapsed": 229.2, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 10.34, "elapsed": 26.1, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "PASS", "p50": 133.24, "elapsed": 162.3, "is_pending": false, "prev_status": null, "fail_reason": ""}]}, {"model": "openai/clip-vit-large-patch14-336", "task": "zero-shot-image-classification", "model_type": "clip", "group": "", "priority": "", "pass_count": 9, "confirmed_pass": 9, "all_confirmed_passed": false, "eps": [{"status": "PASS", "p50": 198.04, "elapsed": 6.9, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 683.04, "elapsed": 11.4, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 877.82, "elapsed": 15.3, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 33.64, "elapsed": 6.3, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 116.65, "elapsed": 51.1, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 362.73, "elapsed": 88.8, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 282.6, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 205.98, "elapsed": 240.3, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 21.73, "elapsed": 26.7, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 265.87, "elapsed": 191.2, "is_pending": false, "prev_status": null, "fail_reason": ""}]}, {"model": "sentence-transformers/paraphrase-multilingual-mpnet-base-v2", "task": "feature-extraction", "model_type": "xlm-roberta", "group": "", "priority": "", "pass_count": 9, "confirmed_pass": 9, "all_confirmed_passed": false, "eps": [{"status": "PASS", "p50": 47.2, "elapsed": 3.5, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "PASS", "p50": 184.53, "elapsed": 3.8, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 233.28, "elapsed": 5.3, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 10.42, "elapsed": 4.8, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 25.07, "elapsed": 16.5, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 104.86, "elapsed": 22.1, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 219.6, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 63.82, "elapsed": 112.3, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 5.29, "elapsed": 10.5, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 77.11, "elapsed": 59.8, "is_pending": false, "prev_status": null, "fail_reason": ""}]}, {"model": "MoritzLaurer/DeBERTa-v3-large-mnli-fever-anli-ling-wanli", "task": "zero-shot-classification", "model_type": "deberta-v2", "group": "", "priority": "", "pass_count": 8, "confirmed_pass": 8, "all_confirmed_passed": false, "eps": [{"status": "PASS", "p50": 261.3, "elapsed": 7.9, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 855.97, "elapsed": 13.3, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 1228.14, "elapsed": 19.3, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 5.6, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "PASS", "p50": 202.12, "elapsed": 61.6, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 1121.38, "elapsed": 70.7, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 1755.01, "elapsed": 82.8, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 3600.4, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 15.24, "elapsed": 24.7, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "PASS", "p50": 342.96, "elapsed": 146.7, "is_pending": false, "prev_status": null, "fail_reason": ""}]}, {"model": "MoritzLaurer/deberta-v3-large-zeroshot-v2.0", "task": "zero-shot-classification", "model_type": "deberta-v2", "group": "", "priority": "", "pass_count": 8, "confirmed_pass": 8, "all_confirmed_passed": false, "eps": [{"status": "PASS", "p50": 264.97, "elapsed": 7.8, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 854.5, "elapsed": 13.0, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 1232.21, "elapsed": 19.2, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 5.7, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "PASS", "p50": 194.47, "elapsed": 60.4, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 1391.71, "elapsed": 104.1, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 1795.25, "elapsed": 85.3, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 3600.4, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 15.18, "elapsed": 22.1, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "PASS", "p50": 331.98, "elapsed": 144.1, "is_pending": false, "prev_status": null, "fail_reason": ""}]}, {"model": "PekingU/rtdetr_r101vd_coco_o365", "task": "object-detection", "model_type": "rt_detr", "group": "", "priority": "", "pass_count": 8, "confirmed_pass": 8, "all_confirmed_passed": false, "eps": [{"status": "PASS", "p50": 109.49, "elapsed": 3.5, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "PASS", "p50": 481.59, "elapsed": 7.4, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 603.73, "elapsed": 9.3, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 178.9, "is_pending": false, "prev_status": "FAIL", "fail_reason": "SA"}, {"status": "PASS", "p50": 572.47, "elapsed": 15.4, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 596.8, "is_pending": false, "prev_status": "PASS", "fail_reason": "SA"}, {"status": "PASS", "p50": 126.16, "elapsed": 31.8, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 267.26, "elapsed": 1406.4, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 24.82, "elapsed": 21.4, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "PASS", "p50": 204.86, "elapsed": 729.4, "is_pending": false, "prev_status": null, "fail_reason": ""}]}, {"model": "PekingU/rtdetr_r50vd_coco_o365", "task": "object-detection", "model_type": "rt_detr", "group": "", "priority": "", "pass_count": 8, "confirmed_pass": 8, "all_confirmed_passed": false, "eps": [{"status": "PASS", "p50": 64.18, "elapsed": 2.6, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "PASS", "p50": 315.64, "elapsed": 5.0, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 331.12, "elapsed": 5.7, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 105.0, "is_pending": false, "prev_status": "FAIL", "fail_reason": "SA"}, {"status": "PASS", "p50": 309.68, "elapsed": 10.5, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 368.7, "is_pending": false, "prev_status": "PASS", "fail_reason": "SA"}, {"status": "PASS", "p50": 108.58, "elapsed": 21.8, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 189.95, "elapsed": 1755.5, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 13.46, "elapsed": 19.2, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 144.59, "elapsed": 546.1, "is_pending": false, "prev_status": null, "fail_reason": ""}]}, {"model": "Salesforce/blip-image-captioning-base", "task": "image-to-text", "model_type": "blip", "group": "", "priority": "", "pass_count": 8, "confirmed_pass": 8, "all_confirmed_passed": false, "eps": [{"status": "PASS", "p50": 19.32, "elapsed": 5.1, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 42.65, "elapsed": 5.4, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 50.23, "elapsed": 8.8, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 16.8, "elapsed": 4.9, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 49.85, "elapsed": 25.9, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 409.9, "is_pending": false, "prev_status": "FAIL", "fail_reason": "SA"}, {"status": "FAIL", "p50": null, "elapsed": 71.9, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 35.45, "elapsed": 282.8, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "PASS", "p50": 53.86, "elapsed": 26.5, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "PASS", "p50": 41.77, "elapsed": 189.5, "is_pending": false, "prev_status": null, "fail_reason": ""}]}, {"model": "Zigeng/SlimSAM-uniform-77", "task": "mask-generation", "model_type": "sam", "group": "", "priority": "", "pass_count": 8, "confirmed_pass": 8, "all_confirmed_passed": false, "eps": [{"status": "PASS", "p50": 9.53, "elapsed": 1.7, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 23.92, "elapsed": 1.1, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 20.84, "elapsed": 1.3, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 46.0, "is_pending": false, "prev_status": "FAIL", "fail_reason": "SA"}, {"status": "PASS", "p50": 11.84, "elapsed": 4.0, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 3.0, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 26.82, "elapsed": 9.0, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 20.8, "elapsed": 33.8, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "PASS", "p50": 23.42, "elapsed": 12.1, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 9.81, "elapsed": 102.8, "is_pending": false, "prev_status": null, "fail_reason": ""}]}, {"model": "buildborderless/CommunityForensics-DeepfakeDet-ViT", "task": "image-classification", "model_type": "vit", "group": "", "priority": "", "pass_count": 8, "confirmed_pass": 8, "all_confirmed_passed": false, "eps": [{"status": "PASS", "p50": 33.55, "elapsed": 1.8, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 101.61, "elapsed": 2.1, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 123.26, "elapsed": 2.6, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 6.28, "elapsed": 1.4, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 50.8, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "PASS", "p50": 81.4, "elapsed": 7.7, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 420.2, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "PASS", "p50": 51.96, "elapsed": 74.8, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "PASS", "p50": 22.48, "elapsed": 9.3, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 40.03, "elapsed": 49.7, "is_pending": false, "prev_status": null, "fail_reason": ""}]}, {"model": "facebook/bart-large-cnn", "task": "summarization", "model_type": "bart", "group": "", "priority": "", "pass_count": 8, "confirmed_pass": 8, "all_confirmed_passed": false, "eps": [{"status": "PASS", "p50": 39.15, "elapsed": 7.9, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "PASS", "p50": 114.92, "elapsed": 13.6, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 151.24, "elapsed": 17.0, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 25.97, "elapsed": 8.4, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 434.62, "elapsed": 56.0, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 313.0, "is_pending": false, "prev_status": "FAIL", "fail_reason": "SA"}, {"status": "PASS", "p50": 66.14, "elapsed": 79.5, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 102.31, "elapsed": 323.1, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 10.8, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 60.85, "elapsed": 321.7, "is_pending": false, "prev_status": null, "fail_reason": ""}]}, {"model": "facebook/nougat-base", "task": "image-to-text", "model_type": "vision-encoder-decoder", "group": "", "priority": "", "pass_count": 8, "confirmed_pass": 8, "all_confirmed_passed": false, "eps": [{"status": "PASS", "p50": 53.01, "elapsed": 7.6, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 75.91, "elapsed": 13.3, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 113.45, "elapsed": 16.0, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 48.49, "elapsed": 8.2, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 115.5, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 318.2, "is_pending": false, "prev_status": "PASS", "fail_reason": "SA"}, {"status": "PASS", "p50": 349.73, "elapsed": 429.3, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 81.12, "elapsed": 1389.2, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 439.35, "elapsed": 43.6, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "PASS", "p50": 68.96, "elapsed": 463.2, "is_pending": false, "prev_status": null, "fail_reason": ""}]}, {"model": "facebook/sam-vit-base", "task": "mask-generation", "model_type": "sam", "group": "", "priority": "", "pass_count": 8, "confirmed_pass": 8, "all_confirmed_passed": false, "eps": [{"status": "PASS", "p50": 9.4, "elapsed": 1.6, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 22.82, "elapsed": 1.1, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 20.81, "elapsed": 1.3, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 42.3, "is_pending": false, "prev_status": "FAIL", "fail_reason": "SA"}, {"status": "PASS", "p50": 11.53, "elapsed": 4.0, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 3.9, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 29.95, "elapsed": 10.7, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 29.33, "elapsed": 54.1, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "PASS", "p50": 23.47, "elapsed": 12.2, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 11.66, "elapsed": 112.9, "is_pending": false, "prev_status": null, "fail_reason": ""}]}, {"model": "facebook/sam-vit-huge", "task": "mask-generation", "model_type": "sam", "group": "", "priority": "", "pass_count": 8, "confirmed_pass": 8, "all_confirmed_passed": false, "eps": [{"status": "PASS", "p50": 9.9, "elapsed": 1.6, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 23.88, "elapsed": 2.5, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 20.42, "elapsed": 1.3, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 61.6, "is_pending": false, "prev_status": "FAIL", "fail_reason": "SA"}, {"status": "PASS", "p50": 11.51, "elapsed": 4.1, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 2.9, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 25.03, "elapsed": 8.3, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 30.83, "elapsed": 56.2, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "PASS", "p50": 23.47, "elapsed": 11.1, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 10.3, "elapsed": 113.3, "is_pending": false, "prev_status": null, "fail_reason": ""}]}, {"model": "facebook/sam-vit-large", "task": "mask-generation", "model_type": "sam", "group": "", "priority": "", "pass_count": 8, "confirmed_pass": 8, "all_confirmed_passed": false, "eps": [{"status": "PASS", "p50": 9.65, "elapsed": 1.6, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 23.07, "elapsed": 1.1, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 20.27, "elapsed": 1.3, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 50.2, "is_pending": false, "prev_status": "FAIL", "fail_reason": "SA"}, {"status": "PASS", "p50": 11.09, "elapsed": 4.0, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 2.9, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 27.2, "elapsed": 8.4, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 31.87, "elapsed": 53.1, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "PASS", "p50": 23.81, "elapsed": 16.6, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 10.09, "elapsed": 111.6, "is_pending": false, "prev_status": null, "fail_reason": ""}]}, {"model": "facebook/sam2-hiera-large", "task": "mask-generation", "model_type": "sam2_video", "group": "", "priority": "", "pass_count": 8, "confirmed_pass": 8, "all_confirmed_passed": false, "eps": [{"status": "PASS", "p50": 18.44, "elapsed": 1.8, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 31.77, "elapsed": 1.3, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 31.34, "elapsed": 1.5, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 52.6, "is_pending": false, "prev_status": "FAIL", "fail_reason": "SA"}, {"status": "PASS", "p50": 17.49, "elapsed": 4.8, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 147.5, "is_pending": false, "prev_status": "PASS", "fail_reason": "SA"}, {"status": "PASS", "p50": 34.92, "elapsed": 8.2, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 42.68, "elapsed": 72.1, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 131.26, "elapsed": 13.5, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 17.73, "elapsed": 371.5, "is_pending": false, "prev_status": null, "fail_reason": ""}]}, {"model": "facebook/sam2.1-hiera-large", "task": "mask-generation", "model_type": "sam2_video", "group": "", "priority": "", "pass_count": 8, "confirmed_pass": 8, "all_confirmed_passed": false, "eps": [{"status": "PASS", "p50": 18.58, "elapsed": 1.8, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 31.81, "elapsed": 1.3, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 31.78, "elapsed": 1.5, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 47.4, "is_pending": false, "prev_status": "FAIL", "fail_reason": "SA"}, {"status": "PASS", "p50": 19.51, "elapsed": 4.9, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 148.9, "is_pending": false, "prev_status": "PASS", "fail_reason": "SA"}, {"status": "PASS", "p50": 34.03, "elapsed": 7.6, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 43.37, "elapsed": 71.5, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 131.17, "elapsed": 13.7, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 17.28, "elapsed": 372.0, "is_pending": false, "prev_status": null, "fail_reason": ""}]}, {"model": "flaviagiammarino/medsam-vit-base", "task": "mask-generation", "model_type": "sam", "group": "", "priority": "", "pass_count": 8, "confirmed_pass": 8, "all_confirmed_passed": false, "eps": [{"status": "PASS", "p50": 9.43, "elapsed": 1.6, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 23.23, "elapsed": 1.1, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 20.55, "elapsed": 1.3, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 44.6, "is_pending": false, "prev_status": "FAIL", "fail_reason": "SA"}, {"status": "PASS", "p50": 11.65, "elapsed": 4.2, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 2.8, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 27.45, "elapsed": 8.6, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 20.65, "elapsed": 34.4, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "PASS", "p50": 23.36, "elapsed": 11.3, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 10.57, "elapsed": 100.3, "is_pending": false, "prev_status": null, "fail_reason": ""}]}, {"model": "google-t5/t5-base", "task": "summarization", "model_type": "t5", "group": "", "priority": "", "pass_count": 8, "confirmed_pass": 8, "all_confirmed_passed": false, "eps": [{"status": "PASS", "p50": 11.74, "elapsed": 4.0, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 14.33, "elapsed": 2.5, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 10.97, "elapsed": 3.7, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 18.95, "elapsed": 4.9, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 17.1, "elapsed": 20.4, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 208.3, "is_pending": false, "prev_status": "PASS", "fail_reason": "SA"}, {"status": "PASS", "p50": 10.03, "elapsed": 22.9, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 16.61, "elapsed": 143.5, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 108.4, "is_pending": false, "prev_status": "PASS", "fail_reason": "SA"}, {"status": "PASS", "p50": 18.2, "elapsed": 74.8, "is_pending": false, "prev_status": null, "fail_reason": ""}]}, {"model": "google-t5/t5-base", "task": "translation", "model_type": "t5", "group": "", "priority": "", "pass_count": 8, "confirmed_pass": 8, "all_confirmed_passed": false, "eps": [{"status": "PASS", "p50": 12.45, "elapsed": 3.9, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 14.27, "elapsed": 2.5, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 10.88, "elapsed": 3.6, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 18.26, "elapsed": 4.7, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 15.69, "elapsed": 20.0, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 211.8, "is_pending": false, "prev_status": "PASS", "fail_reason": "SA"}, {"status": "PASS", "p50": 9.99, "elapsed": 22.1, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 16.53, "elapsed": 126.4, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 98.9, "is_pending": false, "prev_status": "PASS", "fail_reason": "SA"}, {"status": "PASS", "p50": 18.46, "elapsed": 71.7, "is_pending": false, "prev_status": null, "fail_reason": ""}]}, {"model": "google-t5/t5-large", "task": "summarization", "model_type": "t5", "group": "", "priority": "", "pass_count": 8, "confirmed_pass": 8, "all_confirmed_passed": false, "eps": [{"status": "PASS", "p50": 40.83, "elapsed": 8.3, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 44.52, "elapsed": 7.5, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 34.37, "elapsed": 8.4, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 31.94, "elapsed": 11.3, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 15.35, "elapsed": 13.5, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 477.4, "is_pending": false, "prev_status": "PASS", "fail_reason": "SA"}, {"status": "PASS", "p50": 74.51, "elapsed": 117.7, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 41.5, "elapsed": 59.1, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 237.8, "is_pending": false, "prev_status": "PASS", "fail_reason": "SA"}, {"status": "PASS", "p50": 45.47, "elapsed": 134.8, "is_pending": false, "prev_status": null, "fail_reason": ""}]}, {"model": "google-t5/t5-small", "task": "summarization", "model_type": "t5", "group": "", "priority": "", "pass_count": 8, "confirmed_pass": 8, "all_confirmed_passed": false, "eps": [{"status": "PASS", "p50": 3.96, "elapsed": 2.8, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 5.47, "elapsed": 1.8, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 3.52, "elapsed": 2.3, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 5.33, "elapsed": 2.9, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 7.97, "elapsed": 8.3, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 137.7, "is_pending": false, "prev_status": "PASS", "fail_reason": "SA"}, {"status": "PASS", "p50": 8.15, "elapsed": 11.2, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 8.49, "elapsed": 151.4, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 73.5, "is_pending": false, "prev_status": "PASS", "fail_reason": "SA"}, {"status": "PASS", "p50": 6.0, "elapsed": 44.6, "is_pending": false, "prev_status": null, "fail_reason": ""}]}, {"model": "google-t5/t5-small", "task": "translation", "model_type": "t5", "group": "", "priority": "", "pass_count": 8, "confirmed_pass": 8, "all_confirmed_passed": false, "eps": [{"status": "PASS", "p50": 3.99, "elapsed": 2.8, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 5.29, "elapsed": 1.8, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 3.36, "elapsed": 2.2, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 5.12, "elapsed": 2.9, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 8.23, "elapsed": 8.2, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 128.8, "is_pending": false, "prev_status": "PASS", "fail_reason": "SA"}, {"status": "PASS", "p50": 10.1, "elapsed": 12.1, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 8.63, "elapsed": 153.1, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 64.8, "is_pending": false, "prev_status": "PASS", "fail_reason": "SA"}, {"status": "PASS", "p50": 6.05, "elapsed": 43.1, "is_pending": false, "prev_status": null, "fail_reason": ""}]}, {"model": "google/flan-t5-base", "task": "", "model_type": "t5", "group": "", "priority": "", "pass_count": 8, "confirmed_pass": 8, "all_confirmed_passed": false, "eps": [{"status": "PASS", "p50": 11.9, "elapsed": 2.4, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 14.66, "elapsed": 1.6, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 10.87, "elapsed": 2.3, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 16.61, "elapsed": 3.1, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 17.72, "elapsed": 14.3, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 224.3, "is_pending": false, "prev_status": "PASS", "fail_reason": "SA"}, {"status": "PASS", "p50": 24.64, "elapsed": 16.1, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 15.02, "elapsed": 20.1, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 96.6, "is_pending": false, "prev_status": "PASS", "fail_reason": "SA"}, {"status": "PASS", "p50": 30.92, "elapsed": 59.1, "is_pending": false, "prev_status": null, "fail_reason": ""}]}, {"model": "google/flan-t5-base", "task": "summarization", "model_type": "t5", "group": "", "priority": "", "pass_count": 8, "confirmed_pass": 8, "all_confirmed_passed": false, "eps": [{"status": "PASS", "p50": 11.82, "elapsed": 3.9, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 15.32, "elapsed": 2.5, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 10.9, "elapsed": 3.6, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 17.86, "elapsed": 4.7, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 16.8, "elapsed": 22.8, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 228.0, "is_pending": false, "prev_status": "PASS", "fail_reason": "SA"}, {"status": "PASS", "p50": 14.18, "elapsed": 25.0, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 15.49, "elapsed": 99.5, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 95.6, "is_pending": false, "prev_status": "PASS", "fail_reason": "SA"}, {"status": "PASS", "p50": 17.85, "elapsed": 77.5, "is_pending": false, "prev_status": null, "fail_reason": ""}]}, {"model": "google/flan-t5-base", "task": "translation", "model_type": "t5", "group": "", "priority": "", "pass_count": 8, "confirmed_pass": 8, "all_confirmed_passed": false, "eps": [{"status": "PASS", "p50": 11.83, "elapsed": 4.0, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 15.14, "elapsed": 2.5, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 10.89, "elapsed": 3.7, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 18.59, "elapsed": 4.8, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 16.44, "elapsed": 22.8, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 226.2, "is_pending": false, "prev_status": "PASS", "fail_reason": "SA"}, {"status": "PASS", "p50": 15.32, "elapsed": 24.5, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 14.59, "elapsed": 99.6, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 96.2, "is_pending": false, "prev_status": "PASS", "fail_reason": "SA"}, {"status": "PASS", "p50": 17.45, "elapsed": 78.4, "is_pending": false, "prev_status": null, "fail_reason": ""}]}, {"model": "google/siglip-base-patch16-224", "task": "zero-shot-image-classification", "model_type": "siglip", "group": "", "priority": "", "pass_count": 8, "confirmed_pass": 8, "all_confirmed_passed": false, "eps": [{"status": "PASS", "p50": 25.41, "elapsed": 4.1, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 72.58, "elapsed": 3.4, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 87.84, "elapsed": 4.3, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 3.7, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "PASS", "p50": 15.69, "elapsed": 17.5, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 3600.2, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 7.85, "elapsed": 23.7, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 47.69, "elapsed": 761.4, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 15.19, "elapsed": 18.2, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 32.56, "elapsed": 78.9, "is_pending": false, "prev_status": null, "fail_reason": ""}]}, {"model": "google/siglip-so400m-patch14-384", "task": "zero-shot-image-classification", "model_type": "siglip", "group": "", "priority": "", "pass_count": 8, "confirmed_pass": 8, "all_confirmed_passed": false, "eps": [{"status": "PASS", "p50": 476.27, "elapsed": 14.2, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 1310.13, "elapsed": 27.7, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 1614.56, "elapsed": 29.1, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 9.7, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "PASS", "p50": 203.93, "elapsed": 101.3, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 3600.2, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 623.43, "elapsed": 231.7, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 557.28, "elapsed": 1510.9, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "PASS", "p50": 32.25, "elapsed": 44.0, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "PASS", "p50": 431.34, "elapsed": 212.0, "is_pending": false, "prev_status": null, "fail_reason": ""}]}, {"model": "kha-white/manga-ocr-base", "task": "image-to-text", "model_type": "vision-encoder-decoder", "group": "", "priority": "", "pass_count": 8, "confirmed_pass": 8, "all_confirmed_passed": false, "eps": [{"status": "PASS", "p50": 2.55, "elapsed": 3.1, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 4.22, "elapsed": 2.7, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 4.06, "elapsed": 3.3, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 2.92, "elapsed": 3.0, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 15.13, "elapsed": 10.7, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 74.6, "is_pending": false, "prev_status": "PASS", "fail_reason": "SA"}, {"status": "FAIL", "p50": null, "elapsed": 31.0, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 3.01, "elapsed": 108.1, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "PASS", "p50": 9.81, "elapsed": 16.4, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 4.52, "elapsed": 80.0, "is_pending": false, "prev_status": null, "fail_reason": ""}]}, {"model": "microsoft/trocr-large-printed", "task": "image-to-text", "model_type": "vision-encoder-decoder", "group": "", "priority": "", "pass_count": 8, "confirmed_pass": 8, "all_confirmed_passed": false, "eps": [{"status": "PASS", "p50": 32.7, "elapsed": 9.2, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 71.01, "elapsed": 14.9, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 82.99, "elapsed": 18.6, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 21.89, "elapsed": 9.5, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 445.49, "elapsed": 66.9, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 276.8, "is_pending": false, "prev_status": "PASS", "fail_reason": "SA"}, {"status": "FAIL", "p50": null, "elapsed": 600.6, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 62.27, "elapsed": 267.4, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 136.79, "elapsed": 32.5, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "PASS", "p50": 56.21, "elapsed": 314.9, "is_pending": false, "prev_status": null, "fail_reason": ""}]}, {"model": "naver-clova-ix/donut-base-finetuned-cord-v2", "task": "image-to-text", "model_type": "vision-encoder-decoder", "group": "", "priority": "", "pass_count": 8, "confirmed_pass": 8, "all_confirmed_passed": false, "eps": [{"status": "PASS", "p50": 16.83, "elapsed": 9.3, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 44.45, "elapsed": 22.5, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 58.04, "elapsed": 25.3, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 8.44, "elapsed": 7.8, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 113.71, "elapsed": 140.1, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 173.1, "is_pending": false, "prev_status": "FAIL", "fail_reason": "SA"}, {"status": "FAIL", "p50": null, "elapsed": 242.0, "is_pending": false, "prev_status": null, "fail_reason": ""}, {"status": "PASS", "p50": 16.68, "elapsed": 340.7, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 41.16, "elapsed": 26.5, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 23.24, "elapsed": 720.2, "is_pending": false, "prev_status": null, "fail_reason": ""}]}, {"model": "nvidia/segformer-b5-finetuned-ade-640-640", "task": "image-segmentation", "model_type": "segformer", "group": "", "priority": "", "pass_count": 8, "confirmed_pass": 8, "all_confirmed_passed": false, "eps": [{"status": "PASS", "p50": 243.22, "elapsed": 5.2, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 922.38, "elapsed": 12.5, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 941.43, "elapsed": 14.2, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 122.6, "is_pending": false, "prev_status": "FAIL", "fail_reason": "SA"}, {"status": "PASS", "p50": 166.39, "elapsed": 87.5, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 5820.37, "elapsed": 107.3, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 296.6, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 887.77, "elapsed": 603.7, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 44.02, "elapsed": 44.8, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "PASS", "p50": 346.61, "elapsed": 1194.0, "is_pending": false, "prev_status": null, "fail_reason": ""}]}, {"model": "timpal0l/mdeberta-v3-base-squad2", "task": "question-answering", "model_type": "deberta-v2", "group": "", "priority": "", "pass_count": 8, "confirmed_pass": 8, "all_confirmed_passed": false, "eps": [{"status": "PASS", "p50": 91.84, "elapsed": 4.5, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 271.99, "elapsed": 4.9, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 395.6, "elapsed": 7.6, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 4.8, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "PASS", "p50": 70.92, "elapsed": 20.1, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 561.68, "elapsed": 34.7, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 230.4, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 272.41, "elapsed": 1957.8, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 33.58, "elapsed": 16.4, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "PASS", "p50": 111.43, "elapsed": 92.7, "is_pending": false, "prev_status": null, "fail_reason": ""}]}, {"model": "wanglab/medsam-vit-base", "task": "mask-generation", "model_type": "sam", "group": "", "priority": "", "pass_count": 8, "confirmed_pass": 8, "all_confirmed_passed": false, "eps": [{"status": "PASS", "p50": 10.16, "elapsed": 1.6, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 23.02, "elapsed": 1.1, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 20.87, "elapsed": 1.3, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 43.7, "is_pending": false, "prev_status": "FAIL", "fail_reason": "SA"}, {"status": "PASS", "p50": 11.32, "elapsed": 4.0, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 3.7, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 28.26, "elapsed": 8.1, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 27.71, "elapsed": 36.0, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "PASS", "p50": 23.36, "elapsed": 11.6, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 10.93, "elapsed": 133.2, "is_pending": false, "prev_status": null, "fail_reason": ""}]}, {"model": "PekingU/rtdetr_v2_r18vd", "task": "object-detection", "model_type": "rt_detr_v2", "group": "", "priority": "", "pass_count": 7, "confirmed_pass": 7, "all_confirmed_passed": false, "eps": [{"status": "PASS", "p50": 30.3, "elapsed": 2.0, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 134.33, "elapsed": 2.6, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 148.19, "elapsed": 3.1, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 73.3, "is_pending": false, "prev_status": "FAIL", "fail_reason": "SA"}, {"status": "PASS", "p50": 134.81, "elapsed": 5.4, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 267.3, "is_pending": false, "prev_status": "PASS", "fail_reason": "SA"}, {"status": "PASS", "p50": 44.83, "elapsed": 21.3, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 104.91, "elapsed": 1510.5, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 23.45, "elapsed": 14.2, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 21.1, "is_pending": false, "prev_status": null, "fail_reason": ""}]}, {"model": "facebook/detr-resnet-50", "task": "feature-extraction", "model_type": "detr", "group": "", "priority": "", "pass_count": 7, "confirmed_pass": 7, "all_confirmed_passed": false, "eps": [{"status": "PASS", "p50": 67.29, "elapsed": 2.4, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 200.94, "elapsed": 3.5, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 268.49, "elapsed": 4.7, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 1.9, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 101.0, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "PASS", "p50": 198.51, "elapsed": 17.3, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 132.3, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "PASS", "p50": 87.7, "elapsed": 757.1, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "PASS", "p50": 17.06, "elapsed": 18.6, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "PASS", "p50": 77.66, "elapsed": 432.1, "is_pending": false, "prev_status": null, "fail_reason": ""}]}, {"model": "facebook/sam2.1-hiera-small", "task": "mask-generation", "model_type": "sam2_video", "group": "", "priority": "", "pass_count": 7, "confirmed_pass": 7, "all_confirmed_passed": false, "eps": [{"status": "PASS", "p50": 18.5, "elapsed": 1.8, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 32.09, "elapsed": 1.3, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 31.84, "elapsed": 1.6, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 37.0, "is_pending": false, "prev_status": "FAIL", "fail_reason": "SA"}, {"status": "PASS", "p50": 19.46, "elapsed": 4.8, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 135.8, "is_pending": false, "prev_status": "PASS", "fail_reason": "SA"}, {"status": "FAIL", "p50": null, "elapsed": 3419.4, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 43.43, "elapsed": 72.0, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 131.32, "elapsed": 12.2, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 17.47, "elapsed": 373.0, "is_pending": false, "prev_status": null, "fail_reason": ""}]}, {"model": "facebook/sam2.1-hiera-tiny", "task": "mask-generation", "model_type": "sam2_video", "group": "", "priority": "", "pass_count": 7, "confirmed_pass": 7, "all_confirmed_passed": false, "eps": [{"status": "PASS", "p50": 19.14, "elapsed": 1.9, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 32.58, "elapsed": 1.3, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 31.49, "elapsed": 1.5, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 37.2, "is_pending": false, "prev_status": "FAIL", "fail_reason": "SA"}, {"status": "PASS", "p50": 18.66, "elapsed": 5.0, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 131.9, "is_pending": false, "prev_status": "PASS", "fail_reason": "SA"}, {"status": "FAIL", "p50": null, "elapsed": 371.8, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 44.38, "elapsed": 72.2, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 131.26, "elapsed": 12.3, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 18.36, "elapsed": 371.1, "is_pending": false, "prev_status": null, "fail_reason": ""}]}, {"model": "microsoft/tapex-base", "task": "table-question-answering", "model_type": "bart", "group": "", "priority": "", "pass_count": 7, "confirmed_pass": 7, "all_confirmed_passed": false, "eps": [{"status": "PASS", "p50": 15.04, "elapsed": 4.3, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 34.02, "elapsed": 5.0, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 44.14, "elapsed": 6.3, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 10.81, "elapsed": 4.4, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 50.3, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 141.2, "is_pending": false, "prev_status": "FAIL", "fail_reason": "SA"}, {"status": "FAIL", "p50": null, "elapsed": 163.3, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "PASS", "p50": 19.48, "elapsed": 220.1, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "PASS", "p50": 55.09, "elapsed": 18.7, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 38.66, "elapsed": 177.5, "is_pending": false, "prev_status": null, "fail_reason": ""}]}, {"model": "microsoft/tapex-base-finetuned-wikisql", "task": "table-question-answering", "model_type": "bart", "group": "", "priority": "", "pass_count": 7, "confirmed_pass": 7, "all_confirmed_passed": false, "eps": [{"status": "PASS", "p50": 14.44, "elapsed": 4.3, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 33.93, "elapsed": 5.1, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 43.51, "elapsed": 6.3, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 10.35, "elapsed": 4.4, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 52.6, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 142.7, "is_pending": false, "prev_status": "FAIL", "fail_reason": "SA"}, {"status": "FAIL", "p50": null, "elapsed": 92.8, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "PASS", "p50": 17.26, "elapsed": 208.7, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "PASS", "p50": 55.21, "elapsed": 17.1, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 21.0, "elapsed": 172.5, "is_pending": false, "prev_status": null, "fail_reason": ""}]}, {"model": "microsoft/tapex-base-finetuned-wtq", "task": "table-question-answering", "model_type": "bart", "group": "", "priority": "", "pass_count": 7, "confirmed_pass": 7, "all_confirmed_passed": false, "eps": [{"status": "PASS", "p50": 15.16, "elapsed": 4.3, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 34.04, "elapsed": 5.0, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 43.72, "elapsed": 6.3, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 9.94, "elapsed": 4.3, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 52.0, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 142.4, "is_pending": false, "prev_status": "FAIL", "fail_reason": "SA"}, {"status": "FAIL", "p50": null, "elapsed": 131.2, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "PASS", "p50": 24.46, "elapsed": 208.6, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "PASS", "p50": 55.16, "elapsed": 17.3, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 21.59, "elapsed": 172.7, "is_pending": false, "prev_status": null, "fail_reason": ""}]}, {"model": "microsoft/tapex-large", "task": "table-question-answering", "model_type": "bart", "group": "", "priority": "", "pass_count": 7, "confirmed_pass": 7, "all_confirmed_passed": false, "eps": [{"status": "PASS", "p50": 39.54, "elapsed": 8.0, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 116.07, "elapsed": 13.8, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 152.17, "elapsed": 17.5, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 23.79, "elapsed": 10.5, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 81.8, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 248.1, "is_pending": false, "prev_status": "FAIL", "fail_reason": "SA"}, {"status": "FAIL", "p50": null, "elapsed": 180.8, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "PASS", "p50": 86.52, "elapsed": 289.9, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "PASS", "p50": 139.69, "elapsed": 27.0, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 65.62, "elapsed": 350.1, "is_pending": false, "prev_status": null, "fail_reason": ""}]}, {"model": "microsoft/tapex-large-finetuned-tabfact", "task": "table-question-answering", "model_type": "bart", "group": "", "priority": "", "pass_count": 7, "confirmed_pass": 7, "all_confirmed_passed": false, "eps": [{"status": "PASS", "p50": 39.35, "elapsed": 8.0, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 116.55, "elapsed": 13.5, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 152.64, "elapsed": 17.5, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 23.01, "elapsed": 8.1, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 83.9, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 268.1, "is_pending": false, "prev_status": "FAIL", "fail_reason": "SA"}, {"status": "FAIL", "p50": null, "elapsed": 193.8, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "PASS", "p50": 89.11, "elapsed": 289.0, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "PASS", "p50": 139.93, "elapsed": 26.3, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 69.25, "elapsed": 345.1, "is_pending": false, "prev_status": null, "fail_reason": ""}]}, {"model": "microsoft/tapex-large-finetuned-wikisql", "task": "table-question-answering", "model_type": "bart", "group": "", "priority": "", "pass_count": 7, "confirmed_pass": 7, "all_confirmed_passed": false, "eps": [{"status": "PASS", "p50": 39.52, "elapsed": 8.2, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 116.97, "elapsed": 13.5, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 152.72, "elapsed": 17.4, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 25.6, "elapsed": 8.0, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 84.9, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 267.3, "is_pending": false, "prev_status": "FAIL", "fail_reason": "SA"}, {"status": "FAIL", "p50": null, "elapsed": 154.2, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "PASS", "p50": 89.96, "elapsed": 292.3, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "PASS", "p50": 139.78, "elapsed": 26.1, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 77.78, "elapsed": 346.2, "is_pending": false, "prev_status": null, "fail_reason": ""}]}, {"model": "microsoft/tapex-large-finetuned-wtq", "task": "table-question-answering", "model_type": "bart", "group": "", "priority": "", "pass_count": 7, "confirmed_pass": 7, "all_confirmed_passed": false, "eps": [{"status": "PASS", "p50": 39.35, "elapsed": 8.1, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 118.25, "elapsed": 13.6, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 151.83, "elapsed": 17.5, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 23.35, "elapsed": 7.9, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 84.6, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 273.2, "is_pending": false, "prev_status": "FAIL", "fail_reason": "SA"}, {"status": "FAIL", "p50": null, "elapsed": 211.9, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "PASS", "p50": 89.71, "elapsed": 291.3, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "PASS", "p50": 139.77, "elapsed": 26.3, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "PASS", "p50": 76.39, "elapsed": 348.6, "is_pending": false, "prev_status": null, "fail_reason": ""}]}, {"model": "microsoft/tapex-large-sql-execution", "task": "table-question-answering", "model_type": "bart", "group": "", "priority": "", "pass_count": 7, "confirmed_pass": 7, "all_confirmed_passed": false, "eps": [{"status": "PASS", "p50": 39.55, "elapsed": 7.9, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 115.89, "elapsed": 13.4, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 152.26, "elapsed": 17.2, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 24.09, "elapsed": 8.1, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 84.0, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 261.7, "is_pending": false, "prev_status": "FAIL", "fail_reason": "SA"}, {"status": "FAIL", "p50": null, "elapsed": 319.8, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "PASS", "p50": 89.21, "elapsed": 289.7, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "PASS", "p50": 139.73, "elapsed": 28.3, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 74.84, "elapsed": 345.0, "is_pending": false, "prev_status": null, "fail_reason": ""}]}, {"model": "naver-clova-ix/donut-base", "task": "image-to-text", "model_type": "vision-encoder-decoder", "group": "", "priority": "", "pass_count": 7, "confirmed_pass": 7, "all_confirmed_passed": false, "eps": [{"status": "PASS", "p50": 39.21, "elapsed": 26.1, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 146.54, "elapsed": 86.5, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 218.81, "elapsed": 97.0, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 15.95, "elapsed": 16.7, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 209.1, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 174.1, "is_pending": false, "prev_status": "FAIL", "fail_reason": "SA"}, {"status": "FAIL", "p50": null, "elapsed": 353.6, "is_pending": false, "prev_status": null, "fail_reason": ""}, {"status": "PASS", "p50": 59.2, "elapsed": 666.0, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 94.08, "elapsed": 34.4, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 60.75, "elapsed": 2375.3, "is_pending": false, "prev_status": null, "fail_reason": ""}]}, {"model": "nlpconnect/vit-gpt2-image-captioning", "task": "image-to-text", "model_type": "vision-encoder-decoder", "group": "", "priority": "", "pass_count": 7, "confirmed_pass": 7, "all_confirmed_passed": false, "eps": [{"status": "PASS", "p50": 17.6, "elapsed": 4.4, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 25.74, "elapsed": 3.5, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 29.3, "elapsed": 5.0, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 19.28, "elapsed": 5.2, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 282.42, "elapsed": 25.0, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 208.2, "is_pending": false, "prev_status": "PASS", "fail_reason": "SA"}, {"status": "FAIL", "p50": null, "elapsed": 413.7, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 3659.3, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "PASS", "p50": 101.0, "elapsed": 24.6, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 27.88, "elapsed": 175.1, "is_pending": false, "prev_status": null, "fail_reason": ""}]}, {"model": "nvidia/segformer-b5-finetuned-cityscapes-1024-1024", "task": "image-segmentation", "model_type": "segformer", "group": "", "priority": "", "pass_count": 7, "confirmed_pass": 7, "all_confirmed_passed": false, "eps": [{"status": "PASS", "p50": 6278.61, "elapsed": 77.9, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "PASS", "p50": 3057.93, "elapsed": 38.6, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 2910.7, "elapsed": 38.2, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 136.4, "is_pending": false, "prev_status": "FAIL", "fail_reason": "SA"}, {"status": "FAIL", "p50": null, "elapsed": 331.8, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 3736.86, "elapsed": 84.4, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 1562.7, "is_pending": false, "prev_status": null, "fail_reason": ""}, {"status": "PASS", "p50": 2493.6, "elapsed": 824.0, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 93.27, "elapsed": 43.9, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "PASS", "p50": 1069.86, "elapsed": 3426.2, "is_pending": false, "prev_status": null, "fail_reason": ""}]}, {"model": "sshleifer/distilbart-cnn-12-6", "task": "summarization", "model_type": "bart", "group": "", "priority": "", "pass_count": 7, "confirmed_pass": 7, "all_confirmed_passed": false, "eps": [{"status": "PASS", "p50": 21.89, "elapsed": 7.3, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 58.92, "elapsed": 13.0, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 78.73, "elapsed": 15.7, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 12.28, "elapsed": 6.9, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 221.03, "elapsed": 44.8, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 218.6, "is_pending": false, "prev_status": "PASS", "fail_reason": "SA"}, {"status": "FAIL", "p50": null, "elapsed": 320.5, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 27.91, "elapsed": 286.2, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 11.4, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 38.31, "elapsed": 307.2, "is_pending": false, "prev_status": null, "fail_reason": ""}]}, {"model": "Intel/zoedepth-nyu-kitti", "task": "depth-estimation", "model_type": "zoedepth", "group": "", "priority": "", "pass_count": 6, "confirmed_pass": 6, "all_confirmed_passed": false, "eps": [{"status": "PASS", "p50": 320.12, "elapsed": 8.2, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 1151.83, "elapsed": 16.8, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 4.4, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 242.4, "is_pending": false, "prev_status": "FAIL", "fail_reason": "SA"}, {"status": "PASS", "p50": 220.12, "elapsed": 66.6, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 507.69, "elapsed": 57.4, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 96.5, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 3600.5, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "PASS", "p50": 31.61, "elapsed": 35.0, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "PASS", "p50": 575.87, "elapsed": 1151.9, "is_pending": false, "prev_status": null, "fail_reason": ""}]}, {"model": "Qwen/Qwen2.5-0.5B-Instruct", "task": "text-generation", "model_type": "qwen2", "group": "", "priority": "", "pass_count": 4, "confirmed_pass": 4, "all_confirmed_passed": false, "eps": [{"status": "PASS", "p50": 575.34, "elapsed": 12.4, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "PASS", "p50": 2122.02, "elapsed": 29.0, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 235.9, "is_pending": false, "prev_status": "FAIL", "fail_reason": "SA"}, {"status": "FAIL", "p50": null, "elapsed": 241.2, "is_pending": false, "prev_status": "FAIL", "fail_reason": "SA"}, {"status": "FAIL", "p50": null, "elapsed": 434.0, "is_pending": false, "prev_status": "FAIL", "fail_reason": "SA"}, {"status": "FAIL", "p50": null, "elapsed": 435.8, "is_pending": false, "prev_status": "FAIL", "fail_reason": "SA"}, {"status": "FAIL", "p50": null, "elapsed": 56.6, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 3600.5, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "PASS", "p50": 30.04, "elapsed": 23.5, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "PASS", "p50": 507.52, "elapsed": 210.2, "is_pending": false, "prev_status": null, "fail_reason": ""}]}, {"model": "openai-community/gpt2", "task": "text-generation", "model_type": "gpt2", "group": "", "priority": "", "pass_count": 4, "confirmed_pass": 4, "all_confirmed_passed": false, "eps": [{"status": "PASS", "p50": 167.17, "elapsed": 5.3, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 697.4, "elapsed": 9.6, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 61.2, "is_pending": false, "prev_status": "FAIL", "fail_reason": "SA"}, {"status": "FAIL", "p50": null, "elapsed": 61.7, "is_pending": false, "prev_status": "FAIL", "fail_reason": "SA"}, {"status": "FAIL", "p50": null, "elapsed": 59.2, "is_pending": false, "prev_status": "FAIL", "fail_reason": "SA"}, {"status": "FAIL", "p50": null, "elapsed": 184.5, "is_pending": false, "prev_status": "FAIL", "fail_reason": "SA"}, {"status": "FAIL", "p50": null, "elapsed": 8.6, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 3600.2, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "PASS", "p50": 10.54, "elapsed": 11.0, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 159.44, "elapsed": 106.6, "is_pending": false, "prev_status": null, "fail_reason": ""}]}, {"model": "trl-internal-testing/tiny-Qwen2ForCausalLM-2.5", "task": "text-generation", "model_type": "qwen2", "group": "", "priority": "", "pass_count": 4, "confirmed_pass": 4, "all_confirmed_passed": false, "eps": [{"status": "PASS", "p50": 7.56, "elapsed": 1.3, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 21.02, "elapsed": 1.0, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 23.8, "is_pending": false, "prev_status": "FAIL", "fail_reason": "SA"}, {"status": "FAIL", "p50": null, "elapsed": 23.3, "is_pending": false, "prev_status": "FAIL", "fail_reason": "SA"}, {"status": "FAIL", "p50": null, "elapsed": 23.0, "is_pending": false, "prev_status": "FAIL", "fail_reason": "SA"}, {"status": "FAIL", "p50": null, "elapsed": 80.0, "is_pending": false, "prev_status": "FAIL", "fail_reason": "SA"}, {"status": "FAIL", "p50": null, "elapsed": 1.8, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 3600.1, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "PASS", "p50": 1.18, "elapsed": 5.0, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "PASS", "p50": 4.32, "elapsed": 22.9, "is_pending": false, "prev_status": null, "fail_reason": ""}]}, {"model": "Qwen/Qwen2.5-1.5B-Instruct", "task": "text-generation", "model_type": "qwen2", "group": "", "priority": "", "pass_count": 2, "confirmed_pass": 2, "all_confirmed_passed": false, "eps": [{"status": "FAIL", "p50": null, "elapsed": 400.3, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 428.1, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 469.4, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 428.8, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 484.4, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 997.3, "is_pending": false, "prev_status": "FAIL", "fail_reason": "SA"}, {"status": "FAIL", "p50": null, "elapsed": 180.9, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 3601.5, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "PASS", "p50": 79.01, "elapsed": 44.5, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "PASS", "p50": 1663.33, "elapsed": 427.9, "is_pending": false, "prev_status": null, "fail_reason": ""}]}, {"model": "google-t5/t5-3b", "task": "summarization", "model_type": "t5", "group": "", "priority": "", "pass_count": 2, "confirmed_pass": 2, "all_confirmed_passed": false, "eps": [{"status": "FAIL", "p50": null, "elapsed": 367.4, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 494.0, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 558.1, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 395.3, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 475.8, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 775.8, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 669.3, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "PASS", "p50": 169.63, "elapsed": 166.9, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 1030.0, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "PASS", "p50": 153.31, "elapsed": 227.9, "is_pending": false, "prev_status": null, "fail_reason": ""}]}, {"model": "google-t5/t5-3b", "task": "translation", "model_type": "t5", "group": "", "priority": "", "pass_count": 2, "confirmed_pass": 2, "all_confirmed_passed": false, "eps": [{"status": "FAIL", "p50": null, "elapsed": 501.5, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 386.4, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 395.4, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 385.4, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 512.8, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 817.9, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 659.9, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "PASS", "p50": 172.12, "elapsed": 156.2, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 1166.8, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "PASS", "p50": 153.39, "elapsed": 214.6, "is_pending": false, "prev_status": null, "fail_reason": ""}]}, {"model": "google/madlad400-3b-mt", "task": "translation", "model_type": "t5", "group": "", "priority": "", "pass_count": 2, "confirmed_pass": 2, "all_confirmed_passed": false, "eps": [{"status": "FAIL", "p50": null, "elapsed": 358.7, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 418.0, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 389.1, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 370.1, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 406.9, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 1054.1, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 1007.4, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "PASS", "p50": 146.99, "elapsed": 148.3, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 3600.7, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "PASS", "p50": 133.98, "elapsed": 301.5, "is_pending": false, "prev_status": null, "fail_reason": ""}]}, {"model": "google/pegasus-xsum", "task": "summarization", "model_type": "pegasus", "group": "", "priority": "", "pass_count": 2, "confirmed_pass": 2, "all_confirmed_passed": false, "eps": [{"status": "FAIL", "p50": null, "elapsed": 104.5, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 68.9, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 73.6, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 78.7, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 71.8, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 3600.3, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 178.5, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 212.4, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "PASS", "p50": 259.1, "elapsed": 36.0, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "PASS", "p50": 446.02, "elapsed": 435.3, "is_pending": false, "prev_status": null, "fail_reason": ""}]}, {"model": "Qwen/Qwen2.5-3B-Instruct", "task": "text-generation", "model_type": "qwen2", "group": "", "priority": "", "pass_count": 1, "confirmed_pass": 1, "all_confirmed_passed": false, "eps": [{"status": "FAIL", "p50": null, "elapsed": 546.5, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 505.2, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 577.3, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 558.0, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 579.9, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 664.1, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 749.5, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 558.4, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 1538.2, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "PASS", "p50": 3370.35, "elapsed": 671.5, "is_pending": false, "prev_status": null, "fail_reason": ""}]}, {"model": "timm/mobilenetv3_small_100.lamb_in1k", "task": "image-classification", "model_type": "timm_wrapper", "group": "", "priority": "", "pass_count": 1, "confirmed_pass": 1, "all_confirmed_passed": false, "eps": [{"status": "N/A", "p50": null, "elapsed": null, "is_pending": false, "prev_status": null, "fail_reason": ""}, {"status": "N/A", "p50": null, "elapsed": null, "is_pending": false, "prev_status": null, "fail_reason": ""}, {"status": "N/A", "p50": null, "elapsed": null, "is_pending": false, "prev_status": null, "fail_reason": ""}, {"status": "N/A", "p50": null, "elapsed": null, "is_pending": false, "prev_status": null, "fail_reason": ""}, {"status": "N/A", "p50": null, "elapsed": null, "is_pending": false, "prev_status": null, "fail_reason": ""}, {"status": "N/A", "p50": null, "elapsed": null, "is_pending": false, "prev_status": null, "fail_reason": ""}, {"status": "N/A", "p50": null, "elapsed": null, "is_pending": false, "prev_status": null, "fail_reason": ""}, {"status": "N/A", "p50": null, "elapsed": null, "is_pending": false, "prev_status": null, "fail_reason": ""}, {"status": "PASS", "p50": 2.68, "elapsed": 9.1, "is_pending": false, "prev_status": null, "fail_reason": ""}, {"status": "N/A", "p50": null, "elapsed": null, "is_pending": false, "prev_status": null, "fail_reason": ""}]}, {"model": "timm/repghostnet_200.in1k", "task": "image-classification", "model_type": "timm_wrapper", "group": "", "priority": "", "pass_count": 1, "confirmed_pass": 1, "all_confirmed_passed": false, "eps": [{"status": "N/A", "p50": null, "elapsed": null, "is_pending": false, "prev_status": null, "fail_reason": ""}, {"status": "N/A", "p50": null, "elapsed": null, "is_pending": false, "prev_status": null, "fail_reason": ""}, {"status": "N/A", "p50": null, "elapsed": null, "is_pending": false, "prev_status": null, "fail_reason": ""}, {"status": "N/A", "p50": null, "elapsed": null, "is_pending": false, "prev_status": null, "fail_reason": ""}, {"status": "N/A", "p50": null, "elapsed": null, "is_pending": false, "prev_status": null, "fail_reason": ""}, {"status": "N/A", "p50": null, "elapsed": null, "is_pending": false, "prev_status": null, "fail_reason": ""}, {"status": "N/A", "p50": null, "elapsed": null, "is_pending": false, "prev_status": null, "fail_reason": ""}, {"status": "N/A", "p50": null, "elapsed": null, "is_pending": false, "prev_status": null, "fail_reason": ""}, {"status": "PASS", "p50": 5.81, "elapsed": 14.2, "is_pending": false, "prev_status": null, "fail_reason": ""}, {"status": "N/A", "p50": null, "elapsed": null, "is_pending": false, "prev_status": null, "fail_reason": ""}]}, {"model": "Helsinki-NLP/opus-mt-en-ru", "task": "translation", "model_type": "marian", "group": "", "priority": "", "pass_count": 0, "confirmed_pass": 0, "all_confirmed_passed": false, "eps": [{"status": "FAIL", "p50": null, "elapsed": 0, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 0, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 0, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 0, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 0, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 0, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 0, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 0, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 0, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 0, "is_pending": false, "prev_status": null, "fail_reason": ""}]}, {"model": "Helsinki-NLP/opus-mt-fr-en", "task": "translation", "model_type": "marian", "group": "", "priority": "", "pass_count": 0, "confirmed_pass": 0, "all_confirmed_passed": false, "eps": [{"status": "FAIL", "p50": null, "elapsed": 0, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 0, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 0, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 0, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 0, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 0, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 0, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 0, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 0, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 0, "is_pending": false, "prev_status": null, "fail_reason": ""}]}, {"model": "LiheYoung/depth-anything-base-hf", "task": "depth-estimation", "model_type": "depth_anything", "group": "", "priority": "", "pass_count": 0, "confirmed_pass": 0, "all_confirmed_passed": false, "eps": [{"status": "FAIL", "p50": null, "elapsed": 0, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 0, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 0, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 0, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 0, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 0, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 0, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 0, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 0, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 0, "is_pending": false, "prev_status": null, "fail_reason": ""}]}, {"model": "Marqo/marqo-fashionSigLIP", "task": "zero-shot-image-classification", "model_type": "siglip", "group": "", "priority": "", "pass_count": 0, "confirmed_pass": 0, "all_confirmed_passed": false, "eps": [{"status": "FAIL", "p50": null, "elapsed": 9.4, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 9.4, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 9.8, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 9.6, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 9.7, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 35.5, "is_pending": false, "prev_status": "PASS", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 59.6, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 15.6, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 25.8, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 15.5, "is_pending": false, "prev_status": null, "fail_reason": ""}]}, {"model": "Qwen/Qwen2.5-7B-Instruct", "task": "text-generation", "model_type": "qwen2", "group": "", "priority": "", "pass_count": 0, "confirmed_pass": 0, "all_confirmed_passed": false, "eps": [{"status": "FAIL", "p50": null, "elapsed": 893.2, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 882.5, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 881.6, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 802.3, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 878.3, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 1176.4, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 1188.4, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 1244.4, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 2383.3, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 1235.3, "is_pending": false, "prev_status": null, "fail_reason": ""}]}, {"model": "Qwen/Qwen3-0.6B", "task": "text-generation", "model_type": "qwen3", "group": "", "priority": "", "pass_count": 0, "confirmed_pass": 0, "all_confirmed_passed": false, "eps": [{"status": "FAIL", "p50": null, "elapsed": 0, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 0, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 0, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 0, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 0, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 0, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 0, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 0, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 0, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 0, "is_pending": false, "prev_status": null, "fail_reason": ""}]}, {"model": "Qwen/Qwen3-1.7B", "task": "text-generation", "model_type": "qwen3", "group": "", "priority": "", "pass_count": 0, "confirmed_pass": 0, "all_confirmed_passed": false, "eps": [{"status": "FAIL", "p50": null, "elapsed": 0, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 0, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 0, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 0, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 0, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 0, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 0, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 0, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 0, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 0, "is_pending": false, "prev_status": null, "fail_reason": ""}]}, {"model": "Qwen/Qwen3-8B", "task": "text-generation", "model_type": "qwen3", "group": "", "priority": "", "pass_count": 0, "confirmed_pass": 0, "all_confirmed_passed": false, "eps": [{"status": "FAIL", "p50": null, "elapsed": 0, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 0, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 0, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 0, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 0, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 0, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 0, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 0, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 0, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 0, "is_pending": false, "prev_status": null, "fail_reason": ""}]}, {"model": "Salesforce/blip-vqa-base", "task": "visual-question-answering", "model_type": "blip", "group": "", "priority": "", "pass_count": 0, "confirmed_pass": 0, "all_confirmed_passed": false, "eps": [{"status": "FAIL", "p50": null, "elapsed": 7.9, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 7.3, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 32.9, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 7.4, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 7.6, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 22.5, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 27.1, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 14.8, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 47.6, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 11.1, "is_pending": false, "prev_status": null, "fail_reason": ""}]}, {"model": "Salesforce/blip2-flan-t5-xl", "task": "visual-question-answering", "model_type": "blip-2", "group": "", "priority": "", "pass_count": 0, "confirmed_pass": 0, "all_confirmed_passed": false, "eps": [{"status": "FAIL", "p50": null, "elapsed": 8.1, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 7.2, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 7.9, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 7.2, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 7.4, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 22.5, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 19.2, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 14.4, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 20.4, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 10.8, "is_pending": false, "prev_status": null, "fail_reason": ""}]}, {"model": "Salesforce/blip2-opt-2.7b", "task": "visual-question-answering", "model_type": "blip-2", "group": "", "priority": "", "pass_count": 0, "confirmed_pass": 0, "all_confirmed_passed": false, "eps": [{"status": "FAIL", "p50": null, "elapsed": 7.7, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 7.3, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 7.2, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 7.2, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 7.3, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 22.3, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 21.1, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 14.5, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 20.6, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 10.8, "is_pending": false, "prev_status": null, "fail_reason": ""}]}, {"model": "Salesforce/blip2-opt-2.7b-coco", "task": "visual-question-answering", "model_type": "blip-2", "group": "", "priority": "", "pass_count": 0, "confirmed_pass": 0, "all_confirmed_passed": false, "eps": [{"status": "FAIL", "p50": null, "elapsed": 8.2, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 7.4, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 7.2, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 7.3, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 7.5, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 22.6, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 19.2, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 14.7, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 20.1, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 11.0, "is_pending": false, "prev_status": null, "fail_reason": ""}]}, {"model": "Xenova/paraphrase-multilingual-MiniLM-L12-v2", "task": "feature-extraction", "model_type": "bert", "group": "", "priority": "", "pass_count": 0, "confirmed_pass": 0, "all_confirmed_passed": false, "eps": [{"status": "FAIL", "p50": null, "elapsed": 10.2, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 9.4, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 9.4, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 9.2, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 9.6, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 28.2, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 25.8, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 12.2, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 22.9, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 11.3, "is_pending": false, "prev_status": null, "fail_reason": ""}]}, {"model": "Xenova/segformer-b0-finetuned-ade-512-512", "task": "image-segmentation", "model_type": "segformer", "group": "", "priority": "", "pass_count": 0, "confirmed_pass": 0, "all_confirmed_passed": false, "eps": [{"status": "FAIL", "p50": null, "elapsed": 9.8, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 9.2, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 9.4, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 9.4, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 11.1, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 29.4, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 26.5, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 12.0, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 23.1, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 11.8, "is_pending": false, "prev_status": null, "fail_reason": ""}]}, {"model": "ai-forever/Real-ESRGAN", "task": "", "model_type": "unknown", "group": "", "priority": "", "pass_count": 0, "confirmed_pass": 0, "all_confirmed_passed": false, "eps": [{"status": "FAIL", "p50": null, "elapsed": 7.1, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 6.5, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 6.3, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 6.1, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 6.1, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 11.3, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 20.3, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 6.8, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 35.9, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 6.9, "is_pending": false, "prev_status": null, "fail_reason": ""}]}, {"model": "alibaba-damo/mgp-str-base", "task": "image-to-text", "model_type": "mgp-str", "group": "", "priority": "", "pass_count": 0, "confirmed_pass": 0, "all_confirmed_passed": false, "eps": [{"status": "FAIL", "p50": null, "elapsed": 10.7, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 9.4, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 9.3, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 9.0, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 10.0, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 22.4, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 30.3, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 10.5, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 30.0, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 11.9, "is_pending": false, "prev_status": null, "fail_reason": ""}]}, {"model": "apple/DepthPro-hf", "task": "depth-estimation", "model_type": "depth_pro", "group": "", "priority": "", "pass_count": 0, "confirmed_pass": 0, "all_confirmed_passed": false, "eps": [{"status": "FAIL", "p50": null, "elapsed": 0, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 0, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 0, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 0, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 0, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 0, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 0, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 0, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 0, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 0, "is_pending": false, "prev_status": null, "fail_reason": ""}]}, {"model": "breezedeus/pix2text-mfr", "task": "image-to-text", "model_type": "vision-encoder-decoder", "group": "", "priority": "", "pass_count": 0, "confirmed_pass": 0, "all_confirmed_passed": false, "eps": [{"status": "FAIL", "p50": null, "elapsed": 10.1, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 9.6, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 9.6, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 9.8, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 10.1, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 28.6, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 26.0, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 15.1, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 23.2, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 13.2, "is_pending": false, "prev_status": null, "fail_reason": ""}]}, {"model": "dandelin/vilt-b32-finetuned-vqa", "task": "visual-question-answering", "model_type": "vilt", "group": "", "priority": "", "pass_count": 0, "confirmed_pass": 0, "all_confirmed_passed": false, "eps": [{"status": "FAIL", "p50": null, "elapsed": 7.9, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 7.3, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 7.4, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 7.4, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 7.4, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 26.0, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 16.2, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 11.8, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 21.1, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 12.2, "is_pending": false, "prev_status": null, "fail_reason": ""}]}, {"model": "facebook/bart-large-mnli", "task": "text-classification", "model_type": "bart", "group": "", "priority": "", "pass_count": 0, "confirmed_pass": 0, "all_confirmed_passed": false, "eps": [{"status": "FAIL", "p50": null, "elapsed": 30.7, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 45.5, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 32.6, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 34.8, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 33.4, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 421.7, "is_pending": false, "prev_status": "FAIL", "fail_reason": "SA"}, {"status": "FAIL", "p50": null, "elapsed": 68.4, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 71.6, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 45.4, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 17.8, "is_pending": false, "prev_status": null, "fail_reason": ""}]}, {"model": "facebook/bart-large-mnli", "task": "zero-shot-classification", "model_type": "bart", "group": "", "priority": "", "pass_count": 0, "confirmed_pass": 0, "all_confirmed_passed": false, "eps": [{"status": "FAIL", "p50": null, "elapsed": 0, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 0, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 0, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 0, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 0, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 0, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 0, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 0, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 0, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 0, "is_pending": false, "prev_status": null, "fail_reason": ""}]}, {"model": "facebook/nllb-200-distilled-600M", "task": "translation", "model_type": "m2m_100", "group": "", "priority": "", "pass_count": 0, "confirmed_pass": 0, "all_confirmed_passed": false, "eps": [{"status": "FAIL", "p50": null, "elapsed": 0, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 0, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 0, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 0, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 0, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 0, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 0, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 0, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 0, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 0, "is_pending": false, "prev_status": null, "fail_reason": ""}]}, {"model": "google/deplot", "task": "visual-question-answering", "model_type": "pix2struct", "group": "", "priority": "", "pass_count": 0, "confirmed_pass": 0, "all_confirmed_passed": false, "eps": [{"status": "FAIL", "p50": null, "elapsed": 7.3, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 7.2, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 7.5, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 7.9, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 7.4, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 23.3, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 71.0, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 11.5, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 20.7, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 38.1, "is_pending": false, "prev_status": null, "fail_reason": ""}]}, {"model": "google/pix2struct-ai2d-base", "task": "visual-question-answering", "model_type": "pix2struct", "group": "", "priority": "", "pass_count": 0, "confirmed_pass": 0, "all_confirmed_passed": false, "eps": [{"status": "FAIL", "p50": null, "elapsed": 7.3, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 7.4, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 7.3, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 7.3, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 7.5, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 61.5, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 22.5, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 11.3, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 33.0, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 38.4, "is_pending": false, "prev_status": null, "fail_reason": ""}]}, {"model": "google/pix2struct-docvqa-base", "task": "visual-question-answering", "model_type": "pix2struct", "group": "", "priority": "", "pass_count": 0, "confirmed_pass": 0, "all_confirmed_passed": false, "eps": [{"status": "FAIL", "p50": null, "elapsed": 7.1, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 7.0, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 7.1, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 7.2, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 7.3, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 18.5, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 16.7, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 11.6, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 18.2, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 12.0, "is_pending": false, "prev_status": null, "fail_reason": ""}]}, {"model": "hi-wesley/gemma3-vision-encoder", "task": "image-feature-extraction", "model_type": "siglip_vision_model", "group": "", "priority": "", "pass_count": 0, "confirmed_pass": 0, "all_confirmed_passed": false, "eps": [{"status": "FAIL", "p50": null, "elapsed": 54.6, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 54.7, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 76.0, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 54.3, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 55.8, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 3600.2, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 92.3, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 81.5, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 61.7, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 49.5, "is_pending": false, "prev_status": null, "fail_reason": ""}]}, {"model": "internlm/internlm-xcomposer2d5-7b", "task": "visual-question-answering", "model_type": "internlm2", "group": "", "priority": "", "pass_count": 0, "confirmed_pass": 0, "all_confirmed_passed": false, "eps": [{"status": "FAIL", "p50": null, "elapsed": 6.7, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 6.6, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 6.8, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 6.6, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 6.7, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 62.9, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 22.2, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 10.3, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 18.4, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 12.3, "is_pending": false, "prev_status": null, "fail_reason": ""}]}, {"model": "joeddav/bart-large-mnli-yahoo-answers", "task": "zero-shot-classification", "model_type": "bart", "group": "", "priority": "", "pass_count": 0, "confirmed_pass": 0, "all_confirmed_passed": false, "eps": [{"status": "FAIL", "p50": null, "elapsed": 34.2, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 33.7, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 34.0, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 36.9, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 35.3, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 126.9, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 85.6, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 90.4, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 45.4, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 17.3, "is_pending": false, "prev_status": null, "fail_reason": ""}]}, {"model": "knkarthick/MEETING_SUMMARY", "task": "summarization", "model_type": "bart", "group": "", "priority": "", "pass_count": 0, "confirmed_pass": 0, "all_confirmed_passed": false, "eps": [{"status": "FAIL", "p50": null, "elapsed": 0, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 0, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 0, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 0, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 0, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 0, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 0, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 0, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 0, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 0, "is_pending": false, "prev_status": null, "fail_reason": ""}]}, {"model": "laion/CLIP-ViT-B-32-laion2B-s34B-b79K", "task": "zero-shot-classification", "model_type": "clip", "group": "", "priority": "", "pass_count": 0, "confirmed_pass": 0, "all_confirmed_passed": false, "eps": [{"status": "FAIL", "p50": null, "elapsed": 7.0, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 7.1, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 7.1, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 7.2, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 7.3, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 19.5, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 21.3, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 36.5, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 18.3, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 12.0, "is_pending": false, "prev_status": null, "fail_reason": ""}]}, {"model": "microsoft/Phi-4-multimodal-instruct", "task": "visual-question-answering", "model_type": "phi4mm", "group": "", "priority": "", "pass_count": 0, "confirmed_pass": 0, "all_confirmed_passed": false, "eps": [{"status": "FAIL", "p50": null, "elapsed": 6.7, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 6.8, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 6.8, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 6.9, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 7.6, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 19.1, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 17.3, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 11.0, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 18.3, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 38.5, "is_pending": false, "prev_status": null, "fail_reason": ""}]}, {"model": "microsoft/VibeVoice-ASR-HF", "task": "audio-text-to-text", "model_type": "vibevoice_asr", "group": "", "priority": "", "pass_count": 0, "confirmed_pass": 0, "all_confirmed_passed": false, "eps": [{"status": "FAIL", "p50": null, "elapsed": 6.8, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 6.7, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 6.6, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 7.5, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 6.7, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 18.3, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 14.4, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 11.6, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 18.0, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 11.7, "is_pending": false, "prev_status": null, "fail_reason": ""}]}, {"model": "microsoft/VibeVoice-Realtime-0.5B", "task": "text-to-speech", "model_type": "vibevoice_streaming", "group": "", "priority": "", "pass_count": 0, "confirmed_pass": 0, "all_confirmed_passed": false, "eps": [{"status": "FAIL", "p50": null, "elapsed": 6.6, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 6.6, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 6.6, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 7.5, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 6.8, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 18.4, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 15.2, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 11.4, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 17.9, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 11.7, "is_pending": false, "prev_status": null, "fail_reason": ""}]}, {"model": "microsoft/speecht5_tts", "task": "text-to-speech", "model_type": "speecht5", "group": "", "priority": "", "pass_count": 0, "confirmed_pass": 0, "all_confirmed_passed": false, "eps": [{"status": "FAIL", "p50": null, "elapsed": 8.2, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 8.0, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 8.0, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 8.2, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 7.9, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 19.9, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 69.6, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 12.0, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 19.7, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 39.5, "is_pending": false, "prev_status": null, "fail_reason": ""}]}, {"model": "microsoft/xclip-base-patch32", "task": "video-classification", "model_type": "xclip", "group": "", "priority": "", "pass_count": 0, "confirmed_pass": 0, "all_confirmed_passed": false, "eps": [{"status": "FAIL", "p50": null, "elapsed": 11.8, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 12.2, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 10.8, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 11.0, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 11.4, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 19.3, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 35.4, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 11.4, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 18.7, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 14.2, "is_pending": false, "prev_status": null, "fail_reason": ""}]}, {"model": "moussaKam/mbarthez", "task": "summarization", "model_type": "mbart", "group": "", "priority": "", "pass_count": 0, "confirmed_pass": 0, "all_confirmed_passed": false, "eps": [{"status": "FAIL", "p50": null, "elapsed": 0, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 0, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 0, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 0, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 0, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 0, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 0, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 0, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 0, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 0, "is_pending": false, "prev_status": null, "fail_reason": ""}]}, {"model": "openai/clip-vit-base-patch16", "task": "zero-shot-classification", "model_type": "clip", "group": "", "priority": "", "pass_count": 0, "confirmed_pass": 0, "all_confirmed_passed": false, "eps": [{"status": "FAIL", "p50": null, "elapsed": 7.5, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 7.4, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 7.2, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 7.3, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 7.2, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 21.8, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 13.1, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 12.8, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 18.0, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 13.6, "is_pending": false, "prev_status": null, "fail_reason": ""}]}, {"model": "openai/clip-vit-base-patch32", "task": "zero-shot-classification", "model_type": "clip", "group": "", "priority": "", "pass_count": 0, "confirmed_pass": 0, "all_confirmed_passed": false, "eps": [{"status": "FAIL", "p50": null, "elapsed": 8.1, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 7.1, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 7.0, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 8.1, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 7.3, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 67.7, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 12.6, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 13.0, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 18.0, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 14.0, "is_pending": false, "prev_status": null, "fail_reason": ""}]}, {"model": "openai/gpt-oss-20b", "task": "text-generation", "model_type": "gpt_oss", "group": "", "priority": "", "pass_count": 0, "confirmed_pass": 0, "all_confirmed_passed": false, "eps": [{"status": "FAIL", "p50": null, "elapsed": 145.9, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 146.7, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 144.0, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 138.8, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 171.6, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 298.8, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 479.9, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 558.6, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 1569.4, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 13.9, "is_pending": false, "prev_status": null, "fail_reason": ""}]}, {"model": "philschmid/bart-large-cnn-samsum", "task": "summarization", "model_type": "bart", "group": "", "priority": "", "pass_count": 0, "confirmed_pass": 0, "all_confirmed_passed": false, "eps": [{"status": "FAIL", "p50": null, "elapsed": 0, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 0, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 0, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 0, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 0, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 0, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 0, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 0, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 0, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 0, "is_pending": false, "prev_status": null, "fail_reason": ""}]}, {"model": "valhalla/distilbart-mnli-12-3", "task": "zero-shot-classification", "model_type": "bart", "group": "", "priority": "", "pass_count": 0, "confirmed_pass": 0, "all_confirmed_passed": false, "eps": [{"status": "FAIL", "p50": null, "elapsed": 40.4, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 56.4, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 39.1, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 42.8, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 48.7, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 70.9, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 72.1, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 92.0, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 52.2, "is_pending": false, "prev_status": "FAIL", "fail_reason": ""}, {"status": "FAIL", "p50": null, "elapsed": 18.5, "is_pending": false, "prev_status": null, "fail_reason": ""}]}];
-const ALL_TASKS          = ["audio-text-to-text", "depth-estimation", "feature-extraction", "fill-mask", "image-classification", "image-feature-extraction", "image-segmentation", "image-to-text", "mask-generation", "masked-lm", "object-detection", "question-answering", "sentence-similarity", "summarization", "table-question-answering", "text-classification", "text-generation", "text-to-speech", "token-classification", "translation", "video-classification", "visual-question-answering", "zero-shot-classification", "zero-shot-image-classification"];
-const ALL_MODEL_TYPES    = ["bart", "beit", "bert", "blip", "blip-2", "camembert", "clip", "convnext", "deberta", "deberta-v2", "depth_anything", "depth_pro", "detr", "dinov2", "distilbert", "dpt", "electra", "gpt2", "gpt_oss", "internlm2", "m2m_100", "marian", "mbart", "mgp-str", "mobilevit", "mpnet", "pegasus", "phi4mm", "pix2struct", "qwen2", "qwen3", "resnet", "roberta", "rt_detr", "rt_detr_v2", "sam", "sam2_video", "segformer", "siglip", "siglip_vision_model", "speecht5", "splinter", "swin", "swinv2", "t5", "table-transformer", "timm_wrapper", "unknown", "vibevoice_asr", "vibevoice_streaming", "vilt", "vision-encoder-decoder", "vit", "xclip", "xlm-roberta", "yolos", "zoedepth"];
-const N_CONFIRMED_EPS    = 10;
-const PENDING_EP_NAMES   = [];
-
-// ── pending banner ────────────────────────────────────────────────────────────
-(function() {
-  const el = document.getElementById('pending-banner');
-  if (PUBLIC || PENDING_EP_NAMES.length === 0) { el.style.display = 'none'; return; }
-  el.innerHTML = `
-    <span class="icon">⏳</span>
-    <span>
-      <strong>${PENDING_EP_NAMES.length} EP${PENDING_EP_NAMES.length > 1 ? 's' : ''} pending 0605 data:</strong>
-      ${PENDING_EP_NAMES.join(', ')}
-      &nbsp;—&nbsp; showing latest available data for comparison (amber columns).
-    </span>`;
-})();
-
-// ── init filters ──────────────────────────────────────────────────────────────
-(function() {
-  const taskSel = document.getElementById('task-filter');
-  ALL_TASKS.forEach(t => { const o = document.createElement('option'); o.value = o.textContent = t; taskSel.appendChild(o); });
-  const typeSel = document.getElementById('type-filter');
-  ALL_MODEL_TYPES.forEach(t => { const o = document.createElement('option'); o.value = o.textContent = t; typeSel.appendChild(o); });
-})();
-
-// ── EP chips ──────────────────────────────────────────────────────────────────
-(function() {
-  const bar = document.getElementById('ep-bar');
-  EP_LABELS.forEach(ep => {
-    const s    = EP_SUMMARIES[ep]     || {passed:null, total:null};
-    const sp   = EP_PREV_SUMMARIES[ep]|| {passed:null, total:null};
-    const date = EP_DATES[ep]    || 'N/A';
-    const prev = EP_PREV_DATES[ep]|| 'N/A';
-    const pend = EP_IS_PENDING[ep];
-
-    const chip = document.createElement('div');
-    chip.className = `ep-chip ${pend ? 'pending' : 'confirmed'}`;
-
-    if (pend) {
-      chip.innerHTML = `
-        <div class="chip-name">⏳ ${ep}</div>
-        <div class="chip-date">Pending data</div>
-        <div class="chip-stats" style="color:var(--text-dim)">— / —</div>
-      `;
-    } else {
-      const pct  = s.total > 0 ? (s.passed/s.total*100).toFixed(1) : '—';
-      if (PUBLIC) {
-        chip.innerHTML = `
-        <div class="chip-name">✓ ${ep}</div>
-        <div class="chip-stats">${s.passed}/${s.total} (${pct}%)</div>
-        `;
-      } else {
-      const partial = s.total > 0 && s.total < 200;
-      let deltaHtml = '';
-      if (sp.total > 0) {
-        const diff = s.passed - sp.passed;
-        const sign = diff > 0 ? '+' : '';
-        const cls  = diff > 0 ? 'up' : diff < 0 ? 'down' : 'same';
-        deltaHtml = `<div class="chip-delta ${cls}">${sign}${diff} vs ${prev}</div>`;
-      }
-      chip.innerHTML = `
-        <div class="chip-name">✓ ${ep}</div>
-        <div class="chip-date">${date}</div>
-        <div class="chip-stats">${s.passed}/${s.total} (${pct}%)</div>
-        ${partial ? `<div class="chip-partial">⚠ Partial run (${s.total} models)</div>` : ''}
-        ${deltaHtml}
-      `;
-      }
-    }
-    if (!pend) {
-      chip.dataset.ep = ep;
-      chip.setAttribute('role', 'button');
-      chip.title = 'Show only the ' + ep + ' column';
-      chip.addEventListener('click', () => toggleEPFilter(ep));
-    }
-    bar.appendChild(chip);
-  });
-})();
-
-// ── EP tile filter ─────────────────────────────────────────────────────
-let selectedEP = null;
-function toggleEPFilter(ep) {
-  selectedEP = (selectedEP === ep) ? null : ep;
-  render();
-}
-
-// ── table header ──────────────────────────────────────────────────────────────
-function buildHeader() {
-  const thead = document.getElementById('table-head');
-  let html = '<tr>';
-  html += '<th class="model-col">Model</th>';
-  html += '<th class="meta-col task-col">Task</th>';
-  html += '<th class="meta-col type-col">Type</th>';
-  if (!PUBLIC) html += '<th class="meta-col">Priority</th>';
-  html += '<th class="meta-col">Pass</th>';
-  EP_LABELS.forEach(ep => {
-    if (selectedEP && ep !== selectedEP) return;
-    const pend = EP_IS_PENDING[ep];
-    const cls  = pend ? 'ep-col ep-pending' : 'ep-col ep-confirmed';
-    html += `<th class="${cls}">${pend ? '⏳ ' : ''}${ep}</th>`;
-  });
-  html += '</tr>';
-  thead.innerHTML = html;
-}
-
-// ── main render ───────────────────────────────────────────────────────────────
-function render() {
-  const search  = document.getElementById('search').value.toLowerCase();
-  const taskF   = document.getElementById('task-filter').value;
-  const typeF   = document.getElementById('type-filter').value;
-  const priEl   = document.getElementById('pri-filter');
-  const priF    = priEl ? priEl.value : '';
-  const passF   = document.getElementById('pass-filter').value;
-  const sortBy  = document.getElementById('sort-by').value;
-
-  let filtered = ALL_ROWS.filter(r => {
-    if (search && !r.model.toLowerCase().includes(search)) return false;
-    if (taskF  && r.task       !== taskF)  return false;
-    if (typeF  && r.model_type !== typeF)  return false;
-    if (priF   && r.priority   !== priF)   return false;
-    if (passF === 'conf_all' && !r.all_confirmed_passed)  return false;
-    if (passF === 'some'     && r.pass_count === 0)       return false;
-    if (passF === 'none'     && r.pass_count > 0)         return false;
-    return true;
-  });
-
-  if (sortBy === 'pass_desc') filtered.sort((a,b) => b.pass_count - a.pass_count || a.model.localeCompare(b.model));
-  else if (sortBy === 'pass_asc') filtered.sort((a,b) => a.pass_count - b.pass_count || a.model.localeCompare(b.model));
-  else filtered.sort((a,b) => a.model.localeCompare(b.model));
-
-  const epNote = selectedEP ? ` · EP: ${selectedEP}` : '';
-  document.getElementById('count-label').textContent = `Showing ${filtered.length} / ${ALL_ROWS.length} models${epNote}`;
-  document.querySelectorAll('.ep-chip[data-ep]').forEach(c => c.classList.toggle('selected', c.dataset.ep === selectedEP));
-  buildHeader();
-
-  const tbody = document.getElementById('table-body');
-  if (!filtered.length) {
-    tbody.innerHTML = '<tr><td colspan="100" class="no-results">No models match the filters.</td></tr>';
-    updateStats(filtered); return;
-  }
-
-  const rowsHtml = filtered.map(r => {
-    let html = `<tr class="${r.all_confirmed_passed ? 'all-confirmed-pass' : ''}">`;
-
-    html += `<td class="model-col"><a href="https://huggingface.co/${r.model}" target="_blank">${r.model}</a></td>`;
-    html += `<td class="task-col">${r.task}</td>`;
-    html += `<td class="type-col">${r.model_type}</td>`;
-    if (!PUBLIC) {
-      const priCls = r.priority ? 'pri-' + r.priority : '';
-      html += `<td class="pri-col"><span class="pri-badge ${priCls}">${r.priority || '–'}</span></td>`;
-    }
-
-    // Pass count
-    const confPass = r.confirmed_pass;
-    const confBadge = confPass === N_CONFIRMED_EPS
-      ? `<span class="pass-badge">${confPass}/${N_CONFIRMED_EPS}</span>`
-      : confPass > 0
-        ? `<span class="conf-badge">${confPass}/${N_CONFIRMED_EPS}</span>`
-        : `<span class="fail-badge">0/${N_CONFIRMED_EPS}</span>`;
-    html += `<td class="pass-col">${confBadge}</td>`;
-
-    // EP cells — ✓ / ✗ / —
-    r.eps.forEach((ep, ei) => {
-      if (selectedEP && EP_LABELS[ei] !== selectedEP) return;
-      if (ep.is_pending) {
-        html += `<td><div class="ep-cell na pending">—</div></td>`;
-      } else if (ep.status === 'PASS') {
-        html += `<td><div class="ep-cell pass">✓</div></td>`;
-      } else if (ep.status === 'FAIL') {
-        html += `<td><div class="ep-cell fail">✗</div></td>`;
-      } else {
-        html += `<td><div class="ep-cell na">—</div></td>`;
-      }
-    });
-
-    html += '</tr>';
-    return html;
-  });
-
-  tbody.innerHTML = rowsHtml.join('');
-  updateStats(filtered);
-}
-
-function updateStats(filtered) {
-  const total    = filtered.length;
-  const passConf = filtered.filter(r => r.all_confirmed_passed).length;
-  const passAny  = filtered.filter(r => r.pass_count > 0).length;
-  const failAll  = total - passAny;
-
-  if (PUBLIC) {
-    document.getElementById('header-stats').innerHTML = `
-    <div class="stat-card"><div class="label">Total Models</div>  <div class="value blue">${total}</div></div>
-    <div class="stat-card"><div class="label">Pass All ${N_CONFIRMED_EPS} EPs</div><div class="value green">${passConf}</div></div>
-    <div class="stat-card"><div class="label">Pass ≥1 EP</div>    <div class="value green">${passAny}</div></div>
-    `;
-    return;
-  }
-  document.getElementById('header-stats').innerHTML = `
-    <div class="stat-card"><div class="label">Total Models</div>  <div class="value blue">${total}</div></div>
-    <div class="stat-card"><div class="label">Pass All ${N_CONFIRMED_EPS} Confirmed EPs</div><div class="value green">${passConf}</div></div>
-    <div class="stat-card"><div class="label">Pass ≥1 EP</div>    <div class="value green">${passAny}</div></div>
-    <div class="stat-card"><div class="label">Fail All EPs</div>  <div class="value red">${failAll}</div></div>
-    <div class="stat-card"><div class="label">Pending EPs</div>   <div class="value amber">${PENDING_EP_NAMES.length}</div></div>
-  `;
-}
-
-function toggleTheme() {
-  const dark = document.body.classList.toggle('dark');
-  try { localStorage.setItem('winml-theme', dark ? 'dark' : 'light'); } catch (e) {}
-}
-
-render();
-</script>
-</body>
-</html>

From d0bbfdfa25e73dead43d6fd735036dadd0627265 Mon Sep 17 00:00:00 2001
From: Yue Sun <yuesu@microsoft.com>
Date: Tue, 23 Jun 2026 15:39:26 +0800
Subject: [PATCH 2/2] Address review: rename report to
 model_accuracy_report.html and align naming

- Fix module docstring in download_report.py (was still 'model compatibility report')
- Standardize display name to 'Model Accuracy Report' across docstring, README, argparse, and docs link to match the report page title
- Update SOURCE_FILE and all references to model_accuracy_report.html
- Update dev search index entry for consistency
---
 dev/reference/supported-models/index.html        |  2 +-
 dev/search/search_index.json                     |  2 +-
 reports/README.md                                | 16 ++++++++--------
 reports/download_report.py                       | 12 ++++++------
 ...ty_report.html => model_accuracy_report.html} |  0
 5 files changed, 16 insertions(+), 16 deletions(-)
 rename reports/{examples_compatibility_report.html => model_accuracy_report.html} (100%)

diff --git a/dev/reference/supported-models/index.html b/dev/reference/supported-models/index.html
index 63c2995b6..ff443ef1e 100644
--- a/dev/reference/supported-models/index.html
+++ b/dev/reference/supported-models/index.html
@@ -2978,7 +2978,7 @@
 <h1 id="supported-models">Supported Models<a class="headerlink" href="#supported-models" title="Permanent link">&para;</a></h1>
 <p>Windows ML CLI has validated a set of models for compatibility across all
 Execution Providers (EPs)—see the full
-<a href="https://microsoft.github.io/winml-cli/reports/examples_compatibility_report.html">models accuracy report</a>.</p>
+<a href="https://microsoft.github.io/winml-cli/reports/model_accuracy_report.html">Model Accuracy Report</a>.</p>
 <p>winml-cli supports a wide range of model architectures and tasks. This page
 lists what's validated and how to discover model support.</p>
 <hr />
diff --git a/dev/search/search_index.json b/dev/search/search_index.json
index f6529fe68..0e4c53e23 100644
--- a/dev/search/search_index.json
+++ b/dev/search/search_index.json
@@ -1 +1 @@
-{"config":{"lang":["en"],"separator":"[\\s\\-]+","pipeline":["stopWordFilter"],"fields":{"title":{"boost":1000.0},"text":{"boost":1.0},"tags":{"boost":1000000.0}}},"docs":[{"location":"","title":"winml-cli","text":"<p>Windows ML CLI is a command line tool for building portable, performant, and high-quality AI models for Windows ML. It takes you from a source model \u2014 whether from Hugging Face or your own pipeline \u2014 to a hardware-optimized artifact in a reproducible workflow.</p> <p>Purpose-built for Windows hardware diversity, the CLI handles conversion, graph optimization, and compilation across AMD, Intel, NVIDIA, and Qualcomm targets. The CLI fits naturally into CI/CD pipelines so teams can validate and ship models easily.</p>"},{"location":"#what-you-can-do","title":"What you can do","text":"<ul> <li>Build once, run across hardwares. Compose your own workflow from primitive commands (<code>export</code>, <code>analyze</code>, <code>optimize</code>, <code>quantize</code>, <code>compile</code>), or use an auto-generated config with <code>winml build</code> \u2014 both produce portable models that run across hardware.</li> <li>Drill into the details. Deep insights into operator compatibility, shape mismatches, graph optimizations, and EP-aware tuning at any stage of the pipeline.</li> <li>AI-ready. CLI-driven tools with built-in skills, friendly to work with mainstream agents.</li> </ul>"},{"location":"#what-you-get-out-of-the-box","title":"What you get out of the box","text":"<ul> <li>All Windows ML EPs supported. Every supported execution provider is available behind the same commands.</li> <li>Curated model catalog. A verified set of models that run across all Windows ML EPs \u2014 a reliable starting point.</li> <li>Bring your own ONNX. Not only for converting from PyTorch \u2014 bring an existing ONNX model to get operator-compatibility insights and optimize it based on the analysis.</li> </ul>"},{"location":"#where-to-start","title":"Where to start","text":"<ul> <li>Installation \u2014 get the <code>winml</code> CLI running locally.</li> <li>Quickstart \u2014 export a Hugging Face model in five minutes.</li> </ul>"},{"location":"#learn-the-model","title":"Learn the model","text":"<ul> <li>How winml-cli Works \u2014 the pipeline from a PyTorch model to an EP-compiled artifact.</li> <li>Commands \u2014 reference for all 12 <code>winml</code> subcommands.</li> <li>Samples \u2014 walkthroughs for BERT and CLIP.</li> </ul>"},{"location":"#repository-access","title":"Repository access","text":"<p>To request access to the Windows ML CLI repository, visit aka.ms/winml-cli.</p>"},{"location":"#license","title":"License","text":"<p>MIT. See LICENSE.</p>"},{"location":"Privacy/","title":"WinML CLI Privacy Statement","text":"<p>WinML CLI collects limited, unlinked pseudonymized telemetry to help improve the product. This page describes exactly what is collected, what is not, and how to control it.</p>"},{"location":"Privacy/#data-category","title":"Data category","text":"<p>All WinML CLI telemetry is classified as Optional under Microsoft's data categorization model. None of it is required to run any feature; it exists solely to support product improvement.</p> <p>A first-run interactive prompt asks for consent before any event is sent. The prompt defaults to accept \u2014 pressing Enter enables telemetry. You can decline explicitly at the prompt, or change your answer later by editing <code>%USERPROFILE%\\.winml\\config.json</code>. Telemetry is automatically disabled in non-interactive contexts (non-TTY stdin, CI/CD pipelines) regardless of stored consent; those contexts do not see the prompt and default to off.</p>"},{"location":"Privacy/#events-collected","title":"Events collected","text":"<p>When telemetry is enabled, WinML CLI emits three event types:</p>"},{"location":"Privacy/#winmlcliheartbeat","title":"WinMLCLIHeartbeat","text":"<p>Sent once per CLI invocation, just before the requested command runs. Carries only context attributes (OS, architecture, app version, device ID) \u2014 no per-event payload.</p>"},{"location":"Privacy/#winmlcliaction","title":"WinMLCLIAction","text":"<p>Sent once per command completion.</p> Attribute Description <code>invoked_from</code> <code>Script</code> or <code>Interactive</code>, based on whether stdin is a TTY. <code>action_name</code> Click subcommand name (e.g., <code>build</code>, <code>analyze</code>). <code>device</code> Target device type, if the subcommand accepts <code>--device</code> (e.g., <code>NPU</code>, <code>GPU</code>). <code>ep</code> Execution provider, if the subcommand accepts <code>--ep</code> (e.g., <code>QNNExecutionProvider</code>). <code>duration_ms</code> Wall-clock execution time in milliseconds. <code>success</code> Whether the command completed without raising."},{"location":"Privacy/#winmlclierror","title":"WinMLCLIError","text":"<p>Sent only when a command raises an unhandled exception.</p> Attribute Description <code>exception_type</code> Exception class name (e.g., <code>ValueError</code>). <code>exception_message</code> The exception message, with absolute paths trimmed to package-relative, truncated to 200 characters, and with emails, GUIDs, IPv4/IPv6 addresses, and long opaque tokens replaced by <code>&lt;scrubbed&gt;</code>. <code>exception_stack</code> A list of frames, each <code>{file, line, function}</code>. File paths are package-relative. No source line text, no local variable values."},{"location":"Privacy/#common-context-attributes","title":"Common context attributes","text":"<p>Every event carries these attributes (populated by the telemetry module, not by the command code):</p> Attribute Description <code>device_id</code> SHA256 hash of a randomly generated UUID, persisted per machine. Enables counting distinct users without identifying them. <code>id_status</code> <code>EXISTING</code>, <code>NEW</code>, or <code>FAILED</code> \u2014 how the device ID was obtained on this run. <code>os.name</code>, <code>os.version</code>, <code>os.release</code>, <code>os.arch</code> Operating system and architecture (e.g., <code>Windows</code>, <code>10.0.26200</code>, <code>11</code>, <code>AMD64</code>). <code>app_version</code> WinML CLI package version. <code>app_instance_id</code> A random UUID generated for this process only; not persisted. <code>initTs</code> Epoch timestamp when telemetry was initialized."},{"location":"Privacy/#data-never-collected","title":"Data never collected","text":"<ul> <li>Model file paths or model contents</li> <li>User names, machine names, or IP addresses (IPs appearing in exception messages are scrubbed)</li> <li>Command-line arguments or option values (e.g., <code>--model path/to/file.onnx</code>)</li> <li>Source code text in tracebacks</li> <li>Local variable values in tracebacks</li> <li>HuggingFace tokens, API keys, or session tokens (long opaque tokens in exception messages are scrubbed)</li> <li>File system contents</li> <li>Email addresses (scrubbed from exception messages if present)</li> </ul>"},{"location":"Privacy/#controlling-telemetry","title":"Controlling telemetry","text":""},{"location":"Privacy/#consent","title":"Consent","text":"<p>On the first run of any command, WinML CLI prompts:</p> <pre><code>Enable telemetry? [Y/n]\n</code></pre> <p>The default is <code>Y</code> (telemetry enabled) \u2014 pressing Enter accepts. Your answer is persisted to <code>%USERPROFILE%\\.winml\\config.json</code> under <code>telemetry.consent</code> and the prompt is not shown again.</p>"},{"location":"Privacy/#changing-your-decision","title":"Changing your decision","text":"<p>Edit <code>%USERPROFILE%\\.winml\\config.json</code> directly:</p> <pre><code>{\n  \"telemetry\": {\n    \"consent\": \"disabled\"\n  }\n}\n</code></pre> Goal Edit Opt out Set <code>telemetry.consent</code> to <code>\"disabled\"</code>. Opt in Set <code>telemetry.consent</code> to <code>\"enabled\"</code>. Re-show the prompt on next run Delete the file, or remove the <code>telemetry.consent</code> field. <p>There are no CLI subcommands, per-invocation flags, or environment variables for consent \u2014 the config file is the single source of truth.</p>"},{"location":"Privacy/#ci-cd","title":"CI / CD","text":"<p>Telemetry is automatically disabled when any of these environment variables are set, and no prompt is shown:</p> <p><code>CI</code>, <code>TF_BUILD</code>, <code>GITHUB_ACTIONS</code>, <code>JENKINS_URL</code>, <code>CODEBUILD_BUILD_ID</code>, <code>BUILDKITE</code>, <code>SYSTEM_TEAMFOUNDATIONCOLLECTIONURI</code>.</p>"},{"location":"Privacy/#cache-directory","title":"Cache directory","text":"<p>Events that fail to send (e.g., transient network errors) are cached locally and retried on the next run. The cache file lives at:</p> <p><code>%USERPROFILE%\\.winml\\telemetry\\winmlcli.cache</code></p> <p>The cache is append-only on failure and drain-then-resend on recovery. When telemetry is disabled, the cache is cleared so a disabled session never resends events the user has since opted out of.</p>"},{"location":"Privacy/#dev-installs","title":"Dev installs","text":"<p>WinML CLI installed from source (<code>pip install -e .</code>) or run directly from a checkout never sends telemetry. The InstrumentationKey is blank in source and is only populated by the official build pipeline. Only official binary releases are capable of sending telemetry, and only after the user has seen the first-run prompt.</p>"},{"location":"contributing/","title":"Contributing","text":"<p>For the full contributing guide \u2014 development setup, coding conventions, testing, PR checklist, and CLA \u2014 see <code>CONTRIBUTING.md</code> in the repository root.</p>"},{"location":"contributing/#quick-reference","title":"Quick Reference","text":"<pre><code># Clone and set up\ngit clone https://github.com/microsoft/winml-cli.git\ncd winml-cli\nuv sync --extra dev\nuv run pre-commit install\n\n# Download runtime check rules (required for `winml analyze`)\ngh release download &lt;tag&gt; --repo microsoft/winml-cli --pattern 'rules-v*.zip' --dir .\nExpand-Archive -Path .\\rules-v*.zip -DestinationPath src\\winml\\modelkit\\analyze\\rules\\runtime_check_rules -Force\n\n# Run tests\nuv run pytest tests/ -m \"not e2e and not npu and not gpu\"\n\n# Lint and format\nuv run ruff check src/ tests/ --fix\nuv run ruff format src/ tests/\n\n# Docs preview\nuv run mkdocs serve\n</code></pre>"},{"location":"contributing/#see-also","title":"See also","text":"<ul> <li>Installation \u2014 user-facing setup</li> <li>Commands \u2014 CLI reference</li> </ul>"},{"location":"troubleshooting/","title":"Troubleshooting","text":"<p>Common issues and solutions when working with winml-cli.</p>"},{"location":"troubleshooting/#compile","title":"Compile","text":""},{"location":"troubleshooting/#cannot-enable-compilation-no-compile-section","title":"Cannot enable compilation: no compile section","text":"<pre><code>UsageError: Cannot enable compilation: no compile section found in the config file\n</code></pre> <p>Cause: Compilation is off by default in <code>winml build</code>. You passed <code>--compile</code> to explicitly enable it, but the config JSON has no <code>\"compile\"</code> section (it's <code>null</code>). This happens when the config was generated without a device target that supports EPContext (e.g., <code>--device cpu</code> or <code>--device auto</code> on a machine without NPU).</p> <p>Solution: Regenerate the config targeting a device that supports compilation (NPU or GPU with an EP that produces EPContext):</p> <pre><code>uv run winml config -m &lt;model&gt; -d npu --compile -o output/\n</code></pre> <p>Note</p> <p>By default <code>winml build</code> skips the compile stage unless <code>--compile</code> is passed or the config contains a non-null <code>\"compile\"</code> section. To include compilation in the generated config, specify a device that maps to an EPContext-capable EP (e.g., <code>-d npu</code>).</p>"},{"location":"troubleshooting/#already-a-compiled-epcontext-model","title":"Already a compiled EPContext model","text":"<pre><code>ClickException: model_ctx.onnx is already a compiled EPContext model and cannot be re-compiled\n</code></pre> <p>Cause: You're trying to compile a model that is already an EPContext artifact (the <code>_ctx.onnx</code> output).</p> <p>Solution: Run compilation on the original (pre-compiled) ONNX file instead:</p> <pre><code>uv run winml compile -m model.onnx -d npu -o output/\n</code></pre>"},{"location":"troubleshooting/#provider-does-not-support-epcontext-compilation","title":"Provider does not support EPContext compilation","text":"<pre><code>ClickException: Provider 'DmlExecutionProvider' does not support EPContext compilation\n</code></pre> <p>Cause: Not all EPs produce EPContext format. DML and CPU do not support pre-compilation.</p> <p>Solution: EPContext is supported by QNN, OpenVINO, TensorRT, and Vitis AI. For DML/CPU, skip the compile step \u2014 the runtime compiles on first load automatically:</p> <pre><code>uv run winml build -c config.json -m model -o output/ --no-compile\n</code></pre>"},{"location":"troubleshooting/#analyze","title":"Analyze","text":""},{"location":"troubleshooting/#unsupported-nodes-persist-after-analysis","title":"Unsupported nodes persist after analysis","text":"<pre><code>RuntimeError: Unsupported nodes persist after analysis\n</code></pre> <p>Cause: The model contains operators that the selected EP cannot dispatch natively.</p> <p>Solution: Run <code>winml analyze</code> with <code>--optim-config</code> to identify problematic operators and get recommended graph optimizations:</p> <pre><code># Analyze and output optimization recommendations\nuv run winml analyze -m model.onnx --ep qnn --optim-config optim_config.json\n</code></pre> <p>This produces <code>optim_config.json</code> with the auto-discovered optimization flags. Apply them with <code>winml optimize</code>, then re-analyze:</p> <pre><code># Apply recommended optimizations\nuv run winml optimize -m model.onnx -o model_optimized.onnx -c optim_config.json\n\n# Re-analyze to check if unsupported nodes are resolved\nuv run winml analyze -m model_optimized.onnx --ep qnn\n</code></pre> <p>If unsupported nodes still remain after optimization, consider:</p> <ul> <li>Manually modifying problematic nodes \u2014 use tools like <code>onnx-graphsurgeon</code> to replace or remove operators the EP cannot handle</li> <li>Using a different EP (<code>--ep dml</code> or <code>--ep cpu</code>) that supports the operators in question</li> <li>Checking if a newer opset version resolves the compatibility gap (re-export with <code>--opset-version 18</code>)</li> </ul>"},{"location":"troubleshooting/#many-unknown-results-from-constant-nodes","title":"Many \"unknown\" results from constant nodes","text":"<p>When <code>winml analyze</code> reports a large number of nodes as \"unknown\", the model likely hasn't been normalized \u2014 it contains raw constant-folding subgraphs, missing shape annotations, or redundant initializer nodes that the analyzer cannot classify.</p> <p>Solution: Run <code>winml optimize</code> with no optimization flags to normalize the model (constant folding, shape inference, dead-node elimination), then re-analyze:</p> <pre><code># Normalize only (no fusion flags)\nuv run winml optimize -m model.onnx -o model_normalized.onnx\n\n# Re-analyze \u2014 constant nodes are now folded, shapes are inferred\nuv run winml analyze -m model_normalized.onnx --ep qnn\n</code></pre> <p>This baseline pass collapses constant subgraphs into initializers and propagates tensor shapes throughout the graph, giving the analyzer enough information to classify nodes correctly.</p>"},{"location":"troubleshooting/#build-cache","title":"Build / Cache","text":""},{"location":"troubleshooting/#disk-full-out-of-space","title":"Disk full / out of space","text":"<p>Build artifacts (exported ONNX, optimized graphs, quantized models, compiled EPContext files) are cached under:</p> <pre><code>C:\\Users\\&lt;user&gt;\\.cache\\winml\n</code></pre> <p>This directory can grow significantly after multiple builds with large models. If you encounter disk-full errors or want to reclaim space, it is safe to delete the entire folder:</p> <pre><code>Remove-Item -Recurse -Force \"$env:USERPROFILE\\.cache\\winml\"\n</code></pre> <p>The next <code>winml build</code> will re-create the cache as needed. Use <code>--rebuild</code> to force a full rebuild without relying on cached intermediates.</p>"},{"location":"troubleshooting/#general-tips","title":"General Tips","text":"Tip Command Diagnose environment <code>uv run winml sys</code> Check EP compatibility <code>uv run winml analyze -m model.onnx --ep &lt;ep&gt;</code> Verbose output Add <code>-v</code> or <code>--verbose</code> to any command Skip a pipeline stage <code>--no-quant</code>, <code>--no-compile</code>, <code>--no-optimize</code> Force rebuild (ignore cache) <code>uv run winml build -c config.json -m &lt;model&gt; -o output/ --rebuild</code> Regenerate config <code>uv run winml config -m &lt;model&gt; -d &lt;device&gt; -o dir/</code> Free disk space Delete <code>C:\\Users\\&lt;user&gt;\\.cache\\winml</code>"},{"location":"troubleshooting/#see-also","title":"See also","text":"<ul> <li>winml sys \u2014 system diagnostics</li> <li>winml analyze \u2014 EP compatibility analysis</li> <li>EP and Device \u2014 execution provider reference</li> </ul>"},{"location":"commands/analyze/","title":"winml analyze","text":"<p>Verify an ONNX model is compatible with a target execution provider before deployment.</p>"},{"location":"commands/analyze/#when-to-use-this","title":"When to use this","text":"<p>Use <code>winml analyze</code> before running the full build pipeline to confirm that your ONNX model's operators are supported by the intended execution provider and device. It surfaces operator gaps and actionable recommendations early, saving time that would otherwise be spent on a failed compile or quantize run.</p>"},{"location":"commands/analyze/#synopsis","title":"Synopsis","text":"<pre><code>$ winml analyze [options]\n</code></pre>"},{"location":"commands/analyze/#flags","title":"Flags","text":"Flag Short Type Default Description <code>--model</code> <code>-m</code> <code>PATH</code> (required) Path to the ONNX model file to analyze. <code>--ep</code> choice <code>auto</code> Target execution provider. Accepts full names (e.g., <code>QNNExecutionProvider</code>) or short aliases (<code>qnn</code>, <code>openvino</code>, <code>vitisai</code>, <code>cpu</code>, <code>cuda</code>, <code>dml</code>, <code>nvtensorrtrtx</code>, <code>migraphx</code>). Use <code>all</code> for every rule-data-backed EP, or <code>auto</code> to infer from local availability. <code>--device</code> <code>cpu\\|gpu\\|npu\\|all\\|auto</code> <code>auto</code> Target device type. <code>auto</code> infers from local availability; <code>all</code> evaluates all rule-data-backed devices. <code>--verbose</code> <code>-v</code> flag off Enable verbose output. <code>--quiet</code> <code>-q</code> flag off Suppress non-essential output. <code>--config</code> <code>-c</code> <code>PATH</code> (none) Build configuration file (YAML/JSON). <code>--output</code> <code>PATH</code> (none) Save the full JSON result to a file in addition to printing the console summary. <code>--information</code> / <code>--no-information</code> flag enabled Include detailed per-operator recommendations and remediation hints in the output. Pass <code>--no-information</code> for a compact pass/fail summary. <code>--htp-metadata</code> <code>PATH</code> (none) Path to an HTP metadata JSON file (produced by <code>winml export</code>). Enriches subgraph pattern extraction by mapping nodes back to their source module hierarchy. Benefits all target EPs. <code>--run-unknown-op</code> / <code>--no-run-unknown-op</code> flag disabled For operators not in the rule database, build a minimal ONNX graph and run it on the target EP locally to determine support. Enable when local EP libraries are available. <code>--save-node</code> <code>partial\\|unsupported</code> (none) Save partial or unsupported node subgraphs to disk for further investigation. Can be specified multiple times: <code>--save-node partial --save-node unsupported</code>. <code>--optim-config</code> <code>PATH</code> (none) Save the auto-discovered optimization config (merged across all analyzed EPs) to a JSON file."},{"location":"commands/analyze/#how-it-works","title":"How it works","text":"<p><code>winml analyze</code> loads the ONNX model and runs a static analysis pass via <code>ONNXStaticAnalyzer</code>. For each operator (and recognized subgraph pattern), the analyzer consults the target EP's rule database. For operators not in the database, it can optionally probe them locally when <code>--run-unknown-op</code> is enabled. The combined answer classifies each node as supported, partial, unsupported, or unknown (see Analyze and optimize for definitions).</p> <p>The analysis always produces a lint result \u2014 the pass/fail verdict. When <code>--information</code> is enabled (the default), it additionally produces an autoconf result: a set of fusion-flag suggestions that, if applied in the optimize stage, would resolve partial or unsupported patterns. Pass <code>--no-information</code> to skip autoconf and get just the lint verdict.</p>"},{"location":"commands/analyze/#exit-codes","title":"Exit codes","text":"Code Meaning <code>0</code> All operators are fully supported on the target EP. <code>1</code> At least one operator is unsupported, partially supported, or unknown. <code>2</code> Input or configuration error (bad path, unknown EP, etc.). <p>Exit codes make <code>winml analyze</code> safe to use as a CI gate with <code>set -e</code> or <code>$?</code> checks.</p>"},{"location":"commands/analyze/#examples","title":"Examples","text":"<p>Analyze using auto-detected EP and device:</p> <pre><code>$ winml analyze --model microsoft/resnet-50.onnx\n</code></pre> <p>The output shows a live progress table per EP followed by an <code>ANALYSIS SUMMARY</code> section. Each EP line displays support counts in <code>S/P/U/Unk</code> format (Supported / Partial / Unsupported / Unknown) with color-coded indicators.</p> <p>Check QNN NPU support using the short alias:</p> <pre><code>$ winml analyze --model bert-base-uncased.onnx --ep qnn --device NPU\n</code></pre> <p>Check Intel OpenVINO GPU support and print operator-level recommendations:</p> <pre><code>$ winml analyze --model bert-base-uncased.onnx --ep openvino --device GPU --information\n</code></pre> <p>Save the full JSON result for offline inspection while still printing the console summary:</p> <pre><code>$ winml analyze --model facebook/convnext-tiny-224.onnx --output results.json\n</code></pre> <p>Use HTP metadata for enhanced subgraph pattern extraction:</p> <pre><code>$ winml analyze --model bert-base-uncased.onnx \\\n    --ep qnn --device NPU \\\n    --htp-metadata bert-base-uncased_htp_metadata.json\n</code></pre> <p>Run a lint-only pass (no recommendations) for a CI gate:</p> <pre><code>$ winml analyze --model model.onnx --ep qnn --device NPU --no-information\necho \"Exit code: $?\"  # 0 = clean, 1 = issues, 2 = input error\n</code></pre> <p>Dump unsupported subgraphs to disk for debugging:</p> <pre><code>$ winml analyze --model model.onnx --ep qnn \\\n    --save-node partial --save-node unsupported \\\n    --output result.json\n</code></pre> <p>Enable local execution for operators not in the rule database:</p> <pre><code>$ winml analyze --model model.onnx --ep qnn --device NPU --run-unknown-op\n</code></pre>"},{"location":"commands/analyze/#common-pitfalls","title":"Common pitfalls","text":"<ul> <li>Omitting <code>--ep</code> uses <code>auto</code> (inferred from local availability) \u2014 to analyze every EP regardless of what is installed, pass <code>--ep all</code>. Specify <code>--ep &lt;name&gt;</code> when you know your target hardware.</li> <li>Exit code 1 is not a hard failure \u2014 it means at least one operator is unsupported, not that the model cannot run at all. Many EPs fall back unsupported nodes to the CPU EP automatically; review the recommendations before deciding to restructure the model.</li> <li><code>--htp-metadata</code> is EP-agnostic \u2014 HTP metadata enriches pattern extraction before any EP-specific checks, so it benefits all target EPs equally. You do not need separate metadata files per EP.</li> <li><code>--run-unknown-op</code> is disabled by default \u2014 operators not covered by the rule database are classified as <code>UNKNOWN</code> (not unsupported) unless you explicitly pass <code>--run-unknown-op</code> to probe them locally. Enable it only when the target EP's libraries are available on the local machine.</li> <li>The model path must point to an existing <code>.onnx</code> file \u2014 symbolic HuggingFace model IDs are not accepted; export the model first with <code>winml export</code>.</li> </ul>"},{"location":"commands/analyze/#see-also","title":"See also","text":"<ul> <li>Analyze and optimize \u2014 conceptual deep dive on classifications, lint vs autoconf, and the analyzer/optimizer loop</li> <li>eps-and-devices.md \u2014 background on ONNX operators and execution providers</li> <li>export.md \u2014 convert a HuggingFace model to ONNX before analyzing</li> <li>compile.md \u2014 compile the model for the target EP after analysis passes</li> <li>sys.md \u2014 list EPs available on the current machine</li> </ul>"},{"location":"commands/build/","title":"winml build","text":"<p>Run the entire winml-cli pipeline (export \u2192 optimize \u2192 quantize \u2192 compile) in one command.</p>"},{"location":"commands/build/#when-to-use-this","title":"When to use this","text":"<p>Use <code>winml build</code> when you want to go from a Hugging Face model ID (or an existing <code>.onnx</code> file) to a deployment-ready artifact in a single invocation, without manually chaining <code>winml export</code>, <code>winml optimize</code>, <code>winml quantize</code>, and <code>winml compile</code>. A build config file \u2014 generated by <code>winml config</code> \u2014 controls every stage of the pipeline.</p>"},{"location":"commands/build/#synopsis","title":"Synopsis","text":"<pre><code>$ winml build [options]\n</code></pre>"},{"location":"commands/build/#flags","title":"Flags","text":"Flag Short Type Default Description <code>--config</code> <code>-c</code> path <code>None</code> <code>WinMLBuildConfig</code> JSON file, generated by <code>winml config</code>. If omitted, config is auto-generated from <code>-m</code>. <code>--model</code> <code>-m</code> string <code>None</code> Hugging Face model ID or path to an existing <code>.onnx</code> file. <code>--output-dir</code> <code>-o</code> path <code>None</code> Directory for all build artifacts. Mutually exclusive with <code>--use-cache</code>. <code>--use-cache/--no-use-cache</code> flag <code>false</code> Store artifacts in the winml-cli global cache (<code>~/.cache/winml/</code>). Mutually exclusive with <code>--output-dir</code>. <code>--rebuild/--no-rebuild</code> flag <code>false</code> Overwrite existing artifacts and re-run the full pipeline. <code>--quant/--no-quant</code> flag <code>true</code> Run the quantization stage (use <code>--no-quant</code> to skip), overriding the config. <code>--no-compile</code> / <code>--compile</code> flag <code>None</code> Override compilation. <code>--compile</code> forces enable (config must have a compile section). <code>--no-compile</code> forces skip. Default: inherit from config. <code>--optimize/--no-optimize</code> flag <code>true</code> Run the optimization stage (use <code>--no-optimize</code> to skip). <code>--ep</code> string <code>None</code> Target execution provider for the analyzer (e.g., <code>qnn</code>). Falls back to the compile config EP if not set. <code>--device</code> <code>-d</code> string <code>auto</code> Target device for the analyzer (e.g., <code>npu</code>, <code>gpu</code>). Default: <code>auto</code> (auto-detect). <code>--analyze/--no-analyze</code> flag <code>true</code> Run the analyzer loop during build (use <code>--no-analyze</code> to skip). <code>--max-optim-iterations</code> integer <code>None</code> Maximum autoconf re-optimization rounds (3 enforced internally when not set). <code>--no-analyze</code> implicitly sets this to 0. <code>--trust-remote-code/--no-trust-remote-code</code> flag <code>false</code> Allow executing custom code from model repositories. Use only with trusted sources. <code>--allow-unsupported-nodes/--no-allow-unsupported-nodes</code> flag <code>false</code> Allow unsupported nodes to remain in the graph instead of failing the build. <code>--help</code> <code>-h</code> flag Show this message and exit."},{"location":"commands/build/#how-it-works","title":"How it works","text":"<p><code>winml build</code> reads a <code>WinMLBuildConfig</code> JSON file (from <code>winml config</code>) that encodes device, precision, export, quantization, and compilation settings. When <code>-m</code> is a Hugging Face model ID, the full pipeline runs: export \u2192 optimize \u2192 quantize \u2192 compile. When <code>-m</code> points to an existing <code>.onnx</code> file, the export stage is skipped and the pipeline starts at optimization. After compilation, an optional analyzer loop (<code>--max-optim-iterations</code>) re-evaluates graph quality and applies further passes; <code>--no-analyze</code> disables it for a deterministic single-pass build. Individual stages can be suppressed with <code>--no-quant</code>, <code>--no-compile</code>, and <code>--no-optimize</code> without touching the config file.</p> <p>Reproducible CI/CD builds</p> <p>The config file is a portable, self-contained pipeline specification. Check it into source control and invoke <code>winml build -c config.json</code> in CI to produce identical artifacts without manual flag management. Set <code>\"auto\": false</code> in the config to disable the autoconf discovery loop for fully deterministic output.</p>"},{"location":"commands/build/#examples","title":"Examples","text":"<pre><code># Full pipeline: HF model \u2192 export \u2192 optimize \u2192 quantize \u2192 compile\nwinml build -c config.json -m microsoft/resnet-50 -o output/\n</code></pre> <pre><code>winml build\n  Config:     config.json\n  Model:      microsoft/resnet-50\n  Output:     output/\n\n  export       done  (28.3s)\n  optimize     done  (4.1s)\n  quantize     done  (6.8s)\n  compile      done  (14.2s)\n\n  Build complete in 53.4s\n  Final artifact: output/resnet50_ctx.onnx\n</code></pre> <pre><code># Start from a pre-exported ONNX file (skips export stage)\nwinml build -c config.json -m resnet50.onnx -o output/\n</code></pre> <pre><code># Export and optimize only \u2014 skip quantization and compilation for quick testing\nwinml build -c config.json -m bert-base-uncased -o output/ \\\n  --no-quant --no-compile\n</code></pre> <pre><code># Force a clean rebuild, overwriting any cached artifacts\nwinml build -c config.json -m facebook/convnext-tiny-224 -o output/ --rebuild\n</code></pre> <pre><code># Use the global cache and cap optimizer iterations for faster turnaround\nwinml build -c config.json -m microsoft/resnet-50 \\\n  --use-cache --max-optim-iterations 1\n</code></pre>"},{"location":"commands/build/#common-pitfalls","title":"Common pitfalls","text":"<ul> <li>Either <code>--output-dir</code> or <code>--use-cache</code> is required; they are mutually   exclusive. Omitting both raises an error immediately.</li> <li><code>--use-cache</code> is not supported in module mode. When the config is a JSON   array (module mode), only <code>--output-dir</code> is accepted.</li> <li>The config file must come from <code>winml config</code>. The schema is strict;   unknown keys are rejected.</li> <li>Existing artifacts are reused by default. Pass <code>--rebuild</code> to force a   fresh run after changing the config.</li> </ul>"},{"location":"commands/build/#see-also","title":"See also","text":"<ul> <li>winml export</li> <li>winml compile</li> <li>Config and build</li> <li>How it works</li> <li>Config Schema \u2014 full field-by-field config reference</li> <li>Output Layout \u2014 what each output file contains</li> <li>Supported Models \u2014 validated model architectures</li> </ul>"},{"location":"commands/catalog/","title":"winml catalog","text":"<p>Browse the curated winml-cli catalog of validated models and benchmarks.</p>"},{"location":"commands/catalog/#when-to-use-this","title":"When to use this","text":"<p>Use <code>winml catalog</code> to discover which HuggingFace models have been validated end-to-end by the winml-cli team \u2014 exported, quantized, compiled, and benchmarked on real Windows ML devices. It is the starting point when you want a model that is known to work before investing time in a custom build.</p>"},{"location":"commands/catalog/#synopsis","title":"Synopsis","text":"<pre><code>$ winml catalog [options]\n</code></pre>"},{"location":"commands/catalog/#flags","title":"Flags","text":"Flag Short Type Default Description <code>--model-type</code> string <code>null</code> Filter the catalog by model architecture (case-insensitive). Examples: <code>bert</code>, <code>roberta</code>, <code>vit</code>. <code>--task</code> <code>-t</code> string <code>null</code> Filter by HuggingFace task (case-insensitive). Examples: <code>text-classification</code>, <code>image-segmentation</code>. <code>--ep/--execution-provider</code> string <code>null</code> Filter by execution provider (e.g., <code>qnn</code>, <code>dml</code>). If not specified, shows all EPs. <code>--device</code> <code>-d</code> string <code>null</code> Filter by target device (e.g., <code>npu</code>, <code>gpu</code>). If not specified, shows all devices. <code>--output</code> <code>-o</code> path <code>null</code> Save the displayed results to a JSON file. <code>--help</code> <code>-h</code> flag \u2014 Show help and exit. <p><code>winml catalog</code> reads a local catalog bundled with the package \u2014 no network access is required.</p>"},{"location":"commands/catalog/#how-it-works","title":"How it works","text":"<p>The catalog is stored in <code>winml/modelkit/data/hub_models.json</code> and is loaded directly from the installed package data without any network call. Each catalog entry records the model ID, task, architecture type, and model size. Use <code>--model-type</code>, <code>--task</code>, <code>--ep</code>, or <code>--device</code> to narrow the displayed list. When <code>--output</code> is provided, the filtered results are written as indented JSON to the specified path.</p>"},{"location":"commands/catalog/#examples","title":"Examples","text":"<pre><code># List all validated models in the catalog\n$ winml catalog\n</code></pre> <pre><code>+--- winml-cli Catalog  |  12 validated model(s) --------------------------+\n|  Model                             Task                    Model Type     |\n|  microsoft/resnet-50              image-classification    resnet          |\n|  bert-base-uncased                fill-mask               bert            |\n|  ProsusAI/finbert                 text-classification     bert            |\n|  ...                                                                      |\n+---------------------------------------------------------------------------+\nUse  --ep  or  --device  to filter by execution provider or target device.\n</code></pre> <pre><code># Filter to BERT-family models only\n$ winml catalog --model-type bert\n</code></pre> <pre><code># Filter by task \u2014 show only text-classification models\n$ winml catalog --task text-classification\n</code></pre> <pre><code># Combine filters \u2014 BERT models for text classification\n$ winml catalog --model-type bert --task text-classification\n</code></pre> <pre><code># Save filtered results to JSON for offline review\n$ winml catalog --task image-classification --output results/image_catalog.json\n</code></pre>"},{"location":"commands/catalog/#common-pitfalls","title":"Common pitfalls","text":"<ul> <li>The catalog reflects a point-in-time snapshot. Models listed in the catalog   were validated against a specific version of winml-cli, ONNX Runtime, and the   relevant EP driver. Accuracy and latency may differ on your hardware or with   updated drivers.</li> <li><code>--output</code> only saves what was displayed. Combining a filter with <code>--output</code>   saves the filtered list. There is no flag to dump the entire catalog in one call \u2014   omit all filters and add <code>--output</code> to do so.</li> <li>A model not in the catalog can still be used with winml-cli. The catalog covers   tested models; <code>winml inspect</code> and <code>winml export</code> work with any HuggingFace model   that has a supported architecture, whether or not it appears in the catalog.</li> </ul>"},{"location":"commands/catalog/#see-also","title":"See also","text":"<ul> <li>inspect.md \u2014 check loader, exporter, and task detection for any   HuggingFace model ID</li> <li>sys.md \u2014 verify your environment and EP availability before building</li> <li>How winml-cli Works \u2014 pipeline overview from export   to benchmark</li> <li>Quantization &amp; QDQ \u2014 understand quantization concepts   and precision options</li> </ul>"},{"location":"commands/compile/","title":"winml compile","text":"<p>Compile an ONNX model to an EP-specific format for fast runtime loading.</p>"},{"location":"commands/compile/#when-to-use-this","title":"When to use this","text":"<p>Use <code>winml compile</code> as the final pipeline stage after <code>winml quantize</code> to produce an execution-provider-native artifact (for example, a QNN EPContext model) that loads faster and avoids online graph compilation at inference time.</p>"},{"location":"commands/compile/#synopsis","title":"Synopsis","text":"<pre><code>$ winml compile [options]\n</code></pre>"},{"location":"commands/compile/#flags","title":"Flags","text":"Flag Short Type Default Description <code>--model</code> <code>-m</code> path (required unless <code>--list</code>) Input ONNX model file. <code>--output</code> <code>-o</code> path \u2014 Output file path (e.g., <code>model_compiled.onnx</code>). Takes precedence over <code>--output-dir</code>. <code>--output-dir</code> path same dir as input Directory to write compiled output artifacts. <code>--device</code> <code>-d</code> choice <code>auto</code> Target device: <code>auto</code>, <code>npu</code>, <code>gpu</code>, or <code>cpu</code>. <code>--ep</code> <code>TEXT</code> \u2014 Force a specific execution provider, overriding device-to-provider mapping. Accepts full names (e.g., <code>QNNExecutionProvider</code>) or aliases (<code>qnn</code>, <code>dml</code>, <code>openvino</code>, <code>vitisai</code>, <code>migraphx</code>, <code>cpu</code>, <code>nvtensorrtrtx</code>). <code>--validate</code> / <code>--no-validate</code> flag <code>--validate</code> Run a post-compilation validation pass on the target hardware. Enabled by default; pass <code>--no-validate</code> to skip when the target hardware or driver is unavailable. <code>--compiler</code> choice <code>ort</code> Compiler backend: <code>ort</code> (ONNX Runtime) or <code>qairt</code> (Qualcomm AI Runtime Tools). <code>--qnn-sdk-root</code> path <code>None</code> Path to the QNN SDK root directory. <code>--embed/--no-embed</code> flag <code>false</code> Embed the EP context blob inside the ONNX file instead of writing a separate <code>.bin</code> file. <code>--list</code> flag <code>false</code> List available compiler backends for the selected device and exit without compiling. <code>--help</code> <code>-h</code> flag Show this message and exit."},{"location":"commands/compile/#how-it-works","title":"How it works","text":"<p><code>winml compile</code> resolves the target execution provider from <code>--device</code> and <code>--ep</code>, then calls the winml-cli compiler API to hand the ONNX graph to the EP's offline compilation toolchain. When <code>--device auto</code> (the default), the target EP is determined by auto-detecting available hardware. For NPU targets, ONNX Runtime's QNN EP generates a binary <code>.bin</code> context file (or embeds it inline with <code>--embed</code>) that encodes the hardware-optimized execution plan, eliminating graph partitioning at load time. An optional post-compilation validation pass runs a forward pass through the target EP; skip it with <code>--no-validate</code> when the target hardware is absent.</p>"},{"location":"commands/compile/#examples","title":"Examples","text":"<pre><code># Compile with auto device detection (default compiler)\nwinml compile -m resnet50_qdq.onnx\n</code></pre> <pre><code>Input: resnet50_qdq.onnx\nDevice: npu\nProvider: qnn\nCompiler: ort\n\nCompiling model...\n\nSuccess! Model compiled\nOutput: resnet50_qdq_ctx.onnx\nCompile time: 12.40s\nTotal time: 13.05s\n</code></pre> <pre><code># List available compiler backends for NPU before committing to a run\nwinml compile --list --device npu\n</code></pre> <pre><code># Compile a pre-quantized BERT model for NPU with context embedded inline\nwinml compile -m bert-base-uncased_qdq.onnx --embed\n</code></pre> <pre><code># Compile for GPU using the OpenVINO execution provider\nwinml compile -m microsoft_resnet50.onnx --device gpu --ep openvino\n</code></pre>"},{"location":"commands/compile/#common-pitfalls","title":"Common pitfalls","text":"<ul> <li><code>--embed</code> inflates the <code>.onnx</code> file significantly. Embedding the EP   context produces a single portable file but can make it impractical to open or   inspect the ONNX graph with standard tooling.</li> <li>Validation requires the target hardware. The post-compilation validation   step runs an actual inference pass; on a machine without the NPU driver or the   relevant EP installed, always pass <code>--no-validate</code>.</li> <li><code>--device auto</code> auto-detects the best available hardware. Pass <code>--device npu</code>,   <code>--device gpu</code>, or <code>--device cpu</code> explicitly when targeting specific hardware   regardless of what is auto-detected.</li> </ul>"},{"location":"commands/compile/#see-also","title":"See also","text":"<ul> <li>winml quantize</li> <li>winml build</li> <li>ONNX and execution providers</li> </ul>"},{"location":"commands/config/","title":"winml config","text":"<p>Generate a reusable build configuration for a Hugging Face model or ONNX file.</p>"},{"location":"commands/config/#when-to-use-this","title":"When to use this","text":"<p>Use <code>winml config</code> at the start of a new model project to produce a <code>WinMLBuildConfig</code> JSON file. The config captures the model identity, task, precision, and per-stage settings in one shareable artifact that you can edit, version-control, and repeatedly pass to <code>winml build</code>. Running config first lets you review and adjust pipeline settings before committing to a full build.</p>"},{"location":"commands/config/#synopsis","title":"Synopsis","text":"<pre><code>$ winml config [options]\n</code></pre>"},{"location":"commands/config/#flags","title":"Flags","text":"Flag Short Type Default Description <code>--model</code> <code>-m</code> <code>TEXT</code> (none) HuggingFace model ID (e.g., <code>microsoft/resnet-50</code>) or path to an existing <code>.onnx</code> file. Optional when <code>--model-type</code> or <code>--model-class</code> is provided. <code>--task</code> <code>-t</code> <code>TEXT</code> (auto) Override the auto-detected task (e.g., <code>image-classification</code>, <code>text-classification</code>). When omitted, the first supported task for the model is selected automatically. <code>--model-class</code> <code>TEXT</code> (auto) Override the auto-detected model class (e.g., <code>CLIPTextModelWithProjection</code>). Useful for multi-component models. <code>--model-type</code> <code>TEXT</code> (auto) Override the auto-detected model type (e.g., <code>bert</code>, <code>resnet</code>). Can be used without <code>-m</code> to generate a config from HuggingFace default settings. <code>--module</code> <code>TEXT</code> (none) Generate configs for every submodule whose class name matches the given string (e.g., <code>ResNetConvLayer</code>). The output is a JSON array instead of a single object. <code>--config</code> <code>-c</code> <code>PATH</code> (none) JSON override file in <code>WinMLBuildConfig</code> format. Fields present in this file take precedence over auto-detected values. <code>--shape-config</code> <code>PATH</code> (none) JSON file with input shape overrides for dummy input generation. Valid keys by modality \u2014 text: <code>sequence_length</code>; vision: <code>height</code>, <code>width</code>, <code>num_channels</code>; audio: <code>feature_size</code>, <code>nb_max_frames</code>, <code>audio_sequence_length</code>. <code>--device</code> <code>-d</code> <code>auto\\|npu\\|gpu\\|cpu</code> <code>auto</code> Target device. Affects the generated quantization and compilation sub-configs. <code>auto</code> leaves those sections unchanged from the kit defaults. <code>--ep</code> <code>TEXT</code> (none) Force a specific execution provider (<code>qnn</code>, <code>dml</code>, <code>migraphx</code>, <code>tensorrt</code>, <code>vitisai</code>, <code>openvino</code>, <code>cpu</code>). Overrides the device-to-provider mapping. When used without <code>--device</code>, the device is inferred from the EP. <code>--precision</code> <code>-p</code> <code>TEXT</code> <code>auto</code> Target precision: <code>auto</code>, <code>fp32</code>, <code>fp16</code>, <code>int8</code>, <code>int16</code>, or a mixed format such as <code>w8a16</code>. <code>auto</code> selects the precision based on the chosen device. <code>--output</code> <code>-o</code> <code>PATH</code> (stdout) Write the generated JSON to this file instead of printing to stdout. <code>--library</code> <code>TEXT</code> <code>transformers</code> Source library for <code>TasksManager</code> task lookup. Defaults to <code>transformers</code>; set to <code>diffusers</code> or another Optimum-supported library when needed. <code>--quant/--no-quant</code> flag <code>true</code> Include quantization in the generated config (use <code>--no-quant</code> to omit it and set <code>quant</code> to <code>null</code>). <code>--no-compile</code> / <code>--compile</code> flag <code>--no-compile</code> (compile excluded by default) Controls whether compilation is included in the generated config. By default compilation is excluded (<code>compile: null</code>). Pass <code>--compile</code> to include a compile section. <code>--trust-remote-code/--no-trust-remote-code</code> flag <code>false</code> Allow execution of custom model code from the HuggingFace repository. Required for some community models. Only enable for repositories you trust."},{"location":"commands/config/#how-it-works","title":"How it works","text":"<p><code>winml config</code> queries the HuggingFace <code>TasksManager</code> to auto-detect the model's task, class, and ONNX export specification. For known model types it looks up a per-model kit in <code>MODEL_BUILD_CONFIGS</code> and uses that as a starting point, layering in your device, precision, and override file on top. When <code>-m</code> points to an existing <code>.onnx</code> file, the export stage is skipped by setting <code>export</code> to <code>null</code> in the output. The result is a complete <code>WinMLBuildConfig</code> JSON printed to stdout or written to a file, ready to be passed to <code>winml build</code>.</p>"},{"location":"commands/config/#examples","title":"Examples","text":"<p>Generate a config for ResNet-50 with all auto-detected settings:</p> <pre><code>$ winml config -m microsoft/resnet-50\n</code></pre> <pre><code>Generating config for microsoft/resnet-50...\nAuto-selected task: image-classification (from 'microsoft/resnet-50')\nGenerated config for task 'image-classification'\n{\n  \"loader\": { \"task\": \"image-classification\", ... },\n  \"export\": { \"opset_version\": 17, ... },\n  \"optim\": { ... },\n  \"quant\": null,\n  \"compile\": null\n}\n</code></pre> <p>Target NPU with int8 quantization and save to a file:</p> <pre><code>$ winml config -m microsoft/resnet-50 --device npu --precision int8 -o resnet_npu.json\n</code></pre> <p>Generate a config for BERT and override the task:</p> <pre><code>$ winml config -m bert-base-uncased --task text-classification -o bert_cls.json\n</code></pre> <p>Generate from a model type alone (no HuggingFace download required at config time):</p> <pre><code>$ winml config --model-type bert --task fill-mask\n</code></pre> <p>Generate a config from an already-exported ONNX file, skipping quantization (compilation is already excluded by default):</p> <pre><code>$ winml config -m facebook/convnext-tiny-224.onnx --no-quant -o convnext_optim_only.json\n</code></pre>"},{"location":"commands/config/#common-pitfalls","title":"Common pitfalls","text":"<ul> <li>At least one of <code>-m</code>, <code>--model-type</code>, or <code>--model-class</code> is required \u2014 calling <code>winml config</code> with none of these three flags raises a usage error immediately.</li> <li><code>auto</code> precision does not always map to a lower-bit type \u2014 when <code>--device</code> is also <code>auto</code>, precision stays at the kit default (usually <code>fp32</code>). Explicitly pass <code>--device npu</code> or <code>--device gpu</code> for <code>auto</code> precision to resolve to <code>int8</code> or <code>fp16</code>.</li> <li><code>--module</code> changes the output shape \u2014 with <code>--module</code> the JSON output is an array of configs, not a single object. Scripts that expect a single object will fail to parse this output.</li> <li><code>--trust-remote-code</code> has security implications \u2014 only use this flag with model repositories you own or explicitly trust; it allows arbitrary Python execution from the remote model card.</li> <li>Shape overrides in <code>--shape-config</code> are modality-specific \u2014 passing a <code>sequence_length</code> key for a vision model has no effect. Check the <code>--help</code> description for valid keys per modality.</li> </ul>"},{"location":"commands/config/#see-also","title":"See also","text":"<ul> <li>Config and build \u2014 structure of <code>WinMLBuildConfig</code> and how stages interact</li> <li>Config Schema \u2014 full field-by-field config reference</li> <li>Supported Models \u2014 validated model architectures</li> <li>build.md \u2014 run the full pipeline using a generated config</li> <li>export.md \u2014 export a HuggingFace model to ONNX as a standalone step</li> <li>optimize.md \u2014 apply graph optimizations to an existing ONNX file</li> </ul>"},{"location":"commands/eval/","title":"winml eval","text":"<p>Evaluate ONNX model accuracy on a standard dataset.</p>"},{"location":"commands/eval/#when-to-use-this","title":"When to use this","text":"<p>Use <code>winml eval</code> to measure how accurately a model performs on real data \u2014 especially after quantization, where comparing the quantized model against the floating-point baseline reveals any accuracy regression introduced by precision reduction.</p>"},{"location":"commands/eval/#synopsis","title":"Synopsis","text":"<pre><code>$ winml eval [options]\n</code></pre>"},{"location":"commands/eval/#flags","title":"Flags","text":"Flag Short Type Default Description <code>--model</code> <code>-m</code> <code>TEXT</code> \u2014 HuggingFace model ID, or path to a local <code>.onnx</code> file. Required (unless <code>--model-id</code> is provided directly). <code>--model-id</code> <code>TEXT</code> \u2014 HuggingFace model ID used for preprocessor and config resolution when <code>-m</code> points to an <code>.onnx</code> file. Required when <code>-m</code> is an ONNX file. <code>--task</code> <code>TEXT</code> auto-detected Task name (e.g., <code>image-classification</code>). Auto-detected from <code>--model-id</code> when not provided. Required when <code>-m</code> is an ONNX file and the task cannot be inferred. <code>--precision</code> <code>TEXT</code> <code>auto</code> Precision used when building the model from a HuggingFace ID. One of <code>auto</code>, <code>fp32</code>, <code>fp16</code>, <code>int8</code>, <code>int16</code>, or a mixed <code>w{x}a{y}</code> spec (e.g., <code>w8a16</code>). <code>fp16</code>/<code>fp32</code> skip quantization. Ignored when <code>-m</code> is a pre-built <code>.onnx</code> file \u2014 the precision is already baked in. <code>--device</code> choice <code>auto</code> Target device. Choices: <code>auto</code>, <code>npu</code>, <code>gpu</code>, <code>cpu</code>. <code>auto</code> selects the best available device. Combined with <code>--precision</code>, this drives the build when <code>-m</code> is a HuggingFace ID. <code>--ep</code> / <code>--execution-provider</code> <code>TEXT</code> \u2014 Target ONNX Runtime execution provider when finer control than <code>--device</code> is needed. Full names (e.g., <code>QNNExecutionProvider</code>, <code>OpenVINOExecutionProvider</code>, <code>VitisAIExecutionProvider</code>) and aliases (<code>qnn</code>, <code>ov</code>/<code>openvino</code>, <code>vitis</code>/<code>vitisai</code>) are accepted. <code>--dataset</code> <code>TEXT</code> task default HuggingFace dataset path (e.g., <code>imagenet-1k</code>, <code>nyu-mll/glue</code>). If omitted, a default dataset is selected based on the task. <code>--dataset-name</code> <code>TEXT</code> \u2014 Dataset configuration name for multi-config datasets. <code>--dataset-revision</code> <code>TEXT</code> \u2014 Git revision (branch, tag, or commit) of the dataset to load. Use <code>refs/convert/parquet</code> for HF datasets that are only served via the parquet mirror. <code>--dataset-script</code> <code>TEXT</code> \u2014 Path to a Python script that builds the evaluation dataset locally. Requires <code>--trust-remote-code</code>. <code>--trust-remote-code / --no-trust-remote-code</code> flag <code>false</code> Allow executing custom code from model repositories or dataset scripts. Required with <code>--dataset-script</code>. Use only with trusted sources. <code>--samples</code> <code>INTEGER</code> <code>100</code> Number of dataset samples to evaluate. <code>--split</code> <code>TEXT</code> <code>validation</code> Dataset split to use (e.g., <code>validation</code>, <code>test</code>, <code>train</code>). <code>--shuffle / --no-shuffle</code> flag <code>shuffle</code> Shuffle the dataset before sampling. Disable with <code>--no-shuffle</code> for reproducible sample ordering. <code>--streaming / --no-streaming</code> flag <code>false</code> Stream the dataset from the Hub instead of downloading the full split. Useful for large datasets. <code>--column</code> <code>TEXT</code> (multiple) \u2014 Column mapping as <code>key=value</code> pairs (e.g., <code>--column input_column=image</code>). Can be specified multiple times. <code>--label-mapping</code> <code>PATH</code> \u2014 Path to a JSON file mapping dataset label names to the integer class IDs the model emits: <code>{\"label_name\": id}</code>. <code>--output</code> <code>-o</code> <code>PATH</code> \u2014 Output JSON file path for the evaluation results. <code>--schema</code> flag <code>false</code> Print the expected dataset schema for the given <code>--task</code> and exit. Does not run evaluation. <code>--mode</code> <code>onnx\\|compare</code> <code>onnx</code> Evaluation mode. <code>onnx</code> evaluates the ONNX candidate on a dataset. <code>compare</code> runs the ONNX candidate and the HuggingFace reference on identical random inputs and reports per-tensor similarity metrics \u2014 no dataset required."},{"location":"commands/eval/#how-it-works","title":"How it works","text":"<p><code>winml eval</code> loads the model and runs the evaluation pipeline via the internal <code>evaluate</code> function (supporting both HuggingFace IDs and local ONNX files), then pulls the requested number of samples from a HuggingFace dataset. Each sample is preprocessed using the tokenizer or image processor associated with the model ID, passed through the ONNX Runtime session, and the output is compared against the ground-truth label. Aggregated metrics (accuracy, F1, etc.) are printed to the console and optionally written to a JSON file. When <code>-m</code> is an ONNX file, <code>--model-id</code> must be provided so the command knows which preprocessor and label vocabulary to use.</p>"},{"location":"commands/eval/#examples","title":"Examples","text":"<p>Evaluate a HuggingFace model using the task-default dataset:</p> <pre><code>$ winml eval -m microsoft/resnet-50\n</code></pre> <pre><code>Task:     image-classification\nDataset:  timm/mini-imagenet (test, 100 samples)\nDevice:   auto\n\nAccuracy: 76.00%\n\nResults saved to: microsoft_resnet-50_eval.json\n</code></pre> <p>Evaluate a pre-exported ONNX file, providing the source model ID for preprocessing:</p> <pre><code>$ winml eval -m model.onnx --model-id microsoft/resnet-50 --dataset timm/mini-imagenet\n</code></pre> <p>Evaluate a BERT model on the MRPC paraphrase task with column remapping:</p> <pre><code>$ winml eval -m Intel/bert-base-uncased-mrpc --dataset nyu-mll/glue --dataset-name mrpc --column input_column=sentence1 --column second_input_column=sentence2 --samples 500\n</code></pre> <p>Check what dataset columns are expected before running, then remap them to match your dataset:</p> <pre><code>$ winml eval --schema --task text-classification\n</code></pre> <pre><code>Input schema for text-classification models\n==================================================\n\n--column option schema\n\nEvaluating needs a dataset with the following columns:\n  input_column\n      input text (default: text)\n  label_column\n      class label (ClassLabel or integer) (default: label)\n  second_input_column\n      second text for sentence-pair tasks (optional) (default: None)\n\nOverride any default with --column:\n  --column input_column=&lt;your_text_column&gt;\n  --column label_column=&lt;your_label_column&gt;\n  --column second_input_column=&lt;your_pair_column&gt;\n</code></pre> <p>The GLUE SST-2 dataset uses <code>sentence</code> instead of the default <code>text</code> column, so remap it with a single <code>--column</code> override:</p> <pre><code>$ winml eval -m distilbert/distilbert-base-uncased-finetuned-sst-2-english --dataset nyu-mll/glue --dataset-name sst2 --column input_column=sentence --samples 500\n</code></pre> <p>Evaluate against a custom dataset whose label names differ from the model's class IDs. The <code>--label-mapping</code> flag points to a JSON file whose keys are the label name strings as they appear in the dataset and whose values are the integer class IDs the model emits. For example, ResNet-50 outputs ImageNet-1k class IDs (<code>0</code>\u2013<code>999</code>), so if your custom dataset uses readable strings like <code>\"tabby cat\"</code> or <code>\"golden retriever\"</code>, <code>labels.json</code> translates each dataset label to the corresponding ImageNet ID the model predicts:</p> <pre><code>{\n  \"tabby cat\": 281,\n  \"Egyptian cat\": 285,\n  \"golden retriever\": 207\n}\n</code></pre> <pre><code>$ winml eval -m microsoft/resnet-50 --dataset my-org/my-pets-dataset --label-mapping labels.json -o results/resnet_eval.json\n</code></pre> <p>Evaluate a composite model from pre-exported ONNX files. Some tasks (e.g., <code>image-to-text</code>, encoder-decoder, dual-encoder) split the model across multiple ONNX files, one per role. Pass <code>-m</code> once per role as <code>&lt;role&gt;=&lt;path&gt;.onnx</code> and supply <code>--model-id</code> so the preprocessor and tokenizer can be resolved. Run <code>winml eval --schema --task image-to-text</code> to see the expected roles for a task:</p> <pre><code>$ winml eval -m encoder=encoder.onnx -m decoder=decoder.onnx --model-id microsoft/trocr-base-printed\n</code></pre>"},{"location":"commands/eval/#common-pitfalls","title":"Common pitfalls","text":"<ul> <li>ONNX file without <code>--model-id</code> fails. When <code>-m</code> is a <code>.onnx</code> path, <code>--model-id</code> is mandatory. Without it the command cannot resolve the preprocessor or label vocabulary and will exit with a usage error.</li> <li>The task-default dataset may not match every model. A default dataset cannot fit every model. Classification and detection models in particular need a dataset whose label space and domain match what the model was trained on \u2014 using the default may produce misleadingly low scores, missing-label errors, or a dataset-schema error. Always pass <code>--dataset</code> (and <code>--label-mapping</code> if needed) when evaluating a model whose label space or domain differs from the task default.</li> <li>Some dataset requires Hub credentials for gated datasets. Some datasets (e.g., <code>imagenet-1k</code>) require a HuggingFace account with accepted terms of use. Log in with <code>huggingface-cli login</code> before running eval on gated data.</li> <li><code>--shuffle</code> is on by default. The random 100-sample slice changes between runs unless you pass <code>--no-shuffle</code>. Use <code>--no-shuffle</code> when comparing two model variants to ensure they see identical samples.</li> <li><code>--streaming</code> skips the local cache. Streaming mode avoids downloading the full split but prevents random shuffling on large datasets. For reproducible evaluation, download the split once and omit <code>--streaming</code>.</li> <li>Column names vary across datasets. If the evaluator raises a missing-column error, run <code>winml eval --schema --task &lt;task&gt;</code> to inspect the expected schema and use <code>--column</code> to remap dataset field names to the expected names.</li> </ul>"},{"location":"commands/eval/#see-also","title":"See also","text":"<ul> <li>winml perf \u2014 measure latency and throughput on the same model</li> <li>winml build \u2014 produce the quantized artifact to evaluate</li> <li>Quantization &amp; QDQ \u2014 why accuracy validation after quantization matters</li> <li>ONNX &amp; Execution Providers \u2014 understand the <code>--device</code> option</li> </ul>"},{"location":"commands/export/","title":"winml export","text":"<p>Convert a PyTorch / Hugging Face model to ONNX, preserving module hierarchy.</p>"},{"location":"commands/export/#when-to-use-this","title":"When to use this","text":"<p>Use <code>winml export</code> when you have a Hugging Face model ID or a local PyTorch checkpoint and need an ONNX file as the first step of the optimization pipeline. This is the entry point before <code>winml quantize</code> or <code>winml compile</code>.</p>"},{"location":"commands/export/#synopsis","title":"Synopsis","text":"<pre><code>$ winml export [options]\n</code></pre>"},{"location":"commands/export/#flags","title":"Flags","text":"Flag Short Type Default Description <code>--model</code> <code>-m</code> string (required) Hugging Face model name or local path (e.g., <code>prajjwal1/bert-tiny</code>). <code>--output</code> <code>-o</code> path (required) Output ONNX file path (e.g., <code>model.onnx</code>). <code>--with-report/--no-with-report</code> flag <code>false</code> Generate full export reports: Markdown, JSON, and a console tree. <code>--hierarchy/--no-hierarchy</code> flag <code>true</code> Preserve <code>hierarchy_tag</code> metadata in ONNX nodes (use <code>--no-hierarchy</code> for a clean ONNX file). <code>--dynamo/--no-dynamo</code> flag <code>false</code> Enable PyTorch 2.9+ dynamo export for richer node metadata. (Experimental \u2014 currently logs a warning.) <code>--torch-module</code> string <code>None</code> Comma-separated list of <code>torch.nn</code> module types to include in hierarchy (e.g., <code>LayerNorm,Embedding</code>). (Experimental \u2014 currently logs a warning.) <code>--input-specs</code> path <code>None</code> JSON file with explicit input tensor specifications. Auto-generated when omitted. <code>--task</code> <code>-t</code> string <code>None</code> Override auto-detected Hugging Face task (e.g., <code>image-feature-extraction</code>). <code>--export-config</code> path <code>None</code> JSON file with ONNX export parameters such as <code>opset_version</code> and <code>do_constant_folding</code>. <code>--shape-config</code> path <code>None</code> JSON object mapping symbolic dimension names to concrete sizes (e.g., <code>{\"sequence_length\": 2048}</code>). Ignored when <code>--input-specs</code> is provided. <code>--trust-remote-code/--no-trust-remote-code</code> flag <code>false</code> Allow executing custom code from model repositories during export. Use only with trusted sources. <code>--allow-unsupported-nodes/--no-allow-unsupported-nodes</code> flag <code>false</code> Allow unsupported nodes to remain in the exported graph instead of failing export. <code>--help</code> <code>-h</code> flag Show this message and exit."},{"location":"commands/export/#how-it-works","title":"How it works","text":"<p><code>winml export</code> loads the model via Hugging Face <code>transformers</code>, then runs the eight-step Hierarchy-preserving Tags Protocol (HTP): model preparation, input generation, module-hierarchy tracing, TorchScript ONNX export, node-tagger creation, per-node tagging, tag injection into ONNX <code>metadata_props</code>, and optional report generation. The hierarchy metadata allows downstream tools to reason about operators grouped by their originating module rather than flat graph position. When <code>--no-hierarchy</code> is specified, hierarchy steps are bypassed and a bare ONNX file is written, useful for third-party tools that do not understand custom metadata.</p>"},{"location":"commands/export/#examples","title":"Examples","text":"<pre><code># Minimal export: Hugging Face model ID to ONNX file\nwinml export -m microsoft/resnet-50 -o resnet50.onnx\n</code></pre> <pre><code>Model: microsoft/resnet-50\nOutput: resnet50.onnx\n\nStarting HTP export...\n  Detected task: image-classification\n\nSuccess! Model exported to: resnet50.onnx\n</code></pre> <pre><code># Export with verbose output and full Markdown + JSON reports\nwinml export -m facebook/convnext-tiny-224 -o convnext.onnx -v --with-report\n</code></pre> <pre><code># Export a BERT model, overriding input shapes for longer sequences\nwinml export -m bert-base-uncased -o bert.onnx \\\n  --shape-config shape.json\n# shape.json: {\"sequence_length\": 512}\n</code></pre> <pre><code># Export with a hand-crafted input-spec file (skips auto-detection)\nwinml export -m bert-base-uncased -o bert.onnx --input-specs inputs.json\n</code></pre> <pre><code># Produce clean ONNX without hierarchy metadata (for third-party optimizers)\nwinml export -m microsoft/resnet-50 -o resnet50_clean.onnx --no-hierarchy\n</code></pre>"},{"location":"commands/export/#see-also","title":"See also","text":"<ul> <li>winml optimize \u2014 the next pipeline stage after export</li> <li>Supported Models \u2014 full list of validated architectures</li> <li>Load and export concept \u2014 details on the export process</li> </ul>"},{"location":"commands/export/#common-pitfalls","title":"Common pitfalls","text":"<ul> <li>Task detection fails on unusual model IDs. If auto-detection picks the   wrong task (or fails entirely), pass <code>-t</code> with the correct task string, for   example <code>-t image-feature-extraction</code>.</li> <li><code>--shape-config</code> is silently ignored when <code>--input-specs</code> is set. <code>--input-specs</code> takes full priority; remove it if you only want to override   individual dimensions.</li> <li><code>--dynamo</code> and <code>--torch-module</code> are experimental. Both flags emit a   warning and have no effect in the current release. Do not rely on them in   automated pipelines yet.</li> <li>Output directory must be writable. The command creates parent directories   automatically, but will fail with a permission error on read-only paths.</li> <li>Model weights are downloaded to the Hugging Face cache. Set <code>HF_HOME</code> or   <code>HF_HUB_CACHE</code> to control the download location.</li> </ul>"},{"location":"commands/export/#see-also_1","title":"See also","text":"<ul> <li>winml quantize</li> <li>winml compile</li> <li>winml build</li> <li>Load and export concept</li> </ul>"},{"location":"commands/inspect/","title":"winml inspect","text":"<p>Inspect a model's tasks, classes, and hierarchy before committing to an export.</p>"},{"location":"commands/inspect/#when-to-use-this","title":"When to use this","text":"<p>Use <code>winml inspect</code> to understand how winml-cli will treat a HuggingFace model before running <code>winml export</code> or <code>winml build</code>. It answers questions like \"which task will be auto-detected?\", \"which HF model class will be loaded?\", and \"does this model have a supported exporter?\" without downloading weights or writing any files.</p>"},{"location":"commands/inspect/#synopsis","title":"Synopsis","text":"<pre><code>$ winml inspect -m &lt;model_id&gt; [options]\n</code></pre>"},{"location":"commands/inspect/#flags","title":"Flags","text":"Flag Short Type Default Description <code>--model</code> <code>-m</code> string required HuggingFace model ID (e.g. <code>openai/clip-vit-base-patch32</code>). Required unless <code>--list-tasks</code> or <code>--help</code> is used. <code>--format</code> <code>-f</code> <code>table</code> | <code>json</code> <code>table</code> Output format. <code>table</code> renders rich panels; <code>json</code> emits a machine-readable object. <code>--task</code> <code>-t</code> string <code>null</code> Override the auto-detected task (e.g. <code>image-classification</code>, <code>feature-extraction</code>). <code>--hierarchy/--no-hierarchy</code> <code>-H</code> flag <code>false</code> Print the PyTorch module tree. Instantiates the model with random weights \u2014 no weight download required. <code>--verbose</code> <code>-v</code> flag <code>false</code> Show full configuration details. <code>--list-tasks</code> flag <code>false</code> List all known tasks and exit. Does not require <code>--model</code>. <code>--model-type</code> string <code>null</code> Override model type (e.g. <code>bert</code>, <code>resnet</code>). Can be used without <code>--model</code>. <code>--model-class</code> string <code>null</code> Override model class (e.g. <code>BertForMaskedLM</code>). Can be used without <code>--model</code>. <code>--help</code> <code>-h</code> flag \u2014 Show help and exit. <p><code>winml inspect</code> does not accept <code>--device</code>, <code>--ep</code>, <code>--precision</code>, or <code>--output</code>. It is a read-only discovery command that does not produce any artifacts.</p>"},{"location":"commands/inspect/#how-it-works","title":"How it works","text":"<p><code>winml inspect</code> calls into the winml-cli registry to resolve the model ID against the known loader and exporter configurations. It fetches only the model's <code>config.json</code> from HuggingFace Hub (no weights), uses the architecture field to look up the matching HF model class and WinML inference class, and then renders the result. When <code>--hierarchy</code> is supplied, the model is instantiated locally with random weights using <code>AutoModel.from_config()</code>, and a forward-pass trace records the full PyTorch module tree. Because no real weights are downloaded, hierarchy inspection is fast even for large models.</p>"},{"location":"commands/inspect/#examples","title":"Examples","text":"<pre><code># Basic inspection \u2014 check task detection and loader/exporter classes\n$ winml inspect -m microsoft/resnet-50\n</code></pre> <pre><code>+--------------------------- microsoft/resnet-50 ---------------------------+\n| Task          image-classification                                         |\n| Model Class   ResNetForImageClassification                                 |\n| Exporter      OptimumExporter                                              |\n| WinML Class   WinMLImageClassificationModel                                |\n| Status        Supported                                                    |\n+---------------------------------------------------------------------------+\n</code></pre> <pre><code># JSON output \u2014 useful for scripting or CI pre-flight checks\n$ winml inspect -m bert-base-uncased --format json\n</code></pre> <pre><code># Override task when auto-detection picks the wrong one\n$ winml inspect -m bert-base-uncased --task feature-extraction\n</code></pre> <pre><code># Print the full PyTorch module hierarchy (no weight download)\n$ winml inspect -m openai/clip-vit-base-patch32 --hierarchy\n</code></pre> <pre><code># Combine verbose logging with hierarchy for deep diagnostics\n$ winml inspect -m facebook/convnext-tiny-224 -v -H\n</code></pre>"},{"location":"commands/inspect/#common-pitfalls","title":"Common pitfalls","text":"<ul> <li><code>--model</code> is required for model inspection. The flag is marked required for model-specific lookups; omitting it returns an error. The only exception is <code>--list-tasks</code>, which lists all known tasks and exits without needing a model.</li> <li>Hierarchy requires a locally installable model config. If the model config   references a custom architecture not in the local <code>transformers</code> installation,   <code>--hierarchy</code> will fail with an import error. Update <code>transformers</code> or omit the flag.</li> <li>Task override affects all output. Passing <code>--task</code> changes which exporter and   WinML class are reported, not just the task field. If the override is incompatible   with the model architecture, the status will show as unsupported.</li> <li><code>--format json</code> is silent on unsupported models. When the model is not found in   the winml-cli registry, the command raises a <code>ClickException</code>. Wrap the call in   <code>winml inspect ... &amp;&amp; ...</code> or check the exit code when scripting.</li> <li>No weight download does not mean no network access. The <code>config.json</code> is always   fetched from HuggingFace Hub. Set <code>HF_HUB_OFFLINE=1</code> if you need fully offline   inspection of a locally cached model.</li> </ul>"},{"location":"commands/inspect/#see-also","title":"See also","text":"<ul> <li>catalog.md \u2014 browse the curated catalog and check accuracy verdicts before   inspecting</li> <li>Supported Models \u2014 full list of validated model architectures</li> <li>Load and export concept \u2014 how <code>winml.hierarchy.tag</code>   metadata is written and what you can do with the module tree</li> <li>How winml-cli Works \u2014 pipeline overview showing where   inspect fits before export</li> <li>ONNX &amp; Execution Providers \u2014 background on loaders,   exporters, and EP-specific configurations</li> </ul>"},{"location":"commands/optimize/","title":"winml optimize","text":"<p>Apply graph optimizations and fusions to an ONNX model to reduce node count and improve inference speed.</p>"},{"location":"commands/optimize/#when-to-use-this","title":"When to use this","text":"<p>Use <code>winml optimize</code> after exporting an ONNX model and before quantization or compilation. Graph fusions reduce operator count, improve memory locality, and can make downstream quantization more accurate by presenting cleaner subgraphs to the calibration pass. It is also useful as a standalone step when you want to optimize a pre-exported ONNX file without running the full build pipeline.</p>"},{"location":"commands/optimize/#synopsis","title":"Synopsis","text":"<pre><code>$ winml optimize [options]\n</code></pre>"},{"location":"commands/optimize/#flags","title":"Flags","text":"Flag Short Type Default Description <code>--model</code> <code>-m</code> <code>PATH</code> (required unless listing) Input ONNX model file. Not required when <code>--list-capabilities</code> or <code>--list-rewrites</code> is used. <code>--output</code> <code>-o</code> <code>PATH</code> <code>{input}_opt.onnx</code> Output path for the optimized model. Defaults to the input filename with <code>_opt</code> inserted before the extension. <code>--config</code> <code>-c</code> <code>PATH</code> (none) YAML or JSON configuration file. Fields in the file override capability defaults; CLI flags override the file. <code>--verbose</code> <code>-v</code> flag off Enable verbose output. <code>--list-capabilities</code> <code>-l</code> flag off Print all registered optimization capabilities grouped by category and exit. Add <code>--verbose</code> for descriptions and ORT names. <code>--list-rewrites</code> flag off Print all available pattern-rewrite families with their source-to-target mappings and exit. (dynamic) flag (per capability) Each registered capability generates a <code>--enable-&lt;name&gt;</code> / <code>--disable-&lt;name&gt;</code> pair. Run <code>--list-capabilities</code> to see the full current list. Examples: <code>--enable-gelu-fusion</code>, <code>--disable-constant-folding</code>. Pattern-rewrite flags follow the form <code>--enable-&lt;source-slug&gt;-&lt;target-slug&gt;</code>; run <code>--list-rewrites</code> to discover all names."},{"location":"commands/optimize/#configuration-precedence","title":"Configuration precedence","text":"<p>When multiple sources are provided, settings are resolved in this order (highest wins):</p> <ol> <li>Explicit CLI flags (<code>--enable-X</code> / <code>--disable-X</code>)</li> <li>Config file (<code>-c</code>)</li> <li>Capability defaults</li> </ol>"},{"location":"commands/optimize/#how-it-works","title":"How it works","text":"<p><code>winml optimize</code> loads the ONNX model, builds a final capability configuration by merging capability defaults, an optional config file, and any explicit CLI flags, then runs all enabled passes through the <code>Optimizer</code>. Each capability maps to a named optimization or fusion pipe in the <code>winml.modelkit.optim</code> registry. The capability flags are auto-generated at startup from that registry \u2014 adding a new optimization to the registry automatically makes it available as a CLI flag without any change to this command's source. After optimization, the command prints the before-and-after node count and percentage reduction so you can quantify the effect.</p>"},{"location":"commands/optimize/#examples","title":"Examples","text":"<p>Optimize a model with all capability defaults:</p> <pre><code>$ winml optimize -m microsoft/resnet-50.onnx\n</code></pre> <pre><code>Input:  microsoft/resnet-50.onnx\nOutput: microsoft/resnet-50_opt.onnx\n\nLoading model...\nRunning optimizer...\nSaving optimized model...\n\nSuccess! Model optimized: microsoft/resnet-50_opt.onnx\nNodes: 312 -&gt; 289 (7.4% reduction)\n</code></pre> <p>Enable specific fusions for a BERT model:</p> <pre><code>$ winml optimize -m bert-base-uncased.onnx \\\n    --enable-layer-norm-fusion \\\n    --enable-attention-fusion \\\n    -o bert_layernorm_attn.onnx\n</code></pre> <p>Use a config file to set capabilities and save the result for downstream compilation:</p> <pre><code>$ winml optimize -m facebook/convnext-tiny-224.onnx \\\n    -c optimize_config.yaml \\\n    -o convnext_opt.onnx\n</code></pre> <p>List all available optimization capabilities:</p> <pre><code>$ winml optimize --list-capabilities\n</code></pre> <p>Discover pattern-rewrite families and their flag names:</p> <pre><code>$ winml optimize --list-rewrites\n</code></pre>"},{"location":"commands/optimize/#common-pitfalls","title":"Common pitfalls","text":"<ul> <li><code>--model</code> is required for actual optimization \u2014 it can be omitted only when using <code>--list-capabilities</code> or <code>--list-rewrites</code>. Missing <code>--model</code> in any other case raises a usage error.</li> <li>Config file and CLI flags interact via precedence \u2014 a <code>--disable-X</code> CLI flag always wins over a config file value that enables the same capability, but omitting the flag leaves the config file value in effect. To turn off a capability set by a config file, pass the explicit <code>--disable-X</code> flag.</li> <li>Config file validation errors abort the run \u2014 if the config file contains keys that fail capability validation or dependency checks, the command prints all errors and exits with code 1 without touching the model. Fix the config before retrying.</li> <li>The dynamic flag list changes between releases \u2014 new capabilities are added as the optimizer registry grows. Always use <code>--list-capabilities</code> to confirm the current set of flags rather than relying on a cached list.</li> <li>Output path default may overwrite a sibling file \u2014 if you run optimize twice on the same input without specifying <code>-o</code>, the second run silently overwrites <code>{input}_opt.onnx</code>. Specify an explicit output path in scripts.</li> </ul>"},{"location":"commands/optimize/#see-also","title":"See also","text":"<ul> <li>how-it-works.md \u2014 where optimization fits in the full winml-cli pipeline</li> <li>export.md \u2014 produce an ONNX file to optimize from a HuggingFace model</li> <li>quantize.md \u2014 quantize the optimized model for lower-precision inference</li> <li>config.md \u2014 generate a <code>WinMLBuildConfig</code> that includes optimization settings</li> </ul>"},{"location":"commands/overview/","title":"Commands","text":"<p>winml-cli exposes a CLI named <code>winml</code> with 12 subcommands covering the full journey from model discovery to a deployment-ready artifact. Every subcommand shares a consistent invocation style \u2014 <code>winml &lt;command&gt; [flags]</code> \u2014 and the same global flags are available on the root <code>winml</code> group.</p> <p>The commands group by user intent. Discover (<code>sys</code>, <code>inspect</code>, <code>catalog</code>, <code>analyze</code>) helps you understand your hardware and model before writing any artifacts. Configure (<code>config</code>, <code>optimize</code>) produces a reusable build configuration and tunes the ONNX graph. Build (<code>export</code>, <code>quantize</code>, <code>compile</code>, <code>build</code>) runs the pipeline stages that produce deployment artifacts. Measure (<code>perf</code>, <code>eval</code>) benchmarks and validates the result.</p> <p>The typical workflow follows that order: run <code>winml sys</code> to confirm hardware and EPs, then <code>winml inspect</code> or <code>winml catalog</code> to verify model support. Use <code>winml config</code> to generate a build configuration, then <code>winml build</code> to execute the full pipeline \u2014 or chain <code>export</code> \u2192 <code>analyze</code> \u2192 <code>optimize</code> \u2192 <code>quantize</code> \u2192 <code>compile</code> individually for finer control. Close with <code>winml perf</code> and <code>winml eval</code> to measure speed and accuracy.</p>"},{"location":"commands/overview/#command-map","title":"Command map","text":"Command Group Purpose <code>sys</code> Discover Inspect your machine \u2014 devices, EPs, and runtime versions at a glance. <code>inspect</code> Discover Inspect a model's tasks, classes, and hierarchy before committing to an export. <code>catalog</code> Discover Browse the curated winml-cli catalog of validated models and benchmarks. <code>config</code> Configure Generate a reusable build configuration for a Hugging Face model or ONNX file. <code>export</code> Build Convert a PyTorch / Hugging Face model to ONNX, preserving module hierarchy. <code>analyze</code> Build Verify an ONNX model is compatible with a target execution provider before deployment. <code>optimize</code> Build Apply graph optimizations and fusions to an ONNX model to reduce node count and improve inference speed. <code>quantize</code> Build Quantize an ONNX model with QDQ insertion and calibration-based scaling. <code>compile</code> Build Compile an ONNX model to an EP-specific format for fast runtime loading. <code>build</code> Build Run the entire winml-cli pipeline (export \u2192 optimize \u2192 quantize \u2192 compile) in one command. <code>perf</code> Measure Benchmark an ONNX model's latency and throughput on a target device. <code>eval</code> Measure Evaluate ONNX model accuracy on a standard dataset."},{"location":"commands/overview/#choosing-a-command","title":"Choosing a command","text":"<ul> <li>I want to see what hardware and EPs I have \u2192 <code>winml sys</code></li> <li>I want to know if my model is supported \u2192 <code>winml inspect</code></li> <li>I want to browse validated models with known benchmarks \u2192 <code>winml catalog</code></li> <li>I want to verify EP operator compatibility before compiling \u2192 <code>winml analyze</code></li> <li>I want to convert a Hugging Face model to ONNX \u2192 <code>winml export</code></li> <li>I want to run the whole pipeline in one go \u2192 <code>winml build</code></li> <li>I want to benchmark latency and throughput \u2192 <code>winml perf</code></li> <li>I want to measure model accuracy \u2192 <code>winml eval</code></li> </ul>"},{"location":"commands/overview/#global-flags","title":"Global flags","text":"<p><code>-v</code> / <code>--verbose</code>, <code>-q</code> / <code>--quiet</code>, <code>--version</code>, and <code>-h</code> / <code>--help</code> live on the root <code>winml</code> group only. Subcommands access them through <code>ctx.obj</code> and do not redefine them. See <code>src/winml/modelkit/cli.py</code> for the canonical contract.</p>"},{"location":"commands/overview/#shared-flags","title":"Shared flags","text":"<p>Several flags share semantics across the commands that accept them: <code>-m</code> / <code>--model</code>, <code>-d</code> / <code>--device</code>, <code>--ep</code>, <code>-o</code> / <code>--output</code>, <code>-t</code> / <code>--task</code>, and <code>--precision</code>. Defaults and accepted values can differ per command (e.g., <code>-p</code> is a short form for <code>--precision</code> only on <code>config</code> and <code>quantize</code>); check the Flags section of each command page rather than assuming they transfer.</p>"},{"location":"commands/overview/#see-also","title":"See also","text":"<ul> <li>How winml-cli Works \u2014 end-to-end pipeline overview</li> <li>Config and build \u2014 structure of <code>WinMLBuildConfig</code> and how stages interact</li> <li>ONNX &amp; Execution Providers \u2014 background on EPs and how <code>--device</code> / <code>--ep</code> interact</li> <li>winml build \u2014 the single command that runs the entire pipeline</li> </ul>"},{"location":"commands/perf/","title":"winml perf","text":"<p>Benchmark an ONNX model's latency and throughput on a target device.</p>"},{"location":"commands/perf/#when-to-use-this","title":"When to use this","text":"<p>Use <code>winml perf</code> when you want a quantitative latency and throughput baseline for a model on a specific device, or when you need to compare the performance impact of different precision settings, execution providers, or batch sizes.</p>"},{"location":"commands/perf/#synopsis","title":"Synopsis","text":"<pre><code>$ winml perf [options]\n</code></pre>"},{"location":"commands/perf/#flags","title":"Flags","text":"Flag Short Type Default Description <code>--model</code> <code>-m</code> <code>TEXT</code> \u2014 HuggingFace model ID or path to a local <code>.onnx</code> file. Required. <code>--task</code> <code>TEXT</code> auto-detected Explicit task override (e.g., <code>image-classification</code>). Inferred from the model if omitted. <code>--iterations</code> <code>INTEGER</code> <code>100</code> Number of timed inference iterations used to compute statistics. <code>--warmup</code> <code>INTEGER</code> <code>10</code> Number of warm-up iterations run before timing begins; excluded from statistics. <code>--device</code> <code>-d</code> <code>auto\\|cpu\\|gpu\\|npu</code> <code>auto</code> Device to run the benchmark on. <code>auto</code> selects the highest-priority available device. <code>--precision</code> <code>TEXT</code> <code>auto</code> Precision mode applied during model build: <code>auto</code>, <code>fp32</code>, <code>fp16</code>, <code>int8</code>, <code>int16</code>, or compound forms such as <code>w8a16</code>. <code>--ep</code> <code>TEXT</code> \u2014 Force a specific execution provider (e.g., <code>qnn</code>, <code>dml</code>, <code>vitisai</code>, <code>openvino</code>, <code>cpu</code>). Overrides the device-to-provider mapping. <code>--ep-options</code> <code>KEY=VALUE</code> (multiple) \u2014 Runtime EP provider option forwarded to the inference session (e.g., <code>--ep-options htp_performance_mode=burst</code>). Repeatable. Applies to both HuggingFace model IDs and ONNX file inputs. Unlike build-time options set via <code>--config</code>, these tune the runtime session, not the compiled graph. <code>--output</code> <code>-o</code> <code>PATH</code> <code>~/.cache/winml/perf/&lt;slug&gt;/&lt;timestamp&gt;.json</code> Output JSON file path for the benchmark report. <code>--batch-size</code> <code>INTEGER</code> <code>1</code> Batch size used when generating synthetic input tensors. <code>--shape-config</code> <code>PATH</code> \u2014 Path to a JSON file containing shape overrides (e.g., <code>{\"height\": 480, \"width\": 480}</code>). Ignored for pre-exported ONNX files and in <code>--module</code> mode. <code>--quantize/--no-quantize</code> flag <code>true</code> Run quantization during model build (use <code>--no-quantize</code> to skip it). Useful for measuring the fp32 baseline. <code>--rebuild/--no-rebuild</code> flag <code>false</code> Force model rebuild even if a cached artifact already exists. <code>--ignore-cache/--no-ignore-cache</code> flag <code>false</code> Build from scratch in a temporary folder and discard the artifact after benchmarking. Implies <code>--rebuild</code>. <code>--module</code> <code>TEXT</code> \u2014 PyTorch module class name for per-module benchmarking (e.g., <code>BertAttention</code>). Builds and times each matching instance separately. See Load and export. <code>--monitor/--no-monitor</code> flag <code>false</code> Show a live NPU/CPU utilization chart while the benchmark runs and include hardware metrics in the JSON report."},{"location":"commands/perf/#how-it-works","title":"How it works","text":"<p><code>winml perf</code> loads the model through <code>WinMLAutoModel</code> \u2014 accepting both HuggingFace IDs and local ONNX files \u2014 then generates random input tensors from the model's I/O configuration. It runs the specified number of warm-up iterations (excluded from statistics) followed by the timed iterations, collecting per-sample latency. The final report includes mean, min, max, P50, P90, P95, P99, standard deviation, and throughput in samples per second. When <code>--monitor</code> is active, a hardware polling loop runs in parallel and records NPU / GPU utilization, CPU usage, and device memory alongside the timing data.</p>"},{"location":"commands/perf/#examples","title":"Examples","text":"<p>Basic benchmark on the best available device:</p> <pre><code>$ winml perf -m microsoft/resnet-50\n</code></pre> <pre><code>Device:      npu\nPrecision:   auto\nTask:        image-classification\nIterations:  100 (+ 10 warmup)\nBatch Size:  1\n\nLatency (ms)\n  Avg    P50    P90    P95    P99    Min    Max    Std\n 2.14   2.11   2.38   2.51   2.79   1.97   3.04   0.12\n\nThroughput: 467.29 samples/sec\n\nResults saved to: ~/.cache/winml/perf/microsoft_resnet-50/2026-05-27T120000.json\n</code></pre> <p>Benchmark a pre-exported ONNX file on CPU with more iterations:</p> <pre><code>$ winml perf -m model.onnx --device cpu --iterations 500\n</code></pre> <p>Benchmark a text model with an explicit task, targeting the NPU:</p> <pre><code>$ winml perf -m bert-base-uncased --task text-classification --device npu --precision w8a16\n</code></pre> <p>Benchmark with live hardware monitoring enabled:</p> <pre><code>$ winml perf -m microsoft/resnet-50 --device npu --monitor\n</code></pre> <p>Pass runtime EP provider options to tune the session (repeatable):</p> <pre><code>$ winml perf -m model.onnx --device npu \\\n    --ep-options htp_performance_mode=burst \\\n    --ep-options htp_graph_finalization_optimization_mode=3\n</code></pre> <p>Per-module benchmarking to find latency hot-spots across all attention blocks:</p> <pre><code>$ winml perf -m bert-base-uncased --module BertAttention --iterations 200\n</code></pre>"},{"location":"commands/perf/#common-pitfalls","title":"Common pitfalls","text":"<ul> <li>Warm-up too low on NPU. The first several inferences on an NPU EP can be significantly slower due to kernel compilation and caching. The default of 10 warm-up iterations is usually enough for vision models, but transformer models with many operators may need <code>--warmup 30</code> or higher to reach steady-state latency.</li> <li><code>--shape-config</code> is silently ignored in two cases. It has no effect on pre-exported ONNX files (shapes are baked into the graph) and is ignored in <code>--module</code> mode. The command prints a warning in both situations.</li> <li>Random inputs do not represent real data distributions. Latency numbers are accurate, but memory access patterns may differ from production because the generated tensors are uniform random values. For memory-bandwidth-sensitive models this can understate real-world latency.</li> <li>Cross-device comparison. To compare performance across devices, run <code>winml perf</code> separately with different <code>--device</code> values and compare the resulting JSON reports.</li> </ul>"},{"location":"commands/perf/#see-also","title":"See also","text":"<ul> <li>winml eval \u2014 measure accuracy after benchmarking</li> <li>winml build \u2014 build the quantized artifact that <code>perf</code> benchmarks</li> <li>Load and export concept \u2014 how <code>--module</code> per-instance benchmarking works</li> <li>ONNX &amp; Execution Providers \u2014 understand <code>--device</code> vs <code>--ep</code></li> </ul>"},{"location":"commands/quantize/","title":"winml quantize","text":"<p>Quantize an ONNX model with QDQ insertion and calibration-based scaling.</p>"},{"location":"commands/quantize/#when-to-use-this","title":"When to use this","text":"<p>Use <code>winml quantize</code> after <code>winml export</code> to insert QuantizeLinear/DequantizeLinear (QDQ) node pairs into an ONNX graph. The resulting model is ready for <code>winml compile</code> targeting an NPU or other quantization-aware execution provider.</p>"},{"location":"commands/quantize/#synopsis","title":"Synopsis","text":"<pre><code>$ winml quantize [options]\n</code></pre>"},{"location":"commands/quantize/#flags","title":"Flags","text":"Flag Short Type Default Description <code>--model</code> <code>-m</code> path (required) Input ONNX model file. <code>--output</code> <code>-o</code> path <code>{input}_qdq.onnx</code> Output path for the quantized model. <code>--task</code> string \u2014 Task name (e.g., <code>image-classification</code>, <code>text-classification</code>) used to select a task-appropriate calibration dataset. Pair with <code>--model-name</code> so the dataset is preprocessed exactly the way the model expects. Without <code>--task</code>, calibration falls back to synthetic random data. <code>--model-name</code> string \u2014 HuggingFace model ID (e.g., <code>microsoft/resnet-50</code>) used to load the matching preprocessor/tokenizer for calibration. Only used when <code>--task</code> is provided. <code>--precision</code> <code>-p</code> string <code>None</code> Precision shorthand: <code>int8</code>, <code>int16</code>, or mixed-precision like <code>w8a16</code>. Overridden by explicit <code>--weight-type</code> / <code>--activation-type</code>. <code>--samples</code> integer <code>10</code> Number of calibration samples used to compute quantization ranges. <code>--method</code> choice <code>minmax</code> Calibration algorithm: <code>minmax</code>, <code>entropy</code>, or <code>percentile</code>. <code>--weight-type</code> choice \u2014 Per-tensor type for weights: <code>uint8</code>, <code>int8</code>, <code>uint16</code>, or <code>int16</code>. Overrides <code>--precision</code>. When unset, defaults to <code>uint8</code> (or the type implied by <code>--precision</code>). <code>--activation-type</code> choice \u2014 Per-tensor type for activations: <code>uint8</code>, <code>int8</code>, <code>uint16</code>, or <code>int16</code>. Overrides <code>--precision</code>. When unset, defaults to <code>uint8</code> (or the type implied by <code>--precision</code>). <code>--per-channel/--no-per-channel</code> flag <code>false</code> Apply per-channel (rather than per-tensor) quantization to weight tensors. <code>--symmetric/--no-symmetric</code> flag <code>false</code> Use symmetric quantization (zero-point fixed at 0). <code>--help</code> <code>-h</code> flag Show this message and exit."},{"location":"commands/quantize/#how-it-works","title":"How it works","text":"<p><code>winml quantize</code> applies static post-training quantization (PTQ) using the ONNX Runtime quantization API. Calibration passes collect activation range statistics, which are used to compute scale and zero-point values baked into <code>QuantizeLinear</code> / <code>DequantizeLinear</code> node pairs around each eligible operator. The <code>--method</code> flag controls range estimation: <code>minmax</code> uses global observed extremes, <code>entropy</code> minimizes KL-divergence, and <code>percentile</code> clips outliers. Precision can be set at a coarse level with <code>--precision</code> or tuned per tensor type with <code>--weight-type</code> and <code>--activation-type</code>; explicit type flags always override <code>--precision</code>.</p> <p>Calibration data is selected from <code>--task</code> and <code>--model-name</code>. For a supported task, a built-in default calibration dataset is loaded and preprocessed through the model's own tokenizer or image processor, so the calibration tensors match what the model will see at inference time. For an unsupported task \u2014 or when <code>--task</code> is omitted entirely \u2014 calibration falls back to synthetic random data synthesized from the ONNX input specification. Random-data calibration is fast and always works, but the resulting scales are typically less accurate than dataset-driven calibration, so always provide <code>--task</code> and <code>--model-name</code> when the model task is supported.</p>"},{"location":"commands/quantize/#examples","title":"Examples","text":"<pre><code># Minimal quantization: defaults (10 samples, uint8 weights and activations)\nwinml quantize -m resnet50.onnx\n</code></pre> <pre><code>Input: resnet50.onnx\nOutput: resnet50_qdq.onnx\nWeight type: uint8\nActivation type: uint8\nSamples: 10\nMethod: minmax\n\nRunning quantization...\n\nSuccess! Model quantized\nOutput: resnet50_qdq.onnx\nQDQ nodes inserted: 53\nTotal time: 4.31s\n</code></pre> <pre><code># Task-aware calibration: real samples preprocessed through the model's own image processor\nwinml quantize -m resnet50.onnx --task image-classification --model-name microsoft/resnet-50 --samples 128\n</code></pre> <pre><code># int8 precision shorthand (equivalent to --weight-type int8 --activation-type int8)\nwinml quantize -m resnet50.onnx -p int8\n</code></pre> <pre><code># Mixed-precision: int8 weights, uint16 activations with entropy calibration\nwinml quantize -m bert-base-uncased.onnx --weight-type int8 --activation-type uint16 --method entropy --samples 64\n</code></pre> <pre><code># Per-channel symmetric quantization to a specific output path\nwinml quantize -m facebook_convnext.onnx -o facebook_convnext_qdq.onnx --per-channel --symmetric --samples 32\n</code></pre> <pre><code># int16 precision (suitable for models sensitive to int8 accuracy loss)\nwinml quantize -m bert-base-uncased.onnx --precision int16\n</code></pre>"},{"location":"commands/quantize/#common-pitfalls","title":"Common pitfalls","text":"<ul> <li>Calibration uses synthetic random data by default. Without <code>--task</code> and <code>--model-name</code>, scales and zero-points are computed from random tensors synthesized from the ONNX input specification \u2014 the model never sees realistic activations, so accuracy after quantization can degrade noticeably. Always pass <code>--task</code> and <code>--model-name</code> for supported tasks (e.g., <code>--task image-classification --model-name microsoft/resnet-50</code>) so calibration runs on real samples preprocessed through the model's own tokenizer or image processor.</li> <li><code>--weight-type</code> / <code>--activation-type</code> silently override <code>--precision</code>. If you pass both, the explicit type flags win. Omit <code>--precision</code> when setting types explicitly to avoid confusion.</li> <li>Low sample counts can hurt accuracy. The default of 10 samples is sufficient for quick testing, but production models typically need 64\u2013256 representative samples for good calibration.</li> <li><code>--per-channel</code> increases model size. Per-channel quantization stores a separate scale and zero-point per output channel; this can noticeably inflate the model file size compared to per-tensor mode.</li> <li>Output defaults to <code>{stem}_qdq.onnx</code> in the same directory as input. Always pass <code>-o</code> when writing to a specific location to avoid accidentally overwriting or cluttering the source directory.</li> <li>Quantizing an already-quantized model (one containing QDQ nodes) is unsupported and will produce incorrect results. Use <code>winml compile --no-quant</code> instead if the model already contains QDQ nodes.</li> </ul>"},{"location":"commands/quantize/#see-also","title":"See also","text":"<ul> <li>winml export</li> <li>winml compile</li> <li>winml build</li> <li>Quantization concepts</li> </ul>"},{"location":"commands/sys/","title":"winml sys","text":"<p>Inspect your machine \u2014 devices, EPs, and runtime versions at a glance.</p>"},{"location":"commands/sys/#when-to-use-this","title":"When to use this","text":"<p>Run <code>winml sys</code> before starting any export or build workflow to confirm that the required ML libraries are installed and that the target hardware is visible. It is also the first command to run when diagnosing an unexpected export failure.</p>"},{"location":"commands/sys/#synopsis","title":"Synopsis","text":"<pre><code>$ winml sys [options]\n</code></pre>"},{"location":"commands/sys/#flags","title":"Flags","text":"Flag Short Type Default Description <code>--format</code> <code>-f</code> <code>text</code> | <code>json</code> | <code>compact</code> <code>text</code> Output format. <code>text</code> renders rich tables, <code>json</code> emits machine-readable JSON, <code>compact</code> prints a single-line summary. <code>--list-device</code> \u2014 flag <code>false</code> List available compute devices (NPU, GPU, CPU) in priority order instead of showing the full system report. <code>--list-ep</code> \u2014 flag <code>false</code> List available ONNX Runtime execution providers instead of showing the full system report. Can be combined with <code>--list-device</code>. <code>--verbose</code> <code>-v</code> flag <code>false</code> Surface additional diagnostic sections: backend availability and Export Readiness. <code>--help</code> <code>-h</code> flag \u2014 Show help and exit. <p><code>winml sys</code> takes no <code>--model</code>, <code>--device</code>, <code>--ep</code>, <code>--task</code>, or <code>--precision</code> arguments. It describes the host environment, not a specific model.</p>"},{"location":"commands/sys/#how-it-works","title":"How it works","text":"<p><code>winml sys</code> queries Python's <code>platform</code> and <code>importlib.metadata</code> modules to report library versions, then probes PyTorch for CUDA availability and GPU device names. Backend availability checks use the installed runtime environment, while device enumeration queries hardware directly in NPU &gt; GPU &gt; CPU priority order, and EP enumeration merges the WinML EP registry with ONNX Runtime's <code>get_available_providers()</code>. When <code>--format json</code> is used the full report \u2014 including devices and EPs \u2014 is emitted as a single JSON object, making it easy to capture in CI pipelines.</p>"},{"location":"commands/sys/#examples","title":"Examples","text":"<pre><code># Full human-readable system report\n$ winml sys\n</code></pre> <pre><code>+------------------------------------+\n|   winml-cli System Information     |\n+------------------------------------+\n\nEnvironment\n  Python Version    3.11.9\n  Python Executable C:\\...\\python.exe\n  OS                Windows 11\n  Machine           AMD64\n\nML Libraries\n  Library        Version   Status\n  torch          2.4.0     OK\n  transformers   4.44.0    OK\n  onnx           1.16.1    OK\n  ...\n\nAvailable Devices (priority order)\n  #1  NPU   Qualcomm(R) Hexagon NPU\n  #2  GPU   Qualcomm(R) Adreno GPU\n  #3  CPU   Snapdragon(R) X Elite\n\nAvailable Execution Providers\n  QNNExecutionProvider           -&gt; NPU/GPU\n  DmlExecutionProvider           -&gt; GPU\n  CPUExecutionProvider           -&gt; CPU\n</code></pre> <pre><code># Compact one-liner \u2014 useful for CI logs\n$ winml sys --format compact\n</code></pre> <pre><code># Machine-readable JSON \u2014 pipe to jq or save for later comparison\n$ winml sys --format json &gt; env.json\n</code></pre> <pre><code># Only list devices \u2014 skip everything else\n$ winml sys --list-device\n</code></pre> <pre><code># List EPs as JSON \u2014 useful for scripting EP selection\n$ winml sys --list-ep --format json\n</code></pre>"},{"location":"commands/sys/#common-pitfalls","title":"Common pitfalls","text":"<ul> <li><code>--list-device</code> and <code>--list-ep</code> suppress the full report. When either flag is   present, only the requested section is printed. Omit both flags to see the   complete system report.</li> <li><code>--format compact</code> omits device and EP tables. The compact format is designed   for single-line log entries and does not include device or EP details. Use <code>text</code>   or <code>json</code> when you need the full picture.</li> <li>CUDA shown as unavailable on a machine with a GPU. PyTorch must be installed   with CUDA support (<code>torch+cuXXX</code>). A CPU-only torch wheel will always report   <code>cuda_available: false</code>.</li> </ul>"},{"location":"commands/sys/#see-also","title":"See also","text":"<ul> <li>ONNX &amp; Execution Providers \u2014 background on EPs and   how <code>--device</code> / <code>--ep</code> flags interact</li> <li>inspect.md \u2014 inspect a specific HuggingFace model's compatibility</li> <li>catalog.md \u2014 browse the curated catalog of validated models</li> <li>How winml-cli Works \u2014 end-to-end pipeline overview</li> </ul>"},{"location":"concepts/analyze-and-optimize/","title":"Analyze and optimize","text":"<p>Not every ONNX graph runs efficiently on every execution provider. An operator that compiles cleanly on CPU may be unsupported on an NPU, and a correct graph may still leave performance on the table because adjacent operations were not fused. winml-cli separates the concern into two commands \u2014 <code>winml analyze</code> and <code>winml optimize</code> \u2014 that together form a graph-quality loop driven automatically by <code>winml build</code>.</p>"},{"location":"concepts/analyze-and-optimize/#what-analyze-does","title":"What analyze does","text":"<p><code>winml analyze</code> performs static analysis on an ONNX graph to answer one question: will this model run end-to-end on my target execution provider, and if not, what needs to change?</p> <p>Unlike profiling, static analysis does not require executing the full model on the target device. It inspects each operator (and recognized subgraph pattern) against a rule database of known EP capabilities, classifies every node, and emits actionable recommendations. The same analyzer also drives the autoconf feedback loop inside <code>winml build</code>, so understanding how it works is useful even when you never invoke <code>winml analyze</code> directly.</p> <p>Specify a target EP with <code>--ep</code> (e.g., <code>--ep qnn</code> or <code>--ep openvino</code>) and a device with <code>--device</code> (CPU, GPU, or NPU). The default <code>--ep auto</code> infers from locally available EPs; pass <code>--ep all</code> to evaluate every rule-data-backed EP regardless of local availability. Results print to the console by default; add <code>--output results.json</code> to save the report as JSON for scripting or archiving.</p>"},{"location":"concepts/analyze-and-optimize/#how-operators-are-classified","title":"How operators are classified","text":"<p>For each operator (and matched subgraph pattern) the analyzer follows a two-step process:</p> <ol> <li>Rule-database lookup \u2014 does the target EP claim to support this pattern?</li> <li>Local probe (fallback) \u2014 if the pattern is absent from the rule database and <code>--run-unknown-op</code> is enabled, the analyzer builds a minimal ONNX graph for the op and runs it on the target EP locally to determine support (see Local op execution below).</li> </ol> <p>The combined answer is recorded as a <code>SupportLevel</code>:</p> Level Compile on target EP Runs (possibly via CPU fallback) CLI label Exit code contribution <code>SUPPORTED</code> yes yes <code>Fully Supported</code> 0 <code>PARTIAL</code> no yes <code>Partial Support</code> 1 (warning) <code>UNSUPPORTED</code> no no <code>Not Supported</code> 1 (error) <code>UNKNOWN</code> n/a n/a <code>Unknown Support</code> 1 <p>A <code>PARTIAL</code> classification means the operator cannot be dispatched to the requested EP but the ONNX Runtime can still execute the model by falling back to CPU. This is technically a working model, but the latency and power-efficiency goals of NPU deployment are not met. <code>UNSUPPORTED</code> means even the CPU fallback path fails, so the model will not run at all. <code>UNKNOWN</code> appears only when the analyzer lacks both rule-database data and the ability to test locally.</p>"},{"location":"concepts/analyze-and-optimize/#two-key-outputs-lint-and-autoconf","title":"Two key outputs: lint and autoconf","text":"<p>Every analysis produces a lint result; the default (full) mode additionally produces an autoconf result. Understanding these two outputs separately is the easiest way to understand what <code>winml analyze</code> is for and how to consume it.</p> <p>Lint is the analyzer's verdict on the model as it stands today. It classifies every operator and recognized pattern against the target EP and rolls the classifications up into:</p> <ul> <li><code>errors</code> \u2014 count of <code>UNSUPPORTED</code> patterns. The model will not run.</li> <li><code>warnings</code> \u2014 count of <code>PARTIAL</code> patterns. The model runs, but these nodes fall back to CPU.</li> <li><code>passed</code> \u2014 <code>True</code> iff <code>errors == 0 and warnings == 0</code>.</li> </ul> <p>Lint always runs. It is deterministic and sufficient for a yes/no CI gate \u2014 the CLI's exit code is derived from it.</p> <p>Autoconf is the analyzer's suggestion for how to fix the current model. It lists the fusion flags which, if enabled in the optimize stage, would convert one or more <code>PARTIAL</code>/<code>UNSUPPORTED</code> patterns into <code>SUPPORTED</code> ones.</p> <p>Autoconf is what powers the build pipeline's re-optimization loop: when the analyzer says \"<code>gelu_fusion</code> would resolve these warnings\", the build re-runs optimize with that flag and re-analyzes \u2014 until no further suggestions remain or the iteration limit is hit. Autoconf is advisory; nothing else in the system flips fusion flags automatically.</p>"},{"location":"concepts/analyze-and-optimize/#analysis-modes","title":"Analysis modes","text":"<p><code>winml analyze</code> can run in two modes which differ only in whether autoconf is computed:</p> Mode How to enable Output When to use Lint-only <code>--no-information</code> (CLI) or <code>autoconf=False</code> (Python) Lint only. <code>optimization_config</code> is <code>None</code>. CI gate; pass/fail only Full (default) <code>--information</code> (CLI, default) or <code>autoconf=True</code> (Python) Lint plus autoconf and recommendations Local debugging; build pipeline's autoconf loop <p>The only difference between the two modes is whether autoconf and the human-readable recommendations are computed. Skipping them gives a faster, leaner run. The lint result is identical either way.</p>"},{"location":"concepts/analyze-and-optimize/#three-classes-of-finding","title":"Three classes of finding","text":"<p>Every analysis emits findings in three buckets. Each bucket maps to a different remediation pattern.</p> <p>Errors (<code>UNSUPPORTED</code> patterns) block deployment. Either the operator does not exist on the target EP at all, or it does not handle the specific input shape/dtype the model uses. Typical remediations:</p> <ul> <li>Rewrite the model to use an equivalent pattern the EP does support.</li> <li>Lower the opset version of the offending op if the EP supports an older opset.</li> <li>Insert pre/post-processing to massage shapes into a supported configuration.</li> </ul> <p>Each error pattern includes a recommendation that identifies the current pattern and the target pattern the EP does support, so the optimizer (or a manual rewrite) can apply the fix.</p> <p>Warnings (<code>PARTIAL</code> patterns) mean the model will run, but the target EP cannot dispatch this pattern. Inference falls back to the CPU EP, breaking the deployment goal (e.g., NPU offload) without breaking correctness. Warnings are usually fusion opportunities \u2014 the analyzer recognized a sub-pattern that, if fused, would become a single EP-native op. The fix is to enable the relevant fusion flag in the optimize stage \u2014 this is exactly what the autoconf loop does automatically.</p> <p>Info (<code>Information</code> items) are lower-priority insights: a hint that an alternative pattern exists, a QDQ-equivalent that could be used after quantization, or a description of why a node was classified as it was. Info entries never affect exit code.</p>"},{"location":"concepts/analyze-and-optimize/#local-op-execution","title":"Local op execution","text":"<p>The static rule database does not cover every operator and every shape/dtype combination. When <code>--run-unknown-op</code> is enabled and the analyzer encounters a pattern not present in the database, it builds a tiny ONNX graph containing just that op (with the model's actual input metadata) and runs it on the target EP locally. The compile/run result becomes the classification. Without <code>--run-unknown-op</code> (the default), such patterns are classified as <code>UNKNOWN</code>.</p> <p>Leave <code>--run-unknown-op</code> disabled when:</p> <ul> <li>The local machine does not have the target EP available (e.g., analyzing a QNN model from a non-Snapdragon machine).</li> <li>You want bit-for-bit reproducible analysis across machines. Local execution can produce different results depending on driver versions.</li> </ul>"},{"location":"concepts/analyze-and-optimize/#save-node-debugging-unsupported-subgraphs","title":"Save-node: debugging unsupported subgraphs","text":"<p>When a pattern is unsupported and the recommendation does not immediately tell you what is wrong, use <code>--save-node</code> to dump the offending subgraph to disk as a self-contained, runnable <code>.onnx</code> file. You can then open it in Netron, re-analyze it in isolation, or attach it to a bug report as a minimal reproducer. See the analyze command reference for usage examples.</p>"},{"location":"concepts/analyze-and-optimize/#htp-metadata-enhancement","title":"HTP metadata enhancement","text":"<p>When a model is exported with hierarchy-preserving tags (HTP), the export produces a sidecar <code>_htp_metadata.json</code> that maps each ONNX node back to its source module (e.g., <code>encoder.layer.0.attention.self.GELUActivation</code>). Passing this file via <code>--htp-metadata</code> lets the <code>PatternExtractor</code> use the module hierarchy to match subgraph patterns more accurately than operator-level heuristics alone.</p> <p>HTP metadata is consumed at the pattern extraction stage \u2014 before any EP-specific runtime checking \u2014 so the enriched patterns benefit all target EPs equally (QNN, OpenVINO, VitisAI, etc.). Without HTP metadata, the analyzer falls back to attribute-based tag matching and then the general-purpose <code>PatternMatcher</code>; with it, the analyzer can correctly identify fused patterns (GELU, LayerNorm, Attention) that are difficult to detect from the raw operator graph. See the analyze command reference for usage examples.</p>"},{"location":"concepts/analyze-and-optimize/#what-runs-internally","title":"What runs internally","text":"<p>The analyzer is composed of five stages that run in order. You normally do not need to think about them, but they are worth knowing when reading recommendations or extending the analyzer:</p> Stage Job <code>ONNXLoader</code> Load the ONNX file (or <code>ModelProto</code>), record metadata. <code>PatternExtractor</code> Walk the graph, match operator and subgraph patterns from the rule catalog. Optionally consume HTP metadata. <code>RuntimeChecker</code> For each pattern, consult the rule database; if no rule applies, run the op locally (when allowed). <code>InformationEngine</code> Turn classifications into human-readable <code>Information</code> items; also runs model validators (constant folding, dynamic input, pattern matching, QDQ validation, shape inference). <code>OutputAggregator</code> Assemble the final <code>AnalysisOutput</code> (the JSON you get from <code>--output</code>). <p>The model validators run regardless of whether there are runtime check results \u2014 they are model-level sanity checks (e.g., is shape inference complete? are QDQ pairs well-formed?) and can surface issues even when every operator looks fine in isolation.</p>"},{"location":"concepts/analyze-and-optimize/#what-optimize-does","title":"What optimize does","text":"<p><code>winml optimize</code> rewrites the ONNX graph by applying fusions and structural simplifications. Internally the optimizer runs four pipes in sequence:</p> Pipe What it does ORTGraphPipe ORT C++ graph optimizer (level 2): fusions, eliminations, layout transforms RewritePipe JSON-driven pattern matcher that replaces subgraph patterns with equivalent alternatives ORTFusionPipe ORT Python transformer optimizer: attention, LayerNorm, and RMSNorm fusions SurgeryPipe Post-optimization model surgery (constant clamping, NaN guard removal) <p>Every optimization is a named capability toggled via <code>--enable-&lt;name&gt;</code> and <code>--disable-&lt;name&gt;</code> flags. Run <code>--list-capabilities</code> to see all registered optimizations and their defaults. The optimizer currently ships 57 static capabilities across 13 categories:</p> Category Capabilities Examples GELU 5 gelu-fusion, fast-gelu-fusion, quick-gelu-fusion LayerNorm 6 layer-norm-fusion, skip-layer-norm-fusion, fuse-rmsnorm MatMul 6 matmul-add-fusion, matmul-activation-fusion Conv 4 conv-bn-fusion, conv-activation-fusion Layout 4 nhwc-transformer, transpose-optimizer GEMM 3 gemm-activation-fusion, gemm-transpose-fusion Elimination 3 slice-elimination, expand-elimination Graph 3 constant-folding, double-qdq-pairs-remover Activation 2 bias-softmax-fusion, bias-dropout-fusion Attention 1 attention-fusion Misc 4 pad-fusion, gather-to-slice-fusion Rewrite 14 attention-expandedattention, matmuladd-conv2d4d, layernormalization-singlelayernorm Surgery 2 clamp-constant-values, remove-isnan-in-attention-mask <p>This granularity matters when a specific fusion breaks a downstream step or when you need an exact optimization profile for a given EP. Some capabilities declare dependencies (e.g., <code>bias-gelu-fusion</code> requires <code>gelu-fusion</code>); the optimizer resolves these automatically when you enable a flag.</p> <p>Pattern rewrites are a complementary mechanism: instead of folding nodes, rewrites replace one subgraph pattern with a structurally equivalent alternative. Rules are defined in JSON files (<code>default.json</code> for general rewrites, <code>qnn.json</code> for QNN-specific rewrites). The optimizer currently ships 5 rewrite groups containing 12 individual rules \u2014 for example, four GELU source variants can each be rewritten to a single <code>Gelu</code> op, and a MatMul+Add pattern can be rewritten to a GEMM or to a Conv2D for Qualcomm NPU targets. Run <code>--list-rewrites</code> to discover available families and their flag names. Flags follow the form <code>--enable-&lt;source-slug&gt;-&lt;target-slug&gt;</code>.</p> <p>Commit a specific combination of flags to a <code>--config</code> file for reproducible builds.</p>"},{"location":"concepts/analyze-and-optimize/#the-analyzeroptimizer-loop","title":"The analyzer/optimizer loop","text":"<p>A single optimize pass may create fusion opportunities that were not present before, and a freshly fused graph may surface new operator compatibility issues. This is why <code>winml build</code> runs analyze and optimize in an alternating loop rather than once each.</p> <p>The flow inside <code>winml build</code> (implemented in <code>run_optimize_analyze_loop</code>) is:</p> <p></p> <p>The initial optimize pass applies the flags from <code>config.optim</code>. The analyzer then inspects the result; if autoconf discovers fusion flags that were not yet enabled, the optimizer re-runs with those flags and the analyzer re-checks. This repeats up to <code>--max-optim-iterations</code> rounds (default: three). The loop exits early when autoconf suggests no further changes. After the loop, a final analysis validates the result \u2014 if unsupported patterns still exist, the build raises a <code>RuntimeError</code>.</p> <p>Use <code>--no-analyze</code> to skip the loop and run a single optimization pass \u2014 useful for deterministic rebuilds from a fixed ONNX checkpoint where the graph is already known good.</p>"},{"location":"concepts/analyze-and-optimize/#when-to-use-which-entry-point","title":"When to use which entry point","text":"You want to... Use Gate a CI pipeline on EP compatibility <code>winml analyze</code> (CLI) \u2014 exit code is the contract Embed analysis in a build script or notebook <code>analyze_onnx(model, ep=...)</code> (flat Python API) Post-process the full result programmatically <code>ONNXStaticAnalyzer().analyze(...)</code> (class API) Analyze an in-memory <code>ModelProto</code> <code>ONNXStaticAnalyzer().analyze_from_proto(...)</code> Optimize with full control over fusions <code>winml optimize</code> (CLI) with <code>--enable-</code> / <code>--disable-</code> flags Reproducible build from a config file <code>winml build -c config.json</code> (pipeline wrapper) <p>The CLI and the flat Python API are sufficient for the vast majority of cases. The class-based API is only needed when you want to call <code>is_fully_supported(ep)</code>, <code>get_unsupported_operators(ep)</code>, or <code>get_optimization_opportunities(ep)</code> on the full result.</p>"},{"location":"concepts/analyze-and-optimize/#see-also","title":"See also","text":"<ul> <li>Compile and EPContext</li> <li>Primitives and pipeline</li> <li>How winml-cli works \u2014 where the analyzer sits in the build pipeline</li> <li>EPs and devices \u2014 background on EPs and operator support</li> <li>analyze command</li> <li>optimize command</li> </ul>"},{"location":"concepts/compile-and-epcontext/","title":"Compile and EPContext","text":"<p>When you run <code>winml compile</code>, you are not simply copying an ONNX file to a new location. You are asking an execution provider (EP) to transform the model into a form it can load and run directly, without repeating that transformation at every startup. Understanding what the compiler produces \u2014 and why \u2014 helps you decide when to compile, what output format to choose, and how to balance file size against runtime performance.</p> <p>Compilation is an offline, one-time step. The artifact it creates is what you ship with your application and what <code>winml-cli</code> uses for benchmarking and evaluation.</p>"},{"location":"concepts/compile-and-epcontext/#what-compilation-produces","title":"What compilation produces","text":"<p>For EPs that are fully integrated into ONNX Runtime \u2014 CPU, DirectML, and similar providers \u2014 the compile step writes a new <code>.onnx</code> file that the runtime loads directly. The ONNX graph has been prepared and, in some cases, partitioned so that the EP's session initializer has less work to do when the application starts.</p> <p>For EPs that support ahead-of-time compilation (e.g. <code>--ep qnn</code> for Qualcomm NPUs and <code>--ep vitisai</code> for AMD NPUs), the compiler goes further. It takes the ONNX graph and produces a binary artifact \u2014 the EP context blob \u2014 that encodes the fully compiled, hardware-ready version of the network. This blob is then associated with the ONNX model file. On subsequent loads, the EP reads the blob rather than re-compiling the graph, which makes session creation dramatically faster.</p> <p>The default compiler backend is <code>ort</code> (ONNX Runtime).</p>"},{"location":"concepts/compile-and-epcontext/#embedded-vs-external-epcontext","title":"Embedded vs external EPContext","text":"<p>For QNN compilation, <code>winml-cli</code> gives you a choice of where the EP context blob lives. By default the blob is written as a sidecar <code>.bin</code> file alongside the <code>.onnx</code>. Passing <code>--embed</code> instead inlines the blob directly into the ONNX file.</p> <p>External (default): The <code>.onnx</code> is small and human-inspectable; the heavy binary data lives in a separate file. You must keep the two files together \u2014 the ONNX stores a relative path back to the <code>.bin</code>. This layout is preferable for version control and for scenarios where you want to inspect or diff the model graph.</p> <p>Embedded (<code>--embed</code>): Everything ships in a single <code>.onnx</code> file. Deployment is simpler because there is only one artifact to track. The trade-off is file size: the <code>.onnx</code> grows by the full size of the compiled context, and the file is no longer human-readable in the usual sense. Choose embedded when your deployment tooling expects a single model file, or when you want to minimize the chance of the sidecar being misplaced.</p>"},{"location":"concepts/compile-and-epcontext/#why-pre-compile","title":"Why pre-compile","text":"<p>The first time an ONNX Runtime session is created for a model on a hardware EP, the runtime must partition the graph, allocate buffers, and JIT-compile the operators. On an NPU this process can take several seconds. For applications with tight startup budgets \u2014 on-device inference in a UI flow, for example \u2014 that cold-start cost is often unacceptable.</p> <p>A model produced by <code>winml compile</code> has already paid that cost. The EP context blob is the result of compilation, not its input. When the application loads the compiled model the EP reads the pre-built binary and the session is ready almost immediately. Shipping a compiled model is therefore the standard pattern for production deployments on QNN hardware.</p> <p>If you are iterating on quantization settings or ONNX graphs and want to check whether the model compiles at all, pass an already-quantized (QDQ) model directly \u2014 <code>winml compile</code> compiles whatever ONNX file you supply and does not have a separate quantization pass to skip.</p>"},{"location":"concepts/compile-and-epcontext/#skipping-validation","title":"Skipping validation","text":"<p>By default <code>winml compile</code> runs a validation pass after compilation finishes \u2014 it loads the compiled model into an inference session, feeds it dummy inputs (all-ones tensors), and checks that the outputs do not contain NaN or Inf values. This catches basic compilation failures early (e.g., the EP rejecting the graph or producing garbage outputs).</p> <p>The <code>--no-validate</code> flag skips that pass. It is useful during rapid iteration when you only want to confirm that compilation succeeds without the overhead of a trial inference run.</p>"},{"location":"concepts/compile-and-epcontext/#see-also","title":"See also","text":"<ul> <li>EPs and devices \u2014 execution provider selection and <code>--ep</code> / <code>--device</code> flags</li> <li>Analyze and optimize \u2014 graph-level analysis before compilation</li> <li>compile command reference</li> <li>build command reference</li> </ul>"},{"location":"concepts/config-and-build/","title":"Config and build","text":"<p><code>winml config</code> and <code>winml build</code> are a producer/consumer pair. <code>winml config</code> inspects a Hugging Face model (or an existing ONNX file), auto-detects the task, model class, and I/O specifications, and writes a <code>WinMLBuildConfig</code> JSON file. <code>winml build</code> reads that file and runs the full pipeline \u2014 export, optimize, quantize, compile \u2014 producing a Windows ML-ready ONNX artifact.</p> <p>Keeping these two responsibilities separate is intentional. The config file is a stable, human-readable description of exactly what the build will do. You can generate it once, review or edit it, commit it to source control, and replay the same build at any time without re-running model introspection. CI pipelines and team workflows both benefit from treating the config file as a versioned artifact rather than a transient intermediate.</p>"},{"location":"concepts/config-and-build/#generating-a-config","title":"Generating a config","text":"<p><code>winml config</code> produces a <code>WinMLBuildConfig</code> JSON with sensible defaults for the detected model type. At minimum, provide a model identifier:</p> <pre><code>winml config -m microsoft/resnet-50 -o resnet50.json\n</code></pre> <p>Several flags shape what ends up in the config:</p> <ul> <li><code>--task</code> overrides the auto-detected Hugging Face task when detection is   ambiguous or when you want a specific variant (for example, <code>text-classification</code>   vs <code>feature-extraction</code>).</li> <li><code>--no-quant</code> sets the <code>quant</code> section to <code>null</code>, so the quantize stage is omitted   when <code>winml build</code> consumes the config. Use this for GPU workflows where float16   is preferred over QDQ quantization.</li> <li><code>--no-compile</code> sets the <code>compile</code> section to <code>null</code>, producing a portable ONNX   that the runtime compiles on first load instead of embedding a pre-compiled   binary.</li> <li><code>--trust-remote-code</code> allows model repositories that ship custom modeling code \u2014   required for some community models that define non-standard architectures outside   the standard <code>transformers</code> library.</li> </ul> <p>If <code>-o</code> is omitted, the config is printed to stdout, which is convenient for piping or quick inspection. The generated JSON is plain text and can be edited directly before being passed to <code>winml build</code>.</p>"},{"location":"concepts/config-and-build/#whats-in-a-config","title":"What's in a config","text":"<p>A <code>WinMLBuildConfig</code> is a dataclass defined in <code>src/winml/modelkit/config/build.py</code>. It holds five nested sub-configs for the pipeline stages, plus an evaluation config and an auto flag:</p> Field Type Purpose <code>loader</code> <code>WinMLLoaderConfig</code> Task, model type, and model class used to load the Hugging Face model. <code>export</code> <code>WinMLExportConfig</code> Input/output tensor specs, opset version, dynamic axes (<code>null</code> for pre-exported ONNX). <code>optim</code> <code>WinMLOptimizationConfig</code> Graph fusion flags (GeLU, LayerNorm, MatMul+Add). <code>quant</code> <code>WinMLQuantizationConfig</code> Precision types (<code>weight_type</code>, <code>activation_type</code>), calibration samples and method (<code>null</code> to skip). <code>compile</code> <code>WinMLCompileConfig</code> Target EP provider, EPContext options, compiler backend (<code>null</code> to skip). <code>eval</code> <code>WinMLEvaluationConfig \\| null</code> Evaluation settings run after the build (<code>null</code> to skip). <code>auto</code> <code>bool</code> When <code>true</code> (default), auto-fills missing fields from model introspection. <p>Setting <code>quant</code> or <code>compile</code> to <code>null</code> tells the pipeline to skip that stage entirely, equivalent to passing <code>--no-quant</code> or <code>--no-compile</code> on the command line.</p> <p>A generated config looks similar to:</p> <pre><code>{\n  \"loader\": {\n    \"task\": \"image-classification\"\n  },\n  \"export\": {\n    \"opset_version\": 17,\n    \"batch_size\": 1\n  },\n  \"optim\": {\n    \"gelu_fusion\": false,\n    \"layer_norm_fusion\": false,\n    \"matmul_add_fusion\": false\n  },\n  \"quant\": {\n    \"mode\": \"qdq\",\n    \"weight_type\": \"uint8\",\n    \"activation_type\": \"uint8\",\n    \"samples\": 10\n  },\n  \"compile\": {\n    \"execution_provider\": \"qnn\",\n    \"enable_ep_context\": true\n  }\n}\n</code></pre> <p>The file is plain JSON. You can hand-edit any field before passing it to <code>winml build</code> \u2014 adjust the calibration sample count, change the compile provider, or remove a fusion flag.</p>"},{"location":"concepts/config-and-build/#consuming-a-config","title":"Consuming a config","text":"<p>Pass the config file to <code>winml build</code> with either an output directory or the global cache flag:</p> <pre><code># Write artifacts to a local directory\nwinml build -c resnet50.json -m microsoft/resnet-50 --output-dir output/\n\n# Write to the global cache (~/.cache/winml/)\nwinml build -c resnet50.json -m microsoft/resnet-50 --use-cache\n</code></pre> <p><code>--output-dir</code> and <code>--use-cache</code> are mutually exclusive; you must supply one of the two when running <code>winml build</code> (enforced at runtime, not parse time). Within the output directory, <code>winml build</code> writes one ONNX file per completed stage so that intermediate artifacts are available for inspection, and it writes a copy of the resolved config so the full build parameters are recorded alongside the outputs.</p>"},{"location":"concepts/config-and-build/#overrides-at-run-time","title":"Overrides at run time","text":"<p>CLI flags passed directly to <code>winml build</code> override the corresponding config sections for that run only, without modifying the JSON file on disk. This makes it straightforward to experiment with a variation without creating a new config:</p> <pre><code># Skip quantization and compilation for this run only\nwinml build -c resnet50.json -m microsoft/resnet-50 --output-dir output/ --no-quant --no-compile\n\n# Skip optimization (for a pre-quantized input ONNX)\nwinml build -c resnet50.json -m model_qdq.onnx --output-dir output/ --no-optimize\n</code></pre> <p><code>--no-quant</code>, <code>--no-compile</code>, and <code>--no-optimize</code> each suppress the corresponding stage regardless of what the config file specifies. Because the config file is unchanged, re-running without the override flag reverts to the full pipeline described in the config.</p>"},{"location":"concepts/config-and-build/#why-version-a-config","title":"Why version a config","text":"<p>Storing the <code>WinMLBuildConfig</code> JSON in source control brings three concrete benefits:</p> <ol> <li> <p>Reproducibility. A config file pins every build decision \u2014 task, precision,    quantization method, calibration sample count, target EP, fusion flags \u2014 in a    single file. Running <code>winml build -c config.json</code> six months later produces the    same artifact as it does today, regardless of how the tool's defaults evolve.</p> </li> <li> <p>CI integration. A CI job can run <code>winml build -c config.json -m &lt;model-id&gt;    --output-dir artifacts/</code> with no human intervention. Because all settings live    in the config file, the CI script requires no per-model flag knowledge, and    updating build parameters is a pull request to the config file, not a change to    the pipeline script.</p> </li> <li> <p>Team sharing. Handing a colleague a config file is enough for them to    reproduce the exact build on their machine. There is no need to document the    sequence of primitive commands, precision arguments, or calibration settings    separately \u2014 the file is the documentation.</p> </li> </ol>"},{"location":"concepts/config-and-build/#see-also","title":"See also","text":"<ul> <li>Primitives and pipeline \u2014 when to use <code>winml build</code>   vs individual primitive commands</li> <li>Config Schema \u2014 full field-by-field config reference</li> <li>winml config command reference</li> <li>winml build command reference</li> </ul>"},{"location":"concepts/eps-and-devices/","title":"EP and Device","text":"<p>An Execution Provider (EP) is a pluggable backend in ONNX Runtime that claims and runs a subset of graph nodes on a specific hardware target. When ONNX Runtime loads a model it partitions the graph among the registered EPs: operators that an EP claims are dispatched to it, and the remainder fall back to the CPU EP. This design lets a single ONNX model exploit an NPU, GPU, or CPU without any change to the graph itself.</p> <p>A device is the hardware category that an EP targets \u2014 one of <code>npu</code>, <code>gpu</code>, or <code>cpu</code>. winml-cli exposes both levels of control: the high-level <code>--device</code> flag selects a hardware category, while the low-level <code>--ep</code> flag pins a specific ONNX Runtime provider name. In most workflows you set <code>--device</code> and let winml-cli resolve the best available EP; you reach for <code>--ep</code> when you need to compare or force a specific provider.</p>"},{"location":"concepts/eps-and-devices/#eps-winml-cli-supports","title":"EPs winml-cli supports","text":"<p>The table below lists every Execution Provider that winml-cli has explicit support for. EP names are the canonical ONNX Runtime strings accepted by <code>--ep</code>. You can also use the short alias (case-insensitive) anywhere the full name is accepted.</p> EP Alias Device Hardware When to use <code>QNNExecutionProvider</code> <code>qnn</code> npu / gpu Qualcomm NPU (Hexagon DSP) / Qualcomm GPU (Adreno) Snapdragon-based Copilot+ PCs; best latency and power efficiency on Qualcomm silicon <code>VitisAIExecutionProvider</code> <code>vitisai</code> npu AMD NPU (XDNA) AMD Ryzen AI platforms; targets the AMD AI Engine via the Vitis AI stack <code>OpenVINOExecutionProvider</code> <code>openvino</code> npu / gpu / cpu Intel CPU / GPU / NPU Intel Core Ultra platforms; flexible device targeting across all three Intel compute types <code>DmlExecutionProvider</code> <code>dml</code> gpu GPU (DirectML) Any DirectX 12 GPU on Windows; broad compatibility across AMD, Intel, and NVIDIA discrete/integrated graphics <code>NvTensorRTRTXExecutionProvider</code> <code>nv_tensorrt_rtx</code> gpu NVIDIA GPU (TensorRT RTX) NVIDIA RTX GPUs; maximum throughput via TensorRT graph optimization <code>MIGraphXExecutionProvider</code> <code>migraphx</code> gpu AMD GPU (MIGraphX) AMD discrete GPUs; hardware-accelerated inference via the MIGraphX graph engine <code>CPUExecutionProvider</code> <code>cpu</code> cpu CPU Universal fallback; always available regardless of hardware <p>To see which EPs are available on the current machine, run:</p> <pre><code>winml sys --list-ep\n</code></pre>"},{"location":"concepts/eps-and-devices/#device-vs-ep-on-the-cli","title":"Device vs. EP on the CLI","text":"<p>winml-cli exposes two overlapping flags for targeting hardware. Understanding their relationship prevents confusion when using <code>winml analyze</code>, <code>winml compile</code>, or <code>winml build</code>.</p> <p><code>--device</code> (high-level)</p> <p>Accepts one of four values: <code>auto</code>, <code>cpu</code>, <code>gpu</code>, or <code>npu</code>. When set to <code>auto</code> (the default), winml-cli inspects the machine and selects the highest-priority device class that has a compatible EP available, in the order NPU &gt; GPU &gt; CPU. Setting an explicit value such as <code>--device npu</code> requests a device category without naming the EP.</p> <p>For <code>winml analyze</code>, <code>--device</code> also accepts <code>all</code> \u2014 this evaluates the model against every device that has rule data, producing a side-by-side compatibility report.</p> <pre><code># Let winml-cli pick the best available device\nwinml analyze --model model.onnx --device auto\n\n# Target the NPU device class\nwinml analyze --model model.onnx --device npu\n\n# Analyze against all devices at once (analyze only)\nwinml analyze --model model.onnx --device all\n</code></pre> <p><code>--ep</code> (low-level override)</p> <p>Accepts a valid EP name or alias (for example <code>qnn</code>, <code>vitisai</code>, <code>dml</code>, <code>openvino</code>), or <code>auto</code> to let winml-cli resolve the EP from the device. When <code>--ep</code> is provided with a specific value it takes precedence over <code>--device</code> and bypasses device-class resolution entirely. Use <code>--ep</code> when you need to pin a specific provider \u2014 for instance to compare <code>QNNExecutionProvider</code> against <code>DmlExecutionProvider</code> on the same machine.</p> <p>For <code>winml analyze</code>, <code>--ep</code> also accepts <code>all</code> \u2014 this evaluates the model against every registered EP simultaneously.</p> <pre><code># Force Qualcomm QNN regardless of device selection\nwinml analyze --model model.onnx --ep QNNExecutionProvider --device npu\n\n# Use the short alias; winml-cli normalizes it to the full name\nwinml analyze --model model.onnx --ep qnn\n\n# Analyze against all EPs at once (analyze only)\nwinml analyze --model model.onnx --ep all\n</code></pre> <p>The <code>--ep</code> flag accepts a free-form string and is not restricted to the choices listed above. This allows forward compatibility with EP names that winml-cli does not yet enumerate.</p>"},{"location":"concepts/eps-and-devices/#see-also","title":"See also","text":"<ul> <li>Graphs and IR \u2014 ONNX graph format, operator sets, and the IR that EPs consume</li> <li>Weight and Activation \u2014 tensor roles relevant to EP compatibility</li> <li>winml sys \u2014 list available devices and EPs on the current machine</li> <li>winml analyze \u2014 check ONNX operator compatibility against a specific EP</li> </ul>"},{"location":"concepts/eval-and-datasets/","title":"Eval and datasets","text":"<p><code>winml eval</code> answers one question: does this model produce correct results? It measures accuracy \u2014 how well outputs match ground truth \u2014 rather than latency or throughput. You give it a model, point it at a labeled dataset, and get back a JSON report of metric scores. Everything else in the pipeline (compilation, quantization, device selection) is about making the model fast; eval is about knowing whether it is still right.</p> <p>The dataset is the source of truth. Eval iterates over dataset rows, runs each sample through the model, and compares the prediction to the label recorded in the dataset. This means the dataset must have both input features and ground-truth labels, and the columns carrying those values must be wired to the model's inputs and outputs. winml-cli handles standard tasks automatically, but the column-mapping flags let you override the defaults for non-standard datasets.</p>"},{"location":"concepts/eval-and-datasets/#what-eval-reports","title":"What eval reports","text":"<p>The metric reported depends on the task. Classification tasks produce accuracy (top-1 and optionally top-5). Object detection tasks produce mean average precision (mAP). The exact set of metrics is printed to stdout and saved to the file specified by <code>--output</code>. The <code>--output</code> flag accepts any <code>.json</code> path; if omitted, results are printed but not persisted. Use <code>--schema</code> to print the expected dataset schema for a given task without running eval, which is useful when you are preparing a custom dataset.</p>"},{"location":"concepts/eval-and-datasets/#picking-a-dataset","title":"Picking a dataset","text":"<p><code>--dataset</code> takes a Hugging Face dataset path \u2014 for example <code>imagenet-1k</code> or <code>glue</code>. If you omit it, winml-cli selects a default dataset based on the detected task. For datasets that have multiple configurations, <code>--dataset-name</code> picks the specific config (e.g. <code>--dataset-name mrpc</code> when using the <code>glue</code> dataset).</p> <p>By default eval runs on the <code>validation</code> split; <code>--split</code> overrides this. Full validation sets can be large. During development, <code>--samples 200</code> caps the run to 200 rows so you get quick feedback. For very large datasets that you prefer not to download fully, <code>--streaming</code> fetches rows on demand instead of materialising the whole dataset locally. <code>--shuffle</code> (on by default) randomises sampling order so a capped run is representative rather than biased toward the first rows.</p>"},{"location":"concepts/eval-and-datasets/#column-mapping","title":"Column mapping","text":"<p>winml-cli must know which dataset column feeds which model input and which column holds the ground-truth label. For well-known task/dataset combinations this mapping is built in. When it is not, use <code>--column key=value</code> to declare it. The <code>key</code> is the name the task pipeline expects (e.g. <code>input_column</code>) and <code>value</code> is the actual column name in the dataset (e.g. <code>image</code>). You can repeat <code>--column</code> as many times as needed.</p> <p>When the integer label IDs in the dataset do not match the class indices the model was trained against, <code>--label-mapping</code> accepts a JSON file of the form <code>{\"class_name\": id}</code> that translates between the two spaces. This is common with models fine-tuned on a relabelled subset of a public dataset.</p>"},{"location":"concepts/eval-and-datasets/#why-eval-after-quantization","title":"Why eval after quantization","text":"<p>Quantization is a lossy transformation. Converting weights from float32 to int8, or activations to a narrow range, introduces rounding error that accumulates differently across architectures and calibration data. The impact on accuracy cannot be predicted analytically; it must be measured. Running <code>winml eval</code> before and after quantization gives you a concrete accuracy delta. A drop within your acceptable threshold confirms the quantized model is ready; a larger drop means you should revisit calibration settings or switch to a less aggressive quantization scheme.</p> <p>Make this a habit: quantize, then eval. Comparing two <code>--output</code> JSON files is a reliable, reproducible record that the trade-off between performance and accuracy was explicitly checked. See Quantization for the full quantization workflow.</p>"},{"location":"concepts/eval-and-datasets/#see-also","title":"See also","text":"<ul> <li>Quantization \u2014 calibrate and quantize a model, then verify with eval</li> <li>Perf and monitoring \u2014 measure latency and throughput after accuracy is confirmed</li> <li><code>winml eval</code> command reference \u2014 all flags with examples</li> </ul>"},{"location":"concepts/graphs-and-ir/","title":"Graph and IR","text":"<p>A <code>.onnx</code> file is, at rest, a binary-serialized Protocol Buffer. Open it in any hex editor and you will find the familiar <code>ONNX</code> magic bytes followed by a dense encoding of every number the model has ever learned, plus the structural description of how those numbers are combined to produce a prediction. The file is self-contained: weights and computation recipe live together, making the artifact portable without any accompanying framework installation.</p> <p>That computation recipe is a graph \u2014 a directed acyclic structure of operators wired together by named data edges. The graph is what the ONNX Intermediate Representation (IR) actually defines. When winml-cli loads or transforms a model, every operation works against this graph structure, not against framework-specific objects.</p>"},{"location":"concepts/graphs-and-ir/#what-is-in-a-onnx-file","title":"What is in a .onnx file","text":"<p>An ONNX <code>ModelProto</code> wraps a single <code>GraphProto</code>. Inside the graph you will find:</p> <ul> <li>Inputs \u2014 typed, named entry points that accept runtime tensors (e.g., <code>pixel_values: float32[1, 3, 224, 224]</code>).</li> <li>Outputs \u2014 typed, named exit points that carry the model's predictions back to the caller.</li> <li>Nodes \u2014 individual operators (Conv, MatMul, Softmax, \u2026) that transform tensors. Each node names its inputs and outputs using the same string identifiers used throughout the graph.</li> <li>Initializers \u2014 constant tensors embedded in the file. Learned weights, biases, and lookup tables are stored here; they are treated as graph inputs that are always pre-supplied.</li> <li>Metadata \u2014 key\u2013value string properties attached at the model level. winml-cli uses this area to store information such as <code>winml.io.inputs</code> (serialized tensor specs) and <code>winml.hierarchy.tag</code> attributes on individual nodes.</li> </ul>"},{"location":"concepts/graphs-and-ir/#graphs-as-ir","title":"Graphs as IR","text":"<p>ONNX functions as an Intermediate Representation: a portable, framework-neutral description of a computation that can be loaded by any conforming runtime. Unlike a Python object graph or a compiled binary, the ONNX IR makes data flow completely explicit. Every node declares the exact names of its input and output edges; those names form a namespace shared across the whole graph, so any consumer can trace a tensor from the model inputs through every transformation to the final output.</p> <p>This explicit wiring unlocks two capabilities that winml-cli relies on heavily. First, shape inference can propagate concrete or symbolic dimensions through the graph without running it \u2014 a prerequisite for correct quantization and for generating input specs automatically. Second, EP-targeted compilation can partition the graph by examining which nodes an Execution Provider supports, fuse eligible sub-graphs into accelerated kernels, and serialize the result back into a valid ONNX file using the <code>EPContext</code> convention. Neither of these would be tractable on an opaque binary or a dynamic execution trace.</p> <p>Because the IR is static \u2014 describing the full computation at load time rather than at call time \u2014 winml-cli can inspect, validate, and transform a model without a GPU, a framework, or sample data.</p>"},{"location":"concepts/graphs-and-ir/#opsets-and-versioning","title":"Opsets and versioning","text":"<p>Every operator in ONNX belongs to a domain, and every domain advances through numbered opset versions. An opset is a snapshot of the operator catalog: it defines which operators exist, what their inputs and outputs mean, and how edge cases are handled. When a model declares <code>opset_import { domain: \"\" version: 17 }</code>, it is saying \"all unnamed-domain operators in this file must be interpreted according to the rules published in opset 17.\"</p> <p>winml-cli defaults to opset 17 when exporting a PyTorch model to ONNX. This is the value of <code>opset_version: int = 17</code> in <code>WinMLExportConfig</code> (<code>src/winml/modelkit/export/config.py</code>, line 75). Opset 17 introduced layer-normalisation and group-normalisation operators in native form, eliminating the multi-node decompositions required by earlier opsets, which is why it is the recommended baseline for modern transformer and vision architectures.</p> <p>Higher opsets unlock additional operators and fix known edge-case behavior, but not every Execution Provider supports the latest opset. QNN, for instance, may lag behind the ONNX standard by one or two versions. If you need to target an older EP, pass a custom export configuration:</p> <pre><code># Write a config override\necho '{\"opset_version\": 16}' &gt; export_cfg.json\n\n# Export with the override\nwinml export -m prajjwal1/bert-tiny -o bert.onnx --export-config export_cfg.json\n</code></pre> <p>You can also check the opset a saved model declares:</p> <pre><code>winml inspect -m bert.onnx\n</code></pre> <pre><code>Opset: ai.onnx == 17\n</code></pre> <p>When winml-cli's optimization and quantization pipelines transform a model, they preserve the declared opset unless explicitly instructed otherwise, so the model you receive after <code>winml quantize</code> will carry the same opset version as the model you supplied.</p>"},{"location":"concepts/graphs-and-ir/#see-also","title":"See also","text":"<ul> <li>EP and Device</li> <li>Weight and Activation</li> <li>Datatype and Quantization</li> <li>winml inspect command</li> <li>winml export command</li> </ul>"},{"location":"concepts/how-it-works/","title":"How winml-cli Works","text":"<p>winml-cli is a toolkit for converting PyTorch and Hugging Face models into ONNX artifacts that are optimized and compiled for Windows ML execution providers (EPs). Starting from a model identifier or a pre-exported ONNX file, winml-cli runs a staged pipeline \u2014 export, optimize, quantize, compile \u2014 and produces a final <code>model.onnx</code> ready for inference via a Windows ML session.</p> <p>Each stage is independently controllable. Quantization and compilation are optional and can be bypassed with a flag or by leaving the corresponding section of the build configuration empty. The same pipeline API that powers <code>winml build</code> is also the programmatic entry point for <code>WinMLAutoModel.from_pretrained()</code>.</p>"},{"location":"concepts/how-it-works/#the-pipeline-at-a-glance","title":"The Pipeline at a Glance","text":"<p>The stages run in order, and each one writes an intermediate ONNX file to the output directory. All intermediate artifacts are preserved so you can inspect any stage's output or feed a pre-processed file into a later stage directly.</p>"},{"location":"concepts/how-it-works/#pipeline-stages","title":"Pipeline Stages","text":""},{"location":"concepts/how-it-works/#export-winml-export","title":"Export \u2014 <code>winml export</code>","text":"<p><code>winml export</code> loads a Hugging Face model (pretrained or random-weight), traces it with torch.export or an Optimum-based exporter, and writes a portable, device-agnostic ONNX file. The output at this stage is a plain ONNX graph with float32 weights and no EP-specific nodes.</p>"},{"location":"concepts/how-it-works/#analyze-winml-analyze","title":"Analyze \u2014 <code>winml analyze</code>","text":"<p><code>winml analyze</code> performs static compatibility analysis on an ONNX graph against a target execution provider. It classifies every node as Supported, Partial, Unsupported, or Unknown \u2014 without running the model on the device. Use it before building to check if your model (or an intermediate artifact from any pipeline stage) will run cleanly on the target EP:</p> <pre><code>winml analyze -m model.onnx --ep qnn --device npu\n</code></pre> <p>Add <code>--optim-config optim.json</code> to output auto-discovered optimization recommendations that can be fed directly into <code>winml optimize</code>. The same analyzer also drives the autoconf feedback loop inside <code>winml build</code>.</p>"},{"location":"concepts/how-it-works/#optimize-winml-optimize","title":"Optimize \u2014 <code>winml optimize</code>","text":"<p><code>winml optimize</code> runs graph-level transformations on the exported ONNX: operator fusion (attention, layer norm, GeLU), constant folding, and graph pruning. The optimize stage also contains an autoconf loop: a static analyzer inspects the graph for nodes that the target EP cannot dispatch natively, and re-runs optimization with adjusted fusion flags until no further improvements are found (up to a configurable iteration limit).</p>"},{"location":"concepts/how-it-works/#quantize-winml-quantize","title":"Quantize \u2014 <code>winml quantize</code>","text":"<p><code>winml quantize</code> inserts Quantize-Dequantize (QDQ) nodes into the optimized graph to reduce weights and activations to lower-precision types (for example, int8 weights with uint8 activations). Calibration data is used to compute quantization parameters per tensor. If the input model already contains QDQ nodes, this stage is skipped automatically.</p>"},{"location":"concepts/how-it-works/#compile-winml-compile","title":"Compile \u2014 <code>winml compile</code>","text":"<p><code>winml compile</code> invokes an EP-specific compiler (for example, the QNN compiler for NPU targets) to embed a pre-compiled binary cache inside the ONNX graph as an EPContext node. At inference time, the EP loads the cached binary directly, bypassing per-session compilation. Compilation is optional; omitting it produces a portable ONNX that is compiled on first load by the runtime.</p>"},{"location":"concepts/how-it-works/#perf-and-eval-winml-perf-winml-eval","title":"Perf and Eval \u2014 <code>winml perf</code> / <code>winml eval</code>","text":"<p>After the model is built, <code>winml perf</code> benchmarks inference latency and throughput using a Windows ML session, and <code>winml eval</code> runs task-specific accuracy evaluation. Neither command modifies the model; they consume the final <code>model.onnx</code> produced by the pipeline.</p>"},{"location":"concepts/how-it-works/#winml-build-as-the-one-shot-wrapper","title":"<code>winml build</code> as the One-Shot Wrapper","text":"<p>Running each stage individually is useful when iterating on a specific step, but the normal workflow is <code>winml build</code>, which orchestrates the full pipeline in a single command:</p> <pre><code>winml build -m microsoft/resnet-50 -o output/\n</code></pre> <p>The <code>-c config.json</code> flag is optional. If omitted, <code>winml build</code> auto-generates a default config internally. To customize pipeline settings, generate a config first with <code>winml config</code> and then pass it:</p> <pre><code>winml config -m microsoft/resnet-50 -o config.json\nwinml build -c config.json -m microsoft/resnet-50 -o output/\n</code></pre> <p><code>winml build</code> auto-detects whether the input is a Hugging Face model ID or an existing ONNX file and calls the appropriate internal API (<code>build_hf_model</code> or <code>build_onnx_model</code>). When given an ONNX file directly, the export stage is skipped and the pipeline starts at optimize.</p> <p>Individual stages can be bypassed from the command line without editing the config file:</p> <pre><code># Skip quantization and compilation\nwinml build -m bert-base-uncased -o output/ --no-quant --no-compile\n\n# Skip optimization (for pre-quantized input)\nwinml build -m model_qdq.onnx -o output/ --no-optimize\n</code></pre>"},{"location":"concepts/how-it-works/#configuration-winmlbuildconfig-vs-cli-flags","title":"Configuration: <code>WinMLBuildConfig</code> vs CLI Flags","text":"<p>Pipeline behavior is primarily governed by a <code>WinMLBuildConfig</code> JSON file generated by <code>winml config</code>. The config is a hierarchical structure with one section per stage:</p> <pre><code>WinMLBuildConfig\n\u251c\u2500\u2500 loader    \u2014 model type, task, input constraints\n\u251c\u2500\u2500 export    \u2014 input tensor specs, opset, backend\n\u251c\u2500\u2500 optim     \u2014 fusion flags, optimization level\n\u251c\u2500\u2500 quant     \u2014 precision, calibration settings (null = skip stage)\n\u251c\u2500\u2500 compile   \u2014 target EP, device (null = skip stage)\n\u2514\u2500\u2500 eval      \u2014 evaluation settings\n</code></pre> <p>Setting <code>quant</code> or <code>compile</code> to <code>null</code> in the JSON file is equivalent to passing <code>--no-quant</code> or <code>--no-compile</code> on the command line; both result in the corresponding stage being skipped. CLI flags override the config at runtime without modifying the file, which is convenient for one-off experiments.</p> <p>The config file is written (or updated) to the output directory after the optimize stage completes, capturing any autoconf-adjusted fusion flags so the build is reproducible. This persisted <code>winml_build_config.json</code> is a self-contained pipeline specification that you can check into version control and run in CI/CD (<code>winml build -c winml_build_config.json -m &lt;model&gt; -o output/</code>) for repeatable, unattended builds across environments.</p> <p>For the full field-by-field schema, see Reference \u2014 Config Schema.</p>"},{"location":"concepts/how-it-works/#see-also","title":"See Also","text":"<ul> <li>winml build \u2014 full reference for the build command</li> <li>winml export \u2014 export command reference</li> <li>ONNX and Execution Providers \u2014 background on EPs and the ONNX runtime</li> <li>Config and build \u2014 detailed field-by-field config documentation</li> </ul>"},{"location":"concepts/load-and-export/","title":"Load and export","text":"<p>The first stage of the winml-cli pipeline is the most deterministic: bring a model into memory and convert it to ONNX. Everything that follows \u2014 optimization, quantization, compilation \u2014 operates on that ONNX artifact. A well-exported graph with accurate metadata travels cleanly through the rest of the pipeline without requiring patching or re-export.</p> <p>Loading is an internal operation: the loader module resolves model provenance, selects the right HuggingFace model class, and prepares the weights for tracing. The <code>winml export</code> command is the surface users interact with directly.</p>"},{"location":"concepts/load-and-export/#loading-a-model","title":"Loading a model","text":"<p>When you point winml-cli at a model identifier, the internal loader resolves it in one of two ways. If the identifier looks like a HuggingFace Hub path (e.g., <code>prajjwal1/bert-tiny</code>), the loader downloads the model weights and configuration to the standard HuggingFace cache at <code>~/.cache/huggingface</code>. Subsequent runs are served from that cache without re-downloading. If the identifier is a path to a local PyTorch checkpoint directory, the loader reads it directly without network access.</p> <p>In both cases the loader auto-detects the task \u2014 image classification, text feature extraction, and so on \u2014 and selects a corresponding HuggingFace model class. The result is a PyTorch model object ready for tracing.</p> <p>Before committing to a full export you can verify that the loader resolved everything correctly with <code>winml inspect</code>. It prints the detected task, the HuggingFace model class, the export configuration, and the WinML inference class \u2014 all without downloading weights. Add <code>--hierarchy</code> to reconstruct the PyTorch module tree from random-weight tracing.</p> <p>Some community models host custom Python code in their repositories. The loader refuses to execute it by default. Pass <code>--trust-remote-code</code> to <code>winml config</code> when generating a build configuration for such a model.</p>"},{"location":"concepts/load-and-export/#exporting-to-onnx","title":"Exporting to ONNX","text":"<p><code>winml export</code> converts the loaded model to ONNX. The conversion uses TorchScript tracing by default, which follows actual execution paths and tends to produce compact, inference-oriented graphs. A <code>--dynamo</code> flag exists for the PyTorch 2.x dynamo exporter; however, Note: the <code>--dynamo</code> flag is reserved for the PyTorch 2.x dynamo exporter but is not yet functional in the current release \u2014 passing it logs a warning and the flag is ignored.</p> <p>By default the exporter runs an eight-step process that includes hierarchy tracing and tag injection. The result is an ONNX file enriched with structural metadata that powers downstream features such as per-module benchmarking, inspector views, and optimizer scoping.</p>"},{"location":"concepts/load-and-export/#hierarchy-tagging-in-detail","title":"Hierarchy tagging in detail","text":"<p>During export the HTP (Hierarchy-preserving Tags Protocol) exporter attaches two pieces of information to every ONNX graph node via <code>node.metadata_props</code>:</p> Key Value Example <code>winml.hierarchy.tag</code> Full module path the node originated from <code>/BertModel/BertEncoder/BertLayer.0/BertAttention</code> <code>winml.hierarchy.depth</code> Number of path segments (integer as string) <code>4</code>"},{"location":"concepts/load-and-export/#how-tags-are-built","title":"How tags are built","text":"<p>The exporter registers PyTorch forward hooks on each module. When a module executes, a pre-hook pushes its class name onto a tag stack; the post-hook pops it. This produces hierarchical paths that mirror the PyTorch module tree:</p> <pre><code>flowchart LR\n    A[Register hooks] --&gt; B[Run forward pass]\n    B --&gt; C[Pre-hook pushes tag]\n    C --&gt; D[Child modules execute]\n    D --&gt; E[Post-hook pops tag]\n    E --&gt; F[Tag stack \u2192 path]</code></pre> <p>Only modules that are actually executed during tracing receive tags \u2014 unused modules are excluded. For example, <code>prajjwal1/bert-tiny</code> has 48 registered modules but only 18 are reached during a forward pass.</p>"},{"location":"concepts/load-and-export/#concrete-example-bert-tiny","title":"Concrete example: BERT-tiny","text":"<p>Running <code>winml export -m prajjwal1/bert-tiny -o model.onnx -v</code> produces the following hierarchy tree (18 traced modules, 132 ONNX nodes, 100 % coverage):</p> <pre><code>BertModel (132 nodes)\n\u251c\u2500\u2500 BertEmbeddings: embeddings (7 nodes)\n\u251c\u2500\u2500 BertEncoder: encoder (106 nodes)\n\u2502   \u251c\u2500\u2500 BertLayer: encoder.layer.0 (53 nodes)\n\u2502   \u2502   \u251c\u2500\u2500 BertAttention: encoder.layer.0.attention (39 nodes)\n\u2502   \u2502   \u2502   \u251c\u2500\u2500 BertSelfOutput: encoder.layer.0.attention.output (4 nodes)\n\u2502   \u2502   \u2502   \u2514\u2500\u2500 BertSdpaSelfAttention: encoder.layer.0.attention.self (35 nodes)\n\u2502   \u2502   \u251c\u2500\u2500 BertIntermediate: encoder.layer.0.intermediate (10 nodes)\n\u2502   \u2502   \u2502   \u2514\u2500\u2500 GELUActivation: encoder.layer.0.intermediate.intermediate_act_fn (8 nodes)\n\u2502   \u2502   \u2514\u2500\u2500 BertOutput: encoder.layer.0.output (4 nodes)\n\u2502   \u2514\u2500\u2500 BertLayer: encoder.layer.1 (53 nodes)\n\u2502       \u2514\u2500\u2500 ... (same structure)\n\u2514\u2500\u2500 BertPooler: pooler (0 nodes)\n</code></pre> <p>Each ONNX node gets its tag from the module it belongs to. Here are a few examples from the actual exported model:</p> ONNX node name Assigned tag <code>/embeddings/word_embeddings/Gather</code> <code>/BertModel/BertEmbeddings</code> <code>/encoder/layer.0/attention/self/query/MatMul</code> <code>/BertModel/BertEncoder/BertLayer.0/BertAttention/BertSdpaSelfAttention</code> <code>/encoder/layer.0/intermediate/intermediate_act_fn/Mul</code> <code>/BertModel/BertEncoder/BertLayer.0/BertIntermediate/GELUActivation</code> <code>/Unsqueeze</code> (no scope) <code>/BertModel</code> (root fallback)"},{"location":"concepts/load-and-export/#node-to-module-mapping","title":"Node-to-module mapping","text":"<p>After the ONNX graph is produced by <code>torch.onnx.export</code>, a 4-priority system assigns each ONNX node to the closest matching module:</p> <ol> <li>Direct match (61 %) \u2014 the node's scope name maps exactly to a traced module.</li> <li>Parent match (24 %) \u2014 walk up the scope hierarchy until a traced module is found.</li> <li>Operation fallback (optional, off by default) \u2014 find the most similar scope by common prefix.</li> <li>Root fallback (14 %) \u2014 unmatched nodes receive the model root tag (e.g. <code>/BertModel</code>).</li> </ol> <p>This guarantees 100 % tag coverage: every node in the graph carries a non-empty tag.</p>"},{"location":"concepts/load-and-export/#graph-level-metadata","title":"Graph-level metadata","text":"<p>Beyond per-node tags, the exporter also writes model-level metadata properties:</p> Key Content <code>winml.io.inputs</code> JSON array of <code>InputTensorSpec</code> \u2014 name, shape, dtype, and optional <code>value_range</code> <code>winml.io.outputs</code> JSON array of <code>OutputTensorSpec</code> \u2014 name, shape, dtype <p>These I/O specs enable tools like <code>winml perf</code> to generate correct dummy inputs for benchmarking and <code>winml inspect</code> to display tensor shapes without loading the model into a runtime.</p>"},{"location":"concepts/load-and-export/#sidecar-metadata-file","title":"Sidecar metadata file","text":"<p>Alongside the <code>.onnx</code> file, the exporter writes a <code>*_htp_metadata.json</code> sidecar containing:</p> <ul> <li><code>nodes</code> \u2014 complete mapping of every ONNX node name \u2192 hierarchy tag</li> <li><code>modules</code> \u2014 traced module information (class name, tag, execution order)</li> <li><code>statistics</code> \u2014 export time, node counts, coverage percentage</li> <li><code>outputs</code> \u2014 I/O tensor specifications</li> </ul> <p>Use <code>--with-report</code> to additionally generate a human-readable markdown report (<code>*_htp_export_report.md</code>).</p>"},{"location":"concepts/load-and-export/#features-that-depend-on-tags","title":"Features that depend on tags","text":"<ul> <li><code>winml inspect --hierarchy</code> \u2014 traces the model with random weights and displays the resulting module tree in the terminal. This is a lightweight preview of what tags will look like after a full export.</li> <li><code>winml perf --module &lt;ClassName&gt;</code> \u2014 isolates a submodule (e.g. <code>BertAttention</code>) and benchmarks it independently.</li> </ul>"},{"location":"concepts/load-and-export/#disabling-tags","title":"Disabling tags","text":"<p>If you need a clean, standard-compliant ONNX without custom metadata \u2014 to hand off to a third-party tool, for example \u2014 pass <code>--no-hierarchy</code>. (The old <code>--clean-onnx</code> spelling remains as a deprecated hidden alias.) The graph behaviour is unchanged, but hierarchy-dependent features will not work against that file.</p>"},{"location":"concepts/load-and-export/#where-it-goes-wrong","title":"Where it goes wrong","text":"<p>Most export failures fall into three categories.</p> <p>Task mismatch. The loader auto-detects task from the model card and configuration, but some models are registered under multiple tasks or have ambiguous metadata. If the wrong task is selected the exporter generates incorrect dummy inputs and the trace fails or produces wrong output shapes. Override it explicitly with <code>--task</code>, for example <code>--task image-feature-extraction</code>.</p> <p>Shape issues. Transformer models often have symbolic sequence-length dimensions; vision models may expect a fixed spatial resolution. If the default dummy inputs do not match what the model accepts, shape inference will fail or produce dynamic shapes that downstream tools cannot handle. Provide a <code>--shape-config</code> JSON file with explicit overrides, or use <code>--input-specs</code> to supply a fully specified input manifest.</p> <p>Custom modules. Some models contain <code>torch.nn.Module</code> subclasses the tracer cannot automatically decompose. A <code>--torch-module</code> option (comma-separated class names) is intended to include them as distinct hierarchy nodes rather than inlining them \u2014 most often needed for custom normalization or attention implementations defined in the model repository. Note: the <code>--torch-module</code> flag is reserved for module-targeted export but is not yet functional in the current release \u2014 passing it logs a warning and the flag is ignored.</p>"},{"location":"concepts/load-and-export/#see-also","title":"See also","text":"<ul> <li>Graph and IR</li> <li>inspect command</li> <li>export command</li> </ul>"},{"location":"concepts/perf-and-monitoring/","title":"Perf and monitoring","text":"<p>Knowing that a model produces correct outputs is necessary but not sufficient for a production deployment. You also need to know how fast it runs, how consistently it runs, and where the time goes when it does not run fast enough. <code>winml perf</code> is the primary tool in <code>winml-cli</code> for answering those questions. It synthesises end-to-end latency numbers and live hardware utilisation into a single benchmarking workflow.</p> <p>Because <code>winml perf</code> accepts both HuggingFace model IDs and local <code>.onnx</code> files, you can benchmark at any stage of the development cycle \u2014 from a freshly exported float model through to a compiled, quantized production artifact.</p>"},{"location":"concepts/perf-and-monitoring/#what-perf-measures","title":"What perf measures","text":"<p>At its core, <code>winml perf</code> runs a configurable number of inference iterations and reports latency statistics. Here is a real example benchmarking <code>bert-tiny</code> on CPU:</p> <pre><code>$ winml perf -m bert-tiny.onnx --device cpu --iterations 50 --warmup 5\n\nDevice:      cpu / CPUExecutionProvider\nTask:        auto (auto-detected)\nModel Precision:   fp32\nInputs:      input_ids            [1, 512]    int32\n             attention_mask       [1, 512]    int32\n             token_type_ids       [1, 512]    int32\nOutputs:     last_hidden_state    [1, 512, 128]\n</code></pre> <p>Output latency table:</p> Avg P50 P90 P95 P99 Min Max Std 5.53 5.40 6.55 6.87 7.65 4.89 7.65 0.58 <pre><code>Warmup: 14.14 ms avg (first 5 iterations)\nThroughput: 180.72 samples/sec\n</code></pre> <p>Key parameters:</p> Flag Purpose Default <code>--iterations</code> Number of benchmark iterations 100 <code>--warmup</code> Warmup iterations excluded from statistics 10 <code>--batch-size</code> Batch size for input generation 1 <code>-d, --device</code> Target device: <code>auto</code>, <code>cpu</code>, <code>gpu</code>, <code>npu</code> <code>auto</code> <code>--ep</code> Specific execution provider (e.g. <code>qnn</code>, <code>dml</code>, <code>openvino</code>) auto-resolved from device <code>--precision</code> Precision mode: <code>auto</code>, <code>fp32</code>, <code>fp16</code>, <code>int8</code>, <code>int16</code>, or <code>w{x}a{y}</code> <code>auto</code> <code>--quantize/--no-quantize</code> Include quantization during model build <code>--quantize</code> <code>--skip-build/--no-skip-build</code> Skip the build pipeline for ONNX inputs <code>--skip-build</code>"},{"location":"concepts/perf-and-monitoring/#output-format","title":"Output format","text":"<p>Add <code>-f json</code> to emit structured JSON to stdout, suitable for CI pipelines or automated comparisons:</p> <pre><code>{\n  \"benchmark_info\": {\n    \"model_id\": \"bert-tiny.onnx\",\n    \"task\": \"auto-detected\",\n    \"device\": \"cpu\",\n    \"ep\": \"CPUExecutionProvider\",\n    \"precision\": \"auto\",\n    \"iterations\": 50,\n    \"warmup\": 5,\n    \"batch_size\": 1,\n    \"timestamp\": \"2026-06-11T03:27:24+00:00\"\n  },\n  \"model_info\": {\n    \"input_names\": [\"input_ids\", \"attention_mask\", \"token_type_ids\"],\n    \"input_shapes\": [[1, 512], [1, 512], [1, 512]],\n    \"input_types\": [\"int32\", \"int32\", \"int32\"],\n    \"output_names\": [\"last_hidden_state\"],\n    \"output_shapes\": [[1, 512, 128]]\n  },\n  \"latency_ms\": {\n    \"mean\": 5.53, \"p50\": 5.40, \"p90\": 6.55,\n    \"p95\": 6.87, \"p99\": 7.65, \"min\": 4.89, \"max\": 7.65,\n    \"std\": 0.58, \"warmup_mean\": 14.14\n  },\n  \"throughput\": { \"samples_per_sec\": 180.72, \"batches_per_sec\": 180.72 },\n  \"raw_samples_ms\": [5.12, 5.40, ...]\n}\n</code></pre> <p>Results are also saved automatically to <code>~/.cache/winml/perf/&lt;model_slug&gt;/&lt;timestamp&gt;.json</code> for later comparison. Override the path with <code>--output</code>.</p>"},{"location":"concepts/perf-and-monitoring/#live-monitoring","title":"Live monitoring","text":"<p>Latency numbers alone do not tell you whether the hardware is actually being used. A slow NPU inference could mean the model is running on the NPU and hitting a memory bottleneck, or it could mean the EP silently fell back to CPU and is not using the NPU at all.</p> <p>The <code>--monitor</code> flag adds a live terminal chart (powered by plotext + Rich Live) that streams hardware utilisation for whichever device is being benchmarked. The chart updates once per iteration so you can see whether utilisation is sustained, bursty, or absent. This is particularly useful when commissioning a new model on QNN or DirectML hardware, where EP fallback can be hard to detect from latency numbers alone. If the chart stays near zero while the benchmark runs, it is a strong signal that the model may not be executing on the expected device \u2014 investigate further with EP-specific tools.</p> <pre><code>winml perf -m model.onnx --device npu --monitor\n</code></pre> <p>Display updates are not included in the timed inference call, but monitoring may introduce small system overhead from background PDH polling.</p>"},{"location":"concepts/perf-and-monitoring/#memory-and-resource-metrics","title":"Memory and resource metrics","text":"<p>When <code>--monitor</code> is active, hardware metrics are sampled throughout the benchmark and reported at the end. These metrics help answer questions like \"how much device memory does this model need?\" and \"is the model memory-bound?\".</p> <p>The metrics collected depend on the target device:</p> Metric CPU GPU NPU CPU utilisation (mean/peak %) \u2713 \u2713 \u2713 RAM (used MB, peak MB) \u2713 \u2713 \u2713 Device utilisation (mean/peak %) \u2014 \u2713 \u2713 Device memory local (peak MB) \u2014 \u2713 \u2713 Device memory shared (peak MB) \u2014 \u2713 \u2713 Engine running time (ns) \u2014 \u2713 \u2713 <ul> <li>CPU: Only system-level metrics (CPU %, RAM) are shown in terminal output. In JSON, <code>device_memory</code> and <code>running_time_ns</code> are still present but will be zero.</li> <li>GPU: Reports GPU engine utilisation plus dedicated VRAM (<code>local_peak_mb</code>) and shared system memory (<code>shared_peak_mb</code>) allocated by the GPU driver.</li> <li>NPU: Same structure as GPU. NPU adapters register as Windows GPU Engine devices, so utilisation and memory are read via the same PDH counters. <code>local_peak_mb</code> represents dedicated adapter memory; <code>shared_peak_mb</code> is system memory shared with the NPU.</li> </ul>"},{"location":"concepts/perf-and-monitoring/#terminal-output","title":"Terminal output","text":"<p>CPU device:</p> <pre><code>Hardware (during benchmark)\n  CPU: 8.3% avg  |  Mem: 644 MB\n</code></pre> <p>NPU or GPU device:</p> <pre><code>Hardware (during benchmark)\n  NPU: 87.3% avg, 100.0% peak  |  CPU: 12.1% avg  |  Mem: 1842 MB\n  Device Mem: 245/0 MB (local/shared)\n</code></pre>"},{"location":"concepts/perf-and-monitoring/#json-structure","title":"JSON structure","text":"<p>In JSON output (<code>-f json</code>), these metrics appear under the <code>hw_monitor</code> key:</p> <pre><code>\"hw_monitor\": {\n  \"monitor\": \"HWMonitor\",\n  \"device_kind\": null,\n  \"adapter_luid\": null,\n  \"cpu\": { \"mean_pct\": 15.8, \"peak_pct\": 16.71, \"sample_count\": 2 },\n  \"ram\": { \"used_mb\": 640.21, \"peak_mb\": 640.21 },\n  \"device_memory\": { \"local_peak_mb\": 0.0, \"shared_peak_mb\": 0.0 },\n  \"running_time_ns\": 0\n}\n</code></pre> <p>When a hardware accelerator is active, <code>device_kind</code> will be <code>\"npu\"</code> or <code>\"gpu\"</code>, and an additional key (e.g. <code>\"npu\"</code>) appears with device utilisation:</p> <pre><code>\"hw_monitor\": {\n  \"monitor\": \"HWMonitor\",\n  \"device_kind\": \"npu\",\n  \"adapter_luid\": \"0x0000abcd12340000\",\n  \"cpu\": { \"mean_pct\": 12.1, \"peak_pct\": 34.5, \"sample_count\": 50 },\n  \"ram\": { \"used_mb\": 1842.0, \"peak_mb\": 1910.0 },\n  \"device_memory\": { \"local_peak_mb\": 245.0, \"shared_peak_mb\": 0.0 },\n  \"npu\": { \"mean_pct\": 87.3, \"peak_pct\": 100.0, \"sample_count\": 50 },\n  \"running_time_ns\": 4820000000\n}\n</code></pre> <p>This makes it straightforward to track memory consumption across model revisions or compare devices programmatically.</p>"},{"location":"concepts/perf-and-monitoring/#per-module-benchmarking","title":"Per-module benchmarking","text":"<p>Large Transformer-family models contain many repeated module instances \u2014 attention blocks, feed-forward layers, encoder stages. When you want to understand the cost of one type of block rather than the full network, <code>--module &lt;ClassName&gt;</code> isolates and benchmarks matching modules from the HuggingFace model hierarchy.</p> <pre><code>winml perf -m bert-base-uncased --module BertAttention\n</code></pre> <p>This builds and benchmarks each <code>BertAttention</code> instance separately and reports per-instance statistics. The <code>--module</code> argument must be a class name (e.g. <code>BertAttention</code>), not a dotted module path (e.g. not <code>encoder.layer.0.attention</code>).</p> <p>Internally, <code>--module</code> uses <code>torchinfo</code> to discover all submodule instances matching the given class name in the HuggingFace model. For each match it generates a separate build config, exports an isolated ONNX file, and benchmarks it independently. This requires a HuggingFace model ID (not a local <code>.onnx</code> file) because it needs access to the PyTorch module tree.</p>"},{"location":"concepts/perf-and-monitoring/#see-also","title":"See also","text":"<ul> <li>Load and export \u2014 how the module-tree metadata that <code>--module</code> targets gets written</li> <li>Eval and datasets \u2014 accuracy measurement to pair with performance numbers</li> <li>perf command reference</li> </ul>"},{"location":"concepts/primitives-and-pipeline/","title":"Primitives and pipeline","text":"<p>winml-cli exposes two ways to turn a Hugging Face model or ONNX file into a Windows ML-ready artifact. You can invoke each stage of the pipeline as an individual primitive command \u2014 <code>winml export</code>, <code>winml analyze</code>, <code>winml optimize</code>, <code>winml quantize</code>, <code>winml compile</code>, <code>winml perf</code>, <code>winml eval</code> \u2014 running one step at a time with full control over inputs and outputs. Alternatively, <code>winml build</code> wraps all of those stages into a single command driven by a <code>WinMLBuildConfig</code> JSON file.</p> <p>Understanding when to reach for a primitive versus the pipeline wrapper is the central workflow decision in winml-cli. Both paths produce the same artifacts; the difference is in repeatability, convenience, and how much you need to inspect or vary individual stages.</p>"},{"location":"concepts/primitives-and-pipeline/#the-primitive-commands","title":"The primitive commands","text":"<p>Each primitive command corresponds to one stage of the pipeline described in How winml-cli works. They run in order, each producing an ONNX file that the next stage consumes:</p> <ul> <li><code>winml export</code> \u2014 loads a Hugging Face model, traces it with PyTorch and the   Optimum exporter, and writes a portable float32 ONNX file with no EP-specific   nodes.</li> <li><code>winml analyze</code> \u2014 runs compatibility and runtime checks on the exported ONNX   graph, detecting unsupported operators, QDQ issues, and device-specific   constraints before further pipeline stages.</li> <li><code>winml optimize</code> \u2014 applies graph transformations (operator fusion, constant   folding, graph pruning) and runs an autoconf loop to maximize EP-compatible   coverage.</li> <li><code>winml quantize</code> \u2014 inserts QDQ nodes using calibration data, reducing weight   and activation types to lower precision (for example, int8) for efficient   inference.</li> <li><code>winml compile</code> \u2014 invokes an EP-specific compiler (for example, QNN for NPU   targets) to embed a pre-compiled binary cache in the ONNX graph as an EPContext   node.</li> <li><code>winml perf</code> \u2014 benchmarks latency and throughput against a Windows ML   session; does not modify the model.</li> <li><code>winml eval</code> \u2014 evaluates task-specific accuracy on a dataset; does not   modify the model.</li> </ul> <p>You can enter the pipeline at any stage. If you already have an optimized ONNX file, pass it directly to <code>winml quantize</code> without re-exporting. Each command writes its output to a path you specify, so all intermediate artifacts are preserved for inspection.</p>"},{"location":"concepts/primitives-and-pipeline/#the-pipeline-wrapper","title":"The pipeline wrapper","text":"<p><code>winml build</code> orchestrates all of the above stages in order from a single <code>WinMLBuildConfig</code> JSON file:</p> <pre><code>winml build -c config.json -m microsoft/resnet-50 -o output/\n</code></pre> <p>The config file tells <code>winml build</code> which stages to run and how to configure them. Setting the <code>quant</code> or <code>compile</code> section to <code>null</code> in the JSON skips that stage; passing <code>--no-quant</code>, <code>--no-compile</code>, or <code>--no-optimize</code> on the command line achieves the same effect at runtime without editing the file.</p> <p>When the model argument points to an existing ONNX file instead of a Hugging Face ID, <code>winml build</code> detects this and skips the export stage, running analyze \u2192 optimize \u2192 quantize \u2192 compile directly. This mirrors how each primitive command handles the same case.</p> <p><code>winml build</code> also accepts <code>--use-cache</code> in place of <code>-o</code>/<code>--output-dir</code>, routing artifacts to the winml-cli global cache at <code>~/.cache/winml/</code> instead of a local directory. Use <code>--rebuild</code> to force a clean re-run even when cached artifacts already exist.</p>"},{"location":"concepts/primitives-and-pipeline/#when-to-choose-which","title":"When to choose which","text":"<p>Use primitive commands when:</p> <ul> <li>You are learning the pipeline and want to observe each stage's output in   isolation.</li> <li>You are debugging a specific stage \u2014 for example, inspecting the optimized graph   before quantization, or testing a quantized model before compiling it.</li> <li>You need a one-off variation that does not warrant a versioned config, such as   trying a different opset or a different calibration sample count.</li> <li>You are integrating winml-cli output into a larger script that already manages   intermediate files.</li> </ul> <p>Use <code>winml build</code> when:</p> <ul> <li>You are targeting production or CI: a single config file captures the full   pipeline reproducibly and can be committed alongside the code that uses the   model.</li> <li>You want to share the exact build recipe with a teammate or reproduce it later   without reconstructing the sequence of primitive flags.</li> <li>You need the autoconf loop to propagate optimization decisions across stages,   which only <code>winml build</code> coordinates end-to-end.</li> <li>You want stage-skipping to be declarative (<code>quant: null</code> in the config) rather   than remembered flag-by-flag across invocations.</li> </ul> <p>The two approaches are not exclusive. A common pattern is to prototype with primitives \u2014 iterating on <code>winml optimize</code> and <code>winml quantize</code> individually to tune fusion flags and calibration \u2014 and then encode the final settings into a <code>WinMLBuildConfig</code> for repeatable production builds via <code>winml build</code>.</p>"},{"location":"concepts/primitives-and-pipeline/#see-also","title":"See also","text":"<ul> <li>How winml-cli works \u2014 pipeline stage order and internal   architecture</li> <li>Config and build \u2014 generating and versioning a   <code>WinMLBuildConfig</code></li> <li>winml build command reference</li> <li>Hugging Face Model to NPU tutorial \u2014 worked example   using primitive commands end-to-end</li> </ul>"},{"location":"concepts/quantization/","title":"Datatype and Quantization","text":"<p>Every ONNX tensor carries data in a specific numeric type \u2014 <code>float32</code>, <code>float16</code>, <code>int8</code>, <code>int16</code> \u2014 and every winml-cli pipeline makes deliberate choices about which type to use where. This page covers both halves of that decision: the datatype family winml-cli understands, and the quantization workflow that converts a model from one datatype to another to shrink it and run it faster on integer-native hardware.</p> <p>Quantization is the headline use of datatypes in winml-cli. By replacing <code>float32</code> weights and activations with <code>int8</code> or mixed precisions, you typically get a 2\u20134\u00d7 smaller model artifact and a 2\u20138\u00d7 latency speedup on NPU hardware. The trade-off is a potential reduction in model accuracy, the degree of which depends on the precision chosen and the sensitivity of the model.</p>"},{"location":"concepts/quantization/#datatypes","title":"Datatypes","text":"<p>winml-cli exposes a precision shorthand on the <code>--precision</code> flag that encodes the weight/activation dtype pair as a single string. The table below lists every precision from <code>_NAMED_PRECISIONS</code> in <code>config/precision.py</code>, together with the resolved quantization types. Float precisions (<code>fp32</code>, <code>fp16</code>) carry no quantization types because weights and activations remain in floating point throughout.</p> Precision Weight dtype Activation dtype Notes <code>auto</code> device-dependent device-dependent Resolves to <code>w8a16</code> (NPU), <code>fp16</code> (GPU/CPU) at runtime <code>fp32</code> float32 float32 No quantization; baseline accuracy <code>fp16</code> float16 float16 Half-precision float; no QDQ nodes inserted <code>int8</code> uint8 uint8 Static quantization; valid for QNN EP <code>int16</code> int16 uint16 Higher-accuracy quantization; larger model than int8 <code>w8a8</code> uint8 uint8 Equivalent to <code>int8</code>; explicit mixed-precision notation <code>w8a16</code> uint8 uint16 Mixed: compact weights, wider activations for accuracy <code>w4a16</code> n/a n/a Not supported. Rejected at validation \u2014 <code>is_quantized_precision(\"w4a16\")</code> returns <code>False</code> because 4-bit weight types are absent from <code>_BITS_TO_WEIGHT_TYPE</code> in <code>precision.py</code>. The string is not a recognized precision. <p>The <code>--weight-type</code> and <code>--activation-type</code> flags on <code>winml quantize</code> accept <code>uint8</code>, <code>int8</code>, <code>uint16</code>, or <code>int16</code> and override whatever the <code>--precision</code> shorthand would have resolved. This is useful when you need an unsigned weight type for QNN compatibility but a signed activation type for a specific operator constraint. See Weight and Activation for why the two need separate flags in the first place.</p>"},{"location":"concepts/quantization/#how-quantization-works-in-winml-cli","title":"How quantization works in winml-cli","text":"<p>winml-cli applies quantization by inserting QDQ (Quantize/Dequantize) nodes into the ONNX graph. The resulting file is a standard ONNX model that any ONNX Runtime execution provider can consume and optimize for its target hardware \u2014 the EP reads the QDQ pattern and fuses adjacent operations into true integer kernels.</p>"},{"location":"concepts/quantization/#calibration","title":"Calibration","text":"<p>Static quantization \u2014 the kind winml-cli applies \u2014 requires a calibration pass before inserting QDQ nodes. During calibration, a small set of representative inputs runs through the original floating-point model so that winml-cli can observe the actual range of values each tensor takes at runtime. Those observed ranges are then used to choose the scale and zero-point constants baked into the QDQ nodes.</p> <p>The <code>--samples</code> flag controls how many calibration inputs are used (default: <code>10</code>). More samples generally produce better range estimates but take longer. The <code>--method</code> flag selects the algorithm used to summarize the observed ranges:</p> <ul> <li><code>minmax</code> (default) \u2014 uses the absolute minimum and maximum observed values. Fast and predictable; can be sensitive to outliers.</li> <li><code>entropy</code> \u2014 minimizes the KL-divergence between the original and quantized distribution. Often yields better accuracy on models with heavy-tailed activation distributions.</li> <li><code>percentile</code> \u2014 clips a small fraction of extreme values before computing the range. A practical middle ground when outliers are present but entropy calibration is slow.</li> </ul> <p>Example using entropy calibration with more samples:</p> <pre><code>winml quantize -m model.onnx --precision int8 --samples 128 --method entropy\n</code></pre>"},{"location":"concepts/quantization/#the-qdq-pattern","title":"The QDQ pattern","text":"<p>The QDQ pattern is the standard ONNX representation for static quantization. winml-cli wraps the inputs and outputs of quantizable operators with pairs of <code>QuantizeLinear</code> and <code>DequantizeLinear</code> nodes. At the graph level the model still operates in floating-point; the QDQ nodes encode the scale and zero-point metadata that a runtime needs to fuse adjacent operations into true integer kernels.</p> <p>When the model runs under ONNX Runtime, the execution provider \u2014 whether CPU, DirectML, or a dedicated NPU EP \u2014 reads those QDQ patterns and performs its own graph fusion. This means the EP is free to apply hardware-specific optimizations without winml-cli needing to know anything about the target device's internal ISA or operator library. The QDQ model produced by <code>winml quantize</code> is a single portable artifact that can be deployed to any EP that supports integer execution.</p>"},{"location":"concepts/quantization/#when-quantization-is-lossy","title":"When quantization is lossy","text":"<p>Not all precision choices carry equal accuracy risk:</p> <ul> <li><code>fp16</code> is usually lossless in practice. Rounding errors relative to <code>fp32</code> are small enough that most models show no measurable accuracy difference.</li> <li><code>int8</code> and <code>int16</code> are inherently lossy. Compressing a 32-bit float into 8 or 16 bits discards information, and the magnitude of accuracy degradation depends on how well the calibration data represents the deployment distribution.</li> <li>Compound precisions like <code>w8a16</code> reduce the risk compared to full <code>int8</code> by preserving more precision in activations, but they are still lossy relative to <code>fp32</code>.</li> </ul> <p>Always validate accuracy after quantizing an integer-precision model. Run <code>winml eval</code> on a representative dataset and compare the metrics against the original floating-point baseline before shipping the quantized artifact.</p>"},{"location":"concepts/quantization/#see-also","title":"See also","text":"<ul> <li>Weight and Activation</li> <li>EP and Device</li> <li>quantize command reference</li> <li>eval command reference</li> </ul>"},{"location":"concepts/weight-and-activation/","title":"Weight and Activation","text":"<p>Every neural network model stores two kinds of numeric tensors that matter for deployment: weights, the static parameters baked in at training time, and activations, the intermediate values that flow through the graph at every inference call. Understanding the distinction is the key to reading winml-cli's precision flags, deciding when quantization is safe, and knowing why a model that runs fine on one execution provider may stall or degrade on another.</p>"},{"location":"concepts/weight-and-activation/#weights-are-static","title":"Weights are static","text":"<p>Weights are the trained parameters of the model: convolution kernels, linear projection matrices, attention weights, embedding tables, bias vectors. They are fixed at the moment the model is exported and stay constant for every inference call. Because they are static, their quantization parameters \u2014 the scale and zero-point used to compress them from fp32 to int8 \u2014 can be computed once, offline, using calibration data. <code>winml quantize</code> does exactly that: it observes the weight distributions in your exported ONNX and bakes the per-tensor scale/zero-point into the QDQ nodes that wrap the weights.</p> <p>In ONNX terms, weights are stored as initializers inside the graph. The runtime treats them as graph inputs that are always pre-supplied; you do not pass weights to a session at inference time, the way you pass an image tensor or a text prompt.</p>"},{"location":"concepts/weight-and-activation/#activations-are-dynamic","title":"Activations are dynamic","text":"<p>Activations are the intermediate results that flow through the graph during inference: the output of every matrix multiply, every layer norm, every attention softmax. Unlike weights, activations are regenerated on every forward pass and depend entirely on the input data. winml-cli cannot pre-compute their quantization parameters offline \u2014 instead, calibration runs a small set of representative inputs through the model and observes the actual ranges each activation tensor takes. Those observed ranges become the scale/zero-point baked into QDQ nodes around each activation.</p> <p>This is why calibration data matters. If the calibration set fails to represent the inputs you will see in production, the per-activation ranges will be wrong and the quantized model will lose more accuracy than necessary on real traffic.</p>"},{"location":"concepts/weight-and-activation/#why-they-need-separate-flags","title":"Why they need separate flags","text":"<p>The <code>--weight-type</code> and <code>--activation-type</code> flags on <code>winml quantize</code> exist because the optimal bit-width for weights is not necessarily the optimal bit-width for activations:</p> <ul> <li>Wider activation types (int16 vs int8) reduce accuracy loss at the cost of more memory bandwidth. Useful when activations have heavy-tailed distributions that quantize poorly at 8 bits.</li> <li>Narrower weight types compress the static footprint more aggressively. Useful when the model is memory-bound and accuracy headroom exists.</li> <li>Execution providers diverge along this boundary too. QNN on NPU pairs uint8 weights with uint8 or uint16 activations. DirectML on GPU can run float16 throughout. The CPU EP accepts almost any combination.</li> </ul> <p>The compound precision shorthand <code>w8a16</code> (8-bit weights, 16-bit activations) reflects this asymmetry directly: weights and activations get different bit-widths in one config string. For the full precision family and how each maps to weight/activation dtypes, see Datatype and Quantization.</p>"},{"location":"concepts/weight-and-activation/#see-also","title":"See also","text":"<ul> <li>Datatype and Quantization</li> <li>EP and Device</li> <li>quantize command</li> <li>Graph and IR</li> </ul>"},{"location":"getting-started/agent-skill/","title":"Agent Skill","text":"<p>winml-cli ships a Copilot Skill (<code>use-winml-cli</code>) that lets AI coding agents drive the entire model-building pipeline on your behalf. When a coding agent has this skill attached, it can inspect models, generate configs, run builds, and interpret results \u2014 without you having to remember exact flags or stage ordering.</p>"},{"location":"getting-started/agent-skill/#what-the-skill-provides","title":"What the skill provides","text":"<p>The skill teaches the agent:</p> Capability What the agent learns Pipeline shape The stage order (<code>inspect \u2192 export \u2192 analyze \u2192 optimize \u2192 quantize \u2192 compile \u2192 perf</code>) and when to enter mid-pipeline Flag discovery Always run <code>winml &lt;command&gt; --help</code> before quoting a command \u2014 never fabricate flags Output mapping Which command's <code>-o</code> produces the artifact the user actually needs Scope awareness Which model architectures are supported (classic DL) vs. out-of-scope (LLMs, diffusion) Hardware detection Use <code>winml sys --list-ep</code> to confirm what's available before targeting an EP Two paths When to use primitives (debugging, exploring) vs. config + build (production, CI)"},{"location":"getting-started/agent-skill/#how-to-use-it","title":"How to use it","text":""},{"location":"getting-started/agent-skill/#with-github-copilot-coding-agent","title":"With GitHub Copilot Coding Agent","text":"<p>To make the Copilot Coding Agent (the cloud agent that creates PRs) follow the skill's guidance, reference it in <code>.github/copilot-instructions.md</code>. The Coding Agent reads that file automatically when working on this repository.</p>"},{"location":"getting-started/agent-skill/#with-other-ai-agents","title":"With other AI agents","text":"<p>For agents that support custom instructions (e.g., Copilot Extensions, Claude, ChatGPT with file uploads, or custom MCP tool servers), attach the skill file as context:</p> <pre><code>skills/use-winml-cli/SKILL.md\n</code></pre> <p>You can copy the file contents into your agent's system prompt, upload it as a reference document, or include it in a <code>.github/copilot-instructions.md</code> for VS Code Copilot Chat. The skill uses standard markdown with YAML front-matter \u2014 any agent that accepts text context can benefit from it.</p>"},{"location":"getting-started/agent-skill/#skill-location","title":"Skill location","text":"<pre><code>winml-cli/\n\u2514\u2500\u2500 skills/\n    \u2514\u2500\u2500 use-winml-cli/\n        \u2514\u2500\u2500 SKILL.md          \u2190 the skill definition\n</code></pre>"},{"location":"getting-started/agent-skill/#example-agent-interaction","title":"Example agent interaction","text":"<pre><code>User: Can I run ConvNeXt on my Snapdragon X Elite NPU?\n\nAgent (with skill):\n1. Runs `winml sys --list-ep` \u2192 confirms QNNExecutionProvider is registered\n2. Runs `winml inspect -m microsoft/convnext-tiny-224` \u2192 confirms supported\n3. Runs `winml config --onnx ... -d npu -o config.json`\n4. Runs `winml build -c config.json -m microsoft/convnext-tiny-224 -o output/`\n5. Runs `winml perf -m output/model.onnx -d npu --monitor`\n6. Reports latency + NPU utilization to user\n</code></pre>"},{"location":"getting-started/installation/","title":"Installation","text":""},{"location":"getting-started/installation/#prerequisites","title":"Prerequisites","text":"Component Details Windows Windows 11 24H2 or later (required for NPU support) Hardware Device with CPU, GPU, or NPU Python 3.11 Package manager <code>uv</code> Version control <code>git</code> <p>No NPU?</p> <p>You can follow most of these docs without NPU hardware. All winml-cli commands accept <code>--device auto</code> and fall back to CPU or DirectML automatically. The tutorials document explicit CPU fallback paths.</p>"},{"location":"getting-started/installation/#install","title":"Install","text":"<pre><code>uv python install 3.11\nuv pip install winml-cli\n</code></pre> <p><code>uv python install 3.11</code> downloads and pins the exact Python version the project requires. <code>uv pip install winml-cli</code> installs the latest release from PyPI into a managed environment. No separate venv activation is needed.</p> <p>Install from source (for development)</p> <p>If you want to contribute or run the latest unreleased code:</p> <pre><code>git clone https://github.com/microsoft/winml-cli.git\ncd winml-cli\nuv sync\n</code></pre>"},{"location":"getting-started/installation/#verify","title":"Verify","text":"<pre><code>winml sys\n</code></pre> <p>Expected output (abbreviated):</p> <pre><code>+------------------------------------+\n|   winml-cli System Information     |\n+------------------------------------+\n\nEnvironment\n  Python Version    3.11.x\n  OS                Windows 11\n  Machine           AMD64\n\nML Libraries\n  Library        Version   Status\n  torch          2.x.x     OK\n  onnx           1.x.x     OK\n\nAvailable Devices (priority order)\n  #1  NPU   ...\n  #2  GPU   ...\n  #3  CPU   ...\n\nAvailable Execution Providers\n  QNNExecutionProvider           -&gt; NPU\n  DmlExecutionProvider           -&gt; GPU\n  CPUExecutionProvider           -&gt; CPU\n</code></pre> <p>This command enumerates available compute devices and execution providers on your machine. If an expected device or execution provider is missing, <code>winml sys</code> is the right place to diagnose it. See winml sys for the full flag reference and troubleshooting tips.</p>"},{"location":"getting-started/installation/#next-steps","title":"Next steps","text":"<ul> <li>Quickstart \u2014 export your first model in 5 minutes.</li> <li>End-to-End Tour \u2014 full pipeline targeting whatever hardware you have (NPU / GPU / CPU).</li> <li>How winml-cli Works \u2014 the mental model.</li> </ul>"},{"location":"getting-started/quickstart/","title":"Quickstart","text":""},{"location":"getting-started/quickstart/#verify-the-install","title":"Verify the install","text":"<p>Run the following command to enumerate available devices and execution providers on your machine:</p> <pre><code>uv run winml sys --list-device --list-ep\n</code></pre> <p><code>--list-device</code> and <code>--list-ep</code> print only the hardware and EP inventory. If the command exits without error, your winml-cli install is ready. See <code>winml sys</code> for the full flag reference.</p>"},{"location":"getting-started/quickstart/#inspect-the-model","title":"Inspect the model","text":"<p>Before downloading any models, confirm that winml-cli recognises the model:</p> <pre><code>uv run winml inspect -m microsoft/resnet-50\n</code></pre> <pre><code>+--------------------------- microsoft/resnet-50 ---------------------------+\n| Task          image-classification                                         |\n| Model Class   ResNetForImageClassification                                 |\n| Exporter      OptimumExporter                                              |\n| WinML Class   WinMLImageClassificationModel                                |\n| Status        Supported                                                    |\n+---------------------------------------------------------------------------+\n</code></pre> <p>Tip</p> <p>Always inspect before build to catch unsupported architectures early.</p>"},{"location":"getting-started/quickstart/#build-the-model","title":"Build the model","text":"<pre><code>uv run winml build -m microsoft/resnet-50 -o resnet_out/ --no-quant\n</code></pre> <p><code>winml build</code> runs all pipeline steps in sequence \u2014 export, optimize, quantize. You can start a model build without a config file, or provide one to configure each step in the sequence (see <code>winml config</code> to customize). All intermediate artifacts land in <code>resnet_out/</code>, so you can reuse any stage independently.</p> <p>After a successful build, you will find the following outputs in <code>resnet_out/</code>:</p> <ul> <li>A standard ONNX file for each completed stage \u2014 load, inspect, or pass any of these to a downstream tool independently.</li> <li><code>analyze_result.json</code> \u2014 detailed model compatibility insights for each Windows ML EP, including supported, partially supported, and unsupported operators, detected optimization patterns, and recommended optimization workflows.</li> <li>A declarative <code>winml_build_config</code> file \u2014 automatically generated after the build step to capture the full workflow end-to-end.</li> </ul>"},{"location":"getting-started/quickstart/#benchmark-the-model","title":"Benchmark the model","text":"<pre><code>uv run winml perf -m resnet_out/model.onnx --device auto --iterations 50 --monitor\n</code></pre> <p><code>--device auto</code> lets the CLI resolve the best available device on your machine \u2014 NPU first, then GPU, then CPU.</p>"},{"location":"getting-started/quickstart/#whats-next","title":"What's next","text":"<ul> <li>How winml-cli Works \u2014 understand what each command does under the hood.</li> <li>BERT sample \u2014 see the config + build + perf workflow in detail with a representative model.</li> </ul>"},{"location":"getting-started/quickstart/#see-also","title":"See also","text":"<ul> <li><code>winml build</code></li> <li><code>winml inspect</code></li> <li><code>winml perf</code></li> <li><code>winml sys</code></li> </ul>"},{"location":"getting-started/ui-quickstart/","title":"Try Windows ML CLI with a UI","text":"<p>If you prefer a graphical interface, you can use the Foundry Toolkit extension for VS Code to run Windows ML CLI model conversion without typing commands.</p>"},{"location":"getting-started/ui-quickstart/#quick-reference","title":"Quick reference","text":"<ol> <li>Install Visual Studio Code</li> <li>Install the Foundry Toolkit extension \u2014 search for <code>Foundry Toolkit</code> in the VS Code Extensions view</li> <li>Open the Model Conversion tool \u2014 in the Foundry Toolkit panel, select Model Conversion</li> <li>Choose your model \u2014 pick a model from Hugging Face, provide a local path, or select from the built-in model catalog filtered by Windows ML CLI</li> <li>Run the build \u2014 the extension invokes Windows ML CLI and streams the output to the VS Code terminal</li> </ol> <p>For a full walkthrough, see Build with Windows ML CLI (Preview) in the VS Code documentation.</p>"},{"location":"reference/","title":"Reference \u2014 Config Schema","text":"<p>This page documents the full schema for <code>WinMLBuildConfig</code>, the JSON configuration file that drives the winml-cli pipeline. Generate a config with <code>winml config</code>, then pass it to any command with <code>-c config.json</code>.</p> <p>The config is accepted by all pipeline commands \u2014 not just <code>winml build</code>. For example, <code>winml export -c config.json</code>, <code>winml quantize -c config.json</code>, and <code>winml compile -c config.json</code> each read the relevant section of the same config file. This lets you use a single config as the source of truth across all stages.</p>"},{"location":"reference/#top-level-structure","title":"Top-Level Structure","text":"<pre><code>{\n  \"loader\":  { ... },\n  \"export\":  { ... },\n  \"optim\":   { ... },\n  \"quant\":   { ... },\n  \"compile\": { ... },\n  \"eval\":    { ... },\n  \"auto\":    true\n}\n</code></pre> <p>Setting <code>quant</code> or <code>compile</code> to <code>null</code> skips that pipeline stage entirely. Setting <code>auto</code> to <code>true</code> (default) lets winml-cli auto-configure downstream stages based on the target device and precision.</p>"},{"location":"reference/#loader-model-loading","title":"<code>loader</code> \u2014 Model Loading","text":"Field Type Default Description <code>task</code> <code>str \\| null</code> <code>null</code> HuggingFace task (e.g., <code>image-classification</code>). Auto-detected if omitted. <code>model_class</code> <code>str \\| null</code> <code>null</code> Override model class (e.g., <code>AutoModelForCTC</code>). <code>model_type</code> <code>str \\| null</code> <code>null</code> HuggingFace model type (e.g., <code>bert</code>, <code>resnet</code>). <code>module_path</code> <code>str \\| null</code> <code>null</code> Dotted path to a submodule for targeted export. <code>user_script</code> <code>str \\| null</code> <code>null</code> Path to custom model class script. <code>trust_remote_code</code> <code>bool</code> <code>false</code> Trust remote code from HuggingFace."},{"location":"reference/#export-onnx-export","title":"<code>export</code> \u2014 ONNX Export","text":"Field Type Default Description <code>opset_version</code> <code>int</code> <code>17</code> ONNX opset version. <code>batch_size</code> <code>int</code> <code>1</code> Static batch size. Use 1 for QNN compatibility. <code>input_tensors</code> <code>list[InputTensorSpec] \\| null</code> <code>null</code> Input tensor specifications. Auto-inferred if omitted. <code>output_tensors</code> <code>list[OutputTensorSpec] \\| null</code> <code>null</code> Output tensor specifications. <code>dynamic_axes</code> <code>dict \\| null</code> <code>null</code> Dynamic axes mapping. \u26a0\ufe0f Breaks MatMulAddFusion on QNN. <code>export_params</code> <code>bool</code> <code>true</code> Include model parameters in ONNX. <code>do_constant_folding</code> <code>bool</code> <code>true</code> Fold constants during export. <code>verbose</code> <code>bool</code> <code>false</code> Verbose export logging. <code>dynamo</code> <code>bool</code> <code>false</code> Use PyTorch 2.x Dynamo exporter. <code>enable_hierarchy_tags</code> <code>bool</code> <code>true</code> Add module hierarchy tags to ONNX nodes. <code>clean_onnx</code> <code>bool</code> <code>false</code> Strip hierarchy tags after export. <code>hierarchy_tag_format</code> <code>\"full\" \\| \"module_only\"</code> <code>\"full\"</code> Tag detail level. <p>InputTensorSpec:</p> Field Type Description <code>name</code> <code>str \\| null</code> Tensor name (e.g., <code>pixel_values</code>). <code>dtype</code> <code>str \\| null</code> Data type (e.g., <code>float32</code>, <code>int64</code>). <code>shape</code> <code>list[int] \\| null</code> Tensor shape (e.g., <code>[1, 3, 224, 224]</code>). <code>value_range</code> <code>[float, float] \\| null</code> Min/max for dummy tensor generation."},{"location":"reference/#optim-graph-optimization","title":"<code>optim</code> \u2014 Graph Optimization","text":"<p>A dictionary of boolean fusion flags. All default to <code>false</code> unless auto-configured.</p> Field Type Description <code>gelu_fusion</code> <code>bool</code> Fuse GeLU activation patterns. <code>layer_norm_fusion</code> <code>bool</code> Fuse LayerNorm patterns. <code>matmul_add_fusion</code> <code>bool</code> Fuse MatMul + Add (enables BiasGelu). <p>Additional fusion flags can be added as key-value pairs.</p>"},{"location":"reference/#quant-quantization","title":"<code>quant</code> \u2014 Quantization","text":"<p>Set to <code>null</code> to skip quantization.</p> Field Type Default Description <code>mode</code> <code>\"qdq\" \\| \"static\" \\| \"dynamic\"</code> <code>\"qdq\"</code> Quantization mode. <code>weight_type</code> <code>\"uint8\" \\| \"int8\" \\| \"uint16\" \\| \"int16\"</code> <code>\"uint8\"</code> Weight data type. <code>activation_type</code> <code>\"uint8\" \\| \"int8\" \\| \"uint16\" \\| \"int16\"</code> <code>\"uint8\"</code> Activation data type. <code>calibration_method</code> <code>\"minmax\" \\| \"entropy\" \\| \"percentile\"</code> <code>\"minmax\"</code> Scale computation method. <code>samples</code> <code>int</code> <code>10</code> Number of calibration samples. <code>per_channel</code> <code>bool</code> <code>false</code> Per-channel quantization. <code>symmetric</code> <code>bool</code> <code>false</code> Symmetric quantization. <code>task</code> <code>str \\| null</code> <code>null</code> Task for dataset-aware calibration. <code>model_name</code> <code>str \\| null</code> <code>null</code> Model ID for calibration dataset resolution. <code>dataset_name</code> <code>str \\| null</code> <code>null</code> Override calibration dataset. <code>distribution</code> <code>str</code> <code>\"uniform\"</code> Random distribution for dummy data. <code>seed</code> <code>int \\| null</code> <code>null</code> Random seed for reproducibility. <code>calibration_load_path</code> <code>str \\| null</code> <code>null</code> Load pre-computed calibration scales. <code>calibration_save_path</code> <code>str \\| null</code> <code>null</code> Save calibration scales. <code>op_types_to_quantize</code> <code>list[str] \\| null</code> <code>null</code> Operator types to quantize (all if null). <code>nodes_to_exclude</code> <code>list[str] \\| null</code> <code>null</code> Node names to skip."},{"location":"reference/#compile-ep-compilation","title":"<code>compile</code> \u2014 EP Compilation","text":"<p>Set to <code>null</code> to skip compilation.</p> Field Type Default Description <code>ep_config.provider</code> <code>str</code> <code>\"qnn\"</code> EP alias: <code>qnn</code>, <code>cpu</code>, <code>dml</code>, <code>openvino</code>, <code>tensorrt</code>, <code>vitisai</code>, <code>migraphx</code>. <code>ep_config.device</code> <code>str</code> <code>\"auto\"</code> Target device: <code>npu</code>, <code>gpu</code>, <code>cpu</code>, <code>auto</code>. <code>ep_config.enable_ep_context</code> <code>bool</code> <code>true</code> Generate EPContext model. <code>ep_config.embed_context</code> <code>bool</code> <code>false</code> Embed binary in ONNX (true) or external .bin (false). <code>ep_config.compiler</code> <code>str</code> <code>\"ort\"</code> Compiler backend: <code>ort</code> or <code>qairt</code>. <code>ep_config.provider_options</code> <code>dict</code> <code>{}</code> EP-specific options. <code>ep_config.qnn_sdk_root</code> <code>str \\| null</code> <code>null</code> QNN SDK path for QAIRT compiler backend. <code>validate</code> <code>bool</code> <code>true</code> Validate compiled model. <code>verbose</code> <code>bool</code> <code>false</code> Verbose compilation logging."},{"location":"reference/#eval-evaluation","title":"<code>eval</code> \u2014 Evaluation","text":"<p>Set to <code>null</code> (default) to skip evaluation.</p> Field Type Default Description <code>model_id</code> <code>str \\| null</code> <code>null</code> HuggingFace model ID for config resolution. <code>model_path</code> <code>str \\| dict[str, str] \\| null</code> <code>null</code> Path to .onnx file, or a <code>{role: path}</code> dict for composite models. <code>task</code> <code>str \\| null</code> <code>null</code> Task type. <code>device</code> <code>str</code> <code>\"auto\"</code> Inference device. <code>precision</code> <code>str</code> <code>\"auto\"</code> Precision (<code>fp32</code>, <code>fp16</code>, <code>w8a16</code>, etc.). <code>ep</code> <code>str \\| null</code> <code>null</code> EP override. <code>dataset.path</code> <code>str \\| null</code> <code>null</code> HuggingFace dataset path. <code>dataset.name</code> <code>str \\| null</code> <code>null</code> Dataset config name. <code>dataset.split</code> <code>str</code> <code>\"validation\"</code> Dataset split. <code>dataset.samples</code> <code>int</code> <code>100</code> Evaluation sample count. <code>dataset.shuffle</code> <code>bool</code> <code>true</code> Shuffle before sampling. <code>dataset.seed</code> <code>int</code> <code>42</code> Random seed. <code>output_path</code> <code>str \\| null</code> <code>null</code> Path for JSON results output."},{"location":"reference/#example-full-config","title":"Example: Full Config","text":"<pre><code>{\n  \"loader\": {\n    \"task\": \"image-classification\",\n    \"model_type\": \"resnet\"\n  },\n  \"export\": {\n    \"opset_version\": 17,\n    \"batch_size\": 1\n  },\n  \"optim\": {\n    \"gelu_fusion\": true,\n    \"layer_norm_fusion\": true,\n    \"matmul_add_fusion\": true\n  },\n  \"quant\": {\n    \"mode\": \"qdq\",\n    \"weight_type\": \"uint8\",\n    \"activation_type\": \"uint8\",\n    \"samples\": 10,\n    \"calibration_method\": \"minmax\"\n  },\n  \"compile\": {\n    \"ep_config\": {\n      \"provider\": \"qnn\",\n      \"device\": \"npu\",\n      \"enable_ep_context\": true,\n      \"embed_context\": false\n    },\n    \"validate\": true\n  },\n  \"auto\": true\n}\n</code></pre>"},{"location":"reference/#the-auto-field","title":"The <code>auto</code> field","text":"<p>The top-level <code>\"auto\"</code> field (default: <code>true</code>) controls whether the build pipeline runs the autoconf loop \u2014 an iterative analyze \u2192 discover \u2192 re-optimize cycle that automatically detects which additional graph optimizations the model needs for the target EP.</p> Value Behavior <code>true</code> (default) After initial optimization, the analyzer inspects the graph for unsupported or sub-optimal nodes and proposes additional optimization flags. The pipeline re-optimizes using the discovered flags and repeats (up to <code>--max-optim-iterations</code>, default 3). The final optimization result depends on what the analyzer discovers at runtime, so outputs may vary if the model or EP support changes between runs. <code>false</code> The pipeline applies only the explicit <code>optim</code> flags from the config \u2014 no autoconf discovery, no re-optimization loop. Builds are fully deterministic given the same config and input model. Use this for reproducible CI builds or when you have already tuned the optimization flags manually. <p>When <code>auto</code> is <code>true</code> and the autoconf loop discovers additional flags, the final persisted config (written to the output directory) includes the merged result so you can inspect what was discovered.</p>"},{"location":"reference/#see-also","title":"See also","text":"<ul> <li>winml config \u2014 generate a config interactively</li> <li>winml build \u2014 run the pipeline with a config</li> <li>Config and build \u2014 conceptual overview</li> </ul>"},{"location":"reference/output-layout/","title":"Output Layout","text":"<p>When you run <code>winml build</code>, the tool writes all artifacts to the output directory. This page documents what each file is and which ones you need for deployment.</p>"},{"location":"reference/output-layout/#directory-structure","title":"Directory Structure","text":"<p>After a full pipeline run (export \u2192 optimize \u2192 quantize \u2192 compile):</p> <pre><code>output/\n\u251c\u2500\u2500 model.onnx                  \u2190 FINAL artifact (deploy this)\n\u251c\u2500\u2500 model.onnx.data             \u2190 External weights (if model \u2265 100 MiB)\n\u251c\u2500\u2500 winml_build_config.json     \u2190 Persisted build config\n\u251c\u2500\u2500 analyze_result.json         \u2190 Static analysis (EP compatibility)\n\u251c\u2500\u2500 build_manifest.json         \u2190 Build provenance (Python API only)\n\u251c\u2500\u2500 export_htp_metadata.json    \u2190 HTP export metadata (hierarchy info)\n\u251c\u2500\u2500 export.onnx                 \u2190 Intermediate: raw ONNX export\n\u251c\u2500\u2500 export.onnx.data\n\u251c\u2500\u2500 optimized.onnx              \u2190 Intermediate: after graph optimization\n\u251c\u2500\u2500 optimized.onnx.data\n\u251c\u2500\u2500 quantized.onnx              \u2190 Intermediate: after QDQ insertion\n\u251c\u2500\u2500 quantized.onnx.data\n\u251c\u2500\u2500 compiled.onnx               \u2190 Intermediate: after EP compilation\n\u2514\u2500\u2500 compiled.onnx.data\n</code></pre>"},{"location":"reference/output-layout/#file-categories","title":"File Categories","text":""},{"location":"reference/output-layout/#final-artifacts-keep-for-deployment","title":"Final Artifacts (Keep for Deployment)","text":"File Purpose <code>model.onnx</code> The deployment-ready model. Always present. <code>model.onnx.data</code> External weight data (only if model \u2265 100 MiB). Must stay alongside <code>model.onnx</code>. <code>winml_build_config.json</code> The complete pipeline config used for this build (includes auto-discovered optimization flags). This file is a reproducible pipeline specification \u2014 check it into version control or feed it directly to <code>winml build -c</code> in a CI/CD pipeline to guarantee identical model processing across machines and runs (set <code>\"auto\": false</code> for fully deterministic builds). <code>analyze_result.json</code> Static analysis output: EP compatibility, operator classification, detected patterns. <code>build_manifest.json</code> Build provenance with stage timings. Only generated via the Python API (<code>build_hf_model</code>/<code>build_onnx_model</code>). <code>export_htp_metadata.json</code> HTP export metadata: module hierarchy, tracing info, tagging coverage."},{"location":"reference/output-layout/#intermediate-files-can-delete-after-build","title":"Intermediate Files (Can Delete After Build)","text":"File Stage Contents <code>export.onnx</code> Export Raw PyTorch \u2192 ONNX conversion (float32) <code>optimized.onnx</code> Optimize Graph with fused operators, shape inference applied <code>quantized.onnx</code> Quantize QDQ nodes inserted, calibrated scales <code>compiled.onnx</code> Compile EPContext binary embedded or sidecar <p>Each intermediate has a corresponding <code>.onnx.data</code> file if the model exceeds 100 MiB.</p>"},{"location":"reference/output-layout/#what-gets-written-at-each-stage","title":"What Gets Written at Each Stage","text":""},{"location":"reference/output-layout/#export-only-winml-export","title":"Export only (<code>winml export</code>)","text":"<pre><code>output/\n\u251c\u2500\u2500 export.onnx\n\u2514\u2500\u2500 export.onnx.data          (if \u2265 100 MiB)\n</code></pre>"},{"location":"reference/output-layout/#optimize-only-winml-optimize","title":"Optimize only (<code>winml optimize</code>)","text":"<pre><code>output/\n\u251c\u2500\u2500 optimized.onnx\n\u2514\u2500\u2500 optimized.onnx.data\n</code></pre>"},{"location":"reference/output-layout/#full-build-winml-build","title":"Full build (<code>winml build</code>)","text":"<p>All stages write their intermediate, and <code>model.onnx</code> is a copy of the last successful stage output. If you skip quantization (<code>--no-quant</code>), the final model is a copy of <code>optimized.onnx</code>. If you skip compilation too, it's still a copy of <code>optimized.onnx</code>.</p>"},{"location":"reference/output-layout/#external-data","title":"External Data","text":"<p>Models larger than 100 MiB store weights in a separate <code>.onnx.data</code> file. Both files must be kept together \u2014 the <code>.onnx</code> file contains a reference to the data file by name.</p> Model Size Files &lt; 100 MiB <code>model.onnx</code> only (weights embedded) \u2265 100 MiB <code>model.onnx</code> + <code>model.onnx.data</code> <p>Warning</p> <p>If you move <code>model.onnx</code>, always move <code>model.onnx.data</code> alongside it. The ONNX file references the data file by relative path.</p>"},{"location":"reference/output-layout/#analyzer-result","title":"Analyzer Result","text":"<p><code>analyze_result.json</code> contains the static analysis output from the build pipeline's analyze stage. It reports EP compatibility and operator classification:</p> <pre><code>{\n  \"analysis_timestamp\": \"2026-06-04T19:45:17.496169\",\n  \"metadata\": {\n    \"model_path\": \"iter.onnx\",\n    \"opset_version\": 17,\n    \"producer_name\": \"pytorch\",\n    \"producer_version\": \"2.12.0\",\n    \"total_operators\": 122,\n    \"operator_counts\": {\n      \"Conv\": 53,\n      \"Relu\": 49,\n      \"MaxPool\": 1,\n      \"Add\": 16,\n      \"GlobalAveragePool\": 1,\n      \"Flatten\": 1,\n      \"Gemm\": 1\n    },\n    \"unique_operator_types\": 7,\n    \"detected_pattern_count\": {}\n  },\n  \"results\": [\n    {\n      \"ihv_type\": \"Microsoft\",\n      \"ep_type\": \"CPUExecutionProvider\",\n      \"device_type\": \"cpu\",\n      \"runtime_support\": false,\n      \"has_errors\": false,\n      \"has_warnings\": false,\n      \"classification\": {\n        \"supported\": [],\n        \"partial\": [],\n        \"unsupported\": [],\n        \"unknown\": [\n          \"OP/ai.onnx/Conv\",\n          \"OP/ai.onnx/Relu\",\n          \"OP/ai.onnx/MaxPool\",\n          \"OP/ai.onnx/Add\",\n          \"OP/ai.onnx/GlobalAveragePool\",\n          \"OP/ai.onnx/Flatten\",\n          \"OP/ai.onnx/Gemm\"\n        ]\n      },\n      \"information\": []\n    }\n  ]\n}\n</code></pre> <p>Key fields:</p> Field Description <code>metadata.total_operators</code> Total ONNX operator nodes in the model graph <code>metadata.operator_counts</code> Frequency of each operator type <code>metadata.detected_pattern_count</code> Fused subgraph patterns (GeLU, LayerNorm, etc.) <code>results[].ihv_type</code> Hardware vendor (<code>\"Microsoft\"</code>, <code>\"QC\"</code>, <code>\"Intel\"</code>, etc.) <code>results[].runtime_support</code> <code>true</code> if the EP can run all operators <code>results[].classification</code> Operators grouped by support level: <code>supported</code>, <code>partial</code>, <code>unsupported</code>, <code>unknown</code> <code>results[].has_errors</code> <code>true</code> if unsupported ops exist (model won't run on that EP)"},{"location":"reference/output-layout/#build-manifest","title":"Build Manifest","text":"<p><code>build_manifest.json</code> records provenance for every build:</p> <pre><code>{\n  \"schema_version\": 1,\n  \"model_id\": \"microsoft/resnet-50\",\n  \"task\": \"image-classification\",\n  \"cache_key\": \"a1b2c3d4e5f6\",\n  \"config_hash\": \"f7e8d9c0b1a2\",\n  \"timestamp\": \"2026-01-15T10:30:00.000000+00:00\",\n  \"elapsed_seconds\": 45.1,\n  \"final_artifact\": \"model.onnx\",\n  \"analyze_iterations\": 2,\n  \"analyze_unsupported_node_count\": 0,\n  \"analyze_details\": { \"lint\": {}, \"autoconf\": {} },\n  \"stages\": [\n    {\n      \"name\": \"export\",\n      \"status\": \"completed\",\n      \"filename\": \"export.onnx\",\n      \"elapsed_seconds\": 12.5\n    },\n    {\n      \"name\": \"optimize\",\n      \"status\": \"completed\",\n      \"filename\": \"optimized.onnx\",\n      \"elapsed_seconds\": 8.2\n    },\n    {\n      \"name\": \"quantize\",\n      \"status\": \"completed\",\n      \"filename\": \"quantized.onnx\",\n      \"elapsed_seconds\": 15.3,\n      \"nodes_quantized\": 150,\n      \"nodes_skipped\": 12\n    },\n    {\n      \"name\": \"compile\",\n      \"status\": \"completed\",\n      \"filename\": \"compiled.onnx\",\n      \"elapsed_seconds\": 9.1\n    }\n  ]\n}\n</code></pre>"},{"location":"reference/output-layout/#rebuild-behavior","title":"Rebuild Behavior","text":"<ul> <li>If <code>model.onnx</code> already exists and <code>rebuild=False</code> (default), the build is   skipped entirely.</li> <li>Pass <code>--rebuild</code> (CLI) or <code>force_rebuild=True</code> (Python API) to force a fresh   build.</li> <li>On rebuild, all old <code>.onnx</code> and <code>.onnx.data</code> files are deleted before the   pipeline runs.</li> </ul>"},{"location":"reference/output-layout/#see-also","title":"See also","text":"<ul> <li>winml build \u2014 build command reference</li> <li>Reference \u2014 Config Schema \u2014 config file format</li> <li>How winml-cli Works \u2014 pipeline stages explained</li> </ul>"},{"location":"reference/python-api/","title":"Python API","text":"<p>winml-cli can be used as a Python library for programmatic model building and inference. This page documents the public API surface.</p>"},{"location":"reference/python-api/#quick-example","title":"Quick Example","text":"<pre><code>from winml.modelkit import WinMLAutoModel\n\n# Build and load in one call\nmodel = WinMLAutoModel.from_pretrained(\"microsoft/resnet-50\", device=\"npu\")\noutput = model(pixel_values=images)\n\n# From a local ONNX file\nmodel = WinMLAutoModel.from_onnx(\"model.onnx\", task=\"image-classification\")\n</code></pre>"},{"location":"reference/python-api/#winmlautomodel","title":"<code>WinMLAutoModel</code>","text":"<p>Factory class for automatic model building and loading. Not instantiable directly \u2014 use the class methods.</p>"},{"location":"reference/python-api/#from_pretrained","title":"<code>from_pretrained()</code>","text":"<p>Build and load a model from a HuggingFace ID or local path. Runs the full pipeline: config \u2192 export \u2192 optimize \u2192 quantize \u2192 compile \u2192 load.</p> <pre><code>WinMLAutoModel.from_pretrained(\n    model_id_or_path: str | Path,\n    *,\n    task: str | None = None,\n    config: WinMLBuildConfig | None = None,\n    device: str = \"auto\",\n    precision: str = \"auto\",\n    cache_dir: str | Path | None = None,\n    use_cache: bool = True,\n    force_rebuild: bool = False,\n    trust_remote_code: bool = False,\n    shape_config: dict | None = None,\n    no_compile: bool = False,\n) -&gt; WinMLPreTrainedModel\n</code></pre> Parameter Type Default Description <code>model_id_or_path</code> <code>str \\| Path</code> required HuggingFace model ID or path to local model. <code>task</code> <code>str \\| None</code> <code>None</code> Task name. Auto-detected if omitted. <code>config</code> <code>WinMLBuildConfig \\| None</code> <code>None</code> Custom build config. Auto-generated if omitted. <code>device</code> <code>str</code> <code>\"auto\"</code> Target device: <code>\"auto\"</code>, <code>\"npu\"</code>, <code>\"gpu\"</code>, <code>\"cpu\"</code>. <code>precision</code> <code>str</code> <code>\"auto\"</code> Precision: <code>\"auto\"</code>, <code>\"fp32\"</code>, <code>\"fp16\"</code>, <code>\"w8a8\"</code>, etc. <code>cache_dir</code> <code>str \\| Path \\| None</code> <code>None</code> Cache directory for built artifacts. <code>use_cache</code> <code>bool</code> <code>True</code> Reuse cached build if available. <code>force_rebuild</code> <code>bool</code> <code>False</code> Force rebuild even if cache exists. <code>trust_remote_code</code> <code>bool</code> <code>False</code> Trust remote code from HuggingFace. <code>no_compile</code> <code>bool</code> <code>False</code> Skip the compilation stage. <p>Returns: A task-specific <code>WinMLPreTrainedModel</code> subclass.</p>"},{"location":"reference/python-api/#from_onnx","title":"<code>from_onnx()</code>","text":"<p>Build from a pre-exported ONNX file. Runs: optimize \u2192 quantize \u2192 compile \u2192 load.</p> <pre><code>WinMLAutoModel.from_onnx(\n    onnx_path: str | Path | dict[str, str | Path],\n    *,\n    task: str | None = None,\n    config: WinMLBuildConfig | None = None,\n    device: str = \"auto\",\n    precision: str = \"auto\",\n    ep: str | None = None,\n    cache_dir: str | Path | None = None,\n    use_cache: bool = True,\n    force_rebuild: bool = False,\n    skip_build: bool = False,\n    session_options: Any | None = None,\n    hf_config: PretrainedConfig | None = None,\n    **kwargs: Any,\n) -&gt; WinMLPreTrainedModel | WinMLCompositeModel\n</code></pre> Parameter Type Default Description <code>onnx_path</code> <code>str \\| Path \\| dict</code> required ONNX file path, or dict of submodel paths for composite models. <code>skip_build</code> <code>bool</code> <code>False</code> Load ONNX directly without running optimize/quantize/compile. <code>hf_config</code> <code>PretrainedConfig \\| None</code> <code>None</code> Required for composite models (dict inputs)."},{"location":"reference/python-api/#supported_tasks","title":"<code>supported_tasks()</code>","text":"<pre><code>WinMLAutoModel.supported_tasks() -&gt; list[str]\n</code></pre> <p>Returns all task strings with dedicated inference classes (16 tasks).</p>"},{"location":"reference/python-api/#build-pipeline-functions","title":"Build Pipeline Functions","text":"<p>Lower-level functions for fine-grained control over the pipeline.</p>"},{"location":"reference/python-api/#build_hf_model","title":"<code>build_hf_model()</code>","text":"<pre><code>from winml.modelkit.build import build_hf_model\n\nresult = build_hf_model(\n    config: WinMLBuildConfig,\n    output_dir: Path,\n    *,\n    model_id: str | None = None,\n    pytorch_model: nn.Module | None = None,\n    rebuild: bool = False,\n    trust_remote_code: bool = False,\n    random_init: bool = False,\n    cache_key: str | None = None,\n    ep: str | None = None,\n    device: str | None = None,\n    **kwargs: Any,\n) -&gt; BuildResult\n</code></pre> <p>Runs the full pipeline (export \u2192 optimize \u2192 analyze \u2192 quantize \u2192 compile) and writes all artifacts to <code>output_dir</code>.</p>"},{"location":"reference/python-api/#build_onnx_model","title":"<code>build_onnx_model()</code>","text":"<pre><code>from winml.modelkit.build import build_onnx_model\n\nresult = build_onnx_model(\n    onnx_path: Path | str,\n    *,\n    config: WinMLBuildConfig,\n    output_dir: Path | str,\n    rebuild: bool = False,\n    ep: str | None = None,\n    device: str | None = None,\n    **kwargs: Any,\n) -&gt; BuildResult\n</code></pre> <p>Builds from an existing ONNX file (skips export).</p>"},{"location":"reference/python-api/#buildresult","title":"<code>BuildResult</code>","text":"<pre><code>@dataclass\nclass BuildResult:\n    output_dir: Path           # Directory containing all artifacts\n    final_onnx_path: Path      # Path to final model.onnx\n    config_path: Path          # Path to winml_build_config.json\n    stages_completed: list[str]  # e.g., [\"export\", \"optimize\", \"quantize\"]\n    stages_skipped: list[str]\n    stage_timings: dict[str, float]  # Per-stage seconds\n    elapsed: float             # Total build time (seconds)\n    reused: bool               # True if cache hit, no build ran\n    manifest_path: Path | None # Path to build_manifest.json\n</code></pre>"},{"location":"reference/python-api/#config-generation","title":"Config Generation","text":""},{"location":"reference/python-api/#generate_build_config","title":"<code>generate_build_config()</code>","text":"<pre><code>from winml.modelkit.config import generate_build_config\n\nconfig = generate_build_config(\n    model_id: str | None = None,\n    *,\n    task: str | None = None,\n    model_class: str | None = None,\n    model_type: str | None = None,\n    module: str | None = None,\n    override: WinMLBuildConfig | None = None,\n    shape_config: dict | None = None,\n    library_name: str = \"transformers\",\n    device: str = \"auto\",\n    precision: str = \"auto\",\n    trust_remote_code: bool = False,\n    ep: str | None = None,\n    onnx_path: str | Path | None = None,\n) -&gt; WinMLBuildConfig | list[WinMLBuildConfig]\n</code></pre> <p>Auto-generates a complete build config by probing the model's <code>config.json</code> (does not download weights). Equivalent to what <code>winml config</code> produces. Returns a list when <code>module</code> is specified (one config per submodule).</p>"},{"location":"reference/python-api/#inference-model-classes","title":"Inference Model Classes","text":"<p>All inference models inherit from <code>WinMLPreTrainedModel</code> and are HuggingFace pipeline-compatible.</p>"},{"location":"reference/python-api/#winmlpretrainedmodel-base","title":"<code>WinMLPreTrainedModel</code> (Base)","text":"<pre><code>class WinMLPreTrainedModel:\n    def __call__(self, **kwargs) -&gt; Any: ...\n    def perf(self, warmup: int = 0) -&gt; ContextManager: ...\n\n    @property\n    def device(self) -&gt; str: ...\n    @property\n    def ep_name(self) -&gt; str | None: ...\n    @property\n    def io_config(self) -&gt; dict: ...\n    @property\n    def task(self) -&gt; str | None: ...\n</code></pre>"},{"location":"reference/python-api/#task-specific-classes","title":"Task-Specific Classes","text":"Class Task <code>WinMLModelForImageClassification</code> <code>image-classification</code> <code>WinMLModelForSequenceClassification</code> <code>text-classification</code> <code>WinMLModelForImageSegmentation</code> <code>image-segmentation</code> <code>WinMLModelForSemanticSegmentation</code> <code>semantic-segmentation</code> <code>WinMLModelForObjectDetection</code> <code>object-detection</code> <code>WinMLModelForFeatureExtraction</code> <code>feature-extraction</code> <code>WinMLModelForQuestionAnswering</code> <code>question-answering</code> <code>WinMLModelForZeroShotImageClassification</code> <code>zero-shot-image-classification</code> <code>WinMLModelForGenericTask</code> fallback (raw outputs)"},{"location":"reference/python-api/#performance-tracking","title":"Performance Tracking","text":"<pre><code>model = WinMLAutoModel.from_pretrained(\"microsoft/resnet-50\", device=\"npu\")\n\nwith model.perf(warmup=5) as stats:\n    for img in test_images:\n        model(pixel_values=img)\n\nprint(f\"P99 latency: {stats.p99_ms:.2f} ms\")\n</code></pre>"},{"location":"reference/python-api/#see-also","title":"See also","text":"<ul> <li>Reference \u2014 Config Schema \u2014 full config field reference</li> <li>winml build \u2014 CLI equivalent</li> <li>How winml-cli Works \u2014 pipeline overview</li> </ul>"},{"location":"reference/supported-models/","title":"Supported Models","text":"<p>Windows ML CLI has validated a set of models for compatibility across all Execution Providers (EPs)\u2014see the full model compatibility report.</p> <p>winml-cli supports a wide range of model architectures and tasks. This page lists what's validated and how to discover model support.</p>"},{"location":"reference/supported-models/#discovery-commands","title":"Discovery Commands","text":"<pre><code># Browse the curated catalog (64 validated models)\nuv run winml catalog\n\n# Filter by task\nuv run winml catalog -t image-classification\n\n# Check if a specific model is supported\nuv run winml inspect -m microsoft/resnet-50\n\n# List all known tasks\nuv run winml inspect --list-tasks\n</code></pre>"},{"location":"reference/supported-models/#supported-tasks","title":"Supported Tasks","text":"<p>winml-cli recognizes 35 task types across vision, NLP, audio, and multimodal domains. Of these, 16 have dedicated inference classes; the remainder are supported via the generic task fallback.</p>"},{"location":"reference/supported-models/#vision","title":"Vision","text":"Task Example Models <code>image-classification</code> ResNet, ConvNeXt, ViT, Swin <code>image-segmentation</code> Segformer, Mask2Former <code>semantic-segmentation</code> Segformer <code>object-detection</code> DETR, YOLOS, Table-Transformer <code>depth-estimation</code> Depth Anything, ZoeDepth <code>image-feature-extraction</code> DINOv2, ViT <code>zero-shot-image-classification</code> CLIP, SigLIP"},{"location":"reference/supported-models/#nlp","title":"NLP","text":"Task Example Models <code>text-classification</code> BERT, RoBERTa, XLM-RoBERTa <code>token-classification</code> BERT, RoBERTa (NER) <code>question-answering</code> BERT, RoBERTa <code>fill-mask</code> BERT, RoBERTa <code>feature-extraction</code> BGE, BERT, all-MiniLM <code>text-generation</code> Qwen3 (composite) <code>text2text-generation</code> T5, BART, Marian"},{"location":"reference/supported-models/#audio","title":"Audio","text":"Task Example Models <code>automatic-speech-recognition</code> Whisper <code>audio-classification</code> Wav2Vec2"},{"location":"reference/supported-models/#multimodal","title":"Multimodal","text":"Task Example Models <code>zero-shot-image-classification</code> CLIP (text + vision) <code>image-to-text</code> VisionEncoderDecoder <code>visual-question-answering</code> BLIP"},{"location":"reference/supported-models/#validated-model-catalog","title":"Validated Model Catalog","text":"<p>The following models have been validated end-to-end with EP compatibility testing. Use <code>winml catalog</code> to browse the full list interactively.</p>"},{"location":"reference/supported-models/#image-classification","title":"Image Classification","text":"Model Architecture <code>apple/mobilevit-small</code> MobileViT <code>dima806/fairface_age_image_detection</code> ViT <code>facebook/convnext-tiny-224</code> ConvNeXt <code>google/vit-base-patch16-224</code> ViT <code>microsoft/resnet-18</code> ResNet <code>microsoft/resnet-50</code> ResNet <code>microsoft/swin-large-patch4-window7-224</code> Swin <code>rizvandwiki/gender-classification</code> ViT"},{"location":"reference/supported-models/#image-feature-extraction","title":"Image Feature Extraction","text":"Model Architecture <code>facebook/dino-vitb16</code> ViT <code>facebook/dino-vits16</code> ViT <code>facebook/dinov2-small</code> DINOv2 <code>google/vit-base-patch16-224-in21k</code> ViT"},{"location":"reference/supported-models/#feature-extraction-text","title":"Feature Extraction (Text)","text":"Model Architecture <code>BAAI/bge-base-en-v1.5</code> BERT <code>BAAI/bge-m3</code> XLM-RoBERTa <code>BAAI/bge-small-en-v1.5</code> BERT <code>google-bert/bert-base-multilingual-cased</code> BERT <code>Intel/bert-base-uncased-mrpc</code> BERT <code>laion/CLIP-ViT-B-32-laion2B-s34B-b79K</code> CLIP <code>openai/clip-vit-base-patch16</code> CLIP <code>openai/clip-vit-base-patch32</code> CLIP <code>sentence-transformers/all-MiniLM-L6-v2</code> BERT <code>sentence-transformers/all-mpnet-base-v2</code> MPNet <code>sentence-transformers/multi-qa-mpnet-base-dot-v1</code> MPNet <code>sentence-transformers/paraphrase-multilingual-MiniLM-L12-v2</code> BERT"},{"location":"reference/supported-models/#sentence-similarity","title":"Sentence Similarity","text":"Model Architecture <code>BAAI/bge-base-en-v1.5</code> BERT <code>BAAI/bge-large-en-v1.5</code> BERT <code>BAAI/bge-m3</code> XLM-RoBERTa <code>BAAI/bge-small-en-v1.5</code> BERT <code>sentence-transformers/all-MiniLM-L6-v2</code> BERT <code>sentence-transformers/all-mpnet-base-v2</code> MPNet <code>sentence-transformers/multi-qa-mpnet-base-dot-v1</code> MPNet <code>sentence-transformers/paraphrase-multilingual-MiniLM-L12-v2</code> BERT <code>sentence-transformers/paraphrase-multilingual-mpnet-base-v2</code> XLM-RoBERTa"},{"location":"reference/supported-models/#fill-mask","title":"Fill-Mask","text":"Model Architecture <code>distilbert/distilbert-base-uncased</code> DistilBERT <code>FacebookAI/roberta-base</code> RoBERTa <code>FacebookAI/roberta-large</code> RoBERTa <code>FacebookAI/xlm-roberta-base</code> XLM-RoBERTa <code>google-bert/bert-base-multilingual-cased</code> BERT <code>google-bert/bert-base-multilingual-uncased</code> BERT <code>google-bert/bert-base-uncased</code> BERT"},{"location":"reference/supported-models/#text-classification","title":"Text Classification","text":"Model Architecture <code>cardiffnlp/twitter-roberta-base-sentiment-latest</code> RoBERTa <code>distilbert/distilbert-base-uncased-finetuned-sst-2-english</code> DistilBERT <code>Intel/bert-base-uncased-mrpc</code> BERT <code>ProsusAI/finbert</code> BERT"},{"location":"reference/supported-models/#token-classification","title":"Token Classification","text":"Model Architecture <code>Babelscape/wikineural-multilingual-ner</code> BERT <code>dbmdz/bert-large-cased-finetuned-conll03-english</code> BERT <code>dslim/bert-base-NER</code> BERT <code>Isotonic/distilbert_finetuned_ai4privacy_v2</code> DistilBERT <code>w11wo/indonesian-roberta-base-posp-tagger</code> RoBERTa"},{"location":"reference/supported-models/#question-answering","title":"Question Answering","text":"Model Architecture <code>deepset/bert-large-uncased-whole-word-masking-squad2</code> BERT <code>deepset/roberta-base-squad2</code> RoBERTa <code>deepset/tinyroberta-squad2</code> RoBERTa <code>distilbert/distilbert-base-cased-distilled-squad</code> DistilBERT <code>distilbert/distilbert-base-uncased-distilled-squad</code> DistilBERT <code>google-bert/bert-large-uncased-whole-word-masking-finetuned-squad</code> BERT"},{"location":"reference/supported-models/#zero-shot-classification","title":"Zero-Shot Classification","text":"Model Architecture <code>joeddav/xlm-roberta-large-xnli</code> XLM-RoBERTa"},{"location":"reference/supported-models/#zero-shot-image-classification","title":"Zero-Shot Image Classification","text":"Model Architecture <code>openai/clip-vit-base-patch16</code> CLIP"},{"location":"reference/supported-models/#image-segmentation","title":"Image Segmentation","text":"Model Architecture <code>mattmdjaga/segformer_b2_clothes</code> Segformer <code>nvidia/segformer-b1-finetuned-ade-512-512</code> Segformer <code>nvidia/segformer-b2-finetuned-ade-512-512</code> Segformer <code>nvidia/segformer-b5-finetuned-ade-640-640</code> Segformer"},{"location":"reference/supported-models/#image-to-text","title":"Image-to-Text","text":"Model Architecture <code>microsoft/trocr-base-handwritten</code> VisionEncoderDecoder <code>microsoft/trocr-base-printed</code> VisionEncoderDecoder <code>microsoft/trocr-large-handwritten</code> VisionEncoderDecoder"},{"location":"reference/supported-models/#execution-provider-compatibility","title":"Execution Provider Compatibility","text":"<p>Each validated model is tested against available EPs:</p> EP Alias Devices Notes NvTensorRTRTXExecutionProvider <code>nvtensorrtrtx</code>, <code>nv_tensorrt_rtx</code> GPU NVIDIA TensorRT-RTX; NVIDIA GPU with TensorRT runtime CUDAExecutionProvider <code>cuda</code> GPU NVIDIA CUDA; any CUDA-capable GPU MIGraphXExecutionProvider <code>migraphx</code> GPU AMD ROCm MIGraphX QNNExecutionProvider <code>qnn</code> NPU, GPU Qualcomm Snapdragon; bundled in ORT OpenVINOExecutionProvider <code>openvino</code> NPU, GPU, CPU Intel hardware DmlExecutionProvider <code>dml</code> GPU DirectML; any DirectX 12 GPU CPUExecutionProvider <code>cpu</code> CPU Always available VitisAIExecutionProvider <code>vitisai</code> NPU AMD/Xilinx"},{"location":"reference/supported-models/#adding-unsupported-models","title":"Adding Unsupported Models","text":"<p>If your model architecture isn't in the catalog, winml-cli may still support it through auto-detection:</p> <pre><code># Try inspecting first\nuv run winml inspect -m your-org/your-model\n\n# If \"Status: Supported\", proceed normally\nuv run winml build -m your-org/your-model -d auto -o output/\n</code></pre> <p>For truly custom architectures, use <code>--trust-remote-code</code> to allow execution of model code from the Hugging Face Hub.</p>"},{"location":"reference/supported-models/#see-also","title":"See also","text":"<ul> <li>winml catalog \u2014 browse validated models interactively</li> <li>winml inspect \u2014 check model compatibility</li> <li>EP and Device \u2014 execution provider details</li> </ul>"},{"location":"samples/bert-config-build/","title":"BERT \u2014 Config + Build + Perf","text":"<p>BERT (<code>bert-base-uncased</code>) is a canonical text model that exercises every stage of the winml-cli pipeline: it has multiple input tensors, benefits from graph fusion (GeLU, LayerNorm, MatMul+Add), and produces quantizable activations that run well on NPU. That combination makes it a useful reference point for teams deploying transformer encoders on Windows.</p> <p>This sample walks through the production-style workflow: generate a reusable <code>WinMLBuildConfig</code> JSON file with <code>winml config</code>, run the full export \u2192 optimize \u2192 quantize \u2192 compile pipeline in one shot with <code>winml build</code>, and measure the result with <code>winml perf</code>. If you want to understand each pipeline stage individually before running the all-in-one command, read the Hugging Face Model to NPU tutorial first.</p>"},{"location":"samples/bert-config-build/#prerequisites","title":"Prerequisites","text":"<ul> <li>winml-cli installed and <code>winml</code> on your PATH.</li> <li>A target device (NPU or GPU recommended; CPU also works).</li> </ul>"},{"location":"samples/bert-config-build/#step-1-generate-a-build-config","title":"Step 1: Generate a build config","text":"<pre><code>winml config -m bert-base-uncased -t text-classification -o bert_config.json\n</code></pre> <p>This writes a <code>WinMLBuildConfig</code> JSON file to <code>bert_config.json</code>. The file captures every pipeline setting in a single artifact that you can version-control and share. A representative excerpt looks like this:</p> <pre><code>{\n  \"loader\": {\n    \"task\": \"text-classification\",\n    \"model_class\": \"AutoModelForSequenceClassification\",\n    \"model_type\": \"bert\"\n  },\n  \"export\": {\n    \"opset_version\": 17,\n    \"batch_size\": 1\n    .. // truncated: input_tensors, output_tensors\n  },\n   \"optim\": {\n    \"clamp_constant_values\": true\n  },\n  \"quant\": {\n    \"mode\": \"qdq\",\n    \"weight_type\": \"uint8\",\n    \"activation_type\": \"uint16\",\n    \"samples\": 10,\n    \"calibration_method\": \"minmax\",\n    \"task\": \"text-classification\",\n    \"model_name\": \"bert-base-uncased\"\n    ... // truncated: per_channel, symmetric, distribution, ...\n  },\n  \"compile\": null\n}\n</code></pre> <p>Note</p> <p>The five top-level keys \u2014 <code>loader</code>, <code>export</code>, <code>optim</code>, <code>quant</code>, and <code>compile</code> \u2014 map directly to the five pipeline stages. Setting <code>quant</code> or <code>compile</code> to <code>null</code> skips that stage entirely. See Config and build for a field-by-field description of every option.</p>"},{"location":"samples/bert-config-build/#step-2-run-the-build","title":"Step 2: Run the build","text":"<pre><code>winml build -c bert_config.json -m bert-base-uncased --output-dir bert_out/\n</code></pre> <p>winml-cli reads the config, downloads the model weights once, and runs the pipeline in sequence. Terminal output shows each stage as it completes:</p> <pre><code>winml build\n  Config:     bert_config.json\n  Model:      bert-base-uncased\n  Output:     bert_out/\n\n  export       done  (42.1s)\n  optimize     done  (6.3s)\n  quantize     done  (18.7s)\n  compile      done  (21.4s)\n\n  Build complete in 88.5s\n  Final artifact: bert_out/model.onnx\n</code></pre> <p>Note</p> <p>After the optimize stage, winml-cli runs an analyzer loop that inspects the graph for nodes the target EP cannot dispatch natively and re-runs optimization with adjusted fusion flags. The loop repeats up to <code>--max-optim-iterations</code> times (default: 3). Pass <code>--no-optimize</code> to skip this stage entirely when starting from a pre-optimized ONNX file. See How winml-cli Works for a full description of the autoconf loop.</p>"},{"location":"samples/bert-config-build/#step-3-benchmark","title":"Step 3: Benchmark","text":"<pre><code>winml perf -m bert_out/model.onnx --iterations 50\n</code></pre> <p>After a short warm-up, <code>winml perf</code> reports latency percentiles and throughput:</p> <pre><code>Device:      npu\nTask:        text-classification\nIterations:  50 (+ 10 warmup)\nBatch Size:  1\n\nLatency (ms)\n  Avg    P50    P90    P95    P99    Min    Max    Std\n 4.83   4.79   5.12   5.31   5.68   4.51   6.04   0.21\n\nThroughput: 206.99 samples/sec\n\nResults saved to: model_perf.json\n</code></pre>"},{"location":"samples/bert-config-build/#customizing-the-config","title":"Customizing the config","text":"<p>The JSON file is plain text and can be edited before running <code>winml build</code>. Two common adjustments:</p> <p>Change precision. To target fp16 instead of the default uint8 QDQ quantization, regenerate the config with an explicit precision flag:</p> <pre><code>winml config -m bert-base-uncased -t text-classification --precision fp16 -o bert_config.json\n</code></pre> <p>Alternatively, edit <code>bert_config.json</code> directly: set <code>quant.weight_type</code> and <code>quant.activation_type</code> to <code>\"int8\"</code> or <code>\"uint16\"</code>, or set <code>quant</code> to <code>null</code> to skip quantization entirely.</p> <p>Disable a stage at build time. You can suppress a stage for a single run without touching the config file using the <code>--no-quant</code> flags:</p> <pre><code>winml build -c bert_config.json -m bert-base-uncased --output-dir bert_out/ --no-quant \n</code></pre> <p>This is useful for measuring the fp32 baseline before committing to a quantized build. The <code>quant</code> section in <code>bert_config.json</code> is unchanged; the flag only affects this invocation. See Config and build for the full list of configurable fields.</p>"},{"location":"samples/bert-config-build/#what-you-learned","title":"What you learned","text":"<ul> <li><code>winml config</code> generates a complete, version-controllable <code>WinMLBuildConfig</code> JSON from a HuggingFace model ID in one command.</li> <li><code>winml build</code> orchestrates the full export \u2192 optimize \u2192 quantize \u2192 compile pipeline from a single config file and model ID.</li> <li>The autoconf loop inside the optimize stage adjusts graph fusion flags automatically to maximize EP compatibility.</li> <li><code>winml perf</code> gives a latency and throughput baseline on the built artifact in seconds.</li> </ul>"},{"location":"samples/bert-config-build/#see-also","title":"See also","text":"<ul> <li>winml config</li> <li>winml build</li> <li>winml perf</li> <li>Config and build</li> </ul>"},{"location":"samples/clip-composite/","title":"CLIP \u2014 Composite Models","text":"<p>CLIP (<code>openai/clip-vit-base-patch32</code>) is a dual-encoder vision-language model: one tower encodes images, the other encodes text, and both project into a shared embedding space. winml-cli treats it as a composite model \u2014 a model that is split into multiple ONNX sub-models that run together at inference time. For CLIP, the two sub-models are:</p> Sub-model Role Input shape Output (projected) <code>image-encoder</code> Encodes images into embeddings <code>pixel_values</code> <code>[1, 3, 224, 224]</code> <code>image_embeds</code> <code>[1, 512]</code> <code>text-encoder</code> Encodes text labels into embeddings <code>input_ids</code> <code>[1, 77]</code> <code>text_embeds</code> <code>[1, 512]</code> <p>Zero-shot classification is achieved by embedding the image and the candidate text labels, then ranking the labels by the cosine similarity between their embeddings. Splitting the towers into two ONNX graphs lets each encoder have fully static shapes (required for efficient NPU compilation) and lets you build, cache, and benchmark them independently.</p>"},{"location":"samples/clip-composite/#prerequisites","title":"Prerequisites","text":"<ul> <li>winml-cli installed and <code>winml</code> on your PATH.</li> <li>A network connection to download CLIP weights from HuggingFace on first run.</li> </ul>"},{"location":"samples/clip-composite/#overall-workflow","title":"Overall workflow","text":"<p>The composite model architecture for CLIP:</p> <pre><code>graph LR\n    A[winml config] --&gt;|\"(clip, zero-shot-image-classification)\"| B[Composite Registry]\n    B --&gt; C[image-encoder config]\n    B --&gt; D[text-encoder config]\n    C --&gt; E[winml build \u2192 image-encoder.onnx]\n    D --&gt; F[winml build \u2192 text-encoder.onnx]\n    E --&gt; G[WinMLAutoModel]\n    F --&gt; G\n    G --&gt;|logits_per_image| H[Classification scores]</code></pre>"},{"location":"samples/clip-composite/#step-1-generate-build-configs","title":"Step 1: Generate build configs","text":"<pre><code>winml config -m openai/clip-vit-base-patch32 --task zero-shot-image-classification -o clip.json\n</code></pre> <p>Because <code>(clip, zero-shot-image-classification)</code> is registered as a composite model, this command produces two config files \u2014 one per sub-model:</p> <ul> <li><code>clip_image-encoder.json</code> \u2014 export config using <code>image-feature-extraction</code> task</li> <li><code>clip_text-encoder.json</code> \u2014 export config using <code>feature-extraction</code> task</li> </ul> <p>Each config includes CLIP-specific optimizations (GELU fusion, LayerNorm fusion, MatMul+Add fusion, and clamp constant values).</p>"},{"location":"samples/clip-composite/#step-2-build-each-sub-model","title":"Step 2: Build each sub-model","text":"<p>Build both sub-models individually using their config files:</p> <pre><code># Build the image encoder\nwinml build -c clip_image-encoder.json -m openai/clip-vit-base-patch32 -o output/image-encoder\n\n# Build the text encoder\nwinml build -c clip_text-encoder.json -m openai/clip-vit-base-patch32 -o output/text-encoder\n</code></pre> <p>Each <code>winml build</code> runs the full pipeline: export \u2192 optimize \u2192 quantize \u2192 compile. The output directories contain the final ONNX files ready for inference.</p> <p>To target a specific execution provider (e.g., QNN for NPU):</p> <pre><code>winml build -c clip_image-encoder.json -m openai/clip-vit-base-patch32 -o output/image-encoder --ep qnn\nwinml build -c clip_text-encoder.json -m openai/clip-vit-base-patch32 -o output/text-encoder --ep qnn\n</code></pre>"},{"location":"samples/clip-composite/#step-3-benchmark-each-sub-model","title":"Step 3: Benchmark each sub-model","text":"<pre><code>winml perf output/image-encoder -d npu\nwinml perf output/text-encoder -d npu\n</code></pre> <p>This lets you identify whether the image or text encoder is the bottleneck on your target hardware.</p>"},{"location":"samples/clip-composite/#step-4-run-inference-python-api","title":"Step 4: Run inference (Python API)","text":"<p>There are two ways to get a ready-to-run model. Both return the same <code>WinMLModelForZeroShotImageClassification</code> \u2014 a single object that orchestrates the two encoders and combines their projected embeddings into similarity scores \u2014 so the inference code afterward is identical.</p> <p>Option 1 \u2014 Load the ONNX files built in Step 2 (skips re-export/optimization). Pass a dict mapping each component name to its built <code>model.onnx</code>, plus the HF config so the composite registry can resolve <code>(clip, zero-shot-image-classification)</code>:</p> <pre><code>from transformers import AutoConfig\n\nfrom winml.modelkit.models import WinMLAutoModel\n\nmodel = WinMLAutoModel.from_onnx(\n    {\n        \"image-encoder\": \"output/image-encoder/model.onnx\",\n        \"text-encoder\": \"output/text-encoder/model.onnx\",\n    },\n    task=\"zero-shot-image-classification\",\n    hf_config=AutoConfig.from_pretrained(\"openai/clip-vit-base-patch32\"),\n    skip_build=True,\n)\n</code></pre> <p>Option 2 \u2014 Build both encoders from the HuggingFace model in one call. <code>WinMLAutoModel.from_pretrained</code> detects the composite task and runs the full pipeline for each sub-model:</p> <pre><code>from winml.modelkit.models import WinMLAutoModel\n\nmodel = WinMLAutoModel.from_pretrained(\n    \"openai/clip-vit-base-patch32\",\n    task=\"zero-shot-image-classification\",\n)\n</code></pre> <p>Either way, run inference the same way \u2014 prepare an image plus candidate labels with the HF processor, then call the model:</p> <pre><code>from PIL import Image\nfrom transformers import CLIPProcessor\n\nprocessor = CLIPProcessor.from_pretrained(\"openai/clip-vit-base-patch32\")\nimage = Image.open(\"cat.jpg\")\nlabels = [\"a photo of a cat\", \"a photo of a dog\", \"a photo of a car\"]\ninputs = processor(text=labels, images=image, return_tensors=\"pt\", padding=True)\n\n# Run both encoders and combine into per-label similarity scores\noutputs = model(**inputs)\nprobs = outputs.logits_per_image.softmax(dim=-1)\nfor label, p in zip(labels, probs[0].tolist()):\n    print(f\"{label}: {p:.4f}\")\n</code></pre> <p>The text encoder's fixed sequence length (77) is handled for you \u2014 the processor's tokens are padded or truncated to match the ONNX graph before each run.</p>"},{"location":"samples/clip-composite/#customizing-shape-config-per-sub-model","title":"Customizing shape config per sub-model","text":"<p>Each encoder takes its own <code>shape_config</code>, passed through <code>sub_model_kwargs</code>. The image encoder accepts vision keys (<code>height</code>, <code>width</code>); the text encoder accepts text keys (<code>sequence_length</code>):</p> <pre><code>model = WinMLAutoModel.from_pretrained(\n    \"openai/clip-vit-base-patch32\",\n    task=\"zero-shot-image-classification\",\n    sub_model_kwargs={\n        \"image-encoder\": {\"shape_config\": {\"height\": 224, \"width\": 224}},\n        \"text-encoder\":  {\"shape_config\": {\"sequence_length\": 77}},\n    },\n)\n</code></pre>"},{"location":"samples/clip-composite/#other-composite-models","title":"Other composite models","text":"<p>The same composite model pattern is used for:</p> <ul> <li>SigLIP (<code>google/siglip-base-patch16-224</code>) \u2014 dual-encoder zero-shot image classification; shares the same composite wrapper as CLIP</li> <li>T5 (<code>google-t5/t5-small</code>) \u2014 encoder + decoder for translation/summarization</li> <li>BART (<code>facebook/bart-large-cnn</code>) \u2014 encoder + decoder for summarization and table-question-answering (TAPEX)</li> <li>Marian (<code>Helsinki-NLP/opus-mt-en-de</code>) \u2014 encoder + decoder for translation</li> <li>Qwen3 (<code>Qwen/Qwen3-0.6B</code>) \u2014 prefill + generation decoders for text generation</li> <li>BLIP (<code>Salesforce/blip-image-captioning-base</code>) \u2014 vision encoder + text decoder for image-to-text captioning</li> <li>Vision-encoder-decoder (<code>microsoft/trocr-base-handwritten</code>) \u2014 vision encoder + text decoder for image-to-text (TrOCR, Donut)</li> </ul>"},{"location":"samples/clip-composite/#see-also","title":"See also","text":"<ul> <li>BERT \u2014 Config + Build + Perf \u2014 single-model workflow</li> <li>Hugging Face Model to NPU \u2014 step-by-step pipeline</li> <li>Supported Models \u2014 full list of validated architectures</li> <li>Config and build \u2014 concept overview</li> </ul>"},{"location":"tutorials/","title":"Tutorials","text":"<p>Tutorials are linear, prescriptive, end-to-end walkthroughs that guide you through building something concrete with <code>winml-cli</code>. Each tutorial moves in one direction\u2014start to finish\u2014so you can follow along without making decisions. If you need to understand the reasoning behind a feature, see the Concepts section (the why and when). If you need a quick reference for a specific command, see Commands (the what). Tutorials sit alongside Samples, which are reference-style demos that compare multiple approaches side by side rather than walking through a single path.</p>"},{"location":"tutorials/#available-tutorials","title":"Available tutorials","text":"Tutorial What you'll build Hardware Hugging Face Model to NPU A quantized ConvNeXt image classifier compiled for Snapdragon NPU (with CPU/DirectML fallback) Copilot+PC NPU primary; CPU works as fallback Bring Your Own ONNX Model Optimize and deploy an ONNX file you already have, using the analyze \u2192 optimize \u2192 re-analyze feedback loop Any (CPU, NPU, GPU) <p>More tutorials are coming, covering additional model families, execution providers, and deployment scenarios. Check back as the <code>winml-cli</code> documentation expands.</p>"},{"location":"tutorials/build-from-onnx/","title":"Bring Your Own ONNX Model","text":"<p>This tutorial walks you through the complete workflow for optimizing, analyzing, and deploying an ONNX model you already have \u2014 whether you exported it yourself (<code>torch.onnx.export</code>, ONNX Runtime tools), received it from a teammate, or downloaded it from the ONNX Model Zoo.</p> <p>Unlike the Hugging Face Model to NPU tutorial which starts from a HuggingFace model ID, this tutorial assumes you already have a <code>.onnx</code> file on disk and want to make it run faster on your target hardware.</p> <p>The tutorial is split into two sections. Section A walks through the analyze \u2192 optimize \u2192 re-analyze loop using primitive commands, teaching you how the optimization feedback cycle works. Section B shows how <code>winml build</code> automates that same loop in a single command, optionally targeting NPU with quantization.</p>"},{"location":"tutorials/build-from-onnx/#prerequisites","title":"Prerequisites","text":"<ul> <li>Windows 11 24H2 \u2014 required for NPU stack support</li> <li>Python 3.11 and uv installed (<code>pip install uv</code> or follow astral.sh/uv)</li> <li>winml-cli installed \u2014 see Installation</li> <li>An ONNX model file \u2014 this tutorial uses <code>my_model.onnx</code> as a placeholder; substitute your own file</li> </ul> <p>No NPU? Set <code>--device cpu</code> wherever you see <code>--device npu</code>. Every other flag stays the same.</p>"},{"location":"tutorials/build-from-onnx/#section-a-primitive-commands","title":"Section A \u2014 Primitive commands","text":"<p>Working through the primitive commands one at a time reveals how the analyze\u2013optimize feedback cycle works. Each command accepts the output of the previous step as input, and every intermediate artifact is available for inspection.</p>"},{"location":"tutorials/build-from-onnx/#step-1-analyze-the-original-model","title":"Step 1: Analyze the original model","text":"<p>Before any optimization, run the static analyzer to understand your model's EP compatibility and get optimization recommendations:</p> <pre><code>uv run winml analyze --model my_model.onnx --optim-config optim_config.json\n</code></pre> <p>The analyzer classifies every operator in the graph as supported, partial, unsupported, or unknown for each available EP. It also detects fusible subgraph patterns and writes the recommended optimization flags to <code>optim_config.json</code>.</p> <p>To target a specific EP:</p> <pre><code>uv run winml analyze --model my_model.onnx --ep qnn --device npu --optim-config optim_config.json\n</code></pre> <p>The output shows per-EP compatibility results:</p> <pre><code>\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\n ANALYSIS SUMMARY\n\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\n   QNNExecutionProvider (NPU): 122/0/0/0\n      Ready to deploy\n</code></pre> <p>If the analyzer detects fusible patterns (GeLU, LayerNorm, etc.), they will appear in the output and the <code>optim_config.json</code> will contain the recommended fusion settings. If no patterns are detected (as with simple architectures like ResNet), the config will be empty <code>{}</code>.</p> <p>What we just did</p> <p>The analyzer performs static analysis \u2014 no runtime or hardware required. It tells you two things: (1) can the model run on your target EP at all, and (2) are there graph patterns that the optimizer can fuse to improve performance. The <code>--optim-config</code> flag outputs a JSON file with the exact optimization settings the optimizer needs. S/P/U/Unk = Supported/Partial/Unsupported/Unknown.</p>"},{"location":"tutorials/build-from-onnx/#step-2-optimize-the-graph","title":"Step 2: Optimize the graph","text":"<p>Pass the analyzer's output config directly to the optimizer:</p> <pre><code>uv run winml optimize -m my_model.onnx -c optim_config.json -o my_model_optimized.onnx\n</code></pre> <p>The optimizer applies the fusions specified in the config and reports how many nodes it reduced:</p> <pre><code>Input: my_model.onnx\nOutput: my_model_optimized.onnx\n\nSuccess! Model optimized: my_model_optimized.onnx\nNodes: 122 -&gt; 122 (0.0% reduction)\n</code></pre> <p>Tip</p> <p>The node reduction depends on your model's architecture. Simple models like ResNet (only Conv, Relu, Add) have no fusible patterns. Transformer-based models (BERT, ViT) typically see 10\u201330% node reduction from GeLU, LayerNorm, and Attention fusions.</p> <p>What we just did</p> <p>Graph optimization fuses multi-node patterns (like the 5-node GeLU/Erf sequence) into single high-level operators that EPs can execute more efficiently. The optimizer is purely a graph transformation \u2014 it doesn't change the model's numerical behavior or require calibration data. Running it before quantization is important: calibration should be performed on the already-fused topology, not the verbose original graph.</p>"},{"location":"tutorials/build-from-onnx/#step-3-re-analyze-the-optimized-model","title":"Step 3: Re-analyze the optimized model","text":"<p>Run the analyzer again on the optimized output to confirm that the fusions resolved and no new issues appeared:</p> <pre><code>uv run winml analyze --model my_model_optimized.onnx --ep qnn --device npu\n</code></pre> <p>If the original analysis found fusible patterns that were optimized away, this run should show zero detected patterns and the same or better EP compatibility score.</p> <p>What we just did</p> <p>The analyze \u2192 optimize \u2192 re-analyze cycle is the fundamental feedback loop in winml-cli. In Section B you'll see that <code>winml build</code> automates this loop \u2014 it calls the analyzer, applies recommendations, re-analyzes, and repeats until convergence (typically 1\u20133 iterations). Doing it manually here teaches you what the automation is actually doing under the hood.</p>"},{"location":"tutorials/build-from-onnx/#step-4-optional-quantize","title":"Step 4 (optional): Quantize","text":"<p>Insert QDQ (Quantize-Dequantize) nodes into the optimized graph using static calibration:</p> <pre><code>uv run winml quantize -m my_model_optimized.onnx -o my_model_int8.onnx --precision int8 --samples 32\n</code></pre> <p>The quantizer generates 32 random calibration samples, runs them through the model to collect activation statistics, and uses those statistics to set the quantization scale and zero-point for each tensor.</p> <p>What we just did</p> <p><code>--precision int8</code> sets both weights and activations to 8-bit integers, which is the precision most NPU compilers expect. The output model still contains standard <code>QuantizeLinear</code> and <code>DequantizeLinear</code> ONNX nodes, so it is portable and can run on any ONNX Runtime backend. See Concepts \u2192 Quantization and QDQ for calibration methods and per-channel options.</p>"},{"location":"tutorials/build-from-onnx/#step-5-optional-compile-for-the-target-ep","title":"Step 5 (optional): Compile for the target EP","text":"<p>Compilation converts the portable quantized ONNX into an EP-specific binary format that the execution provider can load directly, skipping JIT compilation at inference time:</p> Qualcomm NPUIntel NPUAMD NPUCPU <pre><code>uv run winml compile -m my_model_int8.onnx --device npu --ep qnn\n</code></pre> <pre><code>uv run winml compile -m my_model_int8.onnx --device npu --ep openvino\n</code></pre> <pre><code>uv run winml compile -m my_model_int8.onnx --device npu --ep vitisai\n</code></pre> <pre><code>uv run winml compile -m my_model_int8.onnx --device cpu\n</code></pre> <p>What we just did</p> <p>Compilation embeds EP context \u2014 the compiled binary \u2014 inside or alongside the ONNX file using the <code>EPContext</code> node convention. At inference time the runtime loads the pre-compiled binary directly rather than re-compiling from the ONNX graph. See Concepts \u2192 Compile and EPContext for details.</p>"},{"location":"tutorials/build-from-onnx/#step-6-benchmark","title":"Step 6: Benchmark","text":"<p>Measure the performance of your model:</p> Optimized (CPU)Compiled (NPU) <pre><code>uv run winml perf -m my_model_optimized.onnx --device cpu --warmup 5 --iterations 50\n</code></pre> <pre><code>uv run winml perf -m my_model_int8_npu_ctx.onnx --device npu --iterations 50 --monitor\n</code></pre> <p>What we just did</p> <p><code>winml perf</code> generates random inputs matching the model's I/O spec, runs warmup iterations (excluded from statistics), then the benchmark iterations, and reports full latency percentiles alongside throughput. The <code>--monitor</code> flag activates live hardware utilization polling. See Concepts \u2192 Perf and monitoring for details.</p>"},{"location":"tutorials/build-from-onnx/#section-b-one-shot-with-winml-build","title":"Section B \u2014 One-shot with <code>winml build</code>","text":"<p>Once you understand the analyze \u2192 optimize \u2192 re-analyze loop (which you now do), you can let <code>winml build</code> handle everything in one command. When you pass a <code>.onnx</code> file, winml-cli auto-detects it and skips the export stage \u2014 running the optimization loop, quantization, and compilation automatically.</p> <pre><code>uv run winml build -m my_model.onnx -o output/ --device npu --precision int8\n</code></pre> <p>Config file is optional</p> <p>The <code>-c config.json</code> flag is optional. Without it, <code>winml build</code> auto-generates an internal config from the flags you pass (like <code>--device</code> and <code>--precision</code>). If you need a reusable config, generate one with <code>winml config</code>:</p> <pre><code>uv run winml config --onnx my_model.onnx -d npu --precision int8 -o config.json\nuv run winml build -m my_model.onnx -c config.json -o output/\n</code></pre> <p>The pipeline runs: analyze \u2192 optimize \u2192 (re-analyze \u2192 re-optimize if needed) \u2192 quantize \u2192 compile \u2192 model.onnx. The output directory looks like:</p> <pre><code>output/\n\u251c\u2500\u2500 model.onnx                     \u2190 FINAL: deploy this\n\u251c\u2500\u2500 my_model.onnx                  \u2190 Copy of your input\n\u251c\u2500\u2500 my_model_optimized.onnx        \u2190 After optimization loop converged\n\u251c\u2500\u2500 my_model_quantized.onnx        \u2190 After INT8 quantization\n\u251c\u2500\u2500 my_model_compiled.onnx         \u2190 After EP compilation\n\u251c\u2500\u2500 winml_build_config.json        \u2190 Config used (including auto-detected options)\n\u2514\u2500\u2500 analyze_result.json            \u2190 Analysis from optimize stage\n</code></pre> <p>You can selectively skip stages using the override flags:</p> <ul> <li><code>--no-optimize</code> \u2014 skip graph optimization (rarely needed; useful if you have a pre-optimized ONNX)</li> <li><code>--no-quant</code> \u2014 skip quantization (produces a floating-point compiled model)</li> <li><code>--no-compile</code> \u2014 skip compilation (produces a quantized but not device-locked ONNX)</li> </ul> <p>For example, to produce an optimized model without quantization or compilation:</p> <pre><code>uv run winml build -m my_model.onnx -o output/ --device cpu\n</code></pre> <p>What we just did</p> <p><code>winml build</code> is the production workflow. It guarantees that stages run in the correct order, passes intermediate artifacts through the pipeline automatically, and records which stages completed or were skipped in the result summary.</p> <p>Once the build completes, benchmark the final artifact:</p> <pre><code>uv run winml perf -m output/model.onnx --device npu --iterations 50 --monitor\n</code></pre>"},{"location":"tutorials/build-from-onnx/#using-the-python-api","title":"Using the Python API","text":"<pre><code>from winml.modelkit import WinMLAutoModel\n\n# Load from a pre-built ONNX (skips the build pipeline)\nmodel = WinMLAutoModel.from_onnx(\n    \"output/model.onnx\",\n    task=\"image-classification\",  # set your task\n    skip_build=True,\n)\n\noutput = model(pixel_values=your_input_tensor)\n</code></pre> <p>Or trigger the full build programmatically:</p> <pre><code>from winml.modelkit.build import build_onnx_model\nfrom winml.modelkit.config import generate_build_config\n\nconfig = generate_build_config(onnx_path=\"my_model.onnx\", device=\"npu\", precision=\"int8\")\nresult = build_onnx_model(\"my_model.onnx\", config=config, output_dir=\"output/\")\nprint(f\"Final model: {result.final_onnx_path}\")\n</code></pre>"},{"location":"tutorials/build-from-onnx/#troubleshooting","title":"Troubleshooting","text":"Problem Solution \"ONNX file not found\" Use an absolute path or ensure the file is in the current directory Analyzer reports unsupported ops Check if an optimization fusion resolves them; if not, the model needs modification for that EP Optimization loop doesn't converge The default max is 3 iterations; if patterns persist, they may not be fusible \u2014 use <code>--no-quant --no-compile</code> and inspect Quantization accuracy regression Try <code>--precision int16</code>, <code>--per-channel</code>, or increase <code>--samples</code> for better calibration EP compilation fails Check the selected EP, model compatibility, and target device availability Model too large for memory Use <code>--no-compile</code> and compile on the target device"},{"location":"tutorials/build-from-onnx/#where-to-go-next","title":"Where to go next","text":"<ul> <li>Hugging Face Model to NPU \u2014 the same pipeline starting from HuggingFace (includes export stage)</li> <li>Output Layout \u2014 what each output file contains and the <code>analyze_result.json</code> schema</li> <li>Concepts \u2192 Analyze and optimize \u2014 how the convergence loop works internally</li> <li>Build Config Schema \u2014 customize quantization, compilation, and optimization settings</li> </ul>"},{"location":"tutorials/npu-convnext/","title":"Hugging Face Model to NPU","text":"<p>Pick the right ConvNeXt page</p> <p>Two pages use ConvNeXt as their vehicle:</p> <ul> <li>This tutorial \u2014 the canonical deep-dive: full pipeline with both QNN and OpenVINO NPU backends, plus the <code>winml build</code> one-shot. Start here if you want to ship to NPU.</li> <li>Quickstart \u2014 the short Getting Started introduction. Start here for a 15-minute taste.</li> </ul> <p>This tutorial walks you through the complete journey from a pretrained Hugging Face model \u2014 <code>facebook/convnext-tiny-224</code> \u2014 to a quantized, compiled artifact running on an NPU. By the end you will have benchmarked the model on your device and measured real inference latency. Nothing is skipped, and every command produces a file you can inspect or reuse.</p> <p>The primary hardware target is a Copilot+PC with a Snapdragon X-class NPU (40+ TOPS). If you do not have an NPU, every step works on CPU or DirectML as a fallback \u2014 the only thing that changes is the <code>--device</code> and <code>--ep</code> flags on the compile and perf commands. Those variations are shown explicitly in the tabbed blocks below.</p> <p>The tutorial is split into two sections. Section A runs through eight primitive commands \u2014 one per pipeline stage \u2014 so you understand what each stage does, what artifact it produces, and why it matters. Section B shows you that <code>winml build</code> runs the same pipeline in a single command once you have a config file. Most production workflows live in Section B; Section A is how you learn to trust it.</p>"},{"location":"tutorials/npu-convnext/#prerequisites","title":"Prerequisites","text":"<ul> <li>Windows 11 24H2 \u2014 required for NPU stack support</li> <li>Copilot+PC with NPU \u2014 40+ TOPS recommended; CPU and DirectML work as fallback throughout</li> <li>Python 3.11 and uv installed (<code>pip install uv</code> or follow astral.sh/uv)</li> <li>winml-cli installed \u2014 see Installation</li> </ul> <p>No NPU? Set <code>--device cpu</code> wherever you see <code>--device npu</code> and drop <code>--monitor</code> from perf commands. Every other flag stays the same.</p>"},{"location":"tutorials/npu-convnext/#section-a-primitive-commands","title":"Section A \u2014 Primitive commands","text":"<p>Working through the primitive commands one at a time is the best way to understand what the <code>winml build</code> wrapper does under the hood. Each step accepts the output of the previous step as its input, so the chain is explicit and every intermediate artifact is available for inspection.</p>"},{"location":"tutorials/npu-convnext/#step-1-inspect-the-model","title":"Step 1: Inspect the model","text":"<p>Before downloading any weights, confirm that winml-cli knows how to handle <code>facebook/convnext-tiny-224</code>.</p> <pre><code>uv run winml inspect -m facebook/convnext-tiny-224\n</code></pre> <p>You should see output similar to the following:</p> <pre><code>Model               facebook/convnext-tiny-224\nTask                image-classification\nModel class         ConvNextForImageClassification\nExporter            optimum/onnx\nInput               pixel_values: float32 [1, 3, 224, 224]\nOutput              logits: float32 [1, 1000]\nSupport status      supported\n</code></pre> <p>What we just did</p> <p><code>winml inspect</code> queries the Hugging Face model card and winml-cli's internal registry without downloading weights. It confirms three things: the auto-detected task (<code>image-classification</code>), the model class that will be used for loading, and the exporter that will handle the ONNX conversion. If this command fails, stop here \u2014 something about the model is unsupported and proceeding would waste time. A successful inspect is the green light for every stage that follows.</p>"},{"location":"tutorials/npu-convnext/#step-2-generate-a-build-config","title":"Step 2: Generate a build config","text":"<p>Generate a <code>WinMLBuildConfig</code> JSON file for the model. For the primitive workflow this file is optional \u2014 you can drive each stage entirely through CLI flags \u2014 but generating it now gives you a versioned record of every auto-detected setting, and it is required for Section B.</p> <pre><code>uv run winml config -m facebook/convnext-tiny-224 --device npu --precision int8 -o convnext_config.json\n</code></pre> <p>Open <code>convnext_config.json</code> to see what was auto-detected: the task, I/O tensor shapes, quantization parameters, and the compile target. The <code>--device npu --precision int8</code> flags tell the config generator to pre-populate the quantization and compile sections for NPU deployment rather than leaving them at defaults.</p> <p>What we just did</p> <p><code>winml config</code> auto-resolves every setting that would otherwise require you to look up flags manually. The resulting JSON is the single source of truth for a reproducible build. You can commit it to version control, share it with teammates, edit a single field to try a different precision, and replay the exact same build on any machine. See Concepts \u2192 Config and build for a deeper look at the config schema and how the stages interact.</p>"},{"location":"tutorials/npu-convnext/#step-3-export-to-onnx","title":"Step 3: Export to ONNX","text":"<p>Download the pretrained weights and convert the PyTorch model to ONNX format.</p> <pre><code>uv run winml export -m facebook/convnext-tiny-224 -o convnext.onnx\n</code></pre> <p>This runs an eight-stage export pipeline: model preparation, input generation, hierarchy building, ONNX conversion, node tagging, tag injection, and metadata generation. The result is a standards-compliant ONNX file with winml-cli's Hierarchy-preserving Tags Protocol (HTP) metadata embedded in node <code>metadata_props</code>. That metadata is what lets downstream tools make architecture-aware optimization decisions without hardcoded model knowledge.</p> <p>What we just did</p> <p>The default export embeds hierarchy tags \u2014 a tree of source module names mapped onto ONNX nodes \u2014 so that the optimizer and analyzer can reason about the graph in terms of the original model structure rather than flat node lists. If you need a clean ONNX without that metadata (for compatibility with other tools), add <code>--no-hierarchy</code>. See Concepts \u2192 Load and export for what hierarchy preservation adds and when it matters.</p>"},{"location":"tutorials/npu-convnext/#step-4-analyze-for-ep-compatibility","title":"Step 4: Analyze for EP compatibility","text":"<p>Before spending time on optimization and quantization, check that the model's operators are supported by your target execution provider.</p> <pre><code>uv run winml analyze -m convnext.onnx --ep qnn --device npu\n</code></pre> <p>The analyzer performs static analysis \u2014 no runtime required \u2014 and classifies every operator in the graph as supported, partial, or unsupported for the target EP. It reports a coverage summary, flags any operators that may fall back to CPU, and exits with code 0 for full support or 1 for partial support.</p> <p>For CPU fallback, run:</p> <pre><code>uv run winml analyze -m convnext.onnx --ep cpu --device cpu\n</code></pre> <p>What we just did</p> <p>Knowing your operator coverage before you quantize or compile saves you from discovering EP incompatibilities at the very last step of a long pipeline. ConvNeXt's operators (Conv, GELU, LayerNorm, Add) have broad support across QNN and OpenVINO, so this command should exit 0. If it exits 1, the output tells you which operators are problematic and includes recommendations for resolving them \u2014 typically by enabling a graph rewrite in the optimizer that fuses the unsupported pattern into a supported one. See Concepts \u2192 Analyze and optimize for details on the analyzer's recommendation engine.</p>"},{"location":"tutorials/npu-convnext/#step-5-optimize-the-graph","title":"Step 5: Optimize the graph","text":"<p>Apply graph-level optimizations: operator fusion, constant folding, shape inference, and EP-specific graph rewrites.</p> <pre><code>uv run winml optimize -m convnext.onnx -o convnext_optim.onnx\n</code></pre> <p>The optimizer reports how many nodes it reduced. A typical ConvNeXt-tiny optimization fuses several element-wise sequences and removes redundant reshape operations, cutting the node count noticeably without changing model semantics. If you want to apply a specific preset suited to the Snapdragon NPU, add <code>--preset qnn-compatible</code> to disable fusions that QNN does not benefit from.</p> <p>What we just did</p> <p>Graph optimization is a separate stage from quantization so that you can inspect the intermediate graph, compare node counts, and selectively enable or disable individual fusion passes using the <code>--enable-*</code> / <code>--disable-*</code> flags. Run <code>uv run winml optimize --list-capabilities</code> to see every registered optimization flag and its default state. Optimization always happens on the floating-point graph; quantization is applied after so that calibration statistics are computed on the already-fused topology.</p>"},{"location":"tutorials/npu-convnext/#step-6-quantize","title":"Step 6: Quantize","text":"<p>Insert QDQ (Quantize-Dequantize) nodes into the optimized graph using static calibration. This reduces model size and speeds up inference on hardware with integer execution units, which includes Snapdragon NPUs and Intel NPUs.</p> <pre><code>uv run winml quantize -m convnext_optim.onnx -o convnext_int8.onnx --precision int8 --samples 32\n</code></pre> <p>The quantizer generates 32 random calibration samples, runs them through the model to collect activation statistics, and uses those statistics (with the default <code>minmax</code> method) to set the quantization scale and zero-point for each tensor. Thirty-two samples is sufficient for a vision model with fixed-size inputs like ConvNeXt. For models with variable-length inputs or complex activation distributions, increase <code>--samples</code> to 64 or 128.</p> <p>What we just did</p> <p><code>--precision int8</code> sets both weights and activations to 8-bit integers, which is the precision most NPU compilers expect. The output model still contains standard <code>QuantizeLinear</code> and <code>DequantizeLinear</code> ONNX nodes, so it is portable and can run on any ONNX Runtime backend \u2014 you do not need special tooling to inspect it. See Concepts \u2192 Quantization and QDQ for a detailed explanation of the QDQ node pattern, calibration methods, and how to choose between per-tensor and per-channel quantization.</p>"},{"location":"tutorials/npu-convnext/#step-7-compile-for-the-target-ep","title":"Step 7: Compile for the target EP","text":"<p>Compilation converts the portable quantized ONNX into an EP-specific binary format that the execution provider can load directly, skipping JIT compilation at inference time. This is the step that produces a device-locked artifact tied to the selected EP.</p> <p>The examples below use the default compiler backend (<code>--compiler ort</code>), which uses ONNX Runtime's built-in EP context compiler:</p> Qualcomm NPUIntel NPUAMD NPUCPU <pre><code>uv run winml compile -m convnext_int8.onnx --device npu --ep qnn\n</code></pre> <pre><code>uv run winml compile -m convnext_int8.onnx --device npu --ep openvino\n</code></pre> <pre><code>uv run winml compile -m convnext_int8.onnx --device npu --ep vitisai\n</code></pre> <pre><code>uv run winml compile -m convnext_int8.onnx --device cpu\n</code></pre> <p>The compiled output file appears in the same directory as the input model. The file name follows the pattern <code>convnext_int8_npu_ctx.onnx</code> (using the resolved device string <code>npu</code>, not the EP name) and an accompanying <code>.bin</code> context binary is written alongside it (unless <code>--embed</code> is passed, which embeds the binary inside the ONNX file). CPU builds do not produce a new artifact \u2014 the compile step validates EP compatibility but writes no output file; use <code>convnext_int8.onnx</code> directly for CPU inference.</p> <p>What we just did</p> <p>Compilation embeds EP context \u2014 the compiled binary \u2014 inside or alongside the ONNX file using the <code>EPContext</code> node convention. At inference time the runtime loads the pre-compiled binary directly rather than re-compiling from the ONNX graph, eliminating the 15\u201360 second JIT penalty on first load. The default <code>--compiler ort</code> backend bundles compilation within ONNX Runtime itself. See Concepts \u2192 Compile and EPContext for the full picture of what gets embedded and how the context is consumed at runtime.</p>"},{"location":"tutorials/npu-convnext/#step-8-benchmark","title":"Step 8: Benchmark","text":"<p>Measure inference latency and throughput with the <code>--monitor</code> flag to see live NPU utilization alongside the timing numbers.</p> QNN NPUOpenVINO NPUCPU <pre><code>uv run winml perf -m convnext_int8_npu_ctx.onnx --device npu --iterations 50 --monitor\n</code></pre> <pre><code>uv run winml perf -m convnext_int8_npu_ctx.onnx --device npu --ep openvino --iterations 50 --monitor\n</code></pre> <pre><code>uv run winml perf -m convnext_int8.onnx --device cpu --iterations 50\n</code></pre> <p>A representative run on a Snapdragon X Elite NPU produces output like the following:</p> <pre><code>Device:       npu\nTask:         image-classification\nIterations:   50 (+ 10 warmup)\nBatch Size:   1\n\nLatency (ms)\n  Avg    P50    P90    P95    P99    Min    Max    Std\n  2.14   2.11   2.31   2.38   2.59   1.98   2.71   0.14\n\nThroughput:  467.29 samples/sec\n\nHardware (during benchmark)\n  NPU: 72.4% avg, 89.1% peak  |  CPU: 3.2% avg\n  Sys Mem: 1842 MB  |  Device Mem: 48/12 MB (local/shared)\n</code></pre> <p>The CPU fallback (same model, <code>--device cpu</code>) will typically show latencies 8\u201315x higher and near-zero NPU utilization. The contrast between those two runs is the best proof that your NPU path is actually being used.</p> <p>What we just did</p> <p><code>winml perf</code> generates random inputs matching the model's I/O spec, runs the configured number of warmup iterations (excluded from statistics), then the benchmark iterations, and reports full latency percentiles alongside throughput. The <code>--monitor</code> flag activates live hardware utilization polling at 200 ms intervals, displaying an in-terminal chart and attaching the hardware metrics to the JSON report saved alongside the console output. See Concepts \u2192 Perf and monitoring for how to interpret the utilization numbers and what <code>hw_monitor</code> fields look like in the JSON report.</p>"},{"location":"tutorials/npu-convnext/#step-9-optional-evaluate-accuracy","title":"Step 9 (optional): Evaluate accuracy","text":"<p>After quantization it is good practice to verify that INT8 accuracy is close to the FP32 baseline. The <code>winml eval</code> command runs the model against a held-out dataset slice and reports task-relevant metrics.</p> <pre><code>uv run winml eval -m convnext_int8.onnx --model-id facebook/convnext-tiny-224 --dataset imagenet-1k --split validation --samples 100 --device npu\n</code></pre> <p>The <code>--model-id</code> flag is required when passing an ONNX file, because the evaluator needs it to locate the preprocessor and label mappings. The command downloads 100 shuffled validation samples, runs inference, and reports top-1 and top-5 accuracy. A well-quantized ConvNeXt-tiny should lose less than 0.5 percentage points of top-1 accuracy compared to the floating-point checkpoint.</p> <p>What we just did</p> <p>Accuracy evaluation gives you a principled stopping criterion for quantization decisions. If the accuracy drop is larger than acceptable, return to Step 6 and try <code>--precision int16</code> or per-channel quantization (<code>--per-channel</code>) instead of the default per-tensor int8. See Concepts \u2192 Eval and datasets for the full list of supported datasets, tasks, and column mapping options.</p>"},{"location":"tutorials/npu-convnext/#section-b-one-shot-with-winml-build","title":"Section B \u2014 One-shot with <code>winml build</code>","text":"<p>Once you understand what each primitive stage does (which you now do), you can collapse the entire pipeline into a single command. <code>winml build</code> orchestrates export, optimize, quantize, and compile in sequence.</p> <pre><code>uv run winml build -m facebook/convnext-tiny-224 -o convnext_out/ --device npu --precision int8\n</code></pre> <p>Config file is optional</p> <p>The <code>-c config.json</code> flag is optional. Without it, <code>winml build</code> auto-generates an internal config from the flags you pass (like <code>--device</code> and <code>--precision</code>). If you need a reusable config, generate one with <code>winml config</code>.</p> <p>The command downloads the pretrained weights, runs all four pipeline stages, and writes every intermediate and final artifact into <code>convnext_out/</code>. The stage timing is printed as each stage completes, and the final line tells you the path of the compiled model.</p> <p>You can selectively skip stages using the override flags:</p> <ul> <li><code>--no-optimize</code> \u2014 skip graph optimization (rarely needed; useful if you have a pre-optimized ONNX)</li> <li><code>--no-quant</code> \u2014 skip quantization (produces a floating-point compiled model)</li> <li><code>--no-compile</code> \u2014 skip compilation (produces a quantized but not device-locked ONNX)</li> </ul> <p>For example, to produce an optimized and quantized model without the compile step:</p> <pre><code>uv run winml build -m facebook/convnext-tiny-224 -o convnext_out/ --device npu --precision int8 --no-compile\n</code></pre> <p>What we just did</p> <p><code>winml build</code> is the production workflow. It guarantees that stages run in the correct order, passes intermediate artifacts through the pipeline automatically, and records which stages completed or were skipped in the result summary.</p> <p>Once the build completes, benchmark the final artifact from <code>convnext_out/</code>:</p> <pre><code>uv run winml perf -m convnext_out/model.onnx --device npu --iterations 50 --monitor\n</code></pre> <p>The result should match what you saw in Step 8, confirming that the <code>winml build</code> pipeline produces bit-identical output to the manual primitive chain.</p>"},{"location":"tutorials/npu-convnext/#where-to-go-next","title":"Where to go next","text":"<ul> <li>Concepts \u2192 How winml-cli works \u2014 the full mental model for the pipeline</li> <li>Concepts \u2192 Compile and EPContext \u2014 understanding the compiled artifact format</li> <li>Commands \u2192 Overview \u2014 quick reference for every flag on every command</li> </ul>"},{"location":"tutorials/npu-convnext/#see-also","title":"See also","text":"<ul> <li>Concepts \u2192 Quantization and QDQ</li> <li>Concepts \u2192 Analyze and optimize</li> <li>Concepts \u2192 Perf and monitoring</li> <li>Concepts \u2192 Eval and datasets</li> </ul>"}]}
\ No newline at end of file
+{"config":{"lang":["en"],"separator":"[\\s\\-]+","pipeline":["stopWordFilter"],"fields":{"title":{"boost":1000.0},"text":{"boost":1.0},"tags":{"boost":1000000.0}}},"docs":[{"location":"","title":"winml-cli","text":"<p>Windows ML CLI is a command line tool for building portable, performant, and high-quality AI models for Windows ML. It takes you from a source model \u2014 whether from Hugging Face or your own pipeline \u2014 to a hardware-optimized artifact in a reproducible workflow.</p> <p>Purpose-built for Windows hardware diversity, the CLI handles conversion, graph optimization, and compilation across AMD, Intel, NVIDIA, and Qualcomm targets. The CLI fits naturally into CI/CD pipelines so teams can validate and ship models easily.</p>"},{"location":"#what-you-can-do","title":"What you can do","text":"<ul> <li>Build once, run across hardwares. Compose your own workflow from primitive commands (<code>export</code>, <code>analyze</code>, <code>optimize</code>, <code>quantize</code>, <code>compile</code>), or use an auto-generated config with <code>winml build</code> \u2014 both produce portable models that run across hardware.</li> <li>Drill into the details. Deep insights into operator compatibility, shape mismatches, graph optimizations, and EP-aware tuning at any stage of the pipeline.</li> <li>AI-ready. CLI-driven tools with built-in skills, friendly to work with mainstream agents.</li> </ul>"},{"location":"#what-you-get-out-of-the-box","title":"What you get out of the box","text":"<ul> <li>All Windows ML EPs supported. Every supported execution provider is available behind the same commands.</li> <li>Curated model catalog. A verified set of models that run across all Windows ML EPs \u2014 a reliable starting point.</li> <li>Bring your own ONNX. Not only for converting from PyTorch \u2014 bring an existing ONNX model to get operator-compatibility insights and optimize it based on the analysis.</li> </ul>"},{"location":"#where-to-start","title":"Where to start","text":"<ul> <li>Installation \u2014 get the <code>winml</code> CLI running locally.</li> <li>Quickstart \u2014 export a Hugging Face model in five minutes.</li> </ul>"},{"location":"#learn-the-model","title":"Learn the model","text":"<ul> <li>How winml-cli Works \u2014 the pipeline from a PyTorch model to an EP-compiled artifact.</li> <li>Commands \u2014 reference for all 12 <code>winml</code> subcommands.</li> <li>Samples \u2014 walkthroughs for BERT and CLIP.</li> </ul>"},{"location":"#repository-access","title":"Repository access","text":"<p>To request access to the Windows ML CLI repository, visit aka.ms/winml-cli.</p>"},{"location":"#license","title":"License","text":"<p>MIT. See LICENSE.</p>"},{"location":"Privacy/","title":"WinML CLI Privacy Statement","text":"<p>WinML CLI collects limited, unlinked pseudonymized telemetry to help improve the product. This page describes exactly what is collected, what is not, and how to control it.</p>"},{"location":"Privacy/#data-category","title":"Data category","text":"<p>All WinML CLI telemetry is classified as Optional under Microsoft's data categorization model. None of it is required to run any feature; it exists solely to support product improvement.</p> <p>A first-run interactive prompt asks for consent before any event is sent. The prompt defaults to accept \u2014 pressing Enter enables telemetry. You can decline explicitly at the prompt, or change your answer later by editing <code>%USERPROFILE%\\.winml\\config.json</code>. Telemetry is automatically disabled in non-interactive contexts (non-TTY stdin, CI/CD pipelines) regardless of stored consent; those contexts do not see the prompt and default to off.</p>"},{"location":"Privacy/#events-collected","title":"Events collected","text":"<p>When telemetry is enabled, WinML CLI emits three event types:</p>"},{"location":"Privacy/#winmlcliheartbeat","title":"WinMLCLIHeartbeat","text":"<p>Sent once per CLI invocation, just before the requested command runs. Carries only context attributes (OS, architecture, app version, device ID) \u2014 no per-event payload.</p>"},{"location":"Privacy/#winmlcliaction","title":"WinMLCLIAction","text":"<p>Sent once per command completion.</p> Attribute Description <code>invoked_from</code> <code>Script</code> or <code>Interactive</code>, based on whether stdin is a TTY. <code>action_name</code> Click subcommand name (e.g., <code>build</code>, <code>analyze</code>). <code>device</code> Target device type, if the subcommand accepts <code>--device</code> (e.g., <code>NPU</code>, <code>GPU</code>). <code>ep</code> Execution provider, if the subcommand accepts <code>--ep</code> (e.g., <code>QNNExecutionProvider</code>). <code>duration_ms</code> Wall-clock execution time in milliseconds. <code>success</code> Whether the command completed without raising."},{"location":"Privacy/#winmlclierror","title":"WinMLCLIError","text":"<p>Sent only when a command raises an unhandled exception.</p> Attribute Description <code>exception_type</code> Exception class name (e.g., <code>ValueError</code>). <code>exception_message</code> The exception message, with absolute paths trimmed to package-relative, truncated to 200 characters, and with emails, GUIDs, IPv4/IPv6 addresses, and long opaque tokens replaced by <code>&lt;scrubbed&gt;</code>. <code>exception_stack</code> A list of frames, each <code>{file, line, function}</code>. File paths are package-relative. No source line text, no local variable values."},{"location":"Privacy/#common-context-attributes","title":"Common context attributes","text":"<p>Every event carries these attributes (populated by the telemetry module, not by the command code):</p> Attribute Description <code>device_id</code> SHA256 hash of a randomly generated UUID, persisted per machine. Enables counting distinct users without identifying them. <code>id_status</code> <code>EXISTING</code>, <code>NEW</code>, or <code>FAILED</code> \u2014 how the device ID was obtained on this run. <code>os.name</code>, <code>os.version</code>, <code>os.release</code>, <code>os.arch</code> Operating system and architecture (e.g., <code>Windows</code>, <code>10.0.26200</code>, <code>11</code>, <code>AMD64</code>). <code>app_version</code> WinML CLI package version. <code>app_instance_id</code> A random UUID generated for this process only; not persisted. <code>initTs</code> Epoch timestamp when telemetry was initialized."},{"location":"Privacy/#data-never-collected","title":"Data never collected","text":"<ul> <li>Model file paths or model contents</li> <li>User names, machine names, or IP addresses (IPs appearing in exception messages are scrubbed)</li> <li>Command-line arguments or option values (e.g., <code>--model path/to/file.onnx</code>)</li> <li>Source code text in tracebacks</li> <li>Local variable values in tracebacks</li> <li>HuggingFace tokens, API keys, or session tokens (long opaque tokens in exception messages are scrubbed)</li> <li>File system contents</li> <li>Email addresses (scrubbed from exception messages if present)</li> </ul>"},{"location":"Privacy/#controlling-telemetry","title":"Controlling telemetry","text":""},{"location":"Privacy/#consent","title":"Consent","text":"<p>On the first run of any command, WinML CLI prompts:</p> <pre><code>Enable telemetry? [Y/n]\n</code></pre> <p>The default is <code>Y</code> (telemetry enabled) \u2014 pressing Enter accepts. Your answer is persisted to <code>%USERPROFILE%\\.winml\\config.json</code> under <code>telemetry.consent</code> and the prompt is not shown again.</p>"},{"location":"Privacy/#changing-your-decision","title":"Changing your decision","text":"<p>Edit <code>%USERPROFILE%\\.winml\\config.json</code> directly:</p> <pre><code>{\n  \"telemetry\": {\n    \"consent\": \"disabled\"\n  }\n}\n</code></pre> Goal Edit Opt out Set <code>telemetry.consent</code> to <code>\"disabled\"</code>. Opt in Set <code>telemetry.consent</code> to <code>\"enabled\"</code>. Re-show the prompt on next run Delete the file, or remove the <code>telemetry.consent</code> field. <p>There are no CLI subcommands, per-invocation flags, or environment variables for consent \u2014 the config file is the single source of truth.</p>"},{"location":"Privacy/#ci-cd","title":"CI / CD","text":"<p>Telemetry is automatically disabled when any of these environment variables are set, and no prompt is shown:</p> <p><code>CI</code>, <code>TF_BUILD</code>, <code>GITHUB_ACTIONS</code>, <code>JENKINS_URL</code>, <code>CODEBUILD_BUILD_ID</code>, <code>BUILDKITE</code>, <code>SYSTEM_TEAMFOUNDATIONCOLLECTIONURI</code>.</p>"},{"location":"Privacy/#cache-directory","title":"Cache directory","text":"<p>Events that fail to send (e.g., transient network errors) are cached locally and retried on the next run. The cache file lives at:</p> <p><code>%USERPROFILE%\\.winml\\telemetry\\winmlcli.cache</code></p> <p>The cache is append-only on failure and drain-then-resend on recovery. When telemetry is disabled, the cache is cleared so a disabled session never resends events the user has since opted out of.</p>"},{"location":"Privacy/#dev-installs","title":"Dev installs","text":"<p>WinML CLI installed from source (<code>pip install -e .</code>) or run directly from a checkout never sends telemetry. The InstrumentationKey is blank in source and is only populated by the official build pipeline. Only official binary releases are capable of sending telemetry, and only after the user has seen the first-run prompt.</p>"},{"location":"contributing/","title":"Contributing","text":"<p>For the full contributing guide \u2014 development setup, coding conventions, testing, PR checklist, and CLA \u2014 see <code>CONTRIBUTING.md</code> in the repository root.</p>"},{"location":"contributing/#quick-reference","title":"Quick Reference","text":"<pre><code># Clone and set up\ngit clone https://github.com/microsoft/winml-cli.git\ncd winml-cli\nuv sync --extra dev\nuv run pre-commit install\n\n# Download runtime check rules (required for `winml analyze`)\ngh release download &lt;tag&gt; --repo microsoft/winml-cli --pattern 'rules-v*.zip' --dir .\nExpand-Archive -Path .\\rules-v*.zip -DestinationPath src\\winml\\modelkit\\analyze\\rules\\runtime_check_rules -Force\n\n# Run tests\nuv run pytest tests/ -m \"not e2e and not npu and not gpu\"\n\n# Lint and format\nuv run ruff check src/ tests/ --fix\nuv run ruff format src/ tests/\n\n# Docs preview\nuv run mkdocs serve\n</code></pre>"},{"location":"contributing/#see-also","title":"See also","text":"<ul> <li>Installation \u2014 user-facing setup</li> <li>Commands \u2014 CLI reference</li> </ul>"},{"location":"troubleshooting/","title":"Troubleshooting","text":"<p>Common issues and solutions when working with winml-cli.</p>"},{"location":"troubleshooting/#compile","title":"Compile","text":""},{"location":"troubleshooting/#cannot-enable-compilation-no-compile-section","title":"Cannot enable compilation: no compile section","text":"<pre><code>UsageError: Cannot enable compilation: no compile section found in the config file\n</code></pre> <p>Cause: Compilation is off by default in <code>winml build</code>. You passed <code>--compile</code> to explicitly enable it, but the config JSON has no <code>\"compile\"</code> section (it's <code>null</code>). This happens when the config was generated without a device target that supports EPContext (e.g., <code>--device cpu</code> or <code>--device auto</code> on a machine without NPU).</p> <p>Solution: Regenerate the config targeting a device that supports compilation (NPU or GPU with an EP that produces EPContext):</p> <pre><code>uv run winml config -m &lt;model&gt; -d npu --compile -o output/\n</code></pre> <p>Note</p> <p>By default <code>winml build</code> skips the compile stage unless <code>--compile</code> is passed or the config contains a non-null <code>\"compile\"</code> section. To include compilation in the generated config, specify a device that maps to an EPContext-capable EP (e.g., <code>-d npu</code>).</p>"},{"location":"troubleshooting/#already-a-compiled-epcontext-model","title":"Already a compiled EPContext model","text":"<pre><code>ClickException: model_ctx.onnx is already a compiled EPContext model and cannot be re-compiled\n</code></pre> <p>Cause: You're trying to compile a model that is already an EPContext artifact (the <code>_ctx.onnx</code> output).</p> <p>Solution: Run compilation on the original (pre-compiled) ONNX file instead:</p> <pre><code>uv run winml compile -m model.onnx -d npu -o output/\n</code></pre>"},{"location":"troubleshooting/#provider-does-not-support-epcontext-compilation","title":"Provider does not support EPContext compilation","text":"<pre><code>ClickException: Provider 'DmlExecutionProvider' does not support EPContext compilation\n</code></pre> <p>Cause: Not all EPs produce EPContext format. DML and CPU do not support pre-compilation.</p> <p>Solution: EPContext is supported by QNN, OpenVINO, TensorRT, and Vitis AI. For DML/CPU, skip the compile step \u2014 the runtime compiles on first load automatically:</p> <pre><code>uv run winml build -c config.json -m model -o output/ --no-compile\n</code></pre>"},{"location":"troubleshooting/#analyze","title":"Analyze","text":""},{"location":"troubleshooting/#unsupported-nodes-persist-after-analysis","title":"Unsupported nodes persist after analysis","text":"<pre><code>RuntimeError: Unsupported nodes persist after analysis\n</code></pre> <p>Cause: The model contains operators that the selected EP cannot dispatch natively.</p> <p>Solution: Run <code>winml analyze</code> with <code>--optim-config</code> to identify problematic operators and get recommended graph optimizations:</p> <pre><code># Analyze and output optimization recommendations\nuv run winml analyze -m model.onnx --ep qnn --optim-config optim_config.json\n</code></pre> <p>This produces <code>optim_config.json</code> with the auto-discovered optimization flags. Apply them with <code>winml optimize</code>, then re-analyze:</p> <pre><code># Apply recommended optimizations\nuv run winml optimize -m model.onnx -o model_optimized.onnx -c optim_config.json\n\n# Re-analyze to check if unsupported nodes are resolved\nuv run winml analyze -m model_optimized.onnx --ep qnn\n</code></pre> <p>If unsupported nodes still remain after optimization, consider:</p> <ul> <li>Manually modifying problematic nodes \u2014 use tools like <code>onnx-graphsurgeon</code> to replace or remove operators the EP cannot handle</li> <li>Using a different EP (<code>--ep dml</code> or <code>--ep cpu</code>) that supports the operators in question</li> <li>Checking if a newer opset version resolves the compatibility gap (re-export with <code>--opset-version 18</code>)</li> </ul>"},{"location":"troubleshooting/#many-unknown-results-from-constant-nodes","title":"Many \"unknown\" results from constant nodes","text":"<p>When <code>winml analyze</code> reports a large number of nodes as \"unknown\", the model likely hasn't been normalized \u2014 it contains raw constant-folding subgraphs, missing shape annotations, or redundant initializer nodes that the analyzer cannot classify.</p> <p>Solution: Run <code>winml optimize</code> with no optimization flags to normalize the model (constant folding, shape inference, dead-node elimination), then re-analyze:</p> <pre><code># Normalize only (no fusion flags)\nuv run winml optimize -m model.onnx -o model_normalized.onnx\n\n# Re-analyze \u2014 constant nodes are now folded, shapes are inferred\nuv run winml analyze -m model_normalized.onnx --ep qnn\n</code></pre> <p>This baseline pass collapses constant subgraphs into initializers and propagates tensor shapes throughout the graph, giving the analyzer enough information to classify nodes correctly.</p>"},{"location":"troubleshooting/#build-cache","title":"Build / Cache","text":""},{"location":"troubleshooting/#disk-full-out-of-space","title":"Disk full / out of space","text":"<p>Build artifacts (exported ONNX, optimized graphs, quantized models, compiled EPContext files) are cached under:</p> <pre><code>C:\\Users\\&lt;user&gt;\\.cache\\winml\n</code></pre> <p>This directory can grow significantly after multiple builds with large models. If you encounter disk-full errors or want to reclaim space, it is safe to delete the entire folder:</p> <pre><code>Remove-Item -Recurse -Force \"$env:USERPROFILE\\.cache\\winml\"\n</code></pre> <p>The next <code>winml build</code> will re-create the cache as needed. Use <code>--rebuild</code> to force a full rebuild without relying on cached intermediates.</p>"},{"location":"troubleshooting/#general-tips","title":"General Tips","text":"Tip Command Diagnose environment <code>uv run winml sys</code> Check EP compatibility <code>uv run winml analyze -m model.onnx --ep &lt;ep&gt;</code> Verbose output Add <code>-v</code> or <code>--verbose</code> to any command Skip a pipeline stage <code>--no-quant</code>, <code>--no-compile</code>, <code>--no-optimize</code> Force rebuild (ignore cache) <code>uv run winml build -c config.json -m &lt;model&gt; -o output/ --rebuild</code> Regenerate config <code>uv run winml config -m &lt;model&gt; -d &lt;device&gt; -o dir/</code> Free disk space Delete <code>C:\\Users\\&lt;user&gt;\\.cache\\winml</code>"},{"location":"troubleshooting/#see-also","title":"See also","text":"<ul> <li>winml sys \u2014 system diagnostics</li> <li>winml analyze \u2014 EP compatibility analysis</li> <li>EP and Device \u2014 execution provider reference</li> </ul>"},{"location":"commands/analyze/","title":"winml analyze","text":"<p>Verify an ONNX model is compatible with a target execution provider before deployment.</p>"},{"location":"commands/analyze/#when-to-use-this","title":"When to use this","text":"<p>Use <code>winml analyze</code> before running the full build pipeline to confirm that your ONNX model's operators are supported by the intended execution provider and device. It surfaces operator gaps and actionable recommendations early, saving time that would otherwise be spent on a failed compile or quantize run.</p>"},{"location":"commands/analyze/#synopsis","title":"Synopsis","text":"<pre><code>$ winml analyze [options]\n</code></pre>"},{"location":"commands/analyze/#flags","title":"Flags","text":"Flag Short Type Default Description <code>--model</code> <code>-m</code> <code>PATH</code> (required) Path to the ONNX model file to analyze. <code>--ep</code> choice <code>auto</code> Target execution provider. Accepts full names (e.g., <code>QNNExecutionProvider</code>) or short aliases (<code>qnn</code>, <code>openvino</code>, <code>vitisai</code>, <code>cpu</code>, <code>cuda</code>, <code>dml</code>, <code>nvtensorrtrtx</code>, <code>migraphx</code>). Use <code>all</code> for every rule-data-backed EP, or <code>auto</code> to infer from local availability. <code>--device</code> <code>cpu\\|gpu\\|npu\\|all\\|auto</code> <code>auto</code> Target device type. <code>auto</code> infers from local availability; <code>all</code> evaluates all rule-data-backed devices. <code>--verbose</code> <code>-v</code> flag off Enable verbose output. <code>--quiet</code> <code>-q</code> flag off Suppress non-essential output. <code>--config</code> <code>-c</code> <code>PATH</code> (none) Build configuration file (YAML/JSON). <code>--output</code> <code>PATH</code> (none) Save the full JSON result to a file in addition to printing the console summary. <code>--information</code> / <code>--no-information</code> flag enabled Include detailed per-operator recommendations and remediation hints in the output. Pass <code>--no-information</code> for a compact pass/fail summary. <code>--htp-metadata</code> <code>PATH</code> (none) Path to an HTP metadata JSON file (produced by <code>winml export</code>). Enriches subgraph pattern extraction by mapping nodes back to their source module hierarchy. Benefits all target EPs. <code>--run-unknown-op</code> / <code>--no-run-unknown-op</code> flag disabled For operators not in the rule database, build a minimal ONNX graph and run it on the target EP locally to determine support. Enable when local EP libraries are available. <code>--save-node</code> <code>partial\\|unsupported</code> (none) Save partial or unsupported node subgraphs to disk for further investigation. Can be specified multiple times: <code>--save-node partial --save-node unsupported</code>. <code>--optim-config</code> <code>PATH</code> (none) Save the auto-discovered optimization config (merged across all analyzed EPs) to a JSON file."},{"location":"commands/analyze/#how-it-works","title":"How it works","text":"<p><code>winml analyze</code> loads the ONNX model and runs a static analysis pass via <code>ONNXStaticAnalyzer</code>. For each operator (and recognized subgraph pattern), the analyzer consults the target EP's rule database. For operators not in the database, it can optionally probe them locally when <code>--run-unknown-op</code> is enabled. The combined answer classifies each node as supported, partial, unsupported, or unknown (see Analyze and optimize for definitions).</p> <p>The analysis always produces a lint result \u2014 the pass/fail verdict. When <code>--information</code> is enabled (the default), it additionally produces an autoconf result: a set of fusion-flag suggestions that, if applied in the optimize stage, would resolve partial or unsupported patterns. Pass <code>--no-information</code> to skip autoconf and get just the lint verdict.</p>"},{"location":"commands/analyze/#exit-codes","title":"Exit codes","text":"Code Meaning <code>0</code> All operators are fully supported on the target EP. <code>1</code> At least one operator is unsupported, partially supported, or unknown. <code>2</code> Input or configuration error (bad path, unknown EP, etc.). <p>Exit codes make <code>winml analyze</code> safe to use as a CI gate with <code>set -e</code> or <code>$?</code> checks.</p>"},{"location":"commands/analyze/#examples","title":"Examples","text":"<p>Analyze using auto-detected EP and device:</p> <pre><code>$ winml analyze --model microsoft/resnet-50.onnx\n</code></pre> <p>The output shows a live progress table per EP followed by an <code>ANALYSIS SUMMARY</code> section. Each EP line displays support counts in <code>S/P/U/Unk</code> format (Supported / Partial / Unsupported / Unknown) with color-coded indicators.</p> <p>Check QNN NPU support using the short alias:</p> <pre><code>$ winml analyze --model bert-base-uncased.onnx --ep qnn --device NPU\n</code></pre> <p>Check Intel OpenVINO GPU support and print operator-level recommendations:</p> <pre><code>$ winml analyze --model bert-base-uncased.onnx --ep openvino --device GPU --information\n</code></pre> <p>Save the full JSON result for offline inspection while still printing the console summary:</p> <pre><code>$ winml analyze --model facebook/convnext-tiny-224.onnx --output results.json\n</code></pre> <p>Use HTP metadata for enhanced subgraph pattern extraction:</p> <pre><code>$ winml analyze --model bert-base-uncased.onnx \\\n    --ep qnn --device NPU \\\n    --htp-metadata bert-base-uncased_htp_metadata.json\n</code></pre> <p>Run a lint-only pass (no recommendations) for a CI gate:</p> <pre><code>$ winml analyze --model model.onnx --ep qnn --device NPU --no-information\necho \"Exit code: $?\"  # 0 = clean, 1 = issues, 2 = input error\n</code></pre> <p>Dump unsupported subgraphs to disk for debugging:</p> <pre><code>$ winml analyze --model model.onnx --ep qnn \\\n    --save-node partial --save-node unsupported \\\n    --output result.json\n</code></pre> <p>Enable local execution for operators not in the rule database:</p> <pre><code>$ winml analyze --model model.onnx --ep qnn --device NPU --run-unknown-op\n</code></pre>"},{"location":"commands/analyze/#common-pitfalls","title":"Common pitfalls","text":"<ul> <li>Omitting <code>--ep</code> uses <code>auto</code> (inferred from local availability) \u2014 to analyze every EP regardless of what is installed, pass <code>--ep all</code>. Specify <code>--ep &lt;name&gt;</code> when you know your target hardware.</li> <li>Exit code 1 is not a hard failure \u2014 it means at least one operator is unsupported, not that the model cannot run at all. Many EPs fall back unsupported nodes to the CPU EP automatically; review the recommendations before deciding to restructure the model.</li> <li><code>--htp-metadata</code> is EP-agnostic \u2014 HTP metadata enriches pattern extraction before any EP-specific checks, so it benefits all target EPs equally. You do not need separate metadata files per EP.</li> <li><code>--run-unknown-op</code> is disabled by default \u2014 operators not covered by the rule database are classified as <code>UNKNOWN</code> (not unsupported) unless you explicitly pass <code>--run-unknown-op</code> to probe them locally. Enable it only when the target EP's libraries are available on the local machine.</li> <li>The model path must point to an existing <code>.onnx</code> file \u2014 symbolic HuggingFace model IDs are not accepted; export the model first with <code>winml export</code>.</li> </ul>"},{"location":"commands/analyze/#see-also","title":"See also","text":"<ul> <li>Analyze and optimize \u2014 conceptual deep dive on classifications, lint vs autoconf, and the analyzer/optimizer loop</li> <li>eps-and-devices.md \u2014 background on ONNX operators and execution providers</li> <li>export.md \u2014 convert a HuggingFace model to ONNX before analyzing</li> <li>compile.md \u2014 compile the model for the target EP after analysis passes</li> <li>sys.md \u2014 list EPs available on the current machine</li> </ul>"},{"location":"commands/build/","title":"winml build","text":"<p>Run the entire winml-cli pipeline (export \u2192 optimize \u2192 quantize \u2192 compile) in one command.</p>"},{"location":"commands/build/#when-to-use-this","title":"When to use this","text":"<p>Use <code>winml build</code> when you want to go from a Hugging Face model ID (or an existing <code>.onnx</code> file) to a deployment-ready artifact in a single invocation, without manually chaining <code>winml export</code>, <code>winml optimize</code>, <code>winml quantize</code>, and <code>winml compile</code>. A build config file \u2014 generated by <code>winml config</code> \u2014 controls every stage of the pipeline.</p>"},{"location":"commands/build/#synopsis","title":"Synopsis","text":"<pre><code>$ winml build [options]\n</code></pre>"},{"location":"commands/build/#flags","title":"Flags","text":"Flag Short Type Default Description <code>--config</code> <code>-c</code> path <code>None</code> <code>WinMLBuildConfig</code> JSON file, generated by <code>winml config</code>. If omitted, config is auto-generated from <code>-m</code>. <code>--model</code> <code>-m</code> string <code>None</code> Hugging Face model ID or path to an existing <code>.onnx</code> file. <code>--output-dir</code> <code>-o</code> path <code>None</code> Directory for all build artifacts. Mutually exclusive with <code>--use-cache</code>. <code>--use-cache/--no-use-cache</code> flag <code>false</code> Store artifacts in the winml-cli global cache (<code>~/.cache/winml/</code>). Mutually exclusive with <code>--output-dir</code>. <code>--rebuild/--no-rebuild</code> flag <code>false</code> Overwrite existing artifacts and re-run the full pipeline. <code>--quant/--no-quant</code> flag <code>true</code> Run the quantization stage (use <code>--no-quant</code> to skip), overriding the config. <code>--no-compile</code> / <code>--compile</code> flag <code>None</code> Override compilation. <code>--compile</code> forces enable (config must have a compile section). <code>--no-compile</code> forces skip. Default: inherit from config. <code>--optimize/--no-optimize</code> flag <code>true</code> Run the optimization stage (use <code>--no-optimize</code> to skip). <code>--ep</code> string <code>None</code> Target execution provider for the analyzer (e.g., <code>qnn</code>). Falls back to the compile config EP if not set. <code>--device</code> <code>-d</code> string <code>auto</code> Target device for the analyzer (e.g., <code>npu</code>, <code>gpu</code>). Default: <code>auto</code> (auto-detect). <code>--analyze/--no-analyze</code> flag <code>true</code> Run the analyzer loop during build (use <code>--no-analyze</code> to skip). <code>--max-optim-iterations</code> integer <code>None</code> Maximum autoconf re-optimization rounds (3 enforced internally when not set). <code>--no-analyze</code> implicitly sets this to 0. <code>--trust-remote-code/--no-trust-remote-code</code> flag <code>false</code> Allow executing custom code from model repositories. Use only with trusted sources. <code>--allow-unsupported-nodes/--no-allow-unsupported-nodes</code> flag <code>false</code> Allow unsupported nodes to remain in the graph instead of failing the build. <code>--help</code> <code>-h</code> flag Show this message and exit."},{"location":"commands/build/#how-it-works","title":"How it works","text":"<p><code>winml build</code> reads a <code>WinMLBuildConfig</code> JSON file (from <code>winml config</code>) that encodes device, precision, export, quantization, and compilation settings. When <code>-m</code> is a Hugging Face model ID, the full pipeline runs: export \u2192 optimize \u2192 quantize \u2192 compile. When <code>-m</code> points to an existing <code>.onnx</code> file, the export stage is skipped and the pipeline starts at optimization. After compilation, an optional analyzer loop (<code>--max-optim-iterations</code>) re-evaluates graph quality and applies further passes; <code>--no-analyze</code> disables it for a deterministic single-pass build. Individual stages can be suppressed with <code>--no-quant</code>, <code>--no-compile</code>, and <code>--no-optimize</code> without touching the config file.</p> <p>Reproducible CI/CD builds</p> <p>The config file is a portable, self-contained pipeline specification. Check it into source control and invoke <code>winml build -c config.json</code> in CI to produce identical artifacts without manual flag management. Set <code>\"auto\": false</code> in the config to disable the autoconf discovery loop for fully deterministic output.</p>"},{"location":"commands/build/#examples","title":"Examples","text":"<pre><code># Full pipeline: HF model \u2192 export \u2192 optimize \u2192 quantize \u2192 compile\nwinml build -c config.json -m microsoft/resnet-50 -o output/\n</code></pre> <pre><code>winml build\n  Config:     config.json\n  Model:      microsoft/resnet-50\n  Output:     output/\n\n  export       done  (28.3s)\n  optimize     done  (4.1s)\n  quantize     done  (6.8s)\n  compile      done  (14.2s)\n\n  Build complete in 53.4s\n  Final artifact: output/resnet50_ctx.onnx\n</code></pre> <pre><code># Start from a pre-exported ONNX file (skips export stage)\nwinml build -c config.json -m resnet50.onnx -o output/\n</code></pre> <pre><code># Export and optimize only \u2014 skip quantization and compilation for quick testing\nwinml build -c config.json -m bert-base-uncased -o output/ \\\n  --no-quant --no-compile\n</code></pre> <pre><code># Force a clean rebuild, overwriting any cached artifacts\nwinml build -c config.json -m facebook/convnext-tiny-224 -o output/ --rebuild\n</code></pre> <pre><code># Use the global cache and cap optimizer iterations for faster turnaround\nwinml build -c config.json -m microsoft/resnet-50 \\\n  --use-cache --max-optim-iterations 1\n</code></pre>"},{"location":"commands/build/#common-pitfalls","title":"Common pitfalls","text":"<ul> <li>Either <code>--output-dir</code> or <code>--use-cache</code> is required; they are mutually   exclusive. Omitting both raises an error immediately.</li> <li><code>--use-cache</code> is not supported in module mode. When the config is a JSON   array (module mode), only <code>--output-dir</code> is accepted.</li> <li>The config file must come from <code>winml config</code>. The schema is strict;   unknown keys are rejected.</li> <li>Existing artifacts are reused by default. Pass <code>--rebuild</code> to force a   fresh run after changing the config.</li> </ul>"},{"location":"commands/build/#see-also","title":"See also","text":"<ul> <li>winml export</li> <li>winml compile</li> <li>Config and build</li> <li>How it works</li> <li>Config Schema \u2014 full field-by-field config reference</li> <li>Output Layout \u2014 what each output file contains</li> <li>Supported Models \u2014 validated model architectures</li> </ul>"},{"location":"commands/catalog/","title":"winml catalog","text":"<p>Browse the curated winml-cli catalog of validated models and benchmarks.</p>"},{"location":"commands/catalog/#when-to-use-this","title":"When to use this","text":"<p>Use <code>winml catalog</code> to discover which HuggingFace models have been validated end-to-end by the winml-cli team \u2014 exported, quantized, compiled, and benchmarked on real Windows ML devices. It is the starting point when you want a model that is known to work before investing time in a custom build.</p>"},{"location":"commands/catalog/#synopsis","title":"Synopsis","text":"<pre><code>$ winml catalog [options]\n</code></pre>"},{"location":"commands/catalog/#flags","title":"Flags","text":"Flag Short Type Default Description <code>--model-type</code> string <code>null</code> Filter the catalog by model architecture (case-insensitive). Examples: <code>bert</code>, <code>roberta</code>, <code>vit</code>. <code>--task</code> <code>-t</code> string <code>null</code> Filter by HuggingFace task (case-insensitive). Examples: <code>text-classification</code>, <code>image-segmentation</code>. <code>--ep/--execution-provider</code> string <code>null</code> Filter by execution provider (e.g., <code>qnn</code>, <code>dml</code>). If not specified, shows all EPs. <code>--device</code> <code>-d</code> string <code>null</code> Filter by target device (e.g., <code>npu</code>, <code>gpu</code>). If not specified, shows all devices. <code>--output</code> <code>-o</code> path <code>null</code> Save the displayed results to a JSON file. <code>--help</code> <code>-h</code> flag \u2014 Show help and exit. <p><code>winml catalog</code> reads a local catalog bundled with the package \u2014 no network access is required.</p>"},{"location":"commands/catalog/#how-it-works","title":"How it works","text":"<p>The catalog is stored in <code>winml/modelkit/data/hub_models.json</code> and is loaded directly from the installed package data without any network call. Each catalog entry records the model ID, task, architecture type, and model size. Use <code>--model-type</code>, <code>--task</code>, <code>--ep</code>, or <code>--device</code> to narrow the displayed list. When <code>--output</code> is provided, the filtered results are written as indented JSON to the specified path.</p>"},{"location":"commands/catalog/#examples","title":"Examples","text":"<pre><code># List all validated models in the catalog\n$ winml catalog\n</code></pre> <pre><code>+--- winml-cli Catalog  |  12 validated model(s) --------------------------+\n|  Model                             Task                    Model Type     |\n|  microsoft/resnet-50              image-classification    resnet          |\n|  bert-base-uncased                fill-mask               bert            |\n|  ProsusAI/finbert                 text-classification     bert            |\n|  ...                                                                      |\n+---------------------------------------------------------------------------+\nUse  --ep  or  --device  to filter by execution provider or target device.\n</code></pre> <pre><code># Filter to BERT-family models only\n$ winml catalog --model-type bert\n</code></pre> <pre><code># Filter by task \u2014 show only text-classification models\n$ winml catalog --task text-classification\n</code></pre> <pre><code># Combine filters \u2014 BERT models for text classification\n$ winml catalog --model-type bert --task text-classification\n</code></pre> <pre><code># Save filtered results to JSON for offline review\n$ winml catalog --task image-classification --output results/image_catalog.json\n</code></pre>"},{"location":"commands/catalog/#common-pitfalls","title":"Common pitfalls","text":"<ul> <li>The catalog reflects a point-in-time snapshot. Models listed in the catalog   were validated against a specific version of winml-cli, ONNX Runtime, and the   relevant EP driver. Accuracy and latency may differ on your hardware or with   updated drivers.</li> <li><code>--output</code> only saves what was displayed. Combining a filter with <code>--output</code>   saves the filtered list. There is no flag to dump the entire catalog in one call \u2014   omit all filters and add <code>--output</code> to do so.</li> <li>A model not in the catalog can still be used with winml-cli. The catalog covers   tested models; <code>winml inspect</code> and <code>winml export</code> work with any HuggingFace model   that has a supported architecture, whether or not it appears in the catalog.</li> </ul>"},{"location":"commands/catalog/#see-also","title":"See also","text":"<ul> <li>inspect.md \u2014 check loader, exporter, and task detection for any   HuggingFace model ID</li> <li>sys.md \u2014 verify your environment and EP availability before building</li> <li>How winml-cli Works \u2014 pipeline overview from export   to benchmark</li> <li>Quantization &amp; QDQ \u2014 understand quantization concepts   and precision options</li> </ul>"},{"location":"commands/compile/","title":"winml compile","text":"<p>Compile an ONNX model to an EP-specific format for fast runtime loading.</p>"},{"location":"commands/compile/#when-to-use-this","title":"When to use this","text":"<p>Use <code>winml compile</code> as the final pipeline stage after <code>winml quantize</code> to produce an execution-provider-native artifact (for example, a QNN EPContext model) that loads faster and avoids online graph compilation at inference time.</p>"},{"location":"commands/compile/#synopsis","title":"Synopsis","text":"<pre><code>$ winml compile [options]\n</code></pre>"},{"location":"commands/compile/#flags","title":"Flags","text":"Flag Short Type Default Description <code>--model</code> <code>-m</code> path (required unless <code>--list</code>) Input ONNX model file. <code>--output</code> <code>-o</code> path \u2014 Output file path (e.g., <code>model_compiled.onnx</code>). Takes precedence over <code>--output-dir</code>. <code>--output-dir</code> path same dir as input Directory to write compiled output artifacts. <code>--device</code> <code>-d</code> choice <code>auto</code> Target device: <code>auto</code>, <code>npu</code>, <code>gpu</code>, or <code>cpu</code>. <code>--ep</code> <code>TEXT</code> \u2014 Force a specific execution provider, overriding device-to-provider mapping. Accepts full names (e.g., <code>QNNExecutionProvider</code>) or aliases (<code>qnn</code>, <code>dml</code>, <code>openvino</code>, <code>vitisai</code>, <code>migraphx</code>, <code>cpu</code>, <code>nvtensorrtrtx</code>). <code>--validate</code> / <code>--no-validate</code> flag <code>--validate</code> Run a post-compilation validation pass on the target hardware. Enabled by default; pass <code>--no-validate</code> to skip when the target hardware or driver is unavailable. <code>--compiler</code> choice <code>ort</code> Compiler backend: <code>ort</code> (ONNX Runtime) or <code>qairt</code> (Qualcomm AI Runtime Tools). <code>--qnn-sdk-root</code> path <code>None</code> Path to the QNN SDK root directory. <code>--embed/--no-embed</code> flag <code>false</code> Embed the EP context blob inside the ONNX file instead of writing a separate <code>.bin</code> file. <code>--list</code> flag <code>false</code> List available compiler backends for the selected device and exit without compiling. <code>--help</code> <code>-h</code> flag Show this message and exit."},{"location":"commands/compile/#how-it-works","title":"How it works","text":"<p><code>winml compile</code> resolves the target execution provider from <code>--device</code> and <code>--ep</code>, then calls the winml-cli compiler API to hand the ONNX graph to the EP's offline compilation toolchain. When <code>--device auto</code> (the default), the target EP is determined by auto-detecting available hardware. For NPU targets, ONNX Runtime's QNN EP generates a binary <code>.bin</code> context file (or embeds it inline with <code>--embed</code>) that encodes the hardware-optimized execution plan, eliminating graph partitioning at load time. An optional post-compilation validation pass runs a forward pass through the target EP; skip it with <code>--no-validate</code> when the target hardware is absent.</p>"},{"location":"commands/compile/#examples","title":"Examples","text":"<pre><code># Compile with auto device detection (default compiler)\nwinml compile -m resnet50_qdq.onnx\n</code></pre> <pre><code>Input: resnet50_qdq.onnx\nDevice: npu\nProvider: qnn\nCompiler: ort\n\nCompiling model...\n\nSuccess! Model compiled\nOutput: resnet50_qdq_ctx.onnx\nCompile time: 12.40s\nTotal time: 13.05s\n</code></pre> <pre><code># List available compiler backends for NPU before committing to a run\nwinml compile --list --device npu\n</code></pre> <pre><code># Compile a pre-quantized BERT model for NPU with context embedded inline\nwinml compile -m bert-base-uncased_qdq.onnx --embed\n</code></pre> <pre><code># Compile for GPU using the OpenVINO execution provider\nwinml compile -m microsoft_resnet50.onnx --device gpu --ep openvino\n</code></pre>"},{"location":"commands/compile/#common-pitfalls","title":"Common pitfalls","text":"<ul> <li><code>--embed</code> inflates the <code>.onnx</code> file significantly. Embedding the EP   context produces a single portable file but can make it impractical to open or   inspect the ONNX graph with standard tooling.</li> <li>Validation requires the target hardware. The post-compilation validation   step runs an actual inference pass; on a machine without the NPU driver or the   relevant EP installed, always pass <code>--no-validate</code>.</li> <li><code>--device auto</code> auto-detects the best available hardware. Pass <code>--device npu</code>,   <code>--device gpu</code>, or <code>--device cpu</code> explicitly when targeting specific hardware   regardless of what is auto-detected.</li> </ul>"},{"location":"commands/compile/#see-also","title":"See also","text":"<ul> <li>winml quantize</li> <li>winml build</li> <li>ONNX and execution providers</li> </ul>"},{"location":"commands/config/","title":"winml config","text":"<p>Generate a reusable build configuration for a Hugging Face model or ONNX file.</p>"},{"location":"commands/config/#when-to-use-this","title":"When to use this","text":"<p>Use <code>winml config</code> at the start of a new model project to produce a <code>WinMLBuildConfig</code> JSON file. The config captures the model identity, task, precision, and per-stage settings in one shareable artifact that you can edit, version-control, and repeatedly pass to <code>winml build</code>. Running config first lets you review and adjust pipeline settings before committing to a full build.</p>"},{"location":"commands/config/#synopsis","title":"Synopsis","text":"<pre><code>$ winml config [options]\n</code></pre>"},{"location":"commands/config/#flags","title":"Flags","text":"Flag Short Type Default Description <code>--model</code> <code>-m</code> <code>TEXT</code> (none) HuggingFace model ID (e.g., <code>microsoft/resnet-50</code>) or path to an existing <code>.onnx</code> file. Optional when <code>--model-type</code> or <code>--model-class</code> is provided. <code>--task</code> <code>-t</code> <code>TEXT</code> (auto) Override the auto-detected task (e.g., <code>image-classification</code>, <code>text-classification</code>). When omitted, the first supported task for the model is selected automatically. <code>--model-class</code> <code>TEXT</code> (auto) Override the auto-detected model class (e.g., <code>CLIPTextModelWithProjection</code>). Useful for multi-component models. <code>--model-type</code> <code>TEXT</code> (auto) Override the auto-detected model type (e.g., <code>bert</code>, <code>resnet</code>). Can be used without <code>-m</code> to generate a config from HuggingFace default settings. <code>--module</code> <code>TEXT</code> (none) Generate configs for every submodule whose class name matches the given string (e.g., <code>ResNetConvLayer</code>). The output is a JSON array instead of a single object. <code>--config</code> <code>-c</code> <code>PATH</code> (none) JSON override file in <code>WinMLBuildConfig</code> format. Fields present in this file take precedence over auto-detected values. <code>--shape-config</code> <code>PATH</code> (none) JSON file with input shape overrides for dummy input generation. Valid keys by modality \u2014 text: <code>sequence_length</code>; vision: <code>height</code>, <code>width</code>, <code>num_channels</code>; audio: <code>feature_size</code>, <code>nb_max_frames</code>, <code>audio_sequence_length</code>. <code>--device</code> <code>-d</code> <code>auto\\|npu\\|gpu\\|cpu</code> <code>auto</code> Target device. Affects the generated quantization and compilation sub-configs. <code>auto</code> leaves those sections unchanged from the kit defaults. <code>--ep</code> <code>TEXT</code> (none) Force a specific execution provider (<code>qnn</code>, <code>dml</code>, <code>migraphx</code>, <code>tensorrt</code>, <code>vitisai</code>, <code>openvino</code>, <code>cpu</code>). Overrides the device-to-provider mapping. When used without <code>--device</code>, the device is inferred from the EP. <code>--precision</code> <code>-p</code> <code>TEXT</code> <code>auto</code> Target precision: <code>auto</code>, <code>fp32</code>, <code>fp16</code>, <code>int8</code>, <code>int16</code>, or a mixed format such as <code>w8a16</code>. <code>auto</code> selects the precision based on the chosen device. <code>--output</code> <code>-o</code> <code>PATH</code> (stdout) Write the generated JSON to this file instead of printing to stdout. <code>--library</code> <code>TEXT</code> <code>transformers</code> Source library for <code>TasksManager</code> task lookup. Defaults to <code>transformers</code>; set to <code>diffusers</code> or another Optimum-supported library when needed. <code>--quant/--no-quant</code> flag <code>true</code> Include quantization in the generated config (use <code>--no-quant</code> to omit it and set <code>quant</code> to <code>null</code>). <code>--no-compile</code> / <code>--compile</code> flag <code>--no-compile</code> (compile excluded by default) Controls whether compilation is included in the generated config. By default compilation is excluded (<code>compile: null</code>). Pass <code>--compile</code> to include a compile section. <code>--trust-remote-code/--no-trust-remote-code</code> flag <code>false</code> Allow execution of custom model code from the HuggingFace repository. Required for some community models. Only enable for repositories you trust."},{"location":"commands/config/#how-it-works","title":"How it works","text":"<p><code>winml config</code> queries the HuggingFace <code>TasksManager</code> to auto-detect the model's task, class, and ONNX export specification. For known model types it looks up a per-model kit in <code>MODEL_BUILD_CONFIGS</code> and uses that as a starting point, layering in your device, precision, and override file on top. When <code>-m</code> points to an existing <code>.onnx</code> file, the export stage is skipped by setting <code>export</code> to <code>null</code> in the output. The result is a complete <code>WinMLBuildConfig</code> JSON printed to stdout or written to a file, ready to be passed to <code>winml build</code>.</p>"},{"location":"commands/config/#examples","title":"Examples","text":"<p>Generate a config for ResNet-50 with all auto-detected settings:</p> <pre><code>$ winml config -m microsoft/resnet-50\n</code></pre> <pre><code>Generating config for microsoft/resnet-50...\nAuto-selected task: image-classification (from 'microsoft/resnet-50')\nGenerated config for task 'image-classification'\n{\n  \"loader\": { \"task\": \"image-classification\", ... },\n  \"export\": { \"opset_version\": 17, ... },\n  \"optim\": { ... },\n  \"quant\": null,\n  \"compile\": null\n}\n</code></pre> <p>Target NPU with int8 quantization and save to a file:</p> <pre><code>$ winml config -m microsoft/resnet-50 --device npu --precision int8 -o resnet_npu.json\n</code></pre> <p>Generate a config for BERT and override the task:</p> <pre><code>$ winml config -m bert-base-uncased --task text-classification -o bert_cls.json\n</code></pre> <p>Generate from a model type alone (no HuggingFace download required at config time):</p> <pre><code>$ winml config --model-type bert --task fill-mask\n</code></pre> <p>Generate a config from an already-exported ONNX file, skipping quantization (compilation is already excluded by default):</p> <pre><code>$ winml config -m facebook/convnext-tiny-224.onnx --no-quant -o convnext_optim_only.json\n</code></pre>"},{"location":"commands/config/#common-pitfalls","title":"Common pitfalls","text":"<ul> <li>At least one of <code>-m</code>, <code>--model-type</code>, or <code>--model-class</code> is required \u2014 calling <code>winml config</code> with none of these three flags raises a usage error immediately.</li> <li><code>auto</code> precision does not always map to a lower-bit type \u2014 when <code>--device</code> is also <code>auto</code>, precision stays at the kit default (usually <code>fp32</code>). Explicitly pass <code>--device npu</code> or <code>--device gpu</code> for <code>auto</code> precision to resolve to <code>int8</code> or <code>fp16</code>.</li> <li><code>--module</code> changes the output shape \u2014 with <code>--module</code> the JSON output is an array of configs, not a single object. Scripts that expect a single object will fail to parse this output.</li> <li><code>--trust-remote-code</code> has security implications \u2014 only use this flag with model repositories you own or explicitly trust; it allows arbitrary Python execution from the remote model card.</li> <li>Shape overrides in <code>--shape-config</code> are modality-specific \u2014 passing a <code>sequence_length</code> key for a vision model has no effect. Check the <code>--help</code> description for valid keys per modality.</li> </ul>"},{"location":"commands/config/#see-also","title":"See also","text":"<ul> <li>Config and build \u2014 structure of <code>WinMLBuildConfig</code> and how stages interact</li> <li>Config Schema \u2014 full field-by-field config reference</li> <li>Supported Models \u2014 validated model architectures</li> <li>build.md \u2014 run the full pipeline using a generated config</li> <li>export.md \u2014 export a HuggingFace model to ONNX as a standalone step</li> <li>optimize.md \u2014 apply graph optimizations to an existing ONNX file</li> </ul>"},{"location":"commands/eval/","title":"winml eval","text":"<p>Evaluate ONNX model accuracy on a standard dataset.</p>"},{"location":"commands/eval/#when-to-use-this","title":"When to use this","text":"<p>Use <code>winml eval</code> to measure how accurately a model performs on real data \u2014 especially after quantization, where comparing the quantized model against the floating-point baseline reveals any accuracy regression introduced by precision reduction.</p>"},{"location":"commands/eval/#synopsis","title":"Synopsis","text":"<pre><code>$ winml eval [options]\n</code></pre>"},{"location":"commands/eval/#flags","title":"Flags","text":"Flag Short Type Default Description <code>--model</code> <code>-m</code> <code>TEXT</code> \u2014 HuggingFace model ID, or path to a local <code>.onnx</code> file. Required (unless <code>--model-id</code> is provided directly). <code>--model-id</code> <code>TEXT</code> \u2014 HuggingFace model ID used for preprocessor and config resolution when <code>-m</code> points to an <code>.onnx</code> file. Required when <code>-m</code> is an ONNX file. <code>--task</code> <code>TEXT</code> auto-detected Task name (e.g., <code>image-classification</code>). Auto-detected from <code>--model-id</code> when not provided. Required when <code>-m</code> is an ONNX file and the task cannot be inferred. <code>--precision</code> <code>TEXT</code> <code>auto</code> Precision used when building the model from a HuggingFace ID. One of <code>auto</code>, <code>fp32</code>, <code>fp16</code>, <code>int8</code>, <code>int16</code>, or a mixed <code>w{x}a{y}</code> spec (e.g., <code>w8a16</code>). <code>fp16</code>/<code>fp32</code> skip quantization. Ignored when <code>-m</code> is a pre-built <code>.onnx</code> file \u2014 the precision is already baked in. <code>--device</code> choice <code>auto</code> Target device. Choices: <code>auto</code>, <code>npu</code>, <code>gpu</code>, <code>cpu</code>. <code>auto</code> selects the best available device. Combined with <code>--precision</code>, this drives the build when <code>-m</code> is a HuggingFace ID. <code>--ep</code> / <code>--execution-provider</code> <code>TEXT</code> \u2014 Target ONNX Runtime execution provider when finer control than <code>--device</code> is needed. Full names (e.g., <code>QNNExecutionProvider</code>, <code>OpenVINOExecutionProvider</code>, <code>VitisAIExecutionProvider</code>) and aliases (<code>qnn</code>, <code>ov</code>/<code>openvino</code>, <code>vitis</code>/<code>vitisai</code>) are accepted. <code>--dataset</code> <code>TEXT</code> task default HuggingFace dataset path (e.g., <code>imagenet-1k</code>, <code>nyu-mll/glue</code>). If omitted, a default dataset is selected based on the task. <code>--dataset-name</code> <code>TEXT</code> \u2014 Dataset configuration name for multi-config datasets. <code>--dataset-revision</code> <code>TEXT</code> \u2014 Git revision (branch, tag, or commit) of the dataset to load. Use <code>refs/convert/parquet</code> for HF datasets that are only served via the parquet mirror. <code>--dataset-script</code> <code>TEXT</code> \u2014 Path to a Python script that builds the evaluation dataset locally. Requires <code>--trust-remote-code</code>. <code>--trust-remote-code / --no-trust-remote-code</code> flag <code>false</code> Allow executing custom code from model repositories or dataset scripts. Required with <code>--dataset-script</code>. Use only with trusted sources. <code>--samples</code> <code>INTEGER</code> <code>100</code> Number of dataset samples to evaluate. <code>--split</code> <code>TEXT</code> <code>validation</code> Dataset split to use (e.g., <code>validation</code>, <code>test</code>, <code>train</code>). <code>--shuffle / --no-shuffle</code> flag <code>shuffle</code> Shuffle the dataset before sampling. Disable with <code>--no-shuffle</code> for reproducible sample ordering. <code>--streaming / --no-streaming</code> flag <code>false</code> Stream the dataset from the Hub instead of downloading the full split. Useful for large datasets. <code>--column</code> <code>TEXT</code> (multiple) \u2014 Column mapping as <code>key=value</code> pairs (e.g., <code>--column input_column=image</code>). Can be specified multiple times. <code>--label-mapping</code> <code>PATH</code> \u2014 Path to a JSON file mapping dataset label names to the integer class IDs the model emits: <code>{\"label_name\": id}</code>. <code>--output</code> <code>-o</code> <code>PATH</code> \u2014 Output JSON file path for the evaluation results. <code>--schema</code> flag <code>false</code> Print the expected dataset schema for the given <code>--task</code> and exit. Does not run evaluation. <code>--mode</code> <code>onnx\\|compare</code> <code>onnx</code> Evaluation mode. <code>onnx</code> evaluates the ONNX candidate on a dataset. <code>compare</code> runs the ONNX candidate and the HuggingFace reference on identical random inputs and reports per-tensor similarity metrics \u2014 no dataset required."},{"location":"commands/eval/#how-it-works","title":"How it works","text":"<p><code>winml eval</code> loads the model and runs the evaluation pipeline via the internal <code>evaluate</code> function (supporting both HuggingFace IDs and local ONNX files), then pulls the requested number of samples from a HuggingFace dataset. Each sample is preprocessed using the tokenizer or image processor associated with the model ID, passed through the ONNX Runtime session, and the output is compared against the ground-truth label. Aggregated metrics (accuracy, F1, etc.) are printed to the console and optionally written to a JSON file. When <code>-m</code> is an ONNX file, <code>--model-id</code> must be provided so the command knows which preprocessor and label vocabulary to use.</p>"},{"location":"commands/eval/#examples","title":"Examples","text":"<p>Evaluate a HuggingFace model using the task-default dataset:</p> <pre><code>$ winml eval -m microsoft/resnet-50\n</code></pre> <pre><code>Task:     image-classification\nDataset:  timm/mini-imagenet (test, 100 samples)\nDevice:   auto\n\nAccuracy: 76.00%\n\nResults saved to: microsoft_resnet-50_eval.json\n</code></pre> <p>Evaluate a pre-exported ONNX file, providing the source model ID for preprocessing:</p> <pre><code>$ winml eval -m model.onnx --model-id microsoft/resnet-50 --dataset timm/mini-imagenet\n</code></pre> <p>Evaluate a BERT model on the MRPC paraphrase task with column remapping:</p> <pre><code>$ winml eval -m Intel/bert-base-uncased-mrpc --dataset nyu-mll/glue --dataset-name mrpc --column input_column=sentence1 --column second_input_column=sentence2 --samples 500\n</code></pre> <p>Check what dataset columns are expected before running, then remap them to match your dataset:</p> <pre><code>$ winml eval --schema --task text-classification\n</code></pre> <pre><code>Input schema for text-classification models\n==================================================\n\n--column option schema\n\nEvaluating needs a dataset with the following columns:\n  input_column\n      input text (default: text)\n  label_column\n      class label (ClassLabel or integer) (default: label)\n  second_input_column\n      second text for sentence-pair tasks (optional) (default: None)\n\nOverride any default with --column:\n  --column input_column=&lt;your_text_column&gt;\n  --column label_column=&lt;your_label_column&gt;\n  --column second_input_column=&lt;your_pair_column&gt;\n</code></pre> <p>The GLUE SST-2 dataset uses <code>sentence</code> instead of the default <code>text</code> column, so remap it with a single <code>--column</code> override:</p> <pre><code>$ winml eval -m distilbert/distilbert-base-uncased-finetuned-sst-2-english --dataset nyu-mll/glue --dataset-name sst2 --column input_column=sentence --samples 500\n</code></pre> <p>Evaluate against a custom dataset whose label names differ from the model's class IDs. The <code>--label-mapping</code> flag points to a JSON file whose keys are the label name strings as they appear in the dataset and whose values are the integer class IDs the model emits. For example, ResNet-50 outputs ImageNet-1k class IDs (<code>0</code>\u2013<code>999</code>), so if your custom dataset uses readable strings like <code>\"tabby cat\"</code> or <code>\"golden retriever\"</code>, <code>labels.json</code> translates each dataset label to the corresponding ImageNet ID the model predicts:</p> <pre><code>{\n  \"tabby cat\": 281,\n  \"Egyptian cat\": 285,\n  \"golden retriever\": 207\n}\n</code></pre> <pre><code>$ winml eval -m microsoft/resnet-50 --dataset my-org/my-pets-dataset --label-mapping labels.json -o results/resnet_eval.json\n</code></pre> <p>Evaluate a composite model from pre-exported ONNX files. Some tasks (e.g., <code>image-to-text</code>, encoder-decoder, dual-encoder) split the model across multiple ONNX files, one per role. Pass <code>-m</code> once per role as <code>&lt;role&gt;=&lt;path&gt;.onnx</code> and supply <code>--model-id</code> so the preprocessor and tokenizer can be resolved. Run <code>winml eval --schema --task image-to-text</code> to see the expected roles for a task:</p> <pre><code>$ winml eval -m encoder=encoder.onnx -m decoder=decoder.onnx --model-id microsoft/trocr-base-printed\n</code></pre>"},{"location":"commands/eval/#common-pitfalls","title":"Common pitfalls","text":"<ul> <li>ONNX file without <code>--model-id</code> fails. When <code>-m</code> is a <code>.onnx</code> path, <code>--model-id</code> is mandatory. Without it the command cannot resolve the preprocessor or label vocabulary and will exit with a usage error.</li> <li>The task-default dataset may not match every model. A default dataset cannot fit every model. Classification and detection models in particular need a dataset whose label space and domain match what the model was trained on \u2014 using the default may produce misleadingly low scores, missing-label errors, or a dataset-schema error. Always pass <code>--dataset</code> (and <code>--label-mapping</code> if needed) when evaluating a model whose label space or domain differs from the task default.</li> <li>Some dataset requires Hub credentials for gated datasets. Some datasets (e.g., <code>imagenet-1k</code>) require a HuggingFace account with accepted terms of use. Log in with <code>huggingface-cli login</code> before running eval on gated data.</li> <li><code>--shuffle</code> is on by default. The random 100-sample slice changes between runs unless you pass <code>--no-shuffle</code>. Use <code>--no-shuffle</code> when comparing two model variants to ensure they see identical samples.</li> <li><code>--streaming</code> skips the local cache. Streaming mode avoids downloading the full split but prevents random shuffling on large datasets. For reproducible evaluation, download the split once and omit <code>--streaming</code>.</li> <li>Column names vary across datasets. If the evaluator raises a missing-column error, run <code>winml eval --schema --task &lt;task&gt;</code> to inspect the expected schema and use <code>--column</code> to remap dataset field names to the expected names.</li> </ul>"},{"location":"commands/eval/#see-also","title":"See also","text":"<ul> <li>winml perf \u2014 measure latency and throughput on the same model</li> <li>winml build \u2014 produce the quantized artifact to evaluate</li> <li>Quantization &amp; QDQ \u2014 why accuracy validation after quantization matters</li> <li>ONNX &amp; Execution Providers \u2014 understand the <code>--device</code> option</li> </ul>"},{"location":"commands/export/","title":"winml export","text":"<p>Convert a PyTorch / Hugging Face model to ONNX, preserving module hierarchy.</p>"},{"location":"commands/export/#when-to-use-this","title":"When to use this","text":"<p>Use <code>winml export</code> when you have a Hugging Face model ID or a local PyTorch checkpoint and need an ONNX file as the first step of the optimization pipeline. This is the entry point before <code>winml quantize</code> or <code>winml compile</code>.</p>"},{"location":"commands/export/#synopsis","title":"Synopsis","text":"<pre><code>$ winml export [options]\n</code></pre>"},{"location":"commands/export/#flags","title":"Flags","text":"Flag Short Type Default Description <code>--model</code> <code>-m</code> string (required) Hugging Face model name or local path (e.g., <code>prajjwal1/bert-tiny</code>). <code>--output</code> <code>-o</code> path (required) Output ONNX file path (e.g., <code>model.onnx</code>). <code>--with-report/--no-with-report</code> flag <code>false</code> Generate full export reports: Markdown, JSON, and a console tree. <code>--hierarchy/--no-hierarchy</code> flag <code>true</code> Preserve <code>hierarchy_tag</code> metadata in ONNX nodes (use <code>--no-hierarchy</code> for a clean ONNX file). <code>--dynamo/--no-dynamo</code> flag <code>false</code> Enable PyTorch 2.9+ dynamo export for richer node metadata. (Experimental \u2014 currently logs a warning.) <code>--torch-module</code> string <code>None</code> Comma-separated list of <code>torch.nn</code> module types to include in hierarchy (e.g., <code>LayerNorm,Embedding</code>). (Experimental \u2014 currently logs a warning.) <code>--input-specs</code> path <code>None</code> JSON file with explicit input tensor specifications. Auto-generated when omitted. <code>--task</code> <code>-t</code> string <code>None</code> Override auto-detected Hugging Face task (e.g., <code>image-feature-extraction</code>). <code>--export-config</code> path <code>None</code> JSON file with ONNX export parameters such as <code>opset_version</code> and <code>do_constant_folding</code>. <code>--shape-config</code> path <code>None</code> JSON object mapping symbolic dimension names to concrete sizes (e.g., <code>{\"sequence_length\": 2048}</code>). Ignored when <code>--input-specs</code> is provided. <code>--trust-remote-code/--no-trust-remote-code</code> flag <code>false</code> Allow executing custom code from model repositories during export. Use only with trusted sources. <code>--allow-unsupported-nodes/--no-allow-unsupported-nodes</code> flag <code>false</code> Allow unsupported nodes to remain in the exported graph instead of failing export. <code>--help</code> <code>-h</code> flag Show this message and exit."},{"location":"commands/export/#how-it-works","title":"How it works","text":"<p><code>winml export</code> loads the model via Hugging Face <code>transformers</code>, then runs the eight-step Hierarchy-preserving Tags Protocol (HTP): model preparation, input generation, module-hierarchy tracing, TorchScript ONNX export, node-tagger creation, per-node tagging, tag injection into ONNX <code>metadata_props</code>, and optional report generation. The hierarchy metadata allows downstream tools to reason about operators grouped by their originating module rather than flat graph position. When <code>--no-hierarchy</code> is specified, hierarchy steps are bypassed and a bare ONNX file is written, useful for third-party tools that do not understand custom metadata.</p>"},{"location":"commands/export/#examples","title":"Examples","text":"<pre><code># Minimal export: Hugging Face model ID to ONNX file\nwinml export -m microsoft/resnet-50 -o resnet50.onnx\n</code></pre> <pre><code>Model: microsoft/resnet-50\nOutput: resnet50.onnx\n\nStarting HTP export...\n  Detected task: image-classification\n\nSuccess! Model exported to: resnet50.onnx\n</code></pre> <pre><code># Export with verbose output and full Markdown + JSON reports\nwinml export -m facebook/convnext-tiny-224 -o convnext.onnx -v --with-report\n</code></pre> <pre><code># Export a BERT model, overriding input shapes for longer sequences\nwinml export -m bert-base-uncased -o bert.onnx \\\n  --shape-config shape.json\n# shape.json: {\"sequence_length\": 512}\n</code></pre> <pre><code># Export with a hand-crafted input-spec file (skips auto-detection)\nwinml export -m bert-base-uncased -o bert.onnx --input-specs inputs.json\n</code></pre> <pre><code># Produce clean ONNX without hierarchy metadata (for third-party optimizers)\nwinml export -m microsoft/resnet-50 -o resnet50_clean.onnx --no-hierarchy\n</code></pre>"},{"location":"commands/export/#see-also","title":"See also","text":"<ul> <li>winml optimize \u2014 the next pipeline stage after export</li> <li>Supported Models \u2014 full list of validated architectures</li> <li>Load and export concept \u2014 details on the export process</li> </ul>"},{"location":"commands/export/#common-pitfalls","title":"Common pitfalls","text":"<ul> <li>Task detection fails on unusual model IDs. If auto-detection picks the   wrong task (or fails entirely), pass <code>-t</code> with the correct task string, for   example <code>-t image-feature-extraction</code>.</li> <li><code>--shape-config</code> is silently ignored when <code>--input-specs</code> is set. <code>--input-specs</code> takes full priority; remove it if you only want to override   individual dimensions.</li> <li><code>--dynamo</code> and <code>--torch-module</code> are experimental. Both flags emit a   warning and have no effect in the current release. Do not rely on them in   automated pipelines yet.</li> <li>Output directory must be writable. The command creates parent directories   automatically, but will fail with a permission error on read-only paths.</li> <li>Model weights are downloaded to the Hugging Face cache. Set <code>HF_HOME</code> or   <code>HF_HUB_CACHE</code> to control the download location.</li> </ul>"},{"location":"commands/export/#see-also_1","title":"See also","text":"<ul> <li>winml quantize</li> <li>winml compile</li> <li>winml build</li> <li>Load and export concept</li> </ul>"},{"location":"commands/inspect/","title":"winml inspect","text":"<p>Inspect a model's tasks, classes, and hierarchy before committing to an export.</p>"},{"location":"commands/inspect/#when-to-use-this","title":"When to use this","text":"<p>Use <code>winml inspect</code> to understand how winml-cli will treat a HuggingFace model before running <code>winml export</code> or <code>winml build</code>. It answers questions like \"which task will be auto-detected?\", \"which HF model class will be loaded?\", and \"does this model have a supported exporter?\" without downloading weights or writing any files.</p>"},{"location":"commands/inspect/#synopsis","title":"Synopsis","text":"<pre><code>$ winml inspect -m &lt;model_id&gt; [options]\n</code></pre>"},{"location":"commands/inspect/#flags","title":"Flags","text":"Flag Short Type Default Description <code>--model</code> <code>-m</code> string required HuggingFace model ID (e.g. <code>openai/clip-vit-base-patch32</code>). Required unless <code>--list-tasks</code> or <code>--help</code> is used. <code>--format</code> <code>-f</code> <code>table</code> | <code>json</code> <code>table</code> Output format. <code>table</code> renders rich panels; <code>json</code> emits a machine-readable object. <code>--task</code> <code>-t</code> string <code>null</code> Override the auto-detected task (e.g. <code>image-classification</code>, <code>feature-extraction</code>). <code>--hierarchy/--no-hierarchy</code> <code>-H</code> flag <code>false</code> Print the PyTorch module tree. Instantiates the model with random weights \u2014 no weight download required. <code>--verbose</code> <code>-v</code> flag <code>false</code> Show full configuration details. <code>--list-tasks</code> flag <code>false</code> List all known tasks and exit. Does not require <code>--model</code>. <code>--model-type</code> string <code>null</code> Override model type (e.g. <code>bert</code>, <code>resnet</code>). Can be used without <code>--model</code>. <code>--model-class</code> string <code>null</code> Override model class (e.g. <code>BertForMaskedLM</code>). Can be used without <code>--model</code>. <code>--help</code> <code>-h</code> flag \u2014 Show help and exit. <p><code>winml inspect</code> does not accept <code>--device</code>, <code>--ep</code>, <code>--precision</code>, or <code>--output</code>. It is a read-only discovery command that does not produce any artifacts.</p>"},{"location":"commands/inspect/#how-it-works","title":"How it works","text":"<p><code>winml inspect</code> calls into the winml-cli registry to resolve the model ID against the known loader and exporter configurations. It fetches only the model's <code>config.json</code> from HuggingFace Hub (no weights), uses the architecture field to look up the matching HF model class and WinML inference class, and then renders the result. When <code>--hierarchy</code> is supplied, the model is instantiated locally with random weights using <code>AutoModel.from_config()</code>, and a forward-pass trace records the full PyTorch module tree. Because no real weights are downloaded, hierarchy inspection is fast even for large models.</p>"},{"location":"commands/inspect/#examples","title":"Examples","text":"<pre><code># Basic inspection \u2014 check task detection and loader/exporter classes\n$ winml inspect -m microsoft/resnet-50\n</code></pre> <pre><code>+--------------------------- microsoft/resnet-50 ---------------------------+\n| Task          image-classification                                         |\n| Model Class   ResNetForImageClassification                                 |\n| Exporter      OptimumExporter                                              |\n| WinML Class   WinMLImageClassificationModel                                |\n| Status        Supported                                                    |\n+---------------------------------------------------------------------------+\n</code></pre> <pre><code># JSON output \u2014 useful for scripting or CI pre-flight checks\n$ winml inspect -m bert-base-uncased --format json\n</code></pre> <pre><code># Override task when auto-detection picks the wrong one\n$ winml inspect -m bert-base-uncased --task feature-extraction\n</code></pre> <pre><code># Print the full PyTorch module hierarchy (no weight download)\n$ winml inspect -m openai/clip-vit-base-patch32 --hierarchy\n</code></pre> <pre><code># Combine verbose logging with hierarchy for deep diagnostics\n$ winml inspect -m facebook/convnext-tiny-224 -v -H\n</code></pre>"},{"location":"commands/inspect/#common-pitfalls","title":"Common pitfalls","text":"<ul> <li><code>--model</code> is required for model inspection. The flag is marked required for model-specific lookups; omitting it returns an error. The only exception is <code>--list-tasks</code>, which lists all known tasks and exits without needing a model.</li> <li>Hierarchy requires a locally installable model config. If the model config   references a custom architecture not in the local <code>transformers</code> installation,   <code>--hierarchy</code> will fail with an import error. Update <code>transformers</code> or omit the flag.</li> <li>Task override affects all output. Passing <code>--task</code> changes which exporter and   WinML class are reported, not just the task field. If the override is incompatible   with the model architecture, the status will show as unsupported.</li> <li><code>--format json</code> is silent on unsupported models. When the model is not found in   the winml-cli registry, the command raises a <code>ClickException</code>. Wrap the call in   <code>winml inspect ... &amp;&amp; ...</code> or check the exit code when scripting.</li> <li>No weight download does not mean no network access. The <code>config.json</code> is always   fetched from HuggingFace Hub. Set <code>HF_HUB_OFFLINE=1</code> if you need fully offline   inspection of a locally cached model.</li> </ul>"},{"location":"commands/inspect/#see-also","title":"See also","text":"<ul> <li>catalog.md \u2014 browse the curated catalog and check accuracy verdicts before   inspecting</li> <li>Supported Models \u2014 full list of validated model architectures</li> <li>Load and export concept \u2014 how <code>winml.hierarchy.tag</code>   metadata is written and what you can do with the module tree</li> <li>How winml-cli Works \u2014 pipeline overview showing where   inspect fits before export</li> <li>ONNX &amp; Execution Providers \u2014 background on loaders,   exporters, and EP-specific configurations</li> </ul>"},{"location":"commands/optimize/","title":"winml optimize","text":"<p>Apply graph optimizations and fusions to an ONNX model to reduce node count and improve inference speed.</p>"},{"location":"commands/optimize/#when-to-use-this","title":"When to use this","text":"<p>Use <code>winml optimize</code> after exporting an ONNX model and before quantization or compilation. Graph fusions reduce operator count, improve memory locality, and can make downstream quantization more accurate by presenting cleaner subgraphs to the calibration pass. It is also useful as a standalone step when you want to optimize a pre-exported ONNX file without running the full build pipeline.</p>"},{"location":"commands/optimize/#synopsis","title":"Synopsis","text":"<pre><code>$ winml optimize [options]\n</code></pre>"},{"location":"commands/optimize/#flags","title":"Flags","text":"Flag Short Type Default Description <code>--model</code> <code>-m</code> <code>PATH</code> (required unless listing) Input ONNX model file. Not required when <code>--list-capabilities</code> or <code>--list-rewrites</code> is used. <code>--output</code> <code>-o</code> <code>PATH</code> <code>{input}_opt.onnx</code> Output path for the optimized model. Defaults to the input filename with <code>_opt</code> inserted before the extension. <code>--config</code> <code>-c</code> <code>PATH</code> (none) YAML or JSON configuration file. Fields in the file override capability defaults; CLI flags override the file. <code>--verbose</code> <code>-v</code> flag off Enable verbose output. <code>--list-capabilities</code> <code>-l</code> flag off Print all registered optimization capabilities grouped by category and exit. Add <code>--verbose</code> for descriptions and ORT names. <code>--list-rewrites</code> flag off Print all available pattern-rewrite families with their source-to-target mappings and exit. (dynamic) flag (per capability) Each registered capability generates a <code>--enable-&lt;name&gt;</code> / <code>--disable-&lt;name&gt;</code> pair. Run <code>--list-capabilities</code> to see the full current list. Examples: <code>--enable-gelu-fusion</code>, <code>--disable-constant-folding</code>. Pattern-rewrite flags follow the form <code>--enable-&lt;source-slug&gt;-&lt;target-slug&gt;</code>; run <code>--list-rewrites</code> to discover all names."},{"location":"commands/optimize/#configuration-precedence","title":"Configuration precedence","text":"<p>When multiple sources are provided, settings are resolved in this order (highest wins):</p> <ol> <li>Explicit CLI flags (<code>--enable-X</code> / <code>--disable-X</code>)</li> <li>Config file (<code>-c</code>)</li> <li>Capability defaults</li> </ol>"},{"location":"commands/optimize/#how-it-works","title":"How it works","text":"<p><code>winml optimize</code> loads the ONNX model, builds a final capability configuration by merging capability defaults, an optional config file, and any explicit CLI flags, then runs all enabled passes through the <code>Optimizer</code>. Each capability maps to a named optimization or fusion pipe in the <code>winml.modelkit.optim</code> registry. The capability flags are auto-generated at startup from that registry \u2014 adding a new optimization to the registry automatically makes it available as a CLI flag without any change to this command's source. After optimization, the command prints the before-and-after node count and percentage reduction so you can quantify the effect.</p>"},{"location":"commands/optimize/#examples","title":"Examples","text":"<p>Optimize a model with all capability defaults:</p> <pre><code>$ winml optimize -m microsoft/resnet-50.onnx\n</code></pre> <pre><code>Input:  microsoft/resnet-50.onnx\nOutput: microsoft/resnet-50_opt.onnx\n\nLoading model...\nRunning optimizer...\nSaving optimized model...\n\nSuccess! Model optimized: microsoft/resnet-50_opt.onnx\nNodes: 312 -&gt; 289 (7.4% reduction)\n</code></pre> <p>Enable specific fusions for a BERT model:</p> <pre><code>$ winml optimize -m bert-base-uncased.onnx \\\n    --enable-layer-norm-fusion \\\n    --enable-attention-fusion \\\n    -o bert_layernorm_attn.onnx\n</code></pre> <p>Use a config file to set capabilities and save the result for downstream compilation:</p> <pre><code>$ winml optimize -m facebook/convnext-tiny-224.onnx \\\n    -c optimize_config.yaml \\\n    -o convnext_opt.onnx\n</code></pre> <p>List all available optimization capabilities:</p> <pre><code>$ winml optimize --list-capabilities\n</code></pre> <p>Discover pattern-rewrite families and their flag names:</p> <pre><code>$ winml optimize --list-rewrites\n</code></pre>"},{"location":"commands/optimize/#common-pitfalls","title":"Common pitfalls","text":"<ul> <li><code>--model</code> is required for actual optimization \u2014 it can be omitted only when using <code>--list-capabilities</code> or <code>--list-rewrites</code>. Missing <code>--model</code> in any other case raises a usage error.</li> <li>Config file and CLI flags interact via precedence \u2014 a <code>--disable-X</code> CLI flag always wins over a config file value that enables the same capability, but omitting the flag leaves the config file value in effect. To turn off a capability set by a config file, pass the explicit <code>--disable-X</code> flag.</li> <li>Config file validation errors abort the run \u2014 if the config file contains keys that fail capability validation or dependency checks, the command prints all errors and exits with code 1 without touching the model. Fix the config before retrying.</li> <li>The dynamic flag list changes between releases \u2014 new capabilities are added as the optimizer registry grows. Always use <code>--list-capabilities</code> to confirm the current set of flags rather than relying on a cached list.</li> <li>Output path default may overwrite a sibling file \u2014 if you run optimize twice on the same input without specifying <code>-o</code>, the second run silently overwrites <code>{input}_opt.onnx</code>. Specify an explicit output path in scripts.</li> </ul>"},{"location":"commands/optimize/#see-also","title":"See also","text":"<ul> <li>how-it-works.md \u2014 where optimization fits in the full winml-cli pipeline</li> <li>export.md \u2014 produce an ONNX file to optimize from a HuggingFace model</li> <li>quantize.md \u2014 quantize the optimized model for lower-precision inference</li> <li>config.md \u2014 generate a <code>WinMLBuildConfig</code> that includes optimization settings</li> </ul>"},{"location":"commands/overview/","title":"Commands","text":"<p>winml-cli exposes a CLI named <code>winml</code> with 12 subcommands covering the full journey from model discovery to a deployment-ready artifact. Every subcommand shares a consistent invocation style \u2014 <code>winml &lt;command&gt; [flags]</code> \u2014 and the same global flags are available on the root <code>winml</code> group.</p> <p>The commands group by user intent. Discover (<code>sys</code>, <code>inspect</code>, <code>catalog</code>, <code>analyze</code>) helps you understand your hardware and model before writing any artifacts. Configure (<code>config</code>, <code>optimize</code>) produces a reusable build configuration and tunes the ONNX graph. Build (<code>export</code>, <code>quantize</code>, <code>compile</code>, <code>build</code>) runs the pipeline stages that produce deployment artifacts. Measure (<code>perf</code>, <code>eval</code>) benchmarks and validates the result.</p> <p>The typical workflow follows that order: run <code>winml sys</code> to confirm hardware and EPs, then <code>winml inspect</code> or <code>winml catalog</code> to verify model support. Use <code>winml config</code> to generate a build configuration, then <code>winml build</code> to execute the full pipeline \u2014 or chain <code>export</code> \u2192 <code>analyze</code> \u2192 <code>optimize</code> \u2192 <code>quantize</code> \u2192 <code>compile</code> individually for finer control. Close with <code>winml perf</code> and <code>winml eval</code> to measure speed and accuracy.</p>"},{"location":"commands/overview/#command-map","title":"Command map","text":"Command Group Purpose <code>sys</code> Discover Inspect your machine \u2014 devices, EPs, and runtime versions at a glance. <code>inspect</code> Discover Inspect a model's tasks, classes, and hierarchy before committing to an export. <code>catalog</code> Discover Browse the curated winml-cli catalog of validated models and benchmarks. <code>config</code> Configure Generate a reusable build configuration for a Hugging Face model or ONNX file. <code>export</code> Build Convert a PyTorch / Hugging Face model to ONNX, preserving module hierarchy. <code>analyze</code> Build Verify an ONNX model is compatible with a target execution provider before deployment. <code>optimize</code> Build Apply graph optimizations and fusions to an ONNX model to reduce node count and improve inference speed. <code>quantize</code> Build Quantize an ONNX model with QDQ insertion and calibration-based scaling. <code>compile</code> Build Compile an ONNX model to an EP-specific format for fast runtime loading. <code>build</code> Build Run the entire winml-cli pipeline (export \u2192 optimize \u2192 quantize \u2192 compile) in one command. <code>perf</code> Measure Benchmark an ONNX model's latency and throughput on a target device. <code>eval</code> Measure Evaluate ONNX model accuracy on a standard dataset."},{"location":"commands/overview/#choosing-a-command","title":"Choosing a command","text":"<ul> <li>I want to see what hardware and EPs I have \u2192 <code>winml sys</code></li> <li>I want to know if my model is supported \u2192 <code>winml inspect</code></li> <li>I want to browse validated models with known benchmarks \u2192 <code>winml catalog</code></li> <li>I want to verify EP operator compatibility before compiling \u2192 <code>winml analyze</code></li> <li>I want to convert a Hugging Face model to ONNX \u2192 <code>winml export</code></li> <li>I want to run the whole pipeline in one go \u2192 <code>winml build</code></li> <li>I want to benchmark latency and throughput \u2192 <code>winml perf</code></li> <li>I want to measure model accuracy \u2192 <code>winml eval</code></li> </ul>"},{"location":"commands/overview/#global-flags","title":"Global flags","text":"<p><code>-v</code> / <code>--verbose</code>, <code>-q</code> / <code>--quiet</code>, <code>--version</code>, and <code>-h</code> / <code>--help</code> live on the root <code>winml</code> group only. Subcommands access them through <code>ctx.obj</code> and do not redefine them. See <code>src/winml/modelkit/cli.py</code> for the canonical contract.</p>"},{"location":"commands/overview/#shared-flags","title":"Shared flags","text":"<p>Several flags share semantics across the commands that accept them: <code>-m</code> / <code>--model</code>, <code>-d</code> / <code>--device</code>, <code>--ep</code>, <code>-o</code> / <code>--output</code>, <code>-t</code> / <code>--task</code>, and <code>--precision</code>. Defaults and accepted values can differ per command (e.g., <code>-p</code> is a short form for <code>--precision</code> only on <code>config</code> and <code>quantize</code>); check the Flags section of each command page rather than assuming they transfer.</p>"},{"location":"commands/overview/#see-also","title":"See also","text":"<ul> <li>How winml-cli Works \u2014 end-to-end pipeline overview</li> <li>Config and build \u2014 structure of <code>WinMLBuildConfig</code> and how stages interact</li> <li>ONNX &amp; Execution Providers \u2014 background on EPs and how <code>--device</code> / <code>--ep</code> interact</li> <li>winml build \u2014 the single command that runs the entire pipeline</li> </ul>"},{"location":"commands/perf/","title":"winml perf","text":"<p>Benchmark an ONNX model's latency and throughput on a target device.</p>"},{"location":"commands/perf/#when-to-use-this","title":"When to use this","text":"<p>Use <code>winml perf</code> when you want a quantitative latency and throughput baseline for a model on a specific device, or when you need to compare the performance impact of different precision settings, execution providers, or batch sizes.</p>"},{"location":"commands/perf/#synopsis","title":"Synopsis","text":"<pre><code>$ winml perf [options]\n</code></pre>"},{"location":"commands/perf/#flags","title":"Flags","text":"Flag Short Type Default Description <code>--model</code> <code>-m</code> <code>TEXT</code> \u2014 HuggingFace model ID or path to a local <code>.onnx</code> file. Required. <code>--task</code> <code>TEXT</code> auto-detected Explicit task override (e.g., <code>image-classification</code>). Inferred from the model if omitted. <code>--iterations</code> <code>INTEGER</code> <code>100</code> Number of timed inference iterations used to compute statistics. <code>--warmup</code> <code>INTEGER</code> <code>10</code> Number of warm-up iterations run before timing begins; excluded from statistics. <code>--device</code> <code>-d</code> <code>auto\\|cpu\\|gpu\\|npu</code> <code>auto</code> Device to run the benchmark on. <code>auto</code> selects the highest-priority available device. <code>--precision</code> <code>TEXT</code> <code>auto</code> Precision mode applied during model build: <code>auto</code>, <code>fp32</code>, <code>fp16</code>, <code>int8</code>, <code>int16</code>, or compound forms such as <code>w8a16</code>. <code>--ep</code> <code>TEXT</code> \u2014 Force a specific execution provider (e.g., <code>qnn</code>, <code>dml</code>, <code>vitisai</code>, <code>openvino</code>, <code>cpu</code>). Overrides the device-to-provider mapping. <code>--ep-options</code> <code>KEY=VALUE</code> (multiple) \u2014 Runtime EP provider option forwarded to the inference session (e.g., <code>--ep-options htp_performance_mode=burst</code>). Repeatable. Applies to both HuggingFace model IDs and ONNX file inputs. Unlike build-time options set via <code>--config</code>, these tune the runtime session, not the compiled graph. <code>--output</code> <code>-o</code> <code>PATH</code> <code>~/.cache/winml/perf/&lt;slug&gt;/&lt;timestamp&gt;.json</code> Output JSON file path for the benchmark report. <code>--batch-size</code> <code>INTEGER</code> <code>1</code> Batch size used when generating synthetic input tensors. <code>--shape-config</code> <code>PATH</code> \u2014 Path to a JSON file containing shape overrides (e.g., <code>{\"height\": 480, \"width\": 480}</code>). Ignored for pre-exported ONNX files and in <code>--module</code> mode. <code>--quantize/--no-quantize</code> flag <code>true</code> Run quantization during model build (use <code>--no-quantize</code> to skip it). Useful for measuring the fp32 baseline. <code>--rebuild/--no-rebuild</code> flag <code>false</code> Force model rebuild even if a cached artifact already exists. <code>--ignore-cache/--no-ignore-cache</code> flag <code>false</code> Build from scratch in a temporary folder and discard the artifact after benchmarking. Implies <code>--rebuild</code>. <code>--module</code> <code>TEXT</code> \u2014 PyTorch module class name for per-module benchmarking (e.g., <code>BertAttention</code>). Builds and times each matching instance separately. See Load and export. <code>--monitor/--no-monitor</code> flag <code>false</code> Show a live NPU/CPU utilization chart while the benchmark runs and include hardware metrics in the JSON report."},{"location":"commands/perf/#how-it-works","title":"How it works","text":"<p><code>winml perf</code> loads the model through <code>WinMLAutoModel</code> \u2014 accepting both HuggingFace IDs and local ONNX files \u2014 then generates random input tensors from the model's I/O configuration. It runs the specified number of warm-up iterations (excluded from statistics) followed by the timed iterations, collecting per-sample latency. The final report includes mean, min, max, P50, P90, P95, P99, standard deviation, and throughput in samples per second. When <code>--monitor</code> is active, a hardware polling loop runs in parallel and records NPU / GPU utilization, CPU usage, and device memory alongside the timing data.</p>"},{"location":"commands/perf/#examples","title":"Examples","text":"<p>Basic benchmark on the best available device:</p> <pre><code>$ winml perf -m microsoft/resnet-50\n</code></pre> <pre><code>Device:      npu\nPrecision:   auto\nTask:        image-classification\nIterations:  100 (+ 10 warmup)\nBatch Size:  1\n\nLatency (ms)\n  Avg    P50    P90    P95    P99    Min    Max    Std\n 2.14   2.11   2.38   2.51   2.79   1.97   3.04   0.12\n\nThroughput: 467.29 samples/sec\n\nResults saved to: ~/.cache/winml/perf/microsoft_resnet-50/2026-05-27T120000.json\n</code></pre> <p>Benchmark a pre-exported ONNX file on CPU with more iterations:</p> <pre><code>$ winml perf -m model.onnx --device cpu --iterations 500\n</code></pre> <p>Benchmark a text model with an explicit task, targeting the NPU:</p> <pre><code>$ winml perf -m bert-base-uncased --task text-classification --device npu --precision w8a16\n</code></pre> <p>Benchmark with live hardware monitoring enabled:</p> <pre><code>$ winml perf -m microsoft/resnet-50 --device npu --monitor\n</code></pre> <p>Pass runtime EP provider options to tune the session (repeatable):</p> <pre><code>$ winml perf -m model.onnx --device npu \\\n    --ep-options htp_performance_mode=burst \\\n    --ep-options htp_graph_finalization_optimization_mode=3\n</code></pre> <p>Per-module benchmarking to find latency hot-spots across all attention blocks:</p> <pre><code>$ winml perf -m bert-base-uncased --module BertAttention --iterations 200\n</code></pre>"},{"location":"commands/perf/#common-pitfalls","title":"Common pitfalls","text":"<ul> <li>Warm-up too low on NPU. The first several inferences on an NPU EP can be significantly slower due to kernel compilation and caching. The default of 10 warm-up iterations is usually enough for vision models, but transformer models with many operators may need <code>--warmup 30</code> or higher to reach steady-state latency.</li> <li><code>--shape-config</code> is silently ignored in two cases. It has no effect on pre-exported ONNX files (shapes are baked into the graph) and is ignored in <code>--module</code> mode. The command prints a warning in both situations.</li> <li>Random inputs do not represent real data distributions. Latency numbers are accurate, but memory access patterns may differ from production because the generated tensors are uniform random values. For memory-bandwidth-sensitive models this can understate real-world latency.</li> <li>Cross-device comparison. To compare performance across devices, run <code>winml perf</code> separately with different <code>--device</code> values and compare the resulting JSON reports.</li> </ul>"},{"location":"commands/perf/#see-also","title":"See also","text":"<ul> <li>winml eval \u2014 measure accuracy after benchmarking</li> <li>winml build \u2014 build the quantized artifact that <code>perf</code> benchmarks</li> <li>Load and export concept \u2014 how <code>--module</code> per-instance benchmarking works</li> <li>ONNX &amp; Execution Providers \u2014 understand <code>--device</code> vs <code>--ep</code></li> </ul>"},{"location":"commands/quantize/","title":"winml quantize","text":"<p>Quantize an ONNX model with QDQ insertion and calibration-based scaling.</p>"},{"location":"commands/quantize/#when-to-use-this","title":"When to use this","text":"<p>Use <code>winml quantize</code> after <code>winml export</code> to insert QuantizeLinear/DequantizeLinear (QDQ) node pairs into an ONNX graph. The resulting model is ready for <code>winml compile</code> targeting an NPU or other quantization-aware execution provider.</p>"},{"location":"commands/quantize/#synopsis","title":"Synopsis","text":"<pre><code>$ winml quantize [options]\n</code></pre>"},{"location":"commands/quantize/#flags","title":"Flags","text":"Flag Short Type Default Description <code>--model</code> <code>-m</code> path (required) Input ONNX model file. <code>--output</code> <code>-o</code> path <code>{input}_qdq.onnx</code> Output path for the quantized model. <code>--task</code> string \u2014 Task name (e.g., <code>image-classification</code>, <code>text-classification</code>) used to select a task-appropriate calibration dataset. Pair with <code>--model-name</code> so the dataset is preprocessed exactly the way the model expects. Without <code>--task</code>, calibration falls back to synthetic random data. <code>--model-name</code> string \u2014 HuggingFace model ID (e.g., <code>microsoft/resnet-50</code>) used to load the matching preprocessor/tokenizer for calibration. Only used when <code>--task</code> is provided. <code>--precision</code> <code>-p</code> string <code>None</code> Precision shorthand: <code>int8</code>, <code>int16</code>, or mixed-precision like <code>w8a16</code>. Overridden by explicit <code>--weight-type</code> / <code>--activation-type</code>. <code>--samples</code> integer <code>10</code> Number of calibration samples used to compute quantization ranges. <code>--method</code> choice <code>minmax</code> Calibration algorithm: <code>minmax</code>, <code>entropy</code>, or <code>percentile</code>. <code>--weight-type</code> choice \u2014 Per-tensor type for weights: <code>uint8</code>, <code>int8</code>, <code>uint16</code>, or <code>int16</code>. Overrides <code>--precision</code>. When unset, defaults to <code>uint8</code> (or the type implied by <code>--precision</code>). <code>--activation-type</code> choice \u2014 Per-tensor type for activations: <code>uint8</code>, <code>int8</code>, <code>uint16</code>, or <code>int16</code>. Overrides <code>--precision</code>. When unset, defaults to <code>uint8</code> (or the type implied by <code>--precision</code>). <code>--per-channel/--no-per-channel</code> flag <code>false</code> Apply per-channel (rather than per-tensor) quantization to weight tensors. <code>--symmetric/--no-symmetric</code> flag <code>false</code> Use symmetric quantization (zero-point fixed at 0). <code>--help</code> <code>-h</code> flag Show this message and exit."},{"location":"commands/quantize/#how-it-works","title":"How it works","text":"<p><code>winml quantize</code> applies static post-training quantization (PTQ) using the ONNX Runtime quantization API. Calibration passes collect activation range statistics, which are used to compute scale and zero-point values baked into <code>QuantizeLinear</code> / <code>DequantizeLinear</code> node pairs around each eligible operator. The <code>--method</code> flag controls range estimation: <code>minmax</code> uses global observed extremes, <code>entropy</code> minimizes KL-divergence, and <code>percentile</code> clips outliers. Precision can be set at a coarse level with <code>--precision</code> or tuned per tensor type with <code>--weight-type</code> and <code>--activation-type</code>; explicit type flags always override <code>--precision</code>.</p> <p>Calibration data is selected from <code>--task</code> and <code>--model-name</code>. For a supported task, a built-in default calibration dataset is loaded and preprocessed through the model's own tokenizer or image processor, so the calibration tensors match what the model will see at inference time. For an unsupported task \u2014 or when <code>--task</code> is omitted entirely \u2014 calibration falls back to synthetic random data synthesized from the ONNX input specification. Random-data calibration is fast and always works, but the resulting scales are typically less accurate than dataset-driven calibration, so always provide <code>--task</code> and <code>--model-name</code> when the model task is supported.</p>"},{"location":"commands/quantize/#examples","title":"Examples","text":"<pre><code># Minimal quantization: defaults (10 samples, uint8 weights and activations)\nwinml quantize -m resnet50.onnx\n</code></pre> <pre><code>Input: resnet50.onnx\nOutput: resnet50_qdq.onnx\nWeight type: uint8\nActivation type: uint8\nSamples: 10\nMethod: minmax\n\nRunning quantization...\n\nSuccess! Model quantized\nOutput: resnet50_qdq.onnx\nQDQ nodes inserted: 53\nTotal time: 4.31s\n</code></pre> <pre><code># Task-aware calibration: real samples preprocessed through the model's own image processor\nwinml quantize -m resnet50.onnx --task image-classification --model-name microsoft/resnet-50 --samples 128\n</code></pre> <pre><code># int8 precision shorthand (equivalent to --weight-type int8 --activation-type int8)\nwinml quantize -m resnet50.onnx -p int8\n</code></pre> <pre><code># Mixed-precision: int8 weights, uint16 activations with entropy calibration\nwinml quantize -m bert-base-uncased.onnx --weight-type int8 --activation-type uint16 --method entropy --samples 64\n</code></pre> <pre><code># Per-channel symmetric quantization to a specific output path\nwinml quantize -m facebook_convnext.onnx -o facebook_convnext_qdq.onnx --per-channel --symmetric --samples 32\n</code></pre> <pre><code># int16 precision (suitable for models sensitive to int8 accuracy loss)\nwinml quantize -m bert-base-uncased.onnx --precision int16\n</code></pre>"},{"location":"commands/quantize/#common-pitfalls","title":"Common pitfalls","text":"<ul> <li>Calibration uses synthetic random data by default. Without <code>--task</code> and <code>--model-name</code>, scales and zero-points are computed from random tensors synthesized from the ONNX input specification \u2014 the model never sees realistic activations, so accuracy after quantization can degrade noticeably. Always pass <code>--task</code> and <code>--model-name</code> for supported tasks (e.g., <code>--task image-classification --model-name microsoft/resnet-50</code>) so calibration runs on real samples preprocessed through the model's own tokenizer or image processor.</li> <li><code>--weight-type</code> / <code>--activation-type</code> silently override <code>--precision</code>. If you pass both, the explicit type flags win. Omit <code>--precision</code> when setting types explicitly to avoid confusion.</li> <li>Low sample counts can hurt accuracy. The default of 10 samples is sufficient for quick testing, but production models typically need 64\u2013256 representative samples for good calibration.</li> <li><code>--per-channel</code> increases model size. Per-channel quantization stores a separate scale and zero-point per output channel; this can noticeably inflate the model file size compared to per-tensor mode.</li> <li>Output defaults to <code>{stem}_qdq.onnx</code> in the same directory as input. Always pass <code>-o</code> when writing to a specific location to avoid accidentally overwriting or cluttering the source directory.</li> <li>Quantizing an already-quantized model (one containing QDQ nodes) is unsupported and will produce incorrect results. Use <code>winml compile --no-quant</code> instead if the model already contains QDQ nodes.</li> </ul>"},{"location":"commands/quantize/#see-also","title":"See also","text":"<ul> <li>winml export</li> <li>winml compile</li> <li>winml build</li> <li>Quantization concepts</li> </ul>"},{"location":"commands/sys/","title":"winml sys","text":"<p>Inspect your machine \u2014 devices, EPs, and runtime versions at a glance.</p>"},{"location":"commands/sys/#when-to-use-this","title":"When to use this","text":"<p>Run <code>winml sys</code> before starting any export or build workflow to confirm that the required ML libraries are installed and that the target hardware is visible. It is also the first command to run when diagnosing an unexpected export failure.</p>"},{"location":"commands/sys/#synopsis","title":"Synopsis","text":"<pre><code>$ winml sys [options]\n</code></pre>"},{"location":"commands/sys/#flags","title":"Flags","text":"Flag Short Type Default Description <code>--format</code> <code>-f</code> <code>text</code> | <code>json</code> | <code>compact</code> <code>text</code> Output format. <code>text</code> renders rich tables, <code>json</code> emits machine-readable JSON, <code>compact</code> prints a single-line summary. <code>--list-device</code> \u2014 flag <code>false</code> List available compute devices (NPU, GPU, CPU) in priority order instead of showing the full system report. <code>--list-ep</code> \u2014 flag <code>false</code> List available ONNX Runtime execution providers instead of showing the full system report. Can be combined with <code>--list-device</code>. <code>--verbose</code> <code>-v</code> flag <code>false</code> Surface additional diagnostic sections: backend availability and Export Readiness. <code>--help</code> <code>-h</code> flag \u2014 Show help and exit. <p><code>winml sys</code> takes no <code>--model</code>, <code>--device</code>, <code>--ep</code>, <code>--task</code>, or <code>--precision</code> arguments. It describes the host environment, not a specific model.</p>"},{"location":"commands/sys/#how-it-works","title":"How it works","text":"<p><code>winml sys</code> queries Python's <code>platform</code> and <code>importlib.metadata</code> modules to report library versions, then probes PyTorch for CUDA availability and GPU device names. Backend availability checks use the installed runtime environment, while device enumeration queries hardware directly in NPU &gt; GPU &gt; CPU priority order, and EP enumeration merges the WinML EP registry with ONNX Runtime's <code>get_available_providers()</code>. When <code>--format json</code> is used the full report \u2014 including devices and EPs \u2014 is emitted as a single JSON object, making it easy to capture in CI pipelines.</p>"},{"location":"commands/sys/#examples","title":"Examples","text":"<pre><code># Full human-readable system report\n$ winml sys\n</code></pre> <pre><code>+------------------------------------+\n|   winml-cli System Information     |\n+------------------------------------+\n\nEnvironment\n  Python Version    3.11.9\n  Python Executable C:\\...\\python.exe\n  OS                Windows 11\n  Machine           AMD64\n\nML Libraries\n  Library        Version   Status\n  torch          2.4.0     OK\n  transformers   4.44.0    OK\n  onnx           1.16.1    OK\n  ...\n\nAvailable Devices (priority order)\n  #1  NPU   Qualcomm(R) Hexagon NPU\n  #2  GPU   Qualcomm(R) Adreno GPU\n  #3  CPU   Snapdragon(R) X Elite\n\nAvailable Execution Providers\n  QNNExecutionProvider           -&gt; NPU/GPU\n  DmlExecutionProvider           -&gt; GPU\n  CPUExecutionProvider           -&gt; CPU\n</code></pre> <pre><code># Compact one-liner \u2014 useful for CI logs\n$ winml sys --format compact\n</code></pre> <pre><code># Machine-readable JSON \u2014 pipe to jq or save for later comparison\n$ winml sys --format json &gt; env.json\n</code></pre> <pre><code># Only list devices \u2014 skip everything else\n$ winml sys --list-device\n</code></pre> <pre><code># List EPs as JSON \u2014 useful for scripting EP selection\n$ winml sys --list-ep --format json\n</code></pre>"},{"location":"commands/sys/#common-pitfalls","title":"Common pitfalls","text":"<ul> <li><code>--list-device</code> and <code>--list-ep</code> suppress the full report. When either flag is   present, only the requested section is printed. Omit both flags to see the   complete system report.</li> <li><code>--format compact</code> omits device and EP tables. The compact format is designed   for single-line log entries and does not include device or EP details. Use <code>text</code>   or <code>json</code> when you need the full picture.</li> <li>CUDA shown as unavailable on a machine with a GPU. PyTorch must be installed   with CUDA support (<code>torch+cuXXX</code>). A CPU-only torch wheel will always report   <code>cuda_available: false</code>.</li> </ul>"},{"location":"commands/sys/#see-also","title":"See also","text":"<ul> <li>ONNX &amp; Execution Providers \u2014 background on EPs and   how <code>--device</code> / <code>--ep</code> flags interact</li> <li>inspect.md \u2014 inspect a specific HuggingFace model's compatibility</li> <li>catalog.md \u2014 browse the curated catalog of validated models</li> <li>How winml-cli Works \u2014 end-to-end pipeline overview</li> </ul>"},{"location":"concepts/analyze-and-optimize/","title":"Analyze and optimize","text":"<p>Not every ONNX graph runs efficiently on every execution provider. An operator that compiles cleanly on CPU may be unsupported on an NPU, and a correct graph may still leave performance on the table because adjacent operations were not fused. winml-cli separates the concern into two commands \u2014 <code>winml analyze</code> and <code>winml optimize</code> \u2014 that together form a graph-quality loop driven automatically by <code>winml build</code>.</p>"},{"location":"concepts/analyze-and-optimize/#what-analyze-does","title":"What analyze does","text":"<p><code>winml analyze</code> performs static analysis on an ONNX graph to answer one question: will this model run end-to-end on my target execution provider, and if not, what needs to change?</p> <p>Unlike profiling, static analysis does not require executing the full model on the target device. It inspects each operator (and recognized subgraph pattern) against a rule database of known EP capabilities, classifies every node, and emits actionable recommendations. The same analyzer also drives the autoconf feedback loop inside <code>winml build</code>, so understanding how it works is useful even when you never invoke <code>winml analyze</code> directly.</p> <p>Specify a target EP with <code>--ep</code> (e.g., <code>--ep qnn</code> or <code>--ep openvino</code>) and a device with <code>--device</code> (CPU, GPU, or NPU). The default <code>--ep auto</code> infers from locally available EPs; pass <code>--ep all</code> to evaluate every rule-data-backed EP regardless of local availability. Results print to the console by default; add <code>--output results.json</code> to save the report as JSON for scripting or archiving.</p>"},{"location":"concepts/analyze-and-optimize/#how-operators-are-classified","title":"How operators are classified","text":"<p>For each operator (and matched subgraph pattern) the analyzer follows a two-step process:</p> <ol> <li>Rule-database lookup \u2014 does the target EP claim to support this pattern?</li> <li>Local probe (fallback) \u2014 if the pattern is absent from the rule database and <code>--run-unknown-op</code> is enabled, the analyzer builds a minimal ONNX graph for the op and runs it on the target EP locally to determine support (see Local op execution below).</li> </ol> <p>The combined answer is recorded as a <code>SupportLevel</code>:</p> Level Compile on target EP Runs (possibly via CPU fallback) CLI label Exit code contribution <code>SUPPORTED</code> yes yes <code>Fully Supported</code> 0 <code>PARTIAL</code> no yes <code>Partial Support</code> 1 (warning) <code>UNSUPPORTED</code> no no <code>Not Supported</code> 1 (error) <code>UNKNOWN</code> n/a n/a <code>Unknown Support</code> 1 <p>A <code>PARTIAL</code> classification means the operator cannot be dispatched to the requested EP but the ONNX Runtime can still execute the model by falling back to CPU. This is technically a working model, but the latency and power-efficiency goals of NPU deployment are not met. <code>UNSUPPORTED</code> means even the CPU fallback path fails, so the model will not run at all. <code>UNKNOWN</code> appears only when the analyzer lacks both rule-database data and the ability to test locally.</p>"},{"location":"concepts/analyze-and-optimize/#two-key-outputs-lint-and-autoconf","title":"Two key outputs: lint and autoconf","text":"<p>Every analysis produces a lint result; the default (full) mode additionally produces an autoconf result. Understanding these two outputs separately is the easiest way to understand what <code>winml analyze</code> is for and how to consume it.</p> <p>Lint is the analyzer's verdict on the model as it stands today. It classifies every operator and recognized pattern against the target EP and rolls the classifications up into:</p> <ul> <li><code>errors</code> \u2014 count of <code>UNSUPPORTED</code> patterns. The model will not run.</li> <li><code>warnings</code> \u2014 count of <code>PARTIAL</code> patterns. The model runs, but these nodes fall back to CPU.</li> <li><code>passed</code> \u2014 <code>True</code> iff <code>errors == 0 and warnings == 0</code>.</li> </ul> <p>Lint always runs. It is deterministic and sufficient for a yes/no CI gate \u2014 the CLI's exit code is derived from it.</p> <p>Autoconf is the analyzer's suggestion for how to fix the current model. It lists the fusion flags which, if enabled in the optimize stage, would convert one or more <code>PARTIAL</code>/<code>UNSUPPORTED</code> patterns into <code>SUPPORTED</code> ones.</p> <p>Autoconf is what powers the build pipeline's re-optimization loop: when the analyzer says \"<code>gelu_fusion</code> would resolve these warnings\", the build re-runs optimize with that flag and re-analyzes \u2014 until no further suggestions remain or the iteration limit is hit. Autoconf is advisory; nothing else in the system flips fusion flags automatically.</p>"},{"location":"concepts/analyze-and-optimize/#analysis-modes","title":"Analysis modes","text":"<p><code>winml analyze</code> can run in two modes which differ only in whether autoconf is computed:</p> Mode How to enable Output When to use Lint-only <code>--no-information</code> (CLI) or <code>autoconf=False</code> (Python) Lint only. <code>optimization_config</code> is <code>None</code>. CI gate; pass/fail only Full (default) <code>--information</code> (CLI, default) or <code>autoconf=True</code> (Python) Lint plus autoconf and recommendations Local debugging; build pipeline's autoconf loop <p>The only difference between the two modes is whether autoconf and the human-readable recommendations are computed. Skipping them gives a faster, leaner run. The lint result is identical either way.</p>"},{"location":"concepts/analyze-and-optimize/#three-classes-of-finding","title":"Three classes of finding","text":"<p>Every analysis emits findings in three buckets. Each bucket maps to a different remediation pattern.</p> <p>Errors (<code>UNSUPPORTED</code> patterns) block deployment. Either the operator does not exist on the target EP at all, or it does not handle the specific input shape/dtype the model uses. Typical remediations:</p> <ul> <li>Rewrite the model to use an equivalent pattern the EP does support.</li> <li>Lower the opset version of the offending op if the EP supports an older opset.</li> <li>Insert pre/post-processing to massage shapes into a supported configuration.</li> </ul> <p>Each error pattern includes a recommendation that identifies the current pattern and the target pattern the EP does support, so the optimizer (or a manual rewrite) can apply the fix.</p> <p>Warnings (<code>PARTIAL</code> patterns) mean the model will run, but the target EP cannot dispatch this pattern. Inference falls back to the CPU EP, breaking the deployment goal (e.g., NPU offload) without breaking correctness. Warnings are usually fusion opportunities \u2014 the analyzer recognized a sub-pattern that, if fused, would become a single EP-native op. The fix is to enable the relevant fusion flag in the optimize stage \u2014 this is exactly what the autoconf loop does automatically.</p> <p>Info (<code>Information</code> items) are lower-priority insights: a hint that an alternative pattern exists, a QDQ-equivalent that could be used after quantization, or a description of why a node was classified as it was. Info entries never affect exit code.</p>"},{"location":"concepts/analyze-and-optimize/#local-op-execution","title":"Local op execution","text":"<p>The static rule database does not cover every operator and every shape/dtype combination. When <code>--run-unknown-op</code> is enabled and the analyzer encounters a pattern not present in the database, it builds a tiny ONNX graph containing just that op (with the model's actual input metadata) and runs it on the target EP locally. The compile/run result becomes the classification. Without <code>--run-unknown-op</code> (the default), such patterns are classified as <code>UNKNOWN</code>.</p> <p>Leave <code>--run-unknown-op</code> disabled when:</p> <ul> <li>The local machine does not have the target EP available (e.g., analyzing a QNN model from a non-Snapdragon machine).</li> <li>You want bit-for-bit reproducible analysis across machines. Local execution can produce different results depending on driver versions.</li> </ul>"},{"location":"concepts/analyze-and-optimize/#save-node-debugging-unsupported-subgraphs","title":"Save-node: debugging unsupported subgraphs","text":"<p>When a pattern is unsupported and the recommendation does not immediately tell you what is wrong, use <code>--save-node</code> to dump the offending subgraph to disk as a self-contained, runnable <code>.onnx</code> file. You can then open it in Netron, re-analyze it in isolation, or attach it to a bug report as a minimal reproducer. See the analyze command reference for usage examples.</p>"},{"location":"concepts/analyze-and-optimize/#htp-metadata-enhancement","title":"HTP metadata enhancement","text":"<p>When a model is exported with hierarchy-preserving tags (HTP), the export produces a sidecar <code>_htp_metadata.json</code> that maps each ONNX node back to its source module (e.g., <code>encoder.layer.0.attention.self.GELUActivation</code>). Passing this file via <code>--htp-metadata</code> lets the <code>PatternExtractor</code> use the module hierarchy to match subgraph patterns more accurately than operator-level heuristics alone.</p> <p>HTP metadata is consumed at the pattern extraction stage \u2014 before any EP-specific runtime checking \u2014 so the enriched patterns benefit all target EPs equally (QNN, OpenVINO, VitisAI, etc.). Without HTP metadata, the analyzer falls back to attribute-based tag matching and then the general-purpose <code>PatternMatcher</code>; with it, the analyzer can correctly identify fused patterns (GELU, LayerNorm, Attention) that are difficult to detect from the raw operator graph. See the analyze command reference for usage examples.</p>"},{"location":"concepts/analyze-and-optimize/#what-runs-internally","title":"What runs internally","text":"<p>The analyzer is composed of five stages that run in order. You normally do not need to think about them, but they are worth knowing when reading recommendations or extending the analyzer:</p> Stage Job <code>ONNXLoader</code> Load the ONNX file (or <code>ModelProto</code>), record metadata. <code>PatternExtractor</code> Walk the graph, match operator and subgraph patterns from the rule catalog. Optionally consume HTP metadata. <code>RuntimeChecker</code> For each pattern, consult the rule database; if no rule applies, run the op locally (when allowed). <code>InformationEngine</code> Turn classifications into human-readable <code>Information</code> items; also runs model validators (constant folding, dynamic input, pattern matching, QDQ validation, shape inference). <code>OutputAggregator</code> Assemble the final <code>AnalysisOutput</code> (the JSON you get from <code>--output</code>). <p>The model validators run regardless of whether there are runtime check results \u2014 they are model-level sanity checks (e.g., is shape inference complete? are QDQ pairs well-formed?) and can surface issues even when every operator looks fine in isolation.</p>"},{"location":"concepts/analyze-and-optimize/#what-optimize-does","title":"What optimize does","text":"<p><code>winml optimize</code> rewrites the ONNX graph by applying fusions and structural simplifications. Internally the optimizer runs four pipes in sequence:</p> Pipe What it does ORTGraphPipe ORT C++ graph optimizer (level 2): fusions, eliminations, layout transforms RewritePipe JSON-driven pattern matcher that replaces subgraph patterns with equivalent alternatives ORTFusionPipe ORT Python transformer optimizer: attention, LayerNorm, and RMSNorm fusions SurgeryPipe Post-optimization model surgery (constant clamping, NaN guard removal) <p>Every optimization is a named capability toggled via <code>--enable-&lt;name&gt;</code> and <code>--disable-&lt;name&gt;</code> flags. Run <code>--list-capabilities</code> to see all registered optimizations and their defaults. The optimizer currently ships 57 static capabilities across 13 categories:</p> Category Capabilities Examples GELU 5 gelu-fusion, fast-gelu-fusion, quick-gelu-fusion LayerNorm 6 layer-norm-fusion, skip-layer-norm-fusion, fuse-rmsnorm MatMul 6 matmul-add-fusion, matmul-activation-fusion Conv 4 conv-bn-fusion, conv-activation-fusion Layout 4 nhwc-transformer, transpose-optimizer GEMM 3 gemm-activation-fusion, gemm-transpose-fusion Elimination 3 slice-elimination, expand-elimination Graph 3 constant-folding, double-qdq-pairs-remover Activation 2 bias-softmax-fusion, bias-dropout-fusion Attention 1 attention-fusion Misc 4 pad-fusion, gather-to-slice-fusion Rewrite 14 attention-expandedattention, matmuladd-conv2d4d, layernormalization-singlelayernorm Surgery 2 clamp-constant-values, remove-isnan-in-attention-mask <p>This granularity matters when a specific fusion breaks a downstream step or when you need an exact optimization profile for a given EP. Some capabilities declare dependencies (e.g., <code>bias-gelu-fusion</code> requires <code>gelu-fusion</code>); the optimizer resolves these automatically when you enable a flag.</p> <p>Pattern rewrites are a complementary mechanism: instead of folding nodes, rewrites replace one subgraph pattern with a structurally equivalent alternative. Rules are defined in JSON files (<code>default.json</code> for general rewrites, <code>qnn.json</code> for QNN-specific rewrites). The optimizer currently ships 5 rewrite groups containing 12 individual rules \u2014 for example, four GELU source variants can each be rewritten to a single <code>Gelu</code> op, and a MatMul+Add pattern can be rewritten to a GEMM or to a Conv2D for Qualcomm NPU targets. Run <code>--list-rewrites</code> to discover available families and their flag names. Flags follow the form <code>--enable-&lt;source-slug&gt;-&lt;target-slug&gt;</code>.</p> <p>Commit a specific combination of flags to a <code>--config</code> file for reproducible builds.</p>"},{"location":"concepts/analyze-and-optimize/#the-analyzeroptimizer-loop","title":"The analyzer/optimizer loop","text":"<p>A single optimize pass may create fusion opportunities that were not present before, and a freshly fused graph may surface new operator compatibility issues. This is why <code>winml build</code> runs analyze and optimize in an alternating loop rather than once each.</p> <p>The flow inside <code>winml build</code> (implemented in <code>run_optimize_analyze_loop</code>) is:</p> <p></p> <p>The initial optimize pass applies the flags from <code>config.optim</code>. The analyzer then inspects the result; if autoconf discovers fusion flags that were not yet enabled, the optimizer re-runs with those flags and the analyzer re-checks. This repeats up to <code>--max-optim-iterations</code> rounds (default: three). The loop exits early when autoconf suggests no further changes. After the loop, a final analysis validates the result \u2014 if unsupported patterns still exist, the build raises a <code>RuntimeError</code>.</p> <p>Use <code>--no-analyze</code> to skip the loop and run a single optimization pass \u2014 useful for deterministic rebuilds from a fixed ONNX checkpoint where the graph is already known good.</p>"},{"location":"concepts/analyze-and-optimize/#when-to-use-which-entry-point","title":"When to use which entry point","text":"You want to... Use Gate a CI pipeline on EP compatibility <code>winml analyze</code> (CLI) \u2014 exit code is the contract Embed analysis in a build script or notebook <code>analyze_onnx(model, ep=...)</code> (flat Python API) Post-process the full result programmatically <code>ONNXStaticAnalyzer().analyze(...)</code> (class API) Analyze an in-memory <code>ModelProto</code> <code>ONNXStaticAnalyzer().analyze_from_proto(...)</code> Optimize with full control over fusions <code>winml optimize</code> (CLI) with <code>--enable-</code> / <code>--disable-</code> flags Reproducible build from a config file <code>winml build -c config.json</code> (pipeline wrapper) <p>The CLI and the flat Python API are sufficient for the vast majority of cases. The class-based API is only needed when you want to call <code>is_fully_supported(ep)</code>, <code>get_unsupported_operators(ep)</code>, or <code>get_optimization_opportunities(ep)</code> on the full result.</p>"},{"location":"concepts/analyze-and-optimize/#see-also","title":"See also","text":"<ul> <li>Compile and EPContext</li> <li>Primitives and pipeline</li> <li>How winml-cli works \u2014 where the analyzer sits in the build pipeline</li> <li>EPs and devices \u2014 background on EPs and operator support</li> <li>analyze command</li> <li>optimize command</li> </ul>"},{"location":"concepts/compile-and-epcontext/","title":"Compile and EPContext","text":"<p>When you run <code>winml compile</code>, you are not simply copying an ONNX file to a new location. You are asking an execution provider (EP) to transform the model into a form it can load and run directly, without repeating that transformation at every startup. Understanding what the compiler produces \u2014 and why \u2014 helps you decide when to compile, what output format to choose, and how to balance file size against runtime performance.</p> <p>Compilation is an offline, one-time step. The artifact it creates is what you ship with your application and what <code>winml-cli</code> uses for benchmarking and evaluation.</p>"},{"location":"concepts/compile-and-epcontext/#what-compilation-produces","title":"What compilation produces","text":"<p>For EPs that are fully integrated into ONNX Runtime \u2014 CPU, DirectML, and similar providers \u2014 the compile step writes a new <code>.onnx</code> file that the runtime loads directly. The ONNX graph has been prepared and, in some cases, partitioned so that the EP's session initializer has less work to do when the application starts.</p> <p>For EPs that support ahead-of-time compilation (e.g. <code>--ep qnn</code> for Qualcomm NPUs and <code>--ep vitisai</code> for AMD NPUs), the compiler goes further. It takes the ONNX graph and produces a binary artifact \u2014 the EP context blob \u2014 that encodes the fully compiled, hardware-ready version of the network. This blob is then associated with the ONNX model file. On subsequent loads, the EP reads the blob rather than re-compiling the graph, which makes session creation dramatically faster.</p> <p>The default compiler backend is <code>ort</code> (ONNX Runtime).</p>"},{"location":"concepts/compile-and-epcontext/#embedded-vs-external-epcontext","title":"Embedded vs external EPContext","text":"<p>For QNN compilation, <code>winml-cli</code> gives you a choice of where the EP context blob lives. By default the blob is written as a sidecar <code>.bin</code> file alongside the <code>.onnx</code>. Passing <code>--embed</code> instead inlines the blob directly into the ONNX file.</p> <p>External (default): The <code>.onnx</code> is small and human-inspectable; the heavy binary data lives in a separate file. You must keep the two files together \u2014 the ONNX stores a relative path back to the <code>.bin</code>. This layout is preferable for version control and for scenarios where you want to inspect or diff the model graph.</p> <p>Embedded (<code>--embed</code>): Everything ships in a single <code>.onnx</code> file. Deployment is simpler because there is only one artifact to track. The trade-off is file size: the <code>.onnx</code> grows by the full size of the compiled context, and the file is no longer human-readable in the usual sense. Choose embedded when your deployment tooling expects a single model file, or when you want to minimize the chance of the sidecar being misplaced.</p>"},{"location":"concepts/compile-and-epcontext/#why-pre-compile","title":"Why pre-compile","text":"<p>The first time an ONNX Runtime session is created for a model on a hardware EP, the runtime must partition the graph, allocate buffers, and JIT-compile the operators. On an NPU this process can take several seconds. For applications with tight startup budgets \u2014 on-device inference in a UI flow, for example \u2014 that cold-start cost is often unacceptable.</p> <p>A model produced by <code>winml compile</code> has already paid that cost. The EP context blob is the result of compilation, not its input. When the application loads the compiled model the EP reads the pre-built binary and the session is ready almost immediately. Shipping a compiled model is therefore the standard pattern for production deployments on QNN hardware.</p> <p>If you are iterating on quantization settings or ONNX graphs and want to check whether the model compiles at all, pass an already-quantized (QDQ) model directly \u2014 <code>winml compile</code> compiles whatever ONNX file you supply and does not have a separate quantization pass to skip.</p>"},{"location":"concepts/compile-and-epcontext/#skipping-validation","title":"Skipping validation","text":"<p>By default <code>winml compile</code> runs a validation pass after compilation finishes \u2014 it loads the compiled model into an inference session, feeds it dummy inputs (all-ones tensors), and checks that the outputs do not contain NaN or Inf values. This catches basic compilation failures early (e.g., the EP rejecting the graph or producing garbage outputs).</p> <p>The <code>--no-validate</code> flag skips that pass. It is useful during rapid iteration when you only want to confirm that compilation succeeds without the overhead of a trial inference run.</p>"},{"location":"concepts/compile-and-epcontext/#see-also","title":"See also","text":"<ul> <li>EPs and devices \u2014 execution provider selection and <code>--ep</code> / <code>--device</code> flags</li> <li>Analyze and optimize \u2014 graph-level analysis before compilation</li> <li>compile command reference</li> <li>build command reference</li> </ul>"},{"location":"concepts/config-and-build/","title":"Config and build","text":"<p><code>winml config</code> and <code>winml build</code> are a producer/consumer pair. <code>winml config</code> inspects a Hugging Face model (or an existing ONNX file), auto-detects the task, model class, and I/O specifications, and writes a <code>WinMLBuildConfig</code> JSON file. <code>winml build</code> reads that file and runs the full pipeline \u2014 export, optimize, quantize, compile \u2014 producing a Windows ML-ready ONNX artifact.</p> <p>Keeping these two responsibilities separate is intentional. The config file is a stable, human-readable description of exactly what the build will do. You can generate it once, review or edit it, commit it to source control, and replay the same build at any time without re-running model introspection. CI pipelines and team workflows both benefit from treating the config file as a versioned artifact rather than a transient intermediate.</p>"},{"location":"concepts/config-and-build/#generating-a-config","title":"Generating a config","text":"<p><code>winml config</code> produces a <code>WinMLBuildConfig</code> JSON with sensible defaults for the detected model type. At minimum, provide a model identifier:</p> <pre><code>winml config -m microsoft/resnet-50 -o resnet50.json\n</code></pre> <p>Several flags shape what ends up in the config:</p> <ul> <li><code>--task</code> overrides the auto-detected Hugging Face task when detection is   ambiguous or when you want a specific variant (for example, <code>text-classification</code>   vs <code>feature-extraction</code>).</li> <li><code>--no-quant</code> sets the <code>quant</code> section to <code>null</code>, so the quantize stage is omitted   when <code>winml build</code> consumes the config. Use this for GPU workflows where float16   is preferred over QDQ quantization.</li> <li><code>--no-compile</code> sets the <code>compile</code> section to <code>null</code>, producing a portable ONNX   that the runtime compiles on first load instead of embedding a pre-compiled   binary.</li> <li><code>--trust-remote-code</code> allows model repositories that ship custom modeling code \u2014   required for some community models that define non-standard architectures outside   the standard <code>transformers</code> library.</li> </ul> <p>If <code>-o</code> is omitted, the config is printed to stdout, which is convenient for piping or quick inspection. The generated JSON is plain text and can be edited directly before being passed to <code>winml build</code>.</p>"},{"location":"concepts/config-and-build/#whats-in-a-config","title":"What's in a config","text":"<p>A <code>WinMLBuildConfig</code> is a dataclass defined in <code>src/winml/modelkit/config/build.py</code>. It holds five nested sub-configs for the pipeline stages, plus an evaluation config and an auto flag:</p> Field Type Purpose <code>loader</code> <code>WinMLLoaderConfig</code> Task, model type, and model class used to load the Hugging Face model. <code>export</code> <code>WinMLExportConfig</code> Input/output tensor specs, opset version, dynamic axes (<code>null</code> for pre-exported ONNX). <code>optim</code> <code>WinMLOptimizationConfig</code> Graph fusion flags (GeLU, LayerNorm, MatMul+Add). <code>quant</code> <code>WinMLQuantizationConfig</code> Precision types (<code>weight_type</code>, <code>activation_type</code>), calibration samples and method (<code>null</code> to skip). <code>compile</code> <code>WinMLCompileConfig</code> Target EP provider, EPContext options, compiler backend (<code>null</code> to skip). <code>eval</code> <code>WinMLEvaluationConfig \\| null</code> Evaluation settings run after the build (<code>null</code> to skip). <code>auto</code> <code>bool</code> When <code>true</code> (default), auto-fills missing fields from model introspection. <p>Setting <code>quant</code> or <code>compile</code> to <code>null</code> tells the pipeline to skip that stage entirely, equivalent to passing <code>--no-quant</code> or <code>--no-compile</code> on the command line.</p> <p>A generated config looks similar to:</p> <pre><code>{\n  \"loader\": {\n    \"task\": \"image-classification\"\n  },\n  \"export\": {\n    \"opset_version\": 17,\n    \"batch_size\": 1\n  },\n  \"optim\": {\n    \"gelu_fusion\": false,\n    \"layer_norm_fusion\": false,\n    \"matmul_add_fusion\": false\n  },\n  \"quant\": {\n    \"mode\": \"qdq\",\n    \"weight_type\": \"uint8\",\n    \"activation_type\": \"uint8\",\n    \"samples\": 10\n  },\n  \"compile\": {\n    \"execution_provider\": \"qnn\",\n    \"enable_ep_context\": true\n  }\n}\n</code></pre> <p>The file is plain JSON. You can hand-edit any field before passing it to <code>winml build</code> \u2014 adjust the calibration sample count, change the compile provider, or remove a fusion flag.</p>"},{"location":"concepts/config-and-build/#consuming-a-config","title":"Consuming a config","text":"<p>Pass the config file to <code>winml build</code> with either an output directory or the global cache flag:</p> <pre><code># Write artifacts to a local directory\nwinml build -c resnet50.json -m microsoft/resnet-50 --output-dir output/\n\n# Write to the global cache (~/.cache/winml/)\nwinml build -c resnet50.json -m microsoft/resnet-50 --use-cache\n</code></pre> <p><code>--output-dir</code> and <code>--use-cache</code> are mutually exclusive; you must supply one of the two when running <code>winml build</code> (enforced at runtime, not parse time). Within the output directory, <code>winml build</code> writes one ONNX file per completed stage so that intermediate artifacts are available for inspection, and it writes a copy of the resolved config so the full build parameters are recorded alongside the outputs.</p>"},{"location":"concepts/config-and-build/#overrides-at-run-time","title":"Overrides at run time","text":"<p>CLI flags passed directly to <code>winml build</code> override the corresponding config sections for that run only, without modifying the JSON file on disk. This makes it straightforward to experiment with a variation without creating a new config:</p> <pre><code># Skip quantization and compilation for this run only\nwinml build -c resnet50.json -m microsoft/resnet-50 --output-dir output/ --no-quant --no-compile\n\n# Skip optimization (for a pre-quantized input ONNX)\nwinml build -c resnet50.json -m model_qdq.onnx --output-dir output/ --no-optimize\n</code></pre> <p><code>--no-quant</code>, <code>--no-compile</code>, and <code>--no-optimize</code> each suppress the corresponding stage regardless of what the config file specifies. Because the config file is unchanged, re-running without the override flag reverts to the full pipeline described in the config.</p>"},{"location":"concepts/config-and-build/#why-version-a-config","title":"Why version a config","text":"<p>Storing the <code>WinMLBuildConfig</code> JSON in source control brings three concrete benefits:</p> <ol> <li> <p>Reproducibility. A config file pins every build decision \u2014 task, precision,    quantization method, calibration sample count, target EP, fusion flags \u2014 in a    single file. Running <code>winml build -c config.json</code> six months later produces the    same artifact as it does today, regardless of how the tool's defaults evolve.</p> </li> <li> <p>CI integration. A CI job can run <code>winml build -c config.json -m &lt;model-id&gt;    --output-dir artifacts/</code> with no human intervention. Because all settings live    in the config file, the CI script requires no per-model flag knowledge, and    updating build parameters is a pull request to the config file, not a change to    the pipeline script.</p> </li> <li> <p>Team sharing. Handing a colleague a config file is enough for them to    reproduce the exact build on their machine. There is no need to document the    sequence of primitive commands, precision arguments, or calibration settings    separately \u2014 the file is the documentation.</p> </li> </ol>"},{"location":"concepts/config-and-build/#see-also","title":"See also","text":"<ul> <li>Primitives and pipeline \u2014 when to use <code>winml build</code>   vs individual primitive commands</li> <li>Config Schema \u2014 full field-by-field config reference</li> <li>winml config command reference</li> <li>winml build command reference</li> </ul>"},{"location":"concepts/eps-and-devices/","title":"EP and Device","text":"<p>An Execution Provider (EP) is a pluggable backend in ONNX Runtime that claims and runs a subset of graph nodes on a specific hardware target. When ONNX Runtime loads a model it partitions the graph among the registered EPs: operators that an EP claims are dispatched to it, and the remainder fall back to the CPU EP. This design lets a single ONNX model exploit an NPU, GPU, or CPU without any change to the graph itself.</p> <p>A device is the hardware category that an EP targets \u2014 one of <code>npu</code>, <code>gpu</code>, or <code>cpu</code>. winml-cli exposes both levels of control: the high-level <code>--device</code> flag selects a hardware category, while the low-level <code>--ep</code> flag pins a specific ONNX Runtime provider name. In most workflows you set <code>--device</code> and let winml-cli resolve the best available EP; you reach for <code>--ep</code> when you need to compare or force a specific provider.</p>"},{"location":"concepts/eps-and-devices/#eps-winml-cli-supports","title":"EPs winml-cli supports","text":"<p>The table below lists every Execution Provider that winml-cli has explicit support for. EP names are the canonical ONNX Runtime strings accepted by <code>--ep</code>. You can also use the short alias (case-insensitive) anywhere the full name is accepted.</p> EP Alias Device Hardware When to use <code>QNNExecutionProvider</code> <code>qnn</code> npu / gpu Qualcomm NPU (Hexagon DSP) / Qualcomm GPU (Adreno) Snapdragon-based Copilot+ PCs; best latency and power efficiency on Qualcomm silicon <code>VitisAIExecutionProvider</code> <code>vitisai</code> npu AMD NPU (XDNA) AMD Ryzen AI platforms; targets the AMD AI Engine via the Vitis AI stack <code>OpenVINOExecutionProvider</code> <code>openvino</code> npu / gpu / cpu Intel CPU / GPU / NPU Intel Core Ultra platforms; flexible device targeting across all three Intel compute types <code>DmlExecutionProvider</code> <code>dml</code> gpu GPU (DirectML) Any DirectX 12 GPU on Windows; broad compatibility across AMD, Intel, and NVIDIA discrete/integrated graphics <code>NvTensorRTRTXExecutionProvider</code> <code>nv_tensorrt_rtx</code> gpu NVIDIA GPU (TensorRT RTX) NVIDIA RTX GPUs; maximum throughput via TensorRT graph optimization <code>MIGraphXExecutionProvider</code> <code>migraphx</code> gpu AMD GPU (MIGraphX) AMD discrete GPUs; hardware-accelerated inference via the MIGraphX graph engine <code>CPUExecutionProvider</code> <code>cpu</code> cpu CPU Universal fallback; always available regardless of hardware <p>To see which EPs are available on the current machine, run:</p> <pre><code>winml sys --list-ep\n</code></pre>"},{"location":"concepts/eps-and-devices/#device-vs-ep-on-the-cli","title":"Device vs. EP on the CLI","text":"<p>winml-cli exposes two overlapping flags for targeting hardware. Understanding their relationship prevents confusion when using <code>winml analyze</code>, <code>winml compile</code>, or <code>winml build</code>.</p> <p><code>--device</code> (high-level)</p> <p>Accepts one of four values: <code>auto</code>, <code>cpu</code>, <code>gpu</code>, or <code>npu</code>. When set to <code>auto</code> (the default), winml-cli inspects the machine and selects the highest-priority device class that has a compatible EP available, in the order NPU &gt; GPU &gt; CPU. Setting an explicit value such as <code>--device npu</code> requests a device category without naming the EP.</p> <p>For <code>winml analyze</code>, <code>--device</code> also accepts <code>all</code> \u2014 this evaluates the model against every device that has rule data, producing a side-by-side compatibility report.</p> <pre><code># Let winml-cli pick the best available device\nwinml analyze --model model.onnx --device auto\n\n# Target the NPU device class\nwinml analyze --model model.onnx --device npu\n\n# Analyze against all devices at once (analyze only)\nwinml analyze --model model.onnx --device all\n</code></pre> <p><code>--ep</code> (low-level override)</p> <p>Accepts a valid EP name or alias (for example <code>qnn</code>, <code>vitisai</code>, <code>dml</code>, <code>openvino</code>), or <code>auto</code> to let winml-cli resolve the EP from the device. When <code>--ep</code> is provided with a specific value it takes precedence over <code>--device</code> and bypasses device-class resolution entirely. Use <code>--ep</code> when you need to pin a specific provider \u2014 for instance to compare <code>QNNExecutionProvider</code> against <code>DmlExecutionProvider</code> on the same machine.</p> <p>For <code>winml analyze</code>, <code>--ep</code> also accepts <code>all</code> \u2014 this evaluates the model against every registered EP simultaneously.</p> <pre><code># Force Qualcomm QNN regardless of device selection\nwinml analyze --model model.onnx --ep QNNExecutionProvider --device npu\n\n# Use the short alias; winml-cli normalizes it to the full name\nwinml analyze --model model.onnx --ep qnn\n\n# Analyze against all EPs at once (analyze only)\nwinml analyze --model model.onnx --ep all\n</code></pre> <p>The <code>--ep</code> flag accepts a free-form string and is not restricted to the choices listed above. This allows forward compatibility with EP names that winml-cli does not yet enumerate.</p>"},{"location":"concepts/eps-and-devices/#see-also","title":"See also","text":"<ul> <li>Graphs and IR \u2014 ONNX graph format, operator sets, and the IR that EPs consume</li> <li>Weight and Activation \u2014 tensor roles relevant to EP compatibility</li> <li>winml sys \u2014 list available devices and EPs on the current machine</li> <li>winml analyze \u2014 check ONNX operator compatibility against a specific EP</li> </ul>"},{"location":"concepts/eval-and-datasets/","title":"Eval and datasets","text":"<p><code>winml eval</code> answers one question: does this model produce correct results? It measures accuracy \u2014 how well outputs match ground truth \u2014 rather than latency or throughput. You give it a model, point it at a labeled dataset, and get back a JSON report of metric scores. Everything else in the pipeline (compilation, quantization, device selection) is about making the model fast; eval is about knowing whether it is still right.</p> <p>The dataset is the source of truth. Eval iterates over dataset rows, runs each sample through the model, and compares the prediction to the label recorded in the dataset. This means the dataset must have both input features and ground-truth labels, and the columns carrying those values must be wired to the model's inputs and outputs. winml-cli handles standard tasks automatically, but the column-mapping flags let you override the defaults for non-standard datasets.</p>"},{"location":"concepts/eval-and-datasets/#what-eval-reports","title":"What eval reports","text":"<p>The metric reported depends on the task. Classification tasks produce accuracy (top-1 and optionally top-5). Object detection tasks produce mean average precision (mAP). The exact set of metrics is printed to stdout and saved to the file specified by <code>--output</code>. The <code>--output</code> flag accepts any <code>.json</code> path; if omitted, results are printed but not persisted. Use <code>--schema</code> to print the expected dataset schema for a given task without running eval, which is useful when you are preparing a custom dataset.</p>"},{"location":"concepts/eval-and-datasets/#picking-a-dataset","title":"Picking a dataset","text":"<p><code>--dataset</code> takes a Hugging Face dataset path \u2014 for example <code>imagenet-1k</code> or <code>glue</code>. If you omit it, winml-cli selects a default dataset based on the detected task. For datasets that have multiple configurations, <code>--dataset-name</code> picks the specific config (e.g. <code>--dataset-name mrpc</code> when using the <code>glue</code> dataset).</p> <p>By default eval runs on the <code>validation</code> split; <code>--split</code> overrides this. Full validation sets can be large. During development, <code>--samples 200</code> caps the run to 200 rows so you get quick feedback. For very large datasets that you prefer not to download fully, <code>--streaming</code> fetches rows on demand instead of materialising the whole dataset locally. <code>--shuffle</code> (on by default) randomises sampling order so a capped run is representative rather than biased toward the first rows.</p>"},{"location":"concepts/eval-and-datasets/#column-mapping","title":"Column mapping","text":"<p>winml-cli must know which dataset column feeds which model input and which column holds the ground-truth label. For well-known task/dataset combinations this mapping is built in. When it is not, use <code>--column key=value</code> to declare it. The <code>key</code> is the name the task pipeline expects (e.g. <code>input_column</code>) and <code>value</code> is the actual column name in the dataset (e.g. <code>image</code>). You can repeat <code>--column</code> as many times as needed.</p> <p>When the integer label IDs in the dataset do not match the class indices the model was trained against, <code>--label-mapping</code> accepts a JSON file of the form <code>{\"class_name\": id}</code> that translates between the two spaces. This is common with models fine-tuned on a relabelled subset of a public dataset.</p>"},{"location":"concepts/eval-and-datasets/#why-eval-after-quantization","title":"Why eval after quantization","text":"<p>Quantization is a lossy transformation. Converting weights from float32 to int8, or activations to a narrow range, introduces rounding error that accumulates differently across architectures and calibration data. The impact on accuracy cannot be predicted analytically; it must be measured. Running <code>winml eval</code> before and after quantization gives you a concrete accuracy delta. A drop within your acceptable threshold confirms the quantized model is ready; a larger drop means you should revisit calibration settings or switch to a less aggressive quantization scheme.</p> <p>Make this a habit: quantize, then eval. Comparing two <code>--output</code> JSON files is a reliable, reproducible record that the trade-off between performance and accuracy was explicitly checked. See Quantization for the full quantization workflow.</p>"},{"location":"concepts/eval-and-datasets/#see-also","title":"See also","text":"<ul> <li>Quantization \u2014 calibrate and quantize a model, then verify with eval</li> <li>Perf and monitoring \u2014 measure latency and throughput after accuracy is confirmed</li> <li><code>winml eval</code> command reference \u2014 all flags with examples</li> </ul>"},{"location":"concepts/graphs-and-ir/","title":"Graph and IR","text":"<p>A <code>.onnx</code> file is, at rest, a binary-serialized Protocol Buffer. Open it in any hex editor and you will find the familiar <code>ONNX</code> magic bytes followed by a dense encoding of every number the model has ever learned, plus the structural description of how those numbers are combined to produce a prediction. The file is self-contained: weights and computation recipe live together, making the artifact portable without any accompanying framework installation.</p> <p>That computation recipe is a graph \u2014 a directed acyclic structure of operators wired together by named data edges. The graph is what the ONNX Intermediate Representation (IR) actually defines. When winml-cli loads or transforms a model, every operation works against this graph structure, not against framework-specific objects.</p>"},{"location":"concepts/graphs-and-ir/#what-is-in-a-onnx-file","title":"What is in a .onnx file","text":"<p>An ONNX <code>ModelProto</code> wraps a single <code>GraphProto</code>. Inside the graph you will find:</p> <ul> <li>Inputs \u2014 typed, named entry points that accept runtime tensors (e.g., <code>pixel_values: float32[1, 3, 224, 224]</code>).</li> <li>Outputs \u2014 typed, named exit points that carry the model's predictions back to the caller.</li> <li>Nodes \u2014 individual operators (Conv, MatMul, Softmax, \u2026) that transform tensors. Each node names its inputs and outputs using the same string identifiers used throughout the graph.</li> <li>Initializers \u2014 constant tensors embedded in the file. Learned weights, biases, and lookup tables are stored here; they are treated as graph inputs that are always pre-supplied.</li> <li>Metadata \u2014 key\u2013value string properties attached at the model level. winml-cli uses this area to store information such as <code>winml.io.inputs</code> (serialized tensor specs) and <code>winml.hierarchy.tag</code> attributes on individual nodes.</li> </ul>"},{"location":"concepts/graphs-and-ir/#graphs-as-ir","title":"Graphs as IR","text":"<p>ONNX functions as an Intermediate Representation: a portable, framework-neutral description of a computation that can be loaded by any conforming runtime. Unlike a Python object graph or a compiled binary, the ONNX IR makes data flow completely explicit. Every node declares the exact names of its input and output edges; those names form a namespace shared across the whole graph, so any consumer can trace a tensor from the model inputs through every transformation to the final output.</p> <p>This explicit wiring unlocks two capabilities that winml-cli relies on heavily. First, shape inference can propagate concrete or symbolic dimensions through the graph without running it \u2014 a prerequisite for correct quantization and for generating input specs automatically. Second, EP-targeted compilation can partition the graph by examining which nodes an Execution Provider supports, fuse eligible sub-graphs into accelerated kernels, and serialize the result back into a valid ONNX file using the <code>EPContext</code> convention. Neither of these would be tractable on an opaque binary or a dynamic execution trace.</p> <p>Because the IR is static \u2014 describing the full computation at load time rather than at call time \u2014 winml-cli can inspect, validate, and transform a model without a GPU, a framework, or sample data.</p>"},{"location":"concepts/graphs-and-ir/#opsets-and-versioning","title":"Opsets and versioning","text":"<p>Every operator in ONNX belongs to a domain, and every domain advances through numbered opset versions. An opset is a snapshot of the operator catalog: it defines which operators exist, what their inputs and outputs mean, and how edge cases are handled. When a model declares <code>opset_import { domain: \"\" version: 17 }</code>, it is saying \"all unnamed-domain operators in this file must be interpreted according to the rules published in opset 17.\"</p> <p>winml-cli defaults to opset 17 when exporting a PyTorch model to ONNX. This is the value of <code>opset_version: int = 17</code> in <code>WinMLExportConfig</code> (<code>src/winml/modelkit/export/config.py</code>, line 75). Opset 17 introduced layer-normalisation and group-normalisation operators in native form, eliminating the multi-node decompositions required by earlier opsets, which is why it is the recommended baseline for modern transformer and vision architectures.</p> <p>Higher opsets unlock additional operators and fix known edge-case behavior, but not every Execution Provider supports the latest opset. QNN, for instance, may lag behind the ONNX standard by one or two versions. If you need to target an older EP, pass a custom export configuration:</p> <pre><code># Write a config override\necho '{\"opset_version\": 16}' &gt; export_cfg.json\n\n# Export with the override\nwinml export -m prajjwal1/bert-tiny -o bert.onnx --export-config export_cfg.json\n</code></pre> <p>You can also check the opset a saved model declares:</p> <pre><code>winml inspect -m bert.onnx\n</code></pre> <pre><code>Opset: ai.onnx == 17\n</code></pre> <p>When winml-cli's optimization and quantization pipelines transform a model, they preserve the declared opset unless explicitly instructed otherwise, so the model you receive after <code>winml quantize</code> will carry the same opset version as the model you supplied.</p>"},{"location":"concepts/graphs-and-ir/#see-also","title":"See also","text":"<ul> <li>EP and Device</li> <li>Weight and Activation</li> <li>Datatype and Quantization</li> <li>winml inspect command</li> <li>winml export command</li> </ul>"},{"location":"concepts/how-it-works/","title":"How winml-cli Works","text":"<p>winml-cli is a toolkit for converting PyTorch and Hugging Face models into ONNX artifacts that are optimized and compiled for Windows ML execution providers (EPs). Starting from a model identifier or a pre-exported ONNX file, winml-cli runs a staged pipeline \u2014 export, optimize, quantize, compile \u2014 and produces a final <code>model.onnx</code> ready for inference via a Windows ML session.</p> <p>Each stage is independently controllable. Quantization and compilation are optional and can be bypassed with a flag or by leaving the corresponding section of the build configuration empty. The same pipeline API that powers <code>winml build</code> is also the programmatic entry point for <code>WinMLAutoModel.from_pretrained()</code>.</p>"},{"location":"concepts/how-it-works/#the-pipeline-at-a-glance","title":"The Pipeline at a Glance","text":"<p>The stages run in order, and each one writes an intermediate ONNX file to the output directory. All intermediate artifacts are preserved so you can inspect any stage's output or feed a pre-processed file into a later stage directly.</p>"},{"location":"concepts/how-it-works/#pipeline-stages","title":"Pipeline Stages","text":""},{"location":"concepts/how-it-works/#export-winml-export","title":"Export \u2014 <code>winml export</code>","text":"<p><code>winml export</code> loads a Hugging Face model (pretrained or random-weight), traces it with torch.export or an Optimum-based exporter, and writes a portable, device-agnostic ONNX file. The output at this stage is a plain ONNX graph with float32 weights and no EP-specific nodes.</p>"},{"location":"concepts/how-it-works/#analyze-winml-analyze","title":"Analyze \u2014 <code>winml analyze</code>","text":"<p><code>winml analyze</code> performs static compatibility analysis on an ONNX graph against a target execution provider. It classifies every node as Supported, Partial, Unsupported, or Unknown \u2014 without running the model on the device. Use it before building to check if your model (or an intermediate artifact from any pipeline stage) will run cleanly on the target EP:</p> <pre><code>winml analyze -m model.onnx --ep qnn --device npu\n</code></pre> <p>Add <code>--optim-config optim.json</code> to output auto-discovered optimization recommendations that can be fed directly into <code>winml optimize</code>. The same analyzer also drives the autoconf feedback loop inside <code>winml build</code>.</p>"},{"location":"concepts/how-it-works/#optimize-winml-optimize","title":"Optimize \u2014 <code>winml optimize</code>","text":"<p><code>winml optimize</code> runs graph-level transformations on the exported ONNX: operator fusion (attention, layer norm, GeLU), constant folding, and graph pruning. The optimize stage also contains an autoconf loop: a static analyzer inspects the graph for nodes that the target EP cannot dispatch natively, and re-runs optimization with adjusted fusion flags until no further improvements are found (up to a configurable iteration limit).</p>"},{"location":"concepts/how-it-works/#quantize-winml-quantize","title":"Quantize \u2014 <code>winml quantize</code>","text":"<p><code>winml quantize</code> inserts Quantize-Dequantize (QDQ) nodes into the optimized graph to reduce weights and activations to lower-precision types (for example, int8 weights with uint8 activations). Calibration data is used to compute quantization parameters per tensor. If the input model already contains QDQ nodes, this stage is skipped automatically.</p>"},{"location":"concepts/how-it-works/#compile-winml-compile","title":"Compile \u2014 <code>winml compile</code>","text":"<p><code>winml compile</code> invokes an EP-specific compiler (for example, the QNN compiler for NPU targets) to embed a pre-compiled binary cache inside the ONNX graph as an EPContext node. At inference time, the EP loads the cached binary directly, bypassing per-session compilation. Compilation is optional; omitting it produces a portable ONNX that is compiled on first load by the runtime.</p>"},{"location":"concepts/how-it-works/#perf-and-eval-winml-perf-winml-eval","title":"Perf and Eval \u2014 <code>winml perf</code> / <code>winml eval</code>","text":"<p>After the model is built, <code>winml perf</code> benchmarks inference latency and throughput using a Windows ML session, and <code>winml eval</code> runs task-specific accuracy evaluation. Neither command modifies the model; they consume the final <code>model.onnx</code> produced by the pipeline.</p>"},{"location":"concepts/how-it-works/#winml-build-as-the-one-shot-wrapper","title":"<code>winml build</code> as the One-Shot Wrapper","text":"<p>Running each stage individually is useful when iterating on a specific step, but the normal workflow is <code>winml build</code>, which orchestrates the full pipeline in a single command:</p> <pre><code>winml build -m microsoft/resnet-50 -o output/\n</code></pre> <p>The <code>-c config.json</code> flag is optional. If omitted, <code>winml build</code> auto-generates a default config internally. To customize pipeline settings, generate a config first with <code>winml config</code> and then pass it:</p> <pre><code>winml config -m microsoft/resnet-50 -o config.json\nwinml build -c config.json -m microsoft/resnet-50 -o output/\n</code></pre> <p><code>winml build</code> auto-detects whether the input is a Hugging Face model ID or an existing ONNX file and calls the appropriate internal API (<code>build_hf_model</code> or <code>build_onnx_model</code>). When given an ONNX file directly, the export stage is skipped and the pipeline starts at optimize.</p> <p>Individual stages can be bypassed from the command line without editing the config file:</p> <pre><code># Skip quantization and compilation\nwinml build -m bert-base-uncased -o output/ --no-quant --no-compile\n\n# Skip optimization (for pre-quantized input)\nwinml build -m model_qdq.onnx -o output/ --no-optimize\n</code></pre>"},{"location":"concepts/how-it-works/#configuration-winmlbuildconfig-vs-cli-flags","title":"Configuration: <code>WinMLBuildConfig</code> vs CLI Flags","text":"<p>Pipeline behavior is primarily governed by a <code>WinMLBuildConfig</code> JSON file generated by <code>winml config</code>. The config is a hierarchical structure with one section per stage:</p> <pre><code>WinMLBuildConfig\n\u251c\u2500\u2500 loader    \u2014 model type, task, input constraints\n\u251c\u2500\u2500 export    \u2014 input tensor specs, opset, backend\n\u251c\u2500\u2500 optim     \u2014 fusion flags, optimization level\n\u251c\u2500\u2500 quant     \u2014 precision, calibration settings (null = skip stage)\n\u251c\u2500\u2500 compile   \u2014 target EP, device (null = skip stage)\n\u2514\u2500\u2500 eval      \u2014 evaluation settings\n</code></pre> <p>Setting <code>quant</code> or <code>compile</code> to <code>null</code> in the JSON file is equivalent to passing <code>--no-quant</code> or <code>--no-compile</code> on the command line; both result in the corresponding stage being skipped. CLI flags override the config at runtime without modifying the file, which is convenient for one-off experiments.</p> <p>The config file is written (or updated) to the output directory after the optimize stage completes, capturing any autoconf-adjusted fusion flags so the build is reproducible. This persisted <code>winml_build_config.json</code> is a self-contained pipeline specification that you can check into version control and run in CI/CD (<code>winml build -c winml_build_config.json -m &lt;model&gt; -o output/</code>) for repeatable, unattended builds across environments.</p> <p>For the full field-by-field schema, see Reference \u2014 Config Schema.</p>"},{"location":"concepts/how-it-works/#see-also","title":"See Also","text":"<ul> <li>winml build \u2014 full reference for the build command</li> <li>winml export \u2014 export command reference</li> <li>ONNX and Execution Providers \u2014 background on EPs and the ONNX runtime</li> <li>Config and build \u2014 detailed field-by-field config documentation</li> </ul>"},{"location":"concepts/load-and-export/","title":"Load and export","text":"<p>The first stage of the winml-cli pipeline is the most deterministic: bring a model into memory and convert it to ONNX. Everything that follows \u2014 optimization, quantization, compilation \u2014 operates on that ONNX artifact. A well-exported graph with accurate metadata travels cleanly through the rest of the pipeline without requiring patching or re-export.</p> <p>Loading is an internal operation: the loader module resolves model provenance, selects the right HuggingFace model class, and prepares the weights for tracing. The <code>winml export</code> command is the surface users interact with directly.</p>"},{"location":"concepts/load-and-export/#loading-a-model","title":"Loading a model","text":"<p>When you point winml-cli at a model identifier, the internal loader resolves it in one of two ways. If the identifier looks like a HuggingFace Hub path (e.g., <code>prajjwal1/bert-tiny</code>), the loader downloads the model weights and configuration to the standard HuggingFace cache at <code>~/.cache/huggingface</code>. Subsequent runs are served from that cache without re-downloading. If the identifier is a path to a local PyTorch checkpoint directory, the loader reads it directly without network access.</p> <p>In both cases the loader auto-detects the task \u2014 image classification, text feature extraction, and so on \u2014 and selects a corresponding HuggingFace model class. The result is a PyTorch model object ready for tracing.</p> <p>Before committing to a full export you can verify that the loader resolved everything correctly with <code>winml inspect</code>. It prints the detected task, the HuggingFace model class, the export configuration, and the WinML inference class \u2014 all without downloading weights. Add <code>--hierarchy</code> to reconstruct the PyTorch module tree from random-weight tracing.</p> <p>Some community models host custom Python code in their repositories. The loader refuses to execute it by default. Pass <code>--trust-remote-code</code> to <code>winml config</code> when generating a build configuration for such a model.</p>"},{"location":"concepts/load-and-export/#exporting-to-onnx","title":"Exporting to ONNX","text":"<p><code>winml export</code> converts the loaded model to ONNX. The conversion uses TorchScript tracing by default, which follows actual execution paths and tends to produce compact, inference-oriented graphs. A <code>--dynamo</code> flag exists for the PyTorch 2.x dynamo exporter; however, Note: the <code>--dynamo</code> flag is reserved for the PyTorch 2.x dynamo exporter but is not yet functional in the current release \u2014 passing it logs a warning and the flag is ignored.</p> <p>By default the exporter runs an eight-step process that includes hierarchy tracing and tag injection. The result is an ONNX file enriched with structural metadata that powers downstream features such as per-module benchmarking, inspector views, and optimizer scoping.</p>"},{"location":"concepts/load-and-export/#hierarchy-tagging-in-detail","title":"Hierarchy tagging in detail","text":"<p>During export the HTP (Hierarchy-preserving Tags Protocol) exporter attaches two pieces of information to every ONNX graph node via <code>node.metadata_props</code>:</p> Key Value Example <code>winml.hierarchy.tag</code> Full module path the node originated from <code>/BertModel/BertEncoder/BertLayer.0/BertAttention</code> <code>winml.hierarchy.depth</code> Number of path segments (integer as string) <code>4</code>"},{"location":"concepts/load-and-export/#how-tags-are-built","title":"How tags are built","text":"<p>The exporter registers PyTorch forward hooks on each module. When a module executes, a pre-hook pushes its class name onto a tag stack; the post-hook pops it. This produces hierarchical paths that mirror the PyTorch module tree:</p> <pre><code>flowchart LR\n    A[Register hooks] --&gt; B[Run forward pass]\n    B --&gt; C[Pre-hook pushes tag]\n    C --&gt; D[Child modules execute]\n    D --&gt; E[Post-hook pops tag]\n    E --&gt; F[Tag stack \u2192 path]</code></pre> <p>Only modules that are actually executed during tracing receive tags \u2014 unused modules are excluded. For example, <code>prajjwal1/bert-tiny</code> has 48 registered modules but only 18 are reached during a forward pass.</p>"},{"location":"concepts/load-and-export/#concrete-example-bert-tiny","title":"Concrete example: BERT-tiny","text":"<p>Running <code>winml export -m prajjwal1/bert-tiny -o model.onnx -v</code> produces the following hierarchy tree (18 traced modules, 132 ONNX nodes, 100 % coverage):</p> <pre><code>BertModel (132 nodes)\n\u251c\u2500\u2500 BertEmbeddings: embeddings (7 nodes)\n\u251c\u2500\u2500 BertEncoder: encoder (106 nodes)\n\u2502   \u251c\u2500\u2500 BertLayer: encoder.layer.0 (53 nodes)\n\u2502   \u2502   \u251c\u2500\u2500 BertAttention: encoder.layer.0.attention (39 nodes)\n\u2502   \u2502   \u2502   \u251c\u2500\u2500 BertSelfOutput: encoder.layer.0.attention.output (4 nodes)\n\u2502   \u2502   \u2502   \u2514\u2500\u2500 BertSdpaSelfAttention: encoder.layer.0.attention.self (35 nodes)\n\u2502   \u2502   \u251c\u2500\u2500 BertIntermediate: encoder.layer.0.intermediate (10 nodes)\n\u2502   \u2502   \u2502   \u2514\u2500\u2500 GELUActivation: encoder.layer.0.intermediate.intermediate_act_fn (8 nodes)\n\u2502   \u2502   \u2514\u2500\u2500 BertOutput: encoder.layer.0.output (4 nodes)\n\u2502   \u2514\u2500\u2500 BertLayer: encoder.layer.1 (53 nodes)\n\u2502       \u2514\u2500\u2500 ... (same structure)\n\u2514\u2500\u2500 BertPooler: pooler (0 nodes)\n</code></pre> <p>Each ONNX node gets its tag from the module it belongs to. Here are a few examples from the actual exported model:</p> ONNX node name Assigned tag <code>/embeddings/word_embeddings/Gather</code> <code>/BertModel/BertEmbeddings</code> <code>/encoder/layer.0/attention/self/query/MatMul</code> <code>/BertModel/BertEncoder/BertLayer.0/BertAttention/BertSdpaSelfAttention</code> <code>/encoder/layer.0/intermediate/intermediate_act_fn/Mul</code> <code>/BertModel/BertEncoder/BertLayer.0/BertIntermediate/GELUActivation</code> <code>/Unsqueeze</code> (no scope) <code>/BertModel</code> (root fallback)"},{"location":"concepts/load-and-export/#node-to-module-mapping","title":"Node-to-module mapping","text":"<p>After the ONNX graph is produced by <code>torch.onnx.export</code>, a 4-priority system assigns each ONNX node to the closest matching module:</p> <ol> <li>Direct match (61 %) \u2014 the node's scope name maps exactly to a traced module.</li> <li>Parent match (24 %) \u2014 walk up the scope hierarchy until a traced module is found.</li> <li>Operation fallback (optional, off by default) \u2014 find the most similar scope by common prefix.</li> <li>Root fallback (14 %) \u2014 unmatched nodes receive the model root tag (e.g. <code>/BertModel</code>).</li> </ol> <p>This guarantees 100 % tag coverage: every node in the graph carries a non-empty tag.</p>"},{"location":"concepts/load-and-export/#graph-level-metadata","title":"Graph-level metadata","text":"<p>Beyond per-node tags, the exporter also writes model-level metadata properties:</p> Key Content <code>winml.io.inputs</code> JSON array of <code>InputTensorSpec</code> \u2014 name, shape, dtype, and optional <code>value_range</code> <code>winml.io.outputs</code> JSON array of <code>OutputTensorSpec</code> \u2014 name, shape, dtype <p>These I/O specs enable tools like <code>winml perf</code> to generate correct dummy inputs for benchmarking and <code>winml inspect</code> to display tensor shapes without loading the model into a runtime.</p>"},{"location":"concepts/load-and-export/#sidecar-metadata-file","title":"Sidecar metadata file","text":"<p>Alongside the <code>.onnx</code> file, the exporter writes a <code>*_htp_metadata.json</code> sidecar containing:</p> <ul> <li><code>nodes</code> \u2014 complete mapping of every ONNX node name \u2192 hierarchy tag</li> <li><code>modules</code> \u2014 traced module information (class name, tag, execution order)</li> <li><code>statistics</code> \u2014 export time, node counts, coverage percentage</li> <li><code>outputs</code> \u2014 I/O tensor specifications</li> </ul> <p>Use <code>--with-report</code> to additionally generate a human-readable markdown report (<code>*_htp_export_report.md</code>).</p>"},{"location":"concepts/load-and-export/#features-that-depend-on-tags","title":"Features that depend on tags","text":"<ul> <li><code>winml inspect --hierarchy</code> \u2014 traces the model with random weights and displays the resulting module tree in the terminal. This is a lightweight preview of what tags will look like after a full export.</li> <li><code>winml perf --module &lt;ClassName&gt;</code> \u2014 isolates a submodule (e.g. <code>BertAttention</code>) and benchmarks it independently.</li> </ul>"},{"location":"concepts/load-and-export/#disabling-tags","title":"Disabling tags","text":"<p>If you need a clean, standard-compliant ONNX without custom metadata \u2014 to hand off to a third-party tool, for example \u2014 pass <code>--no-hierarchy</code>. (The old <code>--clean-onnx</code> spelling remains as a deprecated hidden alias.) The graph behaviour is unchanged, but hierarchy-dependent features will not work against that file.</p>"},{"location":"concepts/load-and-export/#where-it-goes-wrong","title":"Where it goes wrong","text":"<p>Most export failures fall into three categories.</p> <p>Task mismatch. The loader auto-detects task from the model card and configuration, but some models are registered under multiple tasks or have ambiguous metadata. If the wrong task is selected the exporter generates incorrect dummy inputs and the trace fails or produces wrong output shapes. Override it explicitly with <code>--task</code>, for example <code>--task image-feature-extraction</code>.</p> <p>Shape issues. Transformer models often have symbolic sequence-length dimensions; vision models may expect a fixed spatial resolution. If the default dummy inputs do not match what the model accepts, shape inference will fail or produce dynamic shapes that downstream tools cannot handle. Provide a <code>--shape-config</code> JSON file with explicit overrides, or use <code>--input-specs</code> to supply a fully specified input manifest.</p> <p>Custom modules. Some models contain <code>torch.nn.Module</code> subclasses the tracer cannot automatically decompose. A <code>--torch-module</code> option (comma-separated class names) is intended to include them as distinct hierarchy nodes rather than inlining them \u2014 most often needed for custom normalization or attention implementations defined in the model repository. Note: the <code>--torch-module</code> flag is reserved for module-targeted export but is not yet functional in the current release \u2014 passing it logs a warning and the flag is ignored.</p>"},{"location":"concepts/load-and-export/#see-also","title":"See also","text":"<ul> <li>Graph and IR</li> <li>inspect command</li> <li>export command</li> </ul>"},{"location":"concepts/perf-and-monitoring/","title":"Perf and monitoring","text":"<p>Knowing that a model produces correct outputs is necessary but not sufficient for a production deployment. You also need to know how fast it runs, how consistently it runs, and where the time goes when it does not run fast enough. <code>winml perf</code> is the primary tool in <code>winml-cli</code> for answering those questions. It synthesises end-to-end latency numbers and live hardware utilisation into a single benchmarking workflow.</p> <p>Because <code>winml perf</code> accepts both HuggingFace model IDs and local <code>.onnx</code> files, you can benchmark at any stage of the development cycle \u2014 from a freshly exported float model through to a compiled, quantized production artifact.</p>"},{"location":"concepts/perf-and-monitoring/#what-perf-measures","title":"What perf measures","text":"<p>At its core, <code>winml perf</code> runs a configurable number of inference iterations and reports latency statistics. Here is a real example benchmarking <code>bert-tiny</code> on CPU:</p> <pre><code>$ winml perf -m bert-tiny.onnx --device cpu --iterations 50 --warmup 5\n\nDevice:      cpu / CPUExecutionProvider\nTask:        auto (auto-detected)\nModel Precision:   fp32\nInputs:      input_ids            [1, 512]    int32\n             attention_mask       [1, 512]    int32\n             token_type_ids       [1, 512]    int32\nOutputs:     last_hidden_state    [1, 512, 128]\n</code></pre> <p>Output latency table:</p> Avg P50 P90 P95 P99 Min Max Std 5.53 5.40 6.55 6.87 7.65 4.89 7.65 0.58 <pre><code>Warmup: 14.14 ms avg (first 5 iterations)\nThroughput: 180.72 samples/sec\n</code></pre> <p>Key parameters:</p> Flag Purpose Default <code>--iterations</code> Number of benchmark iterations 100 <code>--warmup</code> Warmup iterations excluded from statistics 10 <code>--batch-size</code> Batch size for input generation 1 <code>-d, --device</code> Target device: <code>auto</code>, <code>cpu</code>, <code>gpu</code>, <code>npu</code> <code>auto</code> <code>--ep</code> Specific execution provider (e.g. <code>qnn</code>, <code>dml</code>, <code>openvino</code>) auto-resolved from device <code>--precision</code> Precision mode: <code>auto</code>, <code>fp32</code>, <code>fp16</code>, <code>int8</code>, <code>int16</code>, or <code>w{x}a{y}</code> <code>auto</code> <code>--quantize/--no-quantize</code> Include quantization during model build <code>--quantize</code> <code>--skip-build/--no-skip-build</code> Skip the build pipeline for ONNX inputs <code>--skip-build</code>"},{"location":"concepts/perf-and-monitoring/#output-format","title":"Output format","text":"<p>Add <code>-f json</code> to emit structured JSON to stdout, suitable for CI pipelines or automated comparisons:</p> <pre><code>{\n  \"benchmark_info\": {\n    \"model_id\": \"bert-tiny.onnx\",\n    \"task\": \"auto-detected\",\n    \"device\": \"cpu\",\n    \"ep\": \"CPUExecutionProvider\",\n    \"precision\": \"auto\",\n    \"iterations\": 50,\n    \"warmup\": 5,\n    \"batch_size\": 1,\n    \"timestamp\": \"2026-06-11T03:27:24+00:00\"\n  },\n  \"model_info\": {\n    \"input_names\": [\"input_ids\", \"attention_mask\", \"token_type_ids\"],\n    \"input_shapes\": [[1, 512], [1, 512], [1, 512]],\n    \"input_types\": [\"int32\", \"int32\", \"int32\"],\n    \"output_names\": [\"last_hidden_state\"],\n    \"output_shapes\": [[1, 512, 128]]\n  },\n  \"latency_ms\": {\n    \"mean\": 5.53, \"p50\": 5.40, \"p90\": 6.55,\n    \"p95\": 6.87, \"p99\": 7.65, \"min\": 4.89, \"max\": 7.65,\n    \"std\": 0.58, \"warmup_mean\": 14.14\n  },\n  \"throughput\": { \"samples_per_sec\": 180.72, \"batches_per_sec\": 180.72 },\n  \"raw_samples_ms\": [5.12, 5.40, ...]\n}\n</code></pre> <p>Results are also saved automatically to <code>~/.cache/winml/perf/&lt;model_slug&gt;/&lt;timestamp&gt;.json</code> for later comparison. Override the path with <code>--output</code>.</p>"},{"location":"concepts/perf-and-monitoring/#live-monitoring","title":"Live monitoring","text":"<p>Latency numbers alone do not tell you whether the hardware is actually being used. A slow NPU inference could mean the model is running on the NPU and hitting a memory bottleneck, or it could mean the EP silently fell back to CPU and is not using the NPU at all.</p> <p>The <code>--monitor</code> flag adds a live terminal chart (powered by plotext + Rich Live) that streams hardware utilisation for whichever device is being benchmarked. The chart updates once per iteration so you can see whether utilisation is sustained, bursty, or absent. This is particularly useful when commissioning a new model on QNN or DirectML hardware, where EP fallback can be hard to detect from latency numbers alone. If the chart stays near zero while the benchmark runs, it is a strong signal that the model may not be executing on the expected device \u2014 investigate further with EP-specific tools.</p> <pre><code>winml perf -m model.onnx --device npu --monitor\n</code></pre> <p>Display updates are not included in the timed inference call, but monitoring may introduce small system overhead from background PDH polling.</p>"},{"location":"concepts/perf-and-monitoring/#memory-and-resource-metrics","title":"Memory and resource metrics","text":"<p>When <code>--monitor</code> is active, hardware metrics are sampled throughout the benchmark and reported at the end. These metrics help answer questions like \"how much device memory does this model need?\" and \"is the model memory-bound?\".</p> <p>The metrics collected depend on the target device:</p> Metric CPU GPU NPU CPU utilisation (mean/peak %) \u2713 \u2713 \u2713 RAM (used MB, peak MB) \u2713 \u2713 \u2713 Device utilisation (mean/peak %) \u2014 \u2713 \u2713 Device memory local (peak MB) \u2014 \u2713 \u2713 Device memory shared (peak MB) \u2014 \u2713 \u2713 Engine running time (ns) \u2014 \u2713 \u2713 <ul> <li>CPU: Only system-level metrics (CPU %, RAM) are shown in terminal output. In JSON, <code>device_memory</code> and <code>running_time_ns</code> are still present but will be zero.</li> <li>GPU: Reports GPU engine utilisation plus dedicated VRAM (<code>local_peak_mb</code>) and shared system memory (<code>shared_peak_mb</code>) allocated by the GPU driver.</li> <li>NPU: Same structure as GPU. NPU adapters register as Windows GPU Engine devices, so utilisation and memory are read via the same PDH counters. <code>local_peak_mb</code> represents dedicated adapter memory; <code>shared_peak_mb</code> is system memory shared with the NPU.</li> </ul>"},{"location":"concepts/perf-and-monitoring/#terminal-output","title":"Terminal output","text":"<p>CPU device:</p> <pre><code>Hardware (during benchmark)\n  CPU: 8.3% avg  |  Mem: 644 MB\n</code></pre> <p>NPU or GPU device:</p> <pre><code>Hardware (during benchmark)\n  NPU: 87.3% avg, 100.0% peak  |  CPU: 12.1% avg  |  Mem: 1842 MB\n  Device Mem: 245/0 MB (local/shared)\n</code></pre>"},{"location":"concepts/perf-and-monitoring/#json-structure","title":"JSON structure","text":"<p>In JSON output (<code>-f json</code>), these metrics appear under the <code>hw_monitor</code> key:</p> <pre><code>\"hw_monitor\": {\n  \"monitor\": \"HWMonitor\",\n  \"device_kind\": null,\n  \"adapter_luid\": null,\n  \"cpu\": { \"mean_pct\": 15.8, \"peak_pct\": 16.71, \"sample_count\": 2 },\n  \"ram\": { \"used_mb\": 640.21, \"peak_mb\": 640.21 },\n  \"device_memory\": { \"local_peak_mb\": 0.0, \"shared_peak_mb\": 0.0 },\n  \"running_time_ns\": 0\n}\n</code></pre> <p>When a hardware accelerator is active, <code>device_kind</code> will be <code>\"npu\"</code> or <code>\"gpu\"</code>, and an additional key (e.g. <code>\"npu\"</code>) appears with device utilisation:</p> <pre><code>\"hw_monitor\": {\n  \"monitor\": \"HWMonitor\",\n  \"device_kind\": \"npu\",\n  \"adapter_luid\": \"0x0000abcd12340000\",\n  \"cpu\": { \"mean_pct\": 12.1, \"peak_pct\": 34.5, \"sample_count\": 50 },\n  \"ram\": { \"used_mb\": 1842.0, \"peak_mb\": 1910.0 },\n  \"device_memory\": { \"local_peak_mb\": 245.0, \"shared_peak_mb\": 0.0 },\n  \"npu\": { \"mean_pct\": 87.3, \"peak_pct\": 100.0, \"sample_count\": 50 },\n  \"running_time_ns\": 4820000000\n}\n</code></pre> <p>This makes it straightforward to track memory consumption across model revisions or compare devices programmatically.</p>"},{"location":"concepts/perf-and-monitoring/#per-module-benchmarking","title":"Per-module benchmarking","text":"<p>Large Transformer-family models contain many repeated module instances \u2014 attention blocks, feed-forward layers, encoder stages. When you want to understand the cost of one type of block rather than the full network, <code>--module &lt;ClassName&gt;</code> isolates and benchmarks matching modules from the HuggingFace model hierarchy.</p> <pre><code>winml perf -m bert-base-uncased --module BertAttention\n</code></pre> <p>This builds and benchmarks each <code>BertAttention</code> instance separately and reports per-instance statistics. The <code>--module</code> argument must be a class name (e.g. <code>BertAttention</code>), not a dotted module path (e.g. not <code>encoder.layer.0.attention</code>).</p> <p>Internally, <code>--module</code> uses <code>torchinfo</code> to discover all submodule instances matching the given class name in the HuggingFace model. For each match it generates a separate build config, exports an isolated ONNX file, and benchmarks it independently. This requires a HuggingFace model ID (not a local <code>.onnx</code> file) because it needs access to the PyTorch module tree.</p>"},{"location":"concepts/perf-and-monitoring/#see-also","title":"See also","text":"<ul> <li>Load and export \u2014 how the module-tree metadata that <code>--module</code> targets gets written</li> <li>Eval and datasets \u2014 accuracy measurement to pair with performance numbers</li> <li>perf command reference</li> </ul>"},{"location":"concepts/primitives-and-pipeline/","title":"Primitives and pipeline","text":"<p>winml-cli exposes two ways to turn a Hugging Face model or ONNX file into a Windows ML-ready artifact. You can invoke each stage of the pipeline as an individual primitive command \u2014 <code>winml export</code>, <code>winml analyze</code>, <code>winml optimize</code>, <code>winml quantize</code>, <code>winml compile</code>, <code>winml perf</code>, <code>winml eval</code> \u2014 running one step at a time with full control over inputs and outputs. Alternatively, <code>winml build</code> wraps all of those stages into a single command driven by a <code>WinMLBuildConfig</code> JSON file.</p> <p>Understanding when to reach for a primitive versus the pipeline wrapper is the central workflow decision in winml-cli. Both paths produce the same artifacts; the difference is in repeatability, convenience, and how much you need to inspect or vary individual stages.</p>"},{"location":"concepts/primitives-and-pipeline/#the-primitive-commands","title":"The primitive commands","text":"<p>Each primitive command corresponds to one stage of the pipeline described in How winml-cli works. They run in order, each producing an ONNX file that the next stage consumes:</p> <ul> <li><code>winml export</code> \u2014 loads a Hugging Face model, traces it with PyTorch and the   Optimum exporter, and writes a portable float32 ONNX file with no EP-specific   nodes.</li> <li><code>winml analyze</code> \u2014 runs compatibility and runtime checks on the exported ONNX   graph, detecting unsupported operators, QDQ issues, and device-specific   constraints before further pipeline stages.</li> <li><code>winml optimize</code> \u2014 applies graph transformations (operator fusion, constant   folding, graph pruning) and runs an autoconf loop to maximize EP-compatible   coverage.</li> <li><code>winml quantize</code> \u2014 inserts QDQ nodes using calibration data, reducing weight   and activation types to lower precision (for example, int8) for efficient   inference.</li> <li><code>winml compile</code> \u2014 invokes an EP-specific compiler (for example, QNN for NPU   targets) to embed a pre-compiled binary cache in the ONNX graph as an EPContext   node.</li> <li><code>winml perf</code> \u2014 benchmarks latency and throughput against a Windows ML   session; does not modify the model.</li> <li><code>winml eval</code> \u2014 evaluates task-specific accuracy on a dataset; does not   modify the model.</li> </ul> <p>You can enter the pipeline at any stage. If you already have an optimized ONNX file, pass it directly to <code>winml quantize</code> without re-exporting. Each command writes its output to a path you specify, so all intermediate artifacts are preserved for inspection.</p>"},{"location":"concepts/primitives-and-pipeline/#the-pipeline-wrapper","title":"The pipeline wrapper","text":"<p><code>winml build</code> orchestrates all of the above stages in order from a single <code>WinMLBuildConfig</code> JSON file:</p> <pre><code>winml build -c config.json -m microsoft/resnet-50 -o output/\n</code></pre> <p>The config file tells <code>winml build</code> which stages to run and how to configure them. Setting the <code>quant</code> or <code>compile</code> section to <code>null</code> in the JSON skips that stage; passing <code>--no-quant</code>, <code>--no-compile</code>, or <code>--no-optimize</code> on the command line achieves the same effect at runtime without editing the file.</p> <p>When the model argument points to an existing ONNX file instead of a Hugging Face ID, <code>winml build</code> detects this and skips the export stage, running analyze \u2192 optimize \u2192 quantize \u2192 compile directly. This mirrors how each primitive command handles the same case.</p> <p><code>winml build</code> also accepts <code>--use-cache</code> in place of <code>-o</code>/<code>--output-dir</code>, routing artifacts to the winml-cli global cache at <code>~/.cache/winml/</code> instead of a local directory. Use <code>--rebuild</code> to force a clean re-run even when cached artifacts already exist.</p>"},{"location":"concepts/primitives-and-pipeline/#when-to-choose-which","title":"When to choose which","text":"<p>Use primitive commands when:</p> <ul> <li>You are learning the pipeline and want to observe each stage's output in   isolation.</li> <li>You are debugging a specific stage \u2014 for example, inspecting the optimized graph   before quantization, or testing a quantized model before compiling it.</li> <li>You need a one-off variation that does not warrant a versioned config, such as   trying a different opset or a different calibration sample count.</li> <li>You are integrating winml-cli output into a larger script that already manages   intermediate files.</li> </ul> <p>Use <code>winml build</code> when:</p> <ul> <li>You are targeting production or CI: a single config file captures the full   pipeline reproducibly and can be committed alongside the code that uses the   model.</li> <li>You want to share the exact build recipe with a teammate or reproduce it later   without reconstructing the sequence of primitive flags.</li> <li>You need the autoconf loop to propagate optimization decisions across stages,   which only <code>winml build</code> coordinates end-to-end.</li> <li>You want stage-skipping to be declarative (<code>quant: null</code> in the config) rather   than remembered flag-by-flag across invocations.</li> </ul> <p>The two approaches are not exclusive. A common pattern is to prototype with primitives \u2014 iterating on <code>winml optimize</code> and <code>winml quantize</code> individually to tune fusion flags and calibration \u2014 and then encode the final settings into a <code>WinMLBuildConfig</code> for repeatable production builds via <code>winml build</code>.</p>"},{"location":"concepts/primitives-and-pipeline/#see-also","title":"See also","text":"<ul> <li>How winml-cli works \u2014 pipeline stage order and internal   architecture</li> <li>Config and build \u2014 generating and versioning a   <code>WinMLBuildConfig</code></li> <li>winml build command reference</li> <li>Hugging Face Model to NPU tutorial \u2014 worked example   using primitive commands end-to-end</li> </ul>"},{"location":"concepts/quantization/","title":"Datatype and Quantization","text":"<p>Every ONNX tensor carries data in a specific numeric type \u2014 <code>float32</code>, <code>float16</code>, <code>int8</code>, <code>int16</code> \u2014 and every winml-cli pipeline makes deliberate choices about which type to use where. This page covers both halves of that decision: the datatype family winml-cli understands, and the quantization workflow that converts a model from one datatype to another to shrink it and run it faster on integer-native hardware.</p> <p>Quantization is the headline use of datatypes in winml-cli. By replacing <code>float32</code> weights and activations with <code>int8</code> or mixed precisions, you typically get a 2\u20134\u00d7 smaller model artifact and a 2\u20138\u00d7 latency speedup on NPU hardware. The trade-off is a potential reduction in model accuracy, the degree of which depends on the precision chosen and the sensitivity of the model.</p>"},{"location":"concepts/quantization/#datatypes","title":"Datatypes","text":"<p>winml-cli exposes a precision shorthand on the <code>--precision</code> flag that encodes the weight/activation dtype pair as a single string. The table below lists every precision from <code>_NAMED_PRECISIONS</code> in <code>config/precision.py</code>, together with the resolved quantization types. Float precisions (<code>fp32</code>, <code>fp16</code>) carry no quantization types because weights and activations remain in floating point throughout.</p> Precision Weight dtype Activation dtype Notes <code>auto</code> device-dependent device-dependent Resolves to <code>w8a16</code> (NPU), <code>fp16</code> (GPU/CPU) at runtime <code>fp32</code> float32 float32 No quantization; baseline accuracy <code>fp16</code> float16 float16 Half-precision float; no QDQ nodes inserted <code>int8</code> uint8 uint8 Static quantization; valid for QNN EP <code>int16</code> int16 uint16 Higher-accuracy quantization; larger model than int8 <code>w8a8</code> uint8 uint8 Equivalent to <code>int8</code>; explicit mixed-precision notation <code>w8a16</code> uint8 uint16 Mixed: compact weights, wider activations for accuracy <code>w4a16</code> n/a n/a Not supported. Rejected at validation \u2014 <code>is_quantized_precision(\"w4a16\")</code> returns <code>False</code> because 4-bit weight types are absent from <code>_BITS_TO_WEIGHT_TYPE</code> in <code>precision.py</code>. The string is not a recognized precision. <p>The <code>--weight-type</code> and <code>--activation-type</code> flags on <code>winml quantize</code> accept <code>uint8</code>, <code>int8</code>, <code>uint16</code>, or <code>int16</code> and override whatever the <code>--precision</code> shorthand would have resolved. This is useful when you need an unsigned weight type for QNN compatibility but a signed activation type for a specific operator constraint. See Weight and Activation for why the two need separate flags in the first place.</p>"},{"location":"concepts/quantization/#how-quantization-works-in-winml-cli","title":"How quantization works in winml-cli","text":"<p>winml-cli applies quantization by inserting QDQ (Quantize/Dequantize) nodes into the ONNX graph. The resulting file is a standard ONNX model that any ONNX Runtime execution provider can consume and optimize for its target hardware \u2014 the EP reads the QDQ pattern and fuses adjacent operations into true integer kernels.</p>"},{"location":"concepts/quantization/#calibration","title":"Calibration","text":"<p>Static quantization \u2014 the kind winml-cli applies \u2014 requires a calibration pass before inserting QDQ nodes. During calibration, a small set of representative inputs runs through the original floating-point model so that winml-cli can observe the actual range of values each tensor takes at runtime. Those observed ranges are then used to choose the scale and zero-point constants baked into the QDQ nodes.</p> <p>The <code>--samples</code> flag controls how many calibration inputs are used (default: <code>10</code>). More samples generally produce better range estimates but take longer. The <code>--method</code> flag selects the algorithm used to summarize the observed ranges:</p> <ul> <li><code>minmax</code> (default) \u2014 uses the absolute minimum and maximum observed values. Fast and predictable; can be sensitive to outliers.</li> <li><code>entropy</code> \u2014 minimizes the KL-divergence between the original and quantized distribution. Often yields better accuracy on models with heavy-tailed activation distributions.</li> <li><code>percentile</code> \u2014 clips a small fraction of extreme values before computing the range. A practical middle ground when outliers are present but entropy calibration is slow.</li> </ul> <p>Example using entropy calibration with more samples:</p> <pre><code>winml quantize -m model.onnx --precision int8 --samples 128 --method entropy\n</code></pre>"},{"location":"concepts/quantization/#the-qdq-pattern","title":"The QDQ pattern","text":"<p>The QDQ pattern is the standard ONNX representation for static quantization. winml-cli wraps the inputs and outputs of quantizable operators with pairs of <code>QuantizeLinear</code> and <code>DequantizeLinear</code> nodes. At the graph level the model still operates in floating-point; the QDQ nodes encode the scale and zero-point metadata that a runtime needs to fuse adjacent operations into true integer kernels.</p> <p>When the model runs under ONNX Runtime, the execution provider \u2014 whether CPU, DirectML, or a dedicated NPU EP \u2014 reads those QDQ patterns and performs its own graph fusion. This means the EP is free to apply hardware-specific optimizations without winml-cli needing to know anything about the target device's internal ISA or operator library. The QDQ model produced by <code>winml quantize</code> is a single portable artifact that can be deployed to any EP that supports integer execution.</p>"},{"location":"concepts/quantization/#when-quantization-is-lossy","title":"When quantization is lossy","text":"<p>Not all precision choices carry equal accuracy risk:</p> <ul> <li><code>fp16</code> is usually lossless in practice. Rounding errors relative to <code>fp32</code> are small enough that most models show no measurable accuracy difference.</li> <li><code>int8</code> and <code>int16</code> are inherently lossy. Compressing a 32-bit float into 8 or 16 bits discards information, and the magnitude of accuracy degradation depends on how well the calibration data represents the deployment distribution.</li> <li>Compound precisions like <code>w8a16</code> reduce the risk compared to full <code>int8</code> by preserving more precision in activations, but they are still lossy relative to <code>fp32</code>.</li> </ul> <p>Always validate accuracy after quantizing an integer-precision model. Run <code>winml eval</code> on a representative dataset and compare the metrics against the original floating-point baseline before shipping the quantized artifact.</p>"},{"location":"concepts/quantization/#see-also","title":"See also","text":"<ul> <li>Weight and Activation</li> <li>EP and Device</li> <li>quantize command reference</li> <li>eval command reference</li> </ul>"},{"location":"concepts/weight-and-activation/","title":"Weight and Activation","text":"<p>Every neural network model stores two kinds of numeric tensors that matter for deployment: weights, the static parameters baked in at training time, and activations, the intermediate values that flow through the graph at every inference call. Understanding the distinction is the key to reading winml-cli's precision flags, deciding when quantization is safe, and knowing why a model that runs fine on one execution provider may stall or degrade on another.</p>"},{"location":"concepts/weight-and-activation/#weights-are-static","title":"Weights are static","text":"<p>Weights are the trained parameters of the model: convolution kernels, linear projection matrices, attention weights, embedding tables, bias vectors. They are fixed at the moment the model is exported and stay constant for every inference call. Because they are static, their quantization parameters \u2014 the scale and zero-point used to compress them from fp32 to int8 \u2014 can be computed once, offline, using calibration data. <code>winml quantize</code> does exactly that: it observes the weight distributions in your exported ONNX and bakes the per-tensor scale/zero-point into the QDQ nodes that wrap the weights.</p> <p>In ONNX terms, weights are stored as initializers inside the graph. The runtime treats them as graph inputs that are always pre-supplied; you do not pass weights to a session at inference time, the way you pass an image tensor or a text prompt.</p>"},{"location":"concepts/weight-and-activation/#activations-are-dynamic","title":"Activations are dynamic","text":"<p>Activations are the intermediate results that flow through the graph during inference: the output of every matrix multiply, every layer norm, every attention softmax. Unlike weights, activations are regenerated on every forward pass and depend entirely on the input data. winml-cli cannot pre-compute their quantization parameters offline \u2014 instead, calibration runs a small set of representative inputs through the model and observes the actual ranges each activation tensor takes. Those observed ranges become the scale/zero-point baked into QDQ nodes around each activation.</p> <p>This is why calibration data matters. If the calibration set fails to represent the inputs you will see in production, the per-activation ranges will be wrong and the quantized model will lose more accuracy than necessary on real traffic.</p>"},{"location":"concepts/weight-and-activation/#why-they-need-separate-flags","title":"Why they need separate flags","text":"<p>The <code>--weight-type</code> and <code>--activation-type</code> flags on <code>winml quantize</code> exist because the optimal bit-width for weights is not necessarily the optimal bit-width for activations:</p> <ul> <li>Wider activation types (int16 vs int8) reduce accuracy loss at the cost of more memory bandwidth. Useful when activations have heavy-tailed distributions that quantize poorly at 8 bits.</li> <li>Narrower weight types compress the static footprint more aggressively. Useful when the model is memory-bound and accuracy headroom exists.</li> <li>Execution providers diverge along this boundary too. QNN on NPU pairs uint8 weights with uint8 or uint16 activations. DirectML on GPU can run float16 throughout. The CPU EP accepts almost any combination.</li> </ul> <p>The compound precision shorthand <code>w8a16</code> (8-bit weights, 16-bit activations) reflects this asymmetry directly: weights and activations get different bit-widths in one config string. For the full precision family and how each maps to weight/activation dtypes, see Datatype and Quantization.</p>"},{"location":"concepts/weight-and-activation/#see-also","title":"See also","text":"<ul> <li>Datatype and Quantization</li> <li>EP and Device</li> <li>quantize command</li> <li>Graph and IR</li> </ul>"},{"location":"getting-started/agent-skill/","title":"Agent Skill","text":"<p>winml-cli ships a Copilot Skill (<code>use-winml-cli</code>) that lets AI coding agents drive the entire model-building pipeline on your behalf. When a coding agent has this skill attached, it can inspect models, generate configs, run builds, and interpret results \u2014 without you having to remember exact flags or stage ordering.</p>"},{"location":"getting-started/agent-skill/#what-the-skill-provides","title":"What the skill provides","text":"<p>The skill teaches the agent:</p> Capability What the agent learns Pipeline shape The stage order (<code>inspect \u2192 export \u2192 analyze \u2192 optimize \u2192 quantize \u2192 compile \u2192 perf</code>) and when to enter mid-pipeline Flag discovery Always run <code>winml &lt;command&gt; --help</code> before quoting a command \u2014 never fabricate flags Output mapping Which command's <code>-o</code> produces the artifact the user actually needs Scope awareness Which model architectures are supported (classic DL) vs. out-of-scope (LLMs, diffusion) Hardware detection Use <code>winml sys --list-ep</code> to confirm what's available before targeting an EP Two paths When to use primitives (debugging, exploring) vs. config + build (production, CI)"},{"location":"getting-started/agent-skill/#how-to-use-it","title":"How to use it","text":""},{"location":"getting-started/agent-skill/#with-github-copilot-coding-agent","title":"With GitHub Copilot Coding Agent","text":"<p>To make the Copilot Coding Agent (the cloud agent that creates PRs) follow the skill's guidance, reference it in <code>.github/copilot-instructions.md</code>. The Coding Agent reads that file automatically when working on this repository.</p>"},{"location":"getting-started/agent-skill/#with-other-ai-agents","title":"With other AI agents","text":"<p>For agents that support custom instructions (e.g., Copilot Extensions, Claude, ChatGPT with file uploads, or custom MCP tool servers), attach the skill file as context:</p> <pre><code>skills/use-winml-cli/SKILL.md\n</code></pre> <p>You can copy the file contents into your agent's system prompt, upload it as a reference document, or include it in a <code>.github/copilot-instructions.md</code> for VS Code Copilot Chat. The skill uses standard markdown with YAML front-matter \u2014 any agent that accepts text context can benefit from it.</p>"},{"location":"getting-started/agent-skill/#skill-location","title":"Skill location","text":"<pre><code>winml-cli/\n\u2514\u2500\u2500 skills/\n    \u2514\u2500\u2500 use-winml-cli/\n        \u2514\u2500\u2500 SKILL.md          \u2190 the skill definition\n</code></pre>"},{"location":"getting-started/agent-skill/#example-agent-interaction","title":"Example agent interaction","text":"<pre><code>User: Can I run ConvNeXt on my Snapdragon X Elite NPU?\n\nAgent (with skill):\n1. Runs `winml sys --list-ep` \u2192 confirms QNNExecutionProvider is registered\n2. Runs `winml inspect -m microsoft/convnext-tiny-224` \u2192 confirms supported\n3. Runs `winml config --onnx ... -d npu -o config.json`\n4. Runs `winml build -c config.json -m microsoft/convnext-tiny-224 -o output/`\n5. Runs `winml perf -m output/model.onnx -d npu --monitor`\n6. Reports latency + NPU utilization to user\n</code></pre>"},{"location":"getting-started/installation/","title":"Installation","text":""},{"location":"getting-started/installation/#prerequisites","title":"Prerequisites","text":"Component Details Windows Windows 11 24H2 or later (required for NPU support) Hardware Device with CPU, GPU, or NPU Python 3.11 Package manager <code>uv</code> Version control <code>git</code> <p>No NPU?</p> <p>You can follow most of these docs without NPU hardware. All winml-cli commands accept <code>--device auto</code> and fall back to CPU or DirectML automatically. The tutorials document explicit CPU fallback paths.</p>"},{"location":"getting-started/installation/#install","title":"Install","text":"<pre><code>uv python install 3.11\nuv pip install winml-cli\n</code></pre> <p><code>uv python install 3.11</code> downloads and pins the exact Python version the project requires. <code>uv pip install winml-cli</code> installs the latest release from PyPI into a managed environment. No separate venv activation is needed.</p> <p>Install from source (for development)</p> <p>If you want to contribute or run the latest unreleased code:</p> <pre><code>git clone https://github.com/microsoft/winml-cli.git\ncd winml-cli\nuv sync\n</code></pre>"},{"location":"getting-started/installation/#verify","title":"Verify","text":"<pre><code>winml sys\n</code></pre> <p>Expected output (abbreviated):</p> <pre><code>+------------------------------------+\n|   winml-cli System Information     |\n+------------------------------------+\n\nEnvironment\n  Python Version    3.11.x\n  OS                Windows 11\n  Machine           AMD64\n\nML Libraries\n  Library        Version   Status\n  torch          2.x.x     OK\n  onnx           1.x.x     OK\n\nAvailable Devices (priority order)\n  #1  NPU   ...\n  #2  GPU   ...\n  #3  CPU   ...\n\nAvailable Execution Providers\n  QNNExecutionProvider           -&gt; NPU\n  DmlExecutionProvider           -&gt; GPU\n  CPUExecutionProvider           -&gt; CPU\n</code></pre> <p>This command enumerates available compute devices and execution providers on your machine. If an expected device or execution provider is missing, <code>winml sys</code> is the right place to diagnose it. See winml sys for the full flag reference and troubleshooting tips.</p>"},{"location":"getting-started/installation/#next-steps","title":"Next steps","text":"<ul> <li>Quickstart \u2014 export your first model in 5 minutes.</li> <li>End-to-End Tour \u2014 full pipeline targeting whatever hardware you have (NPU / GPU / CPU).</li> <li>How winml-cli Works \u2014 the mental model.</li> </ul>"},{"location":"getting-started/quickstart/","title":"Quickstart","text":""},{"location":"getting-started/quickstart/#verify-the-install","title":"Verify the install","text":"<p>Run the following command to enumerate available devices and execution providers on your machine:</p> <pre><code>uv run winml sys --list-device --list-ep\n</code></pre> <p><code>--list-device</code> and <code>--list-ep</code> print only the hardware and EP inventory. If the command exits without error, your winml-cli install is ready. See <code>winml sys</code> for the full flag reference.</p>"},{"location":"getting-started/quickstart/#inspect-the-model","title":"Inspect the model","text":"<p>Before downloading any models, confirm that winml-cli recognises the model:</p> <pre><code>uv run winml inspect -m microsoft/resnet-50\n</code></pre> <pre><code>+--------------------------- microsoft/resnet-50 ---------------------------+\n| Task          image-classification                                         |\n| Model Class   ResNetForImageClassification                                 |\n| Exporter      OptimumExporter                                              |\n| WinML Class   WinMLImageClassificationModel                                |\n| Status        Supported                                                    |\n+---------------------------------------------------------------------------+\n</code></pre> <p>Tip</p> <p>Always inspect before build to catch unsupported architectures early.</p>"},{"location":"getting-started/quickstart/#build-the-model","title":"Build the model","text":"<pre><code>uv run winml build -m microsoft/resnet-50 -o resnet_out/ --no-quant\n</code></pre> <p><code>winml build</code> runs all pipeline steps in sequence \u2014 export, optimize, quantize. You can start a model build without a config file, or provide one to configure each step in the sequence (see <code>winml config</code> to customize). All intermediate artifacts land in <code>resnet_out/</code>, so you can reuse any stage independently.</p> <p>After a successful build, you will find the following outputs in <code>resnet_out/</code>:</p> <ul> <li>A standard ONNX file for each completed stage \u2014 load, inspect, or pass any of these to a downstream tool independently.</li> <li><code>analyze_result.json</code> \u2014 detailed model compatibility insights for each Windows ML EP, including supported, partially supported, and unsupported operators, detected optimization patterns, and recommended optimization workflows.</li> <li>A declarative <code>winml_build_config</code> file \u2014 automatically generated after the build step to capture the full workflow end-to-end.</li> </ul>"},{"location":"getting-started/quickstart/#benchmark-the-model","title":"Benchmark the model","text":"<pre><code>uv run winml perf -m resnet_out/model.onnx --device auto --iterations 50 --monitor\n</code></pre> <p><code>--device auto</code> lets the CLI resolve the best available device on your machine \u2014 NPU first, then GPU, then CPU.</p>"},{"location":"getting-started/quickstart/#whats-next","title":"What's next","text":"<ul> <li>How winml-cli Works \u2014 understand what each command does under the hood.</li> <li>BERT sample \u2014 see the config + build + perf workflow in detail with a representative model.</li> </ul>"},{"location":"getting-started/quickstart/#see-also","title":"See also","text":"<ul> <li><code>winml build</code></li> <li><code>winml inspect</code></li> <li><code>winml perf</code></li> <li><code>winml sys</code></li> </ul>"},{"location":"getting-started/ui-quickstart/","title":"Try Windows ML CLI with a UI","text":"<p>If you prefer a graphical interface, you can use the Foundry Toolkit extension for VS Code to run Windows ML CLI model conversion without typing commands.</p>"},{"location":"getting-started/ui-quickstart/#quick-reference","title":"Quick reference","text":"<ol> <li>Install Visual Studio Code</li> <li>Install the Foundry Toolkit extension \u2014 search for <code>Foundry Toolkit</code> in the VS Code Extensions view</li> <li>Open the Model Conversion tool \u2014 in the Foundry Toolkit panel, select Model Conversion</li> <li>Choose your model \u2014 pick a model from Hugging Face, provide a local path, or select from the built-in model catalog filtered by Windows ML CLI</li> <li>Run the build \u2014 the extension invokes Windows ML CLI and streams the output to the VS Code terminal</li> </ol> <p>For a full walkthrough, see Build with Windows ML CLI (Preview) in the VS Code documentation.</p>"},{"location":"reference/","title":"Reference \u2014 Config Schema","text":"<p>This page documents the full schema for <code>WinMLBuildConfig</code>, the JSON configuration file that drives the winml-cli pipeline. Generate a config with <code>winml config</code>, then pass it to any command with <code>-c config.json</code>.</p> <p>The config is accepted by all pipeline commands \u2014 not just <code>winml build</code>. For example, <code>winml export -c config.json</code>, <code>winml quantize -c config.json</code>, and <code>winml compile -c config.json</code> each read the relevant section of the same config file. This lets you use a single config as the source of truth across all stages.</p>"},{"location":"reference/#top-level-structure","title":"Top-Level Structure","text":"<pre><code>{\n  \"loader\":  { ... },\n  \"export\":  { ... },\n  \"optim\":   { ... },\n  \"quant\":   { ... },\n  \"compile\": { ... },\n  \"eval\":    { ... },\n  \"auto\":    true\n}\n</code></pre> <p>Setting <code>quant</code> or <code>compile</code> to <code>null</code> skips that pipeline stage entirely. Setting <code>auto</code> to <code>true</code> (default) lets winml-cli auto-configure downstream stages based on the target device and precision.</p>"},{"location":"reference/#loader-model-loading","title":"<code>loader</code> \u2014 Model Loading","text":"Field Type Default Description <code>task</code> <code>str \\| null</code> <code>null</code> HuggingFace task (e.g., <code>image-classification</code>). Auto-detected if omitted. <code>model_class</code> <code>str \\| null</code> <code>null</code> Override model class (e.g., <code>AutoModelForCTC</code>). <code>model_type</code> <code>str \\| null</code> <code>null</code> HuggingFace model type (e.g., <code>bert</code>, <code>resnet</code>). <code>module_path</code> <code>str \\| null</code> <code>null</code> Dotted path to a submodule for targeted export. <code>user_script</code> <code>str \\| null</code> <code>null</code> Path to custom model class script. <code>trust_remote_code</code> <code>bool</code> <code>false</code> Trust remote code from HuggingFace."},{"location":"reference/#export-onnx-export","title":"<code>export</code> \u2014 ONNX Export","text":"Field Type Default Description <code>opset_version</code> <code>int</code> <code>17</code> ONNX opset version. <code>batch_size</code> <code>int</code> <code>1</code> Static batch size. Use 1 for QNN compatibility. <code>input_tensors</code> <code>list[InputTensorSpec] \\| null</code> <code>null</code> Input tensor specifications. Auto-inferred if omitted. <code>output_tensors</code> <code>list[OutputTensorSpec] \\| null</code> <code>null</code> Output tensor specifications. <code>dynamic_axes</code> <code>dict \\| null</code> <code>null</code> Dynamic axes mapping. \u26a0\ufe0f Breaks MatMulAddFusion on QNN. <code>export_params</code> <code>bool</code> <code>true</code> Include model parameters in ONNX. <code>do_constant_folding</code> <code>bool</code> <code>true</code> Fold constants during export. <code>verbose</code> <code>bool</code> <code>false</code> Verbose export logging. <code>dynamo</code> <code>bool</code> <code>false</code> Use PyTorch 2.x Dynamo exporter. <code>enable_hierarchy_tags</code> <code>bool</code> <code>true</code> Add module hierarchy tags to ONNX nodes. <code>clean_onnx</code> <code>bool</code> <code>false</code> Strip hierarchy tags after export. <code>hierarchy_tag_format</code> <code>\"full\" \\| \"module_only\"</code> <code>\"full\"</code> Tag detail level. <p>InputTensorSpec:</p> Field Type Description <code>name</code> <code>str \\| null</code> Tensor name (e.g., <code>pixel_values</code>). <code>dtype</code> <code>str \\| null</code> Data type (e.g., <code>float32</code>, <code>int64</code>). <code>shape</code> <code>list[int] \\| null</code> Tensor shape (e.g., <code>[1, 3, 224, 224]</code>). <code>value_range</code> <code>[float, float] \\| null</code> Min/max for dummy tensor generation."},{"location":"reference/#optim-graph-optimization","title":"<code>optim</code> \u2014 Graph Optimization","text":"<p>A dictionary of boolean fusion flags. All default to <code>false</code> unless auto-configured.</p> Field Type Description <code>gelu_fusion</code> <code>bool</code> Fuse GeLU activation patterns. <code>layer_norm_fusion</code> <code>bool</code> Fuse LayerNorm patterns. <code>matmul_add_fusion</code> <code>bool</code> Fuse MatMul + Add (enables BiasGelu). <p>Additional fusion flags can be added as key-value pairs.</p>"},{"location":"reference/#quant-quantization","title":"<code>quant</code> \u2014 Quantization","text":"<p>Set to <code>null</code> to skip quantization.</p> Field Type Default Description <code>mode</code> <code>\"qdq\" \\| \"static\" \\| \"dynamic\"</code> <code>\"qdq\"</code> Quantization mode. <code>weight_type</code> <code>\"uint8\" \\| \"int8\" \\| \"uint16\" \\| \"int16\"</code> <code>\"uint8\"</code> Weight data type. <code>activation_type</code> <code>\"uint8\" \\| \"int8\" \\| \"uint16\" \\| \"int16\"</code> <code>\"uint8\"</code> Activation data type. <code>calibration_method</code> <code>\"minmax\" \\| \"entropy\" \\| \"percentile\"</code> <code>\"minmax\"</code> Scale computation method. <code>samples</code> <code>int</code> <code>10</code> Number of calibration samples. <code>per_channel</code> <code>bool</code> <code>false</code> Per-channel quantization. <code>symmetric</code> <code>bool</code> <code>false</code> Symmetric quantization. <code>task</code> <code>str \\| null</code> <code>null</code> Task for dataset-aware calibration. <code>model_name</code> <code>str \\| null</code> <code>null</code> Model ID for calibration dataset resolution. <code>dataset_name</code> <code>str \\| null</code> <code>null</code> Override calibration dataset. <code>distribution</code> <code>str</code> <code>\"uniform\"</code> Random distribution for dummy data. <code>seed</code> <code>int \\| null</code> <code>null</code> Random seed for reproducibility. <code>calibration_load_path</code> <code>str \\| null</code> <code>null</code> Load pre-computed calibration scales. <code>calibration_save_path</code> <code>str \\| null</code> <code>null</code> Save calibration scales. <code>op_types_to_quantize</code> <code>list[str] \\| null</code> <code>null</code> Operator types to quantize (all if null). <code>nodes_to_exclude</code> <code>list[str] \\| null</code> <code>null</code> Node names to skip."},{"location":"reference/#compile-ep-compilation","title":"<code>compile</code> \u2014 EP Compilation","text":"<p>Set to <code>null</code> to skip compilation.</p> Field Type Default Description <code>ep_config.provider</code> <code>str</code> <code>\"qnn\"</code> EP alias: <code>qnn</code>, <code>cpu</code>, <code>dml</code>, <code>openvino</code>, <code>tensorrt</code>, <code>vitisai</code>, <code>migraphx</code>. <code>ep_config.device</code> <code>str</code> <code>\"auto\"</code> Target device: <code>npu</code>, <code>gpu</code>, <code>cpu</code>, <code>auto</code>. <code>ep_config.enable_ep_context</code> <code>bool</code> <code>true</code> Generate EPContext model. <code>ep_config.embed_context</code> <code>bool</code> <code>false</code> Embed binary in ONNX (true) or external .bin (false). <code>ep_config.compiler</code> <code>str</code> <code>\"ort\"</code> Compiler backend: <code>ort</code> or <code>qairt</code>. <code>ep_config.provider_options</code> <code>dict</code> <code>{}</code> EP-specific options. <code>ep_config.qnn_sdk_root</code> <code>str \\| null</code> <code>null</code> QNN SDK path for QAIRT compiler backend. <code>validate</code> <code>bool</code> <code>true</code> Validate compiled model. <code>verbose</code> <code>bool</code> <code>false</code> Verbose compilation logging."},{"location":"reference/#eval-evaluation","title":"<code>eval</code> \u2014 Evaluation","text":"<p>Set to <code>null</code> (default) to skip evaluation.</p> Field Type Default Description <code>model_id</code> <code>str \\| null</code> <code>null</code> HuggingFace model ID for config resolution. <code>model_path</code> <code>str \\| dict[str, str] \\| null</code> <code>null</code> Path to .onnx file, or a <code>{role: path}</code> dict for composite models. <code>task</code> <code>str \\| null</code> <code>null</code> Task type. <code>device</code> <code>str</code> <code>\"auto\"</code> Inference device. <code>precision</code> <code>str</code> <code>\"auto\"</code> Precision (<code>fp32</code>, <code>fp16</code>, <code>w8a16</code>, etc.). <code>ep</code> <code>str \\| null</code> <code>null</code> EP override. <code>dataset.path</code> <code>str \\| null</code> <code>null</code> HuggingFace dataset path. <code>dataset.name</code> <code>str \\| null</code> <code>null</code> Dataset config name. <code>dataset.split</code> <code>str</code> <code>\"validation\"</code> Dataset split. <code>dataset.samples</code> <code>int</code> <code>100</code> Evaluation sample count. <code>dataset.shuffle</code> <code>bool</code> <code>true</code> Shuffle before sampling. <code>dataset.seed</code> <code>int</code> <code>42</code> Random seed. <code>output_path</code> <code>str \\| null</code> <code>null</code> Path for JSON results output."},{"location":"reference/#example-full-config","title":"Example: Full Config","text":"<pre><code>{\n  \"loader\": {\n    \"task\": \"image-classification\",\n    \"model_type\": \"resnet\"\n  },\n  \"export\": {\n    \"opset_version\": 17,\n    \"batch_size\": 1\n  },\n  \"optim\": {\n    \"gelu_fusion\": true,\n    \"layer_norm_fusion\": true,\n    \"matmul_add_fusion\": true\n  },\n  \"quant\": {\n    \"mode\": \"qdq\",\n    \"weight_type\": \"uint8\",\n    \"activation_type\": \"uint8\",\n    \"samples\": 10,\n    \"calibration_method\": \"minmax\"\n  },\n  \"compile\": {\n    \"ep_config\": {\n      \"provider\": \"qnn\",\n      \"device\": \"npu\",\n      \"enable_ep_context\": true,\n      \"embed_context\": false\n    },\n    \"validate\": true\n  },\n  \"auto\": true\n}\n</code></pre>"},{"location":"reference/#the-auto-field","title":"The <code>auto</code> field","text":"<p>The top-level <code>\"auto\"</code> field (default: <code>true</code>) controls whether the build pipeline runs the autoconf loop \u2014 an iterative analyze \u2192 discover \u2192 re-optimize cycle that automatically detects which additional graph optimizations the model needs for the target EP.</p> Value Behavior <code>true</code> (default) After initial optimization, the analyzer inspects the graph for unsupported or sub-optimal nodes and proposes additional optimization flags. The pipeline re-optimizes using the discovered flags and repeats (up to <code>--max-optim-iterations</code>, default 3). The final optimization result depends on what the analyzer discovers at runtime, so outputs may vary if the model or EP support changes between runs. <code>false</code> The pipeline applies only the explicit <code>optim</code> flags from the config \u2014 no autoconf discovery, no re-optimization loop. Builds are fully deterministic given the same config and input model. Use this for reproducible CI builds or when you have already tuned the optimization flags manually. <p>When <code>auto</code> is <code>true</code> and the autoconf loop discovers additional flags, the final persisted config (written to the output directory) includes the merged result so you can inspect what was discovered.</p>"},{"location":"reference/#see-also","title":"See also","text":"<ul> <li>winml config \u2014 generate a config interactively</li> <li>winml build \u2014 run the pipeline with a config</li> <li>Config and build \u2014 conceptual overview</li> </ul>"},{"location":"reference/output-layout/","title":"Output Layout","text":"<p>When you run <code>winml build</code>, the tool writes all artifacts to the output directory. This page documents what each file is and which ones you need for deployment.</p>"},{"location":"reference/output-layout/#directory-structure","title":"Directory Structure","text":"<p>After a full pipeline run (export \u2192 optimize \u2192 quantize \u2192 compile):</p> <pre><code>output/\n\u251c\u2500\u2500 model.onnx                  \u2190 FINAL artifact (deploy this)\n\u251c\u2500\u2500 model.onnx.data             \u2190 External weights (if model \u2265 100 MiB)\n\u251c\u2500\u2500 winml_build_config.json     \u2190 Persisted build config\n\u251c\u2500\u2500 analyze_result.json         \u2190 Static analysis (EP compatibility)\n\u251c\u2500\u2500 build_manifest.json         \u2190 Build provenance (Python API only)\n\u251c\u2500\u2500 export_htp_metadata.json    \u2190 HTP export metadata (hierarchy info)\n\u251c\u2500\u2500 export.onnx                 \u2190 Intermediate: raw ONNX export\n\u251c\u2500\u2500 export.onnx.data\n\u251c\u2500\u2500 optimized.onnx              \u2190 Intermediate: after graph optimization\n\u251c\u2500\u2500 optimized.onnx.data\n\u251c\u2500\u2500 quantized.onnx              \u2190 Intermediate: after QDQ insertion\n\u251c\u2500\u2500 quantized.onnx.data\n\u251c\u2500\u2500 compiled.onnx               \u2190 Intermediate: after EP compilation\n\u2514\u2500\u2500 compiled.onnx.data\n</code></pre>"},{"location":"reference/output-layout/#file-categories","title":"File Categories","text":""},{"location":"reference/output-layout/#final-artifacts-keep-for-deployment","title":"Final Artifacts (Keep for Deployment)","text":"File Purpose <code>model.onnx</code> The deployment-ready model. Always present. <code>model.onnx.data</code> External weight data (only if model \u2265 100 MiB). Must stay alongside <code>model.onnx</code>. <code>winml_build_config.json</code> The complete pipeline config used for this build (includes auto-discovered optimization flags). This file is a reproducible pipeline specification \u2014 check it into version control or feed it directly to <code>winml build -c</code> in a CI/CD pipeline to guarantee identical model processing across machines and runs (set <code>\"auto\": false</code> for fully deterministic builds). <code>analyze_result.json</code> Static analysis output: EP compatibility, operator classification, detected patterns. <code>build_manifest.json</code> Build provenance with stage timings. Only generated via the Python API (<code>build_hf_model</code>/<code>build_onnx_model</code>). <code>export_htp_metadata.json</code> HTP export metadata: module hierarchy, tracing info, tagging coverage."},{"location":"reference/output-layout/#intermediate-files-can-delete-after-build","title":"Intermediate Files (Can Delete After Build)","text":"File Stage Contents <code>export.onnx</code> Export Raw PyTorch \u2192 ONNX conversion (float32) <code>optimized.onnx</code> Optimize Graph with fused operators, shape inference applied <code>quantized.onnx</code> Quantize QDQ nodes inserted, calibrated scales <code>compiled.onnx</code> Compile EPContext binary embedded or sidecar <p>Each intermediate has a corresponding <code>.onnx.data</code> file if the model exceeds 100 MiB.</p>"},{"location":"reference/output-layout/#what-gets-written-at-each-stage","title":"What Gets Written at Each Stage","text":""},{"location":"reference/output-layout/#export-only-winml-export","title":"Export only (<code>winml export</code>)","text":"<pre><code>output/\n\u251c\u2500\u2500 export.onnx\n\u2514\u2500\u2500 export.onnx.data          (if \u2265 100 MiB)\n</code></pre>"},{"location":"reference/output-layout/#optimize-only-winml-optimize","title":"Optimize only (<code>winml optimize</code>)","text":"<pre><code>output/\n\u251c\u2500\u2500 optimized.onnx\n\u2514\u2500\u2500 optimized.onnx.data\n</code></pre>"},{"location":"reference/output-layout/#full-build-winml-build","title":"Full build (<code>winml build</code>)","text":"<p>All stages write their intermediate, and <code>model.onnx</code> is a copy of the last successful stage output. If you skip quantization (<code>--no-quant</code>), the final model is a copy of <code>optimized.onnx</code>. If you skip compilation too, it's still a copy of <code>optimized.onnx</code>.</p>"},{"location":"reference/output-layout/#external-data","title":"External Data","text":"<p>Models larger than 100 MiB store weights in a separate <code>.onnx.data</code> file. Both files must be kept together \u2014 the <code>.onnx</code> file contains a reference to the data file by name.</p> Model Size Files &lt; 100 MiB <code>model.onnx</code> only (weights embedded) \u2265 100 MiB <code>model.onnx</code> + <code>model.onnx.data</code> <p>Warning</p> <p>If you move <code>model.onnx</code>, always move <code>model.onnx.data</code> alongside it. The ONNX file references the data file by relative path.</p>"},{"location":"reference/output-layout/#analyzer-result","title":"Analyzer Result","text":"<p><code>analyze_result.json</code> contains the static analysis output from the build pipeline's analyze stage. It reports EP compatibility and operator classification:</p> <pre><code>{\n  \"analysis_timestamp\": \"2026-06-04T19:45:17.496169\",\n  \"metadata\": {\n    \"model_path\": \"iter.onnx\",\n    \"opset_version\": 17,\n    \"producer_name\": \"pytorch\",\n    \"producer_version\": \"2.12.0\",\n    \"total_operators\": 122,\n    \"operator_counts\": {\n      \"Conv\": 53,\n      \"Relu\": 49,\n      \"MaxPool\": 1,\n      \"Add\": 16,\n      \"GlobalAveragePool\": 1,\n      \"Flatten\": 1,\n      \"Gemm\": 1\n    },\n    \"unique_operator_types\": 7,\n    \"detected_pattern_count\": {}\n  },\n  \"results\": [\n    {\n      \"ihv_type\": \"Microsoft\",\n      \"ep_type\": \"CPUExecutionProvider\",\n      \"device_type\": \"cpu\",\n      \"runtime_support\": false,\n      \"has_errors\": false,\n      \"has_warnings\": false,\n      \"classification\": {\n        \"supported\": [],\n        \"partial\": [],\n        \"unsupported\": [],\n        \"unknown\": [\n          \"OP/ai.onnx/Conv\",\n          \"OP/ai.onnx/Relu\",\n          \"OP/ai.onnx/MaxPool\",\n          \"OP/ai.onnx/Add\",\n          \"OP/ai.onnx/GlobalAveragePool\",\n          \"OP/ai.onnx/Flatten\",\n          \"OP/ai.onnx/Gemm\"\n        ]\n      },\n      \"information\": []\n    }\n  ]\n}\n</code></pre> <p>Key fields:</p> Field Description <code>metadata.total_operators</code> Total ONNX operator nodes in the model graph <code>metadata.operator_counts</code> Frequency of each operator type <code>metadata.detected_pattern_count</code> Fused subgraph patterns (GeLU, LayerNorm, etc.) <code>results[].ihv_type</code> Hardware vendor (<code>\"Microsoft\"</code>, <code>\"QC\"</code>, <code>\"Intel\"</code>, etc.) <code>results[].runtime_support</code> <code>true</code> if the EP can run all operators <code>results[].classification</code> Operators grouped by support level: <code>supported</code>, <code>partial</code>, <code>unsupported</code>, <code>unknown</code> <code>results[].has_errors</code> <code>true</code> if unsupported ops exist (model won't run on that EP)"},{"location":"reference/output-layout/#build-manifest","title":"Build Manifest","text":"<p><code>build_manifest.json</code> records provenance for every build:</p> <pre><code>{\n  \"schema_version\": 1,\n  \"model_id\": \"microsoft/resnet-50\",\n  \"task\": \"image-classification\",\n  \"cache_key\": \"a1b2c3d4e5f6\",\n  \"config_hash\": \"f7e8d9c0b1a2\",\n  \"timestamp\": \"2026-01-15T10:30:00.000000+00:00\",\n  \"elapsed_seconds\": 45.1,\n  \"final_artifact\": \"model.onnx\",\n  \"analyze_iterations\": 2,\n  \"analyze_unsupported_node_count\": 0,\n  \"analyze_details\": { \"lint\": {}, \"autoconf\": {} },\n  \"stages\": [\n    {\n      \"name\": \"export\",\n      \"status\": \"completed\",\n      \"filename\": \"export.onnx\",\n      \"elapsed_seconds\": 12.5\n    },\n    {\n      \"name\": \"optimize\",\n      \"status\": \"completed\",\n      \"filename\": \"optimized.onnx\",\n      \"elapsed_seconds\": 8.2\n    },\n    {\n      \"name\": \"quantize\",\n      \"status\": \"completed\",\n      \"filename\": \"quantized.onnx\",\n      \"elapsed_seconds\": 15.3,\n      \"nodes_quantized\": 150,\n      \"nodes_skipped\": 12\n    },\n    {\n      \"name\": \"compile\",\n      \"status\": \"completed\",\n      \"filename\": \"compiled.onnx\",\n      \"elapsed_seconds\": 9.1\n    }\n  ]\n}\n</code></pre>"},{"location":"reference/output-layout/#rebuild-behavior","title":"Rebuild Behavior","text":"<ul> <li>If <code>model.onnx</code> already exists and <code>rebuild=False</code> (default), the build is   skipped entirely.</li> <li>Pass <code>--rebuild</code> (CLI) or <code>force_rebuild=True</code> (Python API) to force a fresh   build.</li> <li>On rebuild, all old <code>.onnx</code> and <code>.onnx.data</code> files are deleted before the   pipeline runs.</li> </ul>"},{"location":"reference/output-layout/#see-also","title":"See also","text":"<ul> <li>winml build \u2014 build command reference</li> <li>Reference \u2014 Config Schema \u2014 config file format</li> <li>How winml-cli Works \u2014 pipeline stages explained</li> </ul>"},{"location":"reference/python-api/","title":"Python API","text":"<p>winml-cli can be used as a Python library for programmatic model building and inference. This page documents the public API surface.</p>"},{"location":"reference/python-api/#quick-example","title":"Quick Example","text":"<pre><code>from winml.modelkit import WinMLAutoModel\n\n# Build and load in one call\nmodel = WinMLAutoModel.from_pretrained(\"microsoft/resnet-50\", device=\"npu\")\noutput = model(pixel_values=images)\n\n# From a local ONNX file\nmodel = WinMLAutoModel.from_onnx(\"model.onnx\", task=\"image-classification\")\n</code></pre>"},{"location":"reference/python-api/#winmlautomodel","title":"<code>WinMLAutoModel</code>","text":"<p>Factory class for automatic model building and loading. Not instantiable directly \u2014 use the class methods.</p>"},{"location":"reference/python-api/#from_pretrained","title":"<code>from_pretrained()</code>","text":"<p>Build and load a model from a HuggingFace ID or local path. Runs the full pipeline: config \u2192 export \u2192 optimize \u2192 quantize \u2192 compile \u2192 load.</p> <pre><code>WinMLAutoModel.from_pretrained(\n    model_id_or_path: str | Path,\n    *,\n    task: str | None = None,\n    config: WinMLBuildConfig | None = None,\n    device: str = \"auto\",\n    precision: str = \"auto\",\n    cache_dir: str | Path | None = None,\n    use_cache: bool = True,\n    force_rebuild: bool = False,\n    trust_remote_code: bool = False,\n    shape_config: dict | None = None,\n    no_compile: bool = False,\n) -&gt; WinMLPreTrainedModel\n</code></pre> Parameter Type Default Description <code>model_id_or_path</code> <code>str \\| Path</code> required HuggingFace model ID or path to local model. <code>task</code> <code>str \\| None</code> <code>None</code> Task name. Auto-detected if omitted. <code>config</code> <code>WinMLBuildConfig \\| None</code> <code>None</code> Custom build config. Auto-generated if omitted. <code>device</code> <code>str</code> <code>\"auto\"</code> Target device: <code>\"auto\"</code>, <code>\"npu\"</code>, <code>\"gpu\"</code>, <code>\"cpu\"</code>. <code>precision</code> <code>str</code> <code>\"auto\"</code> Precision: <code>\"auto\"</code>, <code>\"fp32\"</code>, <code>\"fp16\"</code>, <code>\"w8a8\"</code>, etc. <code>cache_dir</code> <code>str \\| Path \\| None</code> <code>None</code> Cache directory for built artifacts. <code>use_cache</code> <code>bool</code> <code>True</code> Reuse cached build if available. <code>force_rebuild</code> <code>bool</code> <code>False</code> Force rebuild even if cache exists. <code>trust_remote_code</code> <code>bool</code> <code>False</code> Trust remote code from HuggingFace. <code>no_compile</code> <code>bool</code> <code>False</code> Skip the compilation stage. <p>Returns: A task-specific <code>WinMLPreTrainedModel</code> subclass.</p>"},{"location":"reference/python-api/#from_onnx","title":"<code>from_onnx()</code>","text":"<p>Build from a pre-exported ONNX file. Runs: optimize \u2192 quantize \u2192 compile \u2192 load.</p> <pre><code>WinMLAutoModel.from_onnx(\n    onnx_path: str | Path | dict[str, str | Path],\n    *,\n    task: str | None = None,\n    config: WinMLBuildConfig | None = None,\n    device: str = \"auto\",\n    precision: str = \"auto\",\n    ep: str | None = None,\n    cache_dir: str | Path | None = None,\n    use_cache: bool = True,\n    force_rebuild: bool = False,\n    skip_build: bool = False,\n    session_options: Any | None = None,\n    hf_config: PretrainedConfig | None = None,\n    **kwargs: Any,\n) -&gt; WinMLPreTrainedModel | WinMLCompositeModel\n</code></pre> Parameter Type Default Description <code>onnx_path</code> <code>str \\| Path \\| dict</code> required ONNX file path, or dict of submodel paths for composite models. <code>skip_build</code> <code>bool</code> <code>False</code> Load ONNX directly without running optimize/quantize/compile. <code>hf_config</code> <code>PretrainedConfig \\| None</code> <code>None</code> Required for composite models (dict inputs)."},{"location":"reference/python-api/#supported_tasks","title":"<code>supported_tasks()</code>","text":"<pre><code>WinMLAutoModel.supported_tasks() -&gt; list[str]\n</code></pre> <p>Returns all task strings with dedicated inference classes (16 tasks).</p>"},{"location":"reference/python-api/#build-pipeline-functions","title":"Build Pipeline Functions","text":"<p>Lower-level functions for fine-grained control over the pipeline.</p>"},{"location":"reference/python-api/#build_hf_model","title":"<code>build_hf_model()</code>","text":"<pre><code>from winml.modelkit.build import build_hf_model\n\nresult = build_hf_model(\n    config: WinMLBuildConfig,\n    output_dir: Path,\n    *,\n    model_id: str | None = None,\n    pytorch_model: nn.Module | None = None,\n    rebuild: bool = False,\n    trust_remote_code: bool = False,\n    random_init: bool = False,\n    cache_key: str | None = None,\n    ep: str | None = None,\n    device: str | None = None,\n    **kwargs: Any,\n) -&gt; BuildResult\n</code></pre> <p>Runs the full pipeline (export \u2192 optimize \u2192 analyze \u2192 quantize \u2192 compile) and writes all artifacts to <code>output_dir</code>.</p>"},{"location":"reference/python-api/#build_onnx_model","title":"<code>build_onnx_model()</code>","text":"<pre><code>from winml.modelkit.build import build_onnx_model\n\nresult = build_onnx_model(\n    onnx_path: Path | str,\n    *,\n    config: WinMLBuildConfig,\n    output_dir: Path | str,\n    rebuild: bool = False,\n    ep: str | None = None,\n    device: str | None = None,\n    **kwargs: Any,\n) -&gt; BuildResult\n</code></pre> <p>Builds from an existing ONNX file (skips export).</p>"},{"location":"reference/python-api/#buildresult","title":"<code>BuildResult</code>","text":"<pre><code>@dataclass\nclass BuildResult:\n    output_dir: Path           # Directory containing all artifacts\n    final_onnx_path: Path      # Path to final model.onnx\n    config_path: Path          # Path to winml_build_config.json\n    stages_completed: list[str]  # e.g., [\"export\", \"optimize\", \"quantize\"]\n    stages_skipped: list[str]\n    stage_timings: dict[str, float]  # Per-stage seconds\n    elapsed: float             # Total build time (seconds)\n    reused: bool               # True if cache hit, no build ran\n    manifest_path: Path | None # Path to build_manifest.json\n</code></pre>"},{"location":"reference/python-api/#config-generation","title":"Config Generation","text":""},{"location":"reference/python-api/#generate_build_config","title":"<code>generate_build_config()</code>","text":"<pre><code>from winml.modelkit.config import generate_build_config\n\nconfig = generate_build_config(\n    model_id: str | None = None,\n    *,\n    task: str | None = None,\n    model_class: str | None = None,\n    model_type: str | None = None,\n    module: str | None = None,\n    override: WinMLBuildConfig | None = None,\n    shape_config: dict | None = None,\n    library_name: str = \"transformers\",\n    device: str = \"auto\",\n    precision: str = \"auto\",\n    trust_remote_code: bool = False,\n    ep: str | None = None,\n    onnx_path: str | Path | None = None,\n) -&gt; WinMLBuildConfig | list[WinMLBuildConfig]\n</code></pre> <p>Auto-generates a complete build config by probing the model's <code>config.json</code> (does not download weights). Equivalent to what <code>winml config</code> produces. Returns a list when <code>module</code> is specified (one config per submodule).</p>"},{"location":"reference/python-api/#inference-model-classes","title":"Inference Model Classes","text":"<p>All inference models inherit from <code>WinMLPreTrainedModel</code> and are HuggingFace pipeline-compatible.</p>"},{"location":"reference/python-api/#winmlpretrainedmodel-base","title":"<code>WinMLPreTrainedModel</code> (Base)","text":"<pre><code>class WinMLPreTrainedModel:\n    def __call__(self, **kwargs) -&gt; Any: ...\n    def perf(self, warmup: int = 0) -&gt; ContextManager: ...\n\n    @property\n    def device(self) -&gt; str: ...\n    @property\n    def ep_name(self) -&gt; str | None: ...\n    @property\n    def io_config(self) -&gt; dict: ...\n    @property\n    def task(self) -&gt; str | None: ...\n</code></pre>"},{"location":"reference/python-api/#task-specific-classes","title":"Task-Specific Classes","text":"Class Task <code>WinMLModelForImageClassification</code> <code>image-classification</code> <code>WinMLModelForSequenceClassification</code> <code>text-classification</code> <code>WinMLModelForImageSegmentation</code> <code>image-segmentation</code> <code>WinMLModelForSemanticSegmentation</code> <code>semantic-segmentation</code> <code>WinMLModelForObjectDetection</code> <code>object-detection</code> <code>WinMLModelForFeatureExtraction</code> <code>feature-extraction</code> <code>WinMLModelForQuestionAnswering</code> <code>question-answering</code> <code>WinMLModelForZeroShotImageClassification</code> <code>zero-shot-image-classification</code> <code>WinMLModelForGenericTask</code> fallback (raw outputs)"},{"location":"reference/python-api/#performance-tracking","title":"Performance Tracking","text":"<pre><code>model = WinMLAutoModel.from_pretrained(\"microsoft/resnet-50\", device=\"npu\")\n\nwith model.perf(warmup=5) as stats:\n    for img in test_images:\n        model(pixel_values=img)\n\nprint(f\"P99 latency: {stats.p99_ms:.2f} ms\")\n</code></pre>"},{"location":"reference/python-api/#see-also","title":"See also","text":"<ul> <li>Reference \u2014 Config Schema \u2014 full config field reference</li> <li>winml build \u2014 CLI equivalent</li> <li>How winml-cli Works \u2014 pipeline overview</li> </ul>"},{"location":"reference/supported-models/","title":"Supported Models","text":"<p>Windows ML CLI has validated a set of models for compatibility across all Execution Providers (EPs)\u2014see the full Model Accuracy Report.</p> <p>winml-cli supports a wide range of model architectures and tasks. This page lists what's validated and how to discover model support.</p>"},{"location":"reference/supported-models/#discovery-commands","title":"Discovery Commands","text":"<pre><code># Browse the curated catalog (64 validated models)\nuv run winml catalog\n\n# Filter by task\nuv run winml catalog -t image-classification\n\n# Check if a specific model is supported\nuv run winml inspect -m microsoft/resnet-50\n\n# List all known tasks\nuv run winml inspect --list-tasks\n</code></pre>"},{"location":"reference/supported-models/#supported-tasks","title":"Supported Tasks","text":"<p>winml-cli recognizes 35 task types across vision, NLP, audio, and multimodal domains. Of these, 16 have dedicated inference classes; the remainder are supported via the generic task fallback.</p>"},{"location":"reference/supported-models/#vision","title":"Vision","text":"Task Example Models <code>image-classification</code> ResNet, ConvNeXt, ViT, Swin <code>image-segmentation</code> Segformer, Mask2Former <code>semantic-segmentation</code> Segformer <code>object-detection</code> DETR, YOLOS, Table-Transformer <code>depth-estimation</code> Depth Anything, ZoeDepth <code>image-feature-extraction</code> DINOv2, ViT <code>zero-shot-image-classification</code> CLIP, SigLIP"},{"location":"reference/supported-models/#nlp","title":"NLP","text":"Task Example Models <code>text-classification</code> BERT, RoBERTa, XLM-RoBERTa <code>token-classification</code> BERT, RoBERTa (NER) <code>question-answering</code> BERT, RoBERTa <code>fill-mask</code> BERT, RoBERTa <code>feature-extraction</code> BGE, BERT, all-MiniLM <code>text-generation</code> Qwen3 (composite) <code>text2text-generation</code> T5, BART, Marian"},{"location":"reference/supported-models/#audio","title":"Audio","text":"Task Example Models <code>automatic-speech-recognition</code> Whisper <code>audio-classification</code> Wav2Vec2"},{"location":"reference/supported-models/#multimodal","title":"Multimodal","text":"Task Example Models <code>zero-shot-image-classification</code> CLIP (text + vision) <code>image-to-text</code> VisionEncoderDecoder <code>visual-question-answering</code> BLIP"},{"location":"reference/supported-models/#validated-model-catalog","title":"Validated Model Catalog","text":"<p>The following models have been validated end-to-end with EP compatibility testing. Use <code>winml catalog</code> to browse the full list interactively.</p>"},{"location":"reference/supported-models/#image-classification","title":"Image Classification","text":"Model Architecture <code>apple/mobilevit-small</code> MobileViT <code>dima806/fairface_age_image_detection</code> ViT <code>facebook/convnext-tiny-224</code> ConvNeXt <code>google/vit-base-patch16-224</code> ViT <code>microsoft/resnet-18</code> ResNet <code>microsoft/resnet-50</code> ResNet <code>microsoft/swin-large-patch4-window7-224</code> Swin <code>rizvandwiki/gender-classification</code> ViT"},{"location":"reference/supported-models/#image-feature-extraction","title":"Image Feature Extraction","text":"Model Architecture <code>facebook/dino-vitb16</code> ViT <code>facebook/dino-vits16</code> ViT <code>facebook/dinov2-small</code> DINOv2 <code>google/vit-base-patch16-224-in21k</code> ViT"},{"location":"reference/supported-models/#feature-extraction-text","title":"Feature Extraction (Text)","text":"Model Architecture <code>BAAI/bge-base-en-v1.5</code> BERT <code>BAAI/bge-m3</code> XLM-RoBERTa <code>BAAI/bge-small-en-v1.5</code> BERT <code>google-bert/bert-base-multilingual-cased</code> BERT <code>Intel/bert-base-uncased-mrpc</code> BERT <code>laion/CLIP-ViT-B-32-laion2B-s34B-b79K</code> CLIP <code>openai/clip-vit-base-patch16</code> CLIP <code>openai/clip-vit-base-patch32</code> CLIP <code>sentence-transformers/all-MiniLM-L6-v2</code> BERT <code>sentence-transformers/all-mpnet-base-v2</code> MPNet <code>sentence-transformers/multi-qa-mpnet-base-dot-v1</code> MPNet <code>sentence-transformers/paraphrase-multilingual-MiniLM-L12-v2</code> BERT"},{"location":"reference/supported-models/#sentence-similarity","title":"Sentence Similarity","text":"Model Architecture <code>BAAI/bge-base-en-v1.5</code> BERT <code>BAAI/bge-large-en-v1.5</code> BERT <code>BAAI/bge-m3</code> XLM-RoBERTa <code>BAAI/bge-small-en-v1.5</code> BERT <code>sentence-transformers/all-MiniLM-L6-v2</code> BERT <code>sentence-transformers/all-mpnet-base-v2</code> MPNet <code>sentence-transformers/multi-qa-mpnet-base-dot-v1</code> MPNet <code>sentence-transformers/paraphrase-multilingual-MiniLM-L12-v2</code> BERT <code>sentence-transformers/paraphrase-multilingual-mpnet-base-v2</code> XLM-RoBERTa"},{"location":"reference/supported-models/#fill-mask","title":"Fill-Mask","text":"Model Architecture <code>distilbert/distilbert-base-uncased</code> DistilBERT <code>FacebookAI/roberta-base</code> RoBERTa <code>FacebookAI/roberta-large</code> RoBERTa <code>FacebookAI/xlm-roberta-base</code> XLM-RoBERTa <code>google-bert/bert-base-multilingual-cased</code> BERT <code>google-bert/bert-base-multilingual-uncased</code> BERT <code>google-bert/bert-base-uncased</code> BERT"},{"location":"reference/supported-models/#text-classification","title":"Text Classification","text":"Model Architecture <code>cardiffnlp/twitter-roberta-base-sentiment-latest</code> RoBERTa <code>distilbert/distilbert-base-uncased-finetuned-sst-2-english</code> DistilBERT <code>Intel/bert-base-uncased-mrpc</code> BERT <code>ProsusAI/finbert</code> BERT"},{"location":"reference/supported-models/#token-classification","title":"Token Classification","text":"Model Architecture <code>Babelscape/wikineural-multilingual-ner</code> BERT <code>dbmdz/bert-large-cased-finetuned-conll03-english</code> BERT <code>dslim/bert-base-NER</code> BERT <code>Isotonic/distilbert_finetuned_ai4privacy_v2</code> DistilBERT <code>w11wo/indonesian-roberta-base-posp-tagger</code> RoBERTa"},{"location":"reference/supported-models/#question-answering","title":"Question Answering","text":"Model Architecture <code>deepset/bert-large-uncased-whole-word-masking-squad2</code> BERT <code>deepset/roberta-base-squad2</code> RoBERTa <code>deepset/tinyroberta-squad2</code> RoBERTa <code>distilbert/distilbert-base-cased-distilled-squad</code> DistilBERT <code>distilbert/distilbert-base-uncased-distilled-squad</code> DistilBERT <code>google-bert/bert-large-uncased-whole-word-masking-finetuned-squad</code> BERT"},{"location":"reference/supported-models/#zero-shot-classification","title":"Zero-Shot Classification","text":"Model Architecture <code>joeddav/xlm-roberta-large-xnli</code> XLM-RoBERTa"},{"location":"reference/supported-models/#zero-shot-image-classification","title":"Zero-Shot Image Classification","text":"Model Architecture <code>openai/clip-vit-base-patch16</code> CLIP"},{"location":"reference/supported-models/#image-segmentation","title":"Image Segmentation","text":"Model Architecture <code>mattmdjaga/segformer_b2_clothes</code> Segformer <code>nvidia/segformer-b1-finetuned-ade-512-512</code> Segformer <code>nvidia/segformer-b2-finetuned-ade-512-512</code> Segformer <code>nvidia/segformer-b5-finetuned-ade-640-640</code> Segformer"},{"location":"reference/supported-models/#image-to-text","title":"Image-to-Text","text":"Model Architecture <code>microsoft/trocr-base-handwritten</code> VisionEncoderDecoder <code>microsoft/trocr-base-printed</code> VisionEncoderDecoder <code>microsoft/trocr-large-handwritten</code> VisionEncoderDecoder"},{"location":"reference/supported-models/#execution-provider-compatibility","title":"Execution Provider Compatibility","text":"<p>Each validated model is tested against available EPs:</p> EP Alias Devices Notes NvTensorRTRTXExecutionProvider <code>nvtensorrtrtx</code>, <code>nv_tensorrt_rtx</code> GPU NVIDIA TensorRT-RTX; NVIDIA GPU with TensorRT runtime CUDAExecutionProvider <code>cuda</code> GPU NVIDIA CUDA; any CUDA-capable GPU MIGraphXExecutionProvider <code>migraphx</code> GPU AMD ROCm MIGraphX QNNExecutionProvider <code>qnn</code> NPU, GPU Qualcomm Snapdragon; bundled in ORT OpenVINOExecutionProvider <code>openvino</code> NPU, GPU, CPU Intel hardware DmlExecutionProvider <code>dml</code> GPU DirectML; any DirectX 12 GPU CPUExecutionProvider <code>cpu</code> CPU Always available VitisAIExecutionProvider <code>vitisai</code> NPU AMD/Xilinx"},{"location":"reference/supported-models/#adding-unsupported-models","title":"Adding Unsupported Models","text":"<p>If your model architecture isn't in the catalog, winml-cli may still support it through auto-detection:</p> <pre><code># Try inspecting first\nuv run winml inspect -m your-org/your-model\n\n# If \"Status: Supported\", proceed normally\nuv run winml build -m your-org/your-model -d auto -o output/\n</code></pre> <p>For truly custom architectures, use <code>--trust-remote-code</code> to allow execution of model code from the Hugging Face Hub.</p>"},{"location":"reference/supported-models/#see-also","title":"See also","text":"<ul> <li>winml catalog \u2014 browse validated models interactively</li> <li>winml inspect \u2014 check model compatibility</li> <li>EP and Device \u2014 execution provider details</li> </ul>"},{"location":"samples/bert-config-build/","title":"BERT \u2014 Config + Build + Perf","text":"<p>BERT (<code>bert-base-uncased</code>) is a canonical text model that exercises every stage of the winml-cli pipeline: it has multiple input tensors, benefits from graph fusion (GeLU, LayerNorm, MatMul+Add), and produces quantizable activations that run well on NPU. That combination makes it a useful reference point for teams deploying transformer encoders on Windows.</p> <p>This sample walks through the production-style workflow: generate a reusable <code>WinMLBuildConfig</code> JSON file with <code>winml config</code>, run the full export \u2192 optimize \u2192 quantize \u2192 compile pipeline in one shot with <code>winml build</code>, and measure the result with <code>winml perf</code>. If you want to understand each pipeline stage individually before running the all-in-one command, read the Hugging Face Model to NPU tutorial first.</p>"},{"location":"samples/bert-config-build/#prerequisites","title":"Prerequisites","text":"<ul> <li>winml-cli installed and <code>winml</code> on your PATH.</li> <li>A target device (NPU or GPU recommended; CPU also works).</li> </ul>"},{"location":"samples/bert-config-build/#step-1-generate-a-build-config","title":"Step 1: Generate a build config","text":"<pre><code>winml config -m bert-base-uncased -t text-classification -o bert_config.json\n</code></pre> <p>This writes a <code>WinMLBuildConfig</code> JSON file to <code>bert_config.json</code>. The file captures every pipeline setting in a single artifact that you can version-control and share. A representative excerpt looks like this:</p> <pre><code>{\n  \"loader\": {\n    \"task\": \"text-classification\",\n    \"model_class\": \"AutoModelForSequenceClassification\",\n    \"model_type\": \"bert\"\n  },\n  \"export\": {\n    \"opset_version\": 17,\n    \"batch_size\": 1\n    .. // truncated: input_tensors, output_tensors\n  },\n   \"optim\": {\n    \"clamp_constant_values\": true\n  },\n  \"quant\": {\n    \"mode\": \"qdq\",\n    \"weight_type\": \"uint8\",\n    \"activation_type\": \"uint16\",\n    \"samples\": 10,\n    \"calibration_method\": \"minmax\",\n    \"task\": \"text-classification\",\n    \"model_name\": \"bert-base-uncased\"\n    ... // truncated: per_channel, symmetric, distribution, ...\n  },\n  \"compile\": null\n}\n</code></pre> <p>Note</p> <p>The five top-level keys \u2014 <code>loader</code>, <code>export</code>, <code>optim</code>, <code>quant</code>, and <code>compile</code> \u2014 map directly to the five pipeline stages. Setting <code>quant</code> or <code>compile</code> to <code>null</code> skips that stage entirely. See Config and build for a field-by-field description of every option.</p>"},{"location":"samples/bert-config-build/#step-2-run-the-build","title":"Step 2: Run the build","text":"<pre><code>winml build -c bert_config.json -m bert-base-uncased --output-dir bert_out/\n</code></pre> <p>winml-cli reads the config, downloads the model weights once, and runs the pipeline in sequence. Terminal output shows each stage as it completes:</p> <pre><code>winml build\n  Config:     bert_config.json\n  Model:      bert-base-uncased\n  Output:     bert_out/\n\n  export       done  (42.1s)\n  optimize     done  (6.3s)\n  quantize     done  (18.7s)\n  compile      done  (21.4s)\n\n  Build complete in 88.5s\n  Final artifact: bert_out/model.onnx\n</code></pre> <p>Note</p> <p>After the optimize stage, winml-cli runs an analyzer loop that inspects the graph for nodes the target EP cannot dispatch natively and re-runs optimization with adjusted fusion flags. The loop repeats up to <code>--max-optim-iterations</code> times (default: 3). Pass <code>--no-optimize</code> to skip this stage entirely when starting from a pre-optimized ONNX file. See How winml-cli Works for a full description of the autoconf loop.</p>"},{"location":"samples/bert-config-build/#step-3-benchmark","title":"Step 3: Benchmark","text":"<pre><code>winml perf -m bert_out/model.onnx --iterations 50\n</code></pre> <p>After a short warm-up, <code>winml perf</code> reports latency percentiles and throughput:</p> <pre><code>Device:      npu\nTask:        text-classification\nIterations:  50 (+ 10 warmup)\nBatch Size:  1\n\nLatency (ms)\n  Avg    P50    P90    P95    P99    Min    Max    Std\n 4.83   4.79   5.12   5.31   5.68   4.51   6.04   0.21\n\nThroughput: 206.99 samples/sec\n\nResults saved to: model_perf.json\n</code></pre>"},{"location":"samples/bert-config-build/#customizing-the-config","title":"Customizing the config","text":"<p>The JSON file is plain text and can be edited before running <code>winml build</code>. Two common adjustments:</p> <p>Change precision. To target fp16 instead of the default uint8 QDQ quantization, regenerate the config with an explicit precision flag:</p> <pre><code>winml config -m bert-base-uncased -t text-classification --precision fp16 -o bert_config.json\n</code></pre> <p>Alternatively, edit <code>bert_config.json</code> directly: set <code>quant.weight_type</code> and <code>quant.activation_type</code> to <code>\"int8\"</code> or <code>\"uint16\"</code>, or set <code>quant</code> to <code>null</code> to skip quantization entirely.</p> <p>Disable a stage at build time. You can suppress a stage for a single run without touching the config file using the <code>--no-quant</code> flags:</p> <pre><code>winml build -c bert_config.json -m bert-base-uncased --output-dir bert_out/ --no-quant \n</code></pre> <p>This is useful for measuring the fp32 baseline before committing to a quantized build. The <code>quant</code> section in <code>bert_config.json</code> is unchanged; the flag only affects this invocation. See Config and build for the full list of configurable fields.</p>"},{"location":"samples/bert-config-build/#what-you-learned","title":"What you learned","text":"<ul> <li><code>winml config</code> generates a complete, version-controllable <code>WinMLBuildConfig</code> JSON from a HuggingFace model ID in one command.</li> <li><code>winml build</code> orchestrates the full export \u2192 optimize \u2192 quantize \u2192 compile pipeline from a single config file and model ID.</li> <li>The autoconf loop inside the optimize stage adjusts graph fusion flags automatically to maximize EP compatibility.</li> <li><code>winml perf</code> gives a latency and throughput baseline on the built artifact in seconds.</li> </ul>"},{"location":"samples/bert-config-build/#see-also","title":"See also","text":"<ul> <li>winml config</li> <li>winml build</li> <li>winml perf</li> <li>Config and build</li> </ul>"},{"location":"samples/clip-composite/","title":"CLIP \u2014 Composite Models","text":"<p>CLIP (<code>openai/clip-vit-base-patch32</code>) is a dual-encoder vision-language model: one tower encodes images, the other encodes text, and both project into a shared embedding space. winml-cli treats it as a composite model \u2014 a model that is split into multiple ONNX sub-models that run together at inference time. For CLIP, the two sub-models are:</p> Sub-model Role Input shape Output (projected) <code>image-encoder</code> Encodes images into embeddings <code>pixel_values</code> <code>[1, 3, 224, 224]</code> <code>image_embeds</code> <code>[1, 512]</code> <code>text-encoder</code> Encodes text labels into embeddings <code>input_ids</code> <code>[1, 77]</code> <code>text_embeds</code> <code>[1, 512]</code> <p>Zero-shot classification is achieved by embedding the image and the candidate text labels, then ranking the labels by the cosine similarity between their embeddings. Splitting the towers into two ONNX graphs lets each encoder have fully static shapes (required for efficient NPU compilation) and lets you build, cache, and benchmark them independently.</p>"},{"location":"samples/clip-composite/#prerequisites","title":"Prerequisites","text":"<ul> <li>winml-cli installed and <code>winml</code> on your PATH.</li> <li>A network connection to download CLIP weights from HuggingFace on first run.</li> </ul>"},{"location":"samples/clip-composite/#overall-workflow","title":"Overall workflow","text":"<p>The composite model architecture for CLIP:</p> <pre><code>graph LR\n    A[winml config] --&gt;|\"(clip, zero-shot-image-classification)\"| B[Composite Registry]\n    B --&gt; C[image-encoder config]\n    B --&gt; D[text-encoder config]\n    C --&gt; E[winml build \u2192 image-encoder.onnx]\n    D --&gt; F[winml build \u2192 text-encoder.onnx]\n    E --&gt; G[WinMLAutoModel]\n    F --&gt; G\n    G --&gt;|logits_per_image| H[Classification scores]</code></pre>"},{"location":"samples/clip-composite/#step-1-generate-build-configs","title":"Step 1: Generate build configs","text":"<pre><code>winml config -m openai/clip-vit-base-patch32 --task zero-shot-image-classification -o clip.json\n</code></pre> <p>Because <code>(clip, zero-shot-image-classification)</code> is registered as a composite model, this command produces two config files \u2014 one per sub-model:</p> <ul> <li><code>clip_image-encoder.json</code> \u2014 export config using <code>image-feature-extraction</code> task</li> <li><code>clip_text-encoder.json</code> \u2014 export config using <code>feature-extraction</code> task</li> </ul> <p>Each config includes CLIP-specific optimizations (GELU fusion, LayerNorm fusion, MatMul+Add fusion, and clamp constant values).</p>"},{"location":"samples/clip-composite/#step-2-build-each-sub-model","title":"Step 2: Build each sub-model","text":"<p>Build both sub-models individually using their config files:</p> <pre><code># Build the image encoder\nwinml build -c clip_image-encoder.json -m openai/clip-vit-base-patch32 -o output/image-encoder\n\n# Build the text encoder\nwinml build -c clip_text-encoder.json -m openai/clip-vit-base-patch32 -o output/text-encoder\n</code></pre> <p>Each <code>winml build</code> runs the full pipeline: export \u2192 optimize \u2192 quantize \u2192 compile. The output directories contain the final ONNX files ready for inference.</p> <p>To target a specific execution provider (e.g., QNN for NPU):</p> <pre><code>winml build -c clip_image-encoder.json -m openai/clip-vit-base-patch32 -o output/image-encoder --ep qnn\nwinml build -c clip_text-encoder.json -m openai/clip-vit-base-patch32 -o output/text-encoder --ep qnn\n</code></pre>"},{"location":"samples/clip-composite/#step-3-benchmark-each-sub-model","title":"Step 3: Benchmark each sub-model","text":"<pre><code>winml perf output/image-encoder -d npu\nwinml perf output/text-encoder -d npu\n</code></pre> <p>This lets you identify whether the image or text encoder is the bottleneck on your target hardware.</p>"},{"location":"samples/clip-composite/#step-4-run-inference-python-api","title":"Step 4: Run inference (Python API)","text":"<p>There are two ways to get a ready-to-run model. Both return the same <code>WinMLModelForZeroShotImageClassification</code> \u2014 a single object that orchestrates the two encoders and combines their projected embeddings into similarity scores \u2014 so the inference code afterward is identical.</p> <p>Option 1 \u2014 Load the ONNX files built in Step 2 (skips re-export/optimization). Pass a dict mapping each component name to its built <code>model.onnx</code>, plus the HF config so the composite registry can resolve <code>(clip, zero-shot-image-classification)</code>:</p> <pre><code>from transformers import AutoConfig\n\nfrom winml.modelkit.models import WinMLAutoModel\n\nmodel = WinMLAutoModel.from_onnx(\n    {\n        \"image-encoder\": \"output/image-encoder/model.onnx\",\n        \"text-encoder\": \"output/text-encoder/model.onnx\",\n    },\n    task=\"zero-shot-image-classification\",\n    hf_config=AutoConfig.from_pretrained(\"openai/clip-vit-base-patch32\"),\n    skip_build=True,\n)\n</code></pre> <p>Option 2 \u2014 Build both encoders from the HuggingFace model in one call. <code>WinMLAutoModel.from_pretrained</code> detects the composite task and runs the full pipeline for each sub-model:</p> <pre><code>from winml.modelkit.models import WinMLAutoModel\n\nmodel = WinMLAutoModel.from_pretrained(\n    \"openai/clip-vit-base-patch32\",\n    task=\"zero-shot-image-classification\",\n)\n</code></pre> <p>Either way, run inference the same way \u2014 prepare an image plus candidate labels with the HF processor, then call the model:</p> <pre><code>from PIL import Image\nfrom transformers import CLIPProcessor\n\nprocessor = CLIPProcessor.from_pretrained(\"openai/clip-vit-base-patch32\")\nimage = Image.open(\"cat.jpg\")\nlabels = [\"a photo of a cat\", \"a photo of a dog\", \"a photo of a car\"]\ninputs = processor(text=labels, images=image, return_tensors=\"pt\", padding=True)\n\n# Run both encoders and combine into per-label similarity scores\noutputs = model(**inputs)\nprobs = outputs.logits_per_image.softmax(dim=-1)\nfor label, p in zip(labels, probs[0].tolist()):\n    print(f\"{label}: {p:.4f}\")\n</code></pre> <p>The text encoder's fixed sequence length (77) is handled for you \u2014 the processor's tokens are padded or truncated to match the ONNX graph before each run.</p>"},{"location":"samples/clip-composite/#customizing-shape-config-per-sub-model","title":"Customizing shape config per sub-model","text":"<p>Each encoder takes its own <code>shape_config</code>, passed through <code>sub_model_kwargs</code>. The image encoder accepts vision keys (<code>height</code>, <code>width</code>); the text encoder accepts text keys (<code>sequence_length</code>):</p> <pre><code>model = WinMLAutoModel.from_pretrained(\n    \"openai/clip-vit-base-patch32\",\n    task=\"zero-shot-image-classification\",\n    sub_model_kwargs={\n        \"image-encoder\": {\"shape_config\": {\"height\": 224, \"width\": 224}},\n        \"text-encoder\":  {\"shape_config\": {\"sequence_length\": 77}},\n    },\n)\n</code></pre>"},{"location":"samples/clip-composite/#other-composite-models","title":"Other composite models","text":"<p>The same composite model pattern is used for:</p> <ul> <li>SigLIP (<code>google/siglip-base-patch16-224</code>) \u2014 dual-encoder zero-shot image classification; shares the same composite wrapper as CLIP</li> <li>T5 (<code>google-t5/t5-small</code>) \u2014 encoder + decoder for translation/summarization</li> <li>BART (<code>facebook/bart-large-cnn</code>) \u2014 encoder + decoder for summarization and table-question-answering (TAPEX)</li> <li>Marian (<code>Helsinki-NLP/opus-mt-en-de</code>) \u2014 encoder + decoder for translation</li> <li>Qwen3 (<code>Qwen/Qwen3-0.6B</code>) \u2014 prefill + generation decoders for text generation</li> <li>BLIP (<code>Salesforce/blip-image-captioning-base</code>) \u2014 vision encoder + text decoder for image-to-text captioning</li> <li>Vision-encoder-decoder (<code>microsoft/trocr-base-handwritten</code>) \u2014 vision encoder + text decoder for image-to-text (TrOCR, Donut)</li> </ul>"},{"location":"samples/clip-composite/#see-also","title":"See also","text":"<ul> <li>BERT \u2014 Config + Build + Perf \u2014 single-model workflow</li> <li>Hugging Face Model to NPU \u2014 step-by-step pipeline</li> <li>Supported Models \u2014 full list of validated architectures</li> <li>Config and build \u2014 concept overview</li> </ul>"},{"location":"tutorials/","title":"Tutorials","text":"<p>Tutorials are linear, prescriptive, end-to-end walkthroughs that guide you through building something concrete with <code>winml-cli</code>. Each tutorial moves in one direction\u2014start to finish\u2014so you can follow along without making decisions. If you need to understand the reasoning behind a feature, see the Concepts section (the why and when). If you need a quick reference for a specific command, see Commands (the what). Tutorials sit alongside Samples, which are reference-style demos that compare multiple approaches side by side rather than walking through a single path.</p>"},{"location":"tutorials/#available-tutorials","title":"Available tutorials","text":"Tutorial What you'll build Hardware Hugging Face Model to NPU A quantized ConvNeXt image classifier compiled for Snapdragon NPU (with CPU/DirectML fallback) Copilot+PC NPU primary; CPU works as fallback Bring Your Own ONNX Model Optimize and deploy an ONNX file you already have, using the analyze \u2192 optimize \u2192 re-analyze feedback loop Any (CPU, NPU, GPU) <p>More tutorials are coming, covering additional model families, execution providers, and deployment scenarios. Check back as the <code>winml-cli</code> documentation expands.</p>"},{"location":"tutorials/build-from-onnx/","title":"Bring Your Own ONNX Model","text":"<p>This tutorial walks you through the complete workflow for optimizing, analyzing, and deploying an ONNX model you already have \u2014 whether you exported it yourself (<code>torch.onnx.export</code>, ONNX Runtime tools), received it from a teammate, or downloaded it from the ONNX Model Zoo.</p> <p>Unlike the Hugging Face Model to NPU tutorial which starts from a HuggingFace model ID, this tutorial assumes you already have a <code>.onnx</code> file on disk and want to make it run faster on your target hardware.</p> <p>The tutorial is split into two sections. Section A walks through the analyze \u2192 optimize \u2192 re-analyze loop using primitive commands, teaching you how the optimization feedback cycle works. Section B shows how <code>winml build</code> automates that same loop in a single command, optionally targeting NPU with quantization.</p>"},{"location":"tutorials/build-from-onnx/#prerequisites","title":"Prerequisites","text":"<ul> <li>Windows 11 24H2 \u2014 required for NPU stack support</li> <li>Python 3.11 and uv installed (<code>pip install uv</code> or follow astral.sh/uv)</li> <li>winml-cli installed \u2014 see Installation</li> <li>An ONNX model file \u2014 this tutorial uses <code>my_model.onnx</code> as a placeholder; substitute your own file</li> </ul> <p>No NPU? Set <code>--device cpu</code> wherever you see <code>--device npu</code>. Every other flag stays the same.</p>"},{"location":"tutorials/build-from-onnx/#section-a-primitive-commands","title":"Section A \u2014 Primitive commands","text":"<p>Working through the primitive commands one at a time reveals how the analyze\u2013optimize feedback cycle works. Each command accepts the output of the previous step as input, and every intermediate artifact is available for inspection.</p>"},{"location":"tutorials/build-from-onnx/#step-1-analyze-the-original-model","title":"Step 1: Analyze the original model","text":"<p>Before any optimization, run the static analyzer to understand your model's EP compatibility and get optimization recommendations:</p> <pre><code>uv run winml analyze --model my_model.onnx --optim-config optim_config.json\n</code></pre> <p>The analyzer classifies every operator in the graph as supported, partial, unsupported, or unknown for each available EP. It also detects fusible subgraph patterns and writes the recommended optimization flags to <code>optim_config.json</code>.</p> <p>To target a specific EP:</p> <pre><code>uv run winml analyze --model my_model.onnx --ep qnn --device npu --optim-config optim_config.json\n</code></pre> <p>The output shows per-EP compatibility results:</p> <pre><code>\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\n ANALYSIS SUMMARY\n\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\u2550\n   QNNExecutionProvider (NPU): 122/0/0/0\n      Ready to deploy\n</code></pre> <p>If the analyzer detects fusible patterns (GeLU, LayerNorm, etc.), they will appear in the output and the <code>optim_config.json</code> will contain the recommended fusion settings. If no patterns are detected (as with simple architectures like ResNet), the config will be empty <code>{}</code>.</p> <p>What we just did</p> <p>The analyzer performs static analysis \u2014 no runtime or hardware required. It tells you two things: (1) can the model run on your target EP at all, and (2) are there graph patterns that the optimizer can fuse to improve performance. The <code>--optim-config</code> flag outputs a JSON file with the exact optimization settings the optimizer needs. S/P/U/Unk = Supported/Partial/Unsupported/Unknown.</p>"},{"location":"tutorials/build-from-onnx/#step-2-optimize-the-graph","title":"Step 2: Optimize the graph","text":"<p>Pass the analyzer's output config directly to the optimizer:</p> <pre><code>uv run winml optimize -m my_model.onnx -c optim_config.json -o my_model_optimized.onnx\n</code></pre> <p>The optimizer applies the fusions specified in the config and reports how many nodes it reduced:</p> <pre><code>Input: my_model.onnx\nOutput: my_model_optimized.onnx\n\nSuccess! Model optimized: my_model_optimized.onnx\nNodes: 122 -&gt; 122 (0.0% reduction)\n</code></pre> <p>Tip</p> <p>The node reduction depends on your model's architecture. Simple models like ResNet (only Conv, Relu, Add) have no fusible patterns. Transformer-based models (BERT, ViT) typically see 10\u201330% node reduction from GeLU, LayerNorm, and Attention fusions.</p> <p>What we just did</p> <p>Graph optimization fuses multi-node patterns (like the 5-node GeLU/Erf sequence) into single high-level operators that EPs can execute more efficiently. The optimizer is purely a graph transformation \u2014 it doesn't change the model's numerical behavior or require calibration data. Running it before quantization is important: calibration should be performed on the already-fused topology, not the verbose original graph.</p>"},{"location":"tutorials/build-from-onnx/#step-3-re-analyze-the-optimized-model","title":"Step 3: Re-analyze the optimized model","text":"<p>Run the analyzer again on the optimized output to confirm that the fusions resolved and no new issues appeared:</p> <pre><code>uv run winml analyze --model my_model_optimized.onnx --ep qnn --device npu\n</code></pre> <p>If the original analysis found fusible patterns that were optimized away, this run should show zero detected patterns and the same or better EP compatibility score.</p> <p>What we just did</p> <p>The analyze \u2192 optimize \u2192 re-analyze cycle is the fundamental feedback loop in winml-cli. In Section B you'll see that <code>winml build</code> automates this loop \u2014 it calls the analyzer, applies recommendations, re-analyzes, and repeats until convergence (typically 1\u20133 iterations). Doing it manually here teaches you what the automation is actually doing under the hood.</p>"},{"location":"tutorials/build-from-onnx/#step-4-optional-quantize","title":"Step 4 (optional): Quantize","text":"<p>Insert QDQ (Quantize-Dequantize) nodes into the optimized graph using static calibration:</p> <pre><code>uv run winml quantize -m my_model_optimized.onnx -o my_model_int8.onnx --precision int8 --samples 32\n</code></pre> <p>The quantizer generates 32 random calibration samples, runs them through the model to collect activation statistics, and uses those statistics to set the quantization scale and zero-point for each tensor.</p> <p>What we just did</p> <p><code>--precision int8</code> sets both weights and activations to 8-bit integers, which is the precision most NPU compilers expect. The output model still contains standard <code>QuantizeLinear</code> and <code>DequantizeLinear</code> ONNX nodes, so it is portable and can run on any ONNX Runtime backend. See Concepts \u2192 Quantization and QDQ for calibration methods and per-channel options.</p>"},{"location":"tutorials/build-from-onnx/#step-5-optional-compile-for-the-target-ep","title":"Step 5 (optional): Compile for the target EP","text":"<p>Compilation converts the portable quantized ONNX into an EP-specific binary format that the execution provider can load directly, skipping JIT compilation at inference time:</p> Qualcomm NPUIntel NPUAMD NPUCPU <pre><code>uv run winml compile -m my_model_int8.onnx --device npu --ep qnn\n</code></pre> <pre><code>uv run winml compile -m my_model_int8.onnx --device npu --ep openvino\n</code></pre> <pre><code>uv run winml compile -m my_model_int8.onnx --device npu --ep vitisai\n</code></pre> <pre><code>uv run winml compile -m my_model_int8.onnx --device cpu\n</code></pre> <p>What we just did</p> <p>Compilation embeds EP context \u2014 the compiled binary \u2014 inside or alongside the ONNX file using the <code>EPContext</code> node convention. At inference time the runtime loads the pre-compiled binary directly rather than re-compiling from the ONNX graph. See Concepts \u2192 Compile and EPContext for details.</p>"},{"location":"tutorials/build-from-onnx/#step-6-benchmark","title":"Step 6: Benchmark","text":"<p>Measure the performance of your model:</p> Optimized (CPU)Compiled (NPU) <pre><code>uv run winml perf -m my_model_optimized.onnx --device cpu --warmup 5 --iterations 50\n</code></pre> <pre><code>uv run winml perf -m my_model_int8_npu_ctx.onnx --device npu --iterations 50 --monitor\n</code></pre> <p>What we just did</p> <p><code>winml perf</code> generates random inputs matching the model's I/O spec, runs warmup iterations (excluded from statistics), then the benchmark iterations, and reports full latency percentiles alongside throughput. The <code>--monitor</code> flag activates live hardware utilization polling. See Concepts \u2192 Perf and monitoring for details.</p>"},{"location":"tutorials/build-from-onnx/#section-b-one-shot-with-winml-build","title":"Section B \u2014 One-shot with <code>winml build</code>","text":"<p>Once you understand the analyze \u2192 optimize \u2192 re-analyze loop (which you now do), you can let <code>winml build</code> handle everything in one command. When you pass a <code>.onnx</code> file, winml-cli auto-detects it and skips the export stage \u2014 running the optimization loop, quantization, and compilation automatically.</p> <pre><code>uv run winml build -m my_model.onnx -o output/ --device npu --precision int8\n</code></pre> <p>Config file is optional</p> <p>The <code>-c config.json</code> flag is optional. Without it, <code>winml build</code> auto-generates an internal config from the flags you pass (like <code>--device</code> and <code>--precision</code>). If you need a reusable config, generate one with <code>winml config</code>:</p> <pre><code>uv run winml config --onnx my_model.onnx -d npu --precision int8 -o config.json\nuv run winml build -m my_model.onnx -c config.json -o output/\n</code></pre> <p>The pipeline runs: analyze \u2192 optimize \u2192 (re-analyze \u2192 re-optimize if needed) \u2192 quantize \u2192 compile \u2192 model.onnx. The output directory looks like:</p> <pre><code>output/\n\u251c\u2500\u2500 model.onnx                     \u2190 FINAL: deploy this\n\u251c\u2500\u2500 my_model.onnx                  \u2190 Copy of your input\n\u251c\u2500\u2500 my_model_optimized.onnx        \u2190 After optimization loop converged\n\u251c\u2500\u2500 my_model_quantized.onnx        \u2190 After INT8 quantization\n\u251c\u2500\u2500 my_model_compiled.onnx         \u2190 After EP compilation\n\u251c\u2500\u2500 winml_build_config.json        \u2190 Config used (including auto-detected options)\n\u2514\u2500\u2500 analyze_result.json            \u2190 Analysis from optimize stage\n</code></pre> <p>You can selectively skip stages using the override flags:</p> <ul> <li><code>--no-optimize</code> \u2014 skip graph optimization (rarely needed; useful if you have a pre-optimized ONNX)</li> <li><code>--no-quant</code> \u2014 skip quantization (produces a floating-point compiled model)</li> <li><code>--no-compile</code> \u2014 skip compilation (produces a quantized but not device-locked ONNX)</li> </ul> <p>For example, to produce an optimized model without quantization or compilation:</p> <pre><code>uv run winml build -m my_model.onnx -o output/ --device cpu\n</code></pre> <p>What we just did</p> <p><code>winml build</code> is the production workflow. It guarantees that stages run in the correct order, passes intermediate artifacts through the pipeline automatically, and records which stages completed or were skipped in the result summary.</p> <p>Once the build completes, benchmark the final artifact:</p> <pre><code>uv run winml perf -m output/model.onnx --device npu --iterations 50 --monitor\n</code></pre>"},{"location":"tutorials/build-from-onnx/#using-the-python-api","title":"Using the Python API","text":"<pre><code>from winml.modelkit import WinMLAutoModel\n\n# Load from a pre-built ONNX (skips the build pipeline)\nmodel = WinMLAutoModel.from_onnx(\n    \"output/model.onnx\",\n    task=\"image-classification\",  # set your task\n    skip_build=True,\n)\n\noutput = model(pixel_values=your_input_tensor)\n</code></pre> <p>Or trigger the full build programmatically:</p> <pre><code>from winml.modelkit.build import build_onnx_model\nfrom winml.modelkit.config import generate_build_config\n\nconfig = generate_build_config(onnx_path=\"my_model.onnx\", device=\"npu\", precision=\"int8\")\nresult = build_onnx_model(\"my_model.onnx\", config=config, output_dir=\"output/\")\nprint(f\"Final model: {result.final_onnx_path}\")\n</code></pre>"},{"location":"tutorials/build-from-onnx/#troubleshooting","title":"Troubleshooting","text":"Problem Solution \"ONNX file not found\" Use an absolute path or ensure the file is in the current directory Analyzer reports unsupported ops Check if an optimization fusion resolves them; if not, the model needs modification for that EP Optimization loop doesn't converge The default max is 3 iterations; if patterns persist, they may not be fusible \u2014 use <code>--no-quant --no-compile</code> and inspect Quantization accuracy regression Try <code>--precision int16</code>, <code>--per-channel</code>, or increase <code>--samples</code> for better calibration EP compilation fails Check the selected EP, model compatibility, and target device availability Model too large for memory Use <code>--no-compile</code> and compile on the target device"},{"location":"tutorials/build-from-onnx/#where-to-go-next","title":"Where to go next","text":"<ul> <li>Hugging Face Model to NPU \u2014 the same pipeline starting from HuggingFace (includes export stage)</li> <li>Output Layout \u2014 what each output file contains and the <code>analyze_result.json</code> schema</li> <li>Concepts \u2192 Analyze and optimize \u2014 how the convergence loop works internally</li> <li>Build Config Schema \u2014 customize quantization, compilation, and optimization settings</li> </ul>"},{"location":"tutorials/npu-convnext/","title":"Hugging Face Model to NPU","text":"<p>Pick the right ConvNeXt page</p> <p>Two pages use ConvNeXt as their vehicle:</p> <ul> <li>This tutorial \u2014 the canonical deep-dive: full pipeline with both QNN and OpenVINO NPU backends, plus the <code>winml build</code> one-shot. Start here if you want to ship to NPU.</li> <li>Quickstart \u2014 the short Getting Started introduction. Start here for a 15-minute taste.</li> </ul> <p>This tutorial walks you through the complete journey from a pretrained Hugging Face model \u2014 <code>facebook/convnext-tiny-224</code> \u2014 to a quantized, compiled artifact running on an NPU. By the end you will have benchmarked the model on your device and measured real inference latency. Nothing is skipped, and every command produces a file you can inspect or reuse.</p> <p>The primary hardware target is a Copilot+PC with a Snapdragon X-class NPU (40+ TOPS). If you do not have an NPU, every step works on CPU or DirectML as a fallback \u2014 the only thing that changes is the <code>--device</code> and <code>--ep</code> flags on the compile and perf commands. Those variations are shown explicitly in the tabbed blocks below.</p> <p>The tutorial is split into two sections. Section A runs through eight primitive commands \u2014 one per pipeline stage \u2014 so you understand what each stage does, what artifact it produces, and why it matters. Section B shows you that <code>winml build</code> runs the same pipeline in a single command once you have a config file. Most production workflows live in Section B; Section A is how you learn to trust it.</p>"},{"location":"tutorials/npu-convnext/#prerequisites","title":"Prerequisites","text":"<ul> <li>Windows 11 24H2 \u2014 required for NPU stack support</li> <li>Copilot+PC with NPU \u2014 40+ TOPS recommended; CPU and DirectML work as fallback throughout</li> <li>Python 3.11 and uv installed (<code>pip install uv</code> or follow astral.sh/uv)</li> <li>winml-cli installed \u2014 see Installation</li> </ul> <p>No NPU? Set <code>--device cpu</code> wherever you see <code>--device npu</code> and drop <code>--monitor</code> from perf commands. Every other flag stays the same.</p>"},{"location":"tutorials/npu-convnext/#section-a-primitive-commands","title":"Section A \u2014 Primitive commands","text":"<p>Working through the primitive commands one at a time is the best way to understand what the <code>winml build</code> wrapper does under the hood. Each step accepts the output of the previous step as its input, so the chain is explicit and every intermediate artifact is available for inspection.</p>"},{"location":"tutorials/npu-convnext/#step-1-inspect-the-model","title":"Step 1: Inspect the model","text":"<p>Before downloading any weights, confirm that winml-cli knows how to handle <code>facebook/convnext-tiny-224</code>.</p> <pre><code>uv run winml inspect -m facebook/convnext-tiny-224\n</code></pre> <p>You should see output similar to the following:</p> <pre><code>Model               facebook/convnext-tiny-224\nTask                image-classification\nModel class         ConvNextForImageClassification\nExporter            optimum/onnx\nInput               pixel_values: float32 [1, 3, 224, 224]\nOutput              logits: float32 [1, 1000]\nSupport status      supported\n</code></pre> <p>What we just did</p> <p><code>winml inspect</code> queries the Hugging Face model card and winml-cli's internal registry without downloading weights. It confirms three things: the auto-detected task (<code>image-classification</code>), the model class that will be used for loading, and the exporter that will handle the ONNX conversion. If this command fails, stop here \u2014 something about the model is unsupported and proceeding would waste time. A successful inspect is the green light for every stage that follows.</p>"},{"location":"tutorials/npu-convnext/#step-2-generate-a-build-config","title":"Step 2: Generate a build config","text":"<p>Generate a <code>WinMLBuildConfig</code> JSON file for the model. For the primitive workflow this file is optional \u2014 you can drive each stage entirely through CLI flags \u2014 but generating it now gives you a versioned record of every auto-detected setting, and it is required for Section B.</p> <pre><code>uv run winml config -m facebook/convnext-tiny-224 --device npu --precision int8 -o convnext_config.json\n</code></pre> <p>Open <code>convnext_config.json</code> to see what was auto-detected: the task, I/O tensor shapes, quantization parameters, and the compile target. The <code>--device npu --precision int8</code> flags tell the config generator to pre-populate the quantization and compile sections for NPU deployment rather than leaving them at defaults.</p> <p>What we just did</p> <p><code>winml config</code> auto-resolves every setting that would otherwise require you to look up flags manually. The resulting JSON is the single source of truth for a reproducible build. You can commit it to version control, share it with teammates, edit a single field to try a different precision, and replay the exact same build on any machine. See Concepts \u2192 Config and build for a deeper look at the config schema and how the stages interact.</p>"},{"location":"tutorials/npu-convnext/#step-3-export-to-onnx","title":"Step 3: Export to ONNX","text":"<p>Download the pretrained weights and convert the PyTorch model to ONNX format.</p> <pre><code>uv run winml export -m facebook/convnext-tiny-224 -o convnext.onnx\n</code></pre> <p>This runs an eight-stage export pipeline: model preparation, input generation, hierarchy building, ONNX conversion, node tagging, tag injection, and metadata generation. The result is a standards-compliant ONNX file with winml-cli's Hierarchy-preserving Tags Protocol (HTP) metadata embedded in node <code>metadata_props</code>. That metadata is what lets downstream tools make architecture-aware optimization decisions without hardcoded model knowledge.</p> <p>What we just did</p> <p>The default export embeds hierarchy tags \u2014 a tree of source module names mapped onto ONNX nodes \u2014 so that the optimizer and analyzer can reason about the graph in terms of the original model structure rather than flat node lists. If you need a clean ONNX without that metadata (for compatibility with other tools), add <code>--no-hierarchy</code>. See Concepts \u2192 Load and export for what hierarchy preservation adds and when it matters.</p>"},{"location":"tutorials/npu-convnext/#step-4-analyze-for-ep-compatibility","title":"Step 4: Analyze for EP compatibility","text":"<p>Before spending time on optimization and quantization, check that the model's operators are supported by your target execution provider.</p> <pre><code>uv run winml analyze -m convnext.onnx --ep qnn --device npu\n</code></pre> <p>The analyzer performs static analysis \u2014 no runtime required \u2014 and classifies every operator in the graph as supported, partial, or unsupported for the target EP. It reports a coverage summary, flags any operators that may fall back to CPU, and exits with code 0 for full support or 1 for partial support.</p> <p>For CPU fallback, run:</p> <pre><code>uv run winml analyze -m convnext.onnx --ep cpu --device cpu\n</code></pre> <p>What we just did</p> <p>Knowing your operator coverage before you quantize or compile saves you from discovering EP incompatibilities at the very last step of a long pipeline. ConvNeXt's operators (Conv, GELU, LayerNorm, Add) have broad support across QNN and OpenVINO, so this command should exit 0. If it exits 1, the output tells you which operators are problematic and includes recommendations for resolving them \u2014 typically by enabling a graph rewrite in the optimizer that fuses the unsupported pattern into a supported one. See Concepts \u2192 Analyze and optimize for details on the analyzer's recommendation engine.</p>"},{"location":"tutorials/npu-convnext/#step-5-optimize-the-graph","title":"Step 5: Optimize the graph","text":"<p>Apply graph-level optimizations: operator fusion, constant folding, shape inference, and EP-specific graph rewrites.</p> <pre><code>uv run winml optimize -m convnext.onnx -o convnext_optim.onnx\n</code></pre> <p>The optimizer reports how many nodes it reduced. A typical ConvNeXt-tiny optimization fuses several element-wise sequences and removes redundant reshape operations, cutting the node count noticeably without changing model semantics. If you want to apply a specific preset suited to the Snapdragon NPU, add <code>--preset qnn-compatible</code> to disable fusions that QNN does not benefit from.</p> <p>What we just did</p> <p>Graph optimization is a separate stage from quantization so that you can inspect the intermediate graph, compare node counts, and selectively enable or disable individual fusion passes using the <code>--enable-*</code> / <code>--disable-*</code> flags. Run <code>uv run winml optimize --list-capabilities</code> to see every registered optimization flag and its default state. Optimization always happens on the floating-point graph; quantization is applied after so that calibration statistics are computed on the already-fused topology.</p>"},{"location":"tutorials/npu-convnext/#step-6-quantize","title":"Step 6: Quantize","text":"<p>Insert QDQ (Quantize-Dequantize) nodes into the optimized graph using static calibration. This reduces model size and speeds up inference on hardware with integer execution units, which includes Snapdragon NPUs and Intel NPUs.</p> <pre><code>uv run winml quantize -m convnext_optim.onnx -o convnext_int8.onnx --precision int8 --samples 32\n</code></pre> <p>The quantizer generates 32 random calibration samples, runs them through the model to collect activation statistics, and uses those statistics (with the default <code>minmax</code> method) to set the quantization scale and zero-point for each tensor. Thirty-two samples is sufficient for a vision model with fixed-size inputs like ConvNeXt. For models with variable-length inputs or complex activation distributions, increase <code>--samples</code> to 64 or 128.</p> <p>What we just did</p> <p><code>--precision int8</code> sets both weights and activations to 8-bit integers, which is the precision most NPU compilers expect. The output model still contains standard <code>QuantizeLinear</code> and <code>DequantizeLinear</code> ONNX nodes, so it is portable and can run on any ONNX Runtime backend \u2014 you do not need special tooling to inspect it. See Concepts \u2192 Quantization and QDQ for a detailed explanation of the QDQ node pattern, calibration methods, and how to choose between per-tensor and per-channel quantization.</p>"},{"location":"tutorials/npu-convnext/#step-7-compile-for-the-target-ep","title":"Step 7: Compile for the target EP","text":"<p>Compilation converts the portable quantized ONNX into an EP-specific binary format that the execution provider can load directly, skipping JIT compilation at inference time. This is the step that produces a device-locked artifact tied to the selected EP.</p> <p>The examples below use the default compiler backend (<code>--compiler ort</code>), which uses ONNX Runtime's built-in EP context compiler:</p> Qualcomm NPUIntel NPUAMD NPUCPU <pre><code>uv run winml compile -m convnext_int8.onnx --device npu --ep qnn\n</code></pre> <pre><code>uv run winml compile -m convnext_int8.onnx --device npu --ep openvino\n</code></pre> <pre><code>uv run winml compile -m convnext_int8.onnx --device npu --ep vitisai\n</code></pre> <pre><code>uv run winml compile -m convnext_int8.onnx --device cpu\n</code></pre> <p>The compiled output file appears in the same directory as the input model. The file name follows the pattern <code>convnext_int8_npu_ctx.onnx</code> (using the resolved device string <code>npu</code>, not the EP name) and an accompanying <code>.bin</code> context binary is written alongside it (unless <code>--embed</code> is passed, which embeds the binary inside the ONNX file). CPU builds do not produce a new artifact \u2014 the compile step validates EP compatibility but writes no output file; use <code>convnext_int8.onnx</code> directly for CPU inference.</p> <p>What we just did</p> <p>Compilation embeds EP context \u2014 the compiled binary \u2014 inside or alongside the ONNX file using the <code>EPContext</code> node convention. At inference time the runtime loads the pre-compiled binary directly rather than re-compiling from the ONNX graph, eliminating the 15\u201360 second JIT penalty on first load. The default <code>--compiler ort</code> backend bundles compilation within ONNX Runtime itself. See Concepts \u2192 Compile and EPContext for the full picture of what gets embedded and how the context is consumed at runtime.</p>"},{"location":"tutorials/npu-convnext/#step-8-benchmark","title":"Step 8: Benchmark","text":"<p>Measure inference latency and throughput with the <code>--monitor</code> flag to see live NPU utilization alongside the timing numbers.</p> QNN NPUOpenVINO NPUCPU <pre><code>uv run winml perf -m convnext_int8_npu_ctx.onnx --device npu --iterations 50 --monitor\n</code></pre> <pre><code>uv run winml perf -m convnext_int8_npu_ctx.onnx --device npu --ep openvino --iterations 50 --monitor\n</code></pre> <pre><code>uv run winml perf -m convnext_int8.onnx --device cpu --iterations 50\n</code></pre> <p>A representative run on a Snapdragon X Elite NPU produces output like the following:</p> <pre><code>Device:       npu\nTask:         image-classification\nIterations:   50 (+ 10 warmup)\nBatch Size:   1\n\nLatency (ms)\n  Avg    P50    P90    P95    P99    Min    Max    Std\n  2.14   2.11   2.31   2.38   2.59   1.98   2.71   0.14\n\nThroughput:  467.29 samples/sec\n\nHardware (during benchmark)\n  NPU: 72.4% avg, 89.1% peak  |  CPU: 3.2% avg\n  Sys Mem: 1842 MB  |  Device Mem: 48/12 MB (local/shared)\n</code></pre> <p>The CPU fallback (same model, <code>--device cpu</code>) will typically show latencies 8\u201315x higher and near-zero NPU utilization. The contrast between those two runs is the best proof that your NPU path is actually being used.</p> <p>What we just did</p> <p><code>winml perf</code> generates random inputs matching the model's I/O spec, runs the configured number of warmup iterations (excluded from statistics), then the benchmark iterations, and reports full latency percentiles alongside throughput. The <code>--monitor</code> flag activates live hardware utilization polling at 200 ms intervals, displaying an in-terminal chart and attaching the hardware metrics to the JSON report saved alongside the console output. See Concepts \u2192 Perf and monitoring for how to interpret the utilization numbers and what <code>hw_monitor</code> fields look like in the JSON report.</p>"},{"location":"tutorials/npu-convnext/#step-9-optional-evaluate-accuracy","title":"Step 9 (optional): Evaluate accuracy","text":"<p>After quantization it is good practice to verify that INT8 accuracy is close to the FP32 baseline. The <code>winml eval</code> command runs the model against a held-out dataset slice and reports task-relevant metrics.</p> <pre><code>uv run winml eval -m convnext_int8.onnx --model-id facebook/convnext-tiny-224 --dataset imagenet-1k --split validation --samples 100 --device npu\n</code></pre> <p>The <code>--model-id</code> flag is required when passing an ONNX file, because the evaluator needs it to locate the preprocessor and label mappings. The command downloads 100 shuffled validation samples, runs inference, and reports top-1 and top-5 accuracy. A well-quantized ConvNeXt-tiny should lose less than 0.5 percentage points of top-1 accuracy compared to the floating-point checkpoint.</p> <p>What we just did</p> <p>Accuracy evaluation gives you a principled stopping criterion for quantization decisions. If the accuracy drop is larger than acceptable, return to Step 6 and try <code>--precision int16</code> or per-channel quantization (<code>--per-channel</code>) instead of the default per-tensor int8. See Concepts \u2192 Eval and datasets for the full list of supported datasets, tasks, and column mapping options.</p>"},{"location":"tutorials/npu-convnext/#section-b-one-shot-with-winml-build","title":"Section B \u2014 One-shot with <code>winml build</code>","text":"<p>Once you understand what each primitive stage does (which you now do), you can collapse the entire pipeline into a single command. <code>winml build</code> orchestrates export, optimize, quantize, and compile in sequence.</p> <pre><code>uv run winml build -m facebook/convnext-tiny-224 -o convnext_out/ --device npu --precision int8\n</code></pre> <p>Config file is optional</p> <p>The <code>-c config.json</code> flag is optional. Without it, <code>winml build</code> auto-generates an internal config from the flags you pass (like <code>--device</code> and <code>--precision</code>). If you need a reusable config, generate one with <code>winml config</code>.</p> <p>The command downloads the pretrained weights, runs all four pipeline stages, and writes every intermediate and final artifact into <code>convnext_out/</code>. The stage timing is printed as each stage completes, and the final line tells you the path of the compiled model.</p> <p>You can selectively skip stages using the override flags:</p> <ul> <li><code>--no-optimize</code> \u2014 skip graph optimization (rarely needed; useful if you have a pre-optimized ONNX)</li> <li><code>--no-quant</code> \u2014 skip quantization (produces a floating-point compiled model)</li> <li><code>--no-compile</code> \u2014 skip compilation (produces a quantized but not device-locked ONNX)</li> </ul> <p>For example, to produce an optimized and quantized model without the compile step:</p> <pre><code>uv run winml build -m facebook/convnext-tiny-224 -o convnext_out/ --device npu --precision int8 --no-compile\n</code></pre> <p>What we just did</p> <p><code>winml build</code> is the production workflow. It guarantees that stages run in the correct order, passes intermediate artifacts through the pipeline automatically, and records which stages completed or were skipped in the result summary.</p> <p>Once the build completes, benchmark the final artifact from <code>convnext_out/</code>:</p> <pre><code>uv run winml perf -m convnext_out/model.onnx --device npu --iterations 50 --monitor\n</code></pre> <p>The result should match what you saw in Step 8, confirming that the <code>winml build</code> pipeline produces bit-identical output to the manual primitive chain.</p>"},{"location":"tutorials/npu-convnext/#where-to-go-next","title":"Where to go next","text":"<ul> <li>Concepts \u2192 How winml-cli works \u2014 the full mental model for the pipeline</li> <li>Concepts \u2192 Compile and EPContext \u2014 understanding the compiled artifact format</li> <li>Commands \u2192 Overview \u2014 quick reference for every flag on every command</li> </ul>"},{"location":"tutorials/npu-convnext/#see-also","title":"See also","text":"<ul> <li>Concepts \u2192 Quantization and QDQ</li> <li>Concepts \u2192 Analyze and optimize</li> <li>Concepts \u2192 Perf and monitoring</li> <li>Concepts \u2192 Eval and datasets</li> </ul>"}]}
\ No newline at end of file
diff --git a/reports/README.md b/reports/README.md
index 736902bea..9b7e8afb6 100644
--- a/reports/README.md
+++ b/reports/README.md
@@ -1,11 +1,11 @@
-# Examples compatibility report
+# Model accuracy report
 
-This folder hosts the **examples compatibility report** published to the public
+This folder hosts the **model accuracy report** published to the public
 winml-cli GitHub Pages site, plus the script used to refresh it.
 
 | File | Purpose |
 | --- | --- |
-| `examples_compatibility_report.html` | The self-contained report page (all data embedded inline). |
+| `model_accuracy_report.html` | The self-contained report page (all data embedded inline). |
 | `download_report.py` | Fetches the latest report from the private artifacts repo. |
 | `README.md` | This file. |
 
@@ -17,7 +17,7 @@ winml-cli GitHub Pages site, plus the script used to refresh it.
 ## Source
 
 The report is generated in the private `gim-home/ModelKitArtifacts` repo and
-lives at `e2e_model_coverage_result/examples_compatibility_report.html` on its
+lives at `e2e_model_coverage_result/model_accuracy_report.html` on its
 `site-src` branch. The page embeds all of its data inline, so only this one
 file needs to be published — no JSON or other assets are fetched at runtime.
 
@@ -42,7 +42,7 @@ cd ../wmlcli-ghpages/reports
 
 Then run the script from this `reports/` folder. It uses only the Python
 standard library — no project dependencies or `uv` required. By default it
-overwrites `examples_compatibility_report.html` next to the script:
+overwrites `model_accuracy_report.html` next to the script:
 
 ```powershell
 python download_report.py --account <your_gim-home_account>
@@ -57,12 +57,12 @@ fetches — it does not commit or push.
 Commit and push the refreshed report on `gh-pages`:
 
 ```powershell
-git add reports/examples_compatibility_report.html
-git commit -m "Update examples compatibility report"
+git add reports/model_accuracy_report.html
+git commit -m "Update model accuracy report"
 git push origin gh-pages
 ```
 
-The report is then available at `.../reports/examples_compatibility_report.html`.
+The report is then available at `.../reports/model_accuracy_report.html`.
 GitHub Pages redeploys automatically within a minute or two of the push.
 
 If you used a worktree, clean it up afterwards:
diff --git a/reports/download_report.py b/reports/download_report.py
index afb5e45e7..6c78fa6f6 100644
--- a/reports/download_report.py
+++ b/reports/download_report.py
@@ -2,7 +2,7 @@
 # Copyright (c) Microsoft Corporation. All rights reserved.
 # Licensed under the MIT License.
 # --------------------------------------------------------------------------
-"""Fetch the model compatibility report from gim-home/ModelKitArtifacts.
+"""Fetch the model accuracy report from gim-home/ModelKitArtifacts.
 
 For Microsoft internal use only. Requires gh CLI authenticated with an account
 that has access to the gim-home org.
@@ -25,14 +25,14 @@
     python download_report.py --account <account> --out <path>
 
 By default the report is written next to this script, overwriting the published
-copy (reports/examples_compatibility_report.html on the gh-pages branch).
+copy (reports/model_accuracy_report.html on the gh-pages branch).
 
 PUBLISHING (manual, done by a maintainer):
     See README.md (co-located in this folder) for full instructions. After
     fetching, commit and push the refreshed report on the gh-pages branch:
 
-        git add reports/examples_compatibility_report.html
-        git commit -m "Update examples compatibility report"
+        git add reports/model_accuracy_report.html
+        git commit -m "Update model accuracy report"
         git push origin gh-pages
 """
 
@@ -47,7 +47,7 @@
 
 SOURCE_REPO = "gim-home/ModelKitArtifacts"
 SOURCE_BRANCH = "site-src"
-SOURCE_FILE = "e2e_model_coverage_result/examples_compatibility_report.html"
+SOURCE_FILE = "e2e_model_coverage_result/model_accuracy_report.html"
 REPORT_FILENAME = SOURCE_FILE.rsplit("/", 1)[-1]
 DEFAULT_OUT = Path(__file__).resolve().parent / REPORT_FILENAME
 
@@ -122,7 +122,7 @@ def _sparse_clone(clone_url: str, dest: Path) -> bool:
 
 def main() -> None:
     parser = argparse.ArgumentParser(
-        description="Fetch the examples compatibility report from gim-home/ModelKitArtifacts"
+        description="Fetch the model accuracy report from gim-home/ModelKitArtifacts"
     )
     parser.add_argument("--account", type=str, help="gh CLI account with access to gim-home org")
     parser.add_argument(
diff --git a/reports/examples_compatibility_report.html b/reports/model_accuracy_report.html
similarity index 100%
rename from reports/examples_compatibility_report.html
rename to reports/model_accuracy_report.html