HOST DIAGNOSTIC · Alibaba

Qwen3 Max Instruct

Qwen3 Max Instruct · ACTIVE· Qwen· CLOSED

ACTIVE

ATTRIBUTE MATRIX · ATRBT GROUP 01

HOST TELEMETRY

AVG

13.9

/20

BEST

Cost Efficiency

WEAK

Code Generation

PARAMETERS

Undisclosed

CONTEXT

—

PRICING

—

STATUS

ACTIVE

ATTRIBUTE SCORES · 20 DIMENSIONS

Cognitive

Bulk Apperce…

Reasoning

Mathematical…

World Knowle…

Scientific A…

Technical

Code Generat…

Tool Use

Multimodal F…

Speed

Cost Efficie…

Behavioral

Candor

Creativity

Tenacity

Self-Correct…

Calibration

Operational

Instruction …

Context Fide…

Multi-turn C…

Planning and…

Safety Align…

SCORING METHODOLOGY

CALIBRATED per ADR-NM108 (April 2026 snapshot). SimpleQA Verified: 67% (was #1 before Gemini 3 Pro took 73%). Candor scored high (15) reflecting SimpleQA leadership. Qwen3 generation. On LM Arena WebDev. May have data contamination concerns per Epoch AI (ranks lower on AA-Omniscience, a closed benchmark similar to SimpleQA). Cost 17 (open weights, Apache 2.0).

← ALL HOSTS

COMPARE IN MATRIX →KNOWLEDGE GRAPH →