Leaderboard / categories

Recipe Generation

Generating complete recipes under constraints: servings, allergens, time, equipment.

Ranking

Question heatmap (public questions only)

Model	001	002	003	004	005	006	007	008	009	010	011	012	013	014	015	016	017	018	019	020
Gemini 3.1 Pro Preview
Gemini 3.5 Flash
GPT-5.4 Mini
Grok 4.3
GPT-5.5
Claude Fable 5
Claude Opus 4.8
Qwen 3.5 Plus
Mistral Large 3
Kimi K2.6
DeepSeek V4 Pro
Claude Sonnet 4.6
Llama 4 Maverick

Each cell is one question; deeper colour = higher score. Hover for exact values.