Anthropic dominoi LMArenaa: neljä Claude Opus -mallia top 4:ssa.
Claude Opus 4.6 ja 4.7 -thinking-versiot vievät kärjen. Gemini 3 Pro ja GPT-5.5 seuraavat, mutta välimatka on selkeä.
Viikon kärjet
- Anthropic varaa LMArena top 4 — Claude Opus 4.6-thinking johtaa Elolla 1502.
- DeepSeek V4 Pro (862B MoE) on uusin frontier-tasoinen avoin malli — pohdi compliance-vaatimuksia kiinalaisten mallien kohdalla.
- Vaikutus suomalaisille organisaatioille: jos olit GPT-vetoinen, harkitse Claude Opus -malleja ennen seuraavaa pilotointia.
IN — uudet ja relevantit
- Claude Opus 4.7 (thinking) Anthropicin uusin liittyi top 4:ään LMArenassa.
- DeepSeek V4 Pro 862B MoE-malli on uusin frontier-tasoinen avoin malli HF Trendingissä.
- MoE-arkkitehtuuri valtaa avoimet mallit Llama 4 (Scout 17B-16E ja Maverick 17B-128E) sekä Qwen3.6-35B-A3B kaikki rakentavat MoE:lle.
OUT — vanhentuneet
- GPT-4o ja vanhempi Claude-sukupolvi Vanhentuneet LMArena top-listoilla.
- AGI vuonna 2026 -puhe Kärkitutkijat maltillistuivat — fokus agenteissa.
- Käsin promptaaminen ad hoc Organisaatiot vaativat rakenteellista promptien hallintaa.