Benchmark Claude Code, 6 konfiguracji — wygrał Sonnet
Sześć kontrolowanych runów na tym samym tickecie inżynierskim, konfiguracje od A do F. Sonnet 4.6 z czteropunktowym promptem efektywnościowym zużył 27% mniej turnów i 24% mniej output tokenów niż ten sam model bez instrukcji — a droższy Opus 4.7 nie dał żadnej przewagi jakościowej, kosztując 1.5–2× więcej.
Read article →