AI-benchmark på norsk: dagens beste modeller
Over 350 AI-modeller evalueres hver morgen — de beste på norsk språkkvalitet, hastighet og verdi presenteres her.
Les ukesrapporter → Sammenlign modeller → ChatGPT vs Claude → Gemini vs ChatGPT →
Beste i sin klasse
Er premium verdt det?
For norsk tekst og enkle oppgaver holder mid-range svært godt. Premium lønner seg ved kompleks resonnering, lange dokumenter og når presisjon er kritisk.
Alle resultater
| # | Modell | Tier | norsk | Instr | Score | Pris/1M |
|---|---|---|---|---|---|---|
| 1 | Mistral Large 2407 mistralai | Mid-range | 8.0 | 10.0 | 8.5 | $2.00 ≈19 kr |
| 2 | Cohere: Command R+ (08-2024) cohere | Premium | 8.0 | 10.0 | 8.0 | $2.50 ≈24 kr |
| 3 | Anthropic: Claude Haiku 4.5 anthropic | Mid-range | 8.0 | 10.0 | 7.5 | $1.00 ≈10 kr |
| 4 | Anthropic: Claude Sonnet 4.6 anthropic | Premium | 8.0 | 10.0 | 7.4 | $3.00 ≈29 kr |
| 5 | Perplexity: Sonar Pro Search perplexity | Premium | 8.0 | 10.0 | 7.2 | $3.00 ≈29 kr |
| 6 | Meta: Llama 3.2 3B Instruct meta-llama | Budsjett | 8.0 | 8.0 | 8.2 | $0.05 ≈0 kr |
| 7 | Cohere: Command R7B (12-2024) cohere | Budsjett | 8.0 | 8.0 | 7.6 | $0.04 ≈0 kr |
| 8 | IBM: Granite 4.0 Micro ibm-granite | Budsjett | 6.0 | 10.0 | 8.1 | $0.02 ≈0 kr |
| 9 | Google: Gemma 3 4B google | Budsjett | 6.0 | 10.0 | 7.7 | $0.05 ≈0 kr |
| 10 | OpenAI: GPT-5.4 Nano openai | Mid-range | 6.0 | 10.0 | 7.4 | $0.20 ≈2 kr |
| 11 | OpenAI: GPT-4 Turbo openai | Premium | 6.0 | 10.0 | 6.9 | $10.00 ≈97 kr |
| 12 | Google: Gemini 2.5 Pro google | Mid-range | 6.0 | 4.0 | 4.7 | $1.25 ≈12 kr |
Responstid siste 14 dager
Slik tester vi
Vi evaluerer over 350 AI-modeller og presenterer de beste resultatene hver morgen. Scoren kombinerer språkforståelse, kvalitet, hastighet, pris og stabilitet. Den nøyaktige vektingen er proprietær.
Les mer om metodikken →Vanlige spørsmål
Vi evaluerer over 350 tilgjengelige modeller og presenterer de beste resultatene fra siste benchmark. Utvalget oppdateres dynamisk når markedet endrer seg.
Språk-scoren viser hvor godt modellen leverer svar på riktig språk og med god språkkvalitet. Scoren vises som et normalisert tall.
Instruksjons-scoren viser hvor godt modellen følger oppgaven den får. Vi viser resultatet som en enkel, normalisert score.
Scoren kombinerer språkforståelse, kvalitet, hastighet, pris og stabilitet. Den nøyaktige vektingen er proprietær.
Beste verdi peker på modeller som gir sterke resultater i forhold til pris. Den nøyaktige beregningen er proprietær.