Sist oppdatert: 2026-06-23

AI-benchmark på norsk: dagens beste modeller

Over 350 AI-modeller evalueres hver morgen — de beste på norsk språkkvalitet, hastighet og verdi presenteres her.

Les ukesrapporter → Sammenlign modeller → ChatGPT vs Claude → Gemini vs ChatGPT →

Beste i sin klasse

🏆
Høyest score
Mistral Large 2407
8.5/10
🇳🇴
Best på norsk
Meta: Llama 3.2 3B Instruct
8.0/10
Raskest
Meta: Llama 3.2 3B Instruct
265 t/s
💰
Billigst (score ≥ 3)
Meta: Llama 3.2 3B Instruct
$0.05/1M
📊
Beste verdi
IBM: Granite 4.0 Micro
Verdi 266.7
🔗
Beste orkestrator
Cohere: Command R+ (08-2024)
Orch 8.0/10

Er premium verdt det?

Premium norsk-score
3.8/5
Mid-range norsk-score
3.5/5
Prisforskjell
~4×

For norsk tekst og enkle oppgaver holder mid-range svært godt. Premium lønner seg ved kompleks resonnering, lange dokumenter og når presisjon er kritisk.

Alle resultater

# Modell Tier t/s TTFT norsk Instr Score Orch. Verdi EU Pris/1M
1
Mistral Large 2407
mistralai
Stabil
Mid-range 222 62 ms 8.0 10.0 8.5 8.0 4.5 🇪🇺 EU $2.00
≈19 kr
2
Cohere: Command R+ (08-2024)
cohere
Premium 145 131 ms 8.0 10.0 8.0 8.0 3.6 $2.50
≈24 kr
3
Anthropic: Claude Haiku 4.5
anthropic
Mid-range 104 123 ms 8.0 10.0 7.5 8.0 8.9 🇪🇺 EU $1.00
≈10 kr
4
Anthropic: Claude Sonnet 4.6
anthropic
Stabil
Premium 91 253 ms 8.0 10.0 7.4 8.0 3.0 🇪🇺 EU $3.00
≈29 kr
5
Perplexity: Sonar Pro Search
perplexity
Stabil
Premium 64 205 ms 8.0 10.0 7.2 8.0 3.0 ~EU $3.00
≈29 kr
6
Meta: Llama 3.2 3B Instruct
meta-llama
Stabil
Budsjett 265 120 ms 8.0 8.0 8.2 6.4 133.3 $0.05
≈0 kr
7
Cohere: Command R7B (12-2024)
cohere
Stabil
Budsjett 206 97 ms 8.0 8.0 7.6 6.4 160.0 $0.04
≈0 kr
8
IBM: Granite 4.0 Micro
ibm-granite
Budsjett 239 77 ms 6.0 10.0 8.1 6.0 266.7 $0.02
≈0 kr
9
Google: Gemma 3 4B
google
Stabil
Budsjett 222 86 ms 6.0 10.0 7.7 6.0 133.3 ~EU $0.05
≈0 kr
10
OpenAI: GPT-5.4 Nano
openai
Stabil
Mid-range 170 113 ms 6.0 10.0 7.4 6.0 38.1 $0.20
≈2 kr
11
OpenAI: GPT-4 Turbo
openai
Premium 105 160 ms 6.0 10.0 6.9 6.0 0.8 $10.00
≈97 kr
12
Google: Gemini 2.5 Pro
google
Mid-range 142 75 ms 6.0 4.0 4.7 2.4 4.0 ~EU $1.25
≈12 kr

Responstid siste 14 dager

Slik tester vi

Vi evaluerer over 350 AI-modeller og presenterer de beste resultatene hver morgen. Scoren kombinerer språkforståelse, kvalitet, hastighet, pris og stabilitet. Den nøyaktige vektingen er proprietær.

Les mer om metodikken →

Vanlige spørsmål

Vi evaluerer over 350 tilgjengelige modeller og presenterer de beste resultatene fra siste benchmark. Utvalget oppdateres dynamisk når markedet endrer seg.

Språk-scoren viser hvor godt modellen leverer svar på riktig språk og med god språkkvalitet. Scoren vises som et normalisert tall.

Instruksjons-scoren viser hvor godt modellen følger oppgaven den får. Vi viser resultatet som en enkel, normalisert score.

Scoren kombinerer språkforståelse, kvalitet, hastighet, pris og stabilitet. Den nøyaktige vektingen er proprietær.

Beste verdi peker på modeller som gir sterke resultater i forhold til pris. Den nøyaktige beregningen er proprietær.