Er disse målingene representative for vanlig bruk?

Benchmark-resultater gir en god indikasjon, men responstid kan variere med belastning, tidspunkt og oppgavetype. Resultatene er mest nyttige for å sammenligne modeller over tid.

AI-benchmark på norsk: over 350 modeller

Beste i sin klasse

🏆

Høyest score

Mistral Large 2407

8.5/10

🇳🇴

Best på norsk

Meta: Llama 3.2 3B Instruct

8.0/10

⚡

Raskest

Meta: Llama 3.2 3B Instruct

265 t/s

💰

Billigst (score ≥ 3)

Meta: Llama 3.2 3B Instruct

$0.05/1M

📊

Beste verdi

IBM: Granite 4.0 Micro

Verdi 266.7

🔗

Beste orkestrator

Cohere: Command R+ (08-2024)

Orch 8.0/10

Er premium verdt det?

Premium norsk-score

3.8/5

Mid-range norsk-score

3.5/5

Prisforskjell

~4×

For norsk tekst og enkle oppgaver holder mid-range svært godt. Premium lønner seg ved kompleks resonnering, lange dokumenter og når presisjon er kritisk.

Alle resultater

#	Modell	Tier	t/s	TTFT	norsk	Instr	Score	Orch.	Verdi	EU	Pris/1M
1	Mistral Large 2407 mistralai Stabil	Mid-range	222	62 ms	8.0	10.0	8.5	8.0	4.5	🇪🇺 EU	$2.00 ≈19 kr
2	Cohere: Command R+ (08-2024) cohere	Premium	145	131 ms	8.0	10.0	8.0	8.0	3.6	—	$2.50 ≈24 kr
3	Anthropic: Claude Haiku 4.5 anthropic	Mid-range	104	123 ms	8.0	10.0	7.5	8.0	8.9	🇪🇺 EU	$1.00 ≈10 kr
4	Anthropic: Claude Sonnet 4.6 anthropic Stabil	Premium	91	253 ms	8.0	10.0	7.4	8.0	3.0	🇪🇺 EU	$3.00 ≈29 kr
5	Perplexity: Sonar Pro Search perplexity Stabil	Premium	64	205 ms	8.0	10.0	7.2	8.0	3.0	~EU	$3.00 ≈29 kr
6	Meta: Llama 3.2 3B Instruct meta-llama Stabil	Budsjett	265	120 ms	8.0	8.0	8.2	6.4	133.3	—	$0.05 ≈0 kr
7	Cohere: Command R7B (12-2024) cohere Stabil	Budsjett	206	97 ms	8.0	8.0	7.6	6.4	160.0	—	$0.04 ≈0 kr
8	IBM: Granite 4.0 Micro ibm-granite	Budsjett	239	77 ms	6.0	10.0	8.1	6.0	266.7	—	$0.02 ≈0 kr
9	Google: Gemma 3 4B google Stabil	Budsjett	222	86 ms	6.0	10.0	7.7	6.0	133.3	~EU	$0.05 ≈0 kr
10	OpenAI: GPT-5.4 Nano openai Stabil	Mid-range	170	113 ms	6.0	10.0	7.4	6.0	38.1	—	$0.20 ≈2 kr
11	OpenAI: GPT-4 Turbo openai	Premium	105	160 ms	6.0	10.0	6.9	6.0	0.8	—	$10.00 ≈97 kr
12	Google: Gemini 2.5 Pro google	Mid-range	142	75 ms	6.0	4.0	4.7	2.4	4.0	~EU	$1.25 ≈12 kr

Responstid siste 14 dager

Slik tester vi

Vi evaluerer over 350 AI-modeller og presenterer de beste resultatene hver morgen. Scoren kombinerer språkforståelse, kvalitet, hastighet, pris og stabilitet. Den nøyaktige vektingen er proprietær.

Les mer om metodikken →

Vanlige spørsmål

Vi evaluerer over 350 tilgjengelige modeller og presenterer de beste resultatene fra siste benchmark. Utvalget oppdateres dynamisk når markedet endrer seg.

Språk-scoren viser hvor godt modellen leverer svar på riktig språk og med god språkkvalitet. Scoren vises som et normalisert tall.

Instruksjons-scoren viser hvor godt modellen følger oppgaven den får. Vi viser resultatet som en enkel, normalisert score.

Scoren kombinerer språkforståelse, kvalitet, hastighet, pris og stabilitet. Den nøyaktige vektingen er proprietær.

Beste verdi peker på modeller som gir sterke resultater i forhold til pris. Den nøyaktige beregningen er proprietær.

AI-benchmark på norsk: dagens beste modeller

Beste i sin klasse

Er premium verdt det?

Alle resultater

Responstid siste 14 dager

Slik tester vi

Vanlige spørsmål

Les også