R1 1776

February 18, 2025Last synced Apr 7, 2026, 4:00 PM

Blended Price

Free/M

Input Price

Free/M

Output Price

Free/M

Speed

0 tok/s

TTFT

0.00s

Benchmark Scores

Intelligence Index

External Benchmarks

ARC-AGI-1

How R1 1776 Compares

Axes

X Axis

Y Axis

Bubble Size

Filters

Blended Price (USD)$0.00 – $30.0

AgMoBench Overall≥ 3.5

Providers

ai21-labsalibabaanthropicawsazurebaiducoheredeepseek

Show quadrants

anthropic

openai

google

meta

mistral

nvidia

kimi

xai

azure

deepseek

aws

cohere

baidu

ai21-labs

zai

reka-ai

xiaomi

alibaba

minimax

ibm

Bubble size = Context Window

16384.00

2000000.00

Compare with other models

GPQA Diamond

— / 100

LiveCodeBench

— / 100

Terminal-Bench Hard

— / 100

τ²-Bench

— / 100

ARC-AGI-1 Cost per Taskarc_agi

0.1

ARC-AGI-2arc_agi

1.3 / 100

ARC-AGI-2 Cost per Taskarc_agi

0.1

AA-Omniscience AccuracyPredicted

40.2 / 100

AA-Omniscience Hallucination RatePredicted

96.1 / 100

Aider PolyglotPredicted

64.5 / 100

AIMEPredicted

0.8 / 30

AIME 2025Predicted

0.8 / 30

AlpacaEval 2.0 LCPredicted

35.2 / 100

AlpacaEval 2.0 RawPredicted

27.3 / 100

BFCL (Berkeley Function Calling)Predicted

51.3

BigCodeBench CompletePredicted

57.3 / 100

BigCodeBench InstructPredicted

47.1 / 100

AA Intelligence Index (Matrix)Predicted

68.2

AA Long Context Reasoning (Matrix)Predicted

71.6

AIME 2024Predicted

85.4

AIME 2025 (Matrix)Predicted

94.4

Arena-Hard AutoPredicted

83.4

BrowseCompPredicted

59.2

BRUMO 2025Predicted

89.3

CMIMC 2025Predicted

77.3

GPQA Diamond (Matrix)Predicted

82.3

HLE (Matrix)Predicted

18.7

HMMT Feb 2025Predicted

75.2

HMMT Nov 2025Predicted

89.7

HumanEvalPredicted

92.3

IFBench (Matrix)Predicted

49.7

IFEvalPredicted

89.3

IMO 2025Predicted

17.5

LiveCodeBench (Matrix)Predicted

74.8

MATH-500 (Matrix)Predicted

97.5

MathArena Apex 2025Predicted

0.9

MMLU-Pro (Matrix)Predicted

84.2

MMMU-ProPredicted

81.8

MRCR v2Predicted

75.9

OSWorldPredicted

38.7

SimpleQAPredicted

32.5

SMT 2025Predicted

83.0

SWE-bench ProPredicted

37.2

Tau-Bench Telecom (Matrix)Predicted

96.0

Terminal-Bench 2.0Predicted

22.6

Terminal-Bench 1.0Predicted

22.8

USAMO 2025Predicted

12.7

Video-MMUPredicted

86.7

browsecompPredicted

55.4

BullshitBenchPredicted

19.0 / 100

Aider PolyglotPredicted

0.0

Apex AgentsPredicted

2.1

Arc Agi 2Predicted

0.0

BIG-Bench HardPredicted

3.0

CAD-EvalPredicted

3.6

Chess PuzzlesPredicted

0.1

CyBenchPredicted

0.2

DeepResearchBenchPredicted

0.4

FictionLiveBenchPredicted

0.6

GeoBenchPredicted

0.0

GSM8K (Epoch)Predicted

5.1

HellaSwagPredicted

0.6

Lech Mazur WritingPredicted

7.9

METR Time HorizonsPredicted

1.5

OTIS Mock AIME 2024–2025Predicted

0.6

PosttrainbenchPredicted

0.0

SimpleQA Verified (Epoch)Predicted

0.3

The Agent CompanyPredicted

2.3

TriviaQAPredicted

5.7

WinoGrandePredicted

0.9

FrontierMathPredicted

14.1 / 100

GAIA Level 1Predicted

74.8

GAIA Level 2Predicted

64.0

GAIA Level 3Predicted

58.4

GAIAPredicted

59.2 / 100

GPQA DiamondPredicted

0.7 / 100

HLEPredicted

0.1 / 100

IFBenchPredicted

0.5 / 100

LCRPredicted

0.4 / 100

LegalBenchPredicted

89.9 / 100

LiveBench CodingPredicted

66.8 / 100

LiveBench Data AnalysisPredicted

45.5 / 100

LiveBench LanguagePredicted

55.7 / 100

LiveBench MathPredicted

63.7 / 100

LiveBench OverallPredicted

48.9 / 100

LiveBench ReasoningPredicted

44.8 / 100

LiveCodeBenchPredicted

0.6 / 100

LongBench v2 EasyPredicted

54.8

LongBench v2 HardPredicted

51.9

LongBench v2Predicted

42.5 / 100

MathVistaPredicted

60.0 / 100

MLE-benchPredicted

26.8 / 100

MMLU ProPredicted

0.8 / 100

MMMUPredicted

78.3 / 100

MMTU Table UnderstandingPredicted

60.6 / 100

MT-BenchPredicted

7.9 / 10

NoLiMa (NIAH)Predicted

94.7 / 100

OCRBench v2Predicted

85.1 / 100

Open LLM AveragePredicted

29.0 / 100

Open LLM: BBHPredicted

59.0 / 100

Open LLM: GPQAPredicted

32.7 / 100

Open LLM: IFEvalPredicted

52.9 / 100

Open LLM: MATH Level 5Predicted

17.5 / 100

Open LLM: MMLU-PROPredicted

43.3 / 100

Open LLM: MUSRPredicted

43.5 / 100

RE-BenchPredicted

12.5

SciCodePredicted

0.5 / 100

SimpleBenchPredicted

37.8 / 100

simpleqaPredicted

33.0

SWE-bench LitePredicted

39.2 / 100

SWE-bench VerifiedPredicted

59.8 / 100

τ²-BenchPredicted

0.5 / 100

tau-bench RetailPredicted

78.8 / 100

Terminal-Bench HardPredicted

0.4 / 100

Vectara Factual ConsistencyPredicted

92.2 / 100

Vectara Hallucination RatePredicted

7.8 / 100

WebArenaPredicted

5.4 / 100

WeirdMLPredicted

47.0 / 100

WildBenchPredicted

48.7

Arena ELO: Codingchatbot_arena

489.0

Chatbot Arena ELOchatbot_arena

191.0