Model library

Browse our library of open source models that are ready to deploy behind an API endpoint in seconds.

Deploy your own model

88 large language models

Model API

LLM

GLM 5.2

5.2

LLM

Laguna M.1

H100

LLM

Laguna XS.2

H100

Model API

LLM

Kimi K2.7 Code

2.7 - Code

LLM

MiniMax M3

Model API

LLM

NVIDIA Nemotron 3 Super

Super

Model API

LLM

NVIDIA Nemotron 3 Ultra

Ultra

LLM

MAI-Thinking-1

LLM

GPT OSS 20B

MoE

Model API

LLM

Kimi K2.6

2.6

Model API

LLM

GLM 5.1

5.1

LLM

Qwen3.6 27B

V1 - Latency - H100

LLM

Llama 3.3 70B Instruct

3.3 - TRT-LLM - H100

LLM

Nemotron 3 Nano Omni

V1 - Latency - H100

Model API

LLM

DeepSeek V4

V4 - B200

LLM

GLM 4.6

4.6

Model API

LLM

DeepSeek V3.1

V3.1 - B200

LLM

Kimi K2 Thinking

Thinking - K2

Model API

LLM

Kimi K2.5

2.5

Model API

LLM

GLM 4.7

4.7

Model API

LLM

GLM 5

Model API

LLM

MiniMax M2.5

M2.5

LLM

Gemma 4 E2B IT

4 - Latency - H100

LLM

Gemma 4 E4B IT

4 - Latency - H100

LLM

Gemma 4 26B A4B IT

4 - Latency - H100

LLM

Gemma 4 31B IT

4 - Latency - H100

LLM

Qwen3.5 9B

V1 - Latency - vLLM - H100

LLM

Qwen3.5 35B-A3B

V1 - Latency - vLLM - H100

LLM

Qwen3.5 122B-A10B

V1 - Latency - vLLM - H100

LLM

Qwen3.5 4B

V1 - Latency - vLLM - H100

Model API

LLM

GPT OSS 120B

MoE

LLM

DeepSeek V3.2

V3.2 - B200

LLM

Qwen3 235B 2507

2507

LLM

MiniMax M2.1

M2.1

LLM

GLM-4.6V

4.6 - Vision

LLM

Mistral Large 3 2512

3 - Large

Model API

LLM

Qwen3 Coder 480B

3 - Coder

LLM

MiniMax M2

LLM

Qwen 3 32B

V3 - TRT-LLM - H100

LLM

Qwen3 VL 235B

3 - Vision Language

LLM

GLM-4.5V

4.5 - Vision

LLM

Qwen3 Coder 30B

3 - Coder

LLM

GLM-4.5 Air

4.5 - Air

LLM

Cogito v2 671B

Transcription

Ultravox v0.6 70B

v0.6 - H100

LLM

Qwen 3 235B

V3 - SGLang - H100

LLM

Qwen 3 4B

V3 - TRT-LLM - H100

LLM

Llama 3.3 Nemotron 49B Super - NVIDIA NIM

3.3 - Nemotron - H100

LLM

Mistral Small 3.1

3.1 - vLLM - H100

LLM

Gemma 3 27B IT

3 - Instruct - vLLM - H100

LLM

DeepSeek-R1 Llama 70B

R1 - Llama - TRT-LLM - H100

LLM

DeepSeek-R1 Qwen 32B

R1 - Qwen - TRT-LLM - H100

LLM

Llama 3.1 8B Instruct

3.1 - Instruct - TRT-LLM - H100

LLM

DeepSeek-R1 Qwen 7B

R1 - Qwen - TRT-LLM - H100 MIG 40GB

LLM

Llama 3.1 Nemotron 70B

3.1 - Nemotron - A100

LLM

Llama 3.1 405B Instruct

3.1 - Instruct - H100

LLM

Llama 3.2 11B Vision Instruct

3.2 - Vision - A100

LLM

Holo 3.1 35B-A3B

V1 - Throughput - H100

LLM

NVIDIA Nemotron 3.5 Content Safety

Latency - L4

LLM

Qwen3.6 35B-A3B

V1 - Latency - H100

LLM

Phi 3 Mini 4K Instruct

3 - 4k - T4

LLM

Llama 4 Maverick

V4.0 - Instruct - vLLM - B200

Model API

LLM

DeepSeek V3 0324

V3 - 0324 - B200

LLM

Kimi K2 Instruct

0905

LLM

GLM 4.7 Flash

V1 - Latency - H100

LLM

Llama 4 Scout

V4.0 - Instruct - vLLM - H100

LLM

NVIDIA Nemotron 3 Nano

LLM

DeepSeek R1 0528

R1 - 0528 - B200

LLM

Cogito v2.1 671B

v2.1

LLM

NVIDIA Nemotron Nano 12B V2 VL

V2 - Vision

LLM

Qwen3 Omni Thinker

Omni - Thinker

LLM

Seed OSS 36B Instruct

Seed OSS 36B Instruct - Instruct - vLLM - H100

LLM

Qwen3 Next 80B A3B Thinking

Qwen3 Next 80B A3B Instruct - Instruct - SGLang - H100

LLM

Qwen3 Next 80B A3B Instruct

Qwen3 Next 80B A3B Instruct - Instruct - SGLang - H100

LLM

Cogito v2 109B

LLM

Cogito v2 70B

LLM

Cogito v2 405B

LLM

Llama 3.1 Nemotron Ultra 253B

3.1 - Nemotron - TRT-LLM - H100

LLM

Pixtral 12B

Pixtral - vLLM - H100

LLM

Mistral 7B Instruct

v3 - TRT-LLM - H100 MIG 40GB

LLM

Llama 3.1 70B Instruct

3.1 - Instruct - TRT-LLM - H100

LLM

DeepSeek-R1 Zero

R1 - Zero - SGLang - H200

LLM

Llama 3.2 90B Vision Instruct

3.2 - Vision - H100

LLM

Phi 3.5 Mini Instruct

3.5 - 128k - vLLM - A10G

LLM

Phi 3 Mini 128K Instruct

3 - 128k - T4

LLM

DeepSeek Prover V2 671B

V2 - Prover - SGLang

LLM

Mixtral 8x7B Instruct

v1 - TRT-LLM - H100

LLM

Mixtral 8x22B

H100

🔥 Trending models

Model API

LLM

GLM 5.2

5.2

Model API

LLM

Kimi K2.7 Code

2.7 - Code

Model API

LLM

DeepSeek V4

V4 - B200

Model API

LLM

GPT OSS 120B

MoE

Explore Baseten today

Start deploying Talk to an engineer