O índice

O aiDex.

Cada mente, com suas forças. Estude antes de escolher o seu time.

Saída
Capacidade
Provedor
57 modelos

OpenAI

O laboratório original. Generalistas fortes e modelos de raciocínio profundo.

o3

o3

Modelo de raciocínio profundo, cadeia de pensamento estendida para problemas difíceis.

Top de linhaRaciocínioCódigoContexto longo
Contexto
200K tokens
Lançado
2025-04
Entrada
$10
/ 1M tokens
Saída
$40
/ 1M tokens
Em cache
$2.5
/ 1M tokens

GPT-5.4

gpt-5.4

Carro-chefe da OpenAI, melhor para raciocínio complexo e código.

Top de linhaRaciocínioCódigoVisãoContexto longo
Contexto
400K tokens
Lançado
2025-12
Entrada
$2.5
/ 1M tokens
Saída
$15
/ 1M tokens
Em cache
$1.25
/ 1M tokens

GPT-4o

gpt-4o

Generalista multimodal, bom em quase tudo.

RaciocínioCódigoVisãoMultilíngue
Contexto
128K tokens
Lançado
2024-05
Entrada
$2.5
/ 1M tokens
Saída
$10
/ 1M tokens
Em cache
$1.25
/ 1M tokens

GPT-5.4 mini

gpt-5.4-mini

GPT-5.4 mais barato e rápido para o dia a dia.

RápidoCódigoEscrita
Contexto
400K tokens
Lançado
2025-12
Entrada
$0.75
/ 1M tokens
Saída
$4.5
/ 1M tokens
Em cache
$0.375
/ 1M tokens

o3-mini

o3-mini

Raciocínio rápido, ótimo para matemática, código e lógica.

RaciocínioCódigoRápido
Contexto
200K tokens
Lançado
2025-01
Entrada
$1.1
/ 1M tokens
Saída
$4.4
/ 1M tokens
Em cache
$0.55
/ 1M tokens

GPT-4o mini

gpt-4o-mini

Opção mais barata da OpenAI, ótima para volume alto.

RápidoEscrita
Contexto
128K tokens
Lançado
2024-07
Entrada
$0.15
/ 1M tokens
Saída
$0.6
/ 1M tokens
Em cache
$0.075
/ 1M tokens

GPT Image 1

gpt-image-1

Modelo de imagem carro-chefe da OpenAI, boa aderência ao prompt, três níveis de qualidade e proporções.

Visão
Lançado
2025-04
Preço
$0.042
/ imagem

DALL·E 3

dall-e-3

Modelo de imagem legado da OpenAI, útil para contas que ainda não têm acesso ao GPT Image 1.

Visão
Lançado
2023-10
Preço
$0.04
/ imagem

Sora 2

sora-2

Texto-para-vídeo da OpenAI, clipes cinematográficos de até ~20 s com áudio sincronizado.

Top de linhaVisão
Lançado
2025-09
Preço depende do host

o1

o1

Carro-chefe de raciocínio da geração anterior, ainda capaz, amplamente disponível.

RaciocínioCódigoContexto longo
Contexto
200K tokens
Lançado
2024-12
Entrada
$15
/ 1M tokens
Saída
$60
/ 1M tokens
Em cache
$7.5
/ 1M tokens

GPT-4 Turbo

gpt-4-turbo

GPT-4 legado com contexto de 128K, mantido por compatibilidade.

CódigoEscritaContexto longo
Contexto
128K tokens
Lançado
2024-04
Entrada
$10
/ 1M tokens
Saída
$30
/ 1M tokens
Em cache
$5
/ 1M tokens

Anthropic

Referência em código, escrita cuidadosa e análise com nuances.

Claude Opus 4.8

claude-opus-4.8

O modelo mais capaz da Anthropic, raciocínio complexo e programação agêntica.

Top de linhaRaciocínioCódigoEscritaContexto longo
Contexto
1M tokens
Lançado
2026-05
Entrada
$5
/ 1M tokens
Saída
$25
/ 1M tokens
Em cache
$0.5
/ 1M tokens

Claude Opus 4.7

claude-opus-4.7

O modelo mais profundo da Anthropic, escrita e análise com nuances.

Top de linhaRaciocínioEscritaContexto longo
Contexto
1M tokens
Lançado
2026-01
Entrada
$5
/ 1M tokens
Saída
$25
/ 1M tokens
Em cache
$0.5
/ 1M tokens

Claude Sonnet 4.6

claude-sonnet-4.6

Carro-chefe equilibrado, especialmente bom em código.

Top de linhaCódigoEscritaRaciocínioContexto longo
Contexto
200K tokens
Lançado
2025-11
Entrada
$3
/ 1M tokens
Saída
$15
/ 1M tokens
Em cache
$0.3
/ 1M tokens

Claude Haiku 3.5

claude-haiku-3.5

Haiku da geração anterior, ainda capaz, custo menor.

RápidoEscritaCódigo
Contexto
200K tokens
Lançado
2024-11
Entrada
$0.8
/ 1M tokens
Saída
$4
/ 1M tokens
Em cache
$0.08
/ 1M tokens

Claude Haiku 4.5

claude-haiku-4.5

O Claude mais barato e rápido, escolha padrão sólida.

RápidoEscrita
Contexto
200K tokens
Lançado
2025-10
Entrada
$0.25
/ 1M tokens
Saída
$1.25
/ 1M tokens
Em cache
$0.025
/ 1M tokens

Claude 3.5 Sonnet

claude-3-5-sonnet

Sonnet legado, modelo de uso geral forte.

CódigoEscritaRaciocínio
Contexto
200K tokens
Lançado
2024-10
Entrada
$3
/ 1M tokens
Saída
$15
/ 1M tokens
Em cache
$0.3
/ 1M tokens

Google

Janelas de contexto enormes, visão nativa e suporte multilíngue sólido.

Gemini 3.1 Pro

gemini-3.1-pro

Carro-chefe do Google, janela de contexto enorme e visão forte.

Top de linhaRaciocínioVisãoContexto longoMultilíngue
Contexto
2M tokens
Lançado
2025-12
Entrada
$2
/ 1M tokens
Saída
$12
/ 1M tokens
Em cache
$1
/ 1M tokens

Gemini 2.5 Pro

gemini-2.5-pro

Gemini Pro da geração anterior, ainda muito capaz.

RaciocínioVisãoContexto longoMultilíngue
Contexto
2M tokens
Lançado
2025-03
Entrada
$1.25
/ 1M tokens
Saída
$7
/ 1M tokens
Em cache
$0.31
/ 1M tokens

Gemini 3 Flash

gemini-3-flash

Gemini rápido e barato para tarefas de alto volume.

RápidoVisãoMultilíngue
Contexto
1M tokens
Lançado
2025-11
Entrada
$0.5
/ 1M tokens
Saída
$3
/ 1M tokens
Em cache
$0.25
/ 1M tokens

Gemini 2.5 Flash

gemini-2.5-flash

Flash da geração anterior, barato e confiável.

RápidoMultilíngue
Contexto
1M tokens
Lançado
2025-06
Entrada
$0.3
/ 1M tokens
Saída
$1.2
/ 1M tokens
Em cache
$0.075
/ 1M tokens

Nano Banana Pro

gemini-3-pro-image

Gemini 3 Pro Image, fidelidade máxima, iluminação fotorrealista, mais lento e mais caro que o Flash.

Top de linhaVisão
Lançado
2025-12
Preço
$0.12
/ imagem

Nano Banana 2

gemini-3.1-flash-image

Gemini 3.1 Flash Image, o novo Flash, mais nítido que o 2.5 e mais barato que o Pro.

VisãoRápido
Lançado
2026-03
Preço
$0.06
/ imagem

Nano Banana

gemini-2.5-flash-image

Gemini 2.5 Flash Image, rápido, barato e surpreendentemente nítido. Preço plano por imagem.

VisãoRápido
Lançado
2025-08
Preço
$0.039
/ imagem

Gemini 1.5 Pro

gemini-1.5-pro

Pro mais antigo com contexto de 2M, listado para registro.

RaciocínioVisãoContexto longo
Contexto
2M tokens
Lançado
2024-05
Entrada
$1.25
/ 1M tokens
Saída
$5
/ 1M tokens
Em cache
$0.313
/ 1M tokens

Veo 3

veo-3

Modelo de vídeo do Google, saída em 4K, áudio sincronizado, física convincente.

Top de linhaVisão
Lançado
2025-05
Preço
$0.5
/ segundo

Veo 2

veo-2

Veo da geração anterior, ainda útil para B-roll curto.

Visão
Lançado
2024-12
Preço
$0.35
/ segundo

Gemini 1.5 Flash

gemini-1.5-flash

Flash mais antigo, mais barato, mas não recomendado.

Rápido
Contexto
1M tokens
Lançado
2024-05
Entrada
$0.075
/ 1M tokens
Saída
$0.3
/ 1M tokens
Em cache
$0.019
/ 1M tokens

DeepSeek

Modelos open-weight com raciocínio forte, por uma fração do preço dos laboratórios de ponta.

DeepSeek R1

deepseek-r1

Modelo de raciocínio open-weight, competitivo com a série o, a um preço muito menor.

RaciocínioCódigoContexto longo
Contexto
64K tokens
Lançado
2025-01
Entrada
$0.55
/ 1M tokens
Saída
$2.19
/ 1M tokens
Em cache
$0.14
/ 1M tokens

DeepSeek V3.2

deepseek-v3.2

Forte em código e raciocínio por uma fração do custo.

CódigoRaciocínioRápido
Contexto
64K tokens
Lançado
2025-09
Entrada
$0.14
/ 1M tokens
Saída
$0.28
/ 1M tokens
Em cache
$0.014
/ 1M tokens

Ollama

Modelos open-weight no seu próprio hardware. Custo zero por chamada.

Llama 3.1 8B

llama3.1:8b

Roda local via Ollama, gratuito, privado, funciona offline.

Open-weightRápido
Contexto
128K tokens
Lançado
2024-07
GrátisRoda na sua própria máquina via Ollama. Sem fatura, nada sai do seu computador.

Qwen 2.5 7B

qwen2.5:7b

Qwen open-weight, forte em código e idiomas que não o inglês.

Open-weightCódigoMultilíngue
Contexto
128K tokens
Lançado
2024-09
GrátisRoda na sua própria máquina via Ollama. Sem fatura, nada sai do seu computador.

Mistral 7B

mistral:7b

Mistral open-weight, generalista eficiente.

Open-weightRápidoMultilíngue
Contexto
32K tokens
Lançado
2023-09
GrátisRoda na sua própria máquina via Ollama. Sem fatura, nada sai do seu computador.

Phi-3 14B

phi3:14b

Phi-3 open-weight da Microsoft, forte em raciocínio mesmo sendo pequeno.

Open-weightRaciocínioRápido
Contexto
128K tokens
Lançado
2024-04
GrátisRoda na sua própria máquina via Ollama. Sem fatura, nada sai do seu computador.

Mixtral 8x7B

mixtral:8x7b

Modelo MoE da Mistral, inferência rápida com cobertura ampla.

Open-weightCódigoRápidoMultilíngue
Contexto
32K tokens
Lançado
2023-12
GrátisRoda na sua própria máquina via Ollama. Sem fatura, nada sai do seu computador.

DeepSeek Coder 6.7B

deepseek-coder:6.7b

Modelo open-weight especializado em código, roda em hardware modesto.

Open-weightCódigoRápido
Contexto
16K tokens
Lançado
2024-01
GrátisRoda na sua própria máquina via Ollama. Sem fatura, nada sai do seu computador.

Gemma 2 9B

gemma2:9b

Família open-weight do Google, escrita e raciocínio sólidos.

Open-weightEscritaRápido
Contexto
8K tokens
Lançado
2024-06
GrátisRoda na sua própria máquina via Ollama. Sem fatura, nada sai do seu computador.
𝕏

xAI

Laboratório da xAI, acesso à web em tempo real e tom direto.

𝕏

Grok 4

Em breve
grok-4

Carro-chefe de raciocínio da xAI, acesso à web em tempo real e forte em contexto longo.

Top de linhaRaciocínioContexto longo
Contexto
256K tokens
Lançado
2025-07
Entrada
$3
/ 1M tokens
Saída
$15
/ 1M tokens
Em cache
$0.75
/ 1M tokens
𝕏

Grok 2

Em breve
grok-2

Grok da geração anterior, generalista capaz com tom irônico.

RaciocínioEscrita
Contexto
131K tokens
Lançado
2024-08
Entrada
$2
/ 1M tokens
Saída
$10
/ 1M tokens
Em cache
$0.5
/ 1M tokens
M

Mistral AI

Laboratório europeu de ponta. Modelos fortes em código, várias famílias open-weight.

M

Mistral Large 2

Em breve
mistral-large-2

Carro-chefe hospedado da Mistral, forte em código e multilíngue.

Top de linhaCódigoRaciocínioMultilíngue
Contexto
128K tokens
Lançado
2024-07
Entrada
$2
/ 1M tokens
Saída
$6
/ 1M tokens
Em cache
$1
/ 1M tokens
M

Mistral Medium 3

Em breve
mistral-medium-3

Mistral intermediário, boa relação custo-qualidade.

CódigoEscritaRápido
Contexto
32K tokens
Lançado
2025-05
Entrada
$0.4
/ 1M tokens
Saída
$2
/ 1M tokens
Em cache
$0.2
/ 1M tokens
M

Codestral

Em breve
codestral

Mistral especializado em código, autocompletar + chat para mais de 80 linguagens.

CódigoRápido
Contexto
32K tokens
Lançado
2024-05
Entrada
$0.3
/ 1M tokens
Saída
$0.9
/ 1M tokens
Em cache
$0.15
/ 1M tokens
C

Cohere

Foco em empresas, modelos ajustados para RAG, citações claras e uso de ferramentas.

C

Command R+

Em breve
command-r-plus

Carro-chefe da Cohere afinado para RAG, forte em recuperação, citações e uso de ferramentas.

RaciocínioEscritaContexto longoMultilíngue
Contexto
128K tokens
Lançado
2024-04
Entrada
$2.5
/ 1M tokens
Saída
$10
/ 1M tokens
Em cache
$1.25
/ 1M tokens
C

Command R

Em breve
command-r

Command mais barato, mesmas forças de RAG, escopo menor.

EscritaRápidoMultilíngue
Contexto
128K tokens
Lançado
2024-03
Entrada
$0.15
/ 1M tokens
Saída
$0.6
/ 1M tokens
Em cache
$0.075
/ 1M tokens

Meta

A família Llama. Open-weight, performance de ponta, rodam em qualquer lugar.

Llama 3.3 70B

llama-3.3-70b

Carro-chefe open-weight da Meta, roda local em hardware potente via Ollama, ou na nuvem via Together / Replicate.

Open-weightTop de linhaRaciocínioCódigoContexto longo
Contexto
128K tokens
Lançado
2024-12
Preço depende do host

Llama 4 Maverick

llama-4-maverick

Próxima geração do Llama, raciocínio de ponta, multimodal, open-weight.

Open-weightTop de linhaRaciocínioVisão
Contexto
1M tokens
Lançado
2025-04
Preço depende do host
P

Perplexity

Modelos ancorados na web, respostas com citações em tempo real.

P

Sonar Pro

sonar-pro

Modelo da Perplexity ancorado na web, respostas com busca ao vivo. Formato diferente de um chat tradicional.

RaciocínioEscrita
Contexto
200K tokens
Lançado
2025-01
Entrada
$3
/ 1M tokens
Saída
$15
/ 1M tokens
Em cache
$0.75
/ 1M tokens
M

MidJourney

Modelo de imagem com estética própria, favorito de designers e diretores de arte.

M

MidJourney v7

midjourney-v7

Carro-chefe do MidJourney, estética inconfundível, ainda sem API pública (Discord / web).

Top de linhaVisão
Lançado
2025-04
Preço depende do host
M

MidJourney v6.1

midjourney-v6.1

MidJourney da geração anterior, favorito de fotógrafos.

Visão
Lançado
2024-07
Preço depende do host
F

Black Forest Labs

Modelos FLUX do time por trás do Stable Diffusion, adesão precisa ao prompt, geração rápida.

F

FLUX 1.1 Pro

Em breve
flux-1.1-pro

Carro-chefe do Black Forest Labs, adesão precisa ao prompt, geração rápida, API pública.

Top de linhaVisão
Lançado
2024-10
Preço
$0.04
/ imagem
F

FLUX 1 Schnell

Em breve
flux-1-schnell

FLUX open-weight, roda em GPUs de consumo, gratuito.

Open-weightVisãoRápido
Lançado
2024-08
GrátisRoda na sua própria máquina via Ollama. Sem fatura, nada sai do seu computador.
S

Stability AI

Família Stable Diffusion, open-weight, ecossistema gigante de ferramentas.

S

Stable Diffusion 3.5

stable-diffusion-3.5

SD3.5 open-weight, roda local, altamente customizável com LoRAs e ControlNet.

Open-weightVisão
Lançado
2024-10
Preço depende do host
S

SDXL

sdxl

Stable Diffusion XL clássico, comunidade gigante e muita ferramenta de apoio.

Open-weightVisão
Lançado
2023-07
Preço depende do host
R

Runway

Geração de vídeo na nuvem, consistência de personagem e controle de cena para cineastas.

R

Runway Gen-4

runway-gen-4

Próxima geração da Runway, consistência de personagem, controle de cena, imagem-para-vídeo.

Top de linhaVisão
Lançado
2025-03
Preço depende do host
R

Runway Gen-3 Alpha

runway-gen-3-alpha

Carro-chefe anterior da Runway, rápido, na nuvem, popular entre cineastas.

Visão
Lançado
2024-07
Preço depende do host
P

Pika

Geração de vídeo amigável e rápida, imagem-para-vídeo e extensão de cena.

P

Pika 2.0

pika-2.0

Pika 2.0, imagem-para-vídeo e extensão de cena, UX amigável, entrega rápida.

VisãoRápido
Lançado
2024-12
Preço depende do host
K

Kling

Laboratório de vídeo da Kuaishou, clipes longos e movimento humano convincente.

K

Kling 2.0

kling-2.0

Kling da Kuaishou, vídeo longo (até 2 min), movimento humano consistente e bom em prompts em idiomas asiáticos.

Top de linhaVisãoMultilíngue
Lançado
2025-04
Preço depende do host

Preços em USD, direto da tabela de cada provedor, por milhão de tokens em modelos de chat, por imagem em modelos de imagem, por segundo em modelos de vídeo. No BYOK você paga cada provedor diretamente, sem margem nossa; no Pro e no Power a gente cobre o custo do provedor com os seus Créditos Mensais de IA. "Em breve" são entradas do roadmap; "Listado" são modelos conhecidos mas sem plano direto de integração.

Pronto para escolher algumas?

Comece uma conversa, monte um time ou compare respostas lado a lado.