o3
o3Modelo de raciocínio profundo, cadeia de pensamento estendida para problemas difíceis.
- Contexto
- 200K tokens
- Lançado
- 2025-04
- Entrada
- $10 / 1M tokens
- Saída
- $40 / 1M tokens
- Em cache
- $2.5 / 1M tokens
O índice
Cada mente, com suas forças. Estude antes de escolher o seu time.
O laboratório original. Generalistas fortes e modelos de raciocínio profundo.
o3Modelo de raciocínio profundo, cadeia de pensamento estendida para problemas difíceis.
gpt-5.4Carro-chefe da OpenAI, melhor para raciocínio complexo e código.
gpt-4oGeneralista multimodal, bom em quase tudo.
gpt-5.4-miniGPT-5.4 mais barato e rápido para o dia a dia.
o3-miniRaciocínio rápido, ótimo para matemática, código e lógica.
gpt-4o-miniOpção mais barata da OpenAI, ótima para volume alto.
gpt-image-1Modelo de imagem carro-chefe da OpenAI, boa aderência ao prompt, três níveis de qualidade e proporções.
dall-e-3Modelo de imagem legado da OpenAI, útil para contas que ainda não têm acesso ao GPT Image 1.
sora-2Texto-para-vídeo da OpenAI, clipes cinematográficos de até ~20 s com áudio sincronizado.
o1Carro-chefe de raciocínio da geração anterior, ainda capaz, amplamente disponível.
gpt-4-turboGPT-4 legado com contexto de 128K, mantido por compatibilidade.
Referência em código, escrita cuidadosa e análise com nuances.
claude-opus-4.8O modelo mais capaz da Anthropic, raciocínio complexo e programação agêntica.
claude-opus-4.7O modelo mais profundo da Anthropic, escrita e análise com nuances.
claude-sonnet-4.6Carro-chefe equilibrado, especialmente bom em código.
claude-haiku-3.5Haiku da geração anterior, ainda capaz, custo menor.
claude-haiku-4.5O Claude mais barato e rápido, escolha padrão sólida.
claude-3-5-sonnetSonnet legado, modelo de uso geral forte.
Janelas de contexto enormes, visão nativa e suporte multilíngue sólido.
gemini-3.1-proCarro-chefe do Google, janela de contexto enorme e visão forte.
gemini-2.5-proGemini Pro da geração anterior, ainda muito capaz.
gemini-3-flashGemini rápido e barato para tarefas de alto volume.
gemini-2.5-flashFlash da geração anterior, barato e confiável.
gemini-3-pro-imageGemini 3 Pro Image, fidelidade máxima, iluminação fotorrealista, mais lento e mais caro que o Flash.
gemini-3.1-flash-imageGemini 3.1 Flash Image, o novo Flash, mais nítido que o 2.5 e mais barato que o Pro.
gemini-2.5-flash-imageGemini 2.5 Flash Image, rápido, barato e surpreendentemente nítido. Preço plano por imagem.
gemini-1.5-proPro mais antigo com contexto de 2M, listado para registro.
veo-3Modelo de vídeo do Google, saída em 4K, áudio sincronizado, física convincente.
veo-2Veo da geração anterior, ainda útil para B-roll curto.
gemini-1.5-flashFlash mais antigo, mais barato, mas não recomendado.
Modelos open-weight com raciocínio forte, por uma fração do preço dos laboratórios de ponta.
deepseek-r1Modelo de raciocínio open-weight, competitivo com a série o, a um preço muito menor.
deepseek-v3.2Forte em código e raciocínio por uma fração do custo.
Modelos open-weight no seu próprio hardware. Custo zero por chamada.
llama3.1:8bRoda local via Ollama, gratuito, privado, funciona offline.
qwen2.5:7bQwen open-weight, forte em código e idiomas que não o inglês.
mistral:7bMistral open-weight, generalista eficiente.
phi3:14bPhi-3 open-weight da Microsoft, forte em raciocínio mesmo sendo pequeno.
mixtral:8x7bModelo MoE da Mistral, inferência rápida com cobertura ampla.
deepseek-coder:6.7bModelo open-weight especializado em código, roda em hardware modesto.
gemma2:9bFamília open-weight do Google, escrita e raciocínio sólidos.
Laboratório da xAI, acesso à web em tempo real e tom direto.
grok-4Carro-chefe de raciocínio da xAI, acesso à web em tempo real e forte em contexto longo.
grok-2Grok da geração anterior, generalista capaz com tom irônico.
Laboratório europeu de ponta. Modelos fortes em código, várias famílias open-weight.
mistral-large-2Carro-chefe hospedado da Mistral, forte em código e multilíngue.
mistral-medium-3Mistral intermediário, boa relação custo-qualidade.
codestralMistral especializado em código, autocompletar + chat para mais de 80 linguagens.
Foco em empresas, modelos ajustados para RAG, citações claras e uso de ferramentas.
command-r-plusCarro-chefe da Cohere afinado para RAG, forte em recuperação, citações e uso de ferramentas.
command-rCommand mais barato, mesmas forças de RAG, escopo menor.
A família Llama. Open-weight, performance de ponta, rodam em qualquer lugar.
llama-3.3-70bCarro-chefe open-weight da Meta, roda local em hardware potente via Ollama, ou na nuvem via Together / Replicate.
llama-4-maverickPróxima geração do Llama, raciocínio de ponta, multimodal, open-weight.
Modelos ancorados na web, respostas com citações em tempo real.
sonar-proModelo da Perplexity ancorado na web, respostas com busca ao vivo. Formato diferente de um chat tradicional.
Modelo de imagem com estética própria, favorito de designers e diretores de arte.
midjourney-v7Carro-chefe do MidJourney, estética inconfundível, ainda sem API pública (Discord / web).
midjourney-v6.1MidJourney da geração anterior, favorito de fotógrafos.
Modelos FLUX do time por trás do Stable Diffusion, adesão precisa ao prompt, geração rápida.
flux-1.1-proCarro-chefe do Black Forest Labs, adesão precisa ao prompt, geração rápida, API pública.
flux-1-schnellFLUX open-weight, roda em GPUs de consumo, gratuito.
Família Stable Diffusion, open-weight, ecossistema gigante de ferramentas.
stable-diffusion-3.5SD3.5 open-weight, roda local, altamente customizável com LoRAs e ControlNet.
sdxlStable Diffusion XL clássico, comunidade gigante e muita ferramenta de apoio.
Geração de vídeo na nuvem, consistência de personagem e controle de cena para cineastas.
runway-gen-4Próxima geração da Runway, consistência de personagem, controle de cena, imagem-para-vídeo.
runway-gen-3-alphaCarro-chefe anterior da Runway, rápido, na nuvem, popular entre cineastas.
Geração de vídeo amigável e rápida, imagem-para-vídeo e extensão de cena.
pika-2.0Pika 2.0, imagem-para-vídeo e extensão de cena, UX amigável, entrega rápida.
Laboratório de vídeo da Kuaishou, clipes longos e movimento humano convincente.
kling-2.0Kling da Kuaishou, vídeo longo (até 2 min), movimento humano consistente e bom em prompts em idiomas asiáticos.
Preços em USD, direto da tabela de cada provedor, por milhão de tokens em modelos de chat, por imagem em modelos de imagem, por segundo em modelos de vídeo. No BYOK você paga cada provedor diretamente, sem margem nossa; no Pro e no Power a gente cobre o custo do provedor com os seus Créditos Mensais de IA. "Em breve" são entradas do roadmap; "Listado" são modelos conhecidos mas sem plano direto de integração.