o3
o3Modelo de razonamiento profundo, cadena de pensamiento extendida para problemas difíciles.
- Contexto
- 200K tokens
- Lanzado
- 2025-04
- Entrada
- $10 / 1M tokens
- Salida
- $40 / 1M tokens
- En caché
- $2.5 / 1M tokens
El índice
Cada mente, con sus fortalezas. Estudia antes de elegir tu equipo.
El laboratorio original. Generalistas fuertes y modelos de razonamiento profundo.
o3Modelo de razonamiento profundo, cadena de pensamiento extendida para problemas difíciles.
gpt-5.4Buque insignia de OpenAI, el mejor para razonamiento complejo y código.
gpt-4oGeneralista multimodal, sólido en casi todo.
gpt-5.4-miniGPT-5.4 más barato y rápido para el día a día.
o3-miniRazonamiento rápido, excelente para matemáticas, código y lógica.
gpt-4o-miniLa opción más barata de OpenAI, ideal para alto volumen.
gpt-image-1Modelo insignia de imagen de OpenAI, buena adherencia al prompt, tres niveles de calidad y ratios.
dall-e-3Modelo de imagen legado de OpenAI, útil para cuentas que aún no tienen acceso a GPT Image 1.
sora-2Texto-a-vídeo de OpenAI, clips cinematográficos de hasta ~20 s con audio sincronizado.
o1Buque insignia de razonamiento de la generación anterior, sigue siendo capaz, ampliamente disponible.
gpt-4-turboGPT-4 legado con contexto de 128K, mantenido por compatibilidad.
Referencia en código, escritura cuidada y análisis con matices.
claude-opus-4.8El modelo más capaz de Anthropic, razonamiento complejo y programación agéntica.
claude-opus-4.7El modelo más profundo de Anthropic, escritura y análisis con matices.
claude-sonnet-4.6Buque insignia equilibrado, especialmente bueno en código.
claude-haiku-3.5Haiku de la generación anterior, sigue siendo capaz, a menor coste.
claude-haiku-4.5El Claude más barato y rápido, opción por defecto sólida.
claude-3-5-sonnetSonnet legado, modelo de uso general fuerte.
Ventanas de contexto enormes, visión nativa y soporte multilingüe sólido.
gemini-3.1-proBuque insignia de Google, ventana de contexto enorme y visión fuerte.
gemini-2.5-proGemini Pro de la generación anterior, sigue siendo muy capaz.
gemini-3-flashGemini rápido y barato para tareas de alto volumen.
gemini-2.5-flashFlash de la generación anterior, barato y fiable.
gemini-3-pro-imageGemini 3 Pro Image, la mejor fidelidad, iluminación fotorrealista, más lento y caro que Flash.
gemini-3.1-flash-imageGemini 3.1 Flash Image, el nuevo Flash, más nítido que 2.5 y más barato que Pro.
gemini-2.5-flash-imageGemini 2.5 Flash Image, rápido, barato y sorprendentemente nítido. Precio plano por imagen.
gemini-1.5-proPro más antiguo con contexto de 2M, listado para referencia.
veo-3Modelo de vídeo de Google, salida 4K, audio sincronizado, física convincente.
veo-2Veo de la generación anterior, útil para B-roll corto.
gemini-1.5-flashFlash más antiguo, más barato, pero ya no recomendado.
Modelos open-weight con razonamiento fuerte, a una fracción del precio de los laboratorios de vanguardia.
deepseek-r1Modelo de razonamiento open-weight, compite con la serie o a un precio mucho menor.
deepseek-v3.2Fuerte en código y razonamiento a una fracción del coste.
Modelos open-weight en tu propio hardware. Coste cero por llamada.
llama3.1:8bSe ejecuta local vía Ollama, gratis, privado, funciona offline.
qwen2.5:7bQwen open-weight, fuerte en código y en idiomas no-ingleses.
mistral:7bMistral open-weight, generalista eficiente.
phi3:14bPhi-3 open-weight de Microsoft, fuerte en razonamiento a pesar de su tamaño.
mixtral:8x7bModelo MoE de Mistral, inferencia rápida con cobertura amplia.
deepseek-coder:6.7bModelo open-weight especializado en código, se ejecuta en hardware modesto.
gemma2:9bFamilia open-weight de Google, escritura y razonamiento sólidos.
Laboratorio de xAI, acceso web en tiempo real y tono directo.
grok-4Buque insignia de razonamiento de xAI, acceso web en tiempo real y fuerte en contexto largo.
grok-2Grok de la generación anterior, generalista capaz con tono irónico.
Laboratorio europeo de vanguardia. Modelos fuertes en código y varias familias open-weight.
mistral-large-2Buque insignia hospedado de Mistral, fuerte en código y multilingüe.
mistral-medium-3Mistral intermedio, buena relación calidad-precio.
codestralMistral especializado en código, autocompletado + chat para 80+ lenguajes.
Enfocados en empresas, modelos afinados para RAG, citas claras y uso de herramientas.
command-r-plusBuque insignia de Cohere afinado para RAG, fuerte en recuperación, citas y uso de herramientas.
command-rCommand más barato, mismas fortalezas de RAG, alcance menor.
La familia Llama. Open-weight, rendimiento de vanguardia, se ejecutan donde sea.
llama-3.3-70bBuque insignia open-weight de Meta, se ejecuta local en hardware potente vía Ollama, o en la nube vía Together / Replicate.
llama-4-maverickPróxima generación de Llama, razonamiento de vanguardia, multimodal, open-weight.
Modelos anclados a la web, respuestas con citas en vivo.
sonar-proModelo de Perplexity anclado en la web, respuestas con búsqueda en vivo. Formato distinto a un chat tradicional.
Modelo de imagen con estética propia, el favorito de diseñadores y directores de arte.
midjourney-v7Buque insignia de MidJourney, estética muy reconocible, aún sin API pública (Discord / web).
midjourney-v6.1MidJourney de la generación anterior, el favorito de los fotógrafos.
Modelos FLUX del equipo detrás de Stable Diffusion, adherencia precisa al prompt, generación rápida.
flux-1.1-proBuque insignia de Black Forest Labs, adherencia precisa al prompt, generación rápida, API pública.
flux-1-schnellFLUX open-weight, se ejecuta en GPUs de consumo, gratuito.
Familia Stable Diffusion, open-weight, con un ecosistema enorme de herramientas.
stable-diffusion-3.5SD3.5 open-weight, se ejecuta local, altamente personalizable con LoRAs y ControlNet.
sdxlStable Diffusion XL clásico, gran soporte de comunidad y herramientas.
Generación de vídeo en la nube, consistencia de personaje y control de escena para cineastas.
runway-gen-4Próxima gen de Runway, consistencia de personaje, control de escena, imagen-a-vídeo.
runway-gen-3-alphaBuque insignia anterior de Runway, rápido, en la nube, popular entre cineastas.
Generación de vídeo amigable y rápida, imagen-a-vídeo y extensión de escena.
pika-2.0Pika 2.0, imagen-a-vídeo y extensión de escena, UX amigable, entrega rápida.
Laboratorio de vídeo de Kuaishou, clips largos y movimiento humano convincente.
kling-2.0Kling de Kuaishou, vídeo largo (hasta 2 min), movimiento humano sólido y buena adherencia a prompts en idiomas asiáticos.
Los precios están en USD, tomados directamente del tarifario de cada proveedor, por millón de tokens en modelos de chat, por imagen en modelos de imagen, por segundo en modelos de vídeo. Con BYOK pagas a cada proveedor directamente, sin recargo de nuestra parte; en Pro y Power cubrimos el coste del proveedor con tus Créditos Mensuales de IA. "Próximamente" son entradas en nuestro roadmap; "Listado" son modelos conocidos pero sin plan de integración directa.