BitcoinWorld
El gran adelgazamiento de la IA: Por qué los modelos más baratos son de repente la apuesta más inteligente
La industria de la inteligencia artificial ha operado durante mucho tiempo bajo una premisa simple y poderosa: los modelos más grandes son mejores, y el mejor modelo gana. Esta suposición ha impulsado una carrera por la escala, con empresas como OpenAI y Anthropic invirtiendo miles de millones en el entrenamiento de modelos frontera cada vez más grandes. Pero se está produciendo un cambio silencioso y potencialmente sísmico. Los costos crecientes están obligando a las empresas a reconsiderar su dependencia de la IA más costosa, y está comenzando una nueva era de compras de modelos con conciencia de costos. La pregunta ya no es solo sobre el poder bruto, sino sobre la eficiencia, y la respuesta podría remodelar toda la economía de la IA.
Durante años, la trayectoria de la industria de la IA estuvo definida por la "lección amarga": que aprovechar una computación masiva era el camino más seguro hacia un mejor rendimiento. Los laboratorios competían en calidad, lo que significaba recurrir por defecto al modelo más avanzado disponible. Los inversores subsidiaban los altos costos de inferencia, dando a los usuarios pocos incentivos para economizar. Ahora, esa dinámica está cambiando. Los precios de los tokens están subiendo, los subsidios se están desacelerando y las empresas sienten una presión de costos real por primera vez. La respuesta natural es comenzar a buscar alternativas más baratas.
El cofundador de Coinbase, Brian Armstrong, ha ofrecido una predicción contundente: en un plazo de 12 a 18 meses, el 80% de las cargas de trabajo de IA se ejecutarán en modelos que son un 99% más baratos que los sistemas frontera actuales. Solo el 20% restante de las tareas, aquellas que requieren la máxima inteligencia, seguirán utilizando los modelos de última generación. Si esta previsión se cumple, representa un cambio fundamental en la economía de la IA. Gran parte de los ahorros saldrían directamente de los flujos de ingresos de grandes laboratorios como OpenAI y Anthropic, lo que podría suponer un golpe financiero significativo cuando se acerquen a sus OPIs.
La evidencia inicial sugiere que la predicción de Armstrong no es descabellada. Una prueba reciente de la herramienta de IA legal Harvey, realizada en asociación con la plataforma de inferencia Fireworks AI, demostró que los costos podrían reducirse tres veces sin ninguna pérdida de calidad. El sistema enrutó de manera inteligente las tareas más simples a un modelo más pequeño y económico (GLM 5.1 de Fireworks) y reservó el más potente Claude Opus para el trabajo legal más exigente. El cofundador de Harvey, Gabe Pereyra, señaló que la definición de calidad está evolucionando desde simplemente usar el modelo más potente para todo, hasta usar el mejor modelo que obtenga la respuesta correcta de la manera más eficiente.
La guerra de costos emergente a menudo se enmarca como una batalla entre modelos propietarios de laboratorios estadounidenses y modelos de código abierto de empresas chinas como DeepSeek. Sin embargo, este enfoque pasa por alto el punto más importante. La división crítica es entre modelos grandes y modelos pequeños. Una empresa puede ahorrar dinero cambiando de un modelo frontera a una alternativa de código abierto más barata, pero puede lograr ahorros similares cambiando a una versión más pequeña y económica del mismo laboratorio. La guerra de precios es entre la inferencia a gran escala y la inferencia a pequeña escala, y para el cambio más amplio de la industria, no importa qué tipo de modelo pequeño gane.
Si la mayoría de los despliegues empresariales pueden ejecutarse con la misma eficacia en modelos más pequeños y económicos, ello supondría un serio freno a la creciente demanda de inferencia. Esto, a su vez, plantearía preguntas difíciles sobre cómo justificar el enorme costo de entrenar un modelo frontera. La industria está en una encrucijada. Podría abrazar la eficiencia y arriesgarse a ralentizar el crecimiento de sus productos más costosos, o podría encontrar nuevas formas de demostrar que el costo adicional de un modelo frontera está justificado. La respuesta determinará los ganadores y los perdedores en la próxima fase de la revolución de la IA.
La suposición fundamental de la industria de la IA está siendo puesta a prueba. A medida que las empresas enfrentan presiones de costos reales, el cambio a modelos más pequeños y económicos ya no es una posibilidad teórica sino una necesidad práctica. El impacto podría ser profundo, potencialmente ralentizando el crecimiento de los ingresos de los principales laboratorios y obligando a una reevaluación de todo el paradigma de escalado. Los próximos meses revelarán si la industria puede aprender a amar los modelos de IA más baratos, o si la demanda de inteligencia frontera sigue siendo insaciable.
P1: ¿Por qué los modelos de IA más baratos se están volviendo más atractivos ahora?
El aumento de los precios de los tokens y la desaceleración de los subsidios de los inversores están creando una presión de costos real para las empresas que utilizan IA. Esto las está obligando a buscar opciones más eficientes en lugar de recurrir por defecto al modelo más potente.
P2: ¿Usar modelos más baratos significará resultados de menor calidad?
No necesariamente. Las pruebas iniciales, como la realizada por Harvey, muestran que al enrutar las tareas de manera inteligente, las empresas pueden lograr la misma calidad mientras reducen significativamente los costos. La clave es usar el modelo adecuado para el trabajo adecuado.
P3: ¿Cómo afectaría este cambio a empresas como OpenAI y Anthropic?
Un movimiento generalizado hacia modelos más baratos podría reducir la demanda de sus servicios de inferencia más costosos, afectando potencialmente sus ingresos mientras se preparan para salir a bolsa. Desafiaría sus modelos de negocio, que están construidos sobre la suposición de que los clientes pagarán una prima por la mejor inteligencia posible.
Esta publicación El gran adelgazamiento de la IA: Por qué los modelos más baratos son de repente la apuesta más inteligente apareció por primera vez en BitcoinWorld.


