Google officially declares war

By: rootdata|2026/05/21 22:10:32

Autor de este artículo: Chengbei XugongSoporte de datos: Gougu Big Data

La Conferencia de Desarrolladores Google I/O 2026 deja una impresión que se resume en dos palabras: arrogancia.

No solo integraron sin problemas agentes de IA en todos los puntos de entrada de tráfico principales, como búsquedas, navegadores, teléfonos móviles y gafas inteligentes, sino que también lanzaron tres innovaciones importantes: Gemini 3.5 Flash, el modelo de video Omni y el nuevo asistente de IA Spark.

Tras mostrar sus fortalezas, anunciaron con orgullo que los usuarios activos mensuales de Gemini superaron los 900 millones; también anunciaron oficialmente importantes reducciones de precios.

El significado es directo: Soy más fuerte que vos y soy más barato que vos.

¿No es esto una declaración de guerra?

01

La revelación más impactante de la conferencia fue, sin duda, el debut de Gemini 3.5 Flash.

Normalmente, "Pro" representa la columna vertebral, mientras que "Flash" significa ligereza y velocidad.

En términos de parámetros del modelo, 3.5 Flash es efectivamente más pequeño que 3.1 Pro, pero en casi todas las pruebas de referencia de inferencia y codificación, el primero tuvo un desempeño sorprendentemente mejor:

En la compleja prueba de razonamiento matemático GSM8K, 3.5 Flash obtuvo un 95,8%, superando el 93,2% de 3.1 Pro; en la versión completa de la capacidad de generación de código SWE-bench, 3.5 Flash logró una tasa de solución del 38,4%, superando por mucho el 32,1% de 3.1 Pro...

¿Por qué?

Según el "Informe Técnico de Gemini 3.5" publicado por DeepMind, hay dos tecnologías centrales que son las más importantes.

Destilación de conocimiento extrema: Google no confió simplemente en acumular potencia de cómputo para entrenar a Flash; en su lugar, utilizaron el inédito "Gemini 3.5 Ultra" como modelo docente para realizar una destilación de reducción de dimensionalidad en Flash.

Según un análisis en X del científico jefe de DeepMind, Jeff Dean, la tasa de ajuste fino de 3.5 Flash en conjuntos de datos de cadenas lógicas de alta calidad mejoró un 400% en comparación con la generación anterior.

Esto significa que hereda el "cerebro lógico" de un modelo supergrande, en lugar de ser una "base de conocimientos" de memoria.

Nueva arquitectura MoE (Mezcla de Expertos): Dentro de 3.5 Flash, Google adoptó una red de expertos más detallada.

La MoE tradicional puede tener solo 8 o 16 expertos, activando solo 1 o 2 a la vez, lo cual es suficiente para soportar modelos a escala de billones de parámetros.

Según un análisis en el memorando de inversión en infraestructura de IA de 2026 de a16z, 3.5 Flash emplea 256 microexpertos, activando hasta 4 de los más eficientes durante cada inferencia.

Esto le permite cubrir un espacio de características multimodales extremadamente grande mientras mantiene un conteo de parámetros de activación extremadamente bajo.

En términos de TTFT (Tiempo hasta el primer token), 3.5 Flash ya alcanzó menos de 65 milisegundos.

Y un parpadeo humano toma entre 100 y 150 milisegundos.

En resumen, cuando opera como agente, desde una perspectiva fisiológica humana, no hay ninguna pausa perceptible.

Para los desarrolladores que necesitan llamar herramientas con frecuencia, realizar múltiples rondas de reflexión y requieren una latencia extremadamente baja, esta es la base perfecta para un superagente.

Solo con tal optimización de ingeniería extrema se puede establecer el dominio en el "despliegue en el borde" en un entorno ferozmente competitivo.

El primero es el modelo multimodal nativo Gemini Omni Flash.

Omni significa todopoderoso, correspondiendo al anterior GPT-4o; solo por el nombre, uno puede sentir la intensa competencia.

Al menos en términos de rendimiento, Gemini Omni Flash está mucho más calificado para usar el carácter "o" que GPT-4o.

Las versiones iniciales como Sora o Gemini 1.5 eran esencialmente parches, convirtiendo voz a texto y luego texto a imágenes.

Pero el Omni lanzado esta vez es una alineación multimodal nativa de extremo a extremo. No solo puede entender nativamente la coherencia temporal y las leyes físicas en los videos, sino que también reduce el retraso promedio de la industria de 400-600 milisegundos a 120 milisegundos.

Por ejemplo, durante la conferencia: un usuario que lleva una cámara sirve agua, y cuando la taza está a punto de desbordarse, Omni puede decir "¡pará, pará, pará!" 0,5 segundos antes de que el agua se derrame.

Esta inferencia en tiempo real del estado físico del mundo real puede parecer simple, pero es significativa: La IA ha evolucionado oficialmente de un chatbot en la pantalla a una herramienta auxiliar en el mundo real.

Incluso si todavía está en sus etapas iniciales.

El segundo es el asistente inteligente Spark.

Según un informe de The Verge que entrevista al vicepresidente de Ingeniería de Android, Spark ha recibido control sobre la API nativa del sistema Android 17.

En resumen, los procesos complejos que antes requerían abrir muchas aplicaciones ahora pueden completarse sin mover un dedo; solo dale instrucciones a Spark y podrá encargarse de todo por vos, incluso enviar mensajes, organizar correos electrónicos, resumir agendas, rastrear dinámicas web, identificar cargos ocultos en facturas, procesar documentos por lotes, etcétera...

En otras palabras, con el asistente de IA, casi no necesitaremos aplicaciones; cualquier operación compleja se simplifica en un solo comando.

El tercero son las gafas inteligentes.

¿Por qué gafas de nuevo?

Al menos desde la perspectiva de Google, el acceso fluido a la visión y la audición es el anfitrión definitivo para los modelos grandes multimodales.

Estas gafas no tienen una apariencia llamativa, enfocándose completamente en capacidades prácticas:

Lentes de guía de onda a todo color Micro-OLED que pesan solo 4 gramos, con una transmitancia de luz de hasta el 85%;

Equipadas con un chip de borde Gemini ligero de desarrollo propio, latencia de inferencia local ≤12ms, capaz de traducción en tiempo real, reconocimiento de imágenes y análisis de escenas sin necesidad de conectarse a internet;

Vinculadas nativamente al agente Spark, sincronizando datos móviles y en la nube para proporcionar servicios personalizados como recordatorios de agenda, traducción en tiempo real y alertas ambientales.

En resumen, evita la pantalla del teléfono inteligente, integrando al agente en la perspectiva en primera persona del humano a través de las gafas.

Simplemente hay demasiado contenido; Google parece haber vaciado todas sus cartas de triunfo a la vez, declarando una verdad al mercado:

Un algoritmo sin un punto de entrada no es nada.

La era de lanzar parámetros de modelo y puntajes de referencia ha terminado; los proveedores de modelos puros ya no tienen un foso. El futuro es una batalla espacial de cuatro dimensiones de "borde + nube + ecosistema + hardware".

Meter IA en un paquete familiar está en realidad remodelando toda la lógica de distribución de tráfico de internet: de "usuarios buscando/haciendo clic activamente" a "agentes de IA distribuyendo servicios activamente".

Para una gran cantidad de desarrolladores y pequeñas y medianas empresas, esta es una excelente noticia, ya que la potencia de cómputo subyacente y los modelos se han vuelto extremadamente baratos, permitiendo que todos se concentren en la innovación en la capa de aplicación.

Pero otros competidores probablemente solo estén maldiciendo en este momento.

02

Cuando anunciaron casualmente desde el escenario que "los usuarios activos mensuales de Gemini han superado oficialmente los 900 millones", causó un gran revuelo en la audiencia.

900 millones es más que la suma de los MAU de todos los competidores en EE. UU.

¿Cómo lograron esto?

La respuesta es simple y brutal: alimentación forzada.

Google no necesita gastar dinero en publicidad para adquirir usuarios como las empresas de IA independientes; solo necesita agregar un ícono junto a la barra de direcciones en el navegador Chrome, integrar una tecla de acceso directo en la barra de navegación inferior de 3 mil millones de teléfonos Android y enviar actualizaciones en todo Google Workspace...

El costo de adquisición de clientes es esencialmente cero.

Más críticamente, durante el próximo período, las miradas de los 900 millones de usuarios activos mientras usan gafas inteligentes para ver productos, la lógica corregida mientras procesan tareas con Spark y las interacciones con el modelo visual Omni generarán una cantidad masiva de datos de retroalimentación del mundo real multimodales de alta calidad, todo lo cual nutrirá a Gemini 4.

Esto crea una barrera extremadamente sólida: cuanto mejor es el modelo para usar -> más usuarios atrae -> más datos genera -> mejor se vuelve el modelo.

Para fortalecer rápidamente este circuito cerrado, Google anunció directamente una guerra de precios contra todos los competidores: el paquete AI Ultra se redujo de $249,99/mes a $99,9/mes.

El precio de entrada para el millón de tokens de 3.5 Flash cayó a $0,02, y el precio de salida por un millón de tokens es de $0,08.

¿Qué clase de precio increíble es este?

En comparación, los precios promedio para modelos de niveles similares en la industria rondan los $0,15-0,2 para la entrada y $0,6-1 para la salida.

Haciendo los números, los clientes principales procesan alrededor de 1 billón de tokens diariamente. Cambiar el 80% de la carga de trabajo a Gemini 3.5 Flash durante un año podría ahorrar más de $1 mil millones.

¿Por qué se atreven a vender IA a un precio tan bajo?

La mayor dependencia es: infraestructura de potencia de cómputo integrada verticalmente.

Incluyendo gigantes como OpenAI y Anthropic, pueden parecer glamorosos, pero esencialmente siguen siendo "inquilinos de potencia de cómputo", necesitando comprar potencia de cómputo de Microsoft y Amazon, quienes a su vez tienen que pagarle al viejo Huang.

Google tiene su propio TPU y, combinado con la activación dispersa MoE extremadamente eficiente de 3.5 Flash, ha comprimido los costos de potencia de cómputo al extremo.

Pueden aprovechar al máximo sus ventajas de activos pesados para derribar a las empresas de algoritmos puros.

La lógica es clara.

Los modelos grandes básicos se están mercantilizando rápidamente. Al igual que el agua y la electricidad, ¿alguna vez viste a una empresa de agua obteniendo ganancias exorbitantes?

Google no teme que los modelos grandes en sí mismos no generen dinero porque pueden recuperarlo a través de anuncios de búsqueda, servicios en la nube y comisiones del ecosistema Android.

Pero para empresas como OpenAI, Anthropic, Cohere y Mistral que dependen únicamente de vender API de modelos grandes, esto es imposible.

Los inversores probablemente ahora quieran presionar la cabeza de Ultraman y preguntar: "El precio de la API de Google es solo una décima parte del tuyo, y su rendimiento es mejor que el tuyo. ¿Cómo esperás que funcione tu modelo de negocio?"

El panorama competitivo en múltiples industrias entrará así en un período de reorganización acelerada.

Los proveedores de IA deben encontrar rápidamente fuentes más baratas de potencia de cómputo o comenzar a fabricar chips ellos mismos.

La siguiente es Apple, que sigue construyendo de forma aislada.

La combinación de gafas inteligentes + modelo grande de video Omni + la toma de control a nivel de sistema nativo de Spark amenaza indudablemente al iPhone.

Según el "Informe de Pronóstico de Tendencias de Electrónica de Consumo" de Macquarie: En los próximos tres años, se espera que la proporción de interacciones sin pantalla basadas en visión/voz salte del 8% actual al 35%.

Si los usuarios se acostumbran a completar el trabajo diario y el entretenimiento usando gafas y voz, el tiempo de uso de las pantallas inevitablemente se reducirá significativamente.

Si Apple no puede producir dispositivos portátiles lo suficientemente impresionantes para contrarrestar (Vision Pro es demasiado pesado y costoso, destinado a ser un juguete para una minoría), su monopolio en los puntos de entrada en la era de la internet móvil enfrentará desafíos sin precedentes.

Esto no es iteración; es revolución.

Google ha lanzado el guante a todos los competidores con tecnología, tráfico y precio como tres armas.

En este momento, ¿hay alguien que todavía se burle de ellos por tener la enfermedad de una gran empresa?

Precio de --

También te puede gustar

Coinbase stuffed USDC into Hyperliquid; who made money from this transaction?

On the surface, it seems like a good deal for Hyperliquid with doubled revenue, but in reality, Coinbase has obtained something more valuable: a global distribution channel for USDC. In a situation where it is besieged domestically and locked out by USDT overseas, embedding stablecoins into the larg...

It is Bankless that needs Ethereum, not Ethereum that needs Bankless

The role of Bankless is being replaced by a more decentralized, specialized, and diverse "narrative network."

a16z invested $356 million to aggressively acquire HYPE, surpassing Paradigm to become the largest external holding institution

Eight months later, the price of HYPE is approaching its previous high, and institutions like a16z, Goldman Sachs, and Grayscale are collectively taking action. What is their intention?

I’m sorry, but I don’t have access to the original…

I’m sorry, but I don’t have access to the original text content necessary to fulfill the task. If…

## Outline

H1: Predicción de Precios de Bitcoin: Posible Caída a $55,000 H2: Resumen de la Predicción del Mercado H3:…

Bitcoin Alcanza Umbral Crítico y Mr. Beast Adquiere Step: Cambios Clave en el Mundo de las Criptomonedas

Key Takeaways Bitcoin enfrenta un umbral decisivo en los $55,000 USD, que podría determinar el próximo ciclo de…

# BankrCoin y Base Protocol: Movimientos Estratégicos en el Mercado Cripto

Resumen Clave BankrCoin (BNKR) alcanzó un nuevo máximo histórico, con un notable incremento de precio del 30%. Base…

Analistas Predicen una Potencial Caída del Precio de Bitcoin a $55K

Key Takeaways Analistas de múltiples empresas han predicho una caída potencial en el precio de Bitcoin a tan…

Bitcoin Podría Caer A $55,000: Análisis De Soporte Crítico

Key Takeaways Los analistas advierten sobre la posibilidad de una caída del precio de Bitcoin a $55,000 si…

BankerCoin Aumenta Hacia Nuevas Alturas: Análisis Detallado del Mercado

Key Takeaways El token nativo BankerCoin (BNKR) alcanzó un valor de mercado de $102 millones con un incremento…

Bitcoin Rompe Barrera Crítica: ¿Qué Significa el Umbral de los 55,000 USD?

Key Takeaways Se espera que Bitcoin experimente un aumento significativo en valor si supera los 55,000 USD. La…

# Pronósticos del Precio de Bitcoin: ¿Se Mantuendrá por Encima de los $55,000?

Key Takeaways Los analistas advierten sobre una posible caída del precio de Bitcoin a $55,000 si se rompe…

Bitcoin Experimenta Caída debido a presiones del mercado

Key Takeaways Analistas advierten que Bitcoin podría caer a $55,000 si se rompe un soporte clave, destacando la…

# Bitcoin Enfrenta Riesgo de Caer a $55,000: Analistas Emiten Advertencias

Key Takeaways Analistas advierten sobre la posibilidad de que Bitcoin caiga a $55,000 si se rompe el nivel…

El Token Nativo de Base Protocol, BNKR, Alcanza un Nuevo Máximo Histórico

Key Takeaways BNKR ha alcanzado un nuevo máximo histórico, con una capitalización de mercado que supera los $120…

Inversores Venden Ethereum Ante Caída de Precio

Key Takeaways Ethereum ha caído 29% en una semana, situándose por debajo de $2,000, alcanzando un mínimo de…

Predicción de Precio de Bitcoin: Potencial Descenso a $55,000

Key Takeaways Analistas advierten que Bitcoin podría caer a $55,000 si se pierde el soporte crítico. La probabilidad…

Analistas predicen descenso de Bitcoin a $55,000 si la tendencia continúa

Introducción Importancia del precio del Bitcoin Cómo los analistas interpretan el mercado actual Predicciones de Precio de Bitcoin…

Coinbase stuffed USDC into Hyperliquid; who made money from this transaction?

It is Bankless that needs Ethereum, not Ethereum that needs Bankless

The role of Bankless is being replaced by a more decentralized, specialized, and diverse "narrative network."

a16z invested $356 million to aggressively acquire HYPE, surpassing Paradigm to become the largest external holding institution

Eight months later, the price of HYPE is approaching its previous high, and institutions like a16z, Goldman Sachs, and Grayscale are collectively taking action. What is their intention?