Google officially declares war

By: rootdata|2026/05/21 22:10:32
0
Compartir
copy

Autor de este artículo: Chengbei XugongSoporte de datos: Gougu Big Data

La Conferencia de Desarrolladores Google I/O 2026 deja una impresión que se resume en dos palabras: arrogancia.

No solo integraron sin problemas agentes de IA en todos los puntos de entrada de tráfico principales, como búsquedas, navegadores, teléfonos móviles y gafas inteligentes, sino que también lanzaron tres innovaciones importantes: Gemini 3.5 Flash, el modelo de video Omni y el nuevo asistente de IA Spark.

Tras mostrar sus fortalezas, anunciaron con orgullo que los usuarios activos mensuales de Gemini superaron los 900 millones; también anunciaron oficialmente importantes reducciones de precios.

El significado es directo: Soy más fuerte que vos y soy más barato que vos.

¿No es esto una declaración de guerra?

01

La revelación más impactante de la conferencia fue, sin duda, el debut de Gemini 3.5 Flash.

Normalmente, "Pro" representa la columna vertebral, mientras que "Flash" significa ligereza y velocidad.

En términos de parámetros del modelo, 3.5 Flash es efectivamente más pequeño que 3.1 Pro, pero en casi todas las pruebas de referencia de inferencia y codificación, el primero tuvo un desempeño sorprendentemente mejor:

En la compleja prueba de razonamiento matemático GSM8K, 3.5 Flash obtuvo un 95,8%, superando el 93,2% de 3.1 Pro; en la versión completa de la capacidad de generación de código SWE-bench, 3.5 Flash logró una tasa de solución del 38,4%, superando por mucho el 32,1% de 3.1 Pro...

¿Por qué?

Según el "Informe Técnico de Gemini 3.5" publicado por DeepMind, hay dos tecnologías centrales que son las más importantes.

Destilación de conocimiento extrema: Google no confió simplemente en acumular potencia de cómputo para entrenar a Flash; en su lugar, utilizaron el inédito "Gemini 3.5 Ultra" como modelo docente para realizar una destilación de reducción de dimensionalidad en Flash.

Según un análisis en X del científico jefe de DeepMind, Jeff Dean, la tasa de ajuste fino de 3.5 Flash en conjuntos de datos de cadenas lógicas de alta calidad mejoró un 400% en comparación con la generación anterior.

Esto significa que hereda el "cerebro lógico" de un modelo supergrande, en lugar de ser una "base de conocimientos" de memoria.

Nueva arquitectura MoE (Mezcla de Expertos): Dentro de 3.5 Flash, Google adoptó una red de expertos más detallada.

La MoE tradicional puede tener solo 8 o 16 expertos, activando solo 1 o 2 a la vez, lo cual es suficiente para soportar modelos a escala de billones de parámetros.

Según un análisis en el memorando de inversión en infraestructura de IA de 2026 de a16z, 3.5 Flash emplea 256 microexpertos, activando hasta 4 de los más eficientes durante cada inferencia.

Esto le permite cubrir un espacio de características multimodales extremadamente grande mientras mantiene un conteo de parámetros de activación extremadamente bajo.

En términos de TTFT (Tiempo hasta el primer token), 3.5 Flash ya alcanzó menos de 65 milisegundos.

Y un parpadeo humano toma entre 100 y 150 milisegundos.

En resumen, cuando opera como agente, desde una perspectiva fisiológica humana, no hay ninguna pausa perceptible.

Para los desarrolladores que necesitan llamar herramientas con frecuencia, realizar múltiples rondas de reflexión y requieren una latencia extremadamente baja, esta es la base perfecta para un superagente.

Solo con tal optimización de ingeniería extrema se puede establecer el dominio en el "despliegue en el borde" en un entorno ferozmente competitivo.

El primero es el modelo multimodal nativo Gemini Omni Flash.

Omni significa todopoderoso, correspondiendo al anterior GPT-4o; solo por el nombre, uno puede sentir la intensa competencia.

Al menos en términos de rendimiento, Gemini Omni Flash está mucho más calificado para usar el carácter "o" que GPT-4o.

Las versiones iniciales como Sora o Gemini 1.5 eran esencialmente parches, convirtiendo voz a texto y luego texto a imágenes.

Pero el Omni lanzado esta vez es una alineación multimodal nativa de extremo a extremo. No solo puede entender nativamente la coherencia temporal y las leyes físicas en los videos, sino que también reduce el retraso promedio de la industria de 400-600 milisegundos a 120 milisegundos.

Por ejemplo, durante la conferencia: un usuario que lleva una cámara sirve agua, y cuando la taza está a punto de desbordarse, Omni puede decir "¡pará, pará, pará!" 0,5 segundos antes de que el agua se derrame.

Esta inferencia en tiempo real del estado físico del mundo real puede parecer simple, pero es significativa: La IA ha evolucionado oficialmente de un chatbot en la pantalla a una herramienta auxiliar en el mundo real.

Incluso si todavía está en sus etapas iniciales.

El segundo es el asistente inteligente Spark.

Según un informe de The Verge que entrevista al vicepresidente de Ingeniería de Android, Spark ha recibido control sobre la API nativa del sistema Android 17.

En resumen, los procesos complejos que antes requerían abrir muchas aplicaciones ahora pueden completarse sin mover un dedo; solo dale instrucciones a Spark y podrá encargarse de todo por vos, incluso enviar mensajes, organizar correos electrónicos, resumir agendas, rastrear dinámicas web, identificar cargos ocultos en facturas, procesar documentos por lotes, etcétera...

En otras palabras, con el asistente de IA, casi no necesitaremos aplicaciones; cualquier operación compleja se simplifica en un solo comando.

El tercero son las gafas inteligentes.

¿Por qué gafas de nuevo?

Al menos desde la perspectiva de Google, el acceso fluido a la visión y la audición es el anfitrión definitivo para los modelos grandes multimodales.

Estas gafas no tienen una apariencia llamativa, enfocándose completamente en capacidades prácticas:

Lentes de guía de onda a todo color Micro-OLED que pesan solo 4 gramos, con una transmitancia de luz de hasta el 85%;

Equipadas con un chip de borde Gemini ligero de desarrollo propio, latencia de inferencia local ≤12ms, capaz de traducción en tiempo real, reconocimiento de imágenes y análisis de escenas sin necesidad de conectarse a internet;

Vinculadas nativamente al agente Spark, sincronizando datos móviles y en la nube para proporcionar servicios personalizados como recordatorios de agenda, traducción en tiempo real y alertas ambientales.

En resumen, evita la pantalla del teléfono inteligente, integrando al agente en la perspectiva en primera persona del humano a través de las gafas.

Simplemente hay demasiado contenido; Google parece haber vaciado todas sus cartas de triunfo a la vez, declarando una verdad al mercado:

Un algoritmo sin un punto de entrada no es nada.

La era de lanzar parámetros de modelo y puntajes de referencia ha terminado; los proveedores de modelos puros ya no tienen un foso. El futuro es una batalla espacial de cuatro dimensiones de "borde + nube + ecosistema + hardware".

Meter IA en un paquete familiar está en realidad remodelando toda la lógica de distribución de tráfico de internet: de "usuarios buscando/haciendo clic activamente" a "agentes de IA distribuyendo servicios activamente".

Para una gran cantidad de desarrolladores y pequeñas y medianas empresas, esta es una excelente noticia, ya que la potencia de cómputo subyacente y los modelos se han vuelto extremadamente baratos, permitiendo que todos se concentren en la innovación en la capa de aplicación.

Pero otros competidores probablemente solo estén maldiciendo en este momento.

02

Cuando anunciaron casualmente desde el escenario que "los usuarios activos mensuales de Gemini han superado oficialmente los 900 millones", causó un gran revuelo en la audiencia.

900 millones es más que la suma de los MAU de todos los competidores en EE. UU.

¿Cómo lograron esto?

La respuesta es simple y brutal: alimentación forzada.

Google no necesita gastar dinero en publicidad para adquirir usuarios como las empresas de IA independientes; solo necesita agregar un ícono junto a la barra de direcciones en el navegador Chrome, integrar una tecla de acceso directo en la barra de navegación inferior de 3 mil millones de teléfonos Android y enviar actualizaciones en todo Google Workspace...

El costo de adquisición de clientes es esencialmente cero.

Más críticamente, durante el próximo período, las miradas de los 900 millones de usuarios activos mientras usan gafas inteligentes para ver productos, la lógica corregida mientras procesan tareas con Spark y las interacciones con el modelo visual Omni generarán una cantidad masiva de datos de retroalimentación del mundo real multimodales de alta calidad, todo lo cual nutrirá a Gemini 4.

Esto crea una barrera extremadamente sólida: cuanto mejor es el modelo para usar -> más usuarios atrae -> más datos genera -> mejor se vuelve el modelo.

Para fortalecer rápidamente este circuito cerrado, Google anunció directamente una guerra de precios contra todos los competidores: el paquete AI Ultra se redujo de $249,99/mes a $99,9/mes.

El precio de entrada para el millón de tokens de 3.5 Flash cayó a $0,02, y el precio de salida por un millón de tokens es de $0,08.

¿Qué clase de precio increíble es este?

En comparación, los precios promedio para modelos de niveles similares en la industria rondan los $0,15-0,2 para la entrada y $0,6-1 para la salida.

Haciendo los números, los clientes principales procesan alrededor de 1 billón de tokens diariamente. Cambiar el 80% de la carga de trabajo a Gemini 3.5 Flash durante un año podría ahorrar más de $1 mil millones.

¿Por qué se atreven a vender IA a un precio tan bajo?

La mayor dependencia es: infraestructura de potencia de cómputo integrada verticalmente.

Incluyendo gigantes como OpenAI y Anthropic, pueden parecer glamorosos, pero esencialmente siguen siendo "inquilinos de potencia de cómputo", necesitando comprar potencia de cómputo de Microsoft y Amazon, quienes a su vez tienen que pagarle al viejo Huang.

Google tiene su propio TPU y, combinado con la activación dispersa MoE extremadamente eficiente de 3.5 Flash, ha comprimido los costos de potencia de cómputo al extremo.

Pueden aprovechar al máximo sus ventajas de activos pesados para derribar a las empresas de algoritmos puros.

La lógica es clara.

Los modelos grandes básicos se están mercantilizando rápidamente. Al igual que el agua y la electricidad, ¿alguna vez viste a una empresa de agua obteniendo ganancias exorbitantes?

Google no teme que los modelos grandes en sí mismos no generen dinero porque pueden recuperarlo a través de anuncios de búsqueda, servicios en la nube y comisiones del ecosistema Android.

Pero para empresas como OpenAI, Anthropic, Cohere y Mistral que dependen únicamente de vender API de modelos grandes, esto es imposible.

Los inversores probablemente ahora quieran presionar la cabeza de Ultraman y preguntar: "El precio de la API de Google es solo una décima parte del tuyo, y su rendimiento es mejor que el tuyo. ¿Cómo esperás que funcione tu modelo de negocio?"

El panorama competitivo en múltiples industrias entrará así en un período de reorganización acelerada.

Los proveedores de IA deben encontrar rápidamente fuentes más baratas de potencia de cómputo o comenzar a fabricar chips ellos mismos.

La siguiente es Apple, que sigue construyendo de forma aislada.

La combinación de gafas inteligentes + modelo grande de video Omni + la toma de control a nivel de sistema nativo de Spark amenaza indudablemente al iPhone.

Según el "Informe de Pronóstico de Tendencias de Electrónica de Consumo" de Macquarie: En los próximos tres años, se espera que la proporción de interacciones sin pantalla basadas en visión/voz salte del 8% actual al 35%.

Si los usuarios se acostumbran a completar el trabajo diario y el entretenimiento usando gafas y voz, el tiempo de uso de las pantallas inevitablemente se reducirá significativamente.

Si Apple no puede producir dispositivos portátiles lo suficientemente impresionantes para contrarrestar (Vision Pro es demasiado pesado y costoso, destinado a ser un juguete para una minoría), su monopolio en los puntos de entrada en la era de la internet móvil enfrentará desafíos sin precedentes.

Esto no es iteración; es revolución.

Google ha lanzado el guante a todos los competidores con tecnología, tráfico y precio como tres armas.

En este momento, ¿hay alguien que todavía se burle de ellos por tener la enfermedad de una gran empresa?

Precio de --

--

También te puede gustar

Contenido

Monedas populares

Últimas noticias cripto

Más información
iconiconiconiconiconicon
Atención al cliente:@weikecs
Cooperación comercial:@weikecs
Trading cuantitativo y MM:bd@weex.com
Programa VIP:support@weex.com