
Google lanzó el 2 de abril de 2026 Gemma 4, su familia de modelos de inteligencia artificial más avanzada hasta la fecha, bajo una licencia Apache 2.0 totalmente permisiva por primera vez en la historia de la serie Gemma. Este cambio representa un punto de inflexión para empresas y desarrolladores que antes encontraban barreras legales en las versiones anteriores con licencias restrictivas.
¿Qué es Gemma 4 y por qué importa la licencia Apache 2.0?
Gemma 4 es la nueva familia de modelos de IA abiertos de Google, construida sobre la misma tecnología de investigación de clase mundial que impulsa Gemini 3. Hasta ahora, las versiones anteriores de Gemma venían con términos de licencia personalizados que creaban fricciones para el uso empresarial, el fine-tuning y el despliegue comercial. Con Apache 2.0, todas esas barreras desaparecen.
La diferencia práctica es enorme: una empresa puede ahora tomar Gemma 4, adaptarlo a su industria, desplegarlo en su propia infraestructura y comercializarlo, todo sin restricciones. Clément Delangue, cofundador de Hugging Face, calificó este movimiento como «un hito enorme». Por su parte, Demis Hassabis, CEO de Google DeepMind, afirmó que son «los mejores modelos abiertos del mundo para sus respectivos tamaños».
Los 4 modelos de Gemma 4: de tu smartphone al servidor
La familia Gemma 4 se presenta en cuatro tamaños diseñados para diferentes escenarios de uso:
- Gemma 4 E2B (Effective 2B): Modelo ultra-ligero que funciona con menos de 1,5 GB de RAM. Corre en teléfonos Android, Raspberry Pi y dispositivos IoT con latencia casi cero.
- Gemma 4 E4B (Effective 4B): Mayor capacidad para dispositivos de borde. Procesa imágenes, video y audio de forma nativa.
- Gemma 4 26B MoE (Mixture of Experts): Primera arquitectura MoE de la familia Gemma. Con 128 expertos pero solo 3.8B parámetros activos durante la inferencia, ofrece velocidad excepcional. Actualmente en el puesto #6 del ranking Arena AI de modelos abiertos.
- Gemma 4 31B Dense: El modelo más potente de la familia. Ocupa el puesto #3 en el ranking mundial de modelos abiertos de Arena AI, superando a modelos 20 veces más grandes.
Capacidades técnicas que cambian las reglas del juego
Más allá del tamaño, lo que distingue a Gemma 4 son sus capacidades para workflows empresariales avanzados:
- Ventanas de contexto extendidas: 128K tokens para modelos edge y hasta 256K para los modelos grandes, permitiendo procesar repositorios de código completos o documentos extensos en una sola consulta.
- Multimodalidad nativa: Todos los modelos procesan imágenes y video; los edge models además soportan audio para reconocimiento de voz.
- Agentic workflows: Function-calling nativo, salida JSON estructurada e instrucciones de sistema integradas hacen de Gemma 4 una plataforma lista para agentes autónomos.
- Más de 140 idiomas: Entrenados de forma nativa en más de 140 lenguas, incluido el español.
- Generación de código: Capacidad avanzada para actuar como asistente de código local y offline.
Disponibilidad inmediata y ecosistema de herramientas
Gemma 4 ya está disponible en Google AI Studio, Hugging Face, Kaggle y Ollama. El ecosistema de soporte desde el primer día incluye vLLM, llama.cpp, LM Studio, Docker, MLX, NVIDIA NIM y NeMo, entre muchos otros. NVIDIA ya está optimizando Gemma 4 para GPUs RTX locales.
La comunidad Gemma ha superado los 400 millones de descargas y más de 100.000 variantes creadas por la comunidad, lo que demuestra el enorme apetito del mercado por modelos abiertos de alta calidad.
Para desarrolladores Android, los modelos E2B y E4B son la base de Gemini Nano 4, que llegará a dispositivos Android más adelante en 2026. Ya es posible prototipar flujos agénticos en el AICore Developer Preview.
Qué significa esto para empresas y emprendedores
El lanzamiento de Gemma 4 bajo Apache 2.0 democratiza el acceso a IA de nivel frontier para organizaciones de cualquier tamaño. Antes, las empresas que querían desplegar modelos abiertos sin restricciones dependían principalmente de Meta Llama. Ahora Google entra directamente en ese espacio, ofreciendo una alternativa con rendimiento demostrado superior en varios benchmarks.
Para startups y equipos de desarrollo, esto significa poder construir productos de IA con modelos de Google-quality sin costos de licencia ni dependencia de APIs de terceros. Una empresa puede entrenar un modelo especializado para su industria, desplegarlo on-premise y mantener control total sobre sus datos. Casos como el modelo BgGPT (búlgaro) o Cell2Sentence para descubrir terapias contra el cáncer en Yale demuestran el potencial real de personalización.
El camino hacia la IA en el borde (Edge AI)
Quizás el aspecto más transformador es la capacidad de Gemma 4 de correr directamente en dispositivos móviles y de borde con rendimiento competitivo. El modelo E2B bajo 1.5 GB de RAM abre la puerta a aplicaciones de IA completamente offline: desde asistentes médicos en zonas sin conectividad hasta herramientas industriales en entornos cerrados.
Con la llegada de Gemini Nano 4 a Android más adelante en 2026, esta tecnología llegará a miles de millones de dispositivos, convirtiendo cada smartphone en una plataforma de IA capaz.
Con información de Google DeepMind / The Neuron / 9to5Google — Redacción VinzNetwork
y luego