Imagina tomar una foto de tu salón, subirla a una herramienta de IA y recibir como respuesta no un vídeo de unos segundos, sino un mundo 3D completamente navegable que puedes importar directamente en Blender o Unreal Engine para modificarlo a tu antojo. Eso, que hasta hace poco era ciencia ficción, es exactamente lo que Tencent logró con el lanzamiento de HY-World 2.0 el 15 de abril de 2026.
La diferencia con lo que existía antes es radical. Modelos como Genie 3 de Google o NVIDIA Cosmos generaban vídeo: un clip impresionante que desaparecía en cuanto terminaba la reproducción. No podías entrar en él, no podías editarlo, no podías usarlo para construir nada. HY-World 2.0 produce activos 3D reales —mallas poligonales, Gaussian Splattings y nubes de puntos— importables directamente en los motores de creación profesionales. La diferencia es la misma que hay entre ver una película de una ciudad y tener los planos del arquitecto para construirla.
Y lo más importante: es completamente gratuito y de código abierto.
🔍 ¿Qué es HY-World 2.0 y qué problema resuelve?
HY-World 2.0 es un modelo de mundo multimodal desarrollado por Tencent (Hunyuan) que genera y reconstruye mundos 3D a partir de texto, imágenes o vídeos. El proyecto está disponible en Hugging Face y GitHub bajo la licencia tencent-hy-world-2.0-community, lo que significa que cualquier investigador, empresa o desarrollador puede descargarlo, usarlo y adaptarlo libremente.
El problema que resuelve es específico: la brecha entre la IA generativa visual y el pipeline de producción 3D profesional. Hasta ahora, un artista de videojuegos o un diseñador de arquitectura que quisiera usar IA para bocetear escenarios recibía resultados que no podía reutilizar directamente en su flujo de trabajo. Con HY-World 2.0, el resultado ya es un activo 3D editable, no un píxel congelado en el tiempo.
⚙️ Características principales
El sistema funciona mediante un pipeline de cuatro etapas completamente automatizadas. Primero, genera una imagen panorámica del entorno a partir del input proporcionado. Después, planifica la trayectoria de cámara para explorar el espacio de forma coherente. A continuación, expande el mundo en todas las direcciones usando el módulo WorldStereo 2.0. Finalmente, compone el resultado en activos 3D utilizando WorldMirror 2.0, el modelo unificado que predice simultáneamente mapas de profundidad, normales de superficie, parámetros de cámara y nubes de puntos 3D.
La compatibilidad con motores profesionales es uno de sus puntos fuertes: los activos generados se importan directamente en Blender, Unity, Unreal Engine y NVIDIA Isaac Sim sin conversión adicional. HY-World 2.0 acepta cuatro tipos de entrada: texto descriptivo, una sola imagen, múltiples imágenes desde distintos ángulos, o un vídeo. Cuantas más imágenes de entrada desde distintos ángulos, mayor es la precisión geométrica del resultado. Puedes explorar otras herramientas de generación visual en nuestro análisis de DreamO — El Framework Unificado de ByteDance para Personalizar Imágenes con IA.
Según Wikipedia, la inteligencia artificial generativa comprende sistemas capaces de generar imágenes u otros medios en respuesta a instrucciones. HY-World 2.0 lleva esa capacidad un paso más allá: en lugar de generar representaciones 2D del espacio, genera el espacio mismo en su estructura tridimensional real.
La exploración interactiva del resultado incluye navegación en primera y tercera persona, colisiones físicas realistas y física integrada. Esto lo hace especialmente útil para prototipar niveles de videojuegos, visualizar espacios arquitectónicos o crear entornos de entrenamiento para robots y simulaciones.
En cuanto a los modelos disponibles, el zoo incluye WorldMirror-2 (~1.200 millones de parámetros), HY-Pano-2 (~80.000 millones de parámetros) para generación de panoramas, HY-Pano-2-Qwen (~425 millones de parámetros, versión ligera) y WorldStereo-2 (~17.000 millones de parámetros) para expansión del mundo.
💰 Precio y planes
HY-World 2.0 es completamente gratuito y de código abierto. Los modelos están disponibles en Hugging Face (con descarga automática en la primera ejecución del código) y el repositorio completo está en GitHub. La demo web en Tencent 3D (3d.hunyuan.tencent.com) es igualmente gratuita, aunque suele estar muy concurrida y puede presentar tiempos de espera. La instalación local requiere hardware potente: GPU con al menos 40 GB de VRAM (A100 o H100), Python 3.11+ y CUDA 12.8. La comunidad ya está trabajando en versiones cuantizadas que reducirán ese requisito de VRAM considerablemente.
✅ Análisis: Pros y Contras
| ✅ Ventajas | ❌ Desventajas |
|---|---|
| Completamente gratuito y de código abierto bajo licencia permisiva para investigación y uso comercial | Requiere GPU con al menos 40 GB de VRAM para instalación local, lo que limita el acceso a usuarios con hardware consumer |
| Genera activos 3D reales (meshes, Gaussian Splattings) importables directamente en Blender, Unity y Unreal Engine | La demo web gratuita está muy saturada con largos tiempos de espera |
| Acepta múltiples tipos de entrada (texto, imagen, múltiples imágenes, vídeo) con resultados coherentes en todos los casos | La precisión geométrica cae notablemente cuando se usa una sola imagen de entrada con poco detalle de profundidad |
| Incluye física integrada y navegación interactiva en primera y tercera persona directamente en el entorno generado | Aunque open-source, los modelos más grandes requieren infraestructura de servidor costosa para inferencia en producción |
| Informe técnico completo en ArXiv (2604.14268) y soporte comunitario activo en Discord con canal de ayuda | La licencia tencent-hy-world-2.0-community incluye restricciones que deben revisarse antes de un uso comercial a gran escala |
⭐ Puntuación oledir.com: 4.5/5
Puntuación: 4.5/5 — HY-World 2.0 representa un salto paradigmático en la generación 3D con IA. El hecho de ser gratuito y open-source lo convierte en una referencia obligatoria para el sector, aunque los requisitos de hardware limitan su acceso inmediato para usuarios sin infraestructura dedicada.
- 🎯 Facilidad de uso: 3.5/5
- 💡 Funcionalidades: 5/5
- 💰 Relación calidad-precio: 5/5
- 🔧 Integraciones: 4.5/5
- 📞 Soporte: 4/5
🚀 ¿Para quién es ideal HY-World 2.0?
HY-World 2.0 está pensado para desarrolladores de videojuegos que necesitan generar escenarios base rápidamente, arquitectos y diseñadores de interiores que quieren visualizar espacios antes de construirlos, investigadores de robótica que necesitan entornos de simulación realistas para entrenamiento con Isaac Sim, y artistas digitales y creadores de mundos virtuales que quieren explorar nuevas posibilidades creativas con herramientas de última generación. Para quien tenga acceso a hardware adecuado o esté dispuesto a usar la demo web, representa una de las herramientas más revolucionarias publicadas en 2026.
🔗 Accede a HY-World 2.0 (gratis)
👉 Visita HY-World 2.0 en GitHub — Código abierto y gratuito
