What is HY World Model 2?

HY World Model 2 (HunyuanWorld 2.0) is Tencent's latest open-source AI world model that generates real 3D scenes directly usable in game engines. It produces fully editable 3D content from text or image inputs.

What is the difference between HY World and Hunyuan?

HY World is the world-model product line under the Tencent Hunyuan AI brand. Hunyuan was rebranded to 'Tencent HY' for global markets. HunyuanWorld, HY-World, and HY World Model all refer to the same family of 3D world generation models.

Is HY World Model open source?

Yes. The HY World Model series is open-source. HunyuanWorld 1.0, 1.1 (WorldMirror), 1.5 (WorldPlay), and Voyager are all available on GitHub under the Tencent-Hunyuan organization. HunyuanWorld 2.0 is scheduled to open-source in April 2026.

When was HY World Model 2 released?

Tencent released and open-sourced HY-World 2.0 (HunyuanWorld 2.0) on April 16, 2026. The WorldMirror 2.0 code and weights ship with the launch under the tencent-hy-world-2.0-community license; HY-Pano 2.0 and WorldStereo 2.0 weights follow.

What components make up HY-World 2.0?

HY-World 2.0 is a four-stage pipeline: HY-Pano 2.0 (text/image → 360° panorama), WorldNav (spatial agent that plans camera trajectories), WorldStereo 2.0 (panorama → navigable 3DGS world), and WorldMirror 2.0 (a ~1.2B-parameter feed-forward model that predicts depth, surface normals, camera parameters, point clouds, and 3DGS in a single pass).

Which game engines does HY-World 2.0 export to?

HY-World 2.0 outputs Mesh, 3D Gaussian Splatting (3DGS), point clouds, depth maps, and camera parameters that import directly into Blender, Unity, Unreal Engine, and Isaac Sim. Maxon has integrated Hunyuan 3D into Cinema 4D.

What is Character Mode in HY-World 2.0?

Character Mode lets you explore a generated 3D world in first or third person with physics-based collision. Unlike video-only world models there is no fixed duration — the world is persistent 3D geometry, so playable length is unlimited.

How does HY World Model compare to Sora and Veo?

HY World Model generates actual 3D scenes (not just video), is fully open-source, and supports real-time interactive control. Sora and Veo 3 produce higher-fidelity passive video but are closed-source, cloud-only, and do not output 3D geometry. HY World Model is also #1 on Stanford's WorldScore benchmark.

What hardware do I need to run HY World Model?

The recommended pipeline uses the HunyuanVideo-8B backbone and benefits from GPUs with 40+ GB VRAM. The Lite version of HunyuanWorld 1.0 and the WAN-5B lightweight pipeline for v1.5 run on consumer GPUs with as little as 24 GB VRAM, such as an RTX 4090.

抢先体验 — HY-World 2.0 分阶段开放中

HY World Model 2

从一张图片或一句提示词出发，生成真实可探索的3D世界，可漫游、可编辑、可持续存在。由 HY World Model 2 驱动，让创作不止于画面，而是进入空间。

状态WorldMirror 2.0 权重已上线；HY-Pano 2.0 与 WorldStereo 2.0 即将陆续开放。腾讯官方预览为 sceneTo3D 体验场，免费观看，但当前注册需中国大陆手机号。

预览 — 即将开放

早期体验期间暂不开放创建功能。加入候补名单，成为首批用户。

全球注册开放时第一时间通知你 — 无需中国手机号。

提示词驱动场景构建

一个环境多镜头统一视觉逻辑

不是视频生成，而是世界构建

从一张图片或一句提示词出发，直接生成真实3D世界（网格 / 3DGS）。不再是短暂播放的画面，而是可浏览、可编辑、可复用的空间资产。

不止单帧想象，而是完整空间延展

通过全景生成、路径规划与世界扩展能力，自动补全视野之外的内容，生成结构一致、可导航的完整3D场景，而非局部片段。

不只是观看，而是自由探索

支持第一人称与第三人称视角，在生成的世界中自由移动与交互，具备基础物理反馈，让用户真正“进入”AI创造的空间。

什么是 HY World Model？

HY World Model（又称 HunyuanWorld）是腾讯推出的开源 AI 模型家族，能够根据文本提示词或单张图像生成沉浸式、可探索、可交互的 3D 世界。“混元”在中国哲学中意为“原初统一”，后缩写为 “HY” 用于国际品牌。

也称为

HunyuanWorld 2.0 · Hunyuan World Model · HY-World 2 · Tencent HY · Hunyuan · 混元

v2 新特性

真实 3D 输出

HunyuanWorld 2.0 生成的是真正的 3D 场景 —— 不再只是视频。输出可直接编辑，并可在 Unreal Engine、Unity 等游戏引擎中使用。

开源

完全开源

模型权重、训练代码与推理流水线全部在 GitHub 上开源。你可以在自己的硬件上运行，也可以针对自定义领域进行微调。

WorldScore 第一

榜首基准表现

HunyuanWorld-Voyager 变体在 Stanford 的 WorldScore 基准测试中，视频生成与 3D 重建质量均排名第一。

版本时间线

从首个开源 3D 世界模型，到实时可交互的世界，再到原生支持游戏引擎的输出。

April 16, 2026

HY-World 2.0 / HunyuanWorld 2.0 — 发布

面向 3D 世界生成、重建与模拟的多模态世界模型。四阶段流水线（HY-Pano 2.0 → WorldNav → WorldStereo 2.0 → WorldMirror 2.0）直接输出真实的 Mesh / 3DGS / 点云，可在 Blender、Unity、Unreal Engine 与 Isaac Sim 中使用。WorldMirror 2.0 的代码和权重在 tencent-hy-world-2.0-community 许可证下开源。

March 8, 2026

HY-World 1.5 — WorldCompass RL 代码发布

开源了 WorldPlay-8B 模型的强化学习后训练代码（WorldCompass），支持社区微调。

January 2026

HY-World 1.5 — 训练代码发布

WorldPlay-8B 模型的完整训练代码已开源，社区可以从零开始训练自己的世界模型。

December 17, 2025

HY-World 1.5（WorldPlay）

首个具备长时几何一致性的开源实时交互世界模型。以 24 FPS 流式输出视频，支持键鼠控制。基于 HunyuanVideo-8B 骨干。

October 22, 2025

HunyuanWorld 1.1（WorldMirror）

通用前馈 3D 重建模型。支持视频到 3D 以及多视图图像到 3D 生成。输出稠密点云、深度图以及 3D Gaussian Splatting。

September 2, 2025

HunyuanWorld-Voyager

首个具备原生 3D 重建能力的超长程世界模型。可将点云视频导出为 3D 格式，无需外部工具。在 Stanford WorldScore 排行第一。

July 26, 2025

HunyuanWorld 1.0

业界首个开源 3D 世界生成模型。从文本/图像到沉浸式、可探索的 3D 世界。兼容 CG 制作流水线。Lite 版本可在消费级 GPU（24GB VRAM）上运行。

走进 HY-World 2.0

HY-World 2.0 是一个多模态世界模型框架。它接收文本、单视图图像、多视图图像或视频，并在一次处理中输出真实的 3D 资产 —— 网格、3D Gaussian Splatting（3DGS）、点云、深度图、表面法线以及相机参数。

Stage 01

HY-Pano 2.0

全景生成。将文本提示词或单张图像转换为 360° 全景图，用以确立世界的风格、光照与空间布局。支持写实、卡通与游戏风格。

Stage 02

WorldNav

空间规划。空间智能体基于全景图预测相机轨迹 —— 即你可以穿行、观察和探索的路径 —— 在合成任何 3D 内容之前完成规划。

Stage 03

WorldStereo 2.0

世界扩展。沿着规划好的轨迹生成可漫游的 3DGS 世界，相机控制精度极高 —— RotErr 0.492、TransErr 0.968、ATE 1.768，三项指标全面优于 WorldStereo 1.0。

Stage 04

WorldMirror 2.0 + 3DGS 学习

世界合成与重建。一个约 1.2B 参数的统一前馈模型，在一次前向传播中预测深度、表面法线、相机参数、点云以及 3DGS 属性 —— 分辨率覆盖 5 万到 50 万像素。

模型库

Model	Role	Params	Status
WorldMirror 2.0	多视图 / 视频 → 3D 重建	~1.2B	已发布
WorldMirror 1.0	旧版多视图 / 视频 → 3D	~1.2B	已发布
HY-PanoGen（HY-Pano 2.0）	文本 / 图像 → 360° 全景	—	即将推出
WorldStereo 2.0	全景 → 可漫游 3DGS 世界	—	即将推出

WorldMirror 2.0已发布

多视图 / 视频 → 3D 重建

~1.2B

WorldMirror 1.0已发布

旧版多视图 / 视频 → 3D

~1.2B

HY-PanoGen（HY-Pano 2.0）即将推出

文本 / 图像 → 360° 全景

—

WorldStereo 2.0即将推出

全景 → 可漫游 3DGS 世界

—

基准测试

WorldMirror 2.0 在点云重建方面达到同类最佳水平，WorldStereo 2.0 在相机控制上领先 —— 这是首个与 Marble 等闭源系统处于同一梯队的开源 3D 世界模型。

WorldMirror 2.0 —— 点云重建（高分辨率 + 全部先验）

数据集	精度 ↓	完整度 ↓
7-Scenes	0.012	0.016
NRGBD	0.015	0.016
DTU	0.554	0.771

Highlights

HunyuanWorld-Voyager 此前在 Stanford WorldScore 上以 77.62 分登顶（WonderWorld 为 72.69，CogVideoX-I2V 为 62.15）。
截至 2026 年 3 月，Hunyuan 3D 系列在开源社区的累计下载量已超过 300 万次。
已集成进腾讯内部游戏流水线（DreamStar、轻游戏梦工坊），并被 Maxon Cinema 4D 采用。

技术规格

HY World Model 家族的架构、参数与能力。

HY-World 2.0 架构

输入: 文本 · 单张图像 · 多视图图像 · 视频
输出: Mesh · 3DGS · 点云 · 深度 · 表面法线 · 相机参数
生成流水线: HY-Pano 2.0 → WorldNav → WorldStereo 2.0 → WorldMirror 2.0 + 3DGS 学习
重建核心: WorldMirror 2.0 —— 统一前馈，单次前向传播
WorldMirror 2.0 参数量: ~1.2B
推理分辨率: 5 万 – 50 万像素（灵活）
风格: 写实 · 卡通 · 游戏（文本驱动）

运行时与部署

许可证: tencent-hy-world-2.0-community（开源）
CUDA: 推荐 12.4
Python / PyTorch: Python 3.10 · PyTorch 2.4.0
注意力机制: FlashAttention-3（推荐）或 FlashAttention-2
多卡: FSDP 搭配 BF16 精度
目标引擎: Blender · Unity · Unreal Engine · Isaac Sim
角色模式: 第一/第三人称探索，支持物理碰撞

对比一览

HY World Model 与其他主流 AI 世界模型及视频生成模型的对比。

HY World Model

Tencent

开源（权重 + 代码）
真实 3D 输出（可直接用于游戏引擎）
24 FPS 实时生成
支持键鼠交互控制
消费级 GPU 可运行（24 GB）
Stanford WorldScore 第一
兼容 CG 流水线

Sora

OpenAI

闭源
仅视频（无 3D 输出）
最长 1 分钟视频
无交互控制
仅云端
物理精确的运动
动态镜头运动

Veo 3

Google DeepMind

闭源
仅视频（无 3D 输出）
最长 60 秒
无交互控制
公开访问受限
电影级画质
复杂的镜头切换

Genie 2

Google DeepMind

闭源
仅视频（非真正 3D）
可交互的可玩世界
动作条件化生成
未公开发布
持久记忆
非开源

HunyuanVideo

13B/8.3B 视频生成骨干模型

Tencent-Hunyuan GitHub 组织

混元所有开源项目的集合

模型与资源

HY-World 2.0（Hugging Face）

官方 v2 模型卡片 —— 权重 + 模型库

HY-World 2.0 技术报告（PDF）

四阶段流水线、架构与基准结果

HY-World 2.0 论文（Hugging Face）

论文讨论与引用

体验 HY-World 2.0 —— SceneTo3D

腾讯混元官方在线体验场

在 fal.ai 上体验 HunyuanWorld

第三方体验场 —— 图像到世界生成

HY-WorldPlay（Hugging Face）

v1.5 模型权重，用于本地部署

HunyuanWorld-1（Hugging Face）

v1.0 模型权重

HY-World Discord

社区 Discord，可提问、展示 demo 与反馈问题

@TencentHunyuan（X）

官方公告与演示

如何使用 HY World Model 2 生成器

HY World Model 2 上手容易，只需三个简单步骤。

Step 01

定义你的世界

选择一张预设图片，或上传你的素材，作为3D世界的起点与视觉基底。无论是风景、室内还是概念画面，都可以成为世界生成的初始框架。

Step 02

构建与创造

输入一段提示词，描述你希望扩展与生成的内容。AI将基于你的意图，补全空间结构、细节与风格，构建完整的3D世界。

Step 03

等待生成完成

耐心等待约3-5分钟，即可获得一个可探索的3D世界。支持自由漫游与视角切换，让你的创作真正落地为空间。

人人都能使用的AI世界生成器

从一张图片到一个完整世界，从灵感到可探索空间，HY World Model 2 为不同创作者提供统一而强大的3D生成能力，让每一个想法都能被构建、被进入、被实现。

电影制作人和视频创作者

构建可重复、可控制的3D场景，不再受限于一次性的画面生成。你可以在同一世界中反复取景，精确调整镜头路径、构图与空间关系，让每一帧都具备一致性与可控性，从而更高效地完成叙事与视觉表达。

社交媒体和虚拟IP创造者

为你的虚拟形象打造专属世界。无论是日常内容、剧情演绎还是品牌表达，都可以在一个持续存在的3D空间中展开，让内容风格更加统一、记忆点更强，持续输出具有辨识度的视觉资产。

游戏设计师和概念艺术家

快速将灵感转化为可探索的3D场景，而不仅仅是平面概念图。从环境氛围到空间结构，都可以即时生成并自由漫游，帮助你在早期阶段验证世界观与关卡设计，加速创意到落地的过程。

建筑师和空间设计师

将设计想法直接转化为可浏览的空间原型。通过简单的图像或描述，快速生成具备结构与尺度感的3D场景，用于方案演示、灵感探索或客户沟通，让抽象设计更直观、更具说服力。

F A Q

什么是 HY World Model 2？

HY World Model 2 是基于浑元大模型构建的多模态3D世界生成框架。它支持从文本、单张图片等输入直接生成可探索、可编辑的3D世界，而不仅仅是生成视频内容。

HY World Model 2 可以生成什么类型的内容？

HY World Model 2 可以从一张图片或一句提示词生成完整的3D世界，包括网格（Mesh）、3D高斯点云（3DGS）等结构化资产。这些内容支持自由漫游、视角切换，并可用于多种创作与开发场景。

HY World Model 2 和传统视频生成模型有什么区别？

不同于传统视频模型（如 Genie、HY World 1.5）生成一次性的视频内容，HY World Model 2 生成的是可持续存在的3D世界。这意味着用户可以进入场景中探索、编辑，并在不同项目中复用这些空间资产。

是否支持将生成的3D世界导入其他工具或引擎？

是的，HY World Model 2 生成的3D资产（如Mesh、3DGS）可用于主流3D工具和引擎，例如 Unity、Unreal Engine 等，方便进一步编辑、开发或制作完整项目。

使用 HY World Model 2 是否需要注册账号？

是的，用户需要注册并登录后，才能使用 HY World Model 2 的核心功能，包括3D世界生成与管理等操作。

HY World Model 2 的收费方式是怎样的？

HY World Model 2 采用按调用次数计费的方式。每次生成3D世界会消耗固定成本，具体费用会在功能界面中清晰展示，用户可根据需求灵活使用。

生成一个3D世界需要多长时间？

通常情况下，使用 HY World Model 2 生成一个完整的3D世界大约需要3-5分钟。具体时间会根据场景复杂度和生成内容有所变化。

HY World Model 2 会持续更新吗？未来会有哪些能力提升？

是的，HY World Model 2 将持续迭代。未来会不断提升空间生成质量、丰富场景类型，并增强交互能力与世界构建深度，让AI生成的3D世界更加真实与可用。

HY World、HunyuanWorld 和混元之间有什么区别？

“混元”（意为“原初统一”）是腾讯的整体 AI 品牌，在海外市场被重新命名为 “Tencent HY”。“HunyuanWorld” 或 “HY World Model” 特指其世界生成产品线。混元家族还包括 HunyuanVideo（视频生成）、Hunyuan3D（3D 资产）以及 Hunyuan LLM。常见别名包括：HY-World、HY World Model、Hunyuan World Model、HunyuanWorld。

HY World Model 是否开源？在哪里下载？

是的，整个 HY World Model 家族均已开源。代码仓库托管于 github.com/Tencent-Hunyuan，核心仓库包括 HY-WorldPlay（v1.5）、HunyuanWorld-1.0 和 HunyuanWorld-Voyager。模型权重在 Hugging Face 的 “tencent” 组织下提供。HunyuanWorld 2.0 计划于 2026 年 4 月 15 日开源。

运行 HY World Model 需要什么硬件？

推荐的推理流水线基于 HunyuanVideo-8B 骨干模型，建议使用 40GB 及以上 VRAM 的 GPU（如 A100、H100）。HunyuanWorld 1.0 的 Lite 版本以及 v1.5 的 WAN-5B 轻量化流水线可以在 24GB VRAM 的消费级 GPU（如 RTX 4090）上运行。社区也提供了量化版本。

HY World Model 与 Sora、Veo 相比如何？

HY World Model 生成的是真实的 3D 场景（而非仅仅视频），完全开源，并支持 24 FPS 的实时交互控制。Sora 和 Veo 3 虽然能生成高保真的被动视频，但均为闭源、仅支持云端，且不输出 3D 几何。HY World Model 在 Stanford WorldScore 基准测试中，视频生成与 3D 重建两项均排名第一。

腾讯由谁负责构建 HY World Model？

HY World Model 由腾讯混元团队开发。更广泛的混元 AI 战略由首席 AI 科学家姚顺雨（前 OpenAI 研究员，于 2025 年 12 月加入）领衔。2026 年 3 月，腾讯将 AI Lab 并入混元团队，整合 AI 力量，并引入了来自 WizardLM 团队的视频与 3D 专长。

HY-World 2.0 由哪些模块组成？

HY-World 2.0 是一个四阶段流水线：HY-Pano 2.0 从文本或图像生成 360° 全景图，WorldNav 规划相机轨迹，WorldStereo 2.0 将全景扩展为可漫游的 3DGS 世界，而 WorldMirror 2.0 —— 一个约 1.2B 参数的前馈模型 —— 在一次前向传播中预测深度、表面法线、相机参数、点云和 3DGS。在首发时，WorldMirror 2.0 已开源；HY-Pano 2.0 和 WorldStereo 2.0 的权重将随后开放。

HY-World 2.0 支持导出到哪些游戏引擎？

HY-World 2.0 可输出 Mesh、3D Gaussian Splatting（3DGS）、点云、深度图以及相机参数，可直接导入 Blender、Unity、Unreal Engine 和 Isaac Sim。Maxon 也已将 Hunyuan 3D 集成到 Cinema 4D 的制作流水线中。

HY-World 2.0 采用什么许可证？

模型与权重以 tencent-hy-world-2.0-community 许可证发布。完整仓库位于 github.com/Tencent-Hunyuan/HY-World-2.0，模型卡片位于 huggingface.co/tencent/HY-World-2.0。

什么是角色模式（Character Mode）？

角色模式允许你以第一人称或第三人称方式在生成的 3D 世界中探索，并具备基于物理的碰撞反馈。与仅生成视频的世界模型不同，这里没有固定时长限制 —— 世界是持久存在的 3D 几何，因此可游玩的时长不受限制。

HY World Model 2

不是视频生成，而是世界构建

不止单帧想象，而是完整空间延展

不只是观看，而是自由探索

什么是 HY World Model？

真实 3D 输出

完全开源

榜首基准表现

版本时间线

HY-World 2.0 / HunyuanWorld 2.0 — 发布

HY-World 1.5 — WorldCompass RL 代码发布

HY-World 1.5 — 训练代码发布

HY-World 1.5（WorldPlay）

HunyuanWorld 1.1（WorldMirror）

HunyuanWorld-Voyager

HunyuanWorld 1.0

走进 HY-World 2.0

HY-Pano 2.0

WorldNav

WorldStereo 2.0

WorldMirror 2.0 + 3DGS 学习

模型库

基准测试

WorldMirror 2.0 —— 点云重建（高分辨率 + 全部先验）

Highlights

技术规格

HY-World 2.0 架构

运行时与部署

对比一览

HY World Model

Sora

Veo 3

Genie 2

相关混元模型

HunyuanVideo

Hunyuan3D v3

Hunyuan-GameCraft 2

Hunyuan 3.0（LLM）

HunyuanWorld-Voyager

HunyuanWorld 1.1（WorldMirror）

最新动态

官方公告

相关报道

开源资源

代码仓库

模型与资源

如何使用 HY World Model 2 生成器

定义你的世界

构建与创造

等待生成完成

人人都能使用的AI世界生成器

电影制作人和视频创作者

社交媒体和虚拟IP创造者

游戏设计师和概念艺术家

建筑师和空间设计师

F A Q