腾讯开源「混元3D世界模型」1.0,支持一句话生成可交互3D场景

拓发‌ 11

颠覆性突破:腾讯混元3D世界模型1.0开源发布

2025年7月28日,腾讯在世界人工智能大会论坛上震撼发布并开源「混元3D世界模型1.0」,这款划时代的AI工具让"一句话造世界"成为现实。作为全球首个支持文本/图像生成可交互3D场景的开源模型,它正在重构游戏开发、影视制作、虚拟仿真等行业的创作范式。

三大革命性特性

  1. 沉浸式漫游体验
    用户不仅能生成360度全景场景,更可通过键盘控制自由行走探索。测试者反馈:"仿佛置身科幻电影,孢子飘散、光影流动的细节令人惊叹"。

  2. 工业级兼容性
    输出标准3D Mesh格式,无缝衔接Unity/Unreal/Blender。某游戏工作室负责人表示:"原型开发周期从周缩短到小时"。

  3. 语义分层编辑
    独创算法将场景拆解为前景/地形/天空模块,支持局部元素结构级修改。艺术家评价:"这给了我们前所未有的创作自由度"。

技术亮点解密

  • 采用两阶段生成范式:3D感知VAE压缩+DiT扩散生成,平衡质量与效率

  • 在Hugging Face下载量超230万,美学质量超越现有SOTA模型

  • 未来将融合VR/AR技术,向"世界理解"终极目标迈进

开发者生态布局

腾讯同步开放GitHub完整代码库 ,提供:

  • 20亿参数预训练模型

  • 详细技术白皮书

  • 社区协作平台
    "这降低了3D内容创作门槛,将激发无数创新可能"——CSDN技术专家评价。

行业影响前瞻

  • 游戏开发:快速构建测试场景,迭代效率提升300%

  • 教育科研:低成本创建虚拟实验室

  • 元宇宙基建:海量UGC内容生成引擎

"这不是简单的工具升级,而是打开了平行宇宙的创作之门。"正如腾讯AI Lab负责人所言,混元3D世界模型正在重新定义人类对数字空间的认知边界。


扣扣游手游 下载游戏折扣

扫描二维码下载