45亿帧喂出「3D地球模拟器」| EarthCrafter重构“数字地球”,支持语义、RGBD等N+种条件。
- 2025-07-29 08:22:54
打造一个有温度、有趣味、专业的全栈式AI&AIGC交流社区,
用心写好每一篇文章!
项目主页-
https://whiteinblue.github.io/earthcrafter/
论文链接-https://arxiv.org/pdf/2507.16535
代码链接-即将开源

01-EarthCrafter核心优势

EarthCrafter是一种通过稀疏解耦潜在扩散进行大规模3D地球生成框架。该架构将结构和纹理生成解耦开来。
双稀疏3D VAE将高分辨率几何体素和纹理2D高斯散斑(2DGS)压缩到紧凑的潜在空间中,在很大程度上减轻了巨大地理尺度带来的昂贵计算,同时保留了关键信息。
作者提出了在混合输入(语义、图像或两者都没有)上训练的条件感知流匹配模型,从而独立灵活地对潜在的几何和纹理特征进行建模。
除此之外,作者介绍了Aerial-Earth3D,这是迄今为止最大的3D航空数据集,由美国大陆拍摄的5万个精心策划的场景(每个场景价值6亿美元×6亿美元)组成,包括4500万个多视图谷歌地球帧。每个场景都提供姿势注释的多视图图像、深度图、法线、语义分割和相机姿势,并具有明确的质量控制,以确保地形多样性。
02-EarthCrafter落地场景

03-EarthCrafter基础原理

图c展示了EarthCrafter算法的整体流程。图a与图b展示了EarthCrafter分别对TexVAE和StructVAE压缩的潜在空间中的纹理和结构进行建模。
EarthCrafter还包含纹理和结构流匹配模型,即TexFM和StructFM,用于对相关的潜在表现进行建模。
04-EarthCrafter性能评估

关注我,AI热点早知道,AI算法早精通,AI产品早上线!

禁止私自转载,需要转载请先征求我的同意!
欢迎你的加入,让我们一起交流、讨论与成长!

- 点赞 (0)
-
分享
微信扫一扫
-
加入群聊
扫码加入群聊