点击下方卡片,关注「3D视觉工坊」公众号
选择星标,干货第一时间送达

3D视觉工坊很荣幸邀请到了上海期智研究院陈泽铭,为大家着重分享他们团队的工作:BEV-VAE。如果您有相关工作需要分享,欢迎文末联系我们。

BEV-VAE: Multi-view Image Generation with Spatial Consistency for Autonomous Driving
论文https://arxiv.org/pdf/2507.00707
代码https://github.com/Czm369/bev-vae

直播信息

时间

2025年07月21日(周一)19:00

主题

上海期智&清华!BEV-VAE:首个自监督BEV视角的VAE,从图像到场景生成跃迁~

直播平台

3D视觉工坊哔哩哔哩

扫码观看直播,或前往B站搜索3D视觉工坊观看直播

3D视觉工坊视频号也将同步直播

主讲嘉宾

陈泽铭
上海期智研究院

现任上海期智研究院赵行团队的研究助理,硕士毕业于清华大学。主要研究方向为自动驾驶中的生成建模与三维感知,聚焦于利用AIGC技术(如扩散模型与自编码器)从多视图图像构建结构化的世界模型。

个人主页: https://czm369.github.io/

直播大纲

  1. BEV-VAE的研究背景与灵感来源
  2. BEV感知算法回顾:自上而下 vs 自下而上
  3. 生成模型回顾:离散表示 vs 连续隐空间
  4. BEV-VAE架构详解
  5. 多视角图像重建实验分析
  6. 新视角图像生成能力展示
  7. 多视角图像生成实验分析
  8. 未来工作展望

参与方式

:3D视觉工坊很荣幸邀请到了上海期智研究院陈泽铭,为大家着重分享他们团队的工作:BEV-VAE。如果您有相关工作需要分享,欢迎联系微信:cv3d009 请备注:宣传工作,则不予通过。