清华开源!BEV-VAE:空间一致的多视角生成如何重塑自动驾驶感知?
- 2025-07-21 07:00:00
点击下方卡片,关注「3D视觉工坊」公众号
选择星标,干货第一时间送达
3D视觉工坊很荣幸邀请到了上海期智研究院陈泽铭,为大家着重分享他们团队的工作:BEV-VAE。如果您有相关工作需要分享,欢迎文末联系我们。
BEV-VAE: Multi-view Image Generation with Spatial Consistency for Autonomous Driving
论文:https://arxiv.org/pdf/2507.00707
代码:https://github.com/Czm369/bev-vae
直播信息
时间
2025年07月21日(周一)19:00
主题
上海期智&清华!BEV-VAE:首个自监督BEV视角的VAE,从图像到场景生成跃迁~
直播平台
3D视觉工坊哔哩哔哩
扫码观看直播,或前往B站搜索3D视觉工坊观看直播

3D视觉工坊视频号也将同步直播
主讲嘉宾
陈泽铭
上海期智研究院
现任上海期智研究院赵行团队的研究助理,硕士毕业于清华大学。主要研究方向为自动驾驶中的生成建模与三维感知,聚焦于利用AIGC技术(如扩散模型与自编码器)从多视图图像构建结构化的世界模型。
个人主页: https://czm369.github.io/
直播大纲
BEV-VAE的研究背景与灵感来源 BEV感知算法回顾:自上而下 vs 自下而上 生成模型回顾:离散表示 vs 连续隐空间 BEV-VAE架构详解 多视角图像重建实验分析 新视角图像生成能力展示 多视角图像生成实验分析 未来工作展望
参与方式

注:3D视觉工坊很荣幸邀请到了上海期智研究院陈泽铭,为大家着重分享他们团队的工作:BEV-VAE。如果您有相关工作需要分享,欢迎联系微信:cv3d009 请备注:宣传工作,则不予通过。
声明:本文内容及配图由入驻作者撰写或合作网站授权转载。文章观点仅代表作者本人,不代表科技区角网立场。仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。
点击这里
扫码添加微信

- 点赞 0
-
分享
微信扫一扫
-
加入群聊
扫码加入群聊