点击下方卡片,关注「3D视觉工坊」公众号
选择星标,干货第一时间送达

3D视觉工坊很荣幸邀请到了上海人工智能实验室任研究助理赵世天,为大家着重分享他们团队的工作:PyVision。如果您有相关工作需要分享,欢迎文末联系我们。

PyVision: Agentic Vision with Dynamic Tooling
论文https://arxiv.org/pdf/2507.07998
主页https://agent-x.space/pyvision/
代码https://github.com/agents-x-project/PyVision

直播信息

时间

2025年07月22日(周二)19:00

主题

利用Python动态生成工具,实现“Think with Image"!

直播平台

3D视觉工坊哔哩哔哩

扫码观看直播,或前往B站搜索3D视觉工坊观看直播

3D视觉工坊视频号也将同步直播

主讲嘉宾

赵世天

现于上海人工智能实验室任研究助理,本科毕业于华东师范大学,曾在约翰霍普金斯大学实习。主要研究方向为多模态理解、多模态文生图、多模态智能体。在CVPR、EMNLP、ICML等会议上发表多篇论文,并担任NeurIPS, CVPR等学术会议的审稿人。

个人主页https://zhaoshitian.github.io/

直播大纲

  1. 多模态语言模型如何用图片思考及相关工作梳理
  2. PyVision:动态创造工具
  3. 对于PyVision动态生成的工具的分析
  4. 未来工作展望

参与方式

:3D视觉工坊很荣幸邀请到了上海人工智能实验室任研究助理赵世天,为大家着重分享他们团队的工作:PyVision。如果您有相关工作需要分享,欢迎联系微信:cv3d009,请备注:姓名/昵称+工作名称,则不予通过。