华人团队PyVision爆改多模态模型,Claude视觉推理能力飙升31%
- 2025-07-22 07:00:00
点击下方卡片,关注「3D视觉工坊」公众号
选择星标,干货第一时间送达
3D视觉工坊很荣幸邀请到了上海人工智能实验室任研究助理赵世天,为大家着重分享他们团队的工作:PyVision。如果您有相关工作需要分享,欢迎文末联系我们。
PyVision: Agentic Vision with Dynamic Tooling
论文:https://arxiv.org/pdf/2507.07998
主页:https://agent-x.space/pyvision/
代码:https://github.com/agents-x-project/PyVision
直播信息
时间
2025年07月22日(周二)19:00
主题
利用Python动态生成工具,实现“Think with Image"!
直播平台
3D视觉工坊哔哩哔哩
扫码观看直播,或前往B站搜索3D视觉工坊观看直播

3D视觉工坊视频号也将同步直播
主讲嘉宾
赵世天
现于上海人工智能实验室任研究助理,本科毕业于华东师范大学,曾在约翰霍普金斯大学实习。主要研究方向为多模态理解、多模态文生图、多模态智能体。在CVPR、EMNLP、ICML等会议上发表多篇论文,并担任NeurIPS, CVPR等学术会议的审稿人。
个人主页:https://zhaoshitian.github.io/
直播大纲
多模态语言模型如何用图片思考及相关工作梳理 PyVision:动态创造工具 对于PyVision动态生成的工具的分析 未来工作展望
参与方式

注:3D视觉工坊很荣幸邀请到了上海人工智能实验室任研究助理赵世天,为大家着重分享他们团队的工作:PyVision。如果您有相关工作需要分享,
欢迎联系微信:cv3d009
,请备注:姓名/昵称+工作名称
,则不予通过。
声明:本文内容及配图由入驻作者撰写或合作网站授权转载。文章观点仅代表作者本人,不代表科技区角网立场。仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。
点击这里
扫码添加微信

- 点赞 0
-
分享
微信扫一扫
-
加入群聊
扫码加入群聊