让“蒙娜丽莎”笑出声 | 虚拟人直播不用愁:单图生成{喜怒哀乐},支持多人同屏不串戏。
- 2025-07-21 07:45:00
打造一个有温度、有趣味、专业的全栈式AI&AIGC交流社区,
用心写好每一篇文章!
项目主页-https://fantasy-amap.github.io/fantasy-portrait/
代码链接-https://github.com/Fantasy-AMAP/fantasy-portrait
论文链接-https://arxiv.org/pdf/2507.12956

01-FantasyPortrait核心优势
FantasyPortrait是一个基于扩散模型的框架,它能够为单角色和多角色场景生成高保真度和情感丰富的动画。
该方法引入了一种表情增强学习策略,该策略利用隐式表示来捕捉与身份无关的面部动态,增强了模型渲染细粒度情绪的能力。对于多字符控制,作者设计了一种掩码交叉注意力机制,确保独立但协调的表达式生成,有效防止特征干扰。
为了推进这个领域的研究,作者提出了Multi-Expr数据集和ExprBench,它们是专门为训练和评估多角色肖像动画而设计的数据集和基准。
02-FantasyPortrait落地场景
03-FantasyPortrait基本原理

04-FantasyPortrait性能评估

关注我,AI热点早知道,AI算法早精通,AI产品早上线!

禁止私自转载,需要转载请先征求我的同意!
欢迎你的加入,让我们一起交流、讨论与成长!
声明:本文内容及配图由入驻作者撰写或合作网站授权转载。文章观点仅代表作者本人,不代表科技区角网立场。仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。
点击这里
扫码添加微信

- 点赞 (0)
-
分享
微信扫一扫
-
加入群聊
扫码加入群聊