打造一个有温度、有趣味、专业的全栈式AI&AIGC交流社区,

用心写好每一篇文章!



项目主页-https://dreamposter.github.io/

体验链接-https://jimeng.jianying.com/ai-tool/home

论文链接-https://arxiv.org/pdf/2507.04218



为什么需要这个算法?--虽然当前已经有很多方法支持利用AIGC生成海报,Step1X Edit、SeedEdit1.6等模型强制执行严格的输入输出纵横比约束,限制了它们的适应性和实际效用。GPT-4o等模型虽然强大,但在纵横比和主题保留方面往往会产生不稳定的结果,经常产生失真或构图不佳的输出。
这个算法能做什么?-- 字节发布DreamPoster,它是一个大一统的海报生成框架,支持生成各种类型的海报格式,比肩设计界的主流产品Canva/可画!
这个算法效果如何?--大量的测试基准的评估结果表明:DreamPoster优于现有方法,与GPT-4o(47.56%)和SeedEdit3.0(25.96%)相比,可用率高达88.55%。DreamPoster将在即梦AI和其他字节跳动应用程序中上线。



01-DreamPoster核心优势

    DreamPoster是一个文生图生成框架,它可以从用户提供的图像和文本提示中智能地合成高质量的海报,同时保持内容保真度,支持灵活的分辨率和布局输出。

    具体来说,DreamPoster是基于字节的T2I模型Seedream3.0构建的,它可以统一处理不同类型的海报生成。

    对于数据集构建,作者提出了一种系统的数据注释管道,可以精确注释海报图像中的文本内容和排版层次信息,同时采用综合方法构建由源材料(如原始图形/文本)及其相应的最终海报输出组成的成对数据集。

    此外,作者采用了一种渐进式训练策略,使得模型能够分层获取多任务生成能力,同时保持高质量的生成效果。

02-DreamPoster落地场景

02.01-人物海报生成
    如上图所示,第1列和第3列表示Seedream3.0生成的图片,第2列和第4列表示DreamPoster生成的人物海报。
02.02-产品广告生成

    如上图所示,第1列和第3列表示Seedream3.0生成的图片,第2列和第4列表示DreamPoster生成的产品广告海报。

02.03-电影海报生成

    如上图所示,第1列和第3列表示Seedream3.0生成的图片,第2列和第4列表示DreamPoster生成的电影海报。

02.04-字体设计生成

    如上图所示,第1列和第3列表示Seedream3.0生成的图片,第2列和第4列表示DreamPoster生成的字体设计海报。

02.05-自适应尺寸生成

    如上图所示,第1列和第3列表示 Seedream3.0生成的图片,第2列和第4列表示DreamPoster针对特定的图像尺寸重新设计之后的结果。

02.06-图像编辑/涂鸦

    如上图所示,第1列和第3列表示 Seedream3.0生成的图片,第2列和第4列表示DreamPoster设计生成的教学图形和涂鸦结果。

03-DreamPoster上手指南

步骤1-访问https://jimeng.jianying.com/ai-tool/home链接

步骤2-在上图中的红框中输入“相应的文本提示词”

步骤3-在上图中的绿框中选择“合适的宽高比、分辨率”等信息

步骤4-点击上图中绿框中的“发送”按钮,稍等片刻即可

04-DreamPoster性能评估

04.01-主观效果评估
    上图展示了该方法与多个SOTA的海报生成方法(SeedEdit3.0、GPT-4o、Gemini2.5-Flash、Step1X-Edit、SeedEdit1.6)在相同的输入图片+文本提示下的生成效果。通过观察与分析,我们可以发现:与其它基线方法相比,该方法的生成效果更惊艳一些,不仅能够保持图片主体目标,而且可以准确的添加相应的文字。
04.02-客观指标评估
    如上图所示,作者进行了更全面的人类评估,将DreamPoster与最先进的基线在三个关键维度上进行了比较:快速跟进、受试者保护和设计感。DreamPoster的表现明显优于其它方法。
    除此之外,作者还对60名人类评估人员进行了可用性评估,定量分析显示,与最先进的基线相比,DreamPoster的可用性率在统计上更高(88.55%)。
05-DreamPoster效果展示



关注我,AI热点早知道,AI算法早精通,AI产品早上线!



禁止私自转载,需要转载请先征求我的同意!

欢迎你的加入,让我们一起交流、讨论与成长!

若二维码失效:关注公众号--》交流分享--》联系我们