作者头像

AI产品会

持续关注“大模型、多模态、文生图、文生视频、Agent、机器人”等热门话题,分享有关AI&AIGC“数据、芯片、前沿算法、部署、产品”等视角的高质量内容与干货!致力于打造一个“有温度、有趣味、专业的AI&AIGC全栈交流社区”!

资讯28
资讯

万能“目标检测神器”来袭 | 3B参数+大一统10+任务,YOLO等传统检测器《瑟瑟发抖》!

封面图

打造一个有温度、有趣味、专业的全栈式AI&AIGC交流社区,用心写好每一篇文章!项目主页-https://rex-omni.github.io/体验链接-https://huggingface.co/spaces/Mountchicken/Rex-Omni代码链接-https://github.com/IDEA-Research/Rex-Omni论文链接-https://arxiv.org/pdf/2510.12798为什么需要这个算法?--长期以来,目标检测...

2025-10-16 07:50:00

据说,DeepSeekV4将在10月发布,“更大、更强、更快、更便宜”!

封面图

打造一个有温度、有趣味、专业的全栈式AI&AIGC交流社区,用心写好每一篇文章!01-DeepSeekV4核心优势    据说,DeepSeekV4将会在10月份发布,提前透露一些该模型的关键信息: 1M+令牌上下文窗口/更大:一次性处理整个代码库或小说!V4的巨大容量可以使长篇分析变得轻松,超越竞争对手。🧠 基于GRPO的推理/更强:数学和编码...

2025-09-30 07:45:00

AI视频的牛顿革命!PhysCtrl给扩散模型装上「物理引擎」,反重力特效终成历史!

封面图

打造一个有温度、有趣味、专业的全栈式AI&AIGC交流社区,用心写好每一篇文章!项目主页-https://cwchenwang.github.io/physctrl/代码链接-https://github.com/CUT3R/CUT3R论文链接-https://arxiv.org/pdf/2509.20358为什么需要这个算法?--现有的视频生成模型擅长从文本或图像生成逼真的视频,但往往缺乏物理合理性和3D可控...

2025-09-26 08:00:00

广告植入新方式 | OmniInsert让虚拟商品「长」进实拍视频不留痕,无需任何掩码!

封面图

打造一个有温度、有趣味、专业的全栈式AI&AIGC交流社区,用心写好每一篇文章!项目主页-https://phantom-video.github.io/OmniInsert/代码链接-https://github.com/Phantom-video/OmniInsert论文链接-https://arxiv.org/pdf/2509.17627为什么需要这个算法?--基于扩散模型的视频插入任务的最新进展令人印象深刻。然而,现有...

2025-09-24 07:50:00

任督二脉终打通!西湖大学破壁「扩散模型×空间智能」,解锁3D/4D视频生成新篇章!

封面图

打造一个有温度、有趣味、专业的全栈式AI&AIGC交流社区,用心写好每一篇文章!项目主页-https://worldforge-agi.github.io/代码链接-https://github.com/Westlake-AGI-Lab/WorldForge论文链接-https://arxiv.org/pdf/2509.15130为什么需要这个算法?--视频扩散模型由于其丰富的潜在世界先验,在空间智能任务中显示出巨大的...

2025-09-22 07:50:00

给机器人装上「具身智能大脑」| Nav-R1“双脑架构”破局具身导航,慢思考规划+快执行控制!

封面图

打造一个有温度、有趣味、专业的全栈式AI&AIGC交流社区,用心写好每一篇文章!项目主页-https://aigeeksgroup.github.io/Nav-R1/代码链接-https://github.com/AIGeeksGroup/Nav-R1论文链接-https://arxiv.org/pdf/2509.10884为什么需要这个算法?--具身智能对于实现通用人工智能至关重要,多模态大模型(MLMs)和世界模型(W...

2025-09-19 07:50:00

可灵击穿「多模态视频生成」,HuMo大一统“文本+图像+音频”,斩获多项SOTA!

封面图

打造一个有温度、有趣味、专业的全栈式AI&AIGC交流社区,用心写好每一篇文章!项目主页-https://phantom-video.github.io/HuMo/代码链接-https://github.com/Phantom-video/HuMo论文链接-https://arxiv.org/abs/2509.08519为什么需要这个算法?--以人为中心的视频生成(HCVG)方法寻求从多模态输入(包括文本、图像和音频)...

2025-09-15 07:50:00

370万数据{打造}3D部件分割「全能王」| P³-SAM问世:任意复杂物体,一键“分崩离析”!

封面图

打造一个有温度、有趣味、专业的全栈式AI&AIGC交流社区,用心写好每一篇文章!代码链接-近期开源论文链接-https://arxiv.org/pdf/2509.06784为什么需要这个算法?--将3D资产分割成3D部件对于增强3D理解、促进模型重用和支持各种应用程序(如零件生成)至关重要。然而,当前的方法面临着一些局限性,例如在处理复杂对象时鲁...

2025-09-12 07:50:00

3D模型也能做“局部外科手术了”,无需训练,“想改哪里改哪里”,提效N倍+!

封面图

打造一个有温度、有趣味、专业的全栈式AI&AIGC交流社区,用心写好每一篇文章!项目主页-https://huanngzh.github.io/VoxHammer-Page/代码链接-https://github.com/Nelipot-Lee/VoxHammer论文链接-https://arxiv.org/pdf/2508.19247为什么需要这个算法?--指定区域的3D局部编辑对于游戏产业和机器人交互至关重要。最近的方法...

2025-08-29 07:50:00

别的机器狗忙着“跑酷”,这个机器狗却「在干活」:能听懂人话的“打工狗”时代即将来临!

封面图

打造一个有温度、有趣味、专业的全栈式AI&AIGC交流社区,用心写好每一篇文章!项目主页-https://kaijwang.github.io/odyssey.github.io/代码链接-https://kaijwang.github.io/odyssey.github.io/论文链接-https://arxiv.org/pdf/2508.08240为什么需要这个算法?--长期以来,语言引导的长视野移动操作一直是语义推理、泛化操...

2025-08-26 07:50:00

ICCV2025佳作 | 3DGS渲染质量↑10%+训练速度↑200倍+内存占用↓7.9倍,无需相机位姿。

封面图

打造一个有温度、有趣味、专业的全栈式AI&AIGC交流社区,用心写好每一篇文章!项目主页-https://linjohnss.github.io/longsplat/代码链接-https://github.com/NVlabs/LongSplat论文链接-https://arxiv.org/pdf/2508.14041为什么需要这个算法?--从随意捕获的长视频中进行新视图合成(NVS)的关键挑战,不规则的相机运动、未...

2025-08-25 07:55:49

一文速览DeepSeek V3.1中4个关键更新+一些“鲜为人知”的细节,没有想象中那么好!

封面图

打造一个有温度、有趣味、专业的全栈式AI&AIGC交流社区,用心写好每一篇文章!HF链接-https://huggingface.co/deepseek-ai/DeepSeek-V3.1-Base/tree/main01-DeepSeek V3.1简介DeepSeek-V3.1-Base有如下4个关键更新:这是一个混合模型,具有可切换的思维模式,这种模式已经被Qwen所抛弃,或许DeepSeek找到了更好的解决方案?...

2025-08-20 08:17:37

全球首届“人形机器人”大赛杀出多匹黑马,26枚金牌{花落谁家},谁是业界最强黑马?

封面图

打造一个有温度、有趣味、专业的全栈式AI&AIGC交流社区,用心写好每一篇文章!官网链接-https://www.whrgoc.com/“ 2025.08.15~2025.08.17期间,在北京国家速滑馆(冰丝带)里面举办了“2025世界人形机器人运动会”--也是全球首届人形机器人运动会。本次比赛主要包含了竞技赛、表演赛、场景赛,包含26个项目、487场比赛。比赛...

2025-08-18 07:50:00

全球首个“复合特效”视频模型 | 支持火焰+消融+爆炸等精准控制,真正实现「指哪变哪」!

封面图

打造一个有温度、有趣味、专业的全栈式AI&AIGC交流社区,用心写好每一篇文章!项目主页-https://amap-ml.github.io/Omni-Effects.github.io/代码链接-https://github.com/AMAP-ML/Omni-Effects论文链接-https://arxiv.org/pdf/2508.07981为什么需要这个算法?--视觉效果(VFX)是现代电影制作中必不可少的视觉增强功能。目...

2025-08-13 08:09:32

直播电商{核武器}:大一统“正反双试穿”,主播1秒试百套,试穿演示内搭效果肉眼难辨真假!

封面图

打造一个有温度、有趣味、专业的全栈式AI&AIGC交流社区,用心写好每一篇文章!项目主页-https://nxnai.github.io/Voost/代码链接-https://github.com/nxnai/Voost论文链接-https://arxiv.org/pdf/2508.04825为什么需要这个算法?--虚拟试穿旨在合成穿着目标服装的人的真实图像,但准确建模服装与身体的对应关系仍然是一个持...

2025-08-12 08:11:13

字节让“视频虚拟试衣”立马变现,视频换装不再“穿帮”,细节稳如泰山,实现{所见即所得}!

封面图

打造一个有温度、有趣味、专业的全栈式AI&AIGC交流社区,用心写好每一篇文章!项目主页-https://virtu-lab.github.io/代码链接-https://github.com/Virtu-Lab/DreamVVT论文链接-https://arxiv.org/pdf/2508.02807为什么需要这个算法?--视频虚拟试穿(VVT)技术因其在电子商务广告和娱乐中的广泛应用而引起了学术界的极大兴...

2025-08-08 07:50:00

腾讯开源“世界生成器”,可漫游&仿真生成360度沉浸式{宇宙工厂},颠覆游戏引擎+3D建模!

封面图

打造一个有温度、有趣味、专业的全栈式AI&AIGC交流社区,用心写好每一篇文章!项目主页-https://3d-models.hunyuan.tencent.com/world/体验链接-https://3d.hunyuan.tencent.com/sceneTo3D代码链接-https://github.com/Tencent-Hunyuan/HunyuanWorld-1.0论文链接-https://arxiv.org/pdf/2507.21809为什么需要这个算法?--从...

2025-07-31 07:50:00

45亿帧喂出「3D地球模拟器」| EarthCrafter重构“数字地球”,支持语义、RGBD等N+种条件。

封面图

打造一个有温度、有趣味、专业的全栈式AI&AIGC交流社区,用心写好每一篇文章!项目主页-https://whiteinblue.github.io/earthcrafter/论文链接-https://arxiv.org/pdf/2507.16535代码链接-即将开源为什么需要这个算法?--虽然最近的3D生成工作已经取得了显著进展,但是将这些方法扩展到地理范围,例如模拟数千平方公里的地...

2025-07-29 08:22:54

媲美商业模型 | 6.7倍加速+1024分辨率生成毫米级资产,"部件注意力"变身Ultra3D最大功臣!

封面图

打造一个有温度、有趣味、专业的全栈式AI&AIGC交流社区,用心写好每一篇文章!项目主页-https://buaacyw.github.io/ultra3d/体验链接-https://hitem3d.ai/论文链接-https://arxiv.org/pdf/2507.17745为什么需要这个算法?--稀疏体素表示的最新进展显著提高了3D内容生成的质量,实现了具有细粒度几何的高分辨率建模。然而,...

2025-07-28 07:50:00

全面碾压π0,国产VLA“弯道超车” | VR教1次就会,字节GR-3开启机器人「闪学」时代,泛化性爆表!

封面图

打造一个有温度、有趣味、专业的全栈式AI&AIGC交流社区,用心写好每一篇文章!项目主页-https://seed.bytedance.com/zh/GR3论文链接-https://arxiv.org/pdf/2507.15493代码链接-未开源为什么需要这个算法?--VLA无疑是今年的一个热点话题之一,然而在π0之后的很长一段时间,并没有出现什么很亮眼的VLA算法,这无疑证实VLA还...

2025-07-23 07:45:00

让“蒙娜丽莎”笑出声 | 虚拟人直播不用愁:单图生成{喜怒哀乐},支持多人同屏不串戏。

封面图

打造一个有温度、有趣味、专业的全栈式AI&AIGC交流社区,用心写好每一篇文章!项目主页-https://fantasy-amap.github.io/fantasy-portrait/代码链接-https://github.com/Fantasy-AMAP/fantasy-portrait论文链接-https://arxiv.org/pdf/2507.12956为什么需要这个算法?--从静态图像中制作富有表现力的面部动画是一项具有挑战...

2025-07-21 07:45:00

海报生成可用率88% | 效果吊打GPT-4o:设计师提效N倍,DreamPoster令Canva王座不保!

封面图

打造一个有温度、有趣味、专业的全栈式AI&AIGC交流社区,用心写好每一篇文章!项目主页-https://dreamposter.github.io/体验链接-https://jimeng.jianying.com/ai-tool/home论文链接-https://arxiv.org/pdf/2507.04218为什么需要这个算法?--虽然当前已经有很多方法支持利用AIGC生成海报,Step1X Edit、SeedEdit1.6等模型强...

2025-07-16 07:50:00

「4K超分打工仔」4KAgent横扫26项SOTA | 通吃老照片、AIGC图、卫星图、医疗影像等!

封面图

打造一个有温度、有趣味、专业的全栈式AI&AIGC交流社区,用心写好每一篇文章!项目主页-https://4kagent.github.io/代码链接-https://github.com/taco-group/4KAgent/论文链接-https://arxiv.org/pdf/2507.07105为什么需要这个算法?--图像超分在现实场景有很多的实际应用价值,然而当前的开源的图像超分方案很少能够处理4K...

2025-07-14 07:45:00

全球首创“3D部件+整体”生成大一统 | 告别「整坨石膏」,双引擎造出可拆解{智能积木}!

封面图

打造一个有温度、有趣味、专业的全栈式AI&AIGC交流社区,用心写好每一篇文章!项目主页-https://omnipart.github.io/论文链接-https://arxiv.org/pdf/2507.06165体验链接-https://huggingface.co/spaces/omnipart/OmniPart为什么需要这个算法?--创建具有明确、可编辑零件结构的3D资产对于推进交互式应用程序至关重要,但大...

2025-07-10 07:45:00

单卡H100跑4B“流媒体视频模型”->16FPS运行速度+5分钟长视频+512*512分辨率!

封面图

    打造一个有温度、有趣味、专业的全栈式AI&AIGC交流社区,用心写好每一篇文章!项目主页-https://cumulo-autumn.github.io/StreamDiT/论文链接-https://arxiv.org/pdf/2507.03745代码链接-未开源为什么需要这个算法?--虽然文生视频(T2V)任务取得了巨大进展,可以生成高质量的视频。然而,现有的模型通常只能离线生成...

2025-07-09 07:45:00

手机拍三张,重建“开放3D语义世界” | 单扩散模型生成RGB/法线/语义图,开放词汇“任意查”!

封面图

打造一个有温度、有趣味、专业的全栈式AI&AIGC交流社区,用心写好每一篇文章!项目主页-https://liuff19.github.io/LangScene-X/代码链接-https://github.com/liuff19/LangScene-X论文链接-https://arxiv.org/pdf/2507.02813为什么需要这个算法?--从2D图像中恢复具有开放词汇场景理解的3D结构是一项基本但艰巨的任务。最近...

2025-07-07 07:45:00

ICCV2025佳作 | 全球首个“长视频动漫”自动上色神器{燃爆国漫圈},一键统一500帧色彩风格!

封面图

打造一个有温度、有趣味、专业的全栈式AI&AIGC交流社区,用心写好每一篇文章!项目主页-https://cn-makers.github.io/long_animation_web/代码链接-https://github.com/CN-makers/LongAnimation论文链接-https://arxiv.org/pdf/2507.01945为什么需要这个算法?--动画自动上色是真实动画产业生产的重要组成部分。长动画着色...

2025-07-04 07:45:00

热门作者
作者头像
科技区角
Find Your TechCorner,关注前沿科技、集成电路、航空航天、数码、游戏及电子信息产业经济,在科技区角发现属于你的科技内容。
作者头像
华经产业研究院
华经情报网-专注于大中华区产业经济信息情报-隶属于华经产业研究院
作者头像
人工智能产业链union
人工智能产业链联盟,旨在汇聚全球人工智能领域的创新力量,共同推动人工智能技术的研发、应用与产业化。联盟以基础技术、人工智能技术及人工智能应用为核心,打造了一个完整、高效、协同的人工智能生态链。
作者头像
虎嗅app
从思考,到创造
作者头像
36氪
36氪是服务中国新经济参与者的卓越品牌和开创性平台,提供新锐深度的商业报道,强调趋势和价值,我们的slogan是:让一部分人先看到未来。