万能“目标检测神器”来袭 | 3B参数+大一统10+任务,YOLO等传统检测器《瑟瑟发抖》!
打造一个有温度、有趣味、专业的全栈式AI&AIGC交流社区,用心写好每一篇文章!项目主页-https://rex-omni.github.io/体验链接-https://huggingface.co/spaces/Mountchicken/Rex-Omni代码链接-https://github.com/IDEA-Research/Rex-Omni论文链接-https://arxiv.org/pdf/2510.12798为什么需要这个算法?--长期以来,目标检测...
2025-10-16 07:50:00
据说,DeepSeekV4将在10月发布,“更大、更强、更快、更便宜”!
打造一个有温度、有趣味、专业的全栈式AI&AIGC交流社区,用心写好每一篇文章!01-DeepSeekV4核心优势 据说,DeepSeekV4将会在10月份发布,提前透露一些该模型的关键信息: 1M+令牌上下文窗口/更大:一次性处理整个代码库或小说!V4的巨大容量可以使长篇分析变得轻松,超越竞争对手。🧠 基于GRPO的推理/更强:数学和编码...
2025-09-30 07:45:00
AI视频的牛顿革命!PhysCtrl给扩散模型装上「物理引擎」,反重力特效终成历史!
打造一个有温度、有趣味、专业的全栈式AI&AIGC交流社区,用心写好每一篇文章!项目主页-https://cwchenwang.github.io/physctrl/代码链接-https://github.com/CUT3R/CUT3R论文链接-https://arxiv.org/pdf/2509.20358为什么需要这个算法?--现有的视频生成模型擅长从文本或图像生成逼真的视频,但往往缺乏物理合理性和3D可控...
2025-09-26 08:00:00
广告植入新方式 | OmniInsert让虚拟商品「长」进实拍视频不留痕,无需任何掩码!
打造一个有温度、有趣味、专业的全栈式AI&AIGC交流社区,用心写好每一篇文章!项目主页-https://phantom-video.github.io/OmniInsert/代码链接-https://github.com/Phantom-video/OmniInsert论文链接-https://arxiv.org/pdf/2509.17627为什么需要这个算法?--基于扩散模型的视频插入任务的最新进展令人印象深刻。然而,现有...
2025-09-24 07:50:00
任督二脉终打通!西湖大学破壁「扩散模型×空间智能」,解锁3D/4D视频生成新篇章!
打造一个有温度、有趣味、专业的全栈式AI&AIGC交流社区,用心写好每一篇文章!项目主页-https://worldforge-agi.github.io/代码链接-https://github.com/Westlake-AGI-Lab/WorldForge论文链接-https://arxiv.org/pdf/2509.15130为什么需要这个算法?--视频扩散模型由于其丰富的潜在世界先验,在空间智能任务中显示出巨大的...
2025-09-22 07:50:00
给机器人装上「具身智能大脑」| Nav-R1“双脑架构”破局具身导航,慢思考规划+快执行控制!
打造一个有温度、有趣味、专业的全栈式AI&AIGC交流社区,用心写好每一篇文章!项目主页-https://aigeeksgroup.github.io/Nav-R1/代码链接-https://github.com/AIGeeksGroup/Nav-R1论文链接-https://arxiv.org/pdf/2509.10884为什么需要这个算法?--具身智能对于实现通用人工智能至关重要,多模态大模型(MLMs)和世界模型(W...
2025-09-19 07:50:00
可灵击穿「多模态视频生成」,HuMo大一统“文本+图像+音频”,斩获多项SOTA!
打造一个有温度、有趣味、专业的全栈式AI&AIGC交流社区,用心写好每一篇文章!项目主页-https://phantom-video.github.io/HuMo/代码链接-https://github.com/Phantom-video/HuMo论文链接-https://arxiv.org/abs/2509.08519为什么需要这个算法?--以人为中心的视频生成(HCVG)方法寻求从多模态输入(包括文本、图像和音频)...
2025-09-15 07:50:00
370万数据{打造}3D部件分割「全能王」| P³-SAM问世:任意复杂物体,一键“分崩离析”!
打造一个有温度、有趣味、专业的全栈式AI&AIGC交流社区,用心写好每一篇文章!代码链接-近期开源论文链接-https://arxiv.org/pdf/2509.06784为什么需要这个算法?--将3D资产分割成3D部件对于增强3D理解、促进模型重用和支持各种应用程序(如零件生成)至关重要。然而,当前的方法面临着一些局限性,例如在处理复杂对象时鲁...
2025-09-12 07:50:00
媲美Nano-Banana | 字节{全量开源}首个“风格+主题”「双修」模型,节省百万外包费!
打造一个有温度、有趣味、专业的全栈式AI&AIGC交流社区,用心写好每一篇文章!项目主页-https://bytedance.github.io/USO/代码链接-https://github.com/bytedance/USO试用链接-https://huggingface.co/spaces/bytedance-research/USO论文链接-https://huggingface.co/papers/2508.18966为什么需要这个算法?--现有方法通常...
2025-09-01 07:45:00
3D模型也能做“局部外科手术了”,无需训练,“想改哪里改哪里”,提效N倍+!
打造一个有温度、有趣味、专业的全栈式AI&AIGC交流社区,用心写好每一篇文章!项目主页-https://huanngzh.github.io/VoxHammer-Page/代码链接-https://github.com/Nelipot-Lee/VoxHammer论文链接-https://arxiv.org/pdf/2508.19247为什么需要这个算法?--指定区域的3D局部编辑对于游戏产业和机器人交互至关重要。最近的方法...
2025-08-29 07:50:00
别的机器狗忙着“跑酷”,这个机器狗却「在干活」:能听懂人话的“打工狗”时代即将来临!
打造一个有温度、有趣味、专业的全栈式AI&AIGC交流社区,用心写好每一篇文章!项目主页-https://kaijwang.github.io/odyssey.github.io/代码链接-https://kaijwang.github.io/odyssey.github.io/论文链接-https://arxiv.org/pdf/2508.08240为什么需要这个算法?--长期以来,语言引导的长视野移动操作一直是语义推理、泛化操...
2025-08-26 07:50:00
ICCV2025佳作 | 3DGS渲染质量↑10%+训练速度↑200倍+内存占用↓7.9倍,无需相机位姿。
打造一个有温度、有趣味、专业的全栈式AI&AIGC交流社区,用心写好每一篇文章!项目主页-https://linjohnss.github.io/longsplat/代码链接-https://github.com/NVlabs/LongSplat论文链接-https://arxiv.org/pdf/2508.14041为什么需要这个算法?--从随意捕获的长视频中进行新视图合成(NVS)的关键挑战,不规则的相机运动、未...
2025-08-25 07:55:49
一文速览DeepSeek V3.1中4个关键更新+一些“鲜为人知”的细节,没有想象中那么好!
打造一个有温度、有趣味、专业的全栈式AI&AIGC交流社区,用心写好每一篇文章!HF链接-https://huggingface.co/deepseek-ai/DeepSeek-V3.1-Base/tree/main01-DeepSeek V3.1简介DeepSeek-V3.1-Base有如下4个关键更新:这是一个混合模型,具有可切换的思维模式,这种模式已经被Qwen所抛弃,或许DeepSeek找到了更好的解决方案?...
2025-08-20 08:17:37
全球首届“人形机器人”大赛杀出多匹黑马,26枚金牌{花落谁家},谁是业界最强黑马?
打造一个有温度、有趣味、专业的全栈式AI&AIGC交流社区,用心写好每一篇文章!官网链接-https://www.whrgoc.com/“ 2025.08.15~2025.08.17期间,在北京国家速滑馆(冰丝带)里面举办了“2025世界人形机器人运动会”--也是全球首届人形机器人运动会。本次比赛主要包含了竞技赛、表演赛、场景赛,包含26个项目、487场比赛。比赛...
2025-08-18 07:50:00
全球首个“复合特效”视频模型 | 支持火焰+消融+爆炸等精准控制,真正实现「指哪变哪」!
打造一个有温度、有趣味、专业的全栈式AI&AIGC交流社区,用心写好每一篇文章!项目主页-https://amap-ml.github.io/Omni-Effects.github.io/代码链接-https://github.com/AMAP-ML/Omni-Effects论文链接-https://arxiv.org/pdf/2508.07981为什么需要这个算法?--视觉效果(VFX)是现代电影制作中必不可少的视觉增强功能。目...
2025-08-13 08:09:32
直播电商{核武器}:大一统“正反双试穿”,主播1秒试百套,试穿演示内搭效果肉眼难辨真假!
打造一个有温度、有趣味、专业的全栈式AI&AIGC交流社区,用心写好每一篇文章!项目主页-https://nxnai.github.io/Voost/代码链接-https://github.com/nxnai/Voost论文链接-https://arxiv.org/pdf/2508.04825为什么需要这个算法?--虚拟试穿旨在合成穿着目标服装的人的真实图像,但准确建模服装与身体的对应关系仍然是一个持...
2025-08-12 08:11:13
字节让“视频虚拟试衣”立马变现,视频换装不再“穿帮”,细节稳如泰山,实现{所见即所得}!
打造一个有温度、有趣味、专业的全栈式AI&AIGC交流社区,用心写好每一篇文章!项目主页-https://virtu-lab.github.io/代码链接-https://github.com/Virtu-Lab/DreamVVT论文链接-https://arxiv.org/pdf/2508.02807为什么需要这个算法?--视频虚拟试穿(VVT)技术因其在电子商务广告和娱乐中的广泛应用而引起了学术界的极大兴...
2025-08-08 07:50:00
腾讯开源“世界生成器”,可漫游&仿真生成360度沉浸式{宇宙工厂},颠覆游戏引擎+3D建模!
打造一个有温度、有趣味、专业的全栈式AI&AIGC交流社区,用心写好每一篇文章!项目主页-https://3d-models.hunyuan.tencent.com/world/体验链接-https://3d.hunyuan.tencent.com/sceneTo3D代码链接-https://github.com/Tencent-Hunyuan/HunyuanWorld-1.0论文链接-https://arxiv.org/pdf/2507.21809为什么需要这个算法?--从...
2025-07-31 07:50:00
45亿帧喂出「3D地球模拟器」| EarthCrafter重构“数字地球”,支持语义、RGBD等N+种条件。
打造一个有温度、有趣味、专业的全栈式AI&AIGC交流社区,用心写好每一篇文章!项目主页-https://whiteinblue.github.io/earthcrafter/论文链接-https://arxiv.org/pdf/2507.16535代码链接-即将开源为什么需要这个算法?--虽然最近的3D生成工作已经取得了显著进展,但是将这些方法扩展到地理范围,例如模拟数千平方公里的地...
2025-07-29 08:22:54
媲美商业模型 | 6.7倍加速+1024分辨率生成毫米级资产,"部件注意力"变身Ultra3D最大功臣!
打造一个有温度、有趣味、专业的全栈式AI&AIGC交流社区,用心写好每一篇文章!项目主页-https://buaacyw.github.io/ultra3d/体验链接-https://hitem3d.ai/论文链接-https://arxiv.org/pdf/2507.17745为什么需要这个算法?--稀疏体素表示的最新进展显著提高了3D内容生成的质量,实现了具有细粒度几何的高分辨率建模。然而,...
2025-07-28 07:50:00
全面碾压π0,国产VLA“弯道超车” | VR教1次就会,字节GR-3开启机器人「闪学」时代,泛化性爆表!
打造一个有温度、有趣味、专业的全栈式AI&AIGC交流社区,用心写好每一篇文章!项目主页-https://seed.bytedance.com/zh/GR3论文链接-https://arxiv.org/pdf/2507.15493代码链接-未开源为什么需要这个算法?--VLA无疑是今年的一个热点话题之一,然而在π0之后的很长一段时间,并没有出现什么很亮眼的VLA算法,这无疑证实VLA还...
2025-07-23 07:45:00
让“蒙娜丽莎”笑出声 | 虚拟人直播不用愁:单图生成{喜怒哀乐},支持多人同屏不串戏。
打造一个有温度、有趣味、专业的全栈式AI&AIGC交流社区,用心写好每一篇文章!项目主页-https://fantasy-amap.github.io/fantasy-portrait/代码链接-https://github.com/Fantasy-AMAP/fantasy-portrait论文链接-https://arxiv.org/pdf/2507.12956为什么需要这个算法?--从静态图像中制作富有表现力的面部动画是一项具有挑战...
2025-07-21 07:45:00
海报生成可用率88% | 效果吊打GPT-4o:设计师提效N倍,DreamPoster令Canva王座不保!
打造一个有温度、有趣味、专业的全栈式AI&AIGC交流社区,用心写好每一篇文章!项目主页-https://dreamposter.github.io/体验链接-https://jimeng.jianying.com/ai-tool/home论文链接-https://arxiv.org/pdf/2507.04218为什么需要这个算法?--虽然当前已经有很多方法支持利用AIGC生成海报,Step1X Edit、SeedEdit1.6等模型强...
2025-07-16 07:50:00
「4K超分打工仔」4KAgent横扫26项SOTA | 通吃老照片、AIGC图、卫星图、医疗影像等!
打造一个有温度、有趣味、专业的全栈式AI&AIGC交流社区,用心写好每一篇文章!项目主页-https://4kagent.github.io/代码链接-https://github.com/taco-group/4KAgent/论文链接-https://arxiv.org/pdf/2507.07105为什么需要这个算法?--图像超分在现实场景有很多的实际应用价值,然而当前的开源的图像超分方案很少能够处理4K...
2025-07-14 07:45:00
全球首创“3D部件+整体”生成大一统 | 告别「整坨石膏」,双引擎造出可拆解{智能积木}!
打造一个有温度、有趣味、专业的全栈式AI&AIGC交流社区,用心写好每一篇文章!项目主页-https://omnipart.github.io/论文链接-https://arxiv.org/pdf/2507.06165体验链接-https://huggingface.co/spaces/omnipart/OmniPart为什么需要这个算法?--创建具有明确、可编辑零件结构的3D资产对于推进交互式应用程序至关重要,但大...
2025-07-10 07:45:00
单卡H100跑4B“流媒体视频模型”->16FPS运行速度+5分钟长视频+512*512分辨率!
打造一个有温度、有趣味、专业的全栈式AI&AIGC交流社区,用心写好每一篇文章!项目主页-https://cumulo-autumn.github.io/StreamDiT/论文链接-https://arxiv.org/pdf/2507.03745代码链接-未开源为什么需要这个算法?--虽然文生视频(T2V)任务取得了巨大进展,可以生成高质量的视频。然而,现有的模型通常只能离线生成...
2025-07-09 07:45:00
手机拍三张,重建“开放3D语义世界” | 单扩散模型生成RGB/法线/语义图,开放词汇“任意查”!
打造一个有温度、有趣味、专业的全栈式AI&AIGC交流社区,用心写好每一篇文章!项目主页-https://liuff19.github.io/LangScene-X/代码链接-https://github.com/liuff19/LangScene-X论文链接-https://arxiv.org/pdf/2507.02813为什么需要这个算法?--从2D图像中恢复具有开放词汇场景理解的3D结构是一项基本但艰巨的任务。最近...
2025-07-07 07:45:00
ICCV2025佳作 | 全球首个“长视频动漫”自动上色神器{燃爆国漫圈},一键统一500帧色彩风格!
打造一个有温度、有趣味、专业的全栈式AI&AIGC交流社区,用心写好每一篇文章!项目主页-https://cn-makers.github.io/long_animation_web/代码链接-https://github.com/CN-makers/LongAnimation论文链接-https://arxiv.org/pdf/2507.01945为什么需要这个算法?--动画自动上色是真实动画产业生产的重要组成部分。长动画着色...
2025-07-04 07:45:00