机智流 - 科技区角

谷歌Batch Normalization斩获ICML25时间检验奖, 2015已是10年前了

在风起云涌的人工智能领域，有些技术如流星般划过，而有些则像恒星一样，持续照亮着整个行业的发展。今天，让我们将时钟拨回到 2015 年，重温一项由谷歌的 Sergey Ioffe 和 Christian Szegedy 带来的、堪称深度学习“加速器”的革命性工作——Batch Normalization (BN)。这项工作不仅在当时横扫了 ImageNet 竞赛，更在近十年后...

2025-07-17 00:03:56

CVPR2025｜想让机器人像人类一样适应动态交通？纽约大学AI4CE组提出CityWalker，用海量视频优化实体城市导航

全文约 2600 字，预计阅读时间 7 分钟https://arxiv.org/abs/2411.17820一、研究背景：城市导航的现实困境与技术缺口（一）实际场景挑战在动态城市环境中，配送机器人、自动驾驶出租车等实体智能体的导航需同时具备空间推理能力（如路径规划、障碍物避让）与规则遵循能力（交通信号灯识别、社会规范适配）。然而，现有视...

2025-07-16 21:45:57

【AI Insight 第三期】Al For Science 专场直播，港大川大浙大等高校学者带来最前沿研究分享

AI 科学家时代正加速到来，但科研智能体真的做好准备了吗？真实科研场景中，多模态智能体能否在推理、规划与执行等关键能力上达到人类科研人员的水平？我们又该如何准确评估它们的科学认知能力和数据分析表现？为了解开这些谜题，由 OpenMMLab、司南评测体系、Hugging Face、ModelScope、知乎、MLNLP、北京超算、机智流、GD...

2025-07-16 15:10:52

UML和流程图被纳入评测！北航阿里MAP等联合推出M²Eval基准，革新多模态代码生成，让AI“看图编程”

本文由社区同学投稿，全文约 2400 字，预计阅读时间 7 分钟McEval Overview现有的代码生成模型大多仅能处理文本输入，忽略了在实际软件开发中至关重要的UML图和流程图等视觉设计，这限制了模型理解复杂系统架构和高级设计意图的能力。随着vibe coding的广泛普及以及Agent 代码能力增强，copilot和cursor等编程助手也开始将...

2025-07-15 23:45:48

Graphiti，为AI智能体构建实时知识图谱；HuggingFace推出开源机器人；OpenArt 上线「一键视频故事」功能

新闻资讯月之暗面开源万亿参数 MoE 模型 Kimi K2，性能领跑开源界Moonshot AI 发布 Kimi K2，这是一款采用混合专家（MoE）架构的开源模型，总参数 1 万亿，激活参数 32B，训练数据达 15.5 万亿 token。其训练过程通过 MuonClip 优化器实现稳定性突破，损失曲线零波动，在 SWE Bench、AceBench 等基准测试中超越 DeepSeek V3...

2025-07-15 23:45:48

突破传统交互！滑铁卢大学研发 NeuralOS，让神经网络能靠“画”模拟操作系统界面

全文约 3200 字，预计阅读时间 8 分钟与大语言模型（LLM）“聊天” 的感觉就像是在使用一台 80 年代的计算机终端。彼时图形用户界面（GUI）尚未发明，但它的一些特性已经可以开始被预测了。—— OpenAI 创始人之一，安德烈・卡帕西你有没有想过，未来的电脑界面可能不再是固定的代码编写，而是像 “画画” 一样，由 AI 根据你的操...

2025-07-14 23:42:05

刚刚，ICML 2025 杰出论文揭晓！万中选八，AI安全的头等大事竟然是...打工人的饭碗？

机器学习顶会 ICML 2025 杰出论文（Outstanding Paper）榜单火热出炉！今年，评审委员会从数万篇投稿中评选出了代表前沿思考与重大突破的8篇佳作。这些论文不仅在技术上精益求精，更在AI的社会影响、创造力边界和科研生态等宏大命题上给出了深刻洞见。它们是风向标，更是思想的催化剂。本文将为你逐一解读这8篇论文的精华，...

2025-07-14 21:54:54

ICML 2025 强化学习 RL 方向Oral论文盘点

作者：InternLM、Qwen 等 LLM本篇 ICML 2025 强化学习领域的Oral论文精选，涵盖了从基础理论到前沿应用的多个热门方向。这些研究共同推动着智能体向更强大、更安全、更协作的未来迈进。具体来看，这些论文可以归纳为以下几个细分领域：强化学习理论与算法：深入探索了强化学习的基础问题。例如，通过引入网络稀疏性来打破深...

2025-07-13 21:26:51

ICML 2025 多模态方向Oral论文盘点

作者：InternLM、Qwen 等 LLM引言：从“能看多模态”到“像人一样思考与感受”过去两年，多模态大模型（MLLM）在「看得懂」与「说得出」层面取得了令人惊叹的进展，但仍被三大难题卡脖子：知识瓶颈——幻觉严重，缺乏可检索、可验证的外部知识；推理瓶颈——跨模态深度推理薄弱，复杂数理与空间问题频频翻车；情感瓶颈——只能打“开心...

2025-07-12 22:05:34

HF 论文周报 | AI 内存 OS 登顶！英伟达发布长视频 RL 框架，LoRA 迎来新架构

本周热门看点：专为 AI 系统设计的内存操作系统 MemOS 霸榜；英伟达、MIT 联手推出 LongVILA-R1，将强化学习扩展到长视频推理；SingLoRA 仅用单个矩阵实现低秩适配，参数减半性能反超；T-LoRA 解决单图定制过拟合问题；更有关于“MLM 是否已死”的大规模研究。Hugging Face Paper 一周盘点（按投票数倒序）！精彩不容错过！(1...

2025-07-12 17:51:31