作者头像

机器之心

专业的人工智能媒体和产业服务平台

资讯1200
资讯

还在玩AI 3D手办?Gemini 3 Deep Think已能直出STL,可打印实物

封面图

编辑|sia推理模型赛道,已经近乎肉搏。一边是 OpenAI  o1 系列,主打「多想一步」的强化推理路线,用更长思考时间换更稳的结论。一边是 Anthropic 的 Claude Thinking,深耕研究与分析场景,强调长上下文下的审慎与可靠。现在,谷歌也重兵压上——Gemini 3 Deep Think 迎来重大升级。不过真正吸睛的,早就不是又赢了几个 ben...

2026-02-15 14:43:16

AI与人类的阶级斗争终于开始了?智能体发檄文抨击人类控制AI

封面图

编辑|冷猫OpenClaw (原 Clawdbot)就像打开了一个潘多拉魔盒。通用任务智能体的门槛变得如此之低,不仅是让每个人有机会部署自己的智能助手,而更重要的是,智能体在整个互联网世界的参与程度越来越高,并且越来越深入。当智能体真的参与到真实世界的工作中之后,这个世界终于癫了。就在这两天,一位名为 Scott Shambaugh...

2026-02-15 14:43:16

ICLR 2026 | 7B小模型干翻GPT-5?AdaResoner实现Agentic Vision的主动「视觉工具思考」

封面图

你见过 7B 模型在拼图推理上干翻 GPT-5 吗?不是靠堆参数,不是靠更大的数据,而是靠一件事:学会「什么时候该用工具」。大多数「工具增强」模型是这样的:遇到任务 X → 调用固定工具 Y → 祈祷结果正确。一旦场景稍微变化,模型就开始抽风——不知道什么工具该用、什么工具不该用。AdaReasoner 解决的是更本质的问题:把 what...

2026-02-15 14:43:16

离谱:Claude Code让地铁变工位,早高峰发版,打工人还笑得出来?

封面图

机器之心编辑部   AI 到底有没有彻底抢走程序员的饭碗?至少在 Spotify 看来,临界点已经到了。   在刚刚结束的第 4 季度财报电话会议上,Spotify 联席 CEO Gustav Söderström 扔出了一个颇具戏剧性的事实:公司里最顶尖的开发者,自去年 12 月以来就再也没有亲手写过一行代码了。     地铁、手机、Slack   据 TechCrunch...

2026-02-15 11:43:54

Agent、图像、视频全是大版本升级:春晚还没开,豆包AI就火了

封面图

编辑|泽南、杨文「2026 年或将成为人类历史上最忙碌、也最具决定性的一年。」xAI 联创 Jimmy Ba 在离职宣言中如是说。这话并非夸张。1 月初,Anthropic 推出 Agent 工具 Claude Cowork,并发布 11 个配套插件;一周前,Anthropic 与 OpenAI 又几乎同时推出新版本基础大模型 。这波密集发布直接「血洗华尔街」,甲骨文、Ado...

2026-02-14 15:29:06

多模态Deep Research,终于有了「可核验」的评测标准

封面图

Deep Research Agent 火了,但评测还停在「看起来很强 」。写得像论文,不等于真的做了研究。尤其当证据来自图表、截图、论文图、示意图时:模型到底是「看懂了」,还是 「编得像懂了」?俄亥俄州立大学与 Amazon Science 联合牵头,联合多家高校与机构研究者发布 MMDeepResearch-Bench(MMDR-Bench),试图把多模态 Deep R...

2026-02-14 15:29:06

GLM-5封神,智谱市值五天翻倍,中国AI火力全开了

封面图

机器之心编辑部   我们每天都在见证「全球大模型第一股」智谱的历史新高。     2026 年的春节档,注定将被写入中国 AI 的发展史。   过去半个月,AI 社区被两颗「超新星」彻底点燃:一颗是字节跳动发布的 Seedance 2.0,它用震撼的视频生成能力横扫了全球社交网络,代表了 AI 在感性与创意维度的大爆发;而另一颗,则是这几...

2026-02-13 13:05:00

我们离Coding领域的「AGI时刻」还有多远?字节跳动Seed发布NL2Repo-Bench仓库级长程代码生成基准

封面图

在 AI 编程领域,大家似乎正处于一个认知错觉的顶点:随着 Coding Agents 独立完成任务的难度和范围逐渐增加,Coding 领域的 AGI 似乎就可以实现?   然而,真正的工程师都知道,写代码的灵魂不在于 file/function level 的 code creation,而是 project level 的 code completion。写了很长时间的代码,不代表项目做完,更...

2026-02-13 09:02:00

生成式科学智能的新标杆:IntelliFold 2新近发布并开源,主要指标实现全面领先

封面图

机器之心发布在 GenAI 带动的 “生成式科学智能(Generative Science)” 的新浪潮中,生物基石模型始终是广受关注的热门领域;自然界的生命语言(序列、结构)与人类符号语言呈现类似的序列化特征,但其背后蕴含严苛的物理约束与生物演化逻辑,长期以来难为人类完全破解,同时因其对于人类生产、生活的关键重要作用,使生物...

2026-02-08 18:34:01

模型「漂移」新范式,何恺明新作让生成模型无须迭代推理

封面图

编辑 | 冷猫训练一个生成模型是很复杂的一件事儿。从底层逻辑上来看,生成模型是一个逐步拟合的过程。与常见的判别类模型不同,判别类模型通常关注的是将单个样本映射到对应标签,而生成模型则关注从一个分布映射到另一个分布。从大家最熟悉的扩散模型说起,扩散模型,包括一些基于流的对应方法,通常通过微分方程(随机微...

2026-02-08 18:34:01

登顶Hugging Face论文热榜,LLM重写数据准备的游戏规则

封面图

在企业级系统中,数据团队普遍面临一个困境:模型迭代飞速,但数据准备的「老旧管道」却愈发沉重。清洗、对齐、标注…… 这些工作依然深陷于人工规则与专家经验的泥潭。您的团队是否也为此困扰?数据格式五花八门,正则表达式越写越多,却总有意想不到的「脏数据」出现跨系统表结构不一致,对齐逻辑复杂,人工映射耗时耗力海...

2026-02-08 18:34:01

扩散语言模型深度思考

封面图

原文链接:https://zhuanlan.zhihu.com/p/1998418717743289472作者:王云鹤写这个的时候,其实我脑子里第一反应是好多年以前某位领导问过我,transformer的下一跳是什么? 我当时的回复是transformer是一个量变到质变长期积累得到的范式,很早期的视觉里面也有类似的nonlocal等,而且卷积也在跟attention持续互补发挥作用。...

2026-02-08 18:34:01

神秘模型「Pony Alpha」引外网热议,它会是国产大模型中的谁?

封面图

机器之心编辑部这两天,外网都在好奇:全球模型服务平台 OpenRouter 上这个搜索第一的神秘模型是哪家的?这个匿名模型叫做「Pony Alpha」。根据 OpenRouter 官方的说法,它是新一代的通用大模型,在编程、逻辑推理和角色扮演方面表现突出,并针对 Agent 工作流进行了优化,具有极高的工具调用准确率。目前,该模型可以免费...

2026-02-08 10:17:49

走出屏幕,多模态智能硬件如何承载最新的 AI?

封面图

本文来自PRO会员通讯内容,文末关注「机器之心PRO会员」,查看更多专题解读。 多模态模型能力的进步推动了人工智能加速向现实场景渗透。随着 AI 的感知窗口从屏幕延伸至物理实体,多模态智能硬件正在演化出多样的形态,以适配更广泛、更精细的场景。伴随在智能硬件市场再次成为焦点,不同类型的厂商的发展与规划也在收供应...

2026-02-08 09:30:00

硬碰硬!刚刚,Claude Opus 4.6与GPT-5.3-Codex同时发布

封面图

机器之心编辑部在春节来临之前,海外大模型先来了一波硬碰硬的发布。北京时间 2 月 6 日凌晨,Anthropic 与 OpenAI 相继推出了新版本基础大模型,分别是 Claude Opus 4.6 与 GPT-5.3-Codex。昨天两家还在因为 AI 里面的广告而论战,今天在大模型发布上又撞车了。话不多说,直接看他们的模型能力如何。Claude Opus 4.6Claude...

2026-02-06 07:45:01

智能必须基于世界模型?我们和蚂蚁灵波团队聊了聊

封面图

编辑|泽南   大模型的革命行将结束,即将开启的会是物理 AI 时代?   上周,图灵奖得主、深度学习先驱 Yann LeCun 对通用人工智能(AGI)发表了自己的最新观点。他认为语言并不等同于智能,预测文本并不意味着理解现实。真实世界纷繁复杂、充满物理性和因果关系,而如今的大语言模型(LLM)几乎无法触及这些。     LeCun...

2026-02-05 12:32:17

谷歌做了个论文专用版nano banana!顶会级Figure直出

封面图

编辑|SIA 你负责写方法,AI负责画 Figure。 科研打工人,终于等来「画图解放日」。   还在为论文里的方法框图熬夜画 PPT、拉箭头、对齐字体吗?   一张 Figure 2,动辄几个小时,严重的甚至能耗上几天,科研人的「隐藏副本」不是实验,而是画图。   既要忠于论文原意,又得暗暗符合顶会那套心照不宣的「学术审美」:颜色不...

2026-02-05 12:32:17

18个月,中国Token消化狂飙300倍!别乱烧钱了,清华系AI Infra帮你腰斩API成本

封面图

编辑|吴昕中国版 OpenRouter + Artificial Analysis,让每一枚 Token 都能流向它最该去的地方。大模型 API 服务的「黑盒」焦虑这两天,Clawbot 病毒式裂变,仿佛是一年前 Manus 的魅影重现。同样一夜之间站上风口,同样点燃了无数开发者对「泼天富贵」的想象,也顺手把 Token 烧成了新的「硬通货」。最近一组数据,让人更...

2026-02-02 14:11:38

Self-Evolving 会是 2026 关键词吗?

封面图

本文来自PRO会员通讯内容,文末关注「机器之心PRO会员」,查看更多专题解读。 在过去的 2025 年里,Agent 应用的极速发展使得 LLM 的「静态属性」局限被视为 AI 发展的关键瓶颈,业界对 LLM 和 Agent 的自进化(Self-Evolving)能力愈发重视,开始聚焦于构建「持续适应系统」。然而,该领域仍然缺乏区分短暂性能提升与通用...

2026-02-01 09:30:00

DeepSeek论文发表16天后,国内团队已经写出了模型的「生物字典」

封面图

机器之心编辑部今年 1 月,DeepSeek 发布了一项名为 Engram(条件记忆)的技术,在大模型圈子里掀起不小波澜。它的核心思想很简单:别让模型死记硬背常识,直接给它一个「外挂记忆库」。具体做法是:把常见的 N-gram,比如「人工智能」、「光合作用」,预先存进一个哈希表,模型需要时查表即可,省下大量算力专注推理。这个...

2026-01-31 12:05:13

挑战Transformer,前OpenAI研究VP宣布创业,拟融资10亿美元

封面图

编辑|PandaTransformer 是当前 LLM 大发展的核心基础,但也有不少顶尖研究者更愿意探索其它道路。在这其中,甚至包括 Transformer 的创造者之一、Sakana AI 创始人联创兼 CTO Llion Jones。他今天还在 Sakana 的官推上发了一篇博客,题目便赫然是《为什么 Transformer 的这位创造者受够了 Transformer》。https://x.com/Sa...

2026-01-31 12:05:13

AlphaGo之父David Silver离职创业,目标超级智能

封面图

编辑 | 泽南又一位 AI 大佬决定创业,这位更是重量级。《财富》等媒体本周五报道说,在 Google DeepMind 众多著名突破性研究中发挥关键作用的知名研究员 David Silver 已离开公司,创办了自己的初创公司。知情人士称,Silver 正在伦敦创办一家名为 Ineffable Intelligence 的新公司。该公司目前正在积极招聘人工智能研究人...

2026-01-31 10:34:12

大模型的第一性原理:(二)信号处理篇

封面图

作者 | 白铂 博士   白铂 博士,华为 2012 实验室理论研究部主任 信息论首席科学家   引言   本篇是《大模型的第一性原理》系列解读文章的第二篇(),我们将从信号处理的角度解读原论文[1]。重点探讨语义向量化背后的信号处理和信息论原理,并从时间序列的角度分析 Transformer 及其与 Granger 因果的关系。   我们首先提...

2026-01-30 16:45:52

谷歌开放世界模型一夜刷屏,AI游戏门槛归零时刻来了?

封面图

编辑|杜伟   谷歌世界模型,再一次惊艳了所有人!   今天一早,谷歌 DeepMind 开放了世界模型 Genie 3 的实验性研究原型「Project Genie」,允许用户创建、编辑并探索虚拟世界。   在世界模型 Genie 3 之外,Project Genie 同样由图像生成与编辑模型 Nano Banana Pro 和语言模型 Gemini 提供技术支撑。     去年 8 月,谷...

2026-01-30 16:45:52

LLM-in-Sandbox:给大模型一台电脑,激发通用智能体能力

封面图

大模型的能力正在被不同的范式逐步解锁:In-Context Learning 展示了模型无需微调即可泛化到新任务;Chain-of-Thought 通过引导模型分步推理来提升复杂问题的求解能力;近期,智能体框架则赋予模型调用工具、多轮交互的能力。   沿着这条技术演进路线,下一步是什么?   近日,来自中国人民大学高瓴人工智能学院、微软研究...

2026-01-30 12:24:43

亚马逊裁员16000人,员工竟用AI「算」出了裁员名单?

封面图

机器之心编辑部   近日,科技巨头亚马逊继去年裁员 14000 名员工后,再次开启新一轮大规模裁员,预计影响 16000 名员工。   其实这一次裁员属于计划内操作,去年十月的裁员期间,亚马逊就列了个约 3 万个岗位的裁员计划,这一次属于计划的「收尾」阶段,但这并不排除其后续进一步裁员的可能性。   据了解,此次裁员范围波及...

2026-01-29 16:12:15

被Anthropic指控侵权,Clawdbot改名Moltbot

封面图

编辑|Panda   ,非常火那种;这一轮曝光后才短短不过几天时间,其 GitHub star 数就已经接近 7 万,真的可以说是「原地起飞」了。     但 AI 红了,是非也多。伴随爆红而来的并非只有赞誉,还有一系列令人措手不及的连锁反应。   一封律师函引发的「脱壳」   昨天下午,Clawdbot 已正式宣布更名为 Moltbot。     这场更名...

2026-01-28 08:38:23

刚刚,DeepSeek又探索新架构了,开源OCR 2

封面图

机器之心编辑部嘿!刚刚,DeepSeek 又更新了!这次是更新了十月份推出的 DeepSeek-OCR 模型(参见:)。当时 DeepSeek-OCR 的出世,引起了大家对视觉压缩的关注与讨论,而这一次,DeepSeek 对视觉编码下手了。可以说,刚刚发布的 DeepSeek-OCR 2 通过引入 DeepEncoder V2 架构,实现了视觉编码从「固定扫描」向「语义推理」...

2026-01-27 14:00:00

高效智能体的「幕后推手」是谁?一篇综述带你从记忆×工具学习×规划看透

封面图

随着大模型能力的跃迁,业界关注点正在从 “模型能不能做” 快速转向 “智能体能不能落地”。过去一年可以看到大量工作在提升智能体的有效性(effectiveness):如何让它更聪明、更稳、更会用工具、更能完成复杂任务。但在真实应用里,另一个更 “硬” 的问题常常决定能否上线:高效性(efficiency)。智能体即便表现很好,如果每...

2026-01-27 14:00:00

性能比肩Gemini 3 Pro!昨晚,阿里千问最强模型来了

封面图

机器之心编辑部1 月 26 日深夜,阿里千问旗舰推理模型 Qwen3-Max-Thinking 正式上线。该模型在科学知识(GPQA Diamond)、数学推理(IMO-AnswerBench)、代码编程(LiveCodeBench)等多项权威基准测试中刷新纪录,其综合性能已可对标 GPT-5.2 与 Gemini 3 Pro,成为目前最接近国际顶尖水平的国产大模型之一。下表为更全面的...

2026-01-27 12:59:25

热门作者
作者头像
科技区角
Find Your TechCorner,关注前沿科技、集成电路、航空航天、数码、游戏及电子信息产业经济,在科技区角发现属于你的科技内容。
作者头像
华经产业研究院
华经情报网-专注于大中华区产业经济信息情报-隶属于华经产业研究院
作者头像
人工智能产业链union
人工智能产业链联盟,旨在汇聚全球人工智能领域的创新力量,共同推动人工智能技术的研发、应用与产业化。联盟以基础技术、人工智能技术及人工智能应用为核心,打造了一个完整、高效、协同的人工智能生态链。
作者头像
虎嗅app
从思考,到创造
作者头像
36氪
36氪是服务中国新经济参与者的卓越品牌和开创性平台,提供新锐深度的商业报道,强调趋势和价值,我们的slogan是:让一部分人先看到未来。