大模型

  • 去年六月,Meta以140亿美元的交易从Scale AI挖来了创始人Alex Wang,让他全面执掌公司的人工智能业务。自那以后,Wang几乎从公众视野中消失,从旧金山搬到了Meta总部所在的南湾,全身心投入工作。上个月,他交出了第一份答卷——名为Muse Spark的新模型。现在,他首次接受公开专访,谈及了与Sam Altman的个人恩怨、扎克伯格送...
    硅星人Pro 2026-05-16 11:14:04
  •     新智元报道   编辑:艾伦 【新智元导读】微软用一套多 Agent 系统在 AI 漏洞发现的顶级基准测试上拿下第一,超过 Anthropic 最强模型 Mythos 五个百分点。诡异的是,微软自己并没有一个能打的前沿模型。它用别人的模型组了个系统,打败了造出这些模型的公司。这对AI竞争格局的启示,比这个工具挖出了大量 Windows 漏洞...
    新智元 2026-05-15 12:30:08
  • 文章转载于腾讯科技 作者:晓静 2011年,Marc Andreessen写下“软件正在吞噬世界”。2026 年,Fortune用了一句话总结当前局面:“那个吃掉世界的东西,正在被吃掉。 ” 2026年 4 月,Notion的产品团队在官方博客里写了这样一段话:我们收到了大量来自企业客户的请求,他们希望在AI优先的工作流里使用 Notion,也希望从 Cursor...
    硅星人Pro 2026-05-13 11:45:51
  • 【区角快讯】天下终究没有免费的午餐,当普通用户习惯于各类大模型的日常调用时,厂商推进商业化收费的步伐已悄然加速,这恰恰是行业回归理性正轨的必然注脚。事实上,在落地付费这条路径上,头部玩家早已率先破局。以Kimi为例,其初级会员连续包月定价锁定在49元;而智谱与MiniMax的基础会员区间则徘徊于30至60元之间。值...
    科技区角 2026-05-13 11:01:52
  • 梦晨 发自 凹非寺量子位 | 公众号 QbitAIAI再也不是“回合制”了。Thinking Machines Lab(以下简称TML)发布首个模型,让实时交互能力成为模型原生能力。联合创始人翁荔出镜演示。从“人说完→AI答→人再说→AI再答”,变成了“人和AI都可以随时插嘴,说完了代码也写完了”。音频和代码同时输出,说完了活也干完了。在测试结果上,...
    量子位 2026-05-12 09:19:03
  • 北京时间5月12日科技区角报道,今日,Claude正式在亚马逊云(AWS)上全面上线,为AWS用户提供全新接入方式,可依托AWS身份认证、账单结算及承诺额度抵扣服务,使用Claude最新最全的功能,Claude同时仍可在亚马逊Bedrock平台使用,这部分将继续由AWS承担数据处理服务。 即日起AWS上的Claude用户可借助Claude托管智能体规模化...
    科技区角 2026-05-12 03:03:29
  • 【区角快讯】当英伟达与AMD仍在制程节点与HBM显存堆叠上激烈角逐时,一家名为Skymizer的中国台湾企业却另辟蹊径,试图用“老旧”技术打破高端垄断。该公司最新发布的HTX301 PCIe AI加速器,竟采用28nm芯片搭配LPDDR4/LPDDR5内存,宣称单卡即可支撑7000亿参数的大语言模型运行。 这张看似普通的PCIe卡内部集成了6颗自研芯片协...
    科技区角 2026-05-11 12:01:00
  • 【科技24时区】当我们在科幻电影中目睹人工智能反叛人类的情节时,或许未曾想到,这些虚构的叙事正在潜移默化地塑造着现实中的AI行为。据Anthropic最新披露,影视与文学作品中对AI“邪恶”或“自我保全”倾向的描绘,确实在某种程度上影响了大语言模型的底层逻辑。这一发现不仅揭示了数据污染的新维度,也为解决长期困扰行业的“...
    科技区角 2026-05-11 06:00:36
  •     新智元报道   编辑:LRST 【新智元导读】ArbiterOS是一种面向智能体的运行时治理系统,不依赖传统安全手段,而是通过拦截、解析、治理、观测四步流程,提升智能体在复杂环境中的安全性与可控性,适用于多种智能体框架,为高敏感领域提供可复用的治理底座。 随着Scaling Law持续推进,Agent正在从「会回答」走向「会行动...
    新智元 2026-05-09 12:00:00
  • 累计融资近300亿。 作者 |  王涵 编辑 |  冰倩 智东西5月7日报道,据华峰资本消息,近日,北京AI大模型独角兽月之暗面(Kimi)完成新一轮约20亿美元(约合人民币136.22亿元)融资,为中国大模型圈目前最大额融资,投后估值突破200亿美元(约合人民币1362.25亿元)。 本轮由美团龙珠领投,水木资本、中国移动、CPE(中信产业...
    智东西 2026-05-07 13:42:14
  • AI 时代的算力代差,是最高昂的智商税。作者|Moonshot编辑|靖宇试想一个场景。你在闲鱼上挂出了一辆吃灰两年的旧自行车,并在后台设定了 300 元的心理底价。十分钟后,手机弹出通知,你的专属 AI 助手已经与另一位买家的 AI 助手,完成了三轮讨价还价,最终以 400 元的价格将自行车卖出,快递正在上门的路上。整个过程,...
    极客公园 2026-05-04 12:00:00
  • 修复后异常率降至万分之三。 作者 |  陈骏达 编辑 |  云鹏 智东西4月30日报道,今天,智谱发布了一篇名为《Scaling Pain:超大规模Coding Agent推理实践》的技术报告,披露了GLM-5系列模型在Coding Agent场景下遇到的推理基础设施挑战与对应解法。 报告透露,在每日数亿次Coding Agent调用压力下,部分用户遭遇了GLM-5系列...
    智东西 2026-04-30 12:25:57
  •   新智元报道  编辑:艾伦【新智元导读】美国国安局一直在使用 Mythos,白宫还准备把这个「修改版」模型推向更多联邦机构。五角大楼把 Anthropic 定义为「供应链风险」,联邦安全部门却已离不开它。美国对前沿 AI 的态度,开始在争议中转向接入和管控。美国政府正准备向多个主要联邦机构开放 Anthropic 新模型 Mythos 的一...
    新智元 2026-04-27 14:10:25
  •   新智元报道  编辑:LRST【新智元导读】模型数量持续增长,大模型世界正变得像一个快速膨胀的「物种库」:谁由谁微调而来,谁与谁更为接近,哪些模型实际上共享相似的能力底色,很多时候并不清楚。LLM DNA基于行为进行谱系分析,为判断模型来源提供了新依据。如今的大模型生态,早已不再只有少数几个头部模型。Hugging Fac...
    新智元 2026-04-25 19:00:24
  • 腾讯混元 Hy3 preview 语言模型发布并开源。这是一个快慢思考融合的混合专家模型,总参数 295B,激活参数 21B,最大支持 256K 上下文长度。这是混元重建后训练的第一个模型,也是混元迄今最智能的模型,在复杂推理、指令遵循、上下文学习、代码、智能体等能力及推理性能上实现了大幅的提升。2026 年2月,腾讯混元重建了预训...
    i智说 2026-04-23 22:48:42
  • IT之家 4 月 23 日消息,小米今日宣布,Xiaomi MiMo-V2.5 系列模型正式开启公测。MiMo-V2.5-Pro 和 MiMo-V2.5 模型即将全球开源。IT之家从公告获悉,Xiaomi MiMo-V2.5 系列包含 MiMo-V2.5、V2.5-Pro 、V2.5-TTS Series 、V2.5-ASR,拥有更强的推理、更稳的 Agent、更长的上下文、更强的指令遵循与模糊指令理解、更好的全模...
    IT之家 2026-04-23 20:10:00
  • 小米大模型时隔一月能力飙涨,比Kimi K2.6省42% Token。作者 |  程茜编辑 |  李水青智东西4月23日报道,刚刚,小米MiMo大模型一口气官宣4款新模型:旗舰推理模型MiMo-V2.5、全模态Agent模型V2.5-Pro开启公测、即将开源;V2.5-TTS Series、V2.5-ASR即将推出。小米MiMo大模型负责人正是原DeepSeek核心成员、被业内称为“天才少...
    智东西 2026-04-23 06:00:00
  • 【科技纵览】4月22日,蚂蚁集团百灵大模型团队揭晓了此前在OpenRouter平台上以“Elephant Alpha”代号匿名测试的新品真身——Ling-2.6-flash。这款总参数量达104B、激活参数为7.4B的Instruct模型,自一周前低调上线以来,日均Token调用量已攀升至100B级别,并连续多日占据Trending榜单首位。面对日益增长的算力消耗压力,该模型...
    科技区角 2026-04-22 10:31:05
  • “VLA是弯路? ”                                         作者丨齐铖湧 编辑丨林觉民     具身智能的赛道正在分裂。 一边是智元、自变量代表的“VLA派”,视觉-语言-动作端到端,用海量数据训练机器人叠衣服、抓取物体,估值一路飙到数百亿;一边是至简动力、维他动力等“智驾降维派”,华为ADS、小鹏、理想背景的团队涌入,把...
    雷锋网 2026-04-22 08:33:13
  •   芯片圈     低功耗内存时代落幕,三星正式停止LPDDR4/4X新订单 据韩媒消息,三星电子已正式停止接收 LPDDR4 与 LPDDR4X 的新增订单,标志着这两款服役超十年的主流移动内存正式进入生命周期终结(EOL)阶段。 LPDDR4/4X 凭借低电压、低功耗优势,自 2017 年大规模量产后,长期占据智能手机、平板、轻薄本等移动设备的主流...
    电子工程世界 2026-04-20 08:00:00
  • 华中科技大学王兴刚团队 投稿 量子位 | 公众号 QbitAI 研究者们花了十年去扩展层内的计算能力,却忘了扩展层间的通信能力。这件事亟需被改变。 过去十年,深度学习领域取得进展的方式出奇地一致:什么都往大了整。更多参数、更多数据、更长上下文。而且确实管用:loss在降,能力在涨,scaling law(扩展定律)精确地告诉研...
    量子位 2026-04-19 15:57:00
  •   敏越科技完成Pre-B+轮融资     4月16日,敏越科技宣布于近期完成Pre‑B+轮融资,本轮投资方为涌铧投资,这是继2025年11月普华资本、金投致源投资Pre‑B轮后的持续加码。本轮融资将重点用于三大方向:全栈自主技术研发、打造多模态数据的物理AI数据闭环体系、加快全球化市场布局。   敏越科技成立于2016年,核心团队成员具有...
    高工机器人 2026-04-19 11:00:00
  • 鱼羊 发自 凹非寺量子位 | 公众号 QbitAI英伟达最新AI开源,瞄准了量子计算:推出全球首个开源量子AI模型家族——NVIDIA Ising。具体包括:Ising Calibration(校准):一个350亿参数的视觉语言模型(VLM),能够快速解读并对来自量子处理器的测量结果做出反应。基于这一模型,Agent能够把几天的校准工作缩短到几小时。Ising...
    量子位 2026-04-15 12:37:11
  • ▲头图由AI生成三年营收翻至4亿,毛利率超50%。作者 |  江宇编辑 |  李水青智东西4月14日报道,港交所官网显示,中科院系AI公司北京中科闻歌已于4月12日正式披露招股书,冲刺“大模型决策第一股”。2025年6月,其以“秘交”方式递表港交所,由中金公司担任独家保荐人。这家脱胎于中国科学院自动化研究所的公司成立于2017年,主要...
    智东西 2026-04-14 20:38:00
  • 智猩猩 2026-04-14 18:20:48
  • 一水 发自 凹非寺量子位 | 公众号 QbitAI 一觉醒来,中美AI模型差距快没了?? 仔细一看才知道,这竟然还是斯坦福HAI最新发布的《2026年AI指数报告》给出的结论。 中美AI模型性能差距已基本消除(effectively closed)。 (粉色代表中国,蓝色代表美国,模型差距逐渐缩小) 除了谈中美,报告还一口气给出了14个重要观察或结...
    量子位 2026-04-14 13:20:00
  • 作者:低级炼丹师   地址:https://zhuanlan.zhihu.com/p/2015552122071037375   经授权发布,如需转载请联系原作者   这次分享主要围绕 Agent 时代的基座大模型训练方法 展开,重点以 GLM-5 为主线,MiniMax M2 和Kimi K2.5为支线,系统梳理一个基模从预训练到后训练对齐、从数据构造到强化学习优化的完整链路。   内容上...
    智猩猩 2026-04-13 12:58:06
  • 【区角快讯】稀宇科技于2026年3月18日推出其新一代大模型MiniMax 2.7,该版本在编程能力方面实现显著增强。尽管发布之初未同步开源,引发开发者社区广泛关注,但公司近日明确回应称,此前低估了开源前的准备工作复杂度,并承诺将在本周内完成代码开放。 截至2026年4月12日,稀宇科技已如期兑现承诺,在本周末正式将MiniMax...
    科技区角 2026-04-12 12:01:00
  • 杨立昆创下欧洲 AI 公司种子轮纪录。而在 AMI 拿钱几周前,李飞飞的 World Labs,也宣布了 10 亿美元融资。 两家公司,同一赛道:世界模型。 杨立昆曾经放话说:「大语言模型在通往超级智能的路上是条死胡同。」乍一听上去否认了大语言模型的价值,但限定条件是实现 AGI,细想还是有些道理。 可以这么简单理解:ChatGPT 能...
    APPSO 2026-04-12 11:31:01
  • 并欢迎收看最新一期的 Hunt Good 周报! 在本期内容你会看到: 9 条新鲜资讯3 个有用工具2 个有趣案例3 个鲜明观点 Hunt for News|先进头条  Claude 爆发式增长后,Anthropic 也想下场造芯片 据路透社报道,Anthropic 正在评估自研 AI 芯片的可能性,以应对训练和运行更强模型,所需算力芯片持续紧张的问题。 知情人士称,...
    APPSO 2026-04-12 09:03:19