ASO

  • 本文来自PRO会员通讯内容,文末关注「机器之心PRO会员」,查看更多专题解读。引言:在业内关于智能体自进化的探讨中,记忆系统的相关改进使智能体能够在任务间积累经验、复用推理,从而呈现出持续成长的特征。但是记忆并非自进化的全部,随着研究者在智能体元认知、自我诊断和架构重构等方向有了进一步思考,智能体自进化开...
    机器之心 2025-10-25 10:30:00
  • 作者 | 论文团队编辑 | ScienceAI面对多模态、跨尺度、强约束的科研问题,通用 LLM 正从「工具」升级为「合作者」。来自上海人工智能实验室等机构的研究团队提出了一款为科学数据「读 — 思 — 设」而生的统一科学基座模型:以更完整的科学数据基座、更系统的训练日程与更可验证的推理机制,直击科学计算与设计痛点。论文:ht...
    ScienceAI 2025-10-08 12:25:37
  • 论文题目:Think Only When You Need with Large Hybrid-Reasoning Models论文地址:https://arxiv.org/pdf/2505.14631创新点LHRMs是首个能够根据用户查询的上下文信息自适应决定是否进行推理思考的模型。这种模型能够动态地选择是否启用扩展的思考过程,从而在推理能力和计算效率之间取得平衡。HAcc用于量化评估模型在混合...
    学姐带你玩AI 2025-09-29 18:10:00
  • 面对多模态、跨尺度、强约束的科研问题,通用 LLM 正从“工具”升级为“合作者”。我们带来了一款为科学数据“读—思—设”而生的统一科学基座模型:以更完整的科学数据基座、更系统的训练日程与更可验证的推理机制,直击科学计算与设计痛点。它有三点最值得关注——覆盖更广:统一 I/O 与“任务分组奖励”让单一骨干跨化学/生命/材料等...
    大模型之心Tech 2025-09-29 08:00:00
  •   本文由 Intern-S1 等 AI 生成,机智流编辑部校对 (1) SciReasoner: Laying the Scientific Reasoning Ground Across Disciplines 论文简介: 由上海人工智能实验室等机构提出的SciReasoner是一种科学推理基础模型,该工作通过将自然语言与异构科学表示对齐,构建了覆盖103个跨学科任务的统一框架。模型基于2060亿token的...
    机智流 2025-09-26 20:30:00
  • 本文第一作者谢之非,共同第一作者马子阳皆是来自于南洋理工大学的博士生。通讯作者为新加坡国立大学特聘教授颜水成和南洋理工大学数据与科学系校长讲席教授苗春燕。共同作者为腾讯AI首席专家叶德珩和新加坡国立大学博士后研究员廖越。两千多年前,孔子说过「三思而后行」。这句古老箴言,其实点出了人类面对复杂问题的核心...
    机器之心 2025-09-20 12:34:25
  • 它像一个“全家桶”,打包提供了高质量的数据、统一的评测基准和强大的基础模型。作者丨北京深度逻辑科技                                                                                         你是否想过,未来的智能音箱或手机语音助手,不仅能准确识别你的每一句话,还能听出你语气中的疲惫、兴奋或是焦虑?在你口...
    AI科技评论 2025-09-18 14:02:24
  • 在大型语言模型(LLM)的浪潮下,多模态 AI 取得了飞速发展,尤其是在视觉语言(LVLM)领域,已经形成了成熟的研究范式。然而,与之形成鲜明对比的是,大型语音语言模型(LSLM)的发展却显得零散且步调缓慢。该领域长期被碎片化的架构、不透明的训练数据和缺失的评估标准所困扰,导致研究之间难以进行公平比较,严重阻碍了...
    机器之心 2025-09-14 13:13:34
  • 点击下方卡片,关注“大模型之心Tech”公众号戳我 -> 领取大模型巨卷干货    本文只做学术分享,如有侵权,联系删文检索增强生成(Retrieval-Augmented Generation, RAG)通过注入外部知识提升了大语言模型的事实性,但在需要多步推理的问题上表现欠佳;反之,纯推理导向的方法则常出现生成幻觉内容(hallucination)或事实依...
    大模型之心Tech 2025-09-06 17:30:00
  • 机器之心发布机器之心编辑部人工智能的浪潮正将我们推向一个由 RAG 和 AI Agent 定义的新时代。然而,要让这些智能体真正「智能」,而非仅仅是信息的搬运工,就必须攻克一个横亘在所有顶尖团队面前的核心难题。这个难题,就是推理密集型信息检索(Reasoning-Intensive IR)。它不仅是当前 RAG 和 AI Agent 技术发展的关键瓶...
    机器之心 2025-08-27 14:23:41
  • 本文收录8月26日Hugging Face Daily Paper,解读由 Intern-S1、Qwen3 等 AI 生成可能有误。(1) InternVL3.5: Advancing Open-Source Multimodal Models in Versatility,   Reasoning, and Efficiency论文来源:hfHugging Face 投票数:110论文链接:https://hf.co/papers/2508.18265PaperScope.ai 解读:https://paperscope...
    机智流 2025-08-27 07:53:03
  • 在大语言模型的竞争中,数学与代码推理能力已经成为最硬核的“分水岭”。从 OpenAI 最早将 RLHF 引入大模型训练,到 DeepSeek 提出 GRPO 算法,我们见证了强化学习在推理模型领域的巨大潜力。然而,想要复现这些顶尖成果,并不只是“多喂点数据、跑几轮训练”这么简单。现实是,很多中小规模的开源推理模型,在 AIME 这样的高难...
    AI前线 2025-08-22 14:05:00
  • 本文的第一作者是刘文涵,就读于中国人民大学高瓴人工智能学院,博士三年级,导师为窦志成教授,目前在百度大搜部门进行实习。他的研究方向聚焦于 AI 搜索,在顶级国际会议如 ACL、WWW 等发表了多篇论文。推理大模型(Large Reasoning Model)极大的促进了自然语言处理领域的发展,而信息检索领域的核心问题之一是文档排序...
    机器之心 2025-08-21 12:11:41
  • 本文收录了8 月 12 日 Hugging Face  Daily Paper 26 篇论文由点赞数倒叙排序,由解读内容 Intern-S1、Qwen3 等 AI 生成可能有误。(1) ReasonRank:赋予段落排序强大的推理能力!(80 票)论文原始英文标题:ReasonRank: Empowering Passage Ranking with Strong Reasoning Ability论文链接:https://huggingface.co/papers...
    机智流 2025-08-12 22:47:45
  • 作者 | AIGC面面观 原文链接:RAG-Reasoning系统综述点击下方卡片,关注“大模型之心Tech”公众号戳我-> 领取大模型巨卷干货>>点击进入→大模型没那么大Tech技术交流群本文只做学术分享,如有侵权,联系删文,自动驾驶课程学习与技术交流群事宜,也欢迎添加小助理微信AIDriver004做进一步咨询RAG-Reasoning演变路线1. 背景与挑...
    大模型之心Tech 2025-07-20 08:00:00
  •   新智元报道  编辑:KingHZ【新智元导读】又有核心员工跑了!这次OpenAI痛失思维链之父Jason Wei。扎克伯格,王者回归,160亿美元拿下「AI铁王座」!突发新闻:核心科学家Jason Wei将离开OpenAI加入Meta,Hyung Won Chung可能也已离职。其中两人均是核心人物,贡献重大:Jason Wei(下图左):Scaling  Law联合作者及智能...
    新智元 2025-07-16 14:00:11
  • 本文源自 OpenAI 研究员 Jason Wei 的一篇随笔。作为思维链 (CoT)的作者,他从自己深耕的强化学习领域,巧妙地引申出关于个人成长的深刻洞见。过去一年,我痴迷于强化学习,几乎所有醒着的时间都在思考它。这竟无意中,让我悟出了一个关于人生的深刻道理。强化学习中有一个核心理念叫同策略学习(on-policy):相较于模仿他...
    智能情报所 2025-07-16 13:22:56
  • 克雷西 时令 发自 凹非寺量子位 | 公众号 QbitAI这次是真真真挖到OpenAI大动脉了。Jason Wei,思维链的提出者、o1系列模型的关键人物,被曝也被扎克伯格请走,即将入职Meta。消息最早由《连线》杂志Kylie曝光,得到了消息人士证实。Kylie还表示,Jason Wei的Slack账号(OpenAI的企业微信)已经被停用,一同被停用的还有o1的...
    量子位 2025-07-16 12:21:46
  • 机器之心报道机器之心编辑部Meta 针对 OpenAI 的挖人竟然还在继续!这或许是目前为止,扎克伯格挖走的最强技术人才。就在刚刚,外媒 Wired 的一位资深 AI 领域记者爆料称,「多个消息源证实,OpenAI 知名研究员 Jason Wei 和另一位研究科学家 Hyung Won Chung 将双双离职,投奔 Meta。」并且,他们二人的 Slack 账号已经被...
    机器之心 2025-07-16 10:22:26
  • 论文题目:Reward Reasoning Models论文地址:https://arxiv.org/pdf/2505.14674代码地址:https://thegenerality.com/agi/创新点与传统奖励模型直接输出标量分数不同,RRMs 在生成最终奖励前会先进行逐步推理,通过链式思考(chain-of-thought)过程,使模型能够更深入地理解问题和回答的内容,从而提高奖励判断的准确性。...
    学姐带你玩AI 2025-07-03 18:08:00