作者头像

AI大模型前沿

关注我,关注Ai大模型的全部信息!

资讯41
资讯

一文看懂!大模型领域近期进展!

封面图

本文深入探究了自2023年GPT - 4发布以来,大型语言模型(LLM)领域的发展趋向及其技术演进路径。一、始于2023年的GPT - 41.1 2023年基线:GPT - 4范式2023年初,LLM领域的发展遵循着一条清晰且强劲的轨迹,彼时规模决定能力,当年的热门术语便是“Scaling Laws”,即更大的参数、更多的计算量以及更庞大的数据规模。这一理念...

2025-10-28 19:26:00

复旦教授眼里的多模态大模型研究热点!idea满满

封面图

点击蓝字  关注我们从 CVPR、ICLR 到 AAAI,2025 年顶会趋势已清晰释放信号:多模态大模型领域正迈入新一轮技术爆发期。作为当前技术核心,多模态大型语言模型(MLLMs)并非单一模态的升级,而是将大型语言模型的自然语言处理能力,与视觉、音频等多模态数据的理解、生成能力深度融合。我们整理了80篇2025最新多模态大模型...

2025-10-25 12:00:00

火爆全网!重磅《LLM书》,开源!

封面图

时隔数月,业内翘首以盼的LLM大模型系统学习资源终于重磅发布!这几本被誉为"大模型领域圣经"的资料集,已经帮助数千名开发者成功转型,斩获高薪offer。想搭上这波风口却没方向?其实已发顶会的大佬早有捷径,都在啃这几本豆瓣9.8分的大模型经典书籍,从原理到应用讲得透透的,不少人看完:“SCI一区好像没那么难了...?”为...

2025-10-23 12:00:00

通俗介绍大模型,从RNN 到Transformer

封面图

今天,我们来看看RNN、Encoder技术最终累积导向的成果:LLM(Large Language Model)大型语言模型。从RNN 到Transformer这边稍微回顾一下前几天讲过的深度学习模型架构:RNN(Recurrent Neural Network)特点:逐步处理序列资料问题:长距离的文字关系比较难捕捉、训练时间比较长Encoder–Decoder 架构应用:翻译、摘要等序...

2025-10-17 20:00:00

又水了一篇顶会!不知道博士咋毕业的,来看看我咋水的..

封面图

“十月开始了,你的论文和科研项目都步入正轨了吗?最近很多同学和我们聊起——“科研越做越焦虑,论文越写越没底”:想发SCI/CCF高水平论文,每天读文献、找idea、跑实验,花那么多时间,却还是推进缓慢;导师太忙,基本“放养”;课题老旧,创新点难挖;身边人好像都走在前面,自己却越来越迷茫……这可能是很多人真实在状态。据统...

2025-10-14 11:30:00

牛!大模型的9大核心技术解析!

封面图

今天我们来系统梳理AI智能体架构设计的九大核心技术,这些技术构成了现代AI应用开发的核心框架,涵盖从基础推理到多智能体协作、从数据处理到人机交互的关键层面。欢迎各位指正交流。一、AI 智能体(AI Agent)AI智能体是一种具备自主意识的软件实体,能够感知环境、进行推理与决策,并执行相应动作。其核心架构包括以下组...

2025-10-13 20:57:00

太强了!科研的5大AI模型

封面图

今年,国际顶级学术期刊《Nature》发布了一篇题为《What are the best AI tools for research?》的深度评测报告,报告深入剖析了当前科研领域最受瞩目的五款 AI 模型。链接:https://www.nature.com/articles/d41586-025-00437-0这份报告不仅涵盖了从开源到闭源的多种模型类型,也囊括了通用型和专业型 AI 工具,并针对不...

2025-10-10 21:13:00

最近,大模型的招聘市场已经疯掉了。。。

封面图

更新了!OpenAI正式发布大模型GPT-5!!大模型测评网站Artificial Analysis数据显示,目前GPT-5已经超过Grok4排在第一!在开源模型榜中,目前排名前十的有六个是国产大模型!如今GPT、DeepSeek持续火爆,很多公司一口气推出十多个AI产品,抓紧布局AI。AI火爆的同时,也掀起新一轮AI人才争夺战!目前,已有超过 1000家公司发...

2025-10-09 12:00:00

刚刚,DeepSeek更新!

封面图

DeepSeek-V3.1 现已正式升级为 DeepSeek-V3.1-Terminus 版本。本次更新在完全保留模型原有强大能力的基础上,针对用户反馈集中优化了以下核心体验:1.语言表达更规范一致:显著缓解了中英文混杂问题,大幅减少输出中的偶发异常字符,内容生成更加自然流畅。2.智能体(Agent)能力提升:对代码智能体(Code Agent)和搜索智...

2025-09-22 21:59:38

图解AI大模型核心技术!

封面图

一、大模型中的Transformer与混合专家(MoE)1. Transformer核心结构:基于自注意力机制(Self-Attention),并行处理序列数据,解决长距离依赖问题。关键组件:多头注意力(Multi-Head Attention)、前馈网络(FFN)、层归一化(LayerNorm)和残差连接。优势:高效并行训练,适合大规模预训练(如GPT、BERT)。2. 混合专家...

2025-09-17 20:15:00

听劝!今年的风口一定是LLM Agent

封面图

介绍《AI Agents》系统介绍了AI智能体的核心概念、架构设计与应用实践。全书通过丰富的示意图与案例,生动解析智能体如何感知、决策与交互,覆盖从基础模型到多智能体协作的前沿进展。无论是初学者还是开发者,都能通过本书快速理解智能体的运作机制与未来潜力,探索人工智能的下一波浪潮。主要内容这本《AI Agents》指南详...

2025-09-16 12:00:00

30家单位已加入!全国首部AI大模型私有化部署标准起草名录更新

封面图

来源 | 智合标准化建设作者 | 智合标准中心近期,AI领域政策频出,为行业发展注入强劲动力。7月31日,国务院常务会议审议通过《关于深入实施“人工智能+”行动的意见》,明确要大力推进人工智能规模化商业化应用,强化算力、算法和数据供给,提升安全能力水平。在此背景下,企业对人工智能的应用需求持续攀升,出于数据安全、...

2025-09-15 20:18:02

重要突破!全球首个类脑脉冲大模型来了

封面图

近日,中国科学院自动化研究所李国齐、徐波团队在发表原创内生复杂性理论系列论文的工作基础上,与沐曦MetaX合作,打造了类脑脉冲大模型“瞬悉1.0”(SpikingBrain-1.0),在国产千卡GPU算力平台上完成全流程训练和推理,实现了大模型在超长序列推理上数量级的效率和速度提升,展示了构建国产自主可控的新型非Transformer大模...

2025-09-11 21:04:00

重磅!《LLM书》开源

封面图

大模型可太火了吧!已发顶会顶刊的大佬们都在偷偷啃这10本大模型书,几乎把大模型讲得透透的,本人已熬夜翻烂,看完瞬间对大模型的兴趣达到100000000000%,感觉SCI一区都不难了!!豆瓣评分9.8,友好程度感动到哭!AI大佬吴恩达强推,为了让更多小伙伴系统掌握从大模型原理到应用开发的完整知识体系,拿下顶会顶刊,我整理...

2025-09-10 12:00:00

牛!大模型领域最具影响力的TOP10论文!

封面图

回顾 LLM 的发展历程:自 2017 年 Transformer 架构问世以来,我们见证了 GPT 系列的一路高歌猛进,以及多模态能力和端侧应用的全面开花。整个领域正以前所未有的速度演进。要深入理解这场变革的本质,我们需要回到技术的源头。那些奠定今天 AI 能力的关键论文,不仅记录着算法的演进轨迹,更揭示了从传统编程到自然语言交...

2025-09-04 22:00:00

全国首部AI智能体应用评估标准,现公开征集起草单位和个人!

封面图

来源 | 智合标准化建设作者 | 智合标准中心2025年已成为AI智能体元年!8月,国务院发布了《关于深入实施“人工智能+”行动的意见》,明确提出到2030年实现“智能体等应用普及率超90%”的目标。同时,AI智能体正以前所未有的速度走向产业核心,据中商产业研究院发布的数据,目前全球AI智能体市场规模迎来爆发式增长,2025年全球A...

2025-09-02 12:00:00

重磅出炉!2025 AI百人榜、AI产品TOP100

封面图

一、时代2025 AI百人榜出炉:任正非、梁文锋、王兴兴、彭军、薛澜等入围刚刚,《时代》周刊发布了 2025 年度 AI 领域最具影响力的 100 人名单。在这份名单中,我们看到了很多熟悉的学者和企业家。令人惊喜的是,今年出现了更多的华人面孔,并且有许多是第一次登上 AI 领域的榜单。此次登榜的有大家耳熟能详的 AI 领军人物:...

2025-08-29 15:36:14

2025年,中国人工智能各类别最全排名

封面图

根据《2025中国生成式AI服务TOP100》 人工智能备案应用破300款:北京、上海、广东占71%创新高地 核心产业规模逼近6000亿:芯片→模型→应用全链自主化 用户规模达2.49亿:DeepSeek、腾讯元宝、通义千问等头部玩家推动普惠化落地1. 基础层:国产算力底座崛起,德本咨询《2025中国人工智能分类排行》首次纳入AI芯片、服务器等30...

2025-08-26 20:50:00

2025年,大模型仍是顶流!

封面图

当全球开发者还在为‘千亿参数’惊叹时,2025年的大模型已悄然进入‘万亿时代’——然而大模型这场‘智力军备竞赛’远未结束,反而在Agent爆发、端侧轻量化、多模态融合等方向加速内卷。今天,我们从180篇大模型论文出发,拆解2025年大模型!扫码回复【180大模型】免费领取论文合集+书籍1.BOND: Aligning LLMs with Best-of-N Disti...

2025-08-19 12:00:00

30余家单位确认加入,国内首部AI数据标注标准欢迎参与起草!

封面图

来源 | 智合标准化建设作者 | 智合标准中心数据标注作为驱动AI模型进化的必备环节,对于AI产业发展至关重要。2025年初,国家发展改革委等部门发布《关于促进数据标注产业高质量发展的实施意见》,为促进产业发展指明方向。然而,行业长期存在的数据来源模糊、标注质量失控、隐私泄露、敏感信息不当处理等合规问题日渐突出。...

2025-08-13 12:00:00

3万字长文!深度解析大语言模型LLM原理

封面图

大语言模型LLM的精妙之处在于很好地利用数学解决了工业场景的问题,笔者基于过往工程经验继续追本溯源,与腾讯学堂合作撰写本文,尝试让鹅厂小伙伴人人都能懂大语言模型的基础原理。1、大语言模型简述截止到2025年“大模型”一般泛指“超大参数模型”,参数是指深度神经网络里面“神经元数量、层数、神经元权重、神经元偏移量、...

2025-08-11 21:28:00

GPT-5终于发布!最强编程大模型

封面图

全世界等了2年,GPT-5终于正式发布!面向所有人开放,免费用户立即可用。这意味着,所有人现在都能用上“博士生水平的AI”。跟 GPT-4o 的实时多模态体验不同,这次硬件、功能、交互统统缺席;唯有榜单。一口气出了 25 个榜单成绩单。GPT-5 核心榜单速览这次特别还新增了几个新的榜单:HealthBench:OpenAI 2025 年新建的真实...

2025-08-08 08:31:07

全网评测,GPT登顶开源第一!

封面图

全网开扒GPT-oss,惊喜发现……奥特曼还是谦虚了,这性能岂止是o4-mini的水平,直接SOTA击穿一众开源模型。不仅轻松通过多项性能测试,网友也整起了各种花活:论文解读、整理数据,甚至造出类似于Grok 4 Heavy的GPT-oss Pro版。背后架构也是被大佬们挖掘得明明白白,只能说开源真妙哇!终于理解奥特曼提前预告的那句话是啥意...

2025-08-07 09:18:40

吐血整理!700篇大模型论文......

封面图

北航计算机硕士,收到3份大模型offer,薪资86~94W...?家人们,大模型方向这么火爆的吗?是真的,不少人还说这个薪资肯定少了……具备大模型技术的专业人才在市场上稀缺的狠,人手几个SCI一区二区,确实极具竞争力的!为了让更多小伙伴系统掌握从大模型原理到应用开发的完整知识体系,拿下顶会顶刊,我整理了该领域完整的相关...

2025-08-06 12:00:00

7步解锁大模型!被传疯的 AI Agent 实操指南

封面图

介绍《动手做AI Agent》这本书深入探讨了人工智能时代新兴的技术——AI Agent,即人工智能体。AI Agent能够理解自然语言、生成回复并执行具体行动,它不仅是内容生成工具,也是连接复杂任务的关键纽带。该书适合对Agent技术感兴趣或致力于该领域的研究人员、开发人员、产品经理、企业负责人,以及高等院校相关专业师生等阅读...

2025-08-05 12:00:00

GPT-5,终于亮出真容!

封面图

奥特曼带来GPT5最新实测,迅速引发大量围观。疯狂暗示了一周之后,虽说对话只是围绕电视剧推荐,但好歹是有官方实例了。当然奥特曼其人,放料的同时还是少不了新的谜语┓( ´∀` )┏:即将进入SaaS快时尚时代。比起这种奥式基操,更令人兴奋的是,这次有眼疾手快的网友,截到了发布时间(秒删版)???行吧,这一周的夜,熬起...

2025-08-04 11:36:47

开源前十,中国占九!全球第一,刚刚被它拿下!

封面图

“现在全球最强的十大开源大模型,猜猜有几个是中国的?”答案是:九个!其中来自北京的智谱GLM-4.5登顶第一!此信息来源于全球最受认可的开源模型榜单Hugging Face(如下图)中国开源模型快速迭代Hugging Face榜单中排名第1的是智谱最新一代基座大模型GLM-4.5。7月28日,智谱发布GLM-4.5,是专为智能体应用打造的开源模型,...

2025-08-01 21:58:00

从大模型到智能体:50+头部企业的 AI进化实践

封面图

我们正站在软件开发的“奇点”时刻GPT 的爆火仅仅是两年前,但 AI 技术迭代的速度令人目眩。从 GPT-3 到 GPT-4o,从 Claude 2 到 Claude 3.5 Sonnet,从通义千问到 DeepSeek-VL,再到层出不穷的 Agent 框架(如 LangChain, LlamaIndex, AutoGen),我们每天都在见证历史。这不仅是工具的进化,更是开发理念和工程范式的颠覆。...

2025-07-30 12:00:00

大模型技术人求生指南:你的Transformer和RAG知识正在过期

封面图

2025年残酷现状:某招聘平台数据显示,每15份大模型岗位简历仅有1份通过初筛,而83%的候选人倒在技术深水区。当你还在用LangChain搭建玩具级RAG时,大厂面试官的问题已变成:“如何用知识图谱约束检索幻觉率?”“医疗报告的表格结构如何自适应chunk切割?”技术人正在经历的三大崩塌崩塌一:Transformer八股文彻底失效当面试官...

2025-07-29 12:00:00

GPT

封面图

GPT-5终极版爆8月初上线,奥特曼亲证AI秒杀人类时刻降临! 2025年8月,OpenAI将正式发布下一代大模型GPT-5!这一备受瞩目的升级版AI由CEO奥特曼亲自预热,集成了o系列推理能力,定位为通往AGI(通用人工智能)的关键一步。开源模型也即将上线,赶在GPT-5前夕,是一款类似o3 mini的开源语言模型。【1】奥特曼首次公开确认GPT...

2025-07-25 08:18:51

热门作者
作者头像
科技区角
Find Your TechCorner,关注前沿科技、集成电路、航空航天、数码、游戏及电子信息产业经济,在科技区角发现属于你的科技内容。
作者头像
华经产业研究院
华经情报网-专注于大中华区产业经济信息情报-隶属于华经产业研究院
作者头像
人工智能产业链union
人工智能产业链联盟,旨在汇聚全球人工智能领域的创新力量,共同推动人工智能技术的研发、应用与产业化。联盟以基础技术、人工智能技术及人工智能应用为核心,打造了一个完整、高效、协同的人工智能生态链。
作者头像
虎嗅app
从思考,到创造
作者头像
36氪
36氪是服务中国新经济参与者的卓越品牌和开创性平台,提供新锐深度的商业报道,强调趋势和价值,我们的slogan是:让一部分人先看到未来。