作者头像

学姐带你玩AI

这里有人工智能前沿信息、算法技术交流、机器学习/深度学习经验分享、AI大赛解析、大厂大咖算法面试分享、人工智能论文技巧、AI环境工具库教程等……学姐带你玩转AI!

资讯108
资讯

为LLM装上记忆海马体:Memory-R1新框架

封面图

题目:TIME: A Multi-level Benchmark for Temporal Reasoning of LLMs in Real-World Scenarios论文地址:https://arxiv.org/pdf/2505.12891代码地址:https://github.com/sylvain-wei/TIME创新点本文创新性地设计了一个多层次评估框架,用于系统评估大型语言模型(LLMs)在真实世界场景中的时间推理能力。该框架将时间推...

2025-10-16 18:25:00

首个非自回归多模态模型!Meta推出OneFlow

封面图

题目:OneFlow: Concurrent Mixed-Modal and Interleaved Generation with Edit Flows论文地址:https://arxiv.org/pdf/2510.03506创新点OneFlow摒弃了传统自回归模型(AR)的严格顺序生成约束,通过插入式编辑流(Edit Flow)处理离散文本token,结合流匹配(Flow Matching)生成连续图像潜变量,首次实现了文本与图像的无...

2025-10-15 18:16:00

NeurIPS25 Spotlight | 可解释高效注意力

封面图

题目:Towards Interpretable and Effcient Attention:Compressing All by Contracting a Few论文地址:https://arxiv.org/pdf/2509.16875创新点本文通过最大化编码率差(MCR²)的变体,将输入token压缩至由少量代表性token(representatives)张成的子空间中,既降低了计算复杂度(从二次降至线性),又通过子空间投影保留...

2025-10-14 18:10:00

Qwen团队:GSPO!

封面图

论文题目:Group Sequence Policy Optimization论文地址:https://arxiv.org/pdf/2507.18071创新点GSPO在序列级别进行裁剪(clipping)、奖励(rewarding)和优化,而不是在标记级别。这种设计使得优化目标与奖励的单位保持一致,从而提高了训练的稳定性和效率。GSPO能够有效解决Mixture-of-Experts (MoE)模型在强化学习训...

2025-10-13 18:18:00

强烈推荐!频域+PINN,选题超新颖,简直绝绝子!

封面图

频域+PINN这搭配,最近在顶刊上认可度不低,已经有相关论文发表在中科院1区TOP,比如Applied Energy上的FD-PINN方法。这个组合巧妙解决了传统PINN求解波动、振荡类物理问题时的一些固有难点,给我们做新研究提供了思路,创新空间还是不错的。但从目前成果看,这方向虽说机会多,门槛却在涨,要是感兴趣,建议赶紧入手。推荐...

2025-10-12 18:10:00

风向变了!PINN+多任务学习才是王道!

封面图

给想快速发高质量论文的同学分享个交叉领域的黄金方向:PINN+多任务学习。这二者结合,既能满足物理可解释性,又能兼顾数据效率,在能源、医疗、航空航天等领域相当受欢迎。目前已有研究用它做锂电池健康状态预测,还发了中科院一区TOP,足见学术价值。作为新兴子领域,它现在已是顶会顶刊热点。建议大家发论文时,可试试动...

2025-10-11 18:22:00

顶会爆火!多模态融合 + 迁移学习,想发论文就选这个方向!

封面图

看今年ICML这类顶会的录用情况,多模态融合+迁移学习这个组合依旧火爆,TPAMI上也有不少相关成果。而工业界这边,谷歌、微软等巨头的动作,也体现了这个方向明确的商业化路径。总之,这个组合是个挺不错的研究方向,想发论文可以考虑。目前这方向常见的思路还是参数微调、数据迁移、针对具体问题改进这些。其他的也可以试试...

2025-10-10 18:12:00

用心理学实验数据微调大语言模型

封面图

论文题目:A foundation model to predict and capture human cognition论文地址:https://www.nature.com/articles/s41586-025-09215-4.pdf创新点首次将大语言模型(LLaMA 3.1 70B)微调成通用认知模型,无需针对特定任务重新设计架构,直接通过自然语言描述预测任意实验范式中的人类行为。将实验流程转录为自然语言(如“...

2025-10-09 18:30:00

EMNLP2025|大模型“撒谎”的内部机制

封面图

题目:When Truthful Representations Flip Under Deceptive Instructions?论文地址:https://arxiv.org/pdf/2507.22149代码地址:https://github.com/ivyllll/truthfulrepresentation-flip.创新点大型语言模型(LLMs)在遵循恶意指令时会产生欺骗性回答,这带来了安全挑战。然而,目前对于恶意指令如何改变LLMs内部表示的...

2025-10-08 18:02:00

一区Top力推!时空特征融合还能这么玩!思路进阶必码

封面图

给同学们推荐个发文好方向——时空特征融合!不管是学术界还是工业界,它都是香饽饽!一方面,机器人、物流、医疗这些实际场景,都需要更强的时空特征融合技术来支撑。另一方面,它还是CV、NLP、数据挖掘的交叉热点,创新切入点很多,各大顶刊顶会都能看到相关研究,比如Information Fusion上的ST-Camba框架、AutoGRN模型。而...

2025-10-07 19:08:00

字节Seed:AI终于有长期记忆了

封面图

题目:Seeing, Listening, Remembering, and Reasoning: A Multimodal Agent with Long-Term Memory论文地址:https://arxiv.org/pdf/2508.09736主页:https://m3-agent.github.io创新点与传统智能体不同,M3-Agent 能够实时处理视觉和听觉输入,构建和更新其长期记忆。这种长期记忆不仅包括事件记忆(episodic memory),...

2025-10-06 18:12:00

高分收割机:机器学习+组合优化!20种个性化思路带你冲顶会!

封面图

论文er看过来!今天给大家推荐个超适合发论文的方向——机器学习+组合优化。说它好发,不是因为水,而是因为它正处在“范式转移”的黄金期,机会特别多!简单说,它有很多经典老问题,都能用机器学习翻新;而且机器学习几乎能和所有组合优化传统算法“组CP”,创新组合不要太多。加上这方向还比较新,审稿人友好、故事也容易讲,...

2025-10-05 18:01:00

从CVPR 2025看域适应、域泛化最新研究进展

封面图

最近翻了翻今年CVPR的录用论文,发现域泛化、域适应出现得很频繁,果然这俩还是核心研究方向。尤其是域泛化的改进,接下来依旧是要攻克的关键难题。毕竟现实里数据分布变化太复杂,需要让模型能适应这种变化才行,而在这一块,域泛化/域适应一直都是有新的创新点的。现在的常用的思路基本就是生成式与数据扩充、表示学习与...

2025-10-04 18:15:00

可解释多模态融合只会越来越火

封面图

能感觉到,多模态模型是越来越强了,但它的“黑箱问题”仍然没有解决,尤其在医疗、自动驾驶这些高风险领域,迫切需要应对之法。这时候研究“可解释的多模态融合”就显得特别关键,这点从近年顶刊顶会的论文里就能看出来,比如Nat Commun上就有篇可解释的纵向多模态融合模型。而且这方向找创新点也不难,核心就是把“融合过程”讲...

2025-10-03 18:02:00

IEEE TII | 强烈推荐!可解释性时空预测!ScaleSTF:可扩展时空Transformer模型

封面图

题目:Predicting Large-Scale Urban Network Dynamics With Energy-Informed Graph Neural Diffusion论文地址:https://ieeexplore.ieee.org/document/11096982创新点本文首次将能量调节的神经扩散过程与全局图信号去噪问题相联系,从理论上解释了城市网络动态预测模型。通过引入能量正则化项,模型在更新节点表示时能够逐...

2025-10-02 18:15:00

NeurIPS 2025|何恺明MeanFlow:一步到位

封面图

题目:Mean Flows for One-step Generative Modeling论文地址:https://arxiv.org/pdf/2505.13447创新点传统Flow Matching方法通过瞬时速度场(Instantaneous Velocity)指导模型训练,但需依赖时间积分计算轨迹,导致一步生成时误差累积。本文首次提出平均速度场的概念,定义为瞬时速度在时间区间上的积分平均值。现有一步...

2025-10-01 18:18:00

SCI发文热点:物理信息强化学习,现成套路拿走不谢!

封面图

分享个超有活力、创新点又多的研究方向——物理信息强化学习(PIRL)!因为它是把ML、RL、物理建模和领域知识凑一起的“交叉款”,众所周知,交叉领域更容易挖出新点子。而且它也很实用,数据少的场景都适合,应用前景非常广阔。目前这方向还在飞速发展,顶刊顶会的认可度都挺高,比如近期IEEE TSE就发了篇基于约束强化学习的PI...

2025-09-30 18:11:00

必要时才思考?微软Hybrid-Reasoning Model

封面图

论文题目:Think Only When You Need with Large Hybrid-Reasoning Models论文地址:https://arxiv.org/pdf/2505.14631创新点LHRMs是首个能够根据用户查询的上下文信息自适应决定是否进行推理思考的模型。这种模型能够动态地选择是否启用扩展的思考过程,从而在推理能力和计算效率之间取得平衡。HAcc用于量化评估模型在混合...

2025-09-29 18:10:00

论文没思路?特征融合+GNN来救场,创新点好找还易出成果

封面图

图机器学习领域又有活力又好入手的方向是什么?我首推特征融合+GNN!这组合有点意思,总能让人挖出些巧妙的融合方法,针对某个具体问题就能把性能提上去。对写论文的人来说,创新点真的挺好找的。而且它应用场景广阔,这几年大家对它的关注也一直涨,顶会顶刊里能看到不少相关成果。看最近的研究,这方向的创新大多围绕“融...

2025-09-27 18:09:00

Graph+AI Agent创新思路解析,还没有idea的同学可借鉴!!!

封面图

AI Agent想必大家都已经相当熟悉了,发展到现在,它的规划、记忆、协调这些核心能力,在处理复杂关系上还是有局限…而这时候,就该轮到Graph上场了。Graph很会找关联,搭配上Agent的自主决策优势,复杂关系的高效推理、动态决策这些任务能直接拿捏。所以Graph+AI Agents这组合相当受欢迎,不仅应用场景广,学术圈也很热门。...

2025-09-26 18:02:00

Transformer再提升!阿里HeterRec推荐模型

封面图

题目:HeterRec: Heterogeneous Information Transformer for Scalable Sequential Recommendation论文地址:https://arxiv.org/pdf/2503.01469创新点提出了异构令牌扁平化层(HTFL),这是一种新颖的项令牌化方法,将每个项视为一个“词”,并将其细粒度地令牌化为异构特征(特征)集。通过将项特征组织成异构序列,显著增强...

2025-09-25 18:10:00

CVPR2025 | 动态稀疏的免训练Token压缩方法

封面图

题目:DyCoke : Dynamic Compression of Tokens for Fast Video Large Language Models论文地址:https://arxiv.org/abs/2411.15024代码地址: https://github.com/KD-TAO/DyCoke创新点针对视频输入中存在的时空冗余性(时间上的帧间冗余和空间上的视觉令牌冗余),提出两阶段动态压缩策略。传统方法(如FastV、PruMerge)...

2025-09-24 18:19:00

CNN+Mamba 太顶了!登顶遥感分割榜,论文创新选它准没错!

封面图

最近不少研究都能看出来,CNN和Mamba结合,是当下超热门的方向!比如TGRS 2025上的GLVMamba,通过将两者的优势融到了一起,直接在权威数据集上刷新性能纪录,稳稳站上遥感语义分割的榜首。再加上,Mamba在视觉领域起步不算早,和CNN的融合探索才刚热起来,对论文er来说,正是好上手的时候。而且这方向有应用支撑、故事也好...

2025-09-23 18:27:00

Nature重磅:物理神经网络训练革命突破!

封面图

题目:Training of physical neural networks论文地址:https://www.nature.com/articles/s41586-025-09384-2创新点作者全面回顾了物理神经网络(PNNs)的多种训练方法,包括基于反向传播的方法和无反向传播的方法。通过对这些方法的理论分析,总结了它们的优缺点,并探讨了它们在不同应用场景中的适用性。这种方法为研究人...

2025-09-22 18:26:00

顶会顶刊偏爱!「对比学习 + 知识蒸馏」交叉研究发论文稳了!

封面图

想让模型既会分清不同,又能学到真本事,那了解下“对比学习+知识蒸馏”这对“黄金搭档”!这组合能补上单一技术的短板,协同效果拉满。值得一提的是,它在设备资源有限的场景里特别好用,而且这类场景逐渐增多,给我们搞创新留足了空间。最近有不少成果也能证明它解决实际问题的能力很强,比如IEEE TII的CoUDA框架,在动态环境...

2025-09-21 18:18:00

可解释性时空预测超好上手,这思路你做你也发顶会!

封面图

可解释性时空预测,是融合时空数据分析与可解释AI的新方向。现在大家对“可解释性”的需求越来越迫切,而且它能解决交通预测这类实用问题,因此研究热度特别高,发展势头正猛。这方向发文机会自然也很不错,顶会顶刊都很关注,比如IEEE TII的ScaleSTF、ICML 2025的ASNO,不过相对的审稿老师对创新点的要求也越来越严。这里我...

2025-09-20 18:29:00

喜提IEEE TII!“Transformer+CNN+注意力机制”超强组合上大分!

封面图

最近“CNN+Transformer+Attention”这个方向,在顶会顶刊上频频出成果,比如IEEE TII上的双条件领域自适应方法CFBDAM就很有代表性。其实这倒也不意外,因为这个组合刚好解决了“单一模型有局限”的实际难题,所以CV、NLP、多模态等领域都很需要它。更别提工业界现在非常青睐这类能提性能、增效率,还能降低部署成本的混合架构。...

2025-09-19 18:11:00

腾讯:让LLM在《王者荣耀》中学习动态决策

封面图

题目:Think in Games: Learning to Reason in Games via Reinforcement Learning with Large Language Models论文地址:https://arxiv.org/pdf/2508.21365创新点首次将“游戏思维”作为研究重点,强调在游戏场景中对玩家行为和决策的深层次理解,这与以往单纯从技术角度研究游戏 AI 或从心理学角度研究玩家行为的研究视角有...

2025-09-18 18:02:00

Nature communications | 可解释性纵向多模态融合模型用于预测女性乳腺癌患者新辅助治疗反应

封面图

题目:An explainable longitudinal multi-modal fusion model for predicting neoadjuvant therapy response in women with breast cancer论文地址:https://www.nature.com/articles/s41467-024-53450-8创新点提出了一个多模态融合模型(MRP),整合了放射学图像(包括乳腺X线摄影和MRI)、组织病理学信息、个人特征以及...

2025-09-17 18:23:00

现在还能靠注意力机制发论文吗?

封面图

注意力机制作为核心技术,性能方面仍然存在瓶颈,所以现在还是有不少创新机会可以挖掘。而且目前来看大家的创新方向也很集中,都是想让它更高效、更强大,或者说更“聪明”。简单归个类,主要是这四种:结构设计与尺度、特征处理与融合、模型架构与组合,还有针对特定任务或领域的。不过想发论文的同学注意,这方向对创新质量...

2025-09-16 18:20:00

热门作者
作者头像
科技区角
Find Your TechCorner,关注前沿科技、集成电路、航空航天、数码、游戏及电子信息产业经济,在科技区角发现属于你的科技内容。
作者头像
华经产业研究院
华经情报网-专注于大中华区产业经济信息情报-隶属于华经产业研究院
作者头像
人工智能产业链union
人工智能产业链联盟,旨在汇聚全球人工智能领域的创新力量,共同推动人工智能技术的研发、应用与产业化。联盟以基础技术、人工智能技术及人工智能应用为核心,打造了一个完整、高效、协同的人工智能生态链。
作者头像
虎嗅app
从思考,到创造
作者头像
36氪
36氪是服务中国新经济参与者的卓越品牌和开创性平台,提供新锐深度的商业报道,强调趋势和价值,我们的slogan是:让一部分人先看到未来。