作者头像

机智流

共赴 AI 时代浪潮~

资讯390
资讯

不需要精确描述的文本提示词,即可实现“导演级”多镜头运镜克隆!快手清北联合提出视频生成新框架OmniDirector

封面图

在电影制作中,导演通过精妙的镜头语言——推、拉、摇、移、跟,来讲述故事、烘托氛围。如今,AI视频生成技术正试图掌握这门艺术,但如何让AI像导演一样,精准地“克隆”一段参考视频中的复杂运镜,并将其无缝应用到全新的内容上,一直是个巨大挑战。传统方法要么依赖难以精确描述的文字指令,要么需要用户输入复杂的相机参数,...

2026-06-15 23:01:00

学术界不卷模型了|P站本周论文盘点

封面图

PAPERSCOPE × 机智流 · 联合出品学术界卷模型的时代,终结了本周 239 篇 HF Daily Papers · 5 大主线 · 代表论文带「🤔 真正的 insight」你能在前 30 秒读完这一段,就够你跟同行装一晚上 X 了过去 7 天,工业界 AI 圈又发了好几款新产品——但你打开 Hugging Face Daily Papers,239 篇里几乎找不到一篇"新 LLM"论文。不是论...

2026-06-15 08:51:54

当环境持续变化,AI智能体如何保持稳健?NUS联合MIT 等提出EvoArena 基准与 EvoMem 记忆范式

封面图

在现实世界中,一个为软件开发人员设计的智能体,可能需要面对代码库从Python迁移到Go、依赖版本不断升级、API接口持续演变的挑战。一个长期陪伴用户的个性化助手,需要理解用户从“喜欢咖啡”到“最近改喝早茶”的偏好变迁。然而,当前大多数针对大语言模型智能体的评测,都假设它们运行在一个静态、不变的环境中。这种假设与...

2026-06-14 22:28:08

刚刚!Claude Fable 5、Mythos 5 被美国政府紧急叫停

封面图

SMARTFLOW · 突发Claude Fable 5 / Mythos 5 被紧急叫停美国政府出口管制指令 · 两个旗舰模型全球停服 · 2026.06.13北京时间今天清晨,Anthropic 在官网和 X 同步发声明:应美国政府一纸出口管制指令,公司被迫立即、全面暂停 Claude Fable 5 与 Claude Mythos 5。其余所有 Claude 模型不受影响。这是一个值得关注的先例——...

2026-06-13 10:18:46

6.13上海活动邀请|「月亮与六便士」之端侧智能体创客寻宝狂欢派对

封面图

> 本文转载自「OpenBMB」-- 完 --加入机智流 Pro,1 天一块钱,AI 能力指数级增长时代,不掉队。机智流 AI 团队将燃烧远超人类的智能的 AI Tokens 驱动 AI Agents 军团带来「与你有关」「对你有用」的高质量资讯/研报。机智流推荐阅读:1. 2. 3. 4. 关注机智流并加入 AI 技术交流群,不仅能和来自大厂名校的 AI 开发者、爱...

2026-06-12 23:09:50

前沿AI该像飞机一样强制送检|机智流AI日报 6/11

封面图

SMARTFLOW AI DAILY机智流 AI 日报2026 年 6 月 11 日 · 今日 10 条 AI 要闻 产品发布4 条Replit联合Socket推出Package Firewall,从源头阻断恶意包Replit发布Package Firewall,与Socket合作开发,在恶意软件安装到应用前就将其阻断,区别于传统发布前的安全扫描。via @Replit 深度解读Replit与Socket合作推出Package Fire...

2026-06-12 10:17:10

从模型文件到 API 服务:LMDeploy 本地部署完整实践

封面图

> 作者:李剑锋1. 前言1.1 课程回顾在前面的内容中,我们已经围绕模型训练、模型测评以及本地模型运行,逐步学习了大模型从能力构建到能力调用的基本流程。模型训练主要回答的是模型能不能获得更符合预期的能力,模型测评主要回答的是模型能力提升是否能够被有效验证,而 Ollama 的使用则进一步帮助我们回答了另一个非常关...

2026-06-11 22:15:14

聊聊SWE-Bench Pro:Claude Mythos 5/Fable 5 的 80.3 分,真的可信吗?

封面图

> 作者:北辰随着 ,大家是不是也像我一样被下面这张表刷屏了?特别是 SWE-bench Pro 80.3% 的得分,可以说是完全“碾压” GPT-5.5 的58.6% 。由于模型放出的时间太短,各路大神都在火热的测试,我们让子弹多飞一会,不讨论 Fable5 的效果是否惊艳、也不管它是不是 Token 爆炸机……我们今天来聊聊大模型的 Coding Benchmark,...

2026-06-10 23:07:02

从0搭建工业级Agentic RAG:高性能知识库问答助手实战(附代码)

封面图

> 本文转载自「深蓝 AI 大课堂」如同移动互联网时代的APP,Agent正在AI时代呈现涌现式的发展态势。传统大模型应用是“会聊天、会检索”,Agentic RAG则具备自我反思、工具链式调用以及多智能体协同作业等先进特性。传统应用开发的核心是“精准定义”每一步的执行逻辑。Agent开发不同:开发者定义目标和边界,由Agent自主规划执...

2026-06-10 18:00:00

CVPR 2026 盘点|看清视觉 AI 的下半场

封面图

PAPERSCOPE × CVPR 20264069 篇论文,看清视觉 AI 的下半场八大趋势逐个拆 · 每个先给判断,再讲为什么,配代表论文的「机制 + 局限」卡写在前面:当工业界以「周」为单位更新,CVPR 这种年会还值得读吗头部实验室一周一个新模型已是常态——你这周用着的版本,下周可能就是"上一代"。AI 工业界确实领先学术界——这种节奏下,C...

2026-06-10 15:57:39

刚刚|千问发布高考志愿填报Agent,为全国考生免费提供志愿填报咨询

封面图

千问发布高考志愿填报Agent,为全国考生免费提供志愿填报咨询千问发布“高考志愿填报专家”,免费为考生定制价值5000元的志愿报告AI填志愿来了!千问上线“高考志愿填报专家”,免费为全国考生服务6月10日,千问上线国内首个全周期高考志愿填报Agent,为全国考生免费提供志愿填报和咨询服务。高考Agent基于千问高考志愿大模型和...

2026-06-10 15:14:09

刚刚,Claude Fable 5 发布:代码碾压 GPT-5.5

封面图

SMARTFLOW DEEP DIVEClaude Fable 5 发布第一个公开的 Mythos 级模型2026 年 6 月 10 日 · Anthropic 官方发布6 月 4 日,Anthropic 发表了一篇不寻常的文章。它承认:自家合并代码的 80% 以上,已经出自 AI 之手;并罕见地呼吁全行业"保留放慢、甚至暂停前沿 AI 的选项"。很多人把它读成一份警告,甚至一次刹车。5 天后,...

2026-06-10 08:20:08

告别短视调度!中大SlidingServe让大模型推理服务容量提升30%,SLO违规率降低53%

封面图

在大语言模型在线服务日益普及的今天,无论是智能问答、代码生成还是智能体交互,用户对响应速度的期待越来越高。一个理想的系统不仅要能同时处理大量请求,保证高吞吐量,还必须确保每个用户都能在可接受的时间内获得第一个输出词元,并享受流畅的后续生成体验。然而,现有的调度系统往往采用粗粒度的输出约束,难以在多请...

2026-06-09 21:00:00

音频编辑的“高考”来了:首个大规模多任务评测基准MMAE发布,现有模型几乎“全军覆没”

封面图

你正在剪辑一段视频,需要将背景音乐替换为吉他旋律,同时让人声听起来更低沉、更有磁性,并且不能改变说话的内容。又或者,你需要将一段带有地方口音的中文对话,精准地修改为标准普通话发音,同时保留说话人的音色和节奏。对于专业音频编辑师来说,这些任务虽然繁琐,但尚可完成。然而,如果要求一个AI模型,仅凭一句自然...

2026-06-08 21:30:00

马斯克 1.77 万亿史上最大 IPO:SpaceX 人类驶向星辰大海的船票

封面图

SMARTFLOW DEEP DIVE史上最大 IPO一张驶向星辰大海的船票2026 年 6 月 7 日 · SPCX · 纳斯达克1492 年,哥伦布说服西班牙王室为远航买单时,没人知道大西洋的尽头是什么。开启"大航海时代"的,从来不只是勇气,还有愿意为未知买单的资本。五百多年后,相似的剧本在纳斯达克重演——只不过这一次,远方不再是新大陆,而是火星...

2026-06-08 10:10:02

首个实时交互音频大模型Audio-Interaction问世!南洋理工等团队开启实时“感知-决策-响应”的音频交互新范式

封面图

清晨,你一边听书,一边下意识留意着周围的动静,随时准备回应家人的呼唤。这种对连续声音流的实时感知、决策与响应,是人类与生俱来的交互能力。然而,对于当前的人工智能而言,这却是一个巨大的挑战。现有的音频大语言模型(LALM)大多遵循着“离线”模式:用户提供一段完整的录音,模型听完后给出一次性的回答。这就像把一...

2026-06-07 22:31:11

明星 AI 公司 Anthropic 悄悄要上市了|机智流周报

封面图

SMARTFLOW AI WEEKLYAI 开始造工厂、造身体、造公司,和造它自己2026 第 23 周 · 6/1–6/7 · 精选 15 条 · 约 9 分钟6 月的第一周,AI 圈有几件事几乎在同一时间发生:有人在台北把一排 GPU 机柜叫作"工厂",一家明星模型公司悄悄递交了上市文件,还有家公司发了篇文章,标题直接叫《当 AI 开始造自己》。这些事看着互不相干...

2026-06-07 16:35:13

Agentic AI风口已至!聚焦Agent最火的九个方向,年度AI智能体大会7月开幕

封面图

2026年,人工智能迎来革命性的范式跃迁,Agentic AI时代正式来临。在OpenClaw的引爆下,AI彻底突破 “对话交互” 的局限,正式迈入主动执行的新纪元。智能体自进化的觉醒,则让AI第一次拥有了 “从经验中成长” 的能力。Harness Engineering作为保障智能体可靠、可控、规模化落地的核心工程体系,亦同步加速兴起。与此同时,AI...

2026-06-07 12:00:00

好技能应该是代码,但代码必须被审查

封面图

> 本文翻译自外网,机智流编辑部校对一个只靠 prompt 描述的 AI skill,跑出来的结果看起来挺像回事,但每次都不一样。出错不报错,跑偏不提醒,你都不知道它什么时候搞砸的。这是 skill 工程化要解决的核心矛盾。我们在 WorkBuddy 里的做法是:把 skill 拆成三层——SKILL.md 只负责告诉模型什么时候调用、怎么解释结果;真...

2026-06-06 22:07:10

清北团队推出科研绘图“智能助手”CRAFTER!多智能体协同,让科研图表生成更通用、更可编辑

封面图

图片由AI生成在科研论文的撰写过程中,制作一张清晰、美观、符合出版规范的图表,往往是研究者们耗时耗力的环节。从构思布局、绘制元素、调整样式到最终排版,每一步都需要精细的手工操作。尽管文本生成图像技术近年来取得了显著进展,但在科学插图这个高度结构化的领域,现有工具仍存在明显短板:要么只能处理单一类型的图...

2026-06-05 22:24:20

分享一个零基础、高质量、免费、开源的 RL 课

封面图

最近看到一个强化学习开源课程,思路不一样。它让你先跑代码。跑 CartPole(推车倒立摆,强化学习(RL)中经典的基准测试环境),杆子立起来。跑 Atari(雅达利游戏环境),Pong 赢下来。跑 DPO(直接偏好优化,强化学习算法的一种),大模型回答变好。然后再讲公式。最近,AgenticRL、OPD、GRPO(分组相对策略优化)、RLVR...

2026-06-05 18:00:00

开源大模型怎么在本地跑起来?一文讲透 Ollama 部署与调用

封面图

> 作者:李剑锋1. 前言1.1 课程回顾在中,我们已经围绕大模型训练与模型测评,逐步梳理了从数据构建、监督微调、参数高效调优到效果评估的基本流程。到这一阶段为止,实际上已经回答了两个关键问题:一是模型能否学习到目标能力,二是模型能力提升是否能够被验证。但是,对于大模型应用落地而言,训练和测评并不是完整链路...

2026-06-04 21:00:50

Agentic 时代的技术地图:AICon 2026 上海站全日程正式发布

封面图

> 本文转载自「InfoQ」当 AI 不再只是工具,组织本身开始被重塑。过去一年,"Agent"这个词从实验室走进了生产环境。工程师们开始真正面对一个新的问题:不是"AI 能不能做到",而是"我们能不能把它跑稳、跑对、跑出规模"。架构怎么设计?记忆怎么管理?多智能体之间如何协调?研发团队的工作方式又该如何重构?这些,正是 AI...

2026-06-04 18:00:00

宇树G1终于学会了“看+想+抓”:OpenClaw多模态+Skill库开源方案

封面图

> 本文转载自「深蓝 AI 大课堂」当前AI大模型不仅能够进行流畅的对话、撰写文章、编写代码,OpenClaw生态也随之爆发式增长,在更多场景中更展现了强大的泛化能力、决策和自我进化的能力。但一个关键问题横亘在具身智能领域:大模型只会“说”,不会“做”。人形机器人OpenClaw项目架构图那么,如何让LLM真正理解物理世界,并驱...

2026-06-03 18:00:00

已服务超1亿用户!阿里推出RTP-LLM推理引擎:4.7倍加载加速,吞吐提升2.5倍

封面图

图片由 AI 生成在大语言模型(LLM)浪潮席卷全球的今天,从智能对话到代码生成,再到企业自动化,AI应用正经历着前所未有的范式转移。然而,当我们将这些动辄数百亿甚至上千亿参数的“庞然大物”推向实际生产环境时,挑战才刚刚开始。传统的推理系统在设计之初从未考虑过如此巨大的计算与内存需求,模型规模与可部署性之间的...

2026-06-02 21:32:05

Claude Opus 4.8 深夜发布:bug 砍 4 倍,主打『诚实』

封面图

   SMARTFLOW AI · 速攻 / FLASH  Claude Opus 4.8 深夜发布  5-28 美国时间 · 距 4.7 仅 41 天 · bug 砍 4 倍 · 把"诚实"写进 release note        昨天凌晨,Anthropic 端出 Opus 4.8。距上一代 4.7 整 41 天。        它的 release note 第一句不是 SOTA、不是新 benchmark,而是:"sharper judgement, more honesty abo...

2026-05-29 06:59:58

Anthropic 30 天挖 1 万+ 漏洞|机智流 AI 日报 5/22

封面图

今日 12 条 产品发布 3 · 大模型 4 · 观点 3 · 行业 201Google DeepMind:SynthID 水印扩展更多伙伴,Gemini 与搜索可直接溯源 · 3 源02Anthropic:Claude Mythos Preview 将让漏洞发现量暴增,行业需重塑流程 · 2 源03Garry Tan 晒个人 AI「GBrain」:单月数据量增长 5-8 倍 · 2 源 产品发布3 条Cursor SDK 上线:基于 Co...

2026-05-23 12:43:11

从 RLHF 到 DPO:大模型偏好对齐的原理与实战

封面图

> 作者:李剑锋前言在前面的课程中,我们已经重点讲解了 SFT(监督微调) 的相关内容,并在上一节课中进一步介绍了 继续预训练 的基本思路。而在这一节课里,我们将继续沿着模型训练能力不断增强的这条路线,进入一个更进阶的话题:强化学习阶段的模型训练方法。事实上,早在课程第二节介绍大模型训练流程时,我们就已经提...

2026-05-21 22:07:16

Meta 开源 Sapiens2:人体视觉模型进入 5B 参数时代

封面图

Meta 开源 Sapiens2:人体视觉模型进入 5B 参数时代Meta / FAIR 新开源的 Sapiens2,表面上看是一组人体姿态、分割、抠图模型;但更准确地说,它是在把「人体视觉」做成一块基础设施。它不是通用看图模型,而是专门围绕人来训练:身体、衣服、姿态、轮廓、遮挡、表面几何、前景 alpha,都是它要学的核心结构。完整研报已上...

2026-05-19 10:07:49

千问5.20的“新朋友”,可能不只是一个新模型

封面图

> 本文由 Intern-S2 等 AI 生成,机智流编辑部校对下午,千问大模型官方账号发了一条预告:这是一条很会吊胃口的预告,既没有直接说是“新模型”,也没有说是“新功能”,反而用了“新朋友”?那我们在5.20阿里云峰会前一起来猜一猜这个“新朋友”是什么!模型既然是千问大模型官方账号发布的,又说了“更全能、更强大、有深度、有广...

2026-05-18 21:30:00

热门作者
作者头像
科技区角
Find Your TechCorner,关注前沿科技、集成电路、航空航天、数码、游戏及电子信息产业经济,在科技区角发现属于你的科技内容。
作者头像
虎嗅app
从思考,到创造
作者头像
华经产业研究院
华经情报网-专注于大中华区产业经济信息情报-隶属于华经产业研究院
作者头像
36氪
36氪是服务中国新经济参与者的卓越品牌和开创性平台,提供新锐深度的商业报道,强调趋势和价值,我们的slogan是:让一部分人先看到未来。
作者头像
量子位
追踪人工智能新趋势,关注科技行业新突破