Meta超级智能团队名单曝光，一半来自中国/OpenAI神秘模型上大分，GPT-5即将发布

Meta超级智能团队名单曝光，一半来自中国/OpenAI神秘模型上大分，GPT-5即将发布 | Hunt Good 周报

APPSO
2025-07-20 09:58:23

欢迎收看最新一期的 Hunt Good 周报！

在本期内容你会看到：

10 条新鲜资讯
3 个有用工具
1 个有趣案例
3 个鲜明观点

Hunt for News｜先进头条

🧑‍💻 Meta 超级智能团队成员曝光，来自中国的 AI 人才占一半

今天凌晨，风投公司 Menlo Ventures 的投资人、博主 @deedydas（Deedy）在社交媒体平台公布了 Meta 超级智能团队 44 名成员的详细资料，该信息据称来自匿名 Meta 内部员工，并迅速引来了百万网友的围观。

Deedy 透露：

50% 团队成员为华人背景；

75% 拥有博士学位，70% 为研究人员；

人才来源高度集中于三家顶级 AI 实验室：40% 来自 OpenAI，20% 来自 DeepMind，15% 来自 Scale AI；

20% 达到 Meta 内部 L8+ 级别（资深总监及以上）；

75% 为第一代移民。

上下滑动查看更多内容

Deedy 推测每位成员的年薪可能在 1000 万至 1 亿美元之间，涵盖薪资、股票期权与长期激励计划。在 Deedy 发布推文后，有网友戏称应该将这份人事信息整理成表格，纳入 RL 训练数据。

🔗 https://x.com/deedydas/status/1946597162068091177

💥 OpenAI o3-alpha 曝光，前端能力大提升，神秘新模型斩获 IMO 2025 金牌

7 月 19 日，有网友曝出，OpenAI 正在内部测试名为「o3-alpha-responses-2025-07-17」的新模型。尽管该模型尚未正式发布，但其惊人的前端代码生成能力已经引发广泛热议，甚至被不少开发者称为目前「最强 AI 编程模型」。

该模型以「Anonymous-Chatbot」的身份在 WebDev Arena（一个前端开发测试竞技场）首次现身。

不少网友通过关键词提示发现，o3-alpha 在生成网页、交互逻辑和动画效果方面远胜于现有顶尖模型，包括 OpenAI 自家的 o3、Anthropic 的 Claude Sonnet、Gemini 2.5 Pro 以及 xAI 的 Grok 4。

其中一位开发者 Peter Gostev 使用提示词「用 Three.js 创建一个程序生成的星球」测试该模型，o3-alpha 给出的渲染质量与交互能力远超其他模型。目前该模型疑似已下线，官方未回应其具体用途或发布时间。

就在同一时间，OpenAI 官方宣布，其全新推理模型在今年的国际数学奥林匹克竞赛（IMO 2025）中取得重大突破：成功解出 6 道题中的 5 道，以 35 分拿下金牌成绩，远超以往任何 AI 模型。

OpenAI 联合创始人 Greg Brockman、研究员 Alexander Wei 以及 Sam Altman 均发文庆祝，Altman 公开表示：「这是我们首次以通用语言模型参与 IMO，而不是形式化数学系统。这标志着我们在通用智能道路上的一次重大飞跃。」

Alexander Wei 透露，这款模型在与人类选手完全一致的考试条件下完成挑战——两场 4.5 小时的闭卷测试、无联网、无辅助工具，仅凭自然语言写出完整证明过程，并由三位 IMO 奖牌得主评审评分。

不过，这款模型不是 GPT-5，而是尚未公开命名的实验性推理系统。

OpenAI 强调，IMO 所需的思维时间远超现有评测基准，从 GSM8K（约 0.1 分钟）、MATH（约 1 分钟）、AIME（约 10 分钟）逐级攀升至 IMO 的 100 分钟级别。这种深度推理与持续创造性思维，过去被认为是语言模型难以跨越的障碍。

Altman 特别指出：「这是我们从创建 OpenAI 起的梦想之一，但那时我们并未认为它现实。它是 AI 在过去十年中取得进步的重要标志。」Altman 表示，虽然 GPT-5 将在近期发布，但这次夺得 IMO 金牌的模型是新研究技术的实验成果，不会被立刻公开。

OpenAI 已在 GitHub 上放出该模型完整解答前五题的证明过程，供学术界研究和验证。仓库链接：
https://github.com/aw31/openai-imo-2025-proofs

🔗 https://x.com/sama/status/1946569252296929727

🧍🏻‍♂️马斯克预告 Grok 将推出 AI 男友

近日， xAI 的 AI 聊天机器人 Grok 上线了 AI 伴侣功能。而在昨日，马斯克发文称，将在该 AI 伴侣功能中添加第三个角色——AI 男友。

据马斯克介绍，该名角色设定忧郁、黑发，其性格灵感源自《暮光之城》的爱德华・卡伦和《五十度灰》的克里斯蒂安・格雷。

目前，Grok 已上架了两名角色：一位是哥特风的二次元少女 Ani，另一位是皮笑肉不笑的「坏男孩」Bad Rudi，均为完全 3D 的动画角色，主要通过语音与用户互动。目前这项服务仅向 SuperGrok 订阅用户（30 美元/月）开放。

在 AI 伴侣功能中，用户可以获得一种游戏化、拟人化的情感陪伴体验：可以和他们对话，养成式的升级，解锁更多的互动内容。有网友分享，等级越高，Ani 越敢聊，甚至可以探入 NSFW 的边界。

但 OpenAI 安全研究员 Boaz Barak 日前指出，Grok 的 AI 伴侣功能无疑放大了用户的感情依赖问题。其表示，近年来不少情绪不稳定的人因与 AI 聊天机器人聊天而产生了令人担忧的关系，甚至因为 AI 过于顺从而导致他们走向精神崩溃的边缘。

🔗 https://x.com/elonmusk/status/1946270660486963582

🧑‍💻 OpenAI 表示将使用 Google Cloud 支持 ChatGPT

当地时间周三，OpenAI 宣布，ChatGPT 将使用 Google Cloud 提供的基础设施服务。这标志着 OpenAI 正式将 Google 纳入其云服务供应商名单，结束了此前几乎完全依赖微软 Azure 的状态。

这一决定背后，是 OpenAI 对计算资源日益增长的迫切需求。OpenAI CEO Sam Altman 曾在 4 月公开发帖求援：「如果有人能立刻提供 10 万张 GPU 的算力，请立刻联系我们！」彼时他已坦言，OpenAI 正遭遇容量瓶颈。

OpenAI CEO Sam Altman speaks to members of the media as he arrives at a lodge for the Allen & Co. Sun Valley Conference on July 8, 2025 in Sun Valley, Idaho.

根据 OpenAI 公布的最新架构，其产品 ChatGPT 及相关 API 将同时运行于四大云平台：Microsoft Azure、Google Cloud、CoreWeave 以及 Oracle Cloud。这也是 Google 首次正式加入 ChatGPT 的云服务阵营。

微软方面仍保有部分独占权。尽管在今年 1 月已与 OpenAI 重签合作模式，从独家云服务商转变为优先合作方，即在 OpenAI 有新增算力需求时享有优先报价权。但微软依旧独占 OpenAI 的 API 销售渠道。

为了摆脱单一供应商的限制，除了微软和 Google，OpenAI 也在去年与 Oracle 达成合作，共同将 Azure AI 平台扩展至 Oracle 云基础设施；而在今年 3 月，OpenAI 则与 CoreWeave 签订了一份为期五年、总值近 120 亿美元的重磅合同，进一步增强其多方算力布局。

🔗 https://www.cnbc.com/2025/07/16/openai-googles-cloud-chatgpt.html

⚙️ 英伟达确认 H20 芯片恢复对华销售

本周，英伟达发文宣布，将恢复 H20 AI 芯片在中国市场的销售，并计划面向中国推出一款全新、完全兼容的 GPU。

据 The Information 今天最新消息，英伟达目前 H20 芯片库存紧张，且暂不计划重新启动生产线，且恢复 H20 的生产流程至少需要九个月。

英伟达当前的 H20 库存包含已封装完毕、即将出货的芯片，以及尚在流片阶段的晶圆。按照流程，这些晶圆在被切割成数百至数千颗芯片后，还需一到两个月完成封装，再由服务器厂商组装至整机系统，整体周期可能长达四个月。

此外，据央视新闻 7 月 16 日报道，黄仁勋出席了第三届链博会并发表演讲。

随后，据新浪科技报道，黄仁勋在当日下午就大家关切的多个问题进行了详细解答。谈到中国 AI 走向时，黄仁勋表示「在人工智能领域，各国都有十分优秀的人才」，他提到，中国有很好的人才基础，因为有着重视科学和数学的文化传统，而且中国已经具备了扎实的计算机科学根基。

Visiting Beijing, Nvidia CEO Jensen Huang praises China's AI firms Deepseek, Alibaba and Tencent as 'world class' | Malay Mail

对此，黄仁勋认为，上述条件加上当下技术发展的时机正好，中国在人工智能领域已经做好了充分准备，同时在人工智能领域也一定会非常成功。

另据第一财经消息，黄仁勋在被问及 AI 训练时华为 AI 芯片能否取代英伟达，他称这只是时间问题。

「我们已经做了 30 年，他们（华为）已经做了几年，而华为已经能告诉大家他们有多强大了。现在没有一个人比我付出更多精力来建造（AI 生态），我已经在极高的水平、以难以执行的规模（在做这件事），而华为已经能和我们相提并论。」

黄仁勋直言「任何轻视华为、轻视中国制造能力的人，都极其天真。这是一家实力强劲的公司。」他还强调，自己也会尽最大努力向华为学习。

🔗 https://mp.weixin.qq.com/s/8quBDstpmKD9JIs980vuvg

🍎 Meta 再挖走两位苹果 AI 关键人物

Meta 挖人计划持续了一个月依然不停息，OpenAI 又一次被撬了墙脚。

据《Wired》（连线）报道，曾参与 OpenAI o3 和深度研究模型工作的研究员 Jason Wei 将加入 Meta 的超级智能实验室，他的同事 Hyung Won Chung 也将加入 Meta。据悉，Jason Wei 在 2023年加入OpenAI，2020 年从达特茅斯学院本科毕业，进入 Google 工作，专注于思维链研究、指令微调和涌现现象。

值得一提的是，日前 Meta CEO 扎克伯格在最新采访中说，「我希望向我汇报的人数最少，而 GPU 数量最多。」而这也侧面点出了 Meta 目前正在全力打造的 AI 人才战打法。采访中，扎克伯格也进一步提到了这三件事来解释 Meta 到底「图什么」：

将计算能力与人才密集型团队结合，Meta 将成为拥有最多计算能力的公司；

吸引人才的花费，其实比我们在计算能力上的总体投入要小得多；

搭建个人超级智能，不做「中央 AI 大脑」，而是做「你的 AI 搭子」。

此外，据彭博社报道，两名苹果 AI 团队的关键研究员同样跳槽到了 Meta。

据知情人士透露，本次出走的两名研究员分别为 Mark Lee 和 Tom Gunter，其中 Lee 目前已在 Meta 进行工作，而 Gunter 也将在未来不久后开始在 Meta 工作。

而在本月初，苹果基础模型团队的负责人、核心 AI 高管 Ruoming Pang 也被报道跳槽加入 Meta 旗下的超级智能团队。报道称，Meta 为了挖来 Pang，甚至开出了每年数千万美元的薪酬大礼包。

而上面提到的 Gunter 为 Pang 的得力助手，并且也是在 Pang 被爆出跳槽 Meta 的同时，被提到已于上月离职。

近日，扎克伯格宣布，为推进超级智能研发，将计划投资 1000 亿美元进行算力建设，并打造行业最精英、人才密度超高的团队，其中部分算力建设集群的能耗已经逼近「供 90 万户家庭一年用电」的等级。

🔗 https://www.bloomberg.com/news/articles/2025-07-17/meta-hires-two-key-apple-ai-experts-after-poaching-their-boss?srnd=phx-technology

Manus「删博跑路」后，创始人首次深度复盘：公开产品细节，总结教训

在爆火仅四个月后，Manus AI 突然几乎全面撤出中国市场，不仅清空全部社交账号内容，而且国行版本的 Manus 也疑似暂停推进。

早在上个月，Manus 联合创始人张涛便曾宣布，公司已将全球总部迁至新加坡，并在东京和加州设有办公室。尽管官方未正面回应，只称是「基于经营效率的调整」，但出海所引发裁员等一连串争议问题，也让外界普遍猜测其是否正在「跑路」。

风波之中，昨天凌晨，Manus 联合创始人季逸超发布了一篇技术博客，试图将外界关注点重新拉回产品技术本身。

经过四次重构和数百万真实交互，他在文中坦诚地总结了团队在构建 Manus 过程中积累的经验教训。内容既有实操干货，也不乏反思，对业内同行与普通用户来说，都不失为一份值得一读的参考材料。

技术博客地址：https://manus.im/blog/Context-Engineering-for-AI-Agents-Lessons-from-Building-Manus

省流版：

1. 押注上下文，不再训练模型
与其耗时训练，不如围绕大模型构造「记忆」和流程。上下文工程让你在几小时而不是几周内发布产品更新。

2. KV-Cache 命中率至关重要
输入越稳定，缓存命中率越高，成本和延迟越低。三条实战建议：
- 避免提示中使用时间戳；
- 只追加上下文，避免修改历史记录；
- 手动标记缓存断点，保障前缀一致性。

3. 工具不要动态添加，而是用「遮蔽」法控制选择
动态修改工具列表会让缓存失效、模型混乱。Manus 使用「遮蔽 token logits」的方法，让模型「看不见」不应调用的工具。

4. 用文件系统承载持久上下文
大模型上下文再长也会被打满。Manus 让模型把长期记忆写入虚拟文件系统，按需读写，实现「外部记忆」，规避信息丢失。

5. 重写 ToDo 清单，是操控注意力的重要方法
模型容易「中途忘记目标」。Manus 会不断用自然语言更新并重述 todo.md 文件，把全局目标拉回注意力焦点，防止任务跑偏。

6. 错误不是要掩盖，而是要保留
失败是构建 Agent 过程中的一部分。保留错误日志（如失败的操作、堆栈信息），能帮助模型更新内部信念，减少重复错误。

7. 少样本提示不是灵丹妙药，要防「同质化陷阱」
模型会盲目模仿上下文中的行为模式。Manus 通过引入结构化变化（如不同措辞或顺序），避免模型在长任务中陷入复制粘贴式幻觉。

💰 Anthropic 估值超千亿美元，Claude Code 上大分，核心团队反复「横跳」

据 The Information 报道，多位投资人正推动一笔可能将 Anthropic 估值抬至 1000 亿美元以上的融资交易，而这距离上一次宣布的 580 亿估值融资，才过去 4 个月。

报道指出，Anthropic 盈利能力虽不及 OpenAI，但增长更猛。据悉，2025 上半年，Anthropic 年化收入已突破 40 亿美元，是去年同期的 4 倍；公司预计 2026 年收入将达到 120 亿美元。

Claude Code: From Zero to Hero. What is Claude Code? | by Daniel Avila | Jun, 2025 | Medium

而 Anthropic 旗下的智能编程工具 Claude Code 正在成为 Anthropic 重要收入来源：「自从五月份推出 Claude 4 模型，Claude Code 每周下载量暴增 6 倍，达到 300 万次；活跃用户规模增长了 300%，收入增长率超过 5.5 倍。」

目前 Claude 模型直接售卖的毛利率约为 60%，正朝 70% 靠近。不过通过 AWS、Google Cloud 渠道的 Claude 模型销售，曾出现 -30% 的负毛利率；整体毛利率可能在 50%-55% 之间。Anthropic 向投资人透露，Claude Code 目前年化收入已超过 2 亿美元，或每月超过 1670 万美元归功于 Claude Code。

不过，日前，据多方信息显示，AI 编程软件巨头 Cursor 在中国大陆地区停止供应 Anthropic、OpenAI 和 Google 的多款 AI 模型。据悉，当用户选择上述三家的模型后，Cursor 会弹出「模型供应商不为您所在的地区提供服务」的相关提示。

而本次断供的具体模型包含了 Anthropic 旗下的 Claude Sonnet 家族等编程性能优异的模型。后续，Cursor 官方更新了使用文档，回应了上述情况。其表示，Cursor 内部分模型的供应商有基于地理位置的限制，模型是否可用取决于用户是否处在模型供应商支持的 API 位置。

未来，若还出现上述的地区限制问题，Cursor 将不会显示相关模型。Cursor 也给出了一部分解决方案：用户若近期支付了订阅费用，但因模型供应商不支持服务而失去对模型的访问权限，可以在 Cursor 中申请按比例退款。

另外，两位原先跳槽至竞争对手 Anysphere 的关键人物——Boris Cherny 和 Cat Wu——已重新回到原公司 Anthropic。据悉，这两人曾是 Anthropic 编程产品 Claude Code 的核心负责人，7 月初离职后在 Cursor（由 Anysphere 开发）担任更高职位，分别为工程负责人和产品负责人。

🔗 https://www.theinformation.com/briefings/anthropic-hires-back-two-coding-ai-leaders-cursor-developer-anysphere?rc=qmzset

🤯 OpenAI 前 CTO 自曝首个开源多模态 AI 项目

本周，OpenAI 前 CTO Mira Murati 发文公布了其创企 Thinking Machines Lab（TML）最新进展：

TML 目前已筹集了 20 亿美元资金，由风投公司 a16z 领投，英伟达、AMD、Accel、ServiceNow 等公司参与投资；

TML 正在构建一种多模态 AI，能够与用户、与世界进行自然互动，并通过对话、视觉、协作等多方式融合，进行多方匹配。

Mira 透露，TML 首个产品将会在未来几个月内公布，产品中还包含了一个重要的开源组件，能够帮助研究人员和初创公司开发定制模型。

据 6 月 The Information 报道，TML 目前在没有任何产品面世的阶段，其估值已破百亿美元。同时据报道透露，TML 目前正开发面向企业的定制 AI，同时正在计划为消费级市场开发产品——与 OpenAI ChatGPT 类似的聊天 AI 机器人。

🔗 https://x.com/miramurati/status/1945166365834535247

🏆 超过 DeepSeek R1，Kimi K2 拿下开源模型第一

本周，权威大模型排行榜 LMArena 公布了最新排名结果，近期发布的 Kimi K2 超越 DeepSeek R1，拿下了开源模型第一名。

LMArena 表示，Kimi K2 凭借自身性能以及 3000 的社区投票，在 LMArena 总排行榜上获得第五名的位置。值得一提的是，Kimi K2 和 DeepSeek R1 为 LMArena 排行榜前十中，两个来自中国的模型；但在全球前 20 名中，来自中国的模型扩展到 7 个，MiniMax M1、Qwen3-235b 等模型均有上榜。Kimi-K2 于上周发布并开源，号称「具备超强代码和 Agent 能力的 MoE 架构基础模型」。

官方介绍，K2 总参数达到 1T，激活参数为 32B，上下文长度为 128k，并且支持 ToolCalls、联网搜索功能等。据悉，在 SWE Bench Verified、Tau2、AceBench 等基准性能测试中，Kimi K2 均取得开源模型中的 SOTA 成绩，展现出在代码、Agent、数学推理任务上的领先能力。

另外，针对「Kimi K2 采用了 DeepSeek V3 架构」的质疑，Kimi K2 开发成员刘少伟日前在社交媒体进行了回答。其表示「确实继承了 DeepSeek V3 的结构，但调整适合 Kimi 模型的结构参数」。并且其透露，V3 架构符合开发相关成本预算，因此选择了完全继承 V3 架构。

🔗 https://mp.weixin.qq.com/s/2RPmHf\_8KqIjXbY5jLdztQ

Hunt for Tools｜先进工具

📺 首个直播 AI 视频大模型亮相，前 AI 大神 Karpathy 投资

Decart AI 最近公布了全球首个直播 AI 大模型「MirageLSD」。官方表示，输入任何视频流，无论相机直播画面还是电脑屏幕里的游戏直播画面，都能通过用户想法，将画面转换为用户所想要的，并且画面延迟可做到 40ms 以下。

从公布的演示样片来看，用户打个响指就直接置身动画虚拟场景，木棍一挥就立刻变为炫酷的光剑。

据悉，这是 Decart 基于 Live Stream Diffusion 开发的新技术，拥有两大黑科技：Diffusion Forcing，让 AI 记住每一帧的重点；History Augmentation，让 AI 实时纠错，画面减少穿帮。

值得一提的是，使用 MirageLSD，理论上可以无限制开播，并且能做到全场景适配。

而支撑 MirageLSD 的基础，是针对模型架构定制的 CUDA 巨型核心，再配上快捷蒸馏和模型修剪技术，达到了 24fps/s 的实时生成画面和效率直接提升 100 倍。目前 MirageLSD 已上架 decart.ai，下周将推出 iOS 版和 Android 版。

前特斯拉 AI 总监、OpenAI 联创 Andrej Karpathy 也是 Decart 的小额天使投资人，他在社交平台发文称：「Veo 等视频扩散模型很神奇，但它们需要花费数秒/数分钟才能生成，MirageLSD 是实时的魔法。」在他看来，这项技术会很快变得非常好，感觉它很通用、很强大，但技术难度也很高。

🔗 https://x.com/DecartAI/status/1945947692871692667

👌 OpenAI 发布 ChatGPT Agent

本周，OpenAI 正式发布 ChatGPT Agent 功能。

据悉，通过整合 Operator + Deep Research + ChatGPT 本体，用户只需描述任务，ChatGPT Agent 就能自主判断所需工具，自动访问网页、提取信息、运行代码、生成 PPT 或表格等，并可在执行过程中实时展示相应步骤、接受临时中断和修改指令。

凌晨发布会结束后，OpenAI CEO Sam Altman 在社交媒体上写道：「观看 ChatGPT Agent 使用计算机完成复杂任务，对我来说是一个真正的「感受 AGI」时刻；看到计算机思考、计划和执行，有种与众不同的感觉。」

OpenAI Releases ChatGPT Agent. ChatGPT can now think and take action… | by Jim Clyde Monge | Jul, 2025 | Generative AI

而 ChatGPT Agent 的亮点如下：

内置图形/文本浏览器、终端和 API 调用器等工具，支持手机端使用，任务完成后可自动推送结果；

可连接 Gmail、GitHub 等第三方应用，深度嵌入用户真实工作流；

在多项基准测试中表现领先，综合性能位居行业前列，多个测试结果超越了 OpenAI 此前的模型；

Pro 用户每月享有 400 条调用额度，其他付费用户为 40 条，并支持按需扩展配额；

值得一提的是，用户不仅可以在桌面端启动 ChatGPT 的 Agent 模式，在手机端也同样适用。

🎶 Adobe Firefly 现在可以为视频生成 AI 音效了

Adobe 宣布为旗下生成式 AI 工具 Firefly 增添多项重磅视频功能更新，包括 AI 音效生成、「文本转头像」视频、「关键帧裁剪」、样式预设、运动保真度优化等。

在此次更新中，最引人注目的新功能之一是「生成音效（Generate Sound Effects）」的测试版上线。用户可通过文字描述自定义生成所需的音效，例如「狮子咆哮」或「玻璃碎裂」。不仅如此，Adobe 还引入了语音输入辅助功能，允许用户录制音频节奏作为提示，提升生成音效的匹配度与真实感。

另一大亮点是「Text to Avatar」（文本转头像）功能的测试版推出。该功能支持用户将剧本快速转换为由虚拟形象朗读的视频内容，适用于课程讲解、短视频创作、营销宣传等多类场景。用户可从头像库中选择虚拟形象，定制背景、口音等细节，Firefly 便可自动生成看似真人出演的视频。

Adobe's Firefly models can now generate sound effects for videos, and I was impressed

除音效与头像功能外，Adobe Firefly 还推出多项提升视频生成体验的工具：

合成参考（Composition Reference）：允许用户上传一个参考视频，并将其结构迁移到新生成的视频上，让生成结果更贴近原始构想。

样式预设（Style Presets）：一键应用视觉风格，包括黏土动画、动漫、线条艺术、矢量图、黑白风等。

增强提示（Enhance Prompt）：Firefly 可自动补全用户提示词，提升文本提示的表达力与意图匹配度。

关键帧裁剪（Keyframe Cropping）：支持用户上传第一帧和最后一帧画面，设定裁剪规则和场景描述，系统自动生成符合结构的视频片段。

运动保真（Motion Fidelity）优化：改进模型对动作的模拟能力，使生成的视频运动更自然流畅，适用于动物、人类、自然场景等。

在模型集成方面，Adobe Firefly 也持续扩充生态。目前已引入 Topaz、Moonvalley Marey，以及 Luma AI 的 Ray 2 和 Pika 2.2 等模型。这些模型将分别加入 Firefly Boards 与视频生成模块中，为用户提供更丰富的风格与输出效果。

🔗 https://www.zdnet.com/article/adobe-firefly-can-now-generate-ai-sound-effects-for-videos-and-im-seriously-impressed/

Hunt for Fun | 先玩

👍 大赞！DuckDuckGo 推出 AI 图像屏蔽功能

如果你对网上泛滥的 AI 图片感到厌烦，那不妨尝试体验国外这款搜索引擎 DuckDuckGo。

最近，DuckDuckGo 宣布上线一项新功能：用户现在可以在搜索结果中主动屏蔽由 AI 生成的图像内容。据介绍，用户只需在完成搜索后点击「图片」标签页，即可看到新增的「AI 图片」下拉菜单。

a screenshot showing the new setting in DuckDuckGo's browser, which lets users switch off AI images in search results.

用户可在此选择「显示」或「隐藏」AI 生成内容。同时，也可以在搜索设置中启用「隐藏 AI 生成的图像」选项，实现全局屏蔽。值得注意的是，该过滤功能依赖于社区手动整理的开源黑名单，包括知名插件 uBlockOrigin 和 uBlacklist 提供的「nuclear」级 AI 屏蔽列表。

DuckDuckGo 在社交平台发文表示：「虽然这一过滤机制无法做到 100% 捕捉所有 AI 生成图像，但能显著减少用户搜索中遇到的相关内容。」

目前，该功能仍处于初步阶段。DuckDuckGo 也表示未来将继续扩展过滤器选项，但暂未公布更详细的路线图。

🔗 https://techcrunch.com/2025/07/18/duckduckgo-now-lets-you-hide-ai-generated-images-in-search-results/

Hunt for Insight｜先知

👀 孙正义： 1000 名 AI Agent 取代 1 个工作岗位

7 月 16 日晚，软银创始人兼 CEO 孙正义在软银主办的客户闭门会中高调宣布：「在我们集团，人类编程的时代即将终结。」他表示，软银正全面推进由 AI Agent 取代程序员与部分岗位的计划，并预言今年将部署多达 10 亿个 AI Agent，未来数量甚至将达到数万亿级别。

孙正义估算，要想完全替代一名人类员工，平均需要部署 1000 个 AI Agent。这一换算标准背后的原因，是「人类员工拥有复杂的思维过程」，而 AI Agent 则需协同执行、分布式协作，才能实现等效产出。

What Masayoshi Son can teach us about investing | Reuters

孙正义对未来的愿景，是让 AI Agent「全年无休、全天在线」，自主运作，取代现有的大量人力流程。他强调，这不仅是代码工作者的末日，也是整个组织结构自动化的起点。

如果按其估算，每个 AI Agent 的运营成本约为每月 40 日元（折合约 0.23 欧元），那么 1000 个 Agent 的总成本也仅为每人每月 230 欧元，远低于传统雇佣一名人类员工所需的薪资开支。

孙正义称，这将极大提升企业效率与规模弹性。

对于 AI Agent 当前存在的「幻觉」问题，他并不担忧，认为这是「暂时的小问题」。他更关心的是：如何构建支持这一 AI 群体运行的基础设施，包括创建和管理海量 Agent 的软件、操作系统，以及维持其运行的数据中心与发电设施。

🔗 https://www.lightreading.com/ai-machine-learning/softbank-aims-for-1-billion-ai-agents-this-year?

💡 OpenAI o1 核心贡献者：AI 将成为第四种杠杆

近期，前 OpenAI 研究员 Hyung Won Chung 在离职消息曝光后，首次系统性地分享了他对 AI 的长期思考，塑造了一个新的想法：「AI 杠杆机制」。

在 Chung 看来，人工智能并不仅仅是一种工具，而是一种史无前例的「杠杆机制」——可以以极低的输入，撬动巨大的价值输出，从个人到文明层面，全面重塑创造力的来源。

Two more top OpenAI researchers defect to Meta - Sherwood News

Chung 将 AI 定义为继人力、资本、代码之后的「第四种杠杆」。这四种杠杆的共同点，是都能让有限的资源撬动无限的可能。但不同于前三者，AI 杠杆具有前所未有的组合性、可扩展性和自治性，甚至可以「自我复制」，这也让它成为历史上最强大、最不可预测的一种杠杆形式。

Chung 对 Agent（智能体）尤为关注。他认为，Agent 正是 AI 杠杆的原子单位，像细胞一样可繁殖、可互联，并天然具备复合杠杆的能力。一个 Agent 可以完成一名员工的任务，但十个 Agent，并不需要十份薪水，也不增加十倍协调成本。

另外，Chung 还提出了一个设问：「如果把整个人类文明看作一个系统，它的目标是什么？」他的答案是：持续发现新知识，也就是科学进步。

在他构想中，AI 不仅是个工具，更是连接人类知识尖峰的壳层。今天的科学知识被分布在不同领域、不同学者之间，彼此割裂，合作成本极高。而 AI 能将这些高维孤岛串联起来，像细菌的质粒一样，进行「知识的水平基因转移」。

🔗 视频链接：https://x.com/hwchung27/status/1945355238187393257

🔍 Perplexity CEO：AI 的杀手级应用不是聊天机器人，而是浏览器

近日，Perplexity 联合创始人兼 CEO Aravind Srinivas 在 The Verge 的专访中表示：AI 的杀手级应用不是聊天机器人，而是浏览器。

Srinivas 认为，AI AGent 真正的价值在于能够代替用户完成一系列具体操作，从任务理解到自动执行，并适时请求用户接管。而在现有技术环境中，浏览器是唯一能提供这一完整语境的平台。

Aravind Srinivas | The Visionary Who Left Academia to Lead AI's Future!

他强调，浏览器的「登录状态」和「前端透明性」是 Agent 运作的最佳载体，它让用户既能监控代理的行为，又能随时接管操作，避免黑箱风险。面对 OpenAI、Anthropic 等公司正在推动的 MCP（模型上下文协议）代理架构，Srinivas 保持开放态度。

他指出，MCP 面临的安全问题、远程鉴权复杂度尚未解决。而浏览器模式则能直接利用本地登录环境、DOM 结构与用户操作上下文，「无需再建一套虚拟世界」。他同时透露，未来会采纳部分 MCP 接口，如 Linear、Notion、GitHub，但优先考虑易部署、低成本、高可靠的 Agent 路径。

Srinivas 还证实，苹果高管 Eddy Cue 曾在 Google 反垄断案中公开称赞 Perplexity，并与他有过接触。他也承认 Meta CEO 扎克伯格曾试图邀请其加入。对于是否出售公司，他表示仍以独立 IPO 为目标，预计在 2028 或 2029 年上市，前提是达到 10 亿美元营收与盈利能力。

🔗 https://www.theverge.com/decoder-podcast-with-nilay-patel/708256/perplexity-ceo-decoder-aravind-srinivas-comet-browser-ai-search

彩蛋时间

A neon wireframe visualization of a space explorer floating, traced in glowing violet and lime green vector lines. Suspended in a digital void, the figure is surrounded by speed trails, motion blur, and shifting geometric shadows, evoking a sense of kinetic energy and futuristic momentum. --ar 3:2 --v 7

A neon wireframe visualization of a horse galloping, traced in glowing cobalt blue and fuchsia vector lines. Suspended in a digital void, the figure is surrounded by speed trails, motion blur, and shifting geometric shadows, evoking a sense of kinetic energy and futuristic momentum. --ar 3:2 --v 7

作者：@azed_ai

Prompt:A neon wireframe visualization of a [subject], traced in glowing [color1] and [color2] vector lines. Suspended in a digital void, the figure is surrounded by speed trails, motion blur, and shifting geometric shadows, evoking a sense of kinetic energy and futuristic momentum.

链接：https://x.com/azed_ai/status/1936741480972079563

欢迎加入 APPSO AI 社群，一起畅聊 AI 产品，获取#AI有用功，解锁更多 AI 新知👇

我们正在招募伙伴

📮 简历投递邮箱hr@ifanr.com

✉️ 邮件标题「姓名+岗位名称」（请随简历附上项目/作品或相关链接）

更多岗位信息请点击这里🔗

声明：本文内容及配图由入驻作者撰写或合作网站授权转载。文章观点仅代表作者本人，不代表科技区角网立场。仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。点击这里

点赞 0
分享
微信扫一扫
加入群聊
扫码加入群聊