Perplexity Comet 的发布,正式揭开了人工智能浏览器群雄逐鹿的序幕。

帕特里克·麦吉尼斯

2025年7月15日


A cartoon of a person using a computer

AI-generated content may be incorrect.图 1. 人工智能艺术创作。数十年来,我们通过浏览器与网络互动的方式几乎一成不变。而今,人工智能正准备彻底颠覆这一切。

引言

过去一年,我在专栏中多次探讨了强大人工智能代理的崛起与扩散,其核心趋势日益明朗。

MCP(模型上下文协议)的标准化,极大简化了人工智能代理与各类工具和数据的连接,为其能力的飞跃铺平了道路。

这直接催生了以 Manus AI 为代表的,能力更为强大的通用人工智能代理。

我们已掌握了设计高效人工智能代理的最佳实践:将前沿模型与强大工具通过模型上下文协议进行整合,以简约的工作流实现强大的功能

人工智能编程助手是这一领域的先锋。借助模型上下文协议,它们能做的早已超越编码本身。例如,Gemini CLI 能作为通用代理执行本地命令,而 Cursor 更是能够即时构建和运行商业仪表盘,几乎可以管理整个业务流程。

人工智能代理的应用已然来到引爆点,深度融入了无数商业和个人生活场景。

现在,这场变革的浪潮终于涌向了浏览器。上周发布的 Perplexity Comet,正是这股新浪潮中最引人注目的先驱。

人工智能重塑浏览器体验

当然,Perplexity Comet 并非第一个试图颠覆浏览器的产品。此前,已有许多人工智能代理或助手,以浏览器扩展或独立应用的形式,试图实现网页浏览的自动化。

它们的核心能力大同小异:代替用户浏览网页、提取数据、与网站交互,并自动化处理表单填写、数据录入等重复性任务。

在不另起炉灶开发全新浏览器的情况下,实现这些能力主要有两种路径。

第一种是集成浏览器扩展。人工智能助手作为 Chrome 等主流浏览器的一层功能扩展,增强用户既有的浏览体验,为日常网页互动提供情境感知支持,提升效率。

Brave 浏览器的 Leo 助手和 Chrome 的 Copilot 扩展便是如此。它们虽有助益,却远未达到颠覆性的程度,更像是内嵌的聊天机器人。

第二种是能够自动调用浏览器的独立人工智能代理。三大顶尖实验室的探索最具代表性:Anthropic 的 Computer Use、OpenAI 的 Operator 以及谷歌的 Project Mariner。

这些项目真正致力于在网络上执行任务,展现了巨大的潜力,但目前仍是尚不稳定的测试产品。

此外,还有一个关键的基础设施,即为人工智能代理提供隐形的浏览器功能。BrowserBase 运行着一个人工智能可在后台调用的无头浏览器,为各类应用赋予了网页浏览的能力。

人工智能优先的浏览器

在一个技术日新月异的时代,2025 年的 Chrome 浏览器在许多核心交互上,竟仍与三十年前的网景浏览器如此相似,这本身就值得深思。

尽管速度和功能已不可同日而语,但其底层的协议、标准和用户界面范式,却表现出惊人的稳定性。

而人工智能,注定要改变这一切。

因此,一个合乎逻辑的演进方向是:从零开始,打造一款人工智能优先的浏览器

这能确保人工智能与浏览体验的无缝整合,避免信息在不同工具间传递时产生损耗,并提供高度一致的交互界面。

那么,一款人工智能优先的浏览器究竟是何模样?

近期发布的几款产品,如 Perplexity 的 Comet、The Browser Company 的 DIA 以及 Opera 的 Neon,为我们揭开了未来的一角。

Perplexity 的 Comet 浏览器

Perplexity Comet 是一款基于 Chromium 内核打造的人工智能浏览器,它深度集成了 Perplexity 强大的搜索引擎和一个名为 Comet 的侧边栏助手。

它采用混合式人工智能架构:基本任务在本地处理,以保证速度和隐私;复杂操作则调用云端 API,以实现更强大的功能

A screenshot of a computer

AI-generated content may be incorrect.图 2. Comet 助手能自动整理购物清单,并为你一键加满购物车。

Comet 的核心人工智能特性,聚焦于理解网页内容并自动化执行各类任务:

网页互动:通过专属的助手按钮,你可以随时与当前打开的任何标签页进行对话。无需切换,即可让它分析 YouTube 视频、总结文章要点。

信息组织:Comet 能自动从信息流中高亮你可能感兴趣的新闻,关闭闲置数日的标签页,并智能地将相关的研究页面归类整理。

日程安排:它能快速查阅你的日程,提醒你接下来的会议对象,列出今日待办事项,甚至帮你协调会议时间。

智能搜索:地址栏和新标签页的搜索功能,默认由 Perplexity 的人工智能搜索驱动,并支持语音输入,实现真正的“动口不动手”。

任务自动化:Comet 可以帮你自动处理繁琐任务,比如一键接受 LinkedIn 的人脉邀请,或是在电商网站上实时追踪商品库存。

A screenshot of a video chat

AI-generated content may be incorrect.图 3. 在侧边栏一键总结网页内容,这一功能便捷又实用,必将成为未来浏览器的标配。

Comet 极其注重隐私,数据可存储于本地,并提供严格的防追踪控制。本地化操作不仅更快、更经济,还能保持你在各个网站的登录状态,免去了反复验证的麻烦。

它还内置了广告拦截功能,并且可以从 Chrome 无缝迁移所有设置、书签和扩展。

Perplexity 的雄心,是推动用户从手动导航的浏览模式,迈向人工智能驱动的认知模式。挑战 Chrome 的霸主地位无疑是条险路,但其背后的战略意图清晰而坚定:控制权

如果人工智能代理的体验需要依附于他人开发的浏览器,那么它将永远受制于人,无法自由定义功能,只能被动地追赶界面更新。

A screenshot of a computer

AI-generated content may be incorrect.图 4. 仅用一个提示,就能生成详尽的伦敦五站式徒步旅行路线。

The Browser Company 推出的 Dia

Dia 是知名浏览器 Arc 的开发商 The Browser Company 倾力打造的另一款人工智能优先浏览器。它的核心理念,是实现所有在线活动的深度人工智能整合。

The Browser Company 一直以革新浏览器为使命,但他们也深刻体会到,这一领域对变革的抵抗力有多么顽固。

我们所有的软件工具都在变得更好——更协同、更灵活、更强大。唯独浏览器,似乎还停留在二十五年前的模样。

人工智能,或许就是打破僵局的那个变量。Dia 旨在为用户提供一种浏览与智能辅助无缝衔接的体验,消除搜索、阅读与行动之间的壁垒。

它通过几种创新方式运用人工智能:

其侧边栏的 AI 助手会观察你访问的所有网站,随时待命,帮你检索信息、完成任务,甚至可以与你探讨当前和历史浏览内容。

它的地址栏不仅用于导航,更是一个强大的人工智能命令交互界面。

独特的用户技能功能,允许用户编写简单的代码片段,实现高度定制化的浏览器自动化。

通过选择性地开放浏览历史,Dia 可以提供更加懂你的个性化响应。

A screenshot of a computer

AI-generated content may be incorrect.图 5. Dia 能将一封邮件轻松转化为待办事项和行动计划,为你省下大量规划精力。

结论:迎接心流式浏览时代

我曾在文章中提出“万物皆可氛围感”的说法,意指人工智能终将自动化我们几乎所有的线上活动。

但由于人工智能能力的不规则前沿特性,这场变革对不同领域的影响并非同步发生,而是有先有后,有深有浅。但可以确定的是,任何技术和能力,都终将被足够强大的人工智能所颠覆。

现在,轮到浏览器了。

坦白说,由于邀请制、系统限制和订阅费用等原因,我尚未能亲身体验这些新一代的人工智能浏览器。因此,它们究竟是名副其实的爆款,还是只是昙花一现的尝试,我无法断言。

但我坚信,人工智能浏览器这一形态,必将成为未来的主流交互界面

除了 Perplexity 的全力押注,OpenAI 据传也将在未来几周内发布自家的 AI 浏览器,这表明他们也认为,仅有独立的代理是远远不够的。

用户永远会选择阻力最小的路径。一个真正的人工智能优先浏览器,能够无缝继承用户习惯,同时将越来越多的网络苦差事自动化,没有任何理由不被接纳。

各大人工智能实验室将持续创新和实验,不断打磨功能与交互,寻找那个最优解。

请尽情享受和体验这些即将大规模面世的新物种吧。它们尚处萌芽,但会像所有伟大的技术一样,不断进化和完善。一个由人工智能重塑的心流式浏览时代,正向我们走来


一键三连点赞」「转发」「小心心

欢迎在评论区留下你的想法!