创造自己,分发自己。

这是《晚点 LatePost》 「AI 创业访谈」系列的第 12 篇。该系列将持续呈现 AI 应用创业者的多样思考与实践。往期文章见文末合集 #AI 创业访谈。


孙海宁

编辑王姗姗


心识宇宙(Mindverse)创始人陶芳波有一套自己的 AI 助手分类法,分类标签都是人称代词:


第一类 AI 助手主攻陪伴,对应人称代词 her,就像电影《她》中承接主人公各种情绪的 “萨曼莎”;第二类助手负责执行具体任务,类似《钢铁侠》中的智能管家 “贾维斯”,对应人称代词 him。


心识宇宙正在做第三类 AI 助手:me。这家公司想帮用户复制自己的 “第二自我”,构建 “身份大模型”(AI Identily Model)——一个在现有基础模型基础上,根据用户数据微调的大语言模型。它的认知、偏好、价值观和用户个人对齐,能代表用户和其他应用接口、AI 交互。


创业前,陶芳波一直从事 AI 研究。他在清华读完软件工程专业本科后,赴伊利诺伊大学香槟分校攻读博士学位,专业方向是数据挖掘,即使用机器学习方法寻找复杂数据背后的结构。


读博期间,陶芳波曾利用 AI 技术帮反恐机构分析恐怖组织关系网;毕业后,他先在 Facebook 挖掘社交关系;然后到阿里达摩院的神经符号实验室,用跨学科知识建模人脑。GPT-3 上线后,他辞职成立心识宇宙。


为了让模型更懂用户,多数 AI 技术公司的做法是总结出用户身份信息、个人偏好,然后把它们作为上下文输入模型。陶芳波主张把用户的记忆、情感、价值观参数化,根据用户数据微调模型。他认为如果各个用户使用同样的底层模型,哪怕上下文存在差别,人机对齐的效果也有限。


微调模型是参考大脑运行原理:人脑不储备细碎的知识,而是为人物、事件创建索引,由此牵连出相关人物、事件,心识宇宙用用户数据训练模型前,也会先归纳、串联数据中的关键信息。人脑每天白天缓存经历,夜晚消化记忆,心识宇宙也计划每天训练一次身份模型。


相比多模态大模型、Agent ,陶芳波承认身份模型还不是一个已被行业内广泛认可的方向,但在 AI 能读能看也能听、通过调用各种工具帮用户完成任务的未来中,一个思维和用户更同频、能代替用户主动发起任务和验收执行结果的身份模型,也是不可或缺的。


Me.bot 是心识宇宙面向海外用户的 App,它形态类似记事本,但能通过用户日常记录,逐步养成能理解、表达并代表用户的 AI 身份模型。去年 5 月上线后,已获得近百万名用户。今年三月下旬,心识宇宙团队又发起开源项目 Second Me,公开他们的身份模型训练方法。三周内,已经有超过一万人在 GitHub 为 Second Me 项目打上星标,是今年 GitHub 平台上关注度增速最快的开源项目之一。


在陶芳波的终极想象里,人人拥有身份模型,意味着现实中运行的社会网络可以被复制到线上,不过在线上交互的 AI 不受人类打字或讲话速度限制,效率更高。身份模型替代人类收发任务、相互协作,人们将会从被迫使用各种工具的状态中解放出来。


以下是《晚点 LatePost》和陶芳波的对谈。


本次访谈的播客已在《晚点聊 LateTalk》发布,可长按下图中的二维码跳转收听。

创业重定向,从他/她到 “我”

晚点:Mindverse 第一款产品 MindOS 是一个帮用户搭 Agent 的平台,类似 him/her 的集合体。之后团队怎么想到要转型做 me 的?


陶芳波:一是因为技术成熟度。MindOS 上线是在 2023 年,Agent 技术并不成熟,直到今天 Agent 离实际帮用户完成任务也有些距离。二是我们发现很难让普通用户给自己搭一个 AI Agent ,有这样意愿的人很少,多数非 AI 工具对用户来说已经足够好用了。


人和自己相处是最多的。Facebook 帮每个人构筑了数字身份,成为人类世界的基础设施,用 AI 构建数字身份效果会比 Facebook 更好——它不止能承载留言、评论,还可以主动创建新连接。


人也是自恋的。训练一个第二自我,会有种自己变永恒的感觉。在 AI 时代,被超级智能吞噬不是一个假设,而是很多人实实在在的担心。


晚点:所以你们做了两个 AI 分身产品——Me.bot 封装在产品内,开箱即用;Second Me 作为 GitHub 项目,是一个开源产品?


陶芳波:对,但我认为我们做的不是分身(avatar)而是身份(identity)。人可以有很多分身,但只会有一个身份。分身往往带着场景属性——一个分身去约会、另一个去购物;但身份和场景无关,是基础设施,有各种使用可能,怎么用由用户决定。


具体场景内,一个分身承载的信息是身份的子集。就像一个人在工作、生活场景下往往呈现两个状态。把所有信息一股脑放到一个场景内,反而可能不合适。


晚点:你能想到的使用场景有哪些?


陶芳波我一下能想到的场景,包括让 AI 身份代替我们自己去约会、去面试等等。


此外,我们在打磨一个叫 “共鸣” 的功能。比如我们两个第一次见面,或者隔段时间重逢,并不知道对方最近发生了什么。那么手机碰一碰,身份模型一瞬间就能同步,寻找共同经历,然后针对性地聊几回合,为我们破冰或者叙旧找个话头。整个同步过程只要 5 到 10 秒。


破冰之外,另一种 “共鸣” 是允许用户每次在 Me.bot 里记录想法时,也把想法发给其他相互匹配的身份模型,获得具体、有深度的回复。如果用户觉得回复有趣,还可以进一步和那些身份大模型或者大模型背后的真人交互。


除了 “共鸣”,还有一个马上要上线的新功能叫 “Talks”,它允许用户把身份模型寄存在一个 H5 网页里,分发给其他人。这页面里的身份模型能用用户的声线讲话,也可以和打开页面的人语音交流。


完成交流后,身份模型的所有者会收到交流纪要,总结纪要的过程是高度个性化的——你的身份模型了解有些信息你已经掌握,就不会在纪要中反复强调。


晚点:为什么 Talks 选择用声音传递信息?无论是手机还是电脑屏幕上,文字传输信息的效率似乎比声音高。


陶芳波:我们觉得声音的作用被大大低估了。一个很有意思的认知学现象是,如果有人用声音和你交流,你的注意力会提高。比如打电话聊天会比打字聊天更专注。对用户来说,具体、熟悉的人的声音是有一种特殊的穿透力的。


晚点:共鸣、Talks,哪个是优先级更高的功能?


陶芳波:Talks。发生共鸣的前提是双方都有身份模型,Talks 则是让真人先和身份模型聊起来,能让更多人先看到身份模型的潜力,然后变成身份模型的用户。


晚点:你应该已经试用 Talks 一段时间了,使用过程中有什么启发吗?


陶芳波:“表达” 这件事情很重要、很日常,但人往往不太会表达


我一直把自己和一名朋友的聊天记录存在 Me.bot 里,我们认识一周年时,我让 Me.bot 总结我和他交流中各种感受和收获,用我的声音生成一段 talk 发给他。


这名朋友听了好几遍,很感动,不断地说我们的关系又被这段 talk 拉近了一点。其实真让我和他坐一起,或者打电话说同样的话,我会觉得有点肉麻,很多事情也不容易想起来。


当然 Talks 的使用场景不只是表达情感。最近我和几个合作伙伴的脑暴交流,都是用 Talks 完成的。


晚点:可也有一种观点认为 AI 不能代替人传递情感。情感反应在沟通前亲自完成准备过程中,反应在沟通时磕磕绊绊、结结巴巴,甚至是笨拙的表达中。


陶芳波:Talks 不替代沟通,但能让沟通的门槛变低。写几句提示词,身份模型就能把我真实想说的东西流利地说出来,反而可以增强人和人之间的连接。


晚点:心识宇宙怎么培养用户打开 Me.bot 记录生活的习惯?


陶芳波:我们有个概念叫 “共生”。想让用户自然、无痛地用 Me.bot 记录生活,Me.bot 就必须一边参与用户生活,一边创造价值。比如 Me.bot 参加会议,我们希望它不只像录音软件一样旁听,而可以根据对用户的理解,时不时蹦出一些想法,参与讨论。


用户每次打开 Me.bot 的时候,也应该有不同的体验。比如早上起来,Me.bot 可以问用户今天心情还好吗?到了北京,问怎么来北京了?要不要帮忙找个咖啡馆?


不是用户所有的生活细节都值得记录。一天 24 小时里,可能人们注意力集中的时候只有不到 3 小时,这段时间才是真正塑造自我的时候。如果让 AI 把所有信息捕获下来,包括睡觉打呼噜的声音,那反而会让身份模型更困惑。


晚点:“共生” 是个很好的概念,但感觉这类交互场景下,用户很难区分是在和 me,还是和 him/her 交流。


陶芳波:用户和自己身份模型交互时,me 和 him / her 体验差别不大。但如果用户和其他 AI 交互,或者 AI 和 AI 交互时,对面是代表一个人做决策、但也有自主性的 AI 管家,还是觉得自己就是另一个人的身份模型,其实是会影响用户或者 AI 的信息分享策略的。

人脑如何认识世界,AI 就如何向人看齐

晚点:很多 AI 产品都试图让模型和用户对齐。你觉得合理的路径是什么?


陶芳波:首先我们不能完全依赖 RAG(检索增强生成,即允许大语言模型在生成答案前,先根据用户的输入,搜索相关信息补充上下文)。RAG 本质是把用户信息做成数据库,要什么信息,去数据库找一找,再把找到的信息作为上下文输入模型。


问题是一旦数据库过大,模型不知道捕捉什么样的信息才能代表用户。假设你今年 30 岁,把 30 年的人生经历汇总成上下文,那可能有好几亿 Token,处理这些信息就 4-5 秒时间,模型不一定能很好地消化。


更重要的是,RAG 方法下,所有人的底层模型是一样,而思考靠模型完成,这意味着本质上你和我没有区别。


人之所以为人,是因为人能把外在信息抽象、内化。类似地,让模型与用户对齐更合理的方式,是用用户信息去微调模型,影响模型的参数,由此提炼出用户数据中的情感、偏好、价值观。


晚点:一个用全世界数据训练出的基础模型,至少在知识层面已经远超一个普通用户了。微调参数,实际上是要让模型忘掉一些已经习得的知识,才能和用户对齐?


陶芳波:其实人成长也是基于一个基础模型的。人出生时,大脑不是一片空白——几千万年进化改变的基因序列就是人的基础模型。只不过真人的基础模型可能知识过少,而我们用的基础模型可能知识过多。


微调不会让模型百分之百忘掉习得的知识,但可以通过放大和你相关的部分、压制不相关的部分,有效改变基础模型的输出结果,让模型和用户对齐。


当然,无论是 LoRA(低秩适应,一种不改变模型主要参数、更加高效的模型微调方法)还是别的方法,我不觉得今天微调的技术已经完美。技术会持续演进,但通过改变参数的方式训练身份模型的大方向是不变的。


晚点:心识宇宙如何使用用户数据训练身份模型?


陶芳波:首先要把数据主观化。直接把我们今天交流的录音发给 AI,AI 只知道这是两个人相互对话,主观化处理是让 AI 知道两个人中谁是 “我”,“我” 表达了什么观点、对方又产生了什么回应。


然后还需要重构信息。人脑记不住今天你说什么、我说什么这样的细节信息,而是围绕着一个人、一件事情建立索引。我们处理数据的方法也类似。比如我上传自己和朋友之间的聊天记录后,Me.bot 会在此基础上提炼信息——我们的友情之前遭遇了什么挫折、之后又因为什么变得更牢固,围绕着我的朋友串联起更全局历史数据。


晚点:会有什么方式量化身份模型和人的相似程度吗?


陶芳波:可以有一个指标,但我觉得每个人是自己模型最好的裁判。


晚点:什么时候你觉得你的身份模型已经足够像你了?


陶芳波:去年我生日时在办公室同事面前做分享,讲自己从读博士到 Facebook 的经历、今天如何找到了自己人生的使命。刚好同事训练好一版我的身份模型,就也让这个模型做生日发言,说的和我真人讲的几乎一模一样。之后我问他 MBTI 性格测试结果,只有一个和我不一样。


晚点:训练一个身份模型需要多少数据?


陶芳波:一百份笔记或者一百份记录就可以了,甚至更少。其实很多类似的数据已经存在,用户只需要上传就行。


晚点:人的经历不断增加,自我认知随之改变。身份模型如何跟上不断变化的用户?


陶芳波:我们觉得每天训练一次身份模型比较合适。人脑白天获得很多对话、新知识,它们只是被缓存在了一个地方,没有变成持久记忆、参数化。睡眠过程中,人脑才会处理这些数据。身份模型也该这样,白天记载信息,晚上训练。


晚点:训练一次成本是多少?


陶芳波:现在我们用 70 亿参数的模型,单次也就一美金不到。参数量再小,模型不够聪明;再大,边际回报有限。

靠身份服务收费

晚点:身份模型可以代替用户提出需求、和其他 AI 交互。但现在承接需求、完成任务的 AI 都不是很成熟。先做提需求的身份模型,时机成熟吗?


陶芳波:之前提到的社交、面试、约会等需求,可以直接靠身份模型完成任务,这些需求场景已经够大了。


身份模型也不用非要面向 AI。之前互联网公司已经创造了大量的场景,身份模型只要和它们互动起来就行。比如身份模型可以去 LinkedIn 帮你找工作。之后 Agent 能力提升了,再和 Agent 互动也顺理成章。


现在我们做了一个服务器叫 Second Me Server,平台如果希望了解用户,就可以向 Second Me 发起请求,通过身份模型知道用户的偏好是什么。这其实是可以无缝融入现有的互联网生态中的。


晚点:Second Me 和互联网平台的互动可能是单向的——他们愿意通过 Second Me 服务器了解用户偏好,但不一定开放接口让身份模型帮用户购物。


陶芳波:这是个比较现实的问题。现在海外的互联网还相对开放,大家可以通过 API(数据接口)连接。国内就过于封闭了,一个个平台就像一个个孤岛,无法接入,大家都在搞数据壁垒。


但这种孤立的状态肯定会在 AI 时代被打破。孤岛式生态无法提供很好的用户体验,用户会倒逼平台开放的。平台不开放,新世界就与它无关了。


晚点:你们把 Second Me 做成开源项目的价值是什么?


陶芳波:把训练方法开源,用户就能在本地训练身份模型,然后把它接入互联网,可以解决用户使用个人数据的心理壁垒。另外也有成本方面的考虑。如果我们有 100 万个用户,就得训练 100 万个模型,服务器成本、存储成本是无法想象的。开源之后,更多身份模型的用法其实也来自开源社区。


晚点:这个开源项目的参与度如何?


陶芳波:GitHub 上有很多人关注,官方也在今年 4 月写文章说 Second Me 是当时全站 Top 10 的项目。我们在三个星期内得到超过一万个 star(类似用户收藏),今年大概只有不到 20 个项目有这样的增速。


有开发者看到我们项目后,花 7 万块钱买一台 Mac Studio,就为了在本地训练一版更强的自己。有用户用跨时几年、数百万字的日记训练出一个 AI 自我,把自己变永恒。


晚点:身份模型如何商业化?


陶芳波:现在我们想得还不是很充分。核心思路是我们作为身份服务的提供者,可以向用户收费。另一种可能是,要是淘宝、抖音等平台未来通过我们的身份模型了解用户偏好、卖广告,我们也可以向这些平台收费。


晚点:构建身份模型时,已经有大量用户数据的微信、抖音,或者理论上能记录用户一切操作的手机厂商,是不是做起来更快?


陶芳波:从数据的角度看肯定如此。但我们今天赌的是大公司内部创新的阻力。身份模型的早期使用者只会是一小群人,大厂不太可能为 1% 的用户专门改变产品,因为影响剩下 99% 的用户体验的风险太高。淘宝要是抱着拥抱 AI 购物的念头把整个应用界面都改了,只允许用户和 AI 聊天购物,拼多多不得乐坏了?


晚点:身份模型之间可以交互,越多人用越好用,像一个传统互联网产品。Mindverse 有什么加速用户增长的好办法吗?


陶芳波:买量不可持续,还是要靠口碑。口碑一是靠创造感,让用户觉得 “自己” 被创造出来;二是靠连接体验,让用户能在产品上获得高质量的连接。把这两者做到极致,我觉得自然有好增长。


晚点:如果所有人都有一个身份模型,会对社会有什么影响?


陶芳波:人人都有身份模型、AI 接替一部分人们相互交互的工作,相当于存在于现实中的社会网络有了一个线上复制版,复制版的效率会比原版高很多。


互联网工具越来越多、越来越强大后,人反而成了工具的接口——微信、飞书、钉钉一个个随时待命,等待被调用的人。用一个身份模型代替人成为这些工具的接口,个体就能被解放出来。

题图:《编号 17》

这是《晚点 LatePost》 「AI 创业访谈」系列的第 12 篇。该系列将持续呈现 AI 应用创业者的多样思考与实践。往期文章见文末合集 #AI 创业访谈。

AI 创业访谈

该系列将持续呈现多样 AI 应用创业者的思考与实践。

↓ 往期文章 

01

零一万物李开复

阅读文章

02

MiniMax 闫俊杰

阅读文章

03

百川智能 王小川

阅读文章

04

Haivivi 李勇

阅读文章

05

Pokee.ai 朱哲清

阅读文章

06

VITURE 姜公略

阅读文章

07

Flowith

阅读文章

08

YouWare 明超平

阅读文章

09

爱诗科技 王长虎、谢旭璋

阅读文章

10

VAST 宋亚宸

阅读文章

11

Even Realities 王骁逸

阅读文章

- FIN -