资讯配图不知道机友们记不记得。

去年年底,机哥给大伙介绍过豆包App的「一句话P图」功能。

当时我整体体验下来,感觉这功能是能用,但效果不是特别成熟。

资讯配图
资讯配图

资讯配图转眼间。

七八个月过去,市面上的主流大模型应用,该升级的升级,该换代的换代。

当初惊艳一时的豆包,风头也逐渐被Deepseek、阿里Qwen等大模型盖了过去。

资讯配图

这也让机哥都很好奇,这几个月以来,豆包到底干了些啥。

恰好最近豆包更新得比较频繁。

我也打算跟机友们分享下,它上了哪些好玩、好用的新功能。

猜猜我在哪?

资讯配图最近豆包在自家大模型上,整了个「视觉推理」的功能。

说人话就是,它能看懂图片的内容,然后根据你的需求完成任务。

资讯配图机哥实际做几个体验,大伙就知道是怎么回事了。

比如八弟在小红书看到一张图片,他觉得这里建筑贼好看,想知道是哪里,方便下次来玩玩。

资讯配图

资讯配图这时候把图片扔到搜索引擎识图。

往往只能找到更多类似的城市建筑图。

资讯配图

但现在扔给豆包App,在开启深度思考的情况下。

资讯配图它已经能像人类一样思考、搜索和对比分析。

资讯配图

比如机哥问前面那张建筑图,到底是在哪里。

豆包会先识别到,画面中有一栋很高的摩天楼,左侧还有几栋标志性建筑。

资讯配图不到几秒钟,就把大概的地理位置定好了。

资讯配图

随后豆包的深度思考,还会进一步分析几栋建筑的具体名字。

根据建筑风格、窗户细节和地理气候特征。

资讯配图最终确定出城市、区域和建筑名字。

资讯配图

有机友可能会说。

“广州这几栋建筑太过明显了,这不纯纯开卷考么,来点高难度的。”

资讯配图啊确实。

那机哥也用前阵子去长沙旅游拍的图,考验一下豆包。

资讯配图这张照片信息量不大,也没啥明显的建筑风格,似乎很难分析出具体位置。

资讯配图

但未曾想到,浓眉大眼的豆包居然学会了“走捷径”。

资讯配图具体为,它动用了自家大模型,新增的图片放大裁切和搜索能力,把红色海报上的文字提取了出来。

资讯配图

随后再经过网络搜索。

资讯配图很快便识别出,这是长沙芙蓉区车站公交新村粉店。

很难想象,大模型也开始耍起小聪明。

资讯配图

不过机哥多测试了几个街景图。

发现豆包都猜错了位置,说明它现阶段的训练数据和算法,还有不小提升空间。

并且AI特有的胡言乱语现象,在豆包这也没法避免。

资讯配图比如这里明明是长沙,它却板上钉钉地表示,这是合肥市步行街。

感觉还不如不说呢。

资讯配图

相比之下,如果大伙用它来识别一些经典的历史老照片。

准确度可能会高上不少。

毕竟历史照片这类素材,对大模型来说更容易收集并训练。

资讯配图

资讯配图像这张用徕卡相机捕捉到的「胜利之吻」。

就被豆包精准解析出了时间、地点和背景。

资讯配图

豆包P图,干翻PS?

资讯配图除了最近新出的「图片深度思考识别

豆包在六月份推出的一句话P图修改图片文字

在前阵子,也是小小地出过圈。

资讯配图

资讯配图以前用PS抠人像、换素材。

技术还不到位的话,抠图感往往会很重。

但AI大模型,被投喂了数不清的人像、街景和艺术素材,给它提具体要求,不到十秒钟,就能把结果图发回来。

资讯配图起码发个朋友圈,亲朋好友看不出来有没有高P过。

资讯配图


资讯配图除了更换衣服,换个背景,也同样是一句话的事情。

资讯配图
资讯配图

而且机友们发现没。

资讯配图豆包修改背景后。

不仅让中间的人物主体保持不变,连左右两侧的人物,都完好无损保留了下来。

资讯配图就这效果,我还用个嘚PS啊...

资讯配图

再结合网友们的奇思妙想来看。

资讯配图我感觉现在网友们的旅游、自拍和街景图,已经没啥可信度可言。

你一P,我一P,来到经典全懵逼。

资讯配图
资讯配图

看似有一定年代感,和一众买菜车融为一体的老车子。

资讯配图在网友一句描述词的加持下,被豆包修改后,瞬间有了赛博朋克的质感。

资讯配图
资讯配图

有老哥还倒反天罡,发两张图让网友猜一下,哪张是AI修改过后的图。

资讯配图机哥觉得吧,两张都像AI更换过背景。

毕竟这俩图的光影关系,都有点奇怪。

资讯配图

就上面这些P图操作看下来。

资讯配图升级到了SeedEdit 3.0模型后的豆包,改图能力已经相当成熟。

但有机友肯定也好奇。

现阶段的大模型,到底能不能做好中文文字的添加和替换。

资讯配图划重点,中文。

由于中文字笔画较多,加上不同字体的字形千变万化,大模型想要准确写出中文字,在很长一段时间内都是大难题。

所以,机哥还顺便测试了,豆包现在的字体编辑能力。

资讯配图我让它把咱们的招牌,改成中文字——机。

提示词:中间的图标去掉,然后加上中文字“好机友”,整体风格不变。比例 9:16。

资讯配图

然后这是豆包给到我的反馈图。

资讯配图谈笑间,我似乎听到了隔壁工位的美工设计师在打喷嚏。

资讯配图

接着我又让豆包,把图片里的“战斗,爽”,更换为“舒服,爽”。

不难看出,字体风格有些许差异。

资讯配图但如果不是严肃创作的话,用来当梗图还整挺好。

资讯配图

这些新功能体验下来,机哥最大的感受就是,非严肃创作的场景下。

资讯配图平时P图给人物换个背景、发型、衣服,真的用不太上PS了。

但对于大多数用户来说,光是打开电脑-打开PS-寻找素材-创建图层-抠像...

资讯配图这套流程走下来,都没开始P图呢,心已经累了。

所以当我看到各家大模型,不断卷底层、卷开源、卷技术普惠的时候。

资讯配图

资讯配图内心也是相当激动的。

机哥也很好奇,后续国产大模型们,还能整出哪些,让咱们普通用户直呼牛X的狠活。

图片来自网络

AI该帮我上班了
↘↘↘