电子发烧友网报道(文/李弯弯)在人工智能技术飞速发展的今天,端边算力的升级已成为推动行业变革的核心动力。725日,WAIC 2025前夕,后摩智能正式发布全新端边大模型AI芯片——后摩漫界®M50,同步推出力擎系列M.2卡、力谋®系列加速卡及计算盒子等硬件组合,形成覆盖移动终端与边缘场景的完整产品矩阵。这一系列动作标志着后摩智能在存算一体技术领域的突破性进展,更预示着端边智能新生态的全面开启。

M50芯片:高算力、低功耗的端边革命

后摩智能此次发布的M50芯片实现了160TOPS@INT8100TFLOPS@bFP16的物理算力,搭配最大48GB内存与153.6GB/s的超高带宽,而典型功耗仅10W,相当于手机快充的功率。这一性能指标意味着,PC、智能语音设备、机器人等智能移动终端无需依赖云端,即可高效运行1.5B70B参数的本地大模型,真正实现了高算力、低功耗、即插即用的愿景。

资讯配图
除了 M50 芯片,后摩智能此次发布的产品矩阵形成了覆盖端侧到边缘的多元算力方案。力擎™LQ50 M.2卡以口香糖大小的标准M.2规格,为AI PCAI Stick、陪伴机器人等移动终端提供即插即用的端侧AI能力,支持7B/8B模型推理超25tokens/s;力擎™LQ50 Duo M.2卡集成双M50芯片,以320TOPS算力突破14B/32B大模型端侧部署瓶颈;力谋®LM5050加速卡与力谋®LM5070加速卡分别集成2颗、4M50芯片,为单机及超大模型推理提供高密度算力,最高达640TOPSBX50计算盒子则以紧凑机身适配边缘场景,支持32路视频分析与本地大模型运行。

资讯配图
这些产品的应用场景广泛覆盖消费终端、智能办公、智能工业等领域,且均能在离线状态下实现全流程本地处理,从源头杜绝数据联网传输风险。例如,在消费终端,M50芯片赋能笔记本、平板电脑、学习机等设备本地大模型推理能力,无需联网即可完成智能交互、内容生成等任务,用户隐私数据全程闭环留存;在智能办公场景中,智能会议系统在断网环境下仍能实现多语种翻译、纪要生成,会议内容不触云、不泄露;在智能工业领域,产线质检与车路云协同通过本地算力完成实时分析决策,生产数据与运营信息在设备端闭环处理,避免云端传输隐患。

后摩智能通过存算一体技术与大模型的深度融合,推动AI大模型在端边侧实现离线可用、数据留痕不外露,构建起低功耗、高安全、好体验的端边智能新生态。这一生态的建立,不仅解决了传统云端计算的高延迟、高带宽成本问题,更为隐私敏感型应用提供了可靠的解决方案。

技术深耕与战略聚焦:吴强博士的创业哲学

在发布会现场,后摩智能创始人兼CEO吴强博士分享了他的创业初衷与技术追求。吴强博士的创业故事始于一个朴素的愿望:希望通过AI技术弥补子女不在身边的缺憾,让智能无处不在。2020年底,他选择存算一体作为技术方向,开启了后摩智能的征程。

当时存算一体并不像今天这样被主流芯片公司广泛讨论,吴强博士回忆道,但我们坚信,要解决功耗墙和存储墙的问题,必须走存算一体的路线。这一选择在四年后得到了验证。后摩智能通过存算一体技术,成功将计算单元与存储单元深度融合,大幅提升了算力密度与带宽效率,为端边大模型的部署提供了可能。

吴强博士的技术执着不仅体现在芯片设计上,更贯穿于他的生活方式。他分享了自己对运动的热爱,尤其是足球、篮球与长跑。我对运动的自律和坚持,恰似我对技术的执着。一旦认定方向,便矢志不渝。这种精神也体现在后摩智能的团队文化中——公司规模稳步增长,团队精干高效,成为应对行业变化与快速响应的基石。

在战略层面,后摩智能经历了从通用AI计算到端边大模型AI计算的聚焦过程。吴强博士指出,大模型时代对算力的需求呈现出两大趋势:一是重心逐渐从训练向推理迁移,二是从云端智能向边端智能迁移。基于这一认知,后摩智能决定以存算一体技术为矛,直穿端边大模型计算的最后一公里,致力于成为端边大模型AI芯片的领跑者。

这一战略聚焦在M50芯片上得到了充分体现。M50不仅在物理算力上达到160TOPS,更通过存算一体技术实现了能效比的质的飞跃。吴强博士透露,后摩智能已启动下一代DRAM-PIM技术研发,通过将计算单元直接嵌入DRAM阵列,使计算与存储的协同更加紧密高效。该技术将突破1TB/s片内带宽,能效较现有水平再提升三倍,推动百亿参数大模型在终端设备的普及。

在技术细节上,M50芯片的存算一体IP采用了第二代设计,包括双端口加载与计算的并行、混合精度设计以及电源稳定性优化等。这些创新使得M50在极小的面积下实现了极高的面效比,成为市场上能效比最高的端边大模型AI芯片。此外,M50还配备了新一代编译器工具链——后摩大道,通过细颗粒的算子支持与自动化优化策略,大幅降低了模型部署的复杂度,提升了应用落地的效率。

资讯配图
吴强博士的分享不仅揭示了后摩智能的技术实力,更展现了其对行业趋势的深刻洞察。他提到,未来大模型的应用将更依赖于算力与带宽的密集支持,而存算一体技术正是解决这一需求的关键。通过与北京大学的合作,后摩智能在DRAM存算用在大模型推理框架上的研究已取得突破性进展,相关论文入选今年ISCA最佳论文,进一步巩固了其在学术界与产业界的领先地位。

总结

后摩智能的M50芯片及其产品矩阵的发布,标志着端边智能新时代的正式开启。通过存算一体技术的深度融合,后摩智能成功解决了端边设备在算力、功耗与带宽方面的痛点,为消费终端、智能办公与智能工业等领域提供了高效、安全、低成本的AI解决方案。吴强博士的创业故事与技术追求,则为这一成就增添了人文温度与技术深度。

面向未来,后摩智能将继续深耕存算一体技术,推动DRAM-PIM芯片的研发与落地,进一步巩固其在端边大模型AI芯片领域的领跑地位。随着百亿参数大模型在终端设备的普及,后摩智能的愿景——AI走出云端,真正走入千家百户,赋能千行百业——正逐步成为现实。

资讯配图

声明:本文由电子发烧友原创,转载请注明以上来源。如需入群交流,请添加微信elecfans999,投稿爆料采访需求,请发邮箱huangjingjing@elecfans.com。


更多热点文章阅读


点击关注 星标我们



将我们设为星标,不错过每一次更新!
资讯配图

资讯配图喜欢就奖励一个“在看”吧!