音频 - 科技区角

新智元报道编辑：LRST【新智元导读】Bind-Your-Avatar是一个基于扩散Transformer（MM-DiT）的框架，通过细粒度嵌入路由将语音与角色绑定，实现精准的音画同步，并支持动态背景生成。该框架还引入了首个针对多角色对话视频生成的数据集MTCC和基准测试，实验表明其在身份保真和音画同步上优于现有方法。近年来随着视频生...

新智元 2025-07-17 12:50:22

BeDAViN：大规模音频-视觉数据集与多声源架构研究

作者丨视觉语言导航点击下方卡片，关注“具身智能之心”公众号>>点击进入→具身智能之心技术交流群更多干货，欢迎加入国内首个具身智能全栈学习社区：具身智能之心知识星球(戳我)，这里包含所有你想要的。作者：Zhanbo Shi, Lin Zhang, Linfei Li, Ying Shen单位：同济大学计算机学院论文标题：Towards Audio-visual Navigatio...

具身智能之心 2025-07-17 08:00:00

一键实现PPT演讲自由！「解说音频+视频」同步生成，效果逼近真人

点击下方卡片，关注“AI生成未来”如您有工作需要分享，欢迎联系：aigc_to_future转载自：新智元如有侵权，联系删稿演示是一种广泛使用且行之有效的信息传达方式。通过结合视觉元素、结构化的讲解和口头解释，它能够使信息逐步展开，从而让不同受众更容易理解。尽管效果显著，但将长篇文档（如商业报告、技术手册、政策简报或...

AI生成未来 2025-07-17 00:01:23

杜比危险了？苹果发布ASAF格式，要做自己的音频标准？

来源：雷科技AI硬件组 | 编辑：天星曾经我们看视频，只要在清晰度之间做选择。但现在除了画面，我们连声音格式都可以自由选择——打开音质选单，立体声、沉浸立体声、杜比全景声、Audio Vivid 等选项「琳琅满目」。但这还没完，在前段时间结束的 WWDC 2025 分论坛中，苹果还发布了一个全新的声音格式——ASAF，准备带着自己的 A...

雷科技 2025-07-08 20:07:57

邱锡鹏团队开源MOSS-TTSD！百万小时音频训练，突破AI播客恐怖谷

不想看内容，试试听推送吧！（该博客基于 MOSS-TTSD 合成）播客、访谈、体育解说、新闻报道和电商直播中，语音对话已经无处不在。当前的文本到语音（TTS）模型在单句或孤立段落的语音生成效果上取得了令人瞩目的进展，合成语音的自然度、清晰度和表现力都已显著提升，甚至接近真人水平。不过，由于缺乏整体的对话情境，这些...

机器之心 2025-07-05 16:30:00

马恒达（Mahindra）选择赛轮思音频AI为其电动原生SUV打造车载语音交互功能

今日宣布与Arm达成战略合作，赛轮思AI将借助Arm® Kleidi™软件库，提升其CaLLM™ Edge多模态汽车端侧（SLM）模型的能力与性能。···最新发布2025年7月1日，赛轮思AI (Cerence Inc., NASDAQ:CRNC)宣布马恒达已选择赛轮思音频AI，为下一代电动软件定义汽车(SDVs)增强车载交互体验，这是印度汽车制造商首次生产此类车型。··2024年...

赛轮思AI 2025-07-04 13:01:07

阿里通义开源首个CoT音频模型，音·画同步被狠狠拿捏了

一水发自凹非寺量子位 | 公众号 QbitAIAI音效已经进化成这样了吗？？打开声音🦻，来快速感受一下最新feel：模拟婴儿哭声，那叫一个高低起伏、荡气回肠，整个节奏和婴儿表情姿态神同步了。一辆火车由远及近驶来，整个背景音也颇具空间层次感，毫不违和。甚至连小号这种乐器演奏，声音也能和演奏者的动作一一对上。没错，这...

量子位 2025-07-01 11:51:47

htc重返音频市场？我体验了最奇葩的头戴式耳机

来源：雷科技AI硬件组 | 编辑：TSKnight大家对htc的印象还剩下多少？恐怕一些年轻的读者都已经对这个品牌感到陌生，即使这是全球第一个推出安卓手机的品牌，同时也是曾经iPhone最大的对手。但是在2025年的今天，htc已经近乎完全与手机市场无关，也就偶尔凑个热闹，发布一款“区块链”手机之类的产品，然后又沉寂回VR市场。当...

雷科技 2025-06-29 20:23:43

AI玩具爆发，音频编解码器如何满足语音交互需求

电子发烧友网综合报道，在AI玩具已经开始逐渐爆发的当下，人机交互已经成为标配功能，而最重要的便是语音控制。而语音控制的第一步，便需要让AI玩具听懂你在说什么这就需要用到音频编解码器。音频编解码器（Audio Codec）是用于压缩、解压缩和转换音频信号的硬件设备或软件算法。其核心作用是在保证音质的前提下，减少音频...

电子发烧友网 2025-06-20 07:00:00