音频

  • 【科技24时区】瑞典音乐流媒体巨头Spotify在2025年第四季度实现用户规模的历史性突破。受年末“Wrapped”年度回顾活动及免费版新功能推动,该公司当季新增用户达3800万,月活跃用户总数攀升至7.51亿,同比增长11%。与此同时,付费订阅用户数增至2.9亿,环比增长10%。 Spotify表示,“Wrapped”活动在全球56种语言市场中吸引了超...
    科技区角 2026-02-11 00:02:37
  • AI应用的兵家必争之地是Long Context(长上下文)。有了长上下文,AI才会有长期记忆,才能提供个性化服务。 文|周鑫雨 访谈整理|钟楚笛 编辑|苏建勋 上映于2013年的《Her》,是焦可最喜欢的一部电影。 影片中的AI Samantha没有脸、没有形象,人们能感知的,只有她温柔沉静的声音。当Samantha说出,“最近你经历的事情太多...
    智能涌现 2026-02-09 11:12:24
  • 【科技24时区】在人工智能硬件竞赛日趋白热化的背景下,苹果、Meta与谷歌正围绕下一代AI入口展开激烈角逐。近期,苹果进一步强化其在硬件端的AI能力,宣布完成对以色列人工智能初创公司Q.ai的收购。据路透社率先披露,此次交易金额接近20亿美元,成为苹果历史上第二大并购案,仅次于2014年以30亿美元收购Beats Electronics...
    科技区角 2026-01-30 04:00:44
  •   复旦大学、上海创智学院与新加坡国立大学联合推出首个全模态未来预测评测基准 FutureOmni,要求模型从音频 - 视觉线索中预测未来事件,实现跨模态因果和时间推理。包含 919 个视频和 1,034 个多选题问答对,在 13 个全模态模型和 7 个纯视频模型上的评估显示,当前系统在预测未来事件方面存在显著困难,最佳准确率仅为 64...
    机器之心 2026-01-24 09:52:30
  • 【区角快讯】小米于1月15日正式推出Sound 2 Pro智能音箱,起售价为1399元,目前已在官方渠道开启预约。该产品作为此前1999元定价的Sound 2 Max的同系列新成员,延续了包豪斯风格的极简设计语言,但在材质上有所调整——采用塑料结构配合金属漆喷涂工艺,相较Max版本的一体压铸金属机身更为轻量化。整机重量控制在2.1千克,三...
    科技区角 2026-01-15 14:00:26
  •   作为消费电子界每年的开年大戏,CES向来是各大厂商秀肌肉的舞台。前两天,雷科技CES报道团为大家带来了多篇现场、深度、立体的专业报道,同时也带大家看了各种炫酷的AI硬件、黑科技和机器人,今天小雷想带大家换个口味,聊聊音频的事儿。 (图源:雷科技拍摄) 说实话,音频设备这几年其实挺尴尬的,要么是卷音质参数卷到...
    雷科技 2026-01-11 20:08:47
  •   新智元报道  编辑:LRST【新智元导读】文本领域的大模型满分选手,换成语音就集体挂科?大模型引以为傲的多轮对话逻辑,在真实人声面前竟然如此脆弱。Scale AI正式发布首个原生音频多轮对话基准Audio MultiChallenge,直接撕开了大模型靠合成语音评测维持的优等生假象。实验显示,强如Gemini 3 Pro在真实场景下的通过率也...
    新智元 2026-01-06 12:48:31
  • 1预加重滤波器的作用 在语音信号中,声门波激励和口鼻辐射效应共同导致语音信号的高频分量能量要比低频分量弱。预加重(Pre-emphasis)的目的就是:1 .提升高频分量,平衡语音频谱,使得高频特征更加明显,便于后续的特征提取(如MFCC)。2.消除发声过程中口唇辐射的影响。3.在一定程度上抑制工频干扰。 2 预加重滤波器的使...
    FPGA技术江湖 2025-12-11 08:25:00
  • 电子发烧友网综合报道,随着消费者对无线音频品质要求的不断提升,蓝牙编解码技术正成为TWS耳机差异化竞争的核心。在众多高清音频标准中,由台湾盛微先进科技研发的LHDC(Low-Latency Hi-Definition Audio Codec)凭借其高码率、低延迟和高兼容性,正加速渗透高端音频市场。我们关注到,2025年,有多款TWS耳机相继搭载LHDC-...
    电子发烧友网 2025-10-27 07:00:00
  • 如往常一样,一年一度的双十一电商优惠活动在十月下旬准时展开。作为过年前的最后一次超大型全品类电商优惠活动,结合数码产品的更新「季节」,我们不难发现,双十一同时也是每年购买数码产品的最好时机之一。以小雷关注的智能眼镜品类为例,经过多年的发展,智能眼镜品类已经从早期的概念尝鲜期,进入到功能稳定、技术分化...
    雷科技 2025-10-24 17:29:36
  • 梦晨 发自 凹非寺量子位 | 公众号 QbitAIQwen版深度研究加速进化,一觉起来增加了听觉和视觉输出:可以生成网页和音频了。AI深度研究整合的内容,变成图文并茂的网页,还可以一键部署,任何人可凭链接查看,方便对外展示。长篇文字内容也可以变成音频播客,方便自己在碎片时间消化吸收。与此前火爆的NoteBookLM相比,深度研...
    量子位 2025-10-22 13:48:04
  • 前段时间,小米 REDMI K90 Pro Max 手机官宣将于10月23日发布。今日,REDMI 产品经理@笋寸发文透露,新机屏幕尺寸大小确定:6.9英寸,和今年另外两款17 Pro Max是相同尺寸。并且是2D纯直屏贴膜友好,因为新开屏,所以R角弧度也做到更大更优雅。 同时,她还透露REDMI K90 Pro Max 手机“摄像头旁边的圆圈”是真的扬声器,背部...
    科技美学 2025-10-19 21:30:30
  • 该说不说,都 2025 年了,我问 AI 一个问题,体验却常常两极分化。简单的事,它秒回,但答得跟没答一样。复杂的事,让它深度思考,它又要琢磨 30 秒以上。而每一次回答,AI 都在不断「燃烧」token。对企业来说,token 消耗量直接等于成本。当模型开启深度思考时,效果确实能提升一大截,可延迟高了,token 烧得更猛了,成本...
    APPSO 2025-10-16 17:34:17
  • 01AD9653AD9653:四通道高精度 ADC,宽带宽 + 低功耗 + 灵活管控,医疗 / 成像 / 通信全胜任作为ADI旗下明星级模数转换器,以“高精度、低功耗、小尺寸” 三大核心特质,在 16 位、125MSPS 规格的四通道 ADC 领域脱颖而出,尤其在医疗、通信、成像等高端场景中,成为工程师的优选方案。高性能:16 位四通道 ADC,650MHz 带宽...
    集成电路大数据平台 2025-10-14 17:28:00
  • 清华大学&生数科技团队 投稿量子位 | 公众号 QbitAI音频超分辨率(Audio Super-Resolution, Audio SR),即从低采样率音频恢复出高采样率版本,是提升语音清晰度、音乐细节与沉浸式音频体验的关键技术。无论是在老旧录音修复、语音通信增强,还是音乐制作与多模态生成中,高分辨率音频都能显著提升听感与表现力。然而,由于...
    量子位 2025-10-12 12:02:35
  • 音乐仍旧是直抵人心的关键,科技的加持将让这股力量更为铿锵。走进近期在厦门举办的2025中国数字音乐产业大会的华为音乐展区,一个巨型翅膀装置吸引了不少人驻足,这正是许嵩《呼吸之野》演唱会舞台原版翅膀。前来打卡的人中,不少是特意从外岛赶来,他们颇为感叹的表示,“呼吸之野结束了,但美好的点滴还留在心间”。把翅膀...
    36氪 2025-09-30 17:29:12
  • 电子发烧友网综合报道,凭借其超低时延、高可靠、精准同步与海量连接等颠覆性优势,星闪正加速重构智能家居、智能汽车、工业制造及消费电子领域的连接格局。星闪技术的核心突破在于其双模架构:SLB(SparkLink Basic)高速模式可实现高达1Gbps的传输速率,满足8K视频流、高清空间音频的实时传输需求;SLE(SparkLink Low En...
    电子发烧友网 2025-09-28 07:09:00
  • 华经产业研究院为助力企业、科研、投资机构等单位了解AI音频眼镜行业发展态势及未来趋势,特重磅推出《2025-2031年中国AI音频眼镜行业市场深度研究及投资策略研究报告》,本报告由华经产业研究院研究团队对AI音频眼镜行业进行多年跟踪研究,使用桌面研究与定量调查、定性分析相结合的方式,全面解读AI音频眼镜行业市场,深...
    华经产业研究院 2025-09-26 10:32:00
  • 分析师 刘萌媛 刘铁鹰量子位智库 | 公众号 AI123All随着豆包和元宝两大头部智能助手的入场,能够在短短数分钟内将任何内容(话题、链接或文档)转为对话式播客的AI播客工具从小众走向了大众视野。但疑问依旧重重——AI播客究竟是天花板有限的伪命题,还是场景仍可持续拓展的新一代交互方式主打功能大差不差,如何在产品细节上...
    量子位 2025-09-21 16:00:00
  • 根据国际数据公司(IDC)9月18日最新发布的《全球智能眼镜市场季度跟踪报告》,2025 年第二季度全球智能眼镜(Smart Eyewear)市场出货量 255.5 万台,同比增长 54.9%。其中全球音频和音频拍摄眼镜市场出货量 161.8 万台,同比增长 256.8%;AR / VR 市场出货 93.7 万台,同比下滑 21.6%。报告表示,2025 年第二季度中国智能...
    X科技发现 2025-09-20 09:00:00
  • 今日宣的能力··LM™ Edge多模态汽车端侧(SLM)模型的能力与性能。···最新发布2025年9月17日,赛轮思AI (Cerence Inc., NASDAQ:CRNC)宣布将其行业领先的音频AI套件集成至Audio Weaver平台。该平台由全球嵌入式音频软件领域领导者DSP Concepts公司研发。此次集成使客户可在Audio Weaver强大的音频开发平台内,无缝部署赛轮思A...
    赛轮思AI 2025-09-19 13:00:00
  • 本期是平台君和您分享的第328期内容你是不是也曾被音频中的杂音、信号采集中的失真问题困扰过?在电子系统中,运算放大器的性能往往决定了整个系统的“天花板”。速度慢了拖垮系统,失真大了毁掉信号,适应不了宽电压更是直接“罢工”。今天平台君要聊的德州仪器(TI)OPA365,不仅做到了“零交叉失真”,还能在单电源下实现轨到...
    集成电路大数据平台 2025-09-16 17:32:43
  • 打造一个有温度、有趣味、专业的全栈式AI&AIGC交流社区,用心写好每一篇文章!项目主页-https://phantom-video.github.io/HuMo/代码链接-https://github.com/Phantom-video/HuMo论文链接-https://arxiv.org/abs/2509.08519为什么需要这个算法?--以人为中心的视频生成(HCVG)方法寻求从多模态输入(包括文本、图像和音频)...
    AI产品汇 2025-09-15 07:50:00
  • 小红书智创音频技术团队近日发布新一代对话合成模型 FireRedTTS-2。该模型聚焦现有方案的痛点:灵活性差、发音错误多、说话人切换不稳、韵律不自然等问题,通过升级离散语音编码器与文本语音合成模型全面优化合成效果。在多项主客观测评中,FireRedTTS-2 均达到行业领先水平,为多说话人对话合成提供了更优解决方案。论文标...
    机器之心 2025-09-14 11:07:22
  • 关注我们 设为星标从 AI 眼镜到耳塞再到长距离蓝牙音频,三项新产品成果彰显了 MEMS 与射频前端技术如何重塑无线音频领域。在短短几周内,三家企业相继展示了 MEMS 扬声器、触觉执行器和模块化射频平台如何在可穿戴设备、个人音频和专业广播场景中革新无线音频体验。QCY 的 MeloBuds N70 耳塞xMEMS 推出搭载 MEMS 技术的 AI...
    EETOP 2025-09-12 08:10:00
  • 点击下方卡片,关注“AI生成未来”如您有工作需要分享,欢迎联系:aigc_to_future转载自:量子位如有侵权,联系删稿数据智能体到底好不好用?测评一下就知道了!南洋理工大学、新加坡国立大学携手华为开源推出首个专门针对数据智能体(Data Agents)异构混合数据分析的综合性基准测试FDABench。该基准横跨50+数据领域、设置了...
    AI生成未来 2025-09-11 00:01:43
  • B&O音频调校+雷鸟技术积淀,让AR设备从“科技工具”蜕变为兼具音质与实用美学的高端生活符号。出品 | 科技头版    作者 | 刘峰当全球第一的“科技先锋”遇见音响界的“劳斯莱斯”在科技圈,AR眼镜已不再是一个新故事。多年来,它一直被誉为继智能手机之后的“下一代计算平台”,吸引了无数厂商投身其中。然而,理想与现实之间总有距...
    科技头版 2025-09-05 17:49:20
  • 【本期职位】简历投递,欢迎扫描下方二维码添加微信base上海,成都,合肥1.音频模拟:ADC,功放,class A/B/D经验,若有AC-DC高压经验,也可以谈,硕士8年以上经验。base上海,成都,苏州2.电源模拟:DC-DC经验,硕士8年以上经验。base北京3.端口保护:做OCP,OAP之类的,硕士8年以上经验。base成都、上海4.电机驱动模拟:电机...
    EETOP 2025-09-04 13:49:10
  • 机器之心发布机器之心编辑部随着内容创作智能化需求的爆发,长时长、高质量数字人视频生成始终是行业痛点。近日,字节跳动商业化 GenAI 团队联合浙江大学推出商用级长时序音频驱动人物视频生成模型 ——InfinityHuman,打破传统音频驱动技术在长视频场景中的局限性,开启 AI 数字人实用化新征程。从静态图像到动态视频:音频...
    机器之心 2025-09-04 12:07:43
  • 点击下方卡片,关注“AI生成未来”如您有工作需要分享,欢迎联系:aigc_to_future作者:MengChao Wang、Qiang Wang等解读:AI生成未来文章链接:https://arxiv.org/abs/2508.11255 项目链接:https://fantasy-amap.github.io/fantasy-talking2/亮点直击Talking-Critic,一个统一的多模态奖励模型,能够准确量化生成肖像动画与...
    AI生成未来 2025-09-03 08:01:18