AI语音

搜索文档
千元耳机遇劲敌!网友:苹果都要来中国进货了
凤凰网财经· 2025-07-06 20:39
行业趋势 - 中国蓝牙耳机市场竞争激烈,设计创新包括耳挂式、骨传导、气传导、耳夹式等多种形态,音质技术涉及石墨烯、生物膜等材料 [4] - AI技术已应用于耳机领域,实现精确调音及生活助手功能 [4] 公司背景 - Sanag塞那品牌成立于2013年,总部位于深圳,拥有150多项发明和产品专利,覆盖70国用户 [34][36] - 公司与鸿蒙系统保持紧密合作,并获得运动冠军联合推荐 [11][12] - 旗下多款耳机斩获国际三大设计金奖,包括德国红点奖和伦敦设计奖 [14][36] 产品技术 - S6S采用气传导技术,通过空气传递声音,避免骨传导的振动不适感,支持"耳听八方"的安全设计 [26][29][31] - 搭载360° SpaceX声景空间声景引擎技术和Acavity声学结构腔体,实现环绕立体声及低失真音效 [52][55] - 第七代定向传音技术减少98%声音外泄,AI通话降噪算法有效分离人声与环境噪音 [57][60][61] 产品设计 - 耳夹式设计单只重量仅3.5g,采用记忆镍钛合金材质,贴合耳廓且运动时稳定性强 [40][42][45] - 配备Health Ear听力保护系统,自动调节音量至安全范围 [63] - 蓝牙闪连6.0技术支持快速配对,单次续航7.5小时,配合充电仓可达38小时 [65][72] 智能功能 - 配套APP支持EQ调音、触控自定义、白噪音及AI互动功能,覆盖办公与娱乐需求 [78][80] - APP集成定位功能,便于查找耳机位置 [82][83] 市场反馈 - S6S被测评博主评为"性价比拉满",对比千元级竞品(如华为耳夹耳机)性能更优且价格仅199元 [18][20][23] - 消费者评价聚焦于佩戴舒适性、音质表现及便携性 [85][86]
这些股遭机构大幅净卖出
证券时报· 2025-06-20 21:56
市场表现 - 市场全天震荡调整,全市场成交额1 09万亿元,较上一个交易日缩量近1900亿元 [1] - 收盘上涨个股超1500只,其中收盘股价涨停的有53只 [1] - 沪指本周累计跌0 51%,深证成指累计跌1 16%,创业板指累计跌1 66% [2] 个股表现 - 本周超1200股上涨,20股涨幅超30% [3] - 涨幅最大的是山东墨龙,本周累计上涨61 38% [3] - 海科新源、联建光电、捷强装备本周累计涨幅均超50% [3] - 电力设备和电子行业均有4股涨幅超30%,国防军工行业有3股上榜 [3] 机构龙虎榜 - 本周机构专用席位共现身105股的龙虎榜,净买入46股,净卖出59股 [5] - 35股获机构净买入超千万元,悦康药业、利民股份等共6股获机构净买入金额超1亿元 [5] - 悦康药业本周上涨19 34%,机构合计净买入2 27亿元 [5] - 影石创新本周累计上涨0 12%,机构合计净卖出1 91亿元 [6] - 中曼石油、长城军工、永安药业等遭机构大幅净卖出 [7] 公司公告 - 汤姆猫在AI语音交互、情感陪伴领域具备核心优势,已实现与宇树科技机器狗产品的语音控制功能协同 [9] - *ST锦港收到上海证券交易所终止上市决定,股票进入退市整理期的起始日为2025年6月30日 [10] - 新疆浩源更名为"万憬能源",证券代码保持不变 [10] - 宁波华翔预计2025年上半年净利润亏损2 73亿元至3 69亿元,主要受欧洲业务剥离一次性影响8 98亿元 [10] - 诺德股份推出双面镀镍铜箔适配半固态/固态电池技术,但相关收入占比不足1% [11] - 长城军工股票价格4个交易日累计涨幅达37 06%,公司表示生产经营活动正常 [11]
太逼真!豆包·播客模型来了:一句话生成「苏超联赛」播客,很懂13太保的梗
量子位· 2025-06-09 13:24AI Processing
深度|AI语音独角兽11Labs创始人:“人性”中的不完美,恰恰是人愿意互动的关键
Z Potentials· 2025-06-09 11:34
公司概况 - ElevenLabs是一家2022年由前谷歌工程师Piotr Dabkowski与前Palantir策略师Mati Staniszewski创立的AI语音合成公司,专注深度学习技术开发自然语音 [2] - 2025年1月完成1.8亿美元C轮融资,估值达33亿美元 [2] - 年经常性收入(ARR)已突破1亿美元,语音转文本模型Scribe v1支持99种语言且准确性领先 [3][2] 技术突破 - 核心技术突破在于让AI语音加入"人性化特征"如笑声、呼吸音等不完美细节,使合成声音更真实有情感 [9][19] - 首次重大突破发生在2022年11月,实现AI模拟人类笑声并获用户积极反馈 [10][13] - 语音转文本模型采用Transformer架构和Diffusion Models技术,最初聚焦影视配音但扩展至更广泛交互场景 [8][9] 产品应用场景 - 已应用于医疗领域帮助渐冻症患者重建声音,包括协助美国国会议员在失声后继续工作 [26] - 与游戏公司合作复刻角色语音(如Darth Vader),保持角色特质同时支持低延迟交互 [20] - 物流行业客户通过加入语气词使语音Agent通话完成率提升2个百分点 [19] 行业趋势 - 语音交互将向多模态发展,未来1-2年实现"语音版图灵测试"(无法区分AI与人类) [15][16] - 交互式媒体(如游戏NPC对话)和智能客服是下一个爆发场景,将重构传统客户支持流程 [21][22] - 语言壁垒将被打破,AI可实现跨语言语音转换并保留原说话者情感语调 [40][41] 商业模式 - 采用基础研究+产品开发双轨模式,既研发底层模型也构建终端应用 [30][31] - 典型客户落地周期为3个月完成概念验证,1年内正式上线 [24] - 企业应用分两类:效率优化(如客服自动化)和增长驱动(如交互式品牌体验) [23][25] 安全机制 - 采用内容溯源系统,所有生成语音可追踪至创建者身份 [34] - 开发公开分类器检测AI生成语音,未来计划通过设备端加密验证真人发声 [35][36] - 提出三层认证体系:真人验证、授权Agent水印、未认证内容默认标记为AI生成 [37] 企业文化 - 受Disney启发注重叙事能力,通过技术使用户融入产品故事线 [42][43] - 管理层定期参与客户支持,保持与终端用户的直接联系 [44] - 核心优势在于专注语音领域并整合研究与应用,形成技术壁垒 [30][44]
MiniMax登顶、多家创企融资,AI语音离“现实场景”还有多远?
创业邦· 2025-06-06 11:17
以下文章来源于白鲸出海 ,作者白鲸小编 白鲸出海 . 白鲸出海,泛互联网出海服务平台,白鲸专注于具备互联网属性的行业、公司、产品和服务的出海,包 括应用、游戏、电商、区块链、智能手机及硬件、旅游、网络文学、影视、动漫、教育、体育和金融 等。 来源丨 白鲸出海(ID: baijingapp ) 作者丨 张凯然 编辑丨 殷观晓 图源丨Midjourney 2 月份,我们选取了知名影视剧《甄嬛传》中的片段来测试 4 款 AI 语音合成模型在情感表达上的表 现。当时的结论是,AI 语音模型们的表现力依然不足,仍有待加强。 | Creator | | Model | Arena ELO | 95% CI | # Appearances | | --- | --- | --- | --- | --- | --- | | 4 | MiniMax | Speech-02-HD | 1161 | -27/+26 | ae8 | | @ OpenAI | | TTS-1 HD | 1151 | -14/+12 | 6534 | | � | MiniMax | Speech-02-Turbo | 1146 | -25/+25 | ...
MiniMax登顶、多家创企融资,AI语音离“现实场景”还有多远?
36氪· 2025-06-06 10:49
2 月份,我们在《AI 语音,真的有感情了?》选题中,选取了知名影视剧《甄嬛传》中的片段来测试 4 款 AI 语音合成模型在情感表达上的表现。当时的 结论是,AI 语音模型们的表现力依然不足,仍有待加强。 | Creator | | Model | Arena ELO | 95% CI | # Appearances | | --- | --- | --- | --- | --- | --- | | MiniMax | | Speech-02-HD | 1161 | -27/+26 | de8 | | OpenAI | | TTS-1 HD | 1151 | -14/+12 | 6534 | | MiniMax | | Speech-02-Turbo | 1146 | -25/+25 | 955 | | OpenAI | | TTS-1 | 1136 | -15/+13 | 6423 | | 피 | ElevenLabs | Multilingual v2 | 1116 | -13/+13 | 7775 | | 1 | ElevenLabs | Turbo v2.5 | 1112 | -13/+13 | 75 ...
Z Potentials|冷月,00后打造AI语音平台Fish Audio,半年增长500万美元ARR,打造永不背叛AI语音陪伴
Z Potentials· 2025-06-05 11:32
从电话录音机到播客,从语音助手到虚拟主播,语音技术在过去几十年里经历了从 " 工具型服务 " 向 " 内容型产品 " 的演化。大模型的快速崛起让语音技 术的发展进入了一个新的跃迁周期,人们对语音产品的期待从听懂 " 内容 " 逐渐跃迁到听懂 " 情绪 " 。情感语音合成、语音驱动角色等新场景不断涌现, AI 使语音技术不再只是配音的工具,而正在成为交互入口与内容表达的核心媒介。 在这个变革拐点上,一方面,各类开源语音模型在快速迭代,另一方面,寻找一个落地场景,让模型的技术与用户场景更贴合,成为产品落地的重要问 题。其中, " 语音陪伴 " 这一场景仍是一块待深耕的蓝海,它不仅考验模型对人类情感的理解能力,更考验这种人机交互模式背后信任感的构建。 本期我们采访了 Hanabi AI 的创始人冷月,他曾是英伟达的研究员,也是一位深耕开源的 00 后开发者。 Hanabi AI 的代表产品 Fish Audio 是一个出色的 AI 语音合成平台,能够支持多语言文本转语音和高精度的声音克隆。 在短短几个月内, Fish Audio 经历了从 0 到 400 万美元营收的高速增长,成为 AI 语 音赛道中最受关注的产品 ...
开源播客生成MoonCast:让AI播客告别"机械味",中英双语对话更自然!
量子位· 2025-06-04 13:21
输入知识源:经典经济学论文 (PDF 链接: https://gwern.net/doc/statistics/decision/1951-nash.pdf) Zeqian Ju 投稿 量子位 | 公众号 QbitAI 英文播客示例: 仅听几秒人声,即可完成逼真复刻,而且是 对话式语音。 这就是 MoonCast , 一款革新性的对话式语音合成模型, 目前已开源 。 MoonCast 的"人味"播客效果如何?立即试听以下示例音频,让耳朵告诉你答案。 (注:本文使用的所有音频仅用于展示,不代表任何真实事件或观点。禁止商用。) 中文播客示例: 输入知识源:诺贝尔物理学奖新闻稿 (URL 链接: https://www.nobelprize.org/prizes/physics/2024/press-release/) 生成一段地道的 相声 ,完全就是郭德纲于谦那味儿啊。 (注:本文使用的所有音频仅用于展示,不代表任何真实事件或观点。禁止商用。) 它专为高质量播客内容创作量身打造, 旨在将文档转化为引人入胜的播客音频。 这些对话无论是文本内容还是说话人音色,MoonCast在训 练时都从未见过。 这得 益于强大的 ...
速递|Anthropic推出Claude语音模式,卡位AI语音入口
Z Potentials· 2025-05-28 10:43
图片来源: Anthropic Anthropic 为 Claude 推出语音模式,借助 Anthropic 的语音模式,用户可以讨论文档和图片等内容, 并可从五种独特音色中选择。用户还能随时在文本与语音间切换,对话结束后可查看文字记录和摘 要。 包括 OpenAI 在内的多家 AI 公司都为各自的聊天机器人提供语音对话功能。例如谷歌推出了 Gemini Live ,而 xAI 则为 Grok 开发了 Voice Mode 。 这些功能都让用户通过语音而非打字与机器人互动,使对话体验更自然直观。 该功能存在一定限制。语音对话会计入常规使用上限 —— Anthropic 表示大多数免费用户可进行 20- 30 次对话。 此外,只有付费订阅 Claude 的用户才能使用 Google Workspace 连接器,该功能允许语 音模式访问 Google Calendar 日程和 Gmail 邮件( Google Docs 集成仅限 Claude 企业版用户)。 Anthropic 首席产品官 Mike Krieger 证实 ,公司三月初在接受《金融时报》采访时就在开发 Claude 的语音功能。 我们正在招募新一期 ...
江苏方天公司AI语音交互重塑作业模式
江南时报· 2025-05-22 07:13
智能化电力服务升级 - 国网靖江供电公司通过AI语音交互技术将传统电力作业流程效率提升200%,实现"动口不动手"的智能化操作[1] - 江苏方天公司2020年推出营销2.0移动作业APP后,于2024年11月研发营销移动智能助手,实现伴随式作业模式[1] - 智能助手打破传统作业模式局限,支持信息查询、业务办理、问题反馈等快速完成,大幅节省人力与时间成本[1] 智能助手功能创新 - 研发团队针对传统应用终端多、操作复杂等问题,以大模型与语音识别引擎为基础开发一线移动作业智能助手[2] - 智能助手通过语音交互实现电力知识问答、线索查询、用户欠费查询、作业路径规划等功能[2] - 系统每日使用人数超900,知识类、指标类、辅助类问答每日达1000多次,推动服务向深度数字化转变[2] 未来技术发展方向 - 公司将重点研发多模态交互技术,支持设备故障"扫一扫识别"和无网络环境下的离线语音响应[3] - 计划将应用场景扩大至配电运维、应急抢修等领域,持续优化智能助手功能[3] - 目标是通过技术创新全面提升现场作业效率,为行业数字化转型注入动力[3]