Workflow
豆包AI播客
icon
搜索文档
字节、讯飞、MiniMax,为什么都在上新“声音复刻”?
AI研究所· 2025-07-04 17:28
声音复刻技术竞速 - 字节跳动旗下豆包AI播客功能全量上线,可将8万字英文PDF在数秒内生成男女对谈播客,语气词、停顿节奏与真人无异 [1][2] - 科大讯飞2024年4月推出声音复刻功能升级,仅需10秒音频素材即可复刻角色声音,情绪表达与原角色难分伯仲 [1] - MiniMax海螺AI在2024年底已实现30秒语音素材克隆唐国强、林黛玉等人物声音,情感还原度高 [1][7] 技术细节与优势 - 豆包AI播客能将8万词英文起诉书在1-2分钟内转化为带封面图的完整播客,自动添加语气词、附和与停顿 [4] - 科大讯飞构建"三阶段层次化语音建模框架",通过星火底座大模型精确捕捉发音规律,实现"超拟人"效果 [4] - 海螺AI对中文语音情绪与音色把控精细,如林黛玉声音克隆中精准捕捉哀怨感,相比海外产品更贴合中文语境 [8] 行业应用与场景 - 讯飞超拟人合成技术已应用于智能座舱、教育等场景,如蔚来汽车智能助手NOMI情感表达与交互自然度大幅提升 [6] - 微软AzureAISpeech推出"神经语音"技术,谷歌WaveNet以波形级生成提升语音真实感 [9] - 中文场景下形成技术梯队:字节在语义理解领先,讯飞在专业场景精度占优,MiniMax以轻量化克隆和情感表达突围 [9] AI播客市场前景 - 2024年中文播客听众将达1.34亿,76.2%用户每天收听超半小时 [11] - 播客变现模式包括广告、付费订阅与IP衍生开发,头部节目单期广告报价达2-15万元,付费节目销售额可达数百万 [12][13] - 2024年中国播客广告市场收入约33亿人民币,规模仍有限但潜力巨大 [14]
北京发文推动人工智能、AIGC等科技与游戏电竞产业深度融合,游戏ETF(159869)现涨3.22%
每日经济新闻· 2025-06-24 10:51
游戏板块市场表现 - 6月24日早盘游戏板块持续拉升 游戏ETF(159869)盘中上涨3.22% [1] - 持仓股全线飘红 冰川网络、电魂网络、掌趣科技、盛天网络、富春股份涨幅居前 [1] AI应用动态 - 海外AI进展:Mistral AI推出Mistral Compute云平台 谷歌更新Gemini 2.5三个版本模型 OpenAI计划夏季推出GPT-5 Midjourney发布首个AI视频生成模型V1 [1] - 国内AI进展:豆包上线"AI播客"功能 MiniMax推出开源混合架构推理模型M1 腾讯元宝上线AI编程模式 MiniMax发布视频生成工具Hailuo02 [1] 政策支持 - 北京印发《关于促进北京市游戏电竞行业高质量发展的支持办法(暂行)》 推动人工智能、AIGC与游戏电竞产业深度融合 [1] - 政策要求加快技术成果在游戏研发、运营等环节的创新应用 [1] 行业投资机会 - 游戏板块受AI、内容、商业化模式变革多重催化 具备投资潜力 [2] - 游戏ETF(159869)跟踪中证动漫游戏指数 可布局动漫游戏产业A股上市公司 [2]
刘强东:京东一年半涨薪七次,去年发了1161亿工资;传蔚来拟为芯片自研部门引入战略投资者;曝58同城大规模裁员:涉多个部门
雷峰网· 2025-06-19 08:46
京东薪酬与战略 - 京东2023年净收入11588亿元,净利润仅400多亿元,其中员工工资支出达1161亿元,五险一金支出180亿元[4] - 刘强东强调2007年至今京东五险一金累计缴纳超千亿元,坚持不使用外包员工[4] - 京东一年半内涨薪七次,P5以下员工最低涨薪50%,P5以上员工基本实现薪资翻倍[4] - 京东宣布入局酒旅行业,将通过供应链服务优化行业成本,未来还将拓展美容、医美等领域的供应链服务[9] - 京东国际业务采用本地电商模式,已在欧洲布局三年,拥有2000名本地员工,坚持不走跨境电商路线[12] 新能源汽车与自动驾驶 - 蔚来计划为芯片自研部门引入战略投资者,后续将成立项目实体,已推出"杨戬"激光雷达芯片和"神玑NX9031"智能驾驶芯片[6] - 长城旗下毫末智行被曝高层动荡,董事长张凯否认离职传闻,公司乘用车辅助驾驶业务仅有两个现代车型项目,低速无人车今年销售目标仅50余台[6][7] - 奥迪撤回2033年全面停售燃油车计划,将推出全新内燃机和插混车型系列,2024年纯电车型交付量下降8%[37] - 江铃福特或将并入长安福特,整合后将形成全车系矩阵,长安福特2016年销量曾达95.75万辆[17] 本地生活与零售竞争 - 美团外卖日订单量维持在9000万单以上,市占率稳居70%,客单价保持在30元左右[12][13] - 盒马创始人侯毅认为美团即时零售在快消品品类超越天猫京东只是时间问题,因其聚合线下小店资源实现更高效率[8] - 58同城被曝大规模裁员,比例达20%-30%,涉及多个部门,2024年Q4净亏损1970万美元[15][16] 消费电子与AI应用 - 小米Q1全球可穿戴设备出货量870万台,同比增长44%超越苹果重回第一,红米手环5热销是主因[23] - 小米YU7全系标配激光雷达和800V平台,雷军称其定位高性能豪华SUV,起售价预计不低于25万元[19][20] - B站接入阿里千问3大模型,618期间商单成交效率提升5倍,数据洞察效率提升3倍[25][26] - Rokid推出全球首款支持支付的智能眼镜,内置支付宝"看一下支付"功能,全球订单已突破25万台[27] 国际科技动态 - Meta试图以1亿美元签约金挖角OpenAI人才,但Altman表示核心团队无人离职[32][33] - 特斯拉在美国多地租用停车场存放滞销车辆,Cybertruck库存超3000辆,Model 3挂牌量大幅上升[34][35] - 英特尔计划裁减15%-20%工厂员工,同时任命三位来自Cadence、苹果、谷歌的高管[38][39] - 马斯克旗下xAI每月运营成本超10亿美元,预计2025年总支出将达130亿美元[40] - 谷歌研究发现Gemini AI在《宝可梦》游戏中表现出"畏死"情绪,濒死时推理能力显著下降[41]
Google Gemini、MiniMax更新大模型,全球首个智能眼镜支付上线丨新鲜早科技
21世纪经济报道· 2025-06-18 10:16
巨头动向 - Google Gemini 2.5模型家族更新,包含Gemini 2.5 Flash-Lite支持多模态输入和工具接入,Gemini 2.5 Flash统一Token定价标准为每百万Token 0.3美元,Gemini 2.5 Pro在多个基准测试超越竞品 [2] - MiniMax发布全球首个开源大规模混合架构推理模型MiniMax-M1,支持100万上下文输入和8万Token输出,RL成本下降至53万美元 [3] - 月之暗面开源代码大模型Kimi-Dev-72B,在SWE-bench Verified测试中以72B参数量取得60.4%高分,超越671B参数的DeepSeek-R1 [4] 智能终端与出行 - 鸿蒙智行周交付达11600台连续4周破万,问界M8单周交付突破5000台,上市45天累计交付超20000台 [5] - 京东外卖日订单突破2500万单,入驻餐饮门店超150万家,全职骑手超12万人预计本季度末达15万人,北上广深骑手平均月收入1.3万元 [7] - 理想汽车回应美团CEO王兴减持573.7万股套现超6亿港元,持股比例从20.94%降至20.61% [9] 人工智能应用 - 微信测试聊天记录备份至外部存储设备功能,支持U盘/移动硬盘多份备份管理 [6] - 豆包AI上线播客功能,可基于PDF/网页生成双人对话节目 [8] - Rokid联合支付宝推出智能眼镜支付方案"看一下支付",支持语音指令完成付款 [9] - 夸克发布AI学习产品"夸克老师",具备讲题、批作业、出题等家教功能 [13] 半导体与硬件 - 芯聚能半导体车规级SiC芯片实现全链条自主可控并批量上车,主驱模块进入大规模交付阶段 [14] - DDR4内存条价格大幅上调但成交乏力,部分DDR4颗粒现货价已超DDR5 [15] - 兆芯集成科创板IPO申请获受理拟募资41.69亿元,投向服务器/桌面处理器等项目 [16] - 思特威公告国家集成电路基金二期持股比例由7.35%降至6.99% [21] 资本运作 - 曹操出行港股招股拟募资18.53亿港元,估值228.23亿港元引入6名基石投资者 [17] - 京东方A拟48.49亿元收购咸阳彩虹光电30%股权 [18] - 吴通控股拟8400万元收购智能电子20%股权 [19] - 蓝星光域完成数千万元B轮融资用于激光通信技术商业化 [20] 企业合作 - 国芯科技抗量子密码卡CCUPHPQ01测试成功并向多家客户送样 [10] - 德马科技与智元新创达成战略合作探索具身智能机器人在物流场景应用 [11] - 传音控股与印尼电信运营商IOH合作推动5G终端渗透和移动互联解决方案 [12]
MiniMax新模型对标DeepSeek;豆包上线AI播客;美参院通过稳定币法案
观察者网· 2025-06-18 08:49
AI模型与技术创新 - MiniMax开源推理模型MiniMax-M1,多项基准测试比肩DeepSeek-R1、Qwen3等开源模型,接近海外领先模型 [1] - MiniMax-M1训练仅用3周时间、512块H800 GPU,算力租赁成本仅53.47万美元,比预期少一个数量级 [1] - 豆包电脑版上线AI播客功能,用户上传PDF或网页链接可一键生成双人对话播客,秒级转化 [3][4] 数字人与AI应用 - 百度发布高说服力数字人四大突破:双数字人互动直播间、文心4.5T升级剧本模式、多模态高度融合、多任务复杂场景带货效果媲美真人 [4] - 亚马逊CEO表示生成式AI工具将改变工作方式,未来几年企业员工总数将减少 [6] - 苹果AI部门负责人约翰•詹南德雷亚或因项目推进缓慢遭降职,与高层理念分歧 [5] 资本市场与AI布局 - 软银出售T-Mobile股份筹资48亿美元,计划向OpenAI注资至多300亿美元,合作投入数千亿美元建设数据中心 [6] - 蓝思科技H股发行获中国证监会备案,拟发行不超过4.31亿股境外上市普通股 [6] - 兆芯集成科创板IPO获受理,拟募资41.69亿元投向处理器研发项目,研发人员占比75.97%,拥有1410项发明专利 [8] 稳定币与加密货币 - 美国参议院通过《天才法案》,首次批准主要加密货币立法,为稳定币建立监管框架 [7] - 京东计划在全球主要货币国家申请稳定币牌照,目标降低跨境支付成本90%,效率提升至10秒内 [7] 其他行业动态 - 名创优品创始人叶国富分享IP运营四步方法论:签约/孵化IP、开发产品、门店销售跑数据、数据好的IP推广 [9] - 上海成为2024年全球最具影响力电竞城市,中国女性电竞观众比例从2020年36%升至2024年71.8% [9]