语音问一问
搜索文档
小红书,再造一个更有「声」命力的社区
机器之心· 2026-02-12 13:16
公司AI语音功能与春节应用 - 小红书在2026年春节期间推出了多种AI语音新玩法,包括语音发布、语音评论、语音问一问和语音私信拜年,旨在增强社区互动与年味[1][3][11] - 语音评论功能让评论区充满“活人感”,用户可使用多种语言、方言,甚至展示歌喉,增强了社交趣味性和人文关怀[2][5][25] - 语音问一问功能将真人经验与AI总结结合,用户可通过语音搜索获取结构化答案,例如询问春节去处或节日习俗,实现了从手动翻阅到“一问即得”的体验升级[7][8][27][29][30] 语音技术提升社区体验 - 语音作为最自然的交流媒介,正将小红书改造成更有“声”命力的社区,AI语音已全链路渗透至互动、搜索和笔记发布场景[15][16][35] - 语音问一问功能已吸引明星用户参与,如Adam Lambert,其AI能根据站内笔记快速生成分类清晰、结构严密的答案[28][29][30] - 语音发布功能也已上线,明星用户用它分享生活与祝福,进一步丰富了内容形态[33] AI语音落地面临的挑战 - 在庞大用户社区中落地AI语音需解决复杂场景下的音频理解问题,包括应对地域方言、口音、不同年龄段习惯、设备差异、背景噪音和语速的影响[38][39] - 技术需让音频生成具备“活人感”,要求模型能根据场景灵活切换风格,实现连贯的情绪表达,并精准拿捏细节语气和“弦外之音”[41][42] - 响应速度是关键,处理流程长导致的非实时反应会破坏对话连贯性,影响用户体验[43][44] 公司的天然优势与技术布局 - 小红书具备AI语音落地的天然优势:多元内容形态可承载语音交互;评论区插入语音无“打断感”;AI语音能力集成于主站核心场景,便于持续创新[46] - 公司Super Intelligence-AudioLab团队核心布局了语音识别、语音合成、全双工语音交互及ALLinOne基座模型、音乐理解生成四大方向[47] - 在语音识别领域,自研FireRedASR大模型取得中文语音识别开源SOTA效果,其FireRedASR2新支持20+方言和口音,在24个测试集上平均字错率为9.67%,优于竞品Doubao ASR的12.98%和Qwen3-ASR-1.7B的10.12%[47][48][49] - FireRedLID语种检测模型支持100+语种和20+中文方言,语种准确率达97.18%,显著高于OpenAI Whisper的79.41%[48] - FireRedVAD在Fleurs测试集上的F1分数为97.57%,高于开源Silero-VAD的95.95%[48] 语音合成与交互系统进展 - 在语音合成领域,自研FireRedTTS2大模型支持3分钟以上长对话生成,在音色稳定性和自然度上显著优于竞品,达到中文对话长语音合成SOTA[49] - FireRedTTS2模型引入了情绪感知能力,是实现语音“活人感”的关键,其在交互式对话场景微调后的情感控制准确率在多种情绪上表现优异,如担忧道歉达93.3%,快乐达90.0%[50][55] - 团队推出了业内首个开源、支持私有化部署的全双工语音交互系统FireRedChat,通过自研技术将端到端延迟低至2秒,解决了传统AI反应慢、乱打断的痛点[56] - ALLinOne基座模型实现了语音、音效、音乐的统一编码,为泛音频的理解与生成打下基础[57] - 自研的音乐理解与生成模型具备多尺度深层理解与灵活可控创作能力,已赋能平台音乐人创作[57][58] 技术体系与团队成果 - 小红书已构筑起覆盖底层架构优化、高质量语音合成、情感化语音互动、智能语音问答的完整技术栈[59] - Super Intelligence团队是公司面向未来内容形态与通用智能的重要技术引擎,目标构建领先的多模态基础大模型体系,团队包括Audio Lab、Vision Lab等多个实验室[59] - 过去两年,团队主导了多项重大项目,累计发表40余篇顶会与期刊论文,沉淀出InstantID、StoryMaker、FireRedTTS、FireRedASR等具有行业影响力的开源技术成果,并成功孵化多项站内爆款功能[60] AI语音探索的战略意义 - 小红书的AI语音探索能提升社区活跃度,并通过语音搜索让信息获取像聊天一样简单,尤其惠及不习惯或不方便打字的用户群体[61] - 实践验证了在追求技术高度的同时,体验深度同样重要,用户在意交互自然度、意图理解程度和服务无感化[61] - 最终的竞争在于能否以直观、亲和、高效的路径触达用户,让AI在更自然的交互中实现价值[62]
语音问一问上线,小红书为何发力问搜?
36氪· 2026-02-09 21:37
产品功能上线与迭代 - 小红书于1月27日正式上线“语音问一问”功能,用户可通过搜索页面的语音按键进行提问,搜索结果不仅呈现相关笔记,还会在顶部显示由AI总结真人经验笔记生成的答案 [1] - 该功能已全量上线,公司计划在春节期间通过上线春节指南等活动和奖品激励,引导用户使用语音问一问 [8] - 语音问一问是“问一问”功能的重大迭代,此前该功能已于2025年上线,支持文字提问和结构化总结回答,并在2025年底接入了评论区总结功能 [8] 产品核心特点与优势 - 语音问一问以语音为载体,支持更具体、详细、准确的“聊天式发问”,甚至能识别外语、方言和各类声线,提升了搜索效率和用户体验 [9] - 其生成的答案并非依赖通用知识库,而是对平台内庞大、真实的UGC(用户生成内容)经验进行提炼和总结,本质是AI辅助真人经验 [14] - 该功能旨在实现全场景问题的承接,通过高效整合站内海量真人经验,提供结构化问答服务,有助于覆盖医疗、教育等过往非强势垂类的搜索需求 [13] 市场定位与战略意图 - 公司内部将“问搜”作为重要发力点,意在抢占更多决策场景和人群,进一步扩张“有用心智”的护城河 [13] - 语音问搜是一种更低门槛的交互方式,能覆盖不擅长文字搜索的人群,有助于扩大用户边界,让更多人感受到平台的有用性 [22] - 搜索场景是小红书商业化的核心入口之一,用户通过提问比传统关键词搜索更精准地暴露核心需求,可能带来更高的商业化效率 [24] 社区生态与用户基础 - 小红书搜索的最大差异化优势在于其积累的“UGC真人经验”,这使其能提供多元、细分的回答 [14][16] - 平台用户本身存在强烈的“提问”与“解答”需求,例如2025年AMA(Ask me anything)玩法的自发走红,证明了问答交互心智的存在,语音问搜是将此社区行为产品化 [18][20] - 平台内容生态持续扩张与泛化,尤其在2025年二次元、游戏、科技等领域内容爆发,为AI理解提问和精准回复提供了更详细、差异化的语料库支撑 [21] 行业背景与趋势 - 中国人的搜索习惯正在改变,AI搜索逐渐渗透日常生活,部分AI对话工具用户规模达亿量级 [22] - 截至2025年第三季度,中国AI原生App的月人均使用时长约为117.7分钟,显示出强大的用户黏性,并正在蚕食用户在传统搜索引擎上的时间 [22] - 小红书发力语音问搜,既是顺应搜索场景的新变化,也是基于自身社区基因、用户需求与行业趋势的主动选择 [22][24]
语音问一问上线,小红书为何发力问搜?
36氪未来消费· 2026-02-09 21:30
小红书“问一问”功能上线与产品迭代 - 公司于2025年上线“问一问”功能,用户可通过文字提问获得由平台内真人经验笔记总结的结构化答案 [14] - 2025年底,该功能接入评论区,用户可通过@问一问直接总结评论区或笔记、视频的重点内容 [15] - 2026年1月27日,公司正式上线“语音问一问”功能,用户可通过语音进行提问,搜索结果会呈现相关笔记并在顶部显示由AI总结的真人经验答案 [6][13] “语音问一问”的核心特点与优势 - 功能以语音为载体,支持用户进行更自然、更具体、更详细的“聊天式发问”,甚至能识别外语和方言,提升了搜索体验与效率 [16][17] - 该功能旨在实现全场景问题的承接,通过对站内海量真人经验进行高效整合,提供结构化问答服务,可覆盖医疗、教育等非传统强势垂类的搜索需求 [21] - 语音交互相比文字搜索门槛更低,能覆盖不擅长文字搜索的人群,有助于进一步扩大用户边界,强化“有用”心智 [35] 基于“真人经验”的差异化竞争策略 - 公司搜索业务的核心差异化优势在于“UGC真人经验”,其AI生成的答案基于对平台内庞大、真实用户生成内容的提炼,本质是AI辅助真人经验,而非取代 [23] - 平台积累的海量、长尾、细颗粒度的社区真人经验与分享内容,是其能提供多元、细分回答,并满足用户情感联结与心理安全感需求的核心原因 [24][25][30] - 平台内早已存在强烈的问答交互心智,例如2025年下半年AMA(Ask me anything)玩法的自发走红,“问一问”功能是将这种自发的社区行为产品化 [27][29] 业务战略意图与行业背景 - 公司内部将“问搜”作为重要发力点,意在抢占更多决策场景和人群,进一步扩张“有用”心智的护城河 [21] - 此举是顺应搜索习惯的改变,中国AI原生App用户月人均使用时长在2025年三季度已达约117.7分钟,AI对话工具正蚕食用户在传统搜索引擎上的时间 [32][33] - 搜索场景是公司商业化的核心入口之一,用户通过语音提问比传统关键词搜索更精准、具体,能更清晰地暴露核心需求,可能带来更高的商业化效率 [38] 公司长期愿景与社区定位 - 从搜索到问搜的演进,是基于公司自身社区基因、用户需求与行业趋势的选择,旨在持续放大其“有用”心智,这是公司作为一个月活3.5亿APP的核心护城河之一 [40]
挪威主权财富基金2025年获利近2500亿美元;理想新设人形机器人和软件本体部门;Sora下载量暴跌45%丨邦早报
创业邦· 2026-01-31 09:12
AI视频与生成模型动态 - OpenAI旗下AI视频生成应用Sora移动端下载量1月环比暴跌45%,消费者支出环比下降32%至36.7万美元,自去年12月起已连续下滑,12月下载量环比下跌32% [1] - 生数科技发布全球首款支持16秒音视频直出的AI视频模型Vidu Q3,在国际评测机构Artificial Analysis榜单中以1241分位列中国第一、全球第二,超越Runway Gen-4.5、Google Veo3.1及OpenAI Sora 2 [11] - 月之暗面旗下Kimi K2.5模型上线3天后,在海外编程工具Kilo Code上调用量超越所有竞争对手成为最高,在OpenRouter平台调用量进入全球前三,仅次于Claude Sonnet 4.5和Gemini 3 Flash,其海外收入已超过国内,全球付费用户实现4倍增长 [8] 大模型与AI技术进展 - 蚂蚁灵波科技开源具身世界模型LingBot-VA,首次提出自回归视频-动作世界建模框架,将大规模视频生成模型能力与机器人控制融合 [17] - 谷歌旗下DeepMind公司在《自然》杂志发表封面文章,称其AlphaGenome深度学习模型能解码人类基因组中98%对健康至关重要的“暗基因组” [13] - 腾讯引进原新加坡Sea AI Lab高级研究科学家庞天宇,将入职混元多模态模型团队负责强化学习前沿算法探索 [6] - 小红书正在内测“语音问一问”功能,通过AI对分散的用户笔记经验进行一键总结,发力“真人经验+AI”问答场景 [17] 机器人技术与产业布局 - 理想汽车进行研发体系组织架构调整,新成立人形机器人团队和软件本体团队,多数自动驾驶部门员工划入新成立的基座模型团队 [1][3] - 宇树科技创始人王兴兴表示,谁能做出机器人用的大模型,谁就是全世界最厉害的AI公司和机器人公司 [3] - 德国机器人初创公司RobCo完成1亿美元C轮融资,用于推进其物理人工智能路线图并扩大企业部署规模 [10] - 马斯克被曝正考虑整合旗下资产推进太空算力布局,设想在太空部署AI数据中心,并探讨使用SpaceX星舰将特斯拉“擎天柱”机器人运送到月球和火星 [9] 芯片与算力领域 - 知情人士透露,英伟达拟向OpenAI投资至多1000亿美元的合作协议陷入停滞,因英伟达内部部分人士质疑该交易,双方目前正磋商数百亿美元的股权投资 [5] - 阿里旗下平头哥真武PPU芯片出货量已达数十万片,超过寒武纪,在国产GPU厂商中领先 [8] - 腾讯“元宝派”进入公测倒计时,新增功能疑似打通QQ音乐与腾讯视频内容库,支持免费享用会员内容 [11] 消费电子与智能硬件 - 苹果公司2026财年第一财季总营收创纪录达1437.56亿美元,同比增长16%,其中大中华区营收为255.26亿美元,同比增长38% [8][9] - 苹果公司计划优先推进2026年三款高端iPhone机型的生产,包括折叠屏iPhone及两款配备高端摄像头和更大显示屏的非折叠机型,标准版iPhone 18将推迟至2027年上半年上市 [8] - TrendForce集邦咨询预估,受Meta Ray-Ban Display智能眼镜零部件订单两度上修推动,2026年全球AR眼镜出货量将跃升至95万台,年增率达53% [18] - Omdia研究显示,2025年全球智能手机出货量增长2%达12.5亿部,为2021年以来最高水平,其中苹果iPhone出货量同比增长7%至2.406亿部,连续第三年保持全球最大智能手机厂商地位 [18] 新能源汽车与电池技术 - 宁德时代钠电品牌“钠新”即将在乘用车领域展开公开冬测,参与测试车型包括长安欧尚等,后续广汽、江淮旗下乘用车车型也会跟进 [8] - 长城汽车将魏牌调整至品牌公司并更名为魏品牌,组织内按车型设置作战单元,销售渠道将采用直营、代理并行模式 [9] - 一汽奥迪推出A5L燃擎星驰版新车型,售价28.58万元,“心动入手价”26.78万元,采用奥迪最新的E³ 1.2电子电气架构和第五代EA888发动机 [15] 企业融资与收购 - 苹果公司完成对以色列AI音频技术初创公司Q.ai的收购,斥资近20亿美元,这是苹果自2014年以30亿美元收购Beats后的第二大收购案 [10] - AI-Native用户研究平台Trooly.AI完成近千万美元种子轮融资,由蓝驰创投领投 [11] - FoloToy连续完成数千万元Pre-A轮、Pre-A+轮融资,由深创投、南山战新投投资 [10] 企业战略与人事变动 - 迪士尼首席执行官鲍勃·艾格计划在其合同于12月31日到期之前提前卸任,迪士尼董事会正处于挑选继任者的最后阶段 [9] - OpenAI计划在第四季度进行IPO,已与银行就潜在上市事宜举行非正式磋商,并聘请新高管以助筹备 [10]
消息称小红书内测语音问一问功能
新浪科技· 2026-01-30 16:20
公司产品动态 - 小红书正在内测“语音问一问”功能 部分用户的搜索框下方热榜功能已被该功能入口替换 [1] - 用户通过语音输入问题后 搜索结果页面除相关笔记外 还会显示由AI生成的“问一问”总结 [1] - “问一问”功能旨在对问答场景进行新探索 其答案基于站内真实笔记的AI结构化信息梳理 是对分散用户经验的一键总结 [1][3] - 该功能目前处于内测阶段 后续或会覆盖更多用户 [1] 公司战略与市场定位 - 问搜方向是小红书社区2024年重点发展方向之一 公司希望借此拓展和抢占更多决策场景与人群心智 [3] - “语音问一问”功能旨在增强公司在用户问搜场景中快速获取信息的能力 [3] - 该功能侧重于基于站内真实笔记生成答案 本质上是站内大量真人经验的整合提炼 而非单纯依赖AI生成通用答案 以此区别于市面上其他AI搜索产品 [3] 行业与用户背景 - 搜索场景所代表的有用心智是小红书的核心优势 有报道称其70%的月活用户有主动搜索习惯 平台日搜索次数超过7亿 [3] - 随着AI时代到来 用户决策场景快速变化 不少用户开始尝试使用豆包、deepseek等AI产品作为日常决策的效率工具 [3]
独家|小红书内测“语音问一问”功能,发力“真人经验+AI”问答场景
新浪财经· 2026-01-30 16:04
产品功能内测 - 小红书正在内测“语音问一问”功能,部分用户的搜索框下方原有热榜功能已被替换为该功能入口 [1][3] - 用户通过语音输入问题后,搜索结果页面除相关笔记外,还会显示由AI生成的“问一问”总结 [1][3] - 该功能旨在借助AI进行结构化信息梳理,将分散的用户笔记经验进行一键总结 [1][3] - 小红书官方客服回应称该功能尚在内测中,后续或会覆盖更多用户 [2][4] 战略方向与产品定位 - 公司内部人士表示,此动作为对问答场景的新探索 [2][4] - “语音问一问”功能旨在增加公司在用户问搜场景中快速获取信息的能力 [2][4] - 该功能侧重于基于站内真实笔记生成答案,本质上是站内大量真人经验的整合提炼,而非单纯依赖AI生成通用答案 [2][4] - 问搜方向将是小红书社区今年的重点发展方向之一,公司希望借此拓展和抢占更多决策场景和人群心智,并将持续深入布局 [2][4] 市场背景与用户行为 - 以搜索场景为代表的“有用心智”是小红书的核心优势之一 [2][4] - 有媒体曾报道,在小红书上,70%的月活跃用户有主动搜索习惯,平台日搜索次数超过7亿次 [2][4] - 伴随AI时代到来,用户决策场景正快速变化,不少用户开始尝试使用豆包、deepseek等AI产品作为日常决策的效率工具 [2][4]