语音助手

搜索文档
钉钉联手通义实验室发布Fun-ASR语音识别大模型,支持企业专属模型定制训练
新浪科技· 2025-08-22 13:21
核心观点 - 钉钉与通义实验室语音团队联合推出新一代语音识别大模型Fun-ASR 具备行业专用词汇识别能力 支持企业定制化训练 并已集成至钉钉多类功能模块 [1] 技术能力 - 模型经过上亿小时音频数据训练 可准确识别互联网 科技 家装 畜牧 汽车等十多个领域的专业术语 [1] - 结合企业钉钉内通讯录 日程 知识库等信息进行推理优化 有效缓解大模型幻觉问题 需经企业授权生效 [1] - 支持企业利用真实场景语音数据进行端到端定制化训练 提升品牌名 项目代号 产品名等专属词汇识别准确率 [1] 功能集成 - Fun-ASR已被集成至钉钉会议字幕与同传 智能纪要 语音助手等多个功能模块 [1] 合作意义 - 通义实验室语音团队表示将持续扩大模型数据与规模 提升语音智能解决方案可复制能力 [2] - 钉钉强调三个月实现模型落地 获得头部客户认可 为行业定制大模型提供可参考范例 [2]
J.D. Power研究:先进配置渗透率大幅上升
中国汽车报网· 2025-07-31 17:17
行业智能化水平 - 2025年中国汽车行业智能化创新指数达588分,较2024年增长38分,市场深度指数提升80分至275分 [2] - 新能源市场深度指数同比显著增长86分至339分,巩固智能化引领地位 [2] - 自主品牌与国际品牌呈现两极分化:前者高频迭代快速响应,后者聚焦技术成熟度与稳定性 [2] 技术发展趋势 - 软件定义汽车成为行业主要方向,AI辅助驾驶和芯片算力技术迅猛发展 [2] - 消费者感知配置数量达6.9个连续四年上升,ADAS配置感知度整体上扬 [3] - 远程遥控泊车进入"多数派区间",安全防护与离车辅助功能跨越接纳区间 [3] 用户体验痛点 - 行业整体质量抱怨量同比增长34.8个PP100,智能座舱"不易理解/难以使用"问题占比升至36% [4] - 语音识别与内容理解仍是语音助手两大痛点,消费者期待AI提升交互效率 [4] - 故障类问题占比下降,消费者需求从"能用"转向"好用" [4] 市场需求变化 - 安全类配置(离车辅助、驾驶员监测等)使用频率与再购意愿显著上升 [4] - 消费者对便利性配置(数字钥匙、车控APP)需求持续旺盛 [4] - 用户对ADAS配置专注度提升,期待类人化辅助驾驶体验推动主流市场渗透 [3] 品牌创新指数排名 - 主流传统能源汽车品牌创新指数前三:领克(605分)、广汽传祺(605分)、长安汽车(589分) [6] - 行业平均分为557分,一汽丰田(532分)、MG(529分)、东风雪铁龙(523分)排名靠后 [6]
一文读懂数据标注:定义、最佳实践、工具、优势、挑战、类型等
36氪· 2025-07-01 10:20
数据标注的核心重要性 - 数据标注是AI和ML模型实现高准确性的基础 通过精确标记和分类数据使机器学习模型发挥最佳性能 [1] - 80%的数据科学家将超过60%的时间用于数据准备和注释而非模型构建 凸显其作为AI基础的关键地位 [2] - 标注良好的数据可确保模型识别模式 做出准确预测并适应新场景 直接影响AI系统性能 [5] 数据标注技术类型 - 图像标注涉及添加标题和关键词作为属性 对计算机视觉和面部识别至关重要 [13] - 音频标注需标记语言 方言 情绪等多维参数 包括非言语情况的识别 [16] - 视频标注通过逐帧标记实现运动追踪和行为分析 对自动驾驶等应用关键 [20] - 文本标注需处理语义 意图和情感等抽象元素 是NLP领域最复杂的标注类型 [23] - LiDAR标注处理3D点云数据 在自动驾驶和城市规划中实现精确空间识别 [31] 行业应用与市场趋势 - 全球数据标注工具市场规模预计2028年达34亿美元 2021-2028年CAGR为38.5% [5] - 自动驾驶领域依赖标注的图像和激光雷达数据检测行人及障碍物 [5] - 医疗AI通过标记的X射线和CT扫描训练模型识别病理特征 [5] - 78%企业AI项目采用内外结合的数据标注服务 较2022年增长24个百分点 [5] - 零售AI通过产品标记和情感分析实现个性化推荐 [5][81] 标注方法与效率提升 - AI辅助注释可减少70%的标注时间 同时提高15-20%的模型准确率 [5][48] - 半自动标注结合人工准确性和AI处理能力 显著提升大规模数据处理效率 [7] - 主动学习方法通过模型引导标注过程 减少30-40%的标注成本 [8][5] - 合成数据生成技术降低对人工标注的依赖 提高模型多样性 [6] 工具选择与实施策略 - 专业标注工具应支持多模态数据管理和版本控制 确保数据集完整性 [40] - 标注平台需内置质量检查模块 实现实时协作和反馈跟踪 [42] - 企业级解决方案必须符合GDPR/HIPAA等数据安全标准 [43][61] - 构建与购买决策需权衡项目规模 预算 合规要求和人力资源等因素 [50][68] 质量控制与最佳实践 - 多阶段质量控制系统包括初始培训 持续监控和最终审查 [47][54] - 采用多位注释者交叉验证可显著提高标注一致性 [86][88] - 清晰的标注指南和标准化流程是保证质量的关键因素 [86][88] - 人机协作模式将人工聚焦于复杂案例 提升整体效率 [86][88]
专家建议:App适老化并非简单做“加减法”
新京报· 2025-06-01 10:17
适老化App现状与问题 - 当前App适老化改造多停留在表面,如仅放大字体、简化界面,但二级、三级页面未同步优化 [1] - 交互流程复杂、语音助手识别率低导致老年用户操作失败率高 [1] - 部分App通过简单删减功能实现适老化,剥夺老年人选择权 [1] 系统性交互优化策略 - 需围绕老年人高频场景(挂号、缴费、出行等)设计"一键直达"主界面按钮,减少层级菜单 [2] - 采用"用户分层设计策略",区分70岁以下"数字移民"与75岁以上"数字难民",提供差异化界面复杂度 [2] - 引入"基础模式"和"进阶模式"双方案,允许用户自主切换界面复杂度 [3] 多感官协同与反馈机制 - 关键操作环节需加入振动提示、语音确认等多模态反馈,构建冗余信息通道 [3] - 语音执行结果应同步显示大字号文字或图标,结合听觉、视觉、触觉反馈增强可感知性 [5] - 语音播报需支持语速、语调自定义,避免专业术语,采用简洁口语化表达 [5] 语音技术应用突破 - 语音交互是降低数字门槛的首选路径,需建立老年语料库以提升方言、慢语速识别率 [4] - 优化语音唤醒机制,减少依赖唤醒词,加强意图识别与多轮对话逻辑 [4] - 开发"无屏语音设备"如便携遥控器,避开触屏操作阻力 [6] 软硬件生态适配 - 适老化需贯穿软硬件系统,如设计带物理按键、语音遥控的终端设备 [5] - 预置开机大字界面、常用功能一键启动、默认开启语音助手等降低使用门槛 [9] - 推动"家庭协助模式",允许子女远程设置语音指令或协助操作 [6] 政策与社会协同机制 - 建议政府主导"适老化星级认证",对医疗、交通等领域出台强制性标准 [7] - 设立专项基金支持非盈利性老龄技术研发,建立高校合作孵化机制 [7] - 社区开展线下数字学习小组,提供面对面操作辅导与信心建设 [8] 无龄化普惠设计理念 - 产品设计应默认考虑高容错输入框、大响应区按钮等普惠功能,服务全年龄段用户 [9] - 适老服务需内嵌日常功能,线上线下协同优化(如医院配备数字助老员) [9] - 目标是通过技术适配、政策推动与社会响应构建包容性数字生态 [10]