Workflow
AI前线
icon
搜索文档
登顶 Arena!MiniMax 最新 Speech-02 模型屠榜:超越OpenAI、ElevenLabs,人声相似度99%
AI前线· 2025-05-15 14:45
作者 | 凌敏 没有什么比"群星闪耀"更适合形容近期的 TTS(Text-To-Speech,文本转语音)模型领域了。 开年以来,从科技巨头到创业公司再到研究机构,都在发力 TTS 模型。2 月,字节跳动海外实验 室推出一款轻量级 TTS 模型 MegaTTS3-Global;3 月,出门问问联合香港科技大学、上海交通 大学、南洋理工大学、西北工业大学等顶尖学术机构,共同开源新一代语音生成模型 Spark- TTS;同月,OpenAI 推出基于 GPT-4o-mini 架构的 TTS 模型。 与 AI 领域其他热门技术相比,TTS 似乎格外低调,但它却是智能硬件、数字人等场景的"隐形基 石"。凭借广泛的应用领域和开阔的商业前景,TTS 在最近一年取得了长足的进步,并悄然改变 着行业规则。 最近,TTS 模型又有重磅"上新",Speech-02语音模型一出手,就将 OpenAI、ElevenLabs 甩在 了后面,登顶 Arena 榜单,成为全球第一。 | Creator | | Model | Arena ELO | 95% CI | # Appearances | | --- | --- | --- | - ...
不再“纸上谈兵”:大模型能力如何转化为实际业务价值
AI前线· 2025-05-15 14:45
作者 | AICon 全球人工智能开发与应用大会 策划 | 李忠良 编辑 | 宇琪 随着技术的快速发展,大模型在各行业的应用潜力日益凸显,但如何将大模型能力高效转化为实际业 务价值,仍是企业面临的核心挑战。 近日 InfoQ《极客有约》X AICon 直播栏目特别邀请了 华为云 AI 应用首席架构师郑岩 担任主持人, 和 蚂蚁集团高级技术专家杨浩、明略科技高级技术总监吴昊宇 一起,在 AICon 全球人工智能开发 与应用大会 2025 上海站 即将召开之际,共同探讨大模型如何驱动业务提效。 部分精彩观点如下: 在 5 月 23-24 日将于上海举办的 AICon 全球人工智能开发与应用大会 上,我们特别设置了 【大模型 助力业务提效实践】 专题。该专题将围绕模型选型与优化、应用场景落地及效果评估等关键环节,分 享行业领先企业的实战经验。 查看大会日程解锁更多精彩内容: https://aicon.infoq.cn/2025/shanghai/schedule 以下内容基于直播速记整理,经 InfoQ 删减。 场景探索 郑岩:在探索大模型应用场景时,企业常会遇到"看起来很美但落地难"的需求,各位在实际项目中是 ...
AI 开发:从 Demo 到上线有多远?| 直播预告
AI前线· 2025-05-15 14:45
直播亮点 5 月 15 日 20:00-21:30 直播主题 AI 开发:从 Demo 到上线有多远? 直播嘉宾 主持人 : 孙志岗 AI 师傅创始人 /CEO 嘉宾 : 从 0 到 1,AI 创业者的实战经验分享。多位一线 AI 创业者现身说法,亲述从想法到落地的真实经 历。当 AI 不只是工具,而是时代机会,你准备好抓住了吗?扫码预约,不见不散! 直播介绍 直播时间 艾逗笔(idoubi) ThinkAny & MCP.so/ 创始人 莫欣 Agently.tech / 创始人 何少甫 AI 师傅 / 联合创始人、首席产品官 扫描下图海报 【二维码】 ,或戳直播预约按钮,预约 InfoQ 视频号直播。 如何向讲师提问? 文末留言写下问题,讲师会在直播中为你解答。 多视角剖析 AI 开发:从独立产品到系统架构,再到产研协作 AI 落地到底卡在哪,怎么从 Demo 走到真正上线 聊工具也聊认知,聊实践也聊误区 如何看直播? ...
微软再次裁员:18 年老员工、10 倍 TypeScript 性能提升幕后功臣也一并优化了
AI前线· 2025-05-14 18:19
据 CNBC 报道,微软即将在全球范围内裁员 3% 。目前微软在全球拥有约 22.8 万名员工,这意味着超过 6500 名员工可能受到此次裁员的影响,这也标志着这是该公司战略的一次重大调整。 并且,在遣散名单里的人只有 5 天时间做出选择: 拿 16 周遣散费; 或者接受一个绩效改进计划,但如果失败将没有任何遣散费。 微软表示,此次调整旨在优化资源,确保公司能够持续加大在新兴人工智能平台上的投资。裁员决定旨在 精简部分运营、提升底线,从而释放资本支持公司以人工智能为核心的战略。微软在官网上表示:"我们在 人工智能领域进行了大量投资,因为我们对人工智能能为个人、行业和社会带来的帮助充满信心,我们也 承诺将技术与人类相结合,负责任地实现人工智能的承诺。" 编译 | Tina 路透社报道称,导致裁员的原因并非人工智能技术本身,而是微软对新人工智能项目的持续投资。Satya Nadella 在硅谷的一次演讲中表示:"今天我们代码库中的 20% 到 30% 的代码,可能都是由软件编写 的。"不久前,Nadella 还曾描述过他对微软的愿景,称其为"提炼工厂",他们将把大型通用人工智能模型缩 小成更小、更专业甚至任务特定 ...
微软华人AI团队核心成员被曝加入腾讯混元,知情人称与裁员无关|独家
AI前线· 2025-05-14 16:12
作者|冬梅、核子可乐 近 日 , 据 外 媒 消 息 , WizardLM 团 队 核 心 成 员 Can Xu 已 经 离 开 微 软 , 加 入 了 腾 讯 混 元 (Hunyuan)事业部。 Can Xu此前也 在 X 发帖表示 ," 我和 WizardLM 团队 离开微软加入了腾讯混元 ( I and WizardLM team has left Microsoft and joined Tencent Hunyuan! )" 。但此贴目前已被删 除,Can Xu 解释称此前信息有误,是他个人离开了微软,而非整个团队。 据知情人士向 AI 前线独家透露,WizardLM 团队的主力成员大部 分已经离开微软。 有趣的是,AI 前线留意到,Can Xu 宣布离开的时间点比较微妙,因为正值微软被曝出将在全球 范围内裁员 3%,也就是大约 6000 多人会受到影响,外界猜测Can Xu的离开或与微软裁员有 关。 但据知情人士透露,WizardLM 团队核心人物 Can Xu 和 Qingfeng Sun 早已离开微软,只是近 日才将消息公布出来,他们的离开与微软裁员无关。 知情人士还透露,团队也会采用远程办公 ...
RAG系统设计:揭秘语义搜索被低估的核心价值与KG驱动的架构选型策略
AI前线· 2025-05-14 13:47
RAG系统与语义搜索 - RAG系统通过检索增强生成解决LLM的局限性,包括训练成本高和幻觉问题[5] - 语义搜索在RAG系统中被严重低估,其核心是将文件映射到高维测度空间实现语义匹配[10] - 语义搜索允许直接将文件作为索引,通过embedding形式与查询对比,具有处理低资源文件和长文件的灵活性[11][12] 系统设计与损失函数 - 工程是取舍的艺术,需要明确能够接受的权衡和牺牲[19] - Contrastive Loss形成多个相距m距离的紧密聚类,适用于结构紧密、方差较小的数据[21] - Triplet Loss适用于类内方差较大的数据,如同一个人在不同光照条件下的人脸图像[26][27] 距离函数与嵌入模型 - 余弦距离不符合度量空间定义但计算简单,适合推荐系统等只关注方向的场景[29][30] - 欧几里得距离适合复杂场景如电商推荐,但可能出现数值溢出和高维数据稀疏问题[35][36] - 嵌入模型选择优先级:性能/成本权衡 > 数据领域 > 损失函数 > 距离度量[42][43] 向量数据库与索引 - 向量数据库选择需考虑开源/闭源、实现语言和部署方式[45][48] - 索引方式包括哈希、树、图和倒排索引,图索引适用于大多数高维数据场景[50] - 系统设计重点是为语义搜索提供数据结构,如分层结构或Context Enrichment[53][56] KG-RAG与未来趋势 - KG-RAG能清晰描述实体关系但成本高,Lazy Graph RAG通过结合语义搜索降低成本[72][73] - 大模型正向端设备迁移,需要更快的RAG实现以适应有限资源[79] - 机器学习系统设计最佳实践是优先使用传统方法如SQL或正则表达式[81]
微软这支神秘的华人AI团队加入腾讯混元,曝与裁员无关|独家
AI前线· 2025-05-14 13:47
团队动态 - WizardLM团队6名主力成员离开微软加入腾讯混元AI开发组织 将专注于推动LLM培训技术和AI模型构建 [1][4] - 团队采用远程办公模式 成员独立负责各自研发部分 [5] - 团队核心人物Can Xu和Qingfeng Sun早已离开微软 与微软近期裁员6000人无关 [4] 团队背景 - WizardLM团队成立于2023年初 专注高级大语言模型开发 在HuggingFace有6位主要成员 [7] - Qingfeng Sun曾任微软AI研究科学家 共同创立WizardLM项目 贡献Evol-Instruct等方法 [9] - Can Xu领导WizardLM系列模型研发 发表40多篇顶级会议论文 Google Scholar引用超3300次 [10] - 团队曾与北京大学合作开发Evol-Instruct方法 生成的指令质量优于人工数据集 [10] 技术成果 - WizardLM-30B在Evol-Instruct测试集取得97.8% ChatGPT分数占比 [14] - 在2023年UC伯克利LLM排位赛中 WizardLM位列全球第四 是华人团队开源模型第一名 [16] - WizardLM-30B在HumanEval评估中击败code-cushman-001和StarCoder [17] - WizardLM-13B在AlpacaEval和Evol-Instruct测试集分别获得87%和89% ChatGPT能力占比 [17] 模型发布 - 2024年4月发布WizardLM-2系列 包含8x22B/70B/7B三个型号 性能接近专有模型 [19][21] - 8x22B专为复杂任务设计 70B侧重推理能力 7B注重处理速度 [21] - 在MT-Bench评估中 8x22B得9.12分 70B得8.92分 7B得8.28分 [22] - 微软因缺乏毒性测试撤回WizardLM-2模型 团队承诺尽快完成测试重新发布 [23][24] 腾讯布局 - 腾讯重组混元AI研发架构 新设大型语言模型和多模态模型团队 [28] - 加强数据基础设施建设 设立大模型数据管理部门和机器学习平台部门 [28][29] - 计划2025年投入900亿元(124.9亿美元)资本支出 重点发展AI业务 [30] - AI业务为腾讯2025年第一季度贡献8%的增长 [30] 行业影响 - Hugging Face CEO批评微软移除WizardLM模型损害开源社区利益 该模型月下载量超10万次 [25][27] - 网友认为腾讯比微软更适合WizardLM团队发展 微软在AI研发上已显疲态 [32] - 部分用户惋惜WizardLM从开源转向闭源 认为这是行业损失 [34]
氛围编程成新晋顶流,腾讯也出手了!代码助手 CodeBuddy 重磅升级,网友实测:真香
AI前线· 2025-05-13 14:35
作者 | 凌敏 氛围编程(Vibe Coding)彻底火了,甚至已经成为硅谷近期最火热的概念。 今年 2 月,OpenAI 联合创始人、前特斯拉 AI 负责人 Andrej Karpathy 提出氛围编程概念:你完全沉浸在氛围里,拥抱指数式增长,甚至忘记代码本身 的存在。"我只是看到什么就说什么,运行,复制粘贴,然后基本能跑起来。如果发生错误,就把错误信息再塞给 AI,接受它的改动,试试看能不能 行,然后反复这个流程。" 随后,氛围编程在国内外的科技社区迅速走红,一度成为开发者群体的"新精神图腾"。YC CEO Garry Tan 更是直言:"氛围编程不是一阵风潮,也不会 消失;它是编码的主流方式,如果你不这么做,就可能被落在后面。" 与传统的软件开发相比,氛围编程更强调通过自然语言描述需求,由 AI 自动生成代码。这种方式极大地简化了开发流程,开发者能够专注于创意和功能 实现,而不是代码细节。此外,氛围编程也能让完全没有技术背景的人参与到编程中来。 人人都是程序员的畅想,在这一刻更加清晰了。 而氛围编程之所以可行,正如 Karpathy 所说的那样: 大模型已经强大到离谱了。 如今的大模型,编程能力早已不在 ...
从“铁三角”到“六有”组织,北银金科如何打造千人高密度数智化团队?| 极客时间企业版
AI前线· 2025-05-13 14:35
当前,银行业正经历一场由数字化、智能化技术驱动的深刻变革。在这一过程中,金融科技子公 司作为技术创新的引擎,通过推动技术落地、业务重构和人才培养,正在重塑银行业的服务模式 与竞争格局。 在极客时间主办的 2025 DTDS 全球数智人才发展大会上,北 银金科党委书记,副总经理赵瑞兰 发表了题为《北银金科数智化时代的人才培养与组织变革共生之道》的演讲,介绍了北银金科过 去几年来在数智化转型过程中的实践经验以及人力资源部门与管理层战略对齐的思路。以下内容 由极客时间基于本次演讲内容进行编辑。 北银金科企业介绍 北银金科作为北京银行的科技子公司,成立于 2019 年 5 月 16 日。它是在银行业数字化转型的 大背景下诞生的。作为效率革新与成本控制的双重引擎,科技发挥重要作用,在前期投入阶段有 着较强的规模效应,需要更多的人员投入与资源积累,北银金科也是由此而生。 我们以北京银行"数字京行"的战略为指引,定下了"服务母行、做精产品、做优技术、做强实力"的 发展目标,以科技创新激发高质量发展新动能,为北京银行数字化转型提供坚实支撑。 北银金科的职能 定位分为三个方面,分别是以客户为中心的"一个原则",助推北京银行数字 ...
客户不转化、内容不合规?AI 与 Agent 如何破解金融营销五大难题
AI前线· 2025-05-13 14:35
作者|徐小磊,广发银行信用卡中心商业智能负责人 编辑|Kimmy 在金融营销进入智能化 3.0 时代的当下,AI 与 Agent 已不再是锦上添花的"选配",而是重塑客户洞 察、决策效率和服务体验的核心驱动力。本文将结合行业演进、现实痛点与前沿实践,探讨 AI 技术 如何为金融机构打造差异化竞争力,开启以"智能密度"为核心的新一轮营销升级。 在将于 2025 年 6 月 27~28 日举办的 AICon 全球人工智能开发与应用大会(北京站) ,我们设置了「 AI 在金融领域的应用和趋势探索 」专题,由广发银行信用卡中心商业智能负责人徐小磊出品,聚焦"AI 在金融领域的应用案例 / 成果与趋势探索",深入探讨金融 AI 应用案例分享、前沿趋势探索和行业特殊挑 战。 欲了解更多内容,可访问大会官网: https://aicon.infoq.cn/2025/beijing/track/1805 很高兴在今天这样一个充满变革的时刻,能和大家一起探讨一个金融营销人都高度关注的话题: AI 和 Agent 如何深刻改变我们的工作,以及我们如何抓住这波浪潮,为企业建立真正的竞争壁 垒。 回望与前瞻:金融营销的进化之路与 A ...