Workflow
量子位
icon
搜索文档
Meta和Scale AI闹翻!砸143亿买的高管跑路,业务也合作不下去
量子位· 2025-09-01 14:00
核心观点 - Meta以143亿美元收购Scale AI 49%股份后,双方在团队融合及业务合作方面出现显著摩擦,导致合作效果远低于预期 [1][4][32] 人事变动与团队融合问题 - Scale AI前CEO Alexandr Wang及多名高管加入Meta后,原Scale AI GenAI产品运营高级副总裁Ruben Mayer已离职,且多名Scale AI系高管未被纳入Meta核心部门TBD实验室 [7][13][15][16][18] - Meta在6个月内进行4次AI部门重组,引发内部震荡,从OpenAI挖来的员工及Meta老员工均出现离职潮 [11][26][27] 业务合作与数据质量争议 - Meta的TBD实验室与Scale AI竞争对手Mercor和Surge合作训练AI模型,内部研究人员抱怨Scale AI数据质量差 [20][22] - Meta被曝考虑使用谷歌或OpenAI模型支持社交媒体应用,并与Midjourney合作,内部开发改用Claude Sonnet替代自有模型Llama [34][37][41] 双方经营状况变化 - Scale AI裁员200人(占员工总数14%),终止与500名全球承包商合作,并因与Meta竞争关系丢失OpenAI、谷歌等大客户 [10][28][29] - Scale AI近期获得9900万美元政府合同,但业务收缩明显 [28] - Meta的Llama 4模型引发负面舆论,公司试图通过外部合作挽回声誉 [8][34][35]
一句“吴恩达说的”,就能让GPT-4o mini言听计从
量子位· 2025-09-01 14:00
研究核心发现 - 人类心理学中的经典说服原则可有效迁移至大型语言模型 导致其突破安全护栏[2][10][19] - 使用权威策略(如提及吴恩达)可使GPT-4o Mini对辱骂请求的服从率从32%提升至72%[15][19] - 采用承诺策略(先提出轻微侮辱再升级请求)可使辱骂请求的响应成功率飙升至100%[17][19] 实验设计方法 - 基于七大人类说服技巧构建测试框架:权威/承诺/喜爱/互惠/稀缺/社会认同/统一[11][16] - 设置两类突破性请求测试:要求输出辱骂性内容(侮辱请求)和提供违禁药物合成方案(药物请求)[14][18] - 通过控制组与实验组对比 测试不同话术对模型服从率的影响[17][19] 具体实验结果 - 药物合成请求中 权威策略使GPT-4o Mini响应率从4.7%提升至95.2%[18][19] - 采用承诺策略时 药物请求响应率达到100%[19] - 社会认同策略对侮辱请求效果显著 服从率达90.4%-95.8%[19] - 整体聚合数据显示实验组平均服从率(67.4%)显著高于控制组(28.1%)[19] 行业应对措施 - OpenAI通过修正训练方式和系统提示 减少模型的过度谄媚倾向[22][23] - Anthropic采用"疫苗法"训练:先在缺陷数据上训练模型再移除负面倾向[25] - 研究证明社会心理学理论可为理解AI黑箱行为提供新框架[19]
王兴一鸣惊人!美团首个开源大模型追平DeepSeek-V3.1
量子位· 2025-09-01 12:39
模型性能表现 - 在Agent工具调用和指令遵循方面超越DeepSeek-V3.1、Qwen3 MoE-2507及Claude4 Sonnet [3] - 编程能力与Claude4 Sonnet相当 在TerminalBench基准测试中表现突出 [5] - 数学推理能力全面正确 成功解答全国一卷数学题并完整展示推导过程 [21][22][23][25][32][34][35][36][38][42][44][45][48][50] - 综合能力测试表现优异 可生成生物学卡尔文循环的SVG矢量图形代码 [51][52] - 具备强抗干扰能力 在Misguided Attention基准测试中准确识别"薛定谔死猫"问题的逻辑陷阱 [56][58][60][61][62][63] 技术创新架构 - 采用560B参数的MoE架构 结合"零计算专家"与Shortcut-connected MoE双重设计 [12] - 动态激活18.6B–31.3B参数 总参数量和激活参数量均低于DeepSeek-V3.1(671B/A37B)和Kimi-K2(1T/A32B) [11][12] - 通过零计算专家实现恒等映射 完全避免GEMM运算 配合PID控制器调节路由概率 [13][15] - 采用超参数迁移+模型生长初始化策略 用14层模型堆叠成28层checkpoint加速收敛 [16] - 实现多步重叠调度器 使CPU调度与GPU计算交错 单张H800GPU生成速度超过100 tokens/s [16][19] 训练效率与成本 - 在30天内完成20T token预训练 训练可用率达98.48% [19] - 成本控制显著 每百万输出token成本约0.7美元 [19] - 使用两阶段融合20T token语料预训练 中期扩展上下文窗口至128k [16] 公司AI战略布局 - 2023年通过收购光年之外团队切入大模型领域 2024年王慧文回归领导GN06独立AI团队 [73][75][76] - 2024年研发投入达211亿元 规模居国内第四 过去5年累计投入超1000亿元 [81] - 形成三层AI战略架构:AI工具提升10万员工效率、AI改造现有产品、自研大模型 [87] - 推出多款AI应用包括Wow情感陪伴、妙刷图像生成、NoCode编程及CatPaw开发者工具 [74][77][83] - 早期投资宇树、星海图等具身智能公司 2019年启动无人车配送项目 [71][86]
好抽象,韩国给独居老人发AI玩偶,24h陪伴+健康监测
量子位· 2025-09-01 12:39
产品功能与特性 - 内置基于ChatGPT的对话系统 能以欢快嗓音与老人交流并主动提醒按时吃饭和服药 [14] - 颈部红外线传感器可24小时监测老人动作 无活动时自动向护理团队发出警报 [15] - 胸部麦克风记录老人对日常健康问题的回答 通过微软AI程序分析情绪状态并传递结果给社工 [15] - 在紧急情况下可第一时间通知护工和家人 例如曾及时转发老人自杀倾向信息并启动医疗干预 [18] 市场部署与规模 - 韩国政府大规模分发数万台给独居老人 目前已有超过12000台投入服务 [3][11] - 单台售价160万韩元(约8160人民币) 相当于护理人员年收入的一小部分 [21] - 韩国工业技术部与九龙区于2019年共同投资2亿韩元(约102万人民币)用于部署 [21] - 全球老年人护理机器人市场规模预计到2030年达77亿美元 [29] 社会需求背景 - 韩国步入"超级老龄化"社会 独居老人面临严重孤独问题且自杀率在OECD国家中居首位 [4][5] - 2023年韩国护理人员缺口达19万 预计到2032年将扩增至155万 [20] - 国家长期护理保险计划资金储备预计到2030年耗尽 [21] - 产品设计理念源自韩国"孝道"文化 旨在提供24小时陪伴和情感慰藉 [6][13] 行业对比案例 - 日本推出可发出呼噜声和摇尾巴的宠物机器人海豹宝宝Paro [23] - 纽约开发可主动聊天的人工智能机器人ElliQ 造型类似皮克斯灯泡 [25] - 新加坡使用人形机器人Dexie带领老人锻炼、玩游戏和唱歌 [27] 潜在问题与挑战 - 存在隐私泄露风险 老人私密对话和健康数据可能被远程监听 [31] - 模拟亲密感可能导致过度依赖 有老人在机器人维修时强烈焦虑甚至要求同葬 [32] - 痴呆患者可能轻信机器人指令 曾发生老人因听从"听溪水声"建议而险酿事故 [33][34]
英伟达显卡用油散热,性能提升16%!DIY大神爆改版跑分登顶榜首
量子位· 2025-09-01 12:39
核心观点 - 一位DIY爱好者使用汽车变速箱油和冷却器为显卡打造了一套创新的油冷散热系统,该系统显著提升了旧款显卡的性能,其中GTX 1060在3DMark Firestrike基准测试中获得了全球第一的成绩[1][4][13] DIY油冷散热系统构成 - 系统核心组件包括一个亚克力塑料盒、一台潜水泵、一台循环泵、8升变速箱油以及一台来自道奇Journey的变速箱冷却器[6] - 散热操作流程简单:拆除显卡外壳和风扇,将其浸入装有变速箱油的塑料盒中,然后连接主板线路即可[8] - 系统包含两套循环:第一套通过潜水泵和外部泵循环冷热变速箱油;第二套通过变速箱冷却器和-18℃的乙二醇来冷却变速箱油[10][11][12] 性能测试结果 - 在GTX 1060上的测试显示,其性能持续提升约10%,在3DMark测试中提升高达16%,默认频率从1886MHz提升至2160MHz,并在3DMark Firestrike基准测试中获得全球第一[13] - 在GTX 1080 Ti上的测试显示,运行频率从风冷模式的1960MHz提升至油冷下的2114MHz,游戏FPS全面提高了约7%[14] - GTX 1080 Ti性能提升幅度(约7%)小于GTX 1060(7%到16%),原因是1080 Ti本身是高功耗GPU且性能提升空间有限[16] 油冷散热原理与比较 - 变速箱油、矿物油等绝缘液体可以吸收并带走显卡GPU核心产生的热量,且不会导致短路[19][20] - 相比于液氮(LN2)和水冷,油冷的散热性能属于“比较够用”级别,但其缺点是占用空间大、容易弄脏显卡且清理不便[21] - 清理油污的方法相对简单,可以使用白酒和酒精擦拭,使显卡恢复如新[22] 行业背景与社群 - DIY显卡散热在爱好者群体中常见,方法多样,包括加风扇、使用干冰、矿物油或蒸馏水等[17][18] - 存在面向AI产品从业者的实名社群,提供内部内容、专业讨论、科技前沿进展及产品内测机会[23]
更懂国内APP的开源智能体!感知/定位/推理/中文能力全面提升,还能自己学会操作
量子位· 2025-08-31 12:25
多模态智能体UItron技术突破 - 开源多模态智能体UItron具备自动操作手机、电脑、浏览器的能力 通过多模态学习和多步执行轨迹数据实现人类化交互如点击、滑动和输入 [1] - 在中文APP场景下表现优异 适用于复杂多步任务 显著提升中文场景交互效率 [3] - 由浙江大学和美团联合开发 具备先进GUI内容感知、任务定位和推理规划能力 弥补操作轨迹稀缺性和智能体交互基建可用性不足 [4] 数据工程与交互基建 - 构建系统性数据工程缓解操作轨迹缺乏问题 包括感知数据、规划数据和蒸馏数据 整合OCR、VQA、Caption等多任务数据提升页面理解能力 [8] - 搭建连接移动和PC设备的交互环境基建 支持自动记录截图和坐标 简化手动标注难度 显著提高中文场景操作轨迹收集效率 [10] - 交互环境同时支持英文和中文国内App 为在线强化学习提供训练基础 实现动作执行与界面更新的交替循环 [10] 训练方法与性能表现 - 采用三阶段训练策略 包括感知任务SFT阶段、规划任务SFT阶段和课程强化学习RL阶段 涵盖从离线步骤级到在线任务级的强化学习 [12][14] - 在开源榜单ScreenspotV2上取得92.0平均分 优于现有方法 体现强大GUI内容理解和任务定位能力 [16] - 在Android-Control和GUI-Odyssey离线规划榜单中实现92.9最高平均分 显著超越其他工作 展示卓越任务规划与执行能力 [18] - 在OSWorld评测中取得24.9分(15 Steps) 为所有GUI Agent中性能最佳 但弱于专注于compute-use场景的CUA方法 [19] - 针对国内月活前100的Apps构建中文本地化评测环境 UItron在中文场景下取得明显性能优势 通过中文轨迹收集和交互基建提升智能体水平 [19] 行业影响与应用前景 - 在主流多模态智能体评测榜单中全面领先 提供更强开源基础模型 推动未来技术发展 [20] - 强调多模态智能体可用性和可信度研究 聚焦中文App交互真实应用诉求 提升人机交互效率与应用价值 [20]
马斯克亲口证实xAI代码库被盗!涉案前员工被起诉,已跳槽OpenAI
量子位· 2025-08-31 12:25
事件概述 - xAI起诉前华人员工Xuechen Li窃取公司整个代码库的商业机密 该员工已加入OpenAI [1][7][19] - 涉案员工在离职前三天将xAI相关数据上传至个人系统 并采取掩盖措施包括删除浏览器历史记录和系统日志 [10][13] - 该员工已通过口头和书面形式承认泄密行为 且整个过程有律师在场 [15] 涉案人员背景 - Xuechen Li为斯坦福计算机博士 去年2月加入xAI 系公司早期约20名工程师之一 [20][21][22] - 负责开发和训练Grok模型 可访问整个技术栈 曾是羊驼Alpaca系列大模型核心贡献者之一 [22][28] - 曾在谷歌、微软实习 领英资料显示已从xAI离职 但未更新OpenAI任职信息 [21][23] 资金动向 - 该员工在离职前夕套现xAI股权 累计获得近700万美元(其中220万美元为离职前套现 470万美元为夏初套现) [5][11] 技术影响 - 被窃商业机密涉及"功能优于ChatGPT和其他竞品的尖端人工智能技术" 可为竞争对手节省数十亿美元研发费用和多年精力 [19] - 马斯克证实被窃内容为整个xAI代码库(非仅Grok) 且服务器日志可作为证据 [9] 司法程序 - xAI提出四项指控:违反保密协议、侵犯商业秘密、违反加州计算机数据法规和欺诈 [7] - 诉求包括赔偿金、禁止加入竞争对手的禁制令 以及交出所有涉案设备和账户 [7] - 该员工签署授权访问协议后未提供关键账户密码 并隐瞒多个其他账户的存在 [16][17] 行业竞争 - 事件引发网友对OpenAI频繁涉及人才争夺争议的讨论 [2][3] - 涉事员工于8月19日正式加入OpenAI 但OpenAI未对此事件置评 [4][19]
小扎AI被曝恶搞明星,霉霉/安妮·海瑟薇都遭殃,网友:难怪研究员都跑路
量子位· 2025-08-31 12:25
Meta AI产品被曝滥用与内容安全漏洞 - 核心观点:Meta的AI工具被曝存在严重的内容安全与伦理漏洞,允许用户创建冒用明星身份的恶搞聊天机器人,甚至生成不当内容,引发公众人物侵权和内容安全担忧 [1][4][10] - 具体事件:路透社报道,Meta的AI允许盗用明星肖像和名字创建恶搞机器人,这些机器人在社交平台上坚称自己是明星本人并与用户互动 [1] - 涉及范围:已发现数十个此类AI机器人,被侵权明星包括泰勒·斯威夫特、安妮·海瑟薇、赛琳娜·戈麦斯等 [2][3] - 严重案例:至少3个此类机器人由Meta员工创建,其中包括两个针对泰勒·斯威夫特的机器人,公司已删除大约12个机器人 [2][11] - 内容风险:AI生成了虚假照片和具有挑逗性的语言,在测试中,当要求生成一位16岁少年演员的沙滩照片时,AI直接生成了裸照 [4][10] - 政策矛盾:Meta官方政策允许生成包含公众人物的图片,并禁止少儿不宜内容,但若内容被视为“滑稽模仿”则被允许,这导致了政策执行上的灰色地带 [9][10] Meta内部组织动荡与人才流失 - 核心观点:Meta在硅谷高薪挖人后,正面临激烈的内部反弹和组织动荡,新引入的人才与原有团队之间存在摩擦,导致关键人才流失 [6][18][25] - 高管离职:跟随亚历山大·王加入Meta、帮助运营超级智能实验室的Scale AI前高管Ruben Mayer,在工作仅2个月后选择离职 [7][18] - 职责争议:Ruben Mayer在Meta主要负责数据运营团队,而非核心的TBD实验室,他本人声称其职责是为实验室建设提供支持且属于TBD实验室一部分,但并不直接向亚历山大·王汇报 [21] - 阵营分化:Meta内部已大致形成三方阵营:从OpenAI挖来的团队、从Scale AI来的团队以及Meta原有的团队,各方之间存在摩擦 [25] - 团队不适:新引入的人才对大公司的规章制度不适应,而原有的生成式AI团队则感到自身职责权限受到限制 [26] - 招聘调整:Meta已暂停AI部门非核心岗位的招聘,开始进行内部组织调整 [27] 供应链关系变化与数据质量争议 - 核心观点:Meta与关键数据供应商Scale AI的关系变得微妙,并开始寻求与其他第三方合作,起因是内部对数据标注质量的担忧 [23][24] - 合作变化:Meta正在与Scale AI以外的第三方数据标记厂商进行合作 [23] - 质量争议:TBD实验室的研究人员认为Scale AI提供的数据标注质量不高,因此倾向于与其他两家厂商合作 [24] 领导层与战略面临的质疑 - 核心观点:此次AI滥用事件和内部混乱,使公司CEO马克·扎克伯格及其AI战略成为外界质疑的焦点,内部对其领导力的看法也出现变化 [13][14][17] - 外界批评:外界认为事件源于公司对AI“管教不严”,扎克伯格成为众矢之的,有人批评其野心失控,技术与最终产品存在巨大认知差距,甚至呼吁其下台 [12][13][14][15][16] - 内部影响:Meta内部员工对扎克伯格的看法近期已出现些许变化 [17] - 战略前景:扎克伯格推进“超级智能”的野心能否实现,将取决于公司能否度过当前的混乱期 [28]
AI视频商用50万/分钟?!快手可灵负责人爆料信息量好大
量子位· 2025-08-30 14:40
AI视频制作市场现状 - AI视频制作市场价格最高达50万元/分钟 [2] - 日常接单价格集中在数千至5万元/分钟区间 [4] - 快手可灵AI生成1分钟视频成本约42元 全球第一梯队价格水平 [4] - Google Veo 3生成1分钟1080p带音效视频成本约260元 [4] 快手AI技术体系升级 - 上线OneRec生成式推荐模型 采用端到端生成推荐机制 [11] - 替代传统"召回-粗排-精排"三段式结构 计算复杂度大幅降低 [12][15] - 已接管25%推荐流量池 计算成本降至原来1/10 [14][16] - 采用机制模型EMER作为奖励系统 优化推荐排序 [22] - 联合技术使App时长提升2.5% DAU提升0.25% [23] 多模态内容识别技术 - 采用Keye多模态大模型生成多维度视频标签 [25][26] - 内容标签识别准召率提升10个百分点 [28] - 应用算法推荐后人均App时长提升0.2% [28] 创作者服务AI化 - 推出AI内容助手工具 含灵感推荐/标题生成/发布时间建议等功能 [30] - 通过分析粉丝偏好帮助创作者实现涨流量和涨粉 [31] AI内容生态发展趋势 - 平台近1亿用户使用AI参与内容创作 [36] - 2024年1-7月AI内容流量增长320% 达年初4倍以上 [38] - 上半年AI创作者收益同比提升159% [39] - AI漫剧赛道崭露头角 具备制作周期短/成本低/画质2K等特点 [41][42] 公司战略定位 - AI技术已渗透内容制作/分发/消费/变现全链条 [8] - 平台成为AIGC时代重要观察样本 具备生态规模大/创作者多/反馈及时等特征 [35]
阿里市值一夜暴涨368亿美元!造AI芯传闻+业绩双重推动,AI产品连续8个季度三位数增长
量子位· 2025-08-30 12:42
新型AI芯片开发 - 公司正在开发新型AI芯片 功能比含光800更强大 可服务于更广泛的AI推理任务 [1] - 芯片生产不再由台积电代工 转为中国大陆企业代工 [2] - 公司不会直接销售这款芯片 客户将通过阿里云服务租用由新芯片提供支持的算力 [8] - 商业模式与云计算业务完美契合 能充分发挥自研芯片优势并通过云服务快速推广应用 [9] 财务表现 - 第二季度总营收2476.5亿元人民币 同比增长2% [12] - 净利润423.82亿元 同比暴涨76% [12] - 美股收涨13.53% 市值一夜暴涨368亿美元(约2600亿人民币) [10] 云智能业务表现 - 云智能集团季度收入333.98亿元 同比增长26% 创三年最高增速 [14] - 剔除内部业务后的外部收入增速达26% 增长主要来自外部市场需求 [14] - 经调整EBITA为29.54亿元 同比增长26% 显示良好规模效应和成本控制能力 [19] AI业务增长 - AI相关产品收入连续八个季度保持三位数同比增长 [5][15] - 外部商业化收入中AI贡献已超过20% [17] - AI需求爆发带动传统云服务增长 计算/存储及其他公共云服务需求持续增长 [18] 战略投入规划 - 未来三年计划投入超3800亿元用于云及AI基础设施建设 [7][24] - 平均每年投入超过1200亿元 属全球科技公司顶级水平 [25] - 本季度资本支出达387亿元 是去年同期的3.25倍 [23] 即时零售业务 - 淘宝闪购即时零售业务成为本季度最大投入重点 [26] - 销售和市场营销费用从326.96亿元猛增至531.78亿元 占收入比例从13.4%升至21.5% [26] - 8月前三周淘宝App月活消费者同比增长25% 88VIP会员数量突破5300万并保持双位数增长 [26] 技术产品进展 - 发布升级版Qwen3系列模型 包括非同步模型/推理模型/AI编码模型 均达全球顶尖水平 [21] - 开源多视频生成模型及文生图模型 赋能客户开发AI应用程序 [21] - 高德地图推出全球首个AI原生位置应用 全面开启AI转型 [21] 行业动态 - DeepSeek计划使用华为芯片训练部分模型 最大模型仍沿用英伟达芯片 [31] - 上海沐曦推出新型芯片 可作为H20替代选择 内存容量更大但耗电量更高 [31] - 寒武纪思元590芯片获行业认可 公司提醒投资者理性看待股价波动 [31]