Workflow
量子位
icon
搜索文档
Manus收购案细节曝光:开价20亿刀闪电成交,90后CEO不向亚历山大王汇报
量子位· 2025-12-31 08:55
收购交易核心信息 - Meta以20亿美元最终出价收购AI初创公司Manus [1] - 收购谈判过程仅用时10余天闪电完成 [5] - Manus在被收购前正寻求新一轮融资,估值亦为20亿美元 [2] 被收购方Manus的业务表现 - Manus成立仅8个月,年度经常性收入即突破1亿美元 [5] - 公司提供最高每月200美元的付费订阅套餐,上线8个月实现1.25亿美元年化经常性收入,拥有数百万付费用户 [17] - 公司目前主要使用Anthropic的Claude、阿里的Qwen等第三方模型作为底层能力 [7] 收购的战略动机与市场反应 - Meta此前在AI业务上缺乏直接收入来源,收购Manus具有战略补位意义,使其一夜之间拥有了成熟的AI付费业务 [9][18] - 市场对收购消息反应积极,公布当天Meta股价收涨1.10%,收复了此前因AI资本支出计划导致暴跌的部分失地 [19] - 此前Meta宣布2026年AI资本支出将大幅增加时,股价单日下跌11%,市值一夜蒸发2140亿美元,相当于107个Manus的估值 [11] - 有分析师指出,Meta股价下跌的核心原因是其“没有直接的AI营收可以报告” [15] - 相比之下,亚马逊在宣布增加AI资本支出后市值暴涨,相当于165个Manus的估值,因其可通过AWS将AI投资直接转化为营收 [16] 收购后的整合与安排 - Manus约100人的团队将整体并入Meta超级智能实验室的新加坡分部 [6] - 创始人肖弘将出任Meta副总裁,向首席运营官Javier Olivan汇报,而非向AI业务负责人汇报 [6] - 收购公告明示,此次收购的重点是拓展面向企业客户的服务 [23] - 收购后Manus是否继续使用第三方模型,或切换至Meta自家的Llama模型,目前尚无定论 [8] Meta的企业服务业务背景 - Meta之前尝试进军企业市场并未真正成功,例如2016年推出的企业通信应用Workplace将在2026年6月关闭 [24][25] - 此次收购被视为Meta通过Manus“跳车”进入企业服务业务的机会 [9]
阿里开源AI手机的“灵魂”,GUI智能体2B到235B四个版本全,端云协同成功率暴涨33%
量子位· 2025-12-31 08:55
文章核心观点 - 阿里通义实验室发布了名为MAI-UI的GUI智能体系统,该系统通过开源方式提供了从2B到235B的四个尺寸模型,旨在解决当前AI手机智能体落地的核心痛点,并实现了端云协同、主动交互、工具调用等关键能力,在多项基准测试中刷新了性能纪录 [1][3][13][33][34][35][36][37][38][39] 产品发布与核心特性 - 阿里通义实验室发布了MAI-UI系统,包含论文、代码和模型,并开源了从2B(端侧小模型)到235B(云端大模型)的四个尺寸版本,以满足全场景部署需求 [3] - 该系统不仅能执行基础的屏幕点击操作,还能主动追问用户未说清楚的需求,并直接调用外部API以绕过繁琐的界面操作 [4] - 系统设计了一套端云协同机制,将隐私敏感的操作留在本地处理,复杂任务则交由云端大模型处理 [5] 解决的核心痛点与方案 - **痛点一:交互缺失** - 现有系统多为端到端执行,无法处理用户指令不完整的情况(如“帮我订个机票”但未说明目的地、时间等),MAI-UI能够主动追问以澄清需求 [14][15][16] - **痛点二:纯UI操作的局限性** - 完全依赖界面点击容易因步骤出错导致任务失败,且无法完成某些手机界面不支持的功能(如查询GitHub提交记录)[17] - **痛点三:端云割裂** - 现有方案要么是能力有限的端侧模型,要么是存在隐私和成本问题的云端大模型,缺乏原生协作机制 [18] - **痛点四:动态环境下的脆弱性** - 在静态数据上训练的模型难以应对真实世界千变万化的界面布局和弹窗 [19][20] - **解决方案** - MAI-UI通过一条能自动生成用户交互和MCP工具调用数据的自演化数据管线、一套根据任务状态和数据敏感度动态切换端云执行的协同系统,以及一套支持500多个并行环境、最长50步交互的在线强化学习框架来解决上述问题 [21][24][25] 端云协同与隐私保护 - 系统由三部分组成:运行在手机本地的轻量级智能体(负责执行和监控)、云端大容量智能体(处理复杂任务)、本地统一轨迹记忆模块(保证信息一致)[28] - 工作流程中,本地监控模块会定期检查任务轨迹,若发现偏离且不涉及敏感数据,则将任务移交云端处理,并生成错误摘要以帮助云端模型快速恢复 [30] - 相比纯端侧执行,端云协同使2B模型的成功率提升了33%;相比纯云端执行,云端调用次数减少了40%以上,超过40%的任务完全在本地完成 [30] - 系统具备隐私保护机制,当检测到当前界面涉及敏感凭证(如密码输入)时,会阻止任务切换到云端,确保敏感信息不离开本地设备 [31] 性能表现与基准测试 - **GUI元素定位** - MAI-UI-32B在ScreenSpot-Pro基准上达到73.5%的准确率,超过了Gemini-3-Pro的72.7%和Seed1.8的73.1% [33][34] - **UI视觉理解** - MAI-UI-32B在UI-Vision基准上取得49.2%的准确率,比之前最强的UI-Venus-72B(36.8%)高出12.4个百分点 [34][35] - **综合GUI任务** - MAI-UI-32B在MMBench GUI L2基准上达到91.3%的准确率,刷新了纪录 [35][36] - **手机导航任务** - MAI-UI-235B-A22B在AndroidWorld基准上取得76.7%的成功率,超过了UI-Tars-2的73.3%和Gemini-2.5-Pro的69.7% [36][38] - **端侧模型表现** - 最小的MAI-UI-2B模型在AndroidWorld上成功率为49.1%,比之前最强的端侧模型Ferret-UI Lite(28.0%)高出21个百分点,相对提升75.4% [37][38] - **真实场景任务** - 在更接近真实场景的MobileWorld测试集上,MAI-UI-235B-A22B整体成功率为41.7%,比其他端到端模型高出20.8个百分点 [39] - **细分任务能力** - 在MobileWorld测试中,MAI-UI-235B-A22B在需要主动询问用户的任务上成功率为37.5%,在需要调用MCP工具的任务上成功率为51.1%,分别比之前最好的成绩高出32.1和18.7个百分点 [39] 应用案例展示 - **案例一:比较房源距离** - 用户收到两套房源地址,想比较哪套离公司更近并将地址发给朋友。传统方式需在短信和地图APP间反复切换。MAI-UI通过调用高德地图API直接查询驾车距离,一次性获得结构化结果,大幅压缩操作步骤 [7][8] - **案例二:查询GitHub提交记录** - 用户想在手机上查看GitHub仓库最近三次提交的作者和信息并发邮件。通过MCP调用GitHub API,智能体可直接获取结构化数据并切换到邮件APP发送,实现了桌面端工作流向手机的迁移 [9] - **案例三:主动询问需求** - 用户让智能体发送最近一个月的简历文件给HR,但未提供收件人邮箱和邮件正文。智能体检测到信息缺失后主动暂停并询问用户,获得完整信息后再执行任务 [11]
行业首款“万级电池”手机来了!2599元起,堪称游戏党物理外挂
量子位· 2025-12-31 08:55
产品发布与定位 - 荣耀公司于近期正式发布全新“荣耀WIN系列”手机,定位为“年度电竞夯机”,起售价为2599元 [1][2] - 该系列标志着公司产品策略的转变,从全年主攻影像和AI领域,转向年底针对电竞玩家市场推出重磅产品 [11][47] 核心性能配置 - 全系搭载10000mAh(万级)青海湖电池,为行业内首个配备万级电池的手机,官方宣称可支持连续进行50局游戏排位、刷31小时短视频或追40集动漫 [3][14][15][16] - 芯片采用第五代骁龙8至尊芯片,并搭配LPDDR5X至尊版内存与UFS 4.1存储,构成“顶配铁三角”硬件组合 [5][18] - 全系配备幻影引擎3.0,通过AI渲显分离技术优化,官方数据显示1% Low帧最高可提升20 FPS,有效减少游戏卡顿 [19] - 屏幕采用185Hz高刷新率电竞屏,支持3500Hz瞬时触控采样率与480Hz十指触控采样率,提升操作跟手性 [20] 散热系统 - 配备荣耀东风涡轮散热系统,采用行业首创的双360°环绕进风设计,配合直驱冷风道,缩短散热路径 [7][23][24] - 后置进风口设计考虑横握游戏场景,不易被手遮挡,风扇运行时最低噪音约为25分贝 [25][27] - 整机支持IP68/IP69/IP69K最高等级防尘防水,金属核心部件提供5年清灰保养服务,并辅以VC与石墨等被动散热结构 [27][28] 游戏体验优化 - 音频方面配备荣耀AI环绕低音炮与双立体扬声器,通过大音腔与AI算法强化游戏内声音细节,如脚步声与方位声 [30][31] - 通信采用24根多天线环绕布局,并增设独立侧翼电竞天线,优化横屏游戏时的信号稳定性,支持校园网专项优化与YOYO Wi-Fi智联功能 [32][33] - 提供“快开黑”、“指定赢”、“不怕蓝”三款配色 [39] 影像与其他功能 - 影像系统主摄为5000万像素镜头,搭配1200万像素超广角镜头,支持CIPA 5.0级别防抖 [35][36] - WIN版本额外配备一颗5000万像素长焦人像镜头,支持3倍光学变焦与更高倍率数码变焦 [36] - 全系支持与旗舰机型同款的Live Photo功能,便于捕捉动态场景 [37] 产品版本与命名 - 此次发布包括荣耀WIN和荣耀WIN RT两个版本,在性能配置上存在差异 [9] - 产品命名“WIN”源于与游戏玩家的共创,寓意玩家对胜利的追求,名称本身具有双关意味 [42][44][45]
吴恩达年度AI总结来了!附带一份软件开发学习小tips
量子位· 2025-12-30 14:33
文章核心观点 文章总结了吴恩达提出的2025年几大核心AI趋势,认为行业正经历从模型能力、人才竞争、基础设施到应用范式的全面变革,标志着一个由AI驱动的新工业时代正在拉开帷幕[5][7][33] 2025最热AI趋势 趋势1:模型会推理正在成为标配 - “会推理”从少数模型的特权转变为模型的标配能力[7][8] - 其萌芽可追溯至“让我们一步一步思考”提示词的提出,后通过强化学习微调将推理能力固化到模型中[9][10] - 范式转变始于OpenAI的o1模型,首次将多步骤的智能体推理工作流内置到模型架构中,带来性能飞跃[12] - DeepSeek-R1的发布进一步证明了该模式的可复现与可优化,并以开源姿态提供了技术路线图[12] - 但研究也指出推理模型存在局限性:可能在超出特定复杂度时失败,且推理步骤可能遗漏关键决策信息[14][15] - 推理能力提升性能的代价高昂,例如Gemini 3 Flash启用推理消耗1.6亿Token(得分71),未启用仅消耗740万Token(得分55)[16] - 当前模型优化的核心战场是如何在不牺牲性能的前提下大幅压缩推理成本并提升响应速度[17] 趋势2:由Meta点燃的AI人才争夺战 - Meta的激进招聘策略将AI精英薪酬推至堪比职业体育明星的高度,彻底重塑了科技行业人才定价体系[19][24] - 自2025年7月宣布成立“Meta超级智能实验室”起,Meta为顶尖人才开出数亿美元薪酬包,CEO亲自游说[20] - 此策略引发顶级人才在巨头间流动加剧的连锁反应[21] - 这场“军备竞赛”背后是AI价值定位历经十余年的根本性跃迁,薪酬演变分为四个阶段:学术期(薪酬与普通软件工程师无异)、商业化初期(顶级薪酬跃升至50万美元)、大模型爆发期(顶级工程师年薪突破70万美元)、军备竞赛期(出现数亿美元级“球星合约”)[23][27] - 行业共识认为,对于志在参与AGI竞赛的公司,天价薪酬是战略性的必要开支[23] - 到2026年,人才争夺可能从单纯价格战演变为薪酬结构、文化认同与长期潜力的综合博弈[23] 趋势3:数据中心的火热标志着新工业时代的到来 - 数据中心正成为AI时代新的“钢铁厂”与“发电站”,其建设规模堪比国家级基建项目,标志着AI竞赛进入“重资产”工业时代[25][26] - 2025年,各大公司宣布了巨额数据中心建设计划:OpenAI启动耗资5000亿美元的“星际之门”项目;Meta今年基础设施投入约720亿美元,其中“Hyperion”数据中心价值270亿美元;亚马逊预计2025年投入1250亿美元[28] - 仅2025年一年,AI行业资本支出就超过3000亿美元,其中绝大部分流向数据中心建设[29] - 麦肯锡预测,为满足AI训练与推理需求,到2030年总投资额可能高达5.2万亿美元[29] - 数据中心热潮面临三大挑战:一是供需是否合理,贝恩咨询指出到2030年全球AI年收入需达到2万亿美元(超过六大科技巨头2024年收入总和)才能支撑投资;二是电力供应制约,已有数据中心因无法接入电网而闲置;三是市场回归理性,已有金融机构因担忧企业债务过高而退出百亿美元级别的融资项目[30][31] - 数据中心投资已产生实体经济拉动效应,2025年上半年美国GDP的增长几乎全部由数据中心和AI投资所贡献[32] 趋势4:智能体编程正在从“打辅”走向“主导” - 以AI智能体驱动的自动化编程正在彻底重塑软件构建的方式[7][34] - 到2025年,编码智能体在同类任务上的完成率已普遍突破80%[35] - 智能体已演变为能够规划任务、调用工具、审查代码并操控整个代码库的“数字工程师”[36] - 模型推理能力的进步为智能体注入了“灵魂”,使其能先“想清楚”再行动,并通过将复杂任务分解交由低成本模型执行来降低整体计算成本[37] - 此趋势催生了新行业,以Loveable、Replit为代表的初创公司让毫无编程经验的用户也能“一键生成”Web应用[40] - AI辅助编码正迅速变为“编码”行为本身不可分割的一部分[41] 软件开发学习建议 - 核心建议是保持持续学习,通过“知行合一”的方式精进技能[42][44] - 具体方法有三点:一是多参加人工智能课程,进行结构化学习,避免在不了解基础知识的情况下重复造轮子[45][47];二是必须动手实践,亲自构建AI系统,因为很多经验只能通过实践获得[45][48][49];三是在闲暇之余多读一些技术论文,这有助于提升竞争力[45][52]
卡帕西推荐的AI Coding指南:3招教你效率翻倍
量子位· 2025-12-30 14:33
文章核心观点 - 文章介绍了一份由资深开发者撰写的AI编码实战指南,旨在通过三大关键策略提升AI辅助编程的效率与质量,其核心在于根据任务类型选择合适的AI模型、重构开发工作流以及明确人机分工 [1][3] 按任务类型选对模型 - 不应一个模型用到底,需根据任务复杂度选择模型:大型复杂任务(如几十页的工程规范落地、项目重构)适合使用Codex,因其在编码前会默读文件以理解项目逻辑,虽然耗时更长但对复杂需求的完成度更好 [5][6] - Codex在重构Opus 4.0旧代码时,花费数小时读透整个项目,不仅未遗漏关键逻辑,还修复了2个隐藏Bug [7] - 小型零碎任务(如小范围修改)适合使用Opus,其响应迅速,通常几分钟就能出结果,无需长时间读取文件 [8] - 进阶选择是GPT-5.2-Codex(尤其是high模式),它能够兼顾速度与准确率,适用于前端开发(如Chrome扩展)或后端工具(如Go语言CLI工具)等多种场景,无需在Codex和Opus间切换 [10] 重构工作流 - 建立定制化工作流是高效管理多项目并行的关键,作者可同时推进8个项目 [14] - 将新想法直接放入AI编码工具的排队列表,而非备忘录,系统会按优先级自动处理,避免遗忘并解放开发者精力,例如在开发“YouTube视频总结Chrome扩展”时,将“加浏览器弹窗提醒”、“支持本地存储”等想法塞入队列 [15] - 开发过程中应避免回滚决策以节省时间,秉持“构建软件就像爬山,绕路或后退都正常,但不要在‘要不要回滚’上浪费时间”的理念 [16] - 遇到相似功能时,无需从头编写,可指示AI参考旧项目代码或结构进行快速适配,例如参考VibeTunnel项目的“字符流输出”功能为Clawdis添加类似功能,仅用10分钟;或按旧项目(如Sparkle项目)目录格式搭建新工具 [17] 人机分工 - 基本原则是AI负责执行,人类负责决策 [18] - 必须由人类决策的事项包括:选择依赖库、设计系统架构、排列功能优先级等 [19] - 可以交给AI执行的事项包括:编写基础代码、修复已知bug、生成GUI界面、更新项目日志,甚至“注册域名”、“改DNS配置”等琐事 [19] - 实践案例:在开发Go语言CLI工具前,作者花费半天研究Go语言类型系统对AI生成的适配性及可复用库,决策后再让AI编写,有效减少了返工;在开发数据可视化工具时,则直接让AI用20分钟编写核心代码并负责测试 [20][21] 实用小技巧 - 开发新项目应从命令行界面工具开始,先验证核心逻辑,再扩展功能,例如开发“YouTube视频总结Chrome扩展”时,先构建能将视频转文字并总结成Markdown的CLI版本,确认可行后再让AI搭建前端和浏览器扩展,一天内完成 [23][24] - 利用项目文档帮助AI记忆上下文,减少重复沟通,例如在项目docs文件夹中写入“系统设计思路”和“功能说明”,并通过脚本让AI读取,之后添加新功能时无需反复提及兼容性等要求 [25][26] - 单人开发时可直接提交至主分支,避免使用复杂的特性分支或开发分支,因为分支过多易导致合并冲突,而AI工具(如Codex)可自动创建临时工作区处理混乱代码,改完后合并回主分支,比手动管理更简单 [27][28][29]
智谱定档大模型第一股,1月8日挂牌上市,IPO预募资43亿港元
量子位· 2025-12-30 11:57
IPO核心信息 - 智谱AI正式启动港股IPO招股,股票代码2513,预计于2026年1月8日在港交所主板挂牌上市[2][8] - 本次IPO全球发售37,419,500股H股,其中香港发售1,871,000股,国际发售35,548,500股[6][10] - 发售价定为每股116.20港元,预计募资总额约43亿港元,上市后市值预计超过511亿港元[3][9][11] - 招股期为2025年12月30日至2026年1月5日[9] 发行与投资者结构 - 本次IPO引入11家基石投资者,包括上海高毅、广发基金、泰康人寿等,合计拟认购约29.8亿港元,占发售股份比例接近七成[14] - 独家保荐人、整体协调人为OCICC FEATE,联席全球协调人包括国泰君安国际、招商证券国际等多家机构[6] - 募资用途方面,约70%的资金将用于研发,约10%将用于优化MaaS平台[16] 公司定位与技术实力 - 智谱AI被誉为“中国版OpenAI”,是中国最早开启大语言模型研发的公司,定位为国内AGI的引领者[7][17] - 公司最新旗舰模型GLM-4.7在权威评测Artificial Analysis Intelligence Index中以68分综合成绩位列开源模型与国产模型双料榜首[18] - 在Code Arena编码评估中,GLM-4.7位列开源第一、国产第一,超过GPT-5.2[19] - 公司已构建覆盖文本、图像、视频、语音的多模态模型矩阵,并更新了支持硬件设备接入的AutoGLM 2.0[20] 商业化与市场表现 - 智谱AI通过MaaS模式实现商业化,是国内少数通过此模式实现内部造血的初创公司[25] - 国内MaaS平台已汇聚超过270万企业与应用开发者,中国前十大互联网公司中已有9家接入其模型[26] - 全球范围内,GLM-4.5和GLM-4.6在OpenRouter上调用量长期位居全球前十,付费API收入超过所有国产模型之和,平台用户规模超过290万[26] - 公司GLM大模型已赋能全球12000家企业客户、超过8000万台终端用户设备及超过4500万名开发者[26] 财务业绩 - 公司营收连续三年翻倍增长,2022年至2024年收入分别为5740万元、1.245亿元和3.124亿元,年复合增长率达130%[27] - 2025年上半年收入进一步提升至1.91亿元,同比增长高达325%[27] - 毛利率表现亮眼,过去三年始终维持在50%以上,高于AI行业约40%的普遍水平,2022年至2024年毛利率分别为54.6%、64.6%和56.3%,2025年上半年为50%[31][32] 研发投入与资本背景 - 公司研发费用高昂且持续攀升,2022年至2024年及2025年上半年分别为8440万元、5.289亿元、21.954亿元和15.947亿元[35] - 最高峰时研发投入达到当期收入的八倍[36] - 公司拥有顶尖的清华技术班底,核心团队源自清华大学计算机系知识工程实验室,CEO张鹏、首席科学家唐杰等均为核心人物[41][46][53] - 成立以来已完成超过8轮融资,累计融资规模超过83亿元人民币,投资方包括美团、蚂蚁、阿里、腾讯、小米、红杉、高瓴等众多明星产业资本与一线机构[12][56] - IPO前最新投后估值已达243.8亿元人民币[57] 行业背景 - 根据弗若斯特沙利文数据,2024年中国大语言模型市场规模已达53亿元人民币,其中机构客户贡献约47亿元,占比近九成[59]
「AI 100」榜单启动招募,AI产品“年会”不能停丨量子位智库
量子位· 2025-12-30 11:57
2025年中国AI产品市场概览 - 2025年国内AI产品领域涌现多个关键趋势,包括深度思考、Agentic AI、多智能体协作、多模态生成和端侧AI [4] - 多个颠覆性产品引领各技术方向:DeepSeek以强推理和透明化思考引领智能助手迭代;Manus实现全链路自主任务处理,成为通用AI Agent;Lovart等通过多智能体协作简化工作流程;即梦AI等在多模态生成上取得进步;豆包AI手机将系统级AI智能体深度集成于操作系统,重构人机交互范式 [4] 量子位智库「AI 100」榜单介绍 - 榜单旨在全景式检阅中国AI产品发展,深度洞察未来产业格局,寻找代表中国AI实力的巅峰力量 [4] - 榜单共分为三大板块:代表最强综合实力的「旗舰AI 100」、最具未来潜力的「创新AI 100」和十大热门赛道的代表产品 [6] - 「旗舰AI 100」聚焦2025全年表现,评选综合能力最强、在技术突破和实际应用场景中展现巨大价值的100款AI产品 [7] - 「创新AI 100」旨在挖掘2025年崭露头角、具备2026年爆发潜力的创新产品,这些产品代表AI技术前沿方向,有望引领下一阶段行业变革 [8] - 榜单另设10大细分赛道TOP3专项提名,以精准反映各领域发展态势,赛道包括:AI浏览器、AI Agent、AI智能助手、AI工作台、AI创作、AI教育、AI医疗、AI娱乐、Vibe Coding和AI消费级硬件 [9] 榜单评估体系与内容 - 榜单采用定量与定性相结合的双重评估体系以确保客观性和准确性 [13] - 定量评估以真实用户数据为基础,涵盖用户规模、增长、活跃、粘性四大核心维度,包含下载总量、新增下载、活跃用户数、留存率等超过20个具体指标;硬件产品则考察出货量 [13] - 定性评估聚焦长期发展潜力,通过专家评估和用户调研,综合考量产品的底层技术、市场空间、功能设计、变现潜力、团队背景、增长速度等多重因素;硬件产品考察具体功能设计和实际使用体验 [13] - 除榜单外,周边内容还包括数据解读文章、分赛道产品解析、1v1 AI产品深度访谈等 [14] 相关资源与参与方式 - 量子位智库已对外公开自研梳理的国内AI产品知识库,提供对国内AI应用生态全景式、结构化、实时更新的梳理 [15] - 榜单申报时间为即日起至2026年1月15日,榜单将于2026年1月中下旬发布 [10]
千人千面的真人级AI名师,劈开教育「不可能三角」
量子位· 2025-12-30 11:57
公司核心产品与市场表现 - 公司“与爱为舞”开发了一款名为“爱学”的AI教育应用,其AI导师能够提供自然、互动性强的真人级讲课体验,并实现一对一个性化教学[1][2] - 该应用自年初上线以来,已累计服务百万级用户,学员分布在全国342个城市[3][101] 解决教育行业“不可能三角”的技术路径 - 公司通过“模型+语音+工程”三大核心技术组件,旨在破解教育行业规模、质量与成本难以兼得的“不可能三角”[4][5][6] 模型能力:从“知道”到“会教” - 通用大模型虽能解决复杂问题(如获奥赛金牌),但其设计初衷并非教育,往往直接给出答案和枯燥解析,缺乏教学引导[7][8][12][15] - 公司训练AI导师分为“知”与“行”两个层面:“知”包括掌握学科知识图谱、考点及名师授课方法论;“行”则通过海量真实数据与实践让AI学会应用[17][18][19] - 公司积累了约百万小时的音视频互动数据(含顶级名师授课视频),并通过构建“虚拟学员”与AI对练,每周生成数万小时的合成数据用于训练[21] - 训练过程结合专业教研:教师将教学经验具象化为思维链,形成“好老师红宝书”指导AI,后期该标注环节实现自动化[23][25] - 模型训练分两步:首先通过微调模仿教师思维链,固化基本教学方法以保障教学质量下限;随后通过强化学习(奖励函数围绕教学路径、有效性、灵活性设计),使AI能灵活调整教学策略[27][28][30][33][34][35] - 模型通过模拟课堂和直连真实教学一线进行测试与迭代,最终基于学员专属档案库实现千人千面的个性化课程定制[38][40][44][45] 语音交互:实现“真人级”互动体验 - 公司自研多模态语音理解大模型,结合教学上下文理解,解决真实课堂中噪音、方言及同音字(如“极限”与“极线”)的识别难题,将句准确率从行业约80%提升至95%以上[52][53][54] - 自研声纹降噪模型,能区分学员与家长的声音[54] - 语音合成采用LLM+Flow方案,结合强化学习优化语调节奏,并使用真实课堂数据建模不同教师的讲课风格,使发音更自然、情感表现更好[61][62][63][65] - 研发流式语义VAD和打断模型,使AI能实时识别学员打断意图,识别准确度达90%以上,支持双向实时交互[66] - 为AI导师配套设计了口型、表情与动作高度同步的逼真数字人形象,增强信任感与沉浸感[67][69] 系统工程:支撑大规模并发落地 - 通过优化服务链路,将AI思考与响应延迟压缩:简单问题走快速通道,复杂问题并行处理,使模型回复延迟控制在100ms以内,整条响应链路稳定在1–1.5秒;被打断时响应时间控制在100–200ms,整条链路不超过1.6秒[77][78][80] - 通过“提前缓存”优化性能:将Prompt结构化,减少模型重复阅读;缓存常见知识点的讲解结果,避免重复生成[86][89] - 通过链路优化与缓存组合,将整个交互流程控制在1秒至1.6秒之间[90] - 在单机层面优化显存规划与共享,并对GPU算子进行专项加速,使单卡有效吞吐能力提升约5倍,可支撑几十路真人级数字人推理[91] - 在集群层面从多数字人统一调度、系统抽象、并行计算、预留容量、保险机制五个维度加固系统,成为业界首个支持万人并发的真人级AI教学系统[92][94] 公司理念与行业愿景 - 公司不将AI视为简单工具,而是一场对个体工作逻辑与组织管理范式的深层重塑,提出“全员皆超级个体”理念,让个人能调度智能体军团实现创新[95][96][99] - 公司产品实践旨在通过AI技术,实现“有教无类、因材施教”的教育愿景[103]
量子位编辑作者招聘
量子位· 2025-12-30 11:57
公司概况与市场地位 - 公司是一家以追踪AI新进展为核心的内容平台,拥有8年行业积累[1] - 公司在微信公众号平台拥有超过240万订阅用户,全网用户超过700万,日均阅读量超过200万[12] - 公司在第三方数据平台(如新榜、清博)被认为是AI及前沿科技行业的TOP1新媒体[12] 招聘岗位总览 - 公司开放三大方向的岗位招聘:AI产业方向、AI财经商业方向、AI产品方向[2][6] - 招聘面向社招和校招,社招覆盖编辑、主笔、主编各个层级,校招面向应届毕业生并接受实习转正[4][6] - 所有岗位工作地点均为北京中关村[2] AI产业方向岗位详情 - 岗位职责是关注基建层创新,包括芯片、AI Infra、云计算等领域的新进展及核心玩家动态[5][6] - 需要跟进前沿论文、开源社区及技术大会(如Hot Chips、NeurIPS、MLSys)的报告,并进行大众化解读[6] - 需要参与核心采访,对话产业专家、技术大牛,并撰写AI云落地案例[7] - 任职要求包括对芯片、GPU、NPU、服务器、模型训练架构、云计算有基本理解,熟悉AI行业供应链与生态,并能将复杂技术内容结构化表达,有技术背景者优先[11] AI财经商业方向岗位详情 - 岗位职责是聚焦创投、AI创业公司、上市公司、商业模式及产业链资本动向[6][11] - 需要产出创投融资、招股书财报解析、公司战略分析等稿件,并进行访谈对话[11] - 任职要求包括对数据敏感,对财报、股权结构、战略规划感兴趣,逻辑结构强,对商业叙事敏感,并热爱对话采访[11] AI产品方向岗位详情 - 岗位职责是关注AI在终端的落地,包括软件应用产品和硬件方向[6][11] - 需要撰写AI应用产品深度评测,跟踪多终端新品发布(如手机、PC、XR、车机等),并对话访谈相关专家[11] - 任职要求包括对智能硬件、AI终端趋势敏锐,是重度AI产品体验人士,熟悉各大终端厂商业态和体验方法论,并有强逻辑和结构化表达能力[11] 岗位通用职责与层级要求 - 主编岗位需要具备选题和带队能力及经验[6] - 主笔岗位需要具备原创深度稿件能力[6] - 编辑岗位需要热爱表达,喜欢挖掘信息,能够用通俗语言让所有人看懂AI新进展[6] 加入公司的潜在收获 - 可以第一时间接触和了解AI领域最新技术和产品,构建完整的AI认知体系[6] - 可以将各种AI新技术、新工具应用于工作,提升效率和创造力[6] - 可以通过撰写独家原创内容建立个人知名度,成为AI领域的意见领袖[6] - 可以与AI领域大咖零距离接触,参与重要科技活动和发布会,拓展行业人脉[6] - 应届新人会获得主编级编辑的一对一指导[6] - 可以加入扁平、简单、开放、多劳多得的活力团队[6] - 可以获得行业TOP薪资待遇及五险一金、餐补、项目绩效、商务绩效、加班补助等福利[6] 应聘方式 - 应聘者需将个人简历发送至指定邮箱,邮件主题需注明应聘方向及姓名[11] - 需随简历附上科技行业代表作品或能展现个人写作水平和风格的作品[11]
对科技圈,小红书是个「新绿洲」
量子位· 2025-12-30 11:57
小红书平台科技内容生态的转变 - 文章核心观点:小红书正从一个以“吃喝玩乐”为主的社区,转变为一个充满“人间视角”和“活人感”的科技内容“新绿洲”与“科技街区”,其去中心化的内容生态和真实具体的用户互动,正在深刻改变科技内容的消费模式与AI时代的产品创造逻辑 [6][7][19][20] 科技内容消费模式的变迁 - 传统科技资讯如同标准化的“工业快餐”或“快餐店”,高效但易引发信息过载的焦虑感 [9] - 小红书上的科技内容生态则类似喧闹鲜活的“人间夜市”,流量与内容逻辑均已改变 [9] - 博主和开发者扮演“去中心化的编辑+跨世界观的翻译”角色,通过选择和表达“降维”晦涩技术概念,将其变为直观体验 [10] - 例如,有博主将AI的Context与Agent概念,通过用户评论提炼为生动的“来龙去脉”问题,使概念鲜活通透 [11] - 大模型生成能力在小红书演变为“小猫文学”、调教“完美男友”等生活化应用,提升了观察世界的“分辨率” [11][12] 社区“活人感”与具体意义 - 小红书具有强烈的“活人感”,源自真实用户生成内容构成的生态 [15][18] - 例如,极客公园创新大会后,平台出现上百篇参会者“原生”、未修饰的分享笔记,让大会成果的意义变得“真实而具体” [13][15] - 平台AMA活动让科技大咖与创业者直接回答用户提问,创造了平等对话的新沟通方式 [15] - 大量提问聚焦创业起步期的具体困惑,使得经验传递的过程和帮助他人的意义变得无比“具体” [18] 作为“科技街区”的产品创造新逻辑 - 传统流量平台像“公共广场”,需要声量和宏大叙事;小红书则像充满“左邻右舍”的“街区”,讨论焦点是“这东西好不好用”、“能否解决具体问题” [21][26] - 平台在AI浪潮初期,选择放大“普通人与AI的真实交互”,而非追逐快速迭代的技术参数,从而聚集了最真实具体的“人味儿”和需求 [22][23][25] - 这种“街区”属性催生了“Build in Public”的创业方式,营销极度前置,开发者仅凭一个想法就发笔记“口嗨”,进行低成本验证 [26][27] - 独立开发者苏晓江在开发Plan Coach前,先将“站起来去洗碗”的痛点发笔记,一天内获得3000多个点赞,验证了需求并获得了第一批种子用户 [29] - 产品反馈及时且颗粒度细,例如Macaron AI团队纠结产品配色,发到小红书后用户因粉红色觉得“真香”;苏晓江收到1000多条用户反馈,用户成为“精神股东” [30] - 开发者与用户之间形成“养成系”共生关系,用户忠诚度远高于靠买量获得的用户 [34] AI时代赋能“超级个体”与商业逻辑变革 - AI能力降低了开发门槛和生产成本,提升了商业世界的“分辨率”,使服务微小、垂直需求变得可行 [35] - 例如,Macaron AI上有20万个千奇百怪的小应用,包括专门记录“拉屎”的应用,证明了世界的丰富性 [36] - 在“街区”里,即使只服务1万人的垂直需求,只要做得好也能找到这1万个“邻居”,实现商业逻辑自洽 [36] - 流量日益昂贵且属于平台,但“共鸣”是免费的,可由开发者用自己的世界观、审美和能力换来 [36] - 许多年轻创业者在小红书完成从0到1再到100的蜕变,如Flowith等案例越来越多 [37] - 创业动机从追逐“百亿赛道”回归创造本质,始于解决“具体而有意义”的问题或表达一种审美 [38]