Workflow
Z Potentials
icon
搜索文档
喝点VC|a16z的未来展望:现在AI不是泡沫,因为它还没破裂;只有当投入打水漂,才能确认它曾经是泡沫
Z Potentials· 2025-12-18 11:30
AI泡沫争议与盈利能力 - 当前AI企业实际利润情况非常好,若停止开发新模型仅运营现有模型,按当前利润率可很快实现盈利,因此现阶段不像是泡沫 [6] - 企业持续投入资金是为了构建更庞大的模型以追求更高利润,而非因为无法盈利,且很快能收回过去的开发成本 [6] - 用户愿意为AI服务付费,表明其获得了价值,这是一个可靠的信号,进一步反驳了泡沫论 [7] 技术演进与模型能力边界 - 预训练技术焦点有所转移,后训练(如推理优化)成为新方向,但预训练仍有扩展空间,存在大量未被利用的数据 [9] - 纯软件奇点(AI自动化AI研究)目前难以实现,因为大规模实验是研发的必要条件,而当前大量资金同时投向了研究人员和实验算力 [9][11] - 模型能力尚未出现增长放缓的迹象,对“灾难性遗忘”等问题的担忧尚未在实际数据中体现 [12] AI对编码领域的影响 - 有观点预测AI将编写90%的代码,但实际影响复杂,AI可能加速了开发,也可能创造了人类原本不会去写的新代码 [15][16] - 衡量AI对编码效率的提升存在困难,Uplift论文指出参与者主观感觉提速,但难以准确量化 [16] - 最可靠的指标可能是AI公司从程序员用户和订阅服务中获得的收入,这反映了工具被实际使用 [16] AI对劳动力市场的潜在影响 - 在高端市场,AI很可能自动化几乎所有现有工作,但同时会创造新的工作岗位 [17] - 未来十年内,现有工作中被AI替代的比例可能不低于10%,这是一个合理的下限 [19] - 存在一种可能性,即AI的某项新应用可能在短期内(如六个月)导致失业率上升5%,这将引发巨大关注和政策反应 [18][45] 专业选择与技能发展 - 不建议主修“提示工程”等短期热门专业,因为AI工具正变得易用,此类专门技能必要性下降 [22] - 学习计算机科学或数学等专业仍有价值,但应注重培养通用技能,如合作与沟通能力,而非仅成为特定技术的技术人员 [22] - 大学阶段的选择应基于个人兴趣和对世界的价值,而非盲目追逐难以预测的未来潮流 [22] 经济影响与增长预测 - 基于当前趋势(如英伟达收入增长),到2030年AI可能推动GDP增长几个百分点,这按经济标准已属惊人 [26] - 若未来十年内获得能像人类一样完成任何远程工作的AI(AGI),30%的GDP增长是一个合理的下限预测 [27] - 拥有可胜任人类所有工作的虚拟劳动力的世界,很可能导致经济出现极端结果,要么疯狂增长,要么彻底崩溃 [28] 基准测试与模型衡量 - 现有的主流基准测试(如MMLU、GPQA)很快会被AI攻克 [29] - 未来需要开发更困难、更贴近现实场景的基准测试,这平均需要投入更多资源 [30] - 除了系统化的基准测试,一些令人印象深刻的独立案例(如AI成功重构整个代码库)也将成为衡量进展的有力证据 [30] 未来技术里程碑预测 - AI在未来五年内独立解决像黎曼猜想这样的重大未解数学问题,不会令人惊讶,数学领域并非AI的短板 [33] - 在生物学或医学领域取得无需人类深度参与的独立突破,比数学突破要困难得多,因其需要与现实世界互动并进行实验 [35] - 对于“能完成任何远程工作任务”的AI,预测中位数时间线大约在2035年左右;而超级智能的出现时间难以准确预测,但可能在之后不久 [37] 机器人技术与硬件挑战 - 机器人技术的训练算力规模比前沿AI模型小100倍,仍有很大提升空间 [39] - 机器人技术的主要瓶颈在于硬件和经济问题,例如制造成本过高可能使其在低劳动力成本地区缺乏竞争力 [39] - 物理操作(机器人技术)的进展滞后于虚拟任务,可能因为其本身更难,也可能因为优先级较低 [40] 数据中心扩展与能源瓶颈 - AI数据中心的建设速度已经非常快,例如Anthropic与亚马逊合作的“雷尼尔计划”数据中心,其耗电量几乎与一个州首府相当 [41] - 扩展集群规模的主要限制并非技术或能源,而是资金和意愿,只要有资金,行业就在尽可能快地扩展 [42] - 能源不会成为长期瓶颈,虽然获取廉价电力的传统流程变慢,但存在成本更高的应急解决方案(如太阳能加电池),其成本远低于GPU [43] 政策回应与公众关注 - 若AI导致失业率在短期内显著上升(如6个月内升5%),公众将产生强烈反应,政策回应会来得非常快 [45] - 政府对AI的关注度可能遵循与行业收入类似的增长趋势(每年翻倍或三倍增长),未来关注度将急剧上升 [46] - 政策回应的具体形式高度不确定,可能是国有化、暂停发展、加速推进或完善社会保障等 [45]
速递|Manus宣布ARR达1.25亿美元,月增速超20%
Z Potentials· 2025-12-18 11:30
Manus公司业绩与产品发布 - 总部位于新加坡的人工智能公司Manus,在放行其AI Agent产品八个月后,年化运营收入已超过1.25亿美元 [2] - 自Manus 1.5放行以来,公司保持着超过20%的月环比增长,并持续加速产品和功能发布 [3] - 公司的年化运营收入指标包含基于使用量的收入和其他销售额 [4] AI Agent产品与市场定位 - Manus在今年3月发布AI Agent,该产品能根据基本指令筛选简历、制定旅行行程并分析股票 [3] - 公司声称其服务在某些方面的表现优于OpenAI的Deep Research,被视为OpenAI的挑战者 [3] 行业同类公司表现 - AI代码助手Cursor背后的公司Anysphere,在今年1月实现了1亿美元的年经常性收入 [5] - 瑞典AI编程初创公司Lovable在7月宣布其年度化销售额突破1亿美元 [6]
速递|AI视听协同新战场:Index与a16z重注初创公司,Mirelo获4100万美元融资
Z Potentials· 2025-12-17 20:00
公司概况与融资 - 公司Mirelo是一家总部位于柏林的初创公司,专注于开发通过AI解读视频内容并添加同步音效的技术[2][3] - 公司已完成由Index Ventures和Andreessen Horowitz领投的4100万美元种子轮融资,早期投资者Atlantic Labs继续跟投,至此融资总额达4400万美元[3][7] - 公司获得了包括Mistral首席执行官Arthur Mensch、Hugging Face首席科学官Thomas Wolf在内的多位天使投资人的支持[7] 产品与技术 - 公司发布了Mirelo SFX v1.5模型,该模型能通过AI解读视频内容并添加同步音效[3] - 公司产品采用免费增值模式,包含每月20欧元(约合23.50美元)的创作者订阅方案,主要面向希望为AI生成视频添加音效的业余爱好者和专业消费者[5] - 公司模型基于公开及采购的音效库构建,并正在签署尊重艺术家权利的收入分成合作协议[4] - 公司观察到市场对音效的AI生成需求比音乐生成更为迫切,部分原因在于该领域的AI研究相对稀缺[6] 市场定位与竞争 - 公司旨在解决AI生成视频普遍缺乏音频支持的问题,认为声音占观影体验的50%以上,对视频氛围塑造至关重要[5][8] - 公司通过更专注的产品定位形成差异化优势,但面临来自索尼、腾讯、快手旗下Kling AI以及ElevenLabs等大型公司和竞争对手的同类产品竞争[3] - 公司认为在音效领域构建技术护城河相对更容易,并可能将其转化为商业优势[6][7] 商业模式与收入 - 公司预计短期内API使用将驱动其大部分收入,其模型已在Fal.ai和Replicate平台上发布[4] - 公司同时正在投入构建面向创作者的Mirelo Studio工作空间,该平台未来有望支持完整的专业级应用[4] 团队与发展计划 - 公司目前团队规模为10人,计划在明年年底前将团队规模“至少翻倍,甚至可能增长至三倍”[3] - 新招聘的员工将支持公司的研发、产品以及市场进入策略[4] - 公司的联合创始人兼具AI研究员与音乐人的双重身份,并将AI音乐生成列为长期发展目标[6]
深度| 大模型年终观察,如何定义2025年的"好模型"?
Z Potentials· 2025-12-17 20:00
文章核心观点 - 2025年AI行业正经历从追求“跑分”到建立“信任”的深刻范式转变,行业共识是开源模型正从“可选项”成为“默认使用的必选项”[1] - 衡量模型的标准正从“选秀式逐冠军”转向“基建式找伙伴”,模型的基础能力是入场券,而由评测、部署、交付三个维度构成的“信任”是AI融入业务流程的通行证[2][3] - 行业已出现从“技术玩具”到“生产工具”的拐点,驱动力量从“新奇”变为“信任”,未来竞争核心将是业务可靠性、卓越运营、可控性、安全性与可观测性[12][31] 行业趋势:从尝鲜到留存,生产力拐点已现 - 开源模型调用量在关键发布后,首次实现了“峰值后高位平稳”,而非断崖式下跌,标志着真实使用和留存的开始[5][15] - 开源权重模型的token份额在2025年底稳定突破了平台总量的三分之一[5] - 用于复杂推理、规划和代理任务的“推理类模型”调用量爆炸式增长,其token消耗份额从2024年底几乎可忽略不计飙升至超过50%[8] - API调用的平均任务长度显著上升,从2023年后期不足2000 tokens增长到2025年后期超过5400 tokens,表明真实世界的复杂任务正稳定交给AI完成[8][9][12] 评测体系:从分数游戏到多维共识 - 模型发布初期,赢得关键榜单头筹仍是获取关注的“入场券”[13] - Kimi K2 Thinking是2025年典型代表,在Artificial Analysis的Intelligence Index上获得开源模型最高分,并在LMSYS Chatbot Arena开源模型中排名第一,从而获得全球关注[14][18] - 行业正形成多维评测体系,主要包括两类: - **数据驱动型**:以Artificial Analysis为代表,采用“智能指数+成本指数”双轴框架评估“性价比”,涵盖智能度、成本、可控性、生态适配度[20] - **使用实证型**:以OpenRouter为代表,基于其积累的100T tokens真实调用数据,评测模型在生产中的成功率、序列长度、调用失败率等,峰值后的高位调用量是产品力最直接证明[22] - 资深从业者的实际选择成为新维度,如前OpenAI CTO创办的公司在其产品中集成Kimi K2 Thinking以支持复杂推理[18] 部署能力:产业化与成本透明化 - 可部署性是建立信任的第二地基,企业关注“跑得起、跑得稳、跑得久”[24] - 硬件支持取得突破,NVIDIA数据显示Kimi K2 Thinking、Qwen2等MoE模型在GB200 NVL72架构上实现了10倍推理加速,同时每token成本降低90%,证明其大规模产业化部署潜力[24] - 云端推理平台推动部署成本透明化,如Fireworks、Together、OpenRouter公开每百万tokens的精确报价,使模型调用像云计算资源一样“明码标价”[24] 交付保障:治理、观测与复现 - 交付是确保模型在企业环境中“跑得稳”的最后一公里,关乎可治理、可观测、可复现[25] - **可治理**:2025年Q4,AWS、Azure、Google Cloud三大云厂商几乎同时将Claude、Kimi、Mistral等顶级模型纳入其企业级托管服务,使模型可通过统一API调用并享受平台的安全、权限管理和SLA保证,正式进入企业IT治理框架[26] - **可观测**:行业在工具调用可观测性上取得进展,OpenRouter推出的exacto系统能量化和监控模型在工具调用任务上的表现方差,通过遥测数据确保稳定性和一致性[27] - **可复现**:行业迈出关键一步,例如Hugging Face展示的Kimi K2 Thinking应用示例清晰记录了模型执行多步工具链的全过程trace,使模型能力进入“流程可复现、任务可交付”阶段[30] 未来展望:业务可靠性与卓越运营 - 2026年的关键词是“卓越运营”,未来焦点将是任务完成率、生产稳定性以及与真实工作负载的对齐[31] - 未来竞争的核心不再是智能度,而是可控性、安全性与可观测性[31] - 赢得信任的模型才可能成为真正的生产力,信任的建立是工程化的结果[32]
速递|OpenAI的“算力的外交官”:聘请英国前财相奥斯本,深度绑定全球AI布局
Z Potentials· 2025-12-17 20:00
OpenAI的战略扩张与政府合作计划 - OpenAI聘请英国前财政大臣乔治·奥斯本,负责领导一项名为“OpenAI for Countries”的新计划,旨在与各国政府合作建设人工智能基础设施 [1][2] - 该计划旨在帮助各国政府理解人工智能如何融入其经济战略及公共服务领域,如医疗和教育,并共同出资开展初期10个国际项目 [3] - 奥斯本将常驻伦敦,其聘用是公司今年早些时候宣布的、旨在与国家政府在人工智能基础设施和本地化产品版本方面建立合作伙伴关系计划的一部分 [3] “OpenAI for Countries”计划的具体内容 - 该计划于5月推出,目标是帮助各国政府扩大数据中心容量,并根据本地语言和需求定制人工智能工具 [3] - 计划建立在公司的“星际之门”项目基础上,该项目旨在向美国的人工智能基础设施投资5000亿美元 [3] - 公司认为,此类大规模的人工智能基础设施建设对未来的经济增长和国家发展至关重要 [3] 行业背景与公司动机 - 随着各国竞相获取运行先进人工智能系统所需的数据中心和计算能力,公司选择了一位备受瞩目的政治人物来推动其政府合作事务 [1] - 奥斯本将这项计划描述为旨在帮助社会共享人工智能带来的益处,其决定加入是在与公司首席执行官萨姆·奥尔特曼及其他高管交流后做出的 [3]
独家|玄华智能完成数千万元天使轮融资,百度“三驾马车”创始人打造交互式AI知识伙伴
Z Potentials· 2025-12-16 09:32
公司融资与资金用途 - 玄华智能完成数千万元人民币天使轮融资,由云时资本独家投资,逐浪资本担任长期独家财务顾问 [1] - 融资将用于加速多模态交互式知识智能体平台的研发与迭代,深化AI-Native核心能力 [2] - 融资将用于深化教育与企业服务市场渗透,拓展与头部标杆客户合作 [3] - 融资将用于加速全球化业务布局,重点推进东南亚市场的AI Tutor产品 [4] 核心团队背景 - 公司创始人兼CEO柴桥子曾任百度贴吧总经理,是百度文库、百度知道、百度百科的核心创始人 [5] - 创始人还曾担任百度糯米CTO、一点资讯CTO,拥有超大规模系统架构、AI推荐算法和商业化操盘经验 [5] - 公司COO杨屾曾是好未来、作业帮核心运营负责人,带领团队实现年营收50亿,深谙教育行业运营 [5] - 公司CTO杨彦召曾任腾讯、百度主任架构师,主导过现象级社交应用研发,在超写实数字人、深度合成技术领域有完整经验 [5] 产品与技术创新 - 公司核心产品是全球首个多模态交互式知识智能体平台,定位为“交互式知识伙伴”而非简单工具 [6] - 平台以AI-Native为核心,能将零散素材全自动解析、提炼、重组,智能生成包含AI数字分身讲师、动态板书、互动问答、智能测评的多模态交互式课程 [6] - 产品革新显著提升学习效果:传统MOOC课程平均完课率不足15%,而使用该平台生成的AI互动课程完课率跃升至80%以上,学习效率提升超5倍 [6] 商业化进展与市场验证 - 公司成立仅一年多,便已实现千万元营收并进入盈利状态 [7] - 解决方案已形成“高校+企业”双轮驱动格局,获得跨领域头部客户认可 [8] - 在高等教育领域,已与北京交通大学、东北大学、中央财经大学等数十所985/211及高职院校合作 [8] - 在企业服务领域,已服务联想、可口可乐、国家电网等世界500强企业 [9] - 在职业教育领域,与华图、北大培文等头部机构合作 [12] - 商业模式已验证从数万元课程项目到数百万元私有化部署的灵活性 [13] 全球化战略与布局 - 全球化是公司核心战略之一,已在马来西亚、印度尼西亚、新加坡等东南亚国家成功落地 [14] - 海外业务已贡献超过25%的收入 [14] - 针对马来西亚K12学生推出的“AI Tutor”一对一在线辅导课程,以每月199马币订阅价获得市场积极反响 [14] - 未来致力于打造AI时代的全球“Knowledge Hub”,推动知识平权与高效流动 [16] 投资方观点 - 云时资本认为,玄华智能的产品大幅重塑了学习体验,是真正意义上的AI-Native,实现了端到端内容创作 [18] - 投资方认可团队在知识内容认知、Agent产品打造、全球化渠道建设及新形态学习体验上的深刻见解 [18] - 期待公司依靠产品能力和行业洞察,在全球范围内实现知识传播平权 [18]
深度|谷歌前CEO谈旧金山共识:当技术融合到一定阶段会出现递归自我改进,AI自主学习创造时代即将到来
Z Potentials· 2025-12-16 09:32
文章核心观点 - 人工智能是一场堪比科学革命的划时代变革,人类首次面临非人类、智能水平相当或更高的竞争者,其影响深远且人类反应不可预测 [4][12] - 人工智能技术的发展正经历从语言革命到智能体革命,再到推理革命的演进,其规模法则尚未放缓,投入更多数据、电力和芯片将持续催生新能力 [13] - 人工智能的发展机遇与风险并存,机遇在于广泛的企业自动化与各领域潜力释放,风险则涉及人类主体性、儿童发展、网络攻击及地缘政治竞争等多方面挑战 [12][15][19][27] - 美中两国在人工智能领域的发展路径、优势与战略存在显著差异,竞争格局复杂,并可能塑造全球技术生态的未来 [17][23][24] 人工智能技术演进与现状 - 技术发展正经历三个阶段:已发生的语言革命(如ChatGPT)、正在发生的智能体革命(可实现任务自动化串联)、以及刚刚开始的推理革命 [13] - 人工智能的规模法则尚未放缓,投入更多数据、电力与芯片能不断催生新的涌现能力,模型竞争激烈,例如Gemini 3超越了OpenAI 5,后者此前超越了Claude 4.5 [13] - 行业普遍认为“递归自我改进”(即AI能自主学习)即将到来,预测时间从两年到四年不等,AI自主编写程序、提出数学猜想、发现新事实的能力已近在咫尺 [14] - AI生成代码的能力具备革命性意义,相当于每个人的口袋里都有一台超级计算机与一位顶尖程序员 [4][20] 人工智能的深远影响与核心挑战 - 人工智能对“人之为人”的本质提出了根本性质疑,涉及成为孩子、成年人、领导者的意义,以及对经济和就业的影响 [12] - 人工智能正在对人类发展进行大规模实验,极具成瘾性的AI系统通过平板、手机等设备接触易受操控的青少年,其长期社会影响未知 [15] - 网络攻击风险因AI生成代码能力而大幅增加,攻击者可利用AI持续尝试突破系统漏洞,防御可能需要依靠“良性AI对抗恶性AI” [21][27] - 在民主社会,算法放大言论可能传播虚假信息,破坏公众对真相的信任,构成对民主制度的挑战 [29] 美中人工智能竞争格局 - 发展路径分化:美国(以旧金山共识为代表)聚焦于推进技术前沿和超级智能研发;中国则全力推动AI在商业领域的应用,追求“AI嵌入万物” [17][23] - 优势对比:美国拥有芯片优势;中国凭借对可再生能源的巨额投资拥有电力优势(过去五年新增约120吉瓦装机容量,相当于每天1吉瓦),并在应用落地与供应链方面占优 [17][23] - 生态模式差异:美国主流企业因经济考量(如筹集高达100亿至200亿美元研发资金)逐渐走向封闭模式;中国则完全偏向开源(开放权重与源代码),可能使全球多数国家采用中国开源模型 [24][28] - 竞争态势:2024年1月两国AI性能差距显著,但业内认为差距不会持续太久,推理革命可能再次拉大差距,同时中国在产品落地速度和细节上可能提供更优体验 [21][23] 行业展望与关键问题 - 当前人工智能热潮并非泡沫,甚至可能被低估,核心驱动力是企业自动化,在医疗、气候变化、基础科学等领域潜力巨大 [19] - 人类的长远角色面临挑战,多数功能可能被计算机替代,关键在于AI发展能否与人类需求、自由兼容,例如自动驾驶系统是否需要设置“例外按钮”以应对紧急情况 [31] - 意识是否是AI可能触及或拥有的维度,仍是一个开放且值得深入研究的问题,核心在于理解意识的产生与验证方法 [35] - 建立类似国际原子能机构(IAEA)或欧洲核子研究组织(CERN)的AI国际监管机构是一种设想,但可能需在发生重大危机后才会推动各国达成共识 [36][37] 其他区域与跨领域影响 - 欧洲(如法国Mistral)拥有顶尖企业与人才,但难以筹集到与美国竞争对手相当的资金,组织协调能力是挑战 [26][30] - 印度拥有大量顶尖人才(如印度理工学院),但计算资源严重不足(10亿人口仅约1000块GPU),是美印合作的潜在领域与障碍 [26][32] - 人工智能可能改变冲突形态,当恐怖分子与政府都能获取AI工具时,战争与袭击的形式将演变,算法战争时代刚刚开启 [26] - 自动化可能导致低端岗位流失,这是一个社会问题,但技术进步与市场竞争将推动应用落地,政府过度干预效果通常不佳 [33]
速递|AI内容生成平台Runware完成5000万美元A轮融资,40万开源模型实时推理
Z Potentials· 2025-12-15 10:08
公司概况与创立背景 - 公司Runware由Flaviu Radulescu于2023年创立,创立初衷是解决生成式AI生成图像速度慢的问题[2] - 随后与Ioana Hreninciuc合作,推出了专注于实时生成图像、视频和音频的开发工具平台[3] 业务模式与产品 - 产品允许开发者将Runware的API集成到其应用中,通过统一界面生成媒体资产,无需设置新基础设施或维护单独集成[5] - 平台提供针对开源模型的定制AI推理基础设施,特点是“零日访问”和有竞争力的定价[5] - 公司通过其Sonic Inference Engine实现成本效益,该引擎运行在定制AI硬件上,并与第三方AI云提供商合作以自动重新路由高内存需求的工作负载[5] - 在软件层面,公司优化了模型加载和卸载,支持超过40万个模型,并能实现其中任何一个模型的实时推理[6] - 与竞争对手基于GPU计算时间销售的模式不同,Runware倾向于Stable Diffusion和Flux的模式,提供按生成图像成本计费的方式,允许用户按需付费[7] 市场表现与增长 - 自推出以来,公司已为超过20万名开发者提供了超过100亿次创作[4] - 公司近期完成了5000万美元的A轮融资,由Dawn Capital领投,Insight Partners和a16z Speedrun参投,累计融资额达到6600万美元[5] - 公司计划将新资金用于扩展基础设施,目标是使用Sonic Inference Engine为超过200万个模型提供支持[7] - 公司正在快速扩展到新的模态,并计划扩充目前约25人的团队以实现目标[8] 行业竞争格局 - 专注于图像和视频开发工具的初创公司成为风投关注的热门市场,例如竞争对手Fal.ai近期以45亿美元估值融资1.4亿美元[6] - 公司的主要竞争对手是Fal.ai和Replicate[7] 公司愿景与目标 - 公司的最大目标是成为“所有AI的API”,让任何生成式AI模型都能在该平台上运行[7] - 总体目标是使应用程序能够扩展到数百万用户,同时保持其利润率,这有助于使市场更加实惠,让从应用构建者到最终用户的每个人受益,并将强大的AI带给全球更多人[8]
深度|AI编码黑马Sourcegraph华裔联创:我们的理念不是以模型为核心,而是以Agent为核心
Z Potentials· 2025-12-15 10:08
公司发展历程与产品演进 - 公司最初定位为解决大型组织内部编程效率问题,核心是帮助工程师理解代码,因为理解代码占用了80%到99%的时间,而写代码只是最后一步 [6] - 公司早期产品是全球首个可用于生产环境的代码搜索引擎,并成功推广至相当数量的《财富》500强企业 [5] - 随着大语言模型成熟,公司利用其增强搜索引擎的排序信号,并在ChatGPT等应用爆发后,结合自身能力推出了名为Amp的编程智能体产品 [8] - Amp产品于今年二三月启动,历时约七八个月,是从第一性原理出发从零构建的智能体,旨在重新定义所需工具,在大型代码库和业余编程中均表现出色 [10] 产品定位与商业模式 - Amp提供两种顶层智能体:按用量计费的Smart Agent(保持最前沿智能水准)和广告支持、可免费使用的Fast Agent [25] - 商业模式转向广告驱动的实验性决定,源于发现小规模、快速模型的推理成本极低,适合业余项目用户,此模式推出后成长速度非常迅猛 [14] - 产品策略是提供最强大的智能,用户仅为推理成本买单,但随着功能扩展,发现在智能与延迟的权衡曲线上存在多个有价值的平衡点 [13] - 并非最强大的模型一定带来最佳体验,更聪明的模型往往更慢,因此有机会打造更快的顶级智能体来处理针对性的编辑任务 [14] 智能体(Agent)的核心理念与架构 - 真正的“原子级可组合单元”不是模型,而是智能体本身,即用户输入文本、系统输出一系列行为的契约 [7][19] - 公司的理念是智能体中心化而非模型中心化,模型只是实现细节,智能体的行为由系统提示词、工具集、运行环境、反馈机制等多因素共同塑造 [18] - 在智能体架构下,软件开发流程可被拆分为上下文获取、调试等专门任务,为每个任务配置专属智能体,并为其选择参数尽可能小且符合质量标准的模型 [32] - 智能体就像函数在AI语境下的升级版本,虽然每次执行路径可能略有差异,但设计得当的智能体对于完成具体任务已足够可靠 [20][21] 模型选择与开源生态 - 公司同时大量使用开源和闭源模型,并且开源模型正变得越来越关键 [27] - 开源或开放权重模型的核心优势在于可以进行后训练,对于领域专用任务(如上下文检索),可以围绕目标进行优化,且价格优势显著 [7][27] - 在智能体工作负载上表现最出色的模型几乎全部源自中国,美国公司在工具使用的稳健性上尚未到位 [41] - 公司不会从零开始预训练模型,认为那样不经济,普遍做法是在后台使用多模型路由,根据任务切换到更小的专用模型 [31][32] - 驱动顶层智能体仍需数百亿乃至数千亿参数的模型,但用于编辑建议等场景的模型仅需“个位数十亿参数”即可 [30] 行业评估与未来展望 - 评估集作为单元测试或冒烟测试工具非常有效,但问题在于将其作为优化目标,因为评估集必然滞后于技术前沿,将优质产品体验提炼成评估集需要时间 [7][22][23] - 未来十年的开发环境既不会像现有IDE,也不会像今天的终端,核心界面将是能让人类编排多位智能体协作并理解其输出要点的面板 [35] - 目前超过90%的代码行数借助Amp生成,且比例仍在上升,开发者角色正转变为协调者和代码评审者,约90%的时间在做代码评审 [35][37] - 软件工程始终是创造性工作,人类仍是瓶颈,但让编程重新变得“好玩”是待解决的关键痛点之一 [36][38] 地缘格局与监管影响 - 全球开发者若大量依赖中国开源模型进行微调和部署,对美国及整体生态是潜在风险,美国需要确保其AI生态保持活力与竞争力 [40][49] - 当前美国监管格局趋向各州各管一套的“拼布式”法规,增加了复杂度和合规风险,不利于行业发展,反而巩固了原有巨头的地位 [47][49] - 政策建议是制定一套全国统一、清晰且完善的监管标准,聚焦具体应用场景而非模型层面的“生存风险”,同时确保模型层面的充分竞争,防止垄断 [7][49] - 围绕AGI的“终结者”式叙事影响了美国政策制定,降低了对风险的容忍度、生态创新的开放度以及对模型权重开源的接受度 [45]
速递|“医学版ChatGPT”OpenEvidence两月估值翻倍至120亿美元,年化广告收入近1.5亿美元
Z Potentials· 2025-12-15 10:08
公司融资与估值 - 公司正在进行2.5亿美元的股权融资,融资完成后投后估值将达到120亿美元,较两个月前的上一轮私募估值翻了一番[3] - 若交易完成,公司将成为八家估值超过100亿美元且年化收入超过1亿美元的AI应用开发商之一[3] - 公司此前已从包括GV、红杉资本和Kleiner Perkins在内的投资者那里筹集了超过5亿美元的资金[6] 商业模式与财务表现 - 公司通过向制药公司出售其聊天机器人上的广告位来赚钱,类似于谷歌的搜索引擎广告模式[3] - 公司目前的年化广告收入约为1.5亿美元,即每月产生超过1200万美元的收入,这比8月份的广告收入增长了3倍[3] - 公司目前只售出了十分之一的广告库存,若售出其余部分,可能产生超过10亿美元的年化收入[4] - 公司目前的毛利率高于90%,超过了许多其他AI初创公司[4] 产品与市场 - 公司运营一款类似ChatGPT的产品,帮助医生从医学期刊等可信来源查找健康信息[3] - 产品针对医生而非消费者,医生使用其聊天机器人回答医学问题或分析同行评审的研究[4] - 产品使用从医学期刊获得许可的信息开发,例如《新英格兰医学杂志》,公司称其聊天机器人比ChatGPT等通用聊天机器人更准确[4] - 产品使用开源AI模型搜索医学期刊并返回信息和引用,同时也使用来自谷歌、OpenAI等提供商的AI来总结聊天机器人的回应[5] - 公司可以利用用户反馈改进搜索结果排名,并可联系作为专家的用户帮助训练AI更准确地回答细分问题[5] 市场接受度与使用情况 - 根据10月对1000名美国医生的调查,约45%的医生使用该公司的产品,而使用ChatGPT的占16%,使用医疗记录初创公司Abridge的占5%[5] - 公司的聊天机器人每月回答来自美国医生的约2000万个问题[6] - 随着消费者越来越多地使用聊天机器人查找医疗信息,推动了聊天机器人制造商将资源投入到医疗保健相关功能上[4] 行业动态与竞争 - OpenAI在8月聘请了Facebook长期高管Ashley Alexander来开发与健康相关的产品[4] - 目前尚不清楚OpenAI是否也与医学期刊达成了类似的许可协议[4]