Workflow
AI编程
icon
搜索文档
从无人问津到巨头混战,AI为什么最先点燃了编程?
36氪· 2025-10-11 07:40
AI编程市场潜力与规模 - 全球约3000万名软件开发者,年创造经济价值约3万亿美元,相当于法国GDP [2] - 基础AI编码助手可提升开发效率20%,理想部署下效率可翻倍 [2] - AI编程有望为全球经济带来额外3万亿美元产值 [2] - AI编程赛道已孕育估值数十亿美元初创公司,并有望出现万亿美元级科技巨头 [2] - Cursor在15个月内实现年收入5亿美元,估值接近100亿美元 [2] - Google以24亿美元收购Windsurf [2] 软件开发范式变革 - 开发模式从"点菜式"编码转变为"计划→代码→审查"的全流程AI参与 [4] - AI在规划阶段主动起草功能描述并请求关键信息(如API密钥、系统依赖) [4] - AI在编码阶段自动生成代码并完成单元测试,形成"代理循环" [5] - 人类开发者角色转变为检查AI工作并进行微调 [6] - AI生成长达数页的结构化规范文档,作为项目"长期记忆"维持大型项目秩序 [8] - 规范文档可随代码更新而同步修改,实现人机协作良性循环 [8] AI编码工具与协作方式 - AI编码系统配备公司级或项目级架构与编码规范,约束代码风格与技术细节 [10] - 出现专门为AI模型设计的"最佳实践合集"(如Cursor规则集、GitHub prompt模板) [11] - AI从执行工具升级为具备上下文理解力的协作伙伴,参与架构设计与风险预判 [12] - 项目规划环节引入AI工具自动提取客户反馈(如Nexoro)或拆解任务至工单系统(如Delty、Traycer) [13] - 传统协作工具(如维基、任务追踪器)正被AI重构以实现智能化和自动化 [14] AI编码交互与代理技术 - "Tab补全"和"智能编辑"功能集成至编辑器(如Cursor、Windsurf),依赖轻量小模型实现快速响应 [15] - "基于聊天"的文件编辑允许用户通过指令驱动具备大上下文窗口的模型进行跨文件操作 [15] - 后台AI代理(如Devin、Anthropic Code)可长时间独立工作,自动运行测试并提交代码修改 [17] - AI应用构建器(如Lovable、Bolt)通过自然语言或线框图直接生成可运行应用,吸引创业者和专业开发者 [17] - 版本控制工具(如Gitbutler)转向以"意图"为核心记录开发过程,追踪提示词与测试效果 [18] - AI参与代码审查(如Graphite、CodeRabbit),聚焦正确性、安全性与合规性 [19] AI在测试与文档领域的应用 - AI可生成专业的技术文档(如GPT-4、Claude Opus),并动态调取注释与上下文(如Context7) [22][23] - 文档工具(如Mintlify)支持搭建交互式"文档小助手",实现问答与内容再生 [23] - AI自动化生成安全合规文档(如Delve),将合规流程融入自动化 [23] - AI QA工具全自动编写测试脚本、运行流程、输出错误报告与修复建议 [23] - 开发流程从"人工审查+测试"转变为AI全包撰写、测试与提交,仅需人类确认 [24] AI专用工具链与基础设施 - 代码搜索工具(如Sourcegraph、Relace)帮助AI快速定位大型代码库中的关键片段 [26][27] - 文档与网络搜索工具(如Exa、Brave)为AI提供外部知识检索能力 [28] - 代码沙盒(如E2B、Daytona)提供隔离环境供AI安全执行命令与调试程序 [28] - 专为AI设计的工具链使其具备独立接任务、调资源、跑测试、提PR的工程能力 [29] 成本与行业影响 - Claude Opus模型单次调用成本约2.5美元(10万输入token+1万输出token),连续使用年成本超1万美元 [31][32] - 平台通过多模型切换(如Cursor)优化成本,关注性价比而非模型性能极限 [33] - 大模型推理成本成为软件开发的新运营开销,可能改变IT外包商业决策 [33] - 早期采用AI的公司反而增加开发者招聘,因AI释放了新业务机会 [35] - 程序员角色转向"模型协作",需掌握提示词优化、查错与补全技能 [36] - 高等教育需调整编程教学重点,从"从头敲代码"转向"填坑AI生成代码" [37] - 未来可能出现"自我进化应用"(如Gumloop),用户通过自然语言为App添加功能 [37] - 代码在高性能场景不可替代:GPU执行加法比LLM输出token快1000亿倍 [40] - 程序员未来角色将演变为系统编排师、提示工程师与模型质检员 [41]
姚顺宇离职背后:国产大模型已经上桌了
虎嗅· 2025-10-09 21:19
核心人事变动 - 清华物理系特奖得主姚顺宇于2025年9月离开Anthropic,加入Google DeepMind [1] - 其离职原因中40%为反对Anthropic将中国称为“敌对国家”的政策,60%源于无法公开的内部信息判断 [2] - 姚顺宇于2024年10月加入Anthropic,从量子计算研究转向人工智能,并参与了Claude模型从3.7版本提升至4.5版本的工作 [3] Anthropic的战略转向与融资 - Anthropic于2025年9月5日发布公告,立即停止向多数股权由中国资本持有的公司或其子公司提供Claude服务,并将中国等国称为“敌对国家” [7][8] - 在宣布“断供”前两天,公司完成130亿美元(约合人民币928亿元)F轮融资,投后估值达1830亿美元(约合人民币1.3万亿元),为半年前的三倍 [9] - 公司明确将企业级服务API销售作为主要收入来源,并在Claude 3.5推出后将商业重心迁移至AI编程,推出了独立产品Claude Code [15] 技术路径竞争与CEO立场 - Anthropic CEO达里奥·阿莫迪多次呼吁对华实施算力管控,并质疑DeepSeek-V3模型不可能以600万美元的低成本训练而成 [11] - 其立场源于DeepSeek在推理模型上的创新对Anthropic坚持的Scaling Law和预训练模型主导的技术路径构成了挑战 [12] - 以DeepSeek为代表采用的“蒸馏”技术,使大模型厂商能以更快速度、更低成本训练模型,Anthropic采取断供措施以维护其技术壁垒 [13][14] 中国市场替代机遇与竞争 - Anthropic“断供”后,中国科技巨头迅速行动,阿里、腾讯、字节跳动等公司推出的AI编程产品均集成了Claude等主流模型 [16] - 国内大模型厂商如阿里通义千问、DeepSeek和Kimi嗅到国产替代机会,Kimi在断供当天火速更新K2-0905模型,并宣布API限时半价以承接Claude用户 [21] - 智谱、商汤科技、京东云等公司为原Claude用户提供快速切换服务、免费体验Tokens及迁移方案,价格仅为Claude的七分之一,意图争夺市场份额 [23] 全球市场布局与行业动态 - 在疏远中国市场的同时,Anthropic宣布将于2026年在印度班加罗尔设立办事处,因印度已成为其Claude模型的第二大消费市场 [17] - AWS宣布在亚马逊Bedrock上线阿里巴巴的Qwen3系列和DeepSeek V3.1,标志着中国企业在全球AI角逐中已占据核心位置 [28][29] - 海外AI编程产品第一梯队主要为Anthropic的Claude与谷歌的Gemini,而中国企业的模型亦开始被海外平台如Perplexity考虑用于后训练 [16][26]
24岁,她融资4亿,来自广州
华尔街见闻· 2025-10-06 20:13
公司融资与估值 - Axiom Math完成首轮6400万美元(约合人民币4.6亿元)融资,由B Capital领投,Greycroft、Madrona和Menlo Ventures等机构参与 [2] - 公司投后估值达到3亿美元(约合人民币20亿元) [2] - 公司核心团队目前仅有10名全职员工 [6][9] 公司技术与业务模式 - 公司定位为以AI数学家为起点,打造能够自我提升的超级智能推理系统 [6] - 核心模型旨在解决复杂数学问题,能生成详细的推理步骤并进行验证 [7] - 技术路径是将教科书、论文和期刊中的英文数学内容转换为程序化知识,使AI能解决并验证数学问题 [7] - 未来研究场景有望拓展至金融建模、芯片架构及量化交易等领域 [7] - 创始人设想该模型未来或能提出新的数学猜想,从而产生全新知识 [8] - 公司认为当前正站在一场由人工智能、编程语言和数学三大支柱推动的数学复兴门槛上 [8] 创始人及团队背景 - 创始人洪乐潼(Carina Hong)为00后,24岁,在广州出生长大,曾就读于华南师大附中并多次获得奥数竞赛奖牌 [2][12] - 其教育背景包括麻省理工学院数学和物理双学位、牛津大学神经科学硕士,并曾进入斯坦福大学攻读数学与法学博士 [2][13] - 学术成就包括获得Schafer数学卓越奖(每年仅颁发给一名本科女生)以及北美数学本科生最高荣誉摩根奖(第五位获此殊荣的女生) [13] - 2022年底获得牛津大学罗德奖学金,成为当年仅有的四名中国获奖者之一 [13] - 公司CTO Shubho Sengupta曾领导Meta FAIR团队,开发OpenGo和CrypTen,并是早期CUDA技术专家之一 [11] - 团队其他成员包括前Meta人工智能研究科学家François Charton和Hugh Leather,他们在AI与数学交叉领域有深厚积累 [11] 行业趋势:00后创始人崛起 - 00后创始人正集体登上AI舞台,成为创投圈新面孔 [5][15] - 案例包括麻省理工00后创立的Sola Solutions,总计完成2100万美元(约合人民币1.5亿元)融资 [15] - AI编程独角兽Anysphere完成9亿美元(约合人民币65亿元)融资,估值达90亿美元,由麻省理工毕业生创立 [16] - AI招聘网站Mercor完成1亿美元B轮融资,估值达20亿美元,由三位从哈佛及乔治敦大学退学的00后创立 [16] - 国内案例包括清华三位00后创立的机器人公司零次方,完成亿元级融资 [17] - 投资人分析认为,在AI创业潮中,00后创始人因对新事物认知触感更强、没有历史包袱而具备优势 [17]
能连续干活超30小时!Claude发起AI编程新一轮竞赛
第一财经资讯· 2025-09-30 12:13
产品发布与性能 - Anthropic于北京时间9月30日正式发布Claude Sonnet 4 5,官方称其为世界上最好的编程模型,在智能体构建、计算机使用、推理和数学能力上有显著突破[1] - Claude Sonnet 4 5能够在复杂、多步骤任务中保持超过30小时的持续注意力,可自主处理30多个小时的代码[1] - 在SWE-bench Verified测试中,Claude Sonnet 4 5以82 0%的成绩登顶业界第一,比GPT-5-Codex高出7 5个百分点[3] - 在OSWorld基准测试中,Sonnet 4 5以61 4%的得票率领先,而4个月前Sonnet 4的得票率为42 2%[3] - 根据官方评测数据,Sonnet 4 5在多项关键指标上超越主要竞争对手:Agentic coding达77 2%(GPT-5为72 8%),Agentic terminal coding达50 0%(GPT-5为43 8%),Financial analysis达55 3%(GPT-5为46 9%)[5] - 该模型在金融、法律、医学和STEM领域显示出更好的领域特定知识和推理能力[5] 产品功能与体验 - 产品体验升级包括新增检查点功能可随时保存进度并一键回退,终端界面翻新,代码执行和文件创建直接整合到对话中[6] - Claude现可直接在浏览器中工作,导航站点,填写电子表格和完成任务[6] - 推出临时预览功能Imagine with Claude,可实时生成软件,所有代码均为实时互动创建,该功能在接下来五天内仅对Max订阅用户开放[6] 市场竞争与行业动态 - Anthropic此次更新时机紧随OpenAI发布GPT-5-Codex之后,且在一周后OpenAI年度开发者大会之前[1] - AI编程领域创业者如Cursor CEO Michael Truell和Cognition联创兼CEO Scott Wu均对Sonnet 4 5的编码性能和规划能力提升表示认可[7][8] - 在Cursor平台上,Claude仍是最受欢迎的调用模型[8] 定价与商业化 - Sonnet 4 5定价与Sonnet 4保持一致,为3美元/百万输入tokens,15美元/百万输出tokens,但与自家上一代旗舰Opus 4 1相比,输入成本降低5倍[8] - Anthropic最新估值达1830亿美元,成为全球估值第四的独角兽,其年化收入在2025年8月已超过50亿美元,而2025年初约为10亿美元,八个月内收入快速增长[8] - Claude Code在三个月内使用量增长超10倍,产生超5亿美元的运营收入[9] 公司挑战 - 过去两个月,用户普遍反映Claude模型质量出现断崖式下滑,引发开发者大规模退订,公司回应称是因独立Bug导致,非故意降智[9]
刚刚,Claude Sonnet 4.5重磅发布,编程新王降临
36氪· 2025-09-30 09:32
产品发布与核心定位 - Anthropic正式发布Claude Sonnet 4.5,并将其定义为全球最强的代码模型 [2][3] - 该版本在智能体构建、计算机使用、推理和数学能力上展现出显著突破,旨在提升现代工作中运用工具和解决复杂问题的效率与可靠性 [3][5] 性能基准测试表现 - 在SWE-bench Verified测试中达到82.0%的准确率,优于Claude Opus 4.1的79.4%、Claude Sonnet 4的80.2%以及GPT-5的74.5% [4] - 在终端编码测试Terminal-Bench中取得50.0%的准确率,显著高于Claude Sonnet 4的36.4%和GPT-5的43.8% [4] - 在计算机使用基准OSWorld测试中以61.4%的成绩位居首位,相比四个月前Sonnet 4的42.2%有大幅提升 [4][13] - 在金融分析测试Finance Agent中取得55.3%的准确率,高于Claude Opus 4.1的50.9%和GPT-5的46.9% [4] 全新功能与产品升级 - Claude Code新增“检查点”功能,支持随时保存进度和回滚,并更新了终端界面及推出原生VS Code插件 [6] - Claude API增加上下文编辑功能和记忆工具,使智能体能运行更久并处理更复杂的任务 [6] - Claude apps支持在对话中直接执行代码、生成文件(包括表格、幻灯片和文档) [6] - 向开发者社区推出Claude Agent SDK,开放驱动Claude Code的底层基础设施 [8][9] 专业用户验证与实际应用效果 - iGent AI CEO表示,Claude Sonnet 4.5能自主编程超过30小时,帮助工程师在极短时间内完成原本需数月的复杂架构工作 [22][23] - replit内部测试显示,代码错误率从Sonnet 4的9%降至0% [22] 安全性与对齐性改进 - Sonnet 4.5是迄今为止对齐性最好的Claude模型,在减少迎合、欺骗等行为方面成效明显,并特别加强了对提示注入攻击的防御 [28] - 模型按照AI Safety Level 3框架发布,包含针对化学、生物等内容的分类器过滤机制,与Sonnet 4相比误报率已降低十倍 [31] API新特性与定价 - API层面重要更新包括记忆工具、上下文编辑、新的停止原因提示及工具参数改进 [34] - 定价保持与Sonnet 4一致,输入为3美元/百万Tokens,输出为15美元/百万Tokens [35] - 模型可通过Claude API、Amazon Bedrock、Google Cloud Vertex AI及Claude.ai与Claude Code平台使用 [37] 研究预览与行业影响 - 发布临时研究预览“Imagine with Claude”,该功能可实时生成软件演示视频,向Max订阅用户开放5天 [33] - 该版本被视为编程领域的重大跃升,预计将引发新一轮AI编程大战,成为行业争相对标的新对象 [40]
科技融入餐饮:海底捞“火锅+AI编程”成亲子消费新热点
齐鲁晚报网· 2025-09-27 09:34
门店创新与业态升级 - 公司在北京亦庄开设创新概念店 融合火锅餐饮与科技教育体验 打造"未来感"门店场景[1] - 门店配备甜品站 调酒吧和三台迎宾机器人 后厨采用全透明明档设计 智能打锅机精准控制汤料比例[1] - 等位区设置娃娃机和手工冰淇淋机 开业首周娃娃机订单超500单[1] - 夜宵时段增设DJ互动和动感灯光派对 提升夜间消费体验[5] 亲子场景与科技融合 - 公司与猿编程合作将儿童乐园改造为AI启蒙基地 设置四个黑科技互动装置:食材快线 平衡挑战 美食投篮和一拍即合[3] - 引入编程机器狗"小8" 融合人脸识别 语音识别等AI技术 机器狗皮肤采用青铜器纹样和川剧变脸等传统文化元素[3] - 举办"未来专列"快闪活动 提供AIGC照片打印和AR视频体验 将科技体验日常化[3] - 通过AI教育融入儿童乐园场景 实现寓教于乐 让亲子用餐体验升级为边吃边学的科技派对[3][5] 经营表现与模式拓展 - 开业首个周末门店翻台率突破6次 工作日用餐高峰期需等位[5] - 公司计划将"火锅+AI教育+娱乐"模式推广至文旅 零售等更多场景[5] - 创新概念店成功将传统火锅餐饮与科技教育 娱乐元素深度融合 开创亲子消费新场景[1][3][5]
估值 30 亿美元后,Replit CEO的判断:SaaS、App、代码平台,谁先失速?
36氪· 2025-09-25 08:54
AI编程工具普及现状 - 全球90%的软件工程师在日常工作中使用AI编程工具[1] - 大型科技公司内部使用率接近100%,谷歌团队全面切换至Gemini Code Assist,微软已完成Copilot全线整合[2] 传统开发生态的根本问题 - SaaS平台过度分割,无法支撑自动化流程,AI Agent需要完全不同的工作环境[3][6] - App的交互方式打断了连续执行,用户习惯从点击操作转向直接与AI对话[14][15] - 代码平台重编写轻部署,结果无法上线运行,导致开发流程不完整[10][22] Replit的平台架构理念 - 构建全栈能力,使代码可直接运行、部署、生成API并被其他智能代理调用[7][9] - 平台目标不是写代码更快,而是让结果落地,实现从编写到部署的完整交付流程[8][23] - 让用户通过浏览器即可写出、运行并部署完整系统,无需理解服务器或部署流程[27][28] AI Agent对传统App的替代 - App是被动的,需要用户主动操作;Agent是主动的,能自动执行任务并主动反馈[17][19] - 有效解决方案不是创建界面,而是构建自动处理流程,如AI Agent自动扫描、识别和归档文档[17][18] - 用户习惯转向直接向AI交代任务,跳过传统App的点击、填表等中间环节[15][31] 代码平台的闭环能力建设 - 传统平台让写程序变容易,但部署上线依然困难,如同"修了半截路"[22][23] - Replit构建"写→运行→用"连续流程,实现写完就能运行、运行完就能上线的闭环[23][26] - 编程重点从代码技术门槛转向打通产品完整链条,关注代码能否解决实际问题[29] AI驱动的组织架构变革 - AI工具承担更多需要人来做的判断和执行工作,成为工作流程核心环节[33][36] - 未来组织最重要能力是围绕AI设计工作流,而非简单使用AI工具[37] - 公司架构彻底改变,工作安排更灵活,人类主要负责定目标和验证结果,具体执行由AI完成[37][38] 下一代平台的发展方向 - 未来软件起点是生成能调度任务、自我触发、反复调用的智能系统[39][42] - 下一代平台是AI工作助手,用户通过自然语言交互即可完成任务交付[42][44] - 关键不是工具本身,而是构建能反复使用的智能流程和"AI工厂"[37][40]
GenAI系列报告之64暨AI应用深度之三:AI应用:Token经济萌芽
申万宏源证券· 2025-09-24 20:04
行业投资评级 - 报告对AI应用行业持积极态度 投资评级为看好 [4] 核心观点 - AI应用Tokens消耗量大幅增长体现落地进展加速 大模型实现大规模商业化且收入向头部集中 OpenAI年化收入达到120亿美元 [4] - AI视频工具已迈入1亿美元ARR台阶 大规模商业化节点即将到来 [4] - AI编程为最热门融资方向 商业模式已跑通并加速兑现收入 Anysphere实现5亿美元ARR [4] - 企业级AI软件商业化偏慢 但具备坚实应用场景的AI法律 招聘 客服等领域已渐次兑现收入 [4] - 互联网巨头通过AI推荐系统升级和AI应用孵化推动商业化 META业绩已体现生成式推荐系统效果 [4] AI应用总览 - 大模型API调用量2025年后增长明显 OpenRouter平台显示谷歌Gemini Anthropic Claude OpenAI GPT等模型竞争格局高波动 [11] - 互联网公司AI Chatbot成为核心算力消耗场景 ChatGPT周活跃用户达8亿 谷歌Gemini月活用户达4.5亿 [14] - 微软Tokens消耗量从2024Q1的20万亿增长至2025年3月的400万亿 谷歌Tokens消耗量从2024年5月的9.7万亿增长至2025年7月的980万亿 [13] - 初创公司商业化进展分化 OpenAI估值3000亿美元 Anthropic拟以1700亿美元估值融资 xAI估值1130亿美元 [16] - AI视频工具Runway ARR达8400万美元 Synthesia ARR达1亿美元 Midjourney年营收预计3亿美元 [16] - AI编程工具Anysphere估值99亿美元 ARR达5亿美元 Replit估值30亿美元 ARR达1.4亿美元 [18] - 垂类AI应用Scale AI年营收预计20亿美元 Surge AI年营收超10亿美元 ElevenLabs ARR达1亿美元 [22] 互联网巨头进展 - 生成式推荐架构正替代传统DLRM模型 META GRs 快手OneREC 字节HLLM等方案推动推荐系统升级 [34] - META生成式推荐系统使Facebook用户使用时长提升7% Instagram提升6% 广告转化率提升5% [42] - 谷歌AI搜索功能AI Overview月活用户超20亿 AI Mode月活达1亿 Gemini月活达4.5亿 [47] - OpenAI年化收入120亿美元 其中C端订阅55亿 B端订阅36亿 API收入29亿 [53] - Anthropic年化收入50亿美元 其中API收入31亿(60%来自编程工具) 编程工具Claude Code ARR达4亿美元 [53] AI编程领域 - AI编程工具ARR总和超30亿美元 GitHub Copilot用户达2000万 Cursor ARR从1亿快速提升至5亿 [61] - 应用层公司仍需完成代码库感知 编辑器整合 UI优化等工作 具备独立竞争壁垒 [65] - Cursor通过VS Code集成 影子工作区验证 多模型智能路由等技术实现出色用户体验 [68] - 长期看AI编程可能演进为UGC应用程序平台 降低开发门槛并丰富应用生态 [73] 企业级AI软件 - 企业级AI部署前期需3-18个月完成数据清洗 工作流结合等工作 大规模落地节点或在2026年后 [80] - 定制化AI平台更适合企业落地 ServiceNow AI ACV订单达2.5亿美元 指引2026年达10亿美元 [77] - 竞争壁垒来自数据获取能力和行业Know-how Palantir Snowflake ServiceNow SAP等公司具优势 [85] - Palantir通过数据层归一化 逻辑层模型结合 行动层人工审核等构建企业AI操作系统 [91] 内容生产工具 - AI视频工具Runway Synthesia ARR接近1亿美元 但文本忠实度等仍有提升空间 [96] - 设计软件市场分化 Adobe面向专业设计者市场 Figma Canva面向传播者市场 [99] - Figma高价值客户数量高速增长 超过1万美元ARR客户达11107家 超过10万美元客户达1031家 [101] - 多邻国Max会员渗透率达8% 定价29.99美元/月 高于Super会员的12.99美元 [109] 国内AI应用 - 2025H1中国大模型公有云服务Tokens调用量达537万亿 2024全年为114万亿 [112] - 互联网公司通过推荐系统升级 AI Chatbot和云业务推动AI落地 [115]
海外教育科技过亿元融资观察:六起大单勾勒的投资风向
36氪· 2025-09-23 09:11
行业趋势 - 2025年教育科技投融资环境整体收紧 案例减少 估值体系回落 资本态度比疫情高峰期更冷静 [1] - 资本并未全面撤离 而是更集中下注具备刚需价值和技术壁垒的项目 流向更窄更挑剔 [1][21] - 全球教育科技融资逻辑从"普遍下注"转向"精选下注" 聚焦刚需市场、技术壁垒与全球化潜力 [21] Windsurf (原Codeium) - AI编程公司完成新一轮融资 估值升至28.5亿美元 由Kleiner Perkins领投 较2024年8月C轮12.5亿美元估值实现跃升 [1][3] - 年化经常性收入达4000万美元 资本市场以70倍ARR估值买单 显著高于同类公司20-30倍倍数 [3] - 产品从代码补全插件升级为一体化IDE 新推"Cascade"功能支持跨文件上下文理解 [3] - 由Varun Mohan和Douglas Chen于2021年创立 团队具备Meta和Nuro等技术背景 [4] - 被资本视为"生产力基础设施" 服务编程学生和开发行业 具备确定性和成长性 [4] AMBOSS - 德国医学教育平台完成2.4亿欧元融资 投资方包括KIRKBI、M&G Investments和Lightrock [5] - 成立于2012年 覆盖180多个国家 用户超100万 德国50%住院患者由使用AMBOSS的医生治疗 美国25%一年级住院医生依赖该平台 [7] - 采用"负责任的AI"模式 人工智能推荐内容由医生专家团队严格把关 [7] - 完成法律架构转换注册为欧洲股份公司 为未来IPO做准备 [5][7] Manabie - 新加坡教育SaaS服务商完成2300万美元B轮融资 由JIC Venture Growth Investments领投 [8] - 从补习学校转型为SaaS服务商 提供学习管理和学校管理系统 日本30多家教育机构使用其软件 [10] - 聚焦东南亚高度分散的教育市场 填补小型学习中心数字化管理空白 [10] - 战略收缩B2C聚焦B2B 定位教育SaaS基础设施 开发AI辅导工具增强产品差异化 [10] Knowunity - 德国学习平台完成2700万欧元B轮融资 累计融资额达4500万欧元 由XAnge领投 [11] - 平台扩展至15个国家 用户超2000万 其中38万学生创作者贡献内容 [13] - 推出"SchoolGPT"AI产品 基于300万份本地化内容提供知识讲解和作业批改 学生平均每周使用超五次 [13] - 具备UGC社区护城河和规模效应 AI功能进一步提升用户活跃度 [13] Eruditus - 教育科技独角兽完成1.3亿美元再融资 附带2000万美元扩展额度 由Mars Growth Capital和汇丰银行领投 [14] - 2024财年营收4.48亿美元 高于上年4.05亿美元 净亏损从1.27亿美元收窄至8560万美元 [16] - 与80多所全球名校合作 提供700多个高管教育项目 学习者遍布80个国家超100万人 [16] - 将总部从新加坡迁至印度 为未来IPO做准备 融资以债务为主显示资本关注现金流 [16] Lingokids - 西班牙儿童互动学习平台完成1.2亿美元融资 由GP Bullhound和General Catalyst领投 [17] - 全球累计下载量超1.85亿次 提供"Playlearning"理念的安全无广告学习环境 [19] - 与NASA、世界读写能力基金会及Pocoyo等儿童IP合作 AI用于个性化推荐和内容生产 [20] - 面向2030年全球超1000亿美元的幼儿教育市场 多IP战略和全球用户体量获资本认可 [20]
7小时连续重构不掉线,一骑绝尘的Claude终于遇到对手:Greg Brockman亲自解读AI编程重大突破
36氪· 2025-09-17 16:00
产品发布 - OpenAI于9月16日正式推出GPT-5-Codex模型 这是一个专门为AI辅助编程工具设计的微调GPT-5变体 [1] - 新模型在代理编码基准测试中表现更佳 完成编码任务时间从几秒到七小时不等 思考时间比之前模型更加动态 [1] 竞争格局 - Anthropic在过去一年多占据编码场景主导地位 营收飙升至50亿美元 其中10%来自Claude Code 市值冲到1830亿美元 增加1220亿美元市值 [5] - OpenAI早在2021年发布最初Codex 催生GitHub Copilot 全球第一个AI编程工具 现有182位开发者持续贡献 [5] 技术能力 - GPT-5-Codex在SWE-bench上得分74.5% 几乎与GPT-5 thinking在477子集上的74.9%持平 [6] - 模型展现出长时间运行代理任务能力 在内部见过连续工作7小时完成复杂重构 此前从未有过 [8][36] - 针对简单任务响应更快 对于复杂任务具备韧劲 成为全面实用的代理式编程模型 [8][36] 产品形态 - 形成覆盖各种需求的交互界面 包括新Codex CLI ChatGPT Codex现改名Codex Cloud IDE扩展2.5周安装量突破80万 GitHub代码审查机器人 [6] - 不同工具适用场景不同 GitHub为只读小范围代码审查 Cloud支持高自主性项目 CLI支持带权限项目 IDE支持文件级人机协作 [7] 研发背景 - 年初设定公司目标 年底前做出代理式软件工程师 这是OpenAI许多人一起承担的巨大任务 [6][18] - 编程一直是AGI研究的特殊例外 有完全不同的研究计划 专注编程数据代码指标和模型表现 [13] 应用场景 - 代码审查工具取得显著成功 内部上线后效果非常好 当工具挂掉时团队很不满 发现超过九成情况正确 [33][34] - 能帮助迁移重构和安全补丁 比如COBOL迁移问题 没有新COBOL程序员培养 成为全世界风险与负担 [31][32] 使用情况 - 使用量爆炸式增长 总体增长超过10倍 用户使用场景更复杂时间更长 纳入Plus和Pro套餐且额度很大 [50] - 学习编程绝佳时机 用Codex学新语言非常有趣 团队借助Codex快速掌握Rust并取得很棒成果 [47][48] 未来展望 - 未来形态是云端有大量代理组成群体 由人类团队组织监督引导 创造巨大经济价值 [39] - 需要解决安全保障和对齐问题 代理必须做有用工作但以安全方式 人类保持掌控 [39] - 2030年将生活在物质极大丰富世界 AI让创造任何东西更容易 但算力极度稀缺 [44]