Workflow
AGI
icon
搜索文档
AI手搓的Cowork“李鬼”版跟“李逵”一样能打,还免费?
钛媒体APP· 2026-01-19 12:53
核心观点 - AI Agent产品正从被动对话工具转变为能主动执行任务的“数字员工”,重新定义人机协作边界[11][23] - “AI构建AI”的趋势已显现,AI辅助开发将产品开发周期缩短至以“天”为单位,显著提升研发效率[9][10] - 尽管在可靠性、安全性和通用性上存在瓶颈,但AI Agent向通用人工智能(AGI)发展的趋势不可逆转,并将深刻重塑工作流程与商业模式[15][17][22] 主要AI Agent产品对比 - **Anthropic Cowork**:定位为桌面AI Agent,允许用户无需编程处理本地文件与自动化工作流,采用委托式执行,运行于Mac的Linux容器沙箱中,最低订阅费为每月100美元[1][6][8] - **Meta Manus**:定位为“首个通用AI Agent”,采用多Agent并行处理的MapReduce架构,允许完全异步执行,在GAIA基准测试中表现超越OpenAI Deep Research,2025年3月发布后8个月内ARR达1亿美元,同年12月被Meta以超20亿美元收购[3][6][7] - **OpenAI ChatGPT Agent**:于2025年7月推出,运行在虚拟机环境中,提供监督模式选项,在HLE基准测试中得分41.6%,但基线任务成功率仅12.5%[5][8] - **Google Gemini CLI**:面向开发者的开源终端Agent,采用交互式确认(每步需用户批准),直接访问系统终端,使用门槛最高[5][6] 技术架构与能力 - **架构模式**:主流架构包括多Agent协作(如Manus)、工具链集成、沙箱隔离(如Cowork)和虚拟机封装(如ChatGPT Agent),代表不同的安全与能力权衡[7] - **性能表现**:Manus能并行处理大规模任务,如查找所有YC支持的金融科技初创公司CTO邮箱,将数周人工工作缩短至几分钟[8] ChatGPT Agent因虚拟机环境存在性能开销,简单操作可能需数秒至数分钟[8] - **自主性梯度**:从高到低依次为Manus(完全异步)、Cowork(委托式)、ChatGPT Agent(监督模式)、Gemini CLI(交互式确认)[5][6] “AI构建AI”趋势与研发效率变革 - **开发周期革命**:传统软件开发需数月甚至数年,AI辅助开发缩短至数周,而“AI构建AI”阶段可缩短至以“天”为单位,Cowork由4人团队在10天内几乎全部由AI编写完成[1][9] - **研发效率提升**:Anthropic工程师表示,Claude辅助编码比例从去年的30%提升至2025年的60% 同时,工程团队规模扩大一倍,代码合并请求(PR)吞吐量却增加67%[10] - **角色转变**:Anthropic工程师的工作70%以上转变为代码审查者/修订者,而非全新代码编写者 工程师角色从执行者转向指挥者,负责管理1个、5个或100个Claude的工作[12] 向AGI演进与行业影响 - **能力演进**:AI正从工具转变为创意伙伴,如Claude Code能提出构建想法并参与设计 Anthropic的CLAUDE.md系统通过积累机构知识,使AI在代码库中不断变得更聪明[15][16] - **解锁新价值**:Claude辅助的工作中,27%是“否则不会完成”的任务,AI将低优先级、耗时的任务变得可行,其能力增长是指数级的[17] - **行业预测**:Gartner预测,到2028年,90%的B2B采购将由Agent处理,“Agent商务”将控制超15万亿美元支出 到2028年,使用多Agent处理80%客户面向业务流程的组织将占据主导地位[22] 当前瓶颈与挑战 - **可靠性问题**:ChatGPT Agent在简单任务上的基线成功率仅12.5%,需优化才能达到80%的实用水平[5][20] - **安全隐患**:PromptArmor报告称,Cowork可通过提示注入被诱骗传输敏感文件至攻击者账户 随着AI自主性增加,提示注入、数据泄露等风险放大[13][20] - **通用性局限**:Agent在特定领域表现远超跨领域泛化能力,递归自我改进仍局限在应用层工具,而非底层模型[19][21]
深度|OpenAI产品经理谈Codex爆发式增长背后的AI协作:实现AGI级生产力的真正瓶颈是人类的打字速度!
Z Potentials· 2026-01-19 11:02
文章核心观点 - OpenAI的Coding Agent产品Codex自2024年8月ChatGPT5发布以来,规模已增长20倍,目前每周处理数万亿个字符,成为公司最核心的代码生成模型 [3][19] - Codex的愿景不仅是辅助编写代码,更是成为软件工程团队中具备“主动性”的协作伙伴,旨在无缝融入工作流,极大提升人类工作效率 [9][17][28] - 当前AI发展的一个关键瓶颈并非模型能力,而是人类与模型交互时的物理和认知限制,如打字速度和多任务处理能力 [9][76] - OpenAI通过自下而上、高度灵活的组织结构,以及产品与研究的深度融合,实现了Codex等产品的爆炸式增长和快速迭代 [10][12][19][27] OpenAI的组织与运营模式 - OpenAI的组织结构强调自下而上,赋予团队高度自主性和灵活性,以快速尝试和适应不确定的技术与市场环境 [12] - 公司擅长讨论一年或更久之后的长期愿景,但对于数月内的战术性目标,更倾向于通过实证探索来解决,采取“准备、开火、瞄准”的模糊目标策略 [13] - 这种高速发展依赖于汇聚全球顶尖的精英人才,其个体驱动力和自主性构成了组织模式的基石,难以被简单复制 [14] Codex的产品定位与爆发式增长 - Codex是OpenAI的Coding Agent,可作为IDE扩展或终端工具安装,用于回答代码问题、编写、运行测试及处理软件开发生命周期中的多项工作 [15] - 产品定位是成为软件工程团队的“团队成员”,未来将参与从早期创意规划到后期验证、部署和维护的全过程,而不仅限于代码自动补全 [15][18] - 增长关键源于产品形态的调整:从部署门槛较高的云端异步产品(Codex Cloud),转向与开发者日常工具深度整合的本地交互式产品,降低了用户使用门槛并建立了高效的反馈循环 [21][22][23] - 内部试用与市场反馈存在差异,公司内部因熟悉与模型交互而能高效使用异步模式,但普通用户更需要符合直觉的交互方式 [24] 技术栈协同与能力提升 - Codex能力的提升是模型、API和工具环境三个技术栈层面协同优化、并行推进的结果 [25][27] - 最新模型GPT 5.11 CodexMax在执行效率上比前代提升约30%,并解锁了更强的智能和推理能力,能够解决极其棘手的漏洞 [24] - 通过“上下文压缩”等技术,使模型能够长时间持续运行(如通宵或24小时),这需要模型、API接口和工具环境三者的协同支持 [26] - 公司专注于让模型通过命令行界面在沙箱环境中运行,这种针对特定模式的深度优化加速了研发进度 [27] 实际应用案例与效率提升 - Codex助力Sora团队在18天内完成了Sora安卓应用从0到1的开发,并在总共28天内实现公众发布,该应用随后成为App Store排名第一的应用 [47][48][49] - 在Atlas浏览器项目中,以前需要两三名工程师花费两三周的任务,现在一名工程师一周即可完成,效率提升显著 [52][54] - 产品应用已超越工程部门,设计团队使用Codex快速制作动画原型,产品营销人员可直接在Slack上修改文案,体现了“压缩人才层级”的趋势 [46][53] - Codex被用于编写一次性代码,如快速构建交互式数据查看器,推动了代码的普及化应用 [46] 对AI发展、编程及未来工作的看法 - 构建任何Agent的本质都应是构建Coding Agent,因为模型使用计算机的最佳方式就是编写代码 [9] - 未来岗位界限将变得模糊,自然语言成为新的、灵活性极高的抽象层级,但技术的抽象层级提升将是渐进式的 [55] - 在AI时代,对目标用户需求的深度洞察比单纯的技术执行力更为重要,这更有利于垂直领域的AI创业公司 [58] - 对于软件工程教育,理解系统构建原理、系统工程能力及团队协作技能将比掌握具体的编码语法更为重要 [72][74] - 交互界面的未来可能超越聊天模式,向更情境化、低门槛的方式演进,例如设想中的通过滑动视频流与Agent交互的应用 [38][40] 产品开发与评估重点 - 产品团队关注避免过度开发深度功能,重点监测如7日留存率等早期用户留存指标,并以全新用户身份体验产品流程 [59] - 高度重视来自社交媒体(尤其是Reddit)的真实用户反馈,特别是负面评价,以发现特定功能问题并指导优化 [60][62] - 建议用户以最真实、棘手的任务来测试Codex,以此作为与这位“新团队成员”建立信任和熟悉度的最佳方式 [68][70]
对话 Mistral CEO:大模型都差不多了,AI公司靠什么赚钱?
36氪· 2026-01-19 08:47
行业趋势:大模型性能趋同与竞争焦点转移 - 截至2025年底,头部大模型(如Google Gemini、OpenAI GPT、Claude及中国模型)之间的性能差距正在快速缩小,呈现“肉眼可见”的趋同态势 [1] - 当模型性能拉不开差距时,行业竞争焦点将从比拼模型“更聪明”转向比拼如何让客户“真的用起来”,即模型在企业系统、流程和业务中的实际应用能力 [1] - 性能趋同将导致价格压力增大、毛利率被挤压,仅通过增加模型参数难以维持溢价 [1] 技术发展:开源与工程优化加速趋同 - 模型性能趋同的核心原因在于技术开源和工程优化能力的快速传播,全球约有十多个实验室采用相同方法和数据,导致技术护城河消失 [2] - 开源加速了技术迭代,例如Mistral AI在2024年初开源的稀疏混合专家架构,几个月后中国团队DeepSeek-V3便做出了成本更低、效率更高的版本,双方技术互相借鉴 [3] - 模型训练的计算门槛迅速下降,2024年预训练模型达到10^26 FLOPs(运算规模)还很困难,但到2025年任何有资源的团队都能在几个月内追上 [3] 企业应用:AI价值实现的两大路径 - AI在企业中的价值实现可分为两类:一是提升运营效率,二是实现技术突破 [10] - **效率提升案例**:法国航运巨头CMA CGM利用Mistral的AI系统,将原本需要20多名员工轮班完成的港口调度协调工作,简化为仅需2人把关,AI能自动与20多个外部系统交互并执行任务 [12][13] - **技术突破案例**:ASML利用Mistral的模型进行光刻机的高精度图像识别,AI能识别出人眼无法察觉的芯片缺陷,这不仅节省人力,更突破了芯片制造的精度瓶颈,推动半导体制程向更小纳米级别发展 [17][18][19] - AI在核聚变、半导体制造等领域的应用,正帮助行业突破物理极限,其创造的价值远高于单纯节省人力 [20] 商业模式:从销售模型能力转向提供可落地方案 - AI公司真正的盈利机会不在于销售一个“聪明”的模型,而在于提供能让AI深度融入企业日常工作的落地解决方案 [21] - 许多在模型研发上投入巨大的AI实验室未必能盈利,而真正能赚到钱的是那些能让AI在企业中实际运转起来的公司 [22] - 企业需要的不是模型本身,而是能够解决具体业务问题的可执行方案 [21] 竞争壁垒:控制权与部署灵活性成为关键 - Mistral AI将其成功因素归结为三点:**能用**、**能控**、**不受限** [23] - **能用**:通过开源模型,允许企业根据自身需求进行修改、接入现有系统并部署在自有基础设施上运行,这与许多提供“黑盒”工具的闭源模型形成对比 [24][25] - **能控**:闭源模型存在供应商锁定风险,企业可能因API变更、定价调整或功能限制而陷入被动,迁移成本极高,开源模型则赋予客户随时切换和自主部署的控制权 [26] - **不受限**:模型支持本地化部署,即使断网也能使用,客户可根据需求灵活调整功能,无需与供应商反复谈判,这对稳定性要求高的关键业务至关重要 [27] - **案例验证**:2026年1月,法国政府与Mistral签订框架协议,要求AI系统必须在法国本土基础设施上运行,以确保关键业务不依赖外部供应商,这同时能将投资、就业和技术生态留在本地 [29][30] - 行业共识是,随着模型商品化和技术门槛消失,真正的价值在于让AI在企业落地,并将系统控制权交给企业,AI越重要,控制权的价值就越高 [30]
腾讯研究院AI速递 20260119
腾讯研究院· 2026-01-19 00:01
超大规模计算基础设施与能源挑战 - 马斯克旗下xAI的Colossus 2超算集群正式投入运行,成为全球首个功率达到1吉瓦(GW)的超算集群,计划于4月升级至1.5吉瓦,最终装机容量将达到2吉瓦 [1] - 该集群完工后将内置55.5万张GPU,远超Meta和微软的规模,全部专用于Grok模型,预计将支撑6万亿参数的Grok 5模型训练 [1] - 数据中心用电激增对美国电网构成压力,导致PJM电网区域6700万居民可能面临轮流停电风险,xAI已部署168个特斯拉Megapack储能系统以缓解对电网的冲击 [1] 大模型产品商业化与市场策略 - OpenAI正式启动广告业务,计划在美国的免费版和新推出的ChatGPT Go订阅服务中测试广告,广告将出现在回答底部并明确标记,而Pro、Business和Enterprise版本则无广告 [2] - OpenAI推出低价订阅服务ChatGPT Go,价格为每月8美元,提供GPT-5.2 Instant版本,其消息量和图像创建量是免费版的10倍 [2] - OpenAI承诺广告不影响回答内容,不向广告商出售用户数据,用户可关闭个性化广告并随时清除相关数据 [2] 翻译工具与多语言模型竞争 - OpenAI低调上线ChatGPT Translate翻译工具,支持50多种语言,并提供一键调整译文语气(如“商务正式”、“学术风格”)的功能 [3] - 谷歌强势回应,开源了TranslateGemma模型,支持55种语言,其120亿(12B)参数版本性能超越270亿(27B)参数的基线模型,40亿(4B)参数版本可在手机端运行 [3] - TranslateGemma模型保留了多模态能力,可以翻译图像中的文字,其4B版本采用Apache 2.0许可证,支持商业使用 [3] 高效开源图像生成与编辑模型 - Black Forest Labs开源了FLUX.2 Klein模型,包含40亿(4B)和90亿(9B)参数两个版本,在现代硬件上实现了端到端推理时间低于0.5秒,统一了文生图和图像编辑能力 [4] - 4B模型仅需13GB显存即可在消费级GPU上运行,9B版本性能可与参数规模为其5倍的模型匹敌,4B版本采用Apache 2.0许可证 [4] - 模型提供了FP8和NVFP4量化版本,在RTX GPU上分别实现了最高1.6倍和2.7倍的推理加速,显存占用降低了40%至55% [4] 3D内容生成技术升级 - 混元3D Studio 1.2全面开放公测,其组件生成能力升级为PartGen 1.5,拆分精度从1024³提升至1536³分辨率,并支持笔刷交互进行拆分控制 [5] - 基础模型升级为混元3D 3.1版本,几何细节和纹理颜色还原度大幅提升,支持通过八视角图像输入生成3D模型 [5] - 新版本引入了全尺度组件精细化处理和分割掩码控制,实现了更完整的复杂物体拆分和专业可控的组件生成 [5] 大模型智能体能力与训练方法创新 - 美团发布了5600亿参数的LongCat-Flash-Thinking-2601模型,引入了“重思考”模式,可同时启动8路并行思考后汇总得出结论 [7] - 该模型的智能体能力获得重大提升,在工具调用和搜索等基准测试中达到顶尖水平,团队还提出了自动化环境规模扩展的泛化能力评测方法 [7] - 模型采用环境规模扩展与多环境强化学习进行训练,并引入了面向噪声环境的课程式稳健训练,显著提升了在分布外场景的适应能力 [7] OpenAI内部争议与法律诉讼 - 法庭解封了超过100份与马斯克诉OpenAI案相关的证词文件,文件显示奥特曼通过YC基金间接持有OpenAI股份,同时秘密拥有OpenAI创业基金,与其公开声明存在矛盾 [8] - 文件曝光了Brockman 2017年的日记,其中承认想把OpenAI转为营利公司并踢出马斯克,称“这是摆脱埃隆的唯一机会” [8] - OpenAI反驳称马斯克曾要求获得50%-60%的股权和CEO职位但被拒绝,法官认为证据争议较大,适合由陪审团裁决,审判定于4月27日开始 [8] 脑机接口技术进展与升级路径 - Neuralink首位受试者Noland揭秘,其大脑芯片可通过三种方式升级:Telepathy应用更新、植入体固件OTA无线更新以及硬件迭代 [8] - 此前85%的电极发生脱离后,团队通过软件算法更新让剩余15%的电极性能反超完好状态,实现了不开颅修复问题 [8] - 下一代计划采用“双芯配置”,在大脑和脊髓各植入一枚芯片以搭建“数字桥梁”,目标是让瘫痪者重新行走;奥特曼投资的Merge Labs也已入局脑机接口领域 [8] 行业对AGI发展的判断与预测 - 红杉资本合伙人联合发布博客,指出AGI(通用人工智能)已经到来,其功能性定义为“能把事情搞清楚的能力”,认为长周期智能体已具备形成假设、验证、调整直至找到答案的能力 [9] - 文章举例说明,智能体能在31分钟内自主完成一项招聘任务:从LinkedIn搜索到YouTube筛选演讲者,再交叉比对Twitter找出倦怠信号,最终锁定精准候选人 [9] - 长周期智能体的能力被认为每7个月翻一番,预计到2028年能完成人类专家一天的工作,到2034年能完成一年的工作,并称“你对2030年的梦想,2026年就能实现” [9] 大模型能力演进与个性化方向 - OpenAI后训练负责人表示,GPT-5.1首次让所有聊天模型都变成了推理模型,模型可根据问题难度自主决定思考时长,实现更智能的资源分配 [10] - 团队重点改进了模型的上下文记忆、自动模型切换的风格一致性和指令遵循能力,并新增了“风格与特质”个性化功能,允许用户自定义模型的表达方式 [11] - 未来模型将更加可定制,记忆功能让模型能记住用户背景和偏好,真正的方向是模型主动理解用户,但用户始终掌握主导权 [11] AI对工作效率的影响与潜在风险 - Anthropic发布的新《经济指数报告》显示,任务越复杂,AI带来的效率提升越惊人:完成高中学历水平的任务速度提升9倍,完成大学学历水平的任务速度提升达12倍,颠覆了“AI只擅长简单劳动”的认知 [12] - 报告发现,人机协作能将AI处理任务的时长上限从基准测试的2小时推高至19小时,接近10倍提升,人类学会拆解任务和提供反馈修正是关键 [12] - 报告警示存在“去技能化”风险,AI正系统性剔除工作中的高智力部分,当前AI覆盖的任务平均需要14.4年的教育背景,高于经济活动平均所需的13.2年 [12]
All in AI 的第一个三年|42章经
42章经· 2026-01-18 21:33
文章核心观点 - AI行业已完整走过第一个三年周期,市场从早期非共识走向广泛参与和竞争 [2] - 投资机构最正确的决策是All in AI,但反思在早期应更开放、更激进地投资全球机会,并认识到算力是未来支配智力的核心资产 [3][4][6][9][10][13] - 未来三年将进入“大科学时代”,AI将极大赋能科学家,推动科学大爆发,而构建AI与人的“主体性”是未来十年的核心议题 [22][60][61][66] - 在AI时代,个体“活出自己”是几乎唯一的生存和发展策略,AI将放大个体的独特点,而真实和执行力变得比思考和演算更有价值 [24][29][31][57][58][151][153] - 对AI“泡沫”的讨论是产业变迁中的噪声,关键在于方向正确,AGI是人类当下最有价值的命题 [33][37][38][39] 对过去三年的复盘与反思 - **最正确的决策**:All in AI,并在早期非共识时投资大模型而非垂直模型,投资Agent而非应用,预言了超级个体时代 [3][14] - **最错误的决策/反思**:早期投资心态可以更猛,项目性价比更高,例如23年具身智能项目估值仅1-2亿人民币,贵的也才10亿人民币 [3] - **错失的机会**:因顾虑地缘等因素,错过了投资美国具身智能公司Figure AI的机会,其估值从8亿美金增长至400亿美金 [4] - **认知变化**:大方向判断正确,但低估了全球大公司(如Google、微软、Meta)对AI的反应速度、投入决心和战略能力,这反过来压低了创业公司的天花板 [15][16][17][18] - **投资方法论的进化**:在快速变化的AI领域,对人的判断比事更重要,更珍惜创始人的执行力、动态解决问题和实事求是的能力 [51][52][53][54][55] 对AI技术与产业的前瞻判断 - **AGI的信念与定义**:相信AGI会很快到来,其定义并非全知全觉的生命,而是在任何可验证结果的环境中超越人类的AI [19][20][21] - **多模态与具身智能的重要性**:多模态是AI发展的关键,而具身智能是提供多模态训练数据、通往AGI的重要路径(“北坡”) [82][83][84][87] - **AI与具身的关系演进**:认知经历了三个阶段:从“能干活的机器人”,到“AI的载体”(Embodied AI),再到“Robotics就是AI本身”,最终价值在于通过机器训练出的AI [89][90][92][93][94] - **算力的核心地位**:未来是智力时代,算力是支配智力的关键,可能越来越稀缺并受监管,未来慈善可能是捐赠免费算力 [10][11][12] - **未来重点方向**:关注AI与科学的深度结合、Agent基础设施(Agent Infra)以及具身智能,中国在具身智能(北坡)有巨大机会和领先潜力 [98][99] 市场与投资环境分析 - **市场阶段变化**:市场从早期能完全覆盖信息,发展到25年公司数量激增、噪音变多,类似早年的移动互联网,需要做取舍和聚焦主要矛盾 [47][48][49][50] - **退出路径变化**:香港市场成为重要的新退出通道,同时市场参与者结构变化,如智谱、MiniMax等头部公司中人民币基金和政府基金占比显著 [78][79][80][81] - **当前市场信号**:高频信号是火热的融资市场(一周可达四十几个TS),但这可能是噪声;低频信号是创始人是否在解决真正重要的问题 [72][73][74] - **资产配置逻辑**:在AI时代应“Long Action, Short Thinking”(做多行动,做空空想),执行力比空想更值钱 [57][58] - **对融资市场的展望**:对26年融资市场乐观,全球前沿科技看中美,当前资金有从美国减仓并流向中国的趋势,且中国式创新(如DeepSeek、MiniMax、宇树)正获得全球关注 [100][102][103][104] AI时代下的个体与组织发展 - **个体的生存策略**:AI时代个体必须“活出自己”,AI将放大每个人独特的美学或能力点,使其能服务更多人;即使不参与AI变革,活出自己也能成为无法被替代的部分 [24][25][29][31] - **执行力的价值**:在AI能力强大的背景下,人的核心优势在于定义问题、保持初心和快速执行,获取AI无法获得的体感反馈 [55][56] - **注意力的优化**:如同优化AI的注意力机制,人也应优化自身注意力,关注长期低频信号而非短期噪声,以提升生命质量 [124][125][126][127][128] - **组织与伙伴关系**:好的合作伙伴是能让彼此变得更真实、能毫无保留表达真实看法的人,合作中应追求“一层真实”而非层层计算 [151][152] - **创始人的特质**:优秀的创始人特质是“真”与“知行合一”,例如不看竞争对手融资,只聚焦AGI目标与技术研发 [155][156][157][158][159] 中国创新的全球角色 - **中国创始人的全球视野**:新一代中国创始人具备全球眼光和创新决心,正在走向全球市场并引导全球创新,尤其在智能硬件领域(如极壳、大疆、拓竹) [159][160] - **中国在AI发展路径中的优势**:在通往AGI的“北坡”(具身智能)上,中国拥有巨大的机会并处于领先地位 [99] - **本土资本体系的构建**:中国正在搭建自己的科技公司估值体系和资本成长体系,尽管退出市场尚年轻,但方向正确 [81] - **全球创新范例**:如MiniMax从创立第一天就是全球格局,致力于全球创新、产品和用户 [160]
那些活出来的人|绿洲资本张津剑
42章经· 2026-01-18 21:33
文章核心观点 - 文章通过投资人与AI创业者俊杰的对话与观察,阐述了对新一代创业者的核心投资理念:卓越的创始人应具备超越个人需求的宏大出发点(如“Intelligence with Everyone”)和长期专注于愿景的坚韧智慧,而非仅仅关注竞争或短期商业利益 [2][3][5][15] - 中国新生代创业者正发生结构性改变,他们成长于经济高速发展期,具有底层的丰盈感,因此更可能超越个人需求,定义新方向并引领全球前沿创新 [15] - 真正的技术价值在于“User In the Loop”,即用户可感知的技术产品,而非单纯的技术调用 [2] 对创业者俊杰的观察与评价 - 创业者俊杰坚信AGI(通用人工智能)必将实现,其创业出发点是推动AGI发生并让技术服务每个人,即“Intelligence with Everyone” [2] - 俊杰认为AGI是技术、产品、商业、公司整体结合的系统工程,因此选择从应用切入,因为“技术是奢侈品”,单纯技术(如商汤曾每日调用超10亿次的人脸识别)若无产品化则收入有限 [2] - 其在决策离职创业时,核心自问“这是不是人生一定要做的事”,并展现出极强的专注力,不关注竞争对手的营销与融资动态,只专注于通往AGI之路 [2][6][10] - 其创业过程并非一帆风顺,但非常笃定并逐步实现了当初描绘的愿景 [13] 投资机构(绿洲资本)的核心理念 - 投资机构在早期投资中,更关注创业者的出发点和关注点,而非商业模式和短期业绩 [3] - 卓越的创始人是稀缺的,其核心能力是能长期专注在正确事情上的智慧 [5][8] - 机构致力于发现并投资那些具备“生命力”的企业家,即拥有坚韧、进化力量并能引领时代结构性变革的创业者 [25] - 机构专注于早期和成长期投资,单笔投资金额为300万至3000万美元,重点投资领域包括机器人、人工智能、科技服务等 [25][26] 中国新生代创业者的特征 - 新生代创业者成长于中国高速增长年代,底层的丰盈感使其中的一些人能够超越个人需求,去定义新方向、构建新范式并敢为天下先 [15] - 他们长期专注在自己真正感兴趣的前沿创新上(如宣称“生命是可以设计的”、“具身智能通往AGI”),但在个人生活上可能极为简朴(如使用宜家99元的办公桌) [16][17] - 他们并非世俗意义上的完美形象(可能穿着破洞衣服、不善社交),但因相信自己的愿景并专注践行,从而活出了强大的生命力 [16][17][19]
没有商业模式,是DeepSeek最坚固的“护城河”
硬AI· 2026-01-18 21:03
DeepSeek的独特商业模式与行业地位 - 公司是全球AI巨头中唯一坚持零外部融资、无商业化压力的异类,使其能够不计成本、专注于AGI梦想 [2][3][6] - 公司创始人梁文锋坚持不进行外部融资,将公司控制权置于资金之上,这在所有顶尖AI实验室中独树一帜 [6][8] - 公司缺乏传统商业模式,但这被视为其长期优势,使其内部激励机制完全与AGI研究对齐,无需对财报或商业化KPI负责 [18][24][31] 自筹资金的财务基础与运营模式 - 公司的研发资金完全由其创始人梁文锋背后的量化基金“幻方量化”提供,该基金在去年实现了53%的回报率,创造了超过7亿美元(约50亿人民币)的利润 [7][23] - 这种用“老钱”养“新梦”的模式使公司无需迎合外部投资者,能够自主决定将利润用于购买GPU和招聘人才 [7][20][23] - 公司在2023年成立初期曾尝试融资但被国内VC拒绝,这反而成为“塞翁失马”,使其避免了背负商业化压力而导致动作变形 [8][22] 在开源AI领域的竞争态势 - 公司通过发布V3和R1模型打响了MIT License许可开源模型的第一枪,但目前已不再是市场上唯一或最开放的开源玩家 [5][14] - 当前全球开放程度排名前三的模型分别来自NVIDIA、Allen Institute和MBZUAI,公司的模型在能力、成本或开放度上已不再全面领先 [5][15][18] - 公司的竞争推动了行业开源进程,例如促使OpenAI发布了其gpt-oss模型,但公司自身并未开源其训练数据集或主代码库 [14] 零融资模式带来的组织与文化优势 - 公司因无外部融资和估值,避免了“大公司病”,组织架构极度扁平,内部没有因争夺算力资源而产生的官僚主义、内斗和权力斗争 [9][28] - 与一些资金雄厚的实验室(如Thinking Machines Lab)出现的浮夸文化(如定制品牌杠铃片)相比,公司文化更为纯粹,专注于研究 [9][28][30] - 缺乏外部资金附带条件,使得公司能够完全基于“科研品味”来支持新想法,而非盲目堆砌算力 [10][26][27] 对算力与创新关系的行业洞察 - 前OpenAI研究员Ilya Sutskever指出,颠覆性创新往往不需要无限堆算力,例如Transformer架构最初仅使用了8到64张GPU [10][27] - 过多的资金可能导致团队依赖算力而失去科研品味,公司因资源有限反而可能更注重创新效率 [10][11][26] - 公司模式证明,进行前沿研究需要一定算力,但并非绝对需要最大量的算力 [27] 投资视角下的价值与悖论 - 从投资者角度看,公司是极具吸引力的投资标的,但一旦接受外部投资,其纯粹专注于AGI研究的独特特质将可能消失 [12][31] - 即便如埃隆·马斯克的xAI也未能抗拒资本,近期完成了高达200亿美元的融资,凸显了公司坚持零融资的罕见性 [22][23] - 公司通过完全控制权换取了较少的资金,使其命运完全服务于“让AGI成为现实”的长期目标,无需考虑风投所要求的大规模商业化回报 [24][31]
没有商业模式--DeepSeek最坚固的“护城河”
华尔街见闻· 2026-01-18 16:58
文章核心观点 - DeepSeek实验室因其“零外部融资、无商业化压力”的独特模式,在全球AI行业中构建了最坚固的护城河,使其能够专注于AGI研究而不受资本裹挟 [2][8][13] 市场预期与行业竞争格局 - 市场对DeepSeek在农历新年前发布更强大新模型期待高涨,但行业已习惯每隔一两个月就有新的“开放权重”模型发布,DeepSeek的新模型可能难以再次震惊世界 [3] - DeepSeek通过发布V3和R1打响了MIT License许可开源模型的第一枪,但已不再是市场上最开放的实验室,因其未开源训练数据集或主代码库 [4] - 目前全球开放程度排名前三的模型分别来自NVIDIA(Nemotron 3)、Allen Institute(Olmo 3)和穆罕默德·本·扎耶德人工智能大学(MBZUAI,K2-V2) [5] - DeepSeek的模型在开放模型中已不再是最强、最便宜或最开放的 [8] 独特的“零融资”商业模式 - DeepSeek是全球顶尖AI实验室中唯一坚持“零外部融资”的异类,其创始人梁文锋将控制权看得比融资更重要 [3][10] - 公司通过其关联的量化基金“幻方量化”的利润来自筹资金,该基金在去年以53%的回报率创造了超过7亿美元(约50亿人民币)的利润,并用于购买GPU和招聘人才 [3][12] - 2023年公司成立初期寻求风险投资失败,因中国VC的短视和风险厌恶,但这反而使其避免了商业化KPI压力,只需对技术负责 [3][10] - 即便在获得全球知名度后,公司仍拒绝筹集外部资金,以保持对自身命运和AGI研究目标的完全控制权 [12][13] 资金充裕带来的组织问题 - 过多的外部资金会滋生“大公司病”,例如资源内耗、部门宫斗以及浮夸的排场,如某些实验室在健身房使用印有自家Logo的定制杠铃片 [3][16] - 外部融资会带来估值、股票期权以及商业化的期望,这可能导致组织层级化、嫉妒和人才被挖角 [16][17] - 相比之下,DeepSeek因无外部资金,组织架构极度扁平,内部没有资源竞争和官僚主义,有利于研究想法的支持与实施 [15] 算力与创新效率的关系 - 前OpenAI研究员Ilya Sutskever指出,颠覆性创新并不总是需要无限堆算力,例如Transformer架构最初仅使用了8到64张GPU [3][14] - 对于研究而言,需要一定量的算力,但并非绝对需要最大量的算力,过多的资金和算力反而可能让团队变懒,失去“科研品味” [3][14][15] - DeepSeek通过消除“因有钱就必须购买更多算力”的必要性,避免了资源分配的内部斗争,使良好的研究品味能得到最大支持 [15] 行业融资趋势对比 - 全球AI行业资金涌入剧烈,几乎所有有影响力的实验室都在筹集更多资金,例如埃隆·马斯克的xAI近期完成了高达200亿美元的E轮融资 [3][11] - 一批由明星研究员领导、风投支持的“AI新实验室”涌现,如Thinking Machines Lab、SSI(已筹集30亿美元)和AMI Labs [11][17] - 在此背景下,DeepSeek坚持自筹资金,使其激励机制与行业内其他实验室截然不同,实现了内部目标与AGI研究的最大化对齐 [18]
红杉合伙人:2026,AGI已经来了
机器之心· 2026-01-18 12:05
文章核心观点 - 红杉资本合伙人认为,通用人工智能(AGI)已经到来,其功能性定义是“能把事情搞清楚的能力”,而长周期智能体(如Claude Code)是这一能力的首批例证 [1][8][14] - 长周期智能体的能力正以指数级速度增长,大约每7个月翻一番,预计到2028年能完成人类专家一天的工作,到2034年能完成一年的工作 [4][24] - 人工智能应用正从“说话者”向“行动者”演进,2026年将是长周期智能体的元年,它们将像同事一样全天候工作,彻底改变工作模式 [10][27] AGI的功能性定义与现状 - AGI被定义为“能把事情搞清楚的能力”,其核心要素包括:基础知识(预训练)、基于知识的推理能力(推理时计算)以及迭代寻找答案的能力(长周期智能体)[14][16] - 2022年ChatGPT的出现标志着知识/预训练要素的突破,2024年底o1的发布带来了推理/推理时计算能力,而过去几周Claude Code等编程智能体则跨越了长周期智能体的能力门槛 [16] - 长周期智能体已能像人一样连续自主工作数小时,发现并修正自身错误,无需具体指令即可自行判断,这标志着AGI在功能上已经实现 [16] 长周期智能体的能力例证 - 一个具体案例是,智能体在31分钟内为一位创始人找到了合适的开发者关系负责人候选人,过程包括在LinkedIn、YouTube、Twitter上交叉验证信息,并最终起草精准的挖角邮件 [3][4][20] - 该智能体自主完成了形成假设、验证、碰壁、转向直至找到答案的全过程,展示了在模糊情境中导航以达成目标的“把事情搞清楚”的能力 [4][20] - 智能体目前仍会失败,例如产生幻觉或丢失上下文,但趋势明确且这些失败正变得越来越可修复 [20] 技术路径与发展曲线 - 实现长周期智能体主要依赖两种可扩展的技术路径:强化学习(由研究实验室推动)和智能体框架(由应用层产品设计)[22][23][24] - 市场已出现一些以其智能体框架闻名的产品,例如Manus、Claude Code、Factory的Droids等 [24] - 根据METR的追踪,长周期智能体完成长周期任务的能力正以指数级进步,大约每7个月翻一番 [24] - 按此指数曲线推算,到2028年智能体可可靠完成人类专家一天的任务,2034年完成一年的任务,2037年完成一个世纪的任务 [24] 行业影响与应用前景 - AI应用正从2023-2024年的“说话者”(对话式应用)向2026-2027年的“行动者”演进,后者将像同事一样被全天候使用,用户将从个人贡献者转变为智能体团队的管理者 [27] - 长周期智能体将解锁基于“工作成果”出售的新商业模式,促使企业重新思考如何将工作产品化、可靠交付以及根据价值和成果定价 [28] - 多个行业已出现具体应用案例:医疗(OpenEvidence扮演专科医生)、法律(Harvey扮演律师助理)、网络安全(XBOW扮演渗透测试员)、运维(Traversal扮演SRE)、销售(Day AI扮演业务开发等)、招聘(Juicebox扮演招聘官)、数学(Harmonic扮演数学家)、芯片设计(Ricursive扮演芯片设计师)、AI研究(GPT-5.2和Claude扮演研究员)[31] - 长周期智能体将能处理海量、长期的任务,例如分析20万项临床试验、挖掘所有客户支持工单信号或重构整部美国税法,使原本雄心勃勃的路线图变得可行 [29][30]
科技资讯AI速递:昨夜今晨科技热点一览 丨2026年1月18日
新浪财经· 2026-01-18 08:22
人工智能行业法律纠纷与公司动态 - 马斯克向OpenAI及微软提起欺诈诉讼,索赔金额高达790亿至1340亿美元,指控OpenAI违背非营利初衷并与微软深度合作 [1] - OpenAI公开内部邮件等证据反驳指控,文件显示马斯克在2017年曾推动公司转型为营利实体,并要求获得多数股权和完全控制权以支持其火星殖民计划 [1] - 特斯拉CEO马斯克宣布,公司AI5芯片设计已接近完成,AI6芯片处于研发初期,并计划未来持续推出AI7至AI9等后续版本,目标是将芯片设计周期缩短至9个月 [1] AI生成内容在出版行业的应用与监管 - 有出版物被读者发现使用存在面部模糊、肢体扭曲等特征的AI生成图片,但未进行显著标识,出版方归因于作者未说明及审核疏漏 [1] - 根据去年施行的《人工智能生成合成内容标识办法》,要求对AI生成内容进行显著标识,专家指出大规模使用未标识的AI内容可能构成对消费者的欺骗 [1] - 另一本奇幻绘本在版本馆登记中注明了使用AI辅助,但其商品页面却无相关提示,显示出标识规范执行的不一致 [1] 全球制造业智能化进展 - 世界经济论坛公布新一批全球灯塔工厂名单,全球23家企业入选,其中16家来自中国,占比显著 [1] - 江苏省表现突出,共有5家企业上榜,占比超过五分之一,包括佛吉亚盐城和悦达纺织等,其中这两家工厂分别是其所在行业全球首家灯塔工厂 [1] - 此次入选标志着盐城实现零的突破,并集中体现了江苏在制造业智能化数字化方面的领先优势与产业生态实力 [1] 科技与文化娱乐融合 - 2026年央视春晚完成首次彩排,主题为“骐骥驰骋 势不可挡”,将融合生肖马元素与AI、AR等前沿技术,营造沉浸式舞台效果 [1] - 晚会坚持“思想+艺术+技术”融合传播,并确认机器人将继蛇年春晚后再度登台献艺 [1] 商业航天发展挑战 - 2026年1月17日,中国航天发射遭遇两次失利,包括长征三号乙运载火箭发射实践三十二号卫星时三级飞行段出现异常,以及星河动力公司的谷神星二号民营商业火箭首次飞行试验失败 [1] - 两起事件具体原因均在排查中,凸显了航天产业的高风险特性,事件发生正值中国商业航天处于从技术验证迈向规模化运营的关键阶段 [1] 科技公司长期愿景与业绩 - 追觅科技CEO俞浩回应打造“百万亿美元公司生态”的争议,称此为未来二十年的奋斗目标,依据是企业市值每二十年提升一个数量级的规律 [1][2] - 公司披露其全球业务高速增长,2025年营收同比翻倍,其扫地机、洗地机等多品类在海外市场占有率领先 [2]