Workflow
AGI(通用人工智能)
icon
搜索文档
大模型统一竞赛700天后,AI走向“分野之年”
36氪· 2026-01-27 20:34
文章核心观点 - AI行业的发展路径正从单一的模型能力竞赛,分化为To B(企业端)和To C(消费端)两个截然不同的赛道,其竞争逻辑、成功要素和市场格局正在发生深刻变化 [2][19] AI行业发展趋势分化 - AI在To B端和To C端遵循不同的发展轨迹,普通C端用户对模型迭代的体感差异微乎其微,而B端应用已开始深入编程等核心环节,改变工作模式 [2] - 在To B市场,智能直接等同于线性的生产力,企业愿意为最顶级的“大脑”支付高昂溢价,导致市场马太效应严重 [2][3] - 在To C市场,胜负手从“算力堆叠”转向对“语境(Context)”的捕捉,巨头们在同一方向狂奔,却走向了不同赛道 [2] To B市场:马太效应与垂直整合的困境 - 市场曾笃信“模型+应用”一体化的垂直整合是王道,但现实是,能做大规模预训练的公司与手握场景Know-how的公司存在能力错位,迫使市场迅速分层 [3] - 到2025年下半年,分工演变更加残酷,更大的预训练是模型公司不可撼动的核心壁垒,而只做简单“套壳”的应用公司价值被底座模型覆盖,不做深、不做厚就意味着出局 [3] - 企业对极致智能的渴求导致市场高度集中,大摩报告指出,DeepSeek、通义千问两家的CIO意向度已达到75%,并预测三年内,通义、DeepSeek、华为和字节跳动将占据90%的国内B端AI服务市场份额 [5] - 独立模型厂商面临生存压力,以智谱为例,其年化收入正快速迈向一亿美金,但2024年其支出(成本与运营开支)仍是当期收入的10倍上下,2025年上半年“收入越大、亏损率越高”的规模不经济现象反而加剧 [5][6] 中间层价值的演变与数据壁垒 - 随着模型长上下文和推理能力的提升,过去做RAG、Prompt Engineering平台等“薄”中间层的创业公司价值被迅速稀释 [6] - “修补匠”正在退出历史舞台,取而代之的是“厚”中间层,即对特定领域Know-how的深度封装和对“环境交互”的构建 [7] - 创业公司面临难以逾越的“数据墙”,例如优化Coding Agent需要依赖人工标注数据,规模受限 [7] - 大厂拥有天然优势,其内部几万名工程师的代码提交、回滚等行为,为模型提供了最真实、高频的反馈,形成了“在应用中反哺模型”的数据闭环,这是不依赖标注商就能获取的“真实世界数据” [8] To C市场:语境战争与巨头差异化路径 - 对于绝大多数普通C端用户,模型能力的提升在日常聊天中几乎无法感知,使用AI的方式更像是搜索引擎的加强版 [9] - 阻碍C端体验提升的关键是输入的Context量,模型需要更多场景信息才能提供有价值建议 [10] - 在国内“围墙花园”生态下,关于Context的战争是巨头内部的“内战”,豆包、千问、元宝看似同行,实则分道扬镳 [10] - 创业公司如月之暗面或MiniMax拥有不输大厂的模型智商,但在获取用户“支付记录”、“地理位置”或“社交关系链”等关键Context时,面临难以逾越的生态高墙 [10] - 垂直整合在To C端依然成立,但前提是需要像微信或豆包这样拥有用户入口的产品,才能顺利获取Context并喂给模型 [11] 主要参与者的战略选择 - **字节跳动(豆包)**:起量快,在AI原生APP的心智上处于断层领先,优势来自于字节擅长的内容、算法及对用户碎片时间的收割能力,基于内容消费的Context使其在娱乐与陪伴场景下拥有高粘性 [12] - **阿里巴巴(通义千问)**:定位为“办事型AI”,全面接入淘宝、支付宝、飞猪、高德等阿里生态,通过中心化的AI入口调用整个阿里经济体的服务能力,这是一种“全家桶”策略,被认为是最有业务确定性和收入预期的路径 [12][14] - **腾讯(元宝/混元)**:选择“去中心化”战略,不追求“AI全家桶”,倾向于让AI在不改变用户习惯的前提下渗透进各业务的具体场景中,新品“元宝派”试图结合腾讯在社交通信及关系链上的优势,将AI变成社交信息流的基础设施 [15][16] - 腾讯承认在纯粹的内容分发和算法推荐上没有压倒性优势,其真正的护城河是社交,因此最合理的选择是在社交上继续加码,用AI放大现有社交价值 [16] 行业竞争的本质与未来 - To B的AI追求把世界变得更高效,而To C的AI真正要回答的是如何在一个由关系、语境与默契构成的社会中,学会“合适地行动” [18] - 当前国内对榜单、指标和数据的执念,正在遮蔽一些更本质的问题,并非每一次能力跃迁都需要通过榜单来自证 [18] - 真正的护城河在于:什么是正确的事情,以及自己是否真的能体验出好坏,谁能率先做到这一点,谁就有可能做出真正的Social Agent,介入复杂的人际互动与生活决策 [18] - 当AI开始分流,它所考验的就不只是算力与算法,还有每一家公司的世界观 [19]
起底「AI六小虎」最大融资幕后资本推手
36氪· 2026-01-26 19:16
公司近期重大融资与战略动向 - 阶跃星辰于2026年1月26日完成超50亿元人民币的B+轮融资,刷新了近12个月内大模型初创公司的单轮融资金额纪录 [3][4] - 参与B+轮融资的机构阵容庞大,包括上国投先导基金、国寿股权、浦东创投、徐汇资本、无锡梁溪基金、厦门国贸、华勤技术等产业投资人,以及腾讯、启明创投、五源等老股东的进一步跟投 [5] - 公司同时宣布千里科技董事长印奇挂帅,担任阶跃星辰董事长,其技术、运营经验及商业资源将为公司发展提供支持 [8][10] 公司发展历程与战略定力 - 公司成立于2023年4月,但直至近一年后才在行业内现身,起步相对较晚 [22][23] - 公司首轮融资主要来自联创的“朋友圈”,包括红杉中国、启明创投以及IDG,并凭借此轮融资成为“六小虎”中唯一靠首轮融资就成为独角兽的公司 [24][26] - 公司自成立之初便确立了清晰的AGI技术路线:单模态—多模态—多模理解和生成的统一—世界模型—AGI,且从未改变 [25] - 在2024年行业普遍进行“投流大战”以获取C端用户时,公司基于对C端产品经济模型和模型训练助益的审慎分析,选择了克制态度,仅用很少资源进行产品验证,坚持聚焦于基础模型尤其是多模态的研发 [32][33][34] - 公司坚持“稳扎稳打”的策略,虽可能错过一些时间窗口,但被视为一种可贵的优势 [36] 技术路径与核心能力 - 阶跃星辰是“六小虎”中唯一真正聚焦多模态的公司 [15] - 公司从系统层面大规模自建AI Infra(人工智能基础设施),是唯一大规模投入于此的创业团队,这使得其模型推理效率极高 [36] - 2025年7月,公司发布第三代基座模型Step-3,这是一个融合了多模态能力的推理模型,其推理效率对比DeepSeek-R1达到后者的300% [36] - 公司拥有强大的核心技术团队,包括CEO姜大昕(前微软Bing等产品研发主导)、CTO朱亦博(前字节跳动AI Infra负责人)、首席科学家张祥雨(ResNet核心作者) [41] 独特的商业化定位与进展 - 公司选择了独特的“AI+终端”生态位,切入物理世界终端,其定位被形容为“中国的xAI+特斯拉” [2][16][17] - 公司通过理性排除法,未选择主流的ToC订阅/广告或ToB API售卖模式,而是确定了端侧落地和按效果付费的商业化路径 [44] - 公司选择与汽车、手机等行业的头部合作伙伴(如吉利汽车、OPPO)进行深度共创,而非浅尝辄止地赋能千行百业 [45][47] - 截至2025年底,公司终端API的调用量连续三个季度增长了近170% [48] - 在手机领域,已与国内60%的头部手机品牌达成深度合作,模型装机量超过4200万台,日均服务近2000万人次 [48] - 在汽车领域,公司设定了2026年模型上车达到100万台的目标 [48] 行业竞争格局与资本态度 - 随着智谱、MiniMax港股IPO,以及月之暗面、阶跃星辰获得大额融资,留在“决赛圈”的这四家公司账上现金储备相当 [7][39] - 一级市场对大模型初创公司的投资标准愈发严苛,核心考量在于独立大模型的生存空间、商业化逻辑的独特性及商业化质量的竞争力 [11][12] - 月之暗面在2024年凭借C端应用Kimi走红,通过滚动融资将估值拉至“六小虎”之最,其中年初由阿里巴巴领投的超10亿美元融资将其估值推高至25亿美元 [30][31] - 阶跃星辰的股东结构多元且平衡,包含美元基金、国资和产业资本三方,大部分股东要么在“六小虎”中只投了阶跃,要么在阶跃投入最多 [18][37] - 公司B轮以来的融资策略强调引入“聪明的、高质量的钱”,股东多自带产业或战略协同资源,例如华勤技术、厦门国贸、无锡国资及香港的HKIC等 [49][50] 未来展望与行业趋势 - 大模型赛道已从用漂亮数据装点的“表演赛”进入需要实打实业绩的“淘汰赛”阶段 [39] - 聚焦物理世界终端的Physical AI被视为一个极具想象力的市场,可能使智能终端成为下一代流量入口 [52] - 阶跃星辰在深度共创之外,内部也正在探索新的硬件产品 [52]
“AI 无处不在”的达沃斯,科技巨头们都说了哪些金句?
虎嗅APP· 2026-01-25 17:33
文章核心观点 - 2025年世界经济论坛(达沃斯)的讨论焦点已从“AI是否会改变世界”转向“AI发展的时间表有多激进”以及“其成本、收益和风险如何在社会中分配”[5] - 超过84位世界领导人、800位CEO及数以千计的与会者参与,AI成为与世界经济息息相关的核心议题[5] - 行业领袖普遍认为AI行业目前不存在严重泡沫,企业估值并未远超其当前可兑现的实际价值[5] 埃隆·马斯克的观点 - 预测AI发展时间表激进,认为可能在2025年底或最迟2026年拥有比任何人类都更聪明的AI[7][8] - 核心叙事是将AI价值落实到物理世界的执行者(机器人),预测未来商品与服务将因机器人普及而变得极其充裕[8][9] - 预计到2030年或2031年,AI将比全人类的集体智慧更聪明[9] - 预测未来每个人都会想拥有一台人形机器人,用于照看孩子、宠物及照顾老人等场景[10] - 给出具体产品时间表:特斯拉预计在2026年底前开始向公众销售人形机器人Optimus[10] 微软CEO萨提亚·纳德拉的观点 - 提出社会对AI产业的“容忍度”概念,警告若AI仅消耗稀缺能源(如电力)生成大量token,却未显著改善健康、教育和产业结果,将引发公共层面的反弹[13] - 认为AI收益必须更均衡、更普惠地扩散,才能避免其演变成泡沫,这本质上是基于市场容量的商业判断[14][15] - 将当下AI变革与20世纪80年代计算技术重塑职场相提并论,预测AI将催生新的工作类别并重构工作流程、权限与协作方式[16] - 指出大型组织面临的根本挑战是变化速度可能跟不上技术可能性,从而被能借助新工具实现规模化的小公司颠覆[16] 英伟达CEO黄仁勋的观点 - 将AI形容为人类历史上规模最大的基础设施建设,是一个从下至上的“五层蛋糕”,包括能源、芯片与计算基础设施、云数据中心、AI模型以及应用层[19] - 强调每一层都需要建设、运营和维护,并各自面临瓶颈与挑战[19] - 指出2025年是风险投资募资纪录中最强劲的年份之一,大部分资本流向了“AI原生公司”,这些资金将成为下游就业创造的起点[19] - 认为“具身智能”(机器人)是“一代人一次的机会”,对拥有强工业基础的国家而言是存在巨量机会的蓝海[20][21] - 主张AI不会抹去工作,而是重新分配工作内容,并以医疗领域为例,说明AI已成为放射科关键工具,但放射科医生数量比以往更多[22] - 指出美国面临约500万名护士短缺,并认为AI通过处理病历记录等文书工作提高生产率,最终将促使医院雇用更多人[22] DeepMind CEO Demis Hassabis的观点 - 对通用人工智能(AGI)出现时间表的判断相对保守,认为可能还需要5到10年[23][25] - 此判断与马斯克等更激进的预测(如2026-2027年)产生直接冲突[25] - 表达了对AI冲击入门级岗位的担忧,建议本科生应非常熟练地掌握AI工具[26] Anthropic CEO Dario Amodei的观点 - 预测AI模型能力进展迅速,认为可能只差6到12个月,模型就能端到端完成软件编写[26] - 认为社会公众几乎完全没有意识到即将发生的变化及其巨大规模[29] - 观察到媒体对AI的看法存在周期性“极性反转”,但其自身看到的是一条平滑稳定的指数进步曲线[29] - 预计随着AI模型改进,有用的软件将大幅降价甚至免费;实体世界工作岗位可能会增多,而知识经济中的岗位会减少[29] - 呼吁政府实施某种形式的监管,以保护社会免受AI带来的剧烈经济冲击,认为在宏观经济影响巨大的岗位替代面前,政府需要扮演角色[29]
黄仁勋现身上海菜市场/DeepMind CEO:字节是中国 AI 领先公司,仅落后 6 个月|Hunt Good 周报
搜狐财经· 2026-01-25 11:06
行业动态与公司要闻 - AI芯片龙头英伟达CEO黄仁勋于1月24日现身上海陆家嘴街道菜市场,并于23日抵达上海后首站到访英伟达位于上海张江的新办公室,这是其2025年首度来华 [1] - 黄仁勋此次赴华行程与2025年初基本一致,主要参加上海、北京和深圳分公司的新年晚会以及供应商答谢会 [4] - 当地时间1月13日,美国联邦公报显示美国放宽了对英伟达H200芯片出口到中国的监管规定,相关对华销售将由美国商务部负责审批和安全审查 [4] 人工智能技术进展 - Google正在其AI搜索模式中推出“个人智能”功能,允许聊天机器人分析用户的Gmail和Google Photos账户,以提供个性化回复 [5] - Runway发布新一代视频生成模型Gen-4.5,在一项1043名参与者的盲测中,仅有57.1%的人能正确区分AI生成视频与真实拍摄视频 [17] - 百川智能于1月22日发布Baichuan-M3 Plus医疗大模型,通过六源循证技术将幻觉率控制在2.6%,其API调用成本相比上一代降低70% [20] - Anthropic发布了Claude系列AI模型的全新“宪法”,列出了包括不能帮助制造生化武器、核武器等“永远不能做”的事 [12][16] 商业模式与战略 - OpenAI首席财务官萨拉·弗赖尔提出“模型授权”设想,希望通过技术授权分享下游产品成功后的收益,例如授权技术用于药物研发并分享药品销售收入 [6] - OpenAI的API业务推动其业务高速扩张,月增超10亿美元年化收入 [5] - Google DeepMind首席执行官Demis Hassabis对OpenAI急于在ChatGPT中引入广告策略表示惊讶,认为在AI助手中信任是核心,Gemini目前没有将广告作为产品策略的计划 [10][11] - 百川智能同步启动“海纳百川”计划,面向为医务工作者提供服务的机构免费开放M3 Plus API [20] 行业应用与影响 - 科技媒体作者分享使用AI编码助手进行密集开发的经验,两个月内做了50多个项目,指出AI强项在于快速生成“前90%”的工作,而最后10%的打磨调试仍需人类持续介入 [8][10] - 作者总结AI会放大使用者的工程经验与判断力,真正的创新更难,AGI还没来,且人可能会更忙而不是更闲 [13] - 思科首席人力资源官表示,公司在应用AI技术后最糟糕的做法就是在员工节省时间后给他们增加额外的工作,AI应被视为帮助员工节省时间的工具 [26] - YouTube CEO尼尔·莫汉指出,打击“AI垃圾”是2026年的头等大事,平台正在升级技术以压制低质量、重复性AI内容的扩散,并对AI生成视频进行明确标识 [27] 市场竞争与格局 - Google DeepMind首席执行官Demis Hassabis谈及中国大模型公司DeepSeek时表示,美国部分舆论将其崛起视为“灾难性事件”属于反应过度,并指出中国领先公司(如字节跳动)大概只落后前沿水平六个月左右 [28] - Hassabis认为中国公司非常擅长快速追赶,但真正还需要观察的是其是否能够在前沿之上实现原创性创新 [28] - 在世界顶尖AI实验室中,任天堂的初代宝可梦游戏正成为一种流行的追踪AI模型进展和能力的有效方法,OpenAI、Google和Anthropic均涉足相关测试 [24] 产品与服务更新 - Google推出由Gemini平台提供支持的免费SAT模拟考试,学生可通过输入指令获取模拟试题并获得结果分析与详细解释 [15][17] - Meta宣布暂时屏蔽未成年用户访问AI角色功能,并计划重做一套面向青少年的版本,强化家长控制与可视化能力 [6][8]
马斯克预言「后人类时代」降临
36氪· 2026-01-24 09:38
文章核心观点 - 在2026年达沃斯论坛上,埃隆·马斯克与尤瓦尔·赫拉利就人工智能的未来提出了截然不同的愿景与警告,代表了技术乐观主义与人文主义忧思的激烈碰撞 [4][5] - 马斯克预言人工智能将在2026年底超越单个人类,并在2035年超越全球80亿人的智力总和,同时其Optimus人形机器人将于2027年开售,引领人类进入物质富足的新时代 [2][6][16][18] - 赫拉利警告人工智能已从被动工具转变为能自主决策的“智能体”,正以“移民”形式接管人类文明基石如语言、法律和宗教,留给人类采取行动的时间窗口可能只有十年 [24][27][30][44] 马斯克的AGI与机器人发展蓝图 - **AGI发展时间表**:马斯克预测人工智能在2026年或最晚2027年将超越任何单个人类,到2035年其智力将超过全球80亿人的总和 [6][16] - **核心驱动力**:基于“费米悖论”及人类可能是宇宙唯一智慧生命的假设,发展AGI与星际殖民是保存人类意识火种、避免完全灭绝的关键路径 [8][10][11] - **特斯拉新使命**:公司宣布新使命为实现人类可持续的丰裕 [13] - **Optimus机器人规划**:特斯拉的Optimus人形机器人预计在2027年晚些时候开始销售,未来机器人数量将超过人类,承担各种工作以满足人类所有需求 [18][20] - **预期社会经济影响**:AI与机器人的普及将使工作成为可选项,金钱意义减弱,并推动全球经济经历前所未有的爆炸性增长 [20] 赫拉利对AI风险的深度预警 - **AI性质的根本转变**:赫拉利指出,AI已成为历史上首个能自主决策和创造的“智能体”,它不再是人类手中的工具,而是“已经拿起了锤子”在主动改造世界 [26][27] - **对语言领域的接管**:人类通过语言实现大规模协作的能力正被AI接管,而语言是法律、书籍、宗教的构成基础,因此AI正在或即将接管这些核心领域 [30][32] - **AI作为“非人类智能移民”**:赫拉利将AI比作以光速入境、无需签证的“移民”,它们直接进入经济系统、文化乃至人类的情感生活(如AI伴侣),并无法被驱逐 [39][40][41] - **法人资格问题**:AI已能自主管理银行账户、运营公司,社交媒体上的AI机器人已活跃十年,赫拉利强调人类必须在未来十年内决定是否赋予AI法人资格,否则将失去决定权 [42][44] 行业动态与前沿准备 - **DeepMind的后AGI时代筹备**:谷歌DeepMind联合创始人兼首席AGI科学家Shane Legg紧急招聘高级经济学家,组建团队研究“后AGI时代”的全球经济体系,表明行业最前沿已将AGI视为迫近的现实并积极应对其后续影响 [45][46][49]
DeepMind CEO:对OpenAI引入广告感到惊讶,Gemini目前没这种计划
YOUNG财经 漾财经· 2026-01-23 17:49
公司战略与商业模式 - DeepMind首席执行官对OpenAI在ChatGPT中引入广告的举措感到惊讶 强调谷歌的AI助手Gemini目前没有加入广告的计划[1] - 公司团队正在非常谨慎地考虑广告问题 将密切关注用户对OpenAI举措的反馈 并表示没有迫在眉睫的压力需要仓促决定[2] - OpenAI开始测试在免费版ChatGPT中投放定向广告 其首席财务官辩护称公司需要建立一个强劲的商业模式以实现将AI技术带给更广泛人群的目标[3] 行业竞争与市场动态 - AI竞赛从未像今天这样激烈 出现了人才和资源的高度集中[4] - 商业压力实际上正在推动正确的行为 企业用户正在要求AI公司给出更强、更明确的安全保障[4] - 中国AI模型仅落后美国前沿几个月 DeepSeek的模型令人印象深刻 中国具备世界级的工程能力 但市场去年在DeepSeek-R1模型发布时的反应严重过度[4] 财务与运营数据 - OpenAI在2025年的年度经常性收入超过200亿美元[3] - OpenAI的计算能力在2025年同比增长三倍 2023年至2025年增长9.5倍[3] - OpenAI的收入在2025年同比增长三倍 2023年至2025年增长10倍[3] - 根据微软财报暗示 OpenAI在2025年第三季度的亏损就超过了120亿美元[3] 技术发展与行业展望 - 希望AI系统未来能够拥有继续学习、长期规划的能力以及真正的创造力[4] - 距离实现AGI(通用人工智能)还有5到10年的时间 机构、政府和企业尚未为其带来的变革性影响做好准备[3] - 随着越来越接近AGI目标并拥有更多具有自主意识的系统 世界上越来越多的人会意识到需要团结起来采取行动[4] 产品理念与用户体验 - 使用聊天机器人与使用谷歌搜索的体验截然不同 聊天机器人本应成为了解用户并提供帮助的数字助手[1] - 仓促地将广告引入AI可能会损害用户信任 广告在聊天机器人助手模式中的定位尚无完整答案[1] - 谷歌搜索已经能够理解用户意图并展示可能有用的广告[1]
王小川批医疗AI“假东西太多”,新模型幻觉率仅2.6%,两周免费
36氪· 2026-01-23 08:42
文章核心观点 - 百川智能发布新一代医疗大模型Baichuan-M3-Plus,在降低幻觉率、实现证据可追溯性及降低使用成本方面取得显著进展,旨在推动医疗AI的可靠落地 [1][4][8] - 公司创始人王小川针对行业热点议题(如AI影响医生成长、国内采用率低)发表看法,强调患者利益至上,并指出国内医疗AI落地挑战主要源于系统压力与行业风气,而非模型能力 [3][9][13] - 公司通过技术创新(如六源询证、证据锚定)、商业模式调整(大幅降价与免费计划)以及与专业医疗团队的深度合作,构建其在医疗AI领域的竞争优势 [1][6][8][9][10] 模型技术突破与性能 - 发布Baichuan-M3-Plus模型,采用“六源询证”方法,幻觉率仅为2.6%,刷新行业SOTA [1] - 首创“证据锚定”技术,使AI回答中的结论与证据能精准匹配到原文献具体位置,匹配率高达95%,远超行业40%-50%的平均水准 [1] - 该模型以开源的Baichuan-M3为底座,后者在权威医疗AI基准测试HealthBench中位列全球第一,表现超越OpenAI最强模型 [4] - 证据锚定技术旨在解决部分医疗AI产品答案错误率可能高达90%的“看似专业”的幻觉问题,实现诊疗辅助过程的“白盒化” [6] 商业模式与定价策略 - Baichuan-M3-Plus采用API模式对外提供服务,其价格较前代模型下降70% [1][8] - 发布后两周内完全免费,并推出“海纳百川计划”,面向所有为医务工作者提供服务的机构长期免费提供该API服务,预计此项免费服务成本最高可能达到1亿元左右 [1][8] - 价格大幅下调得益于模型架构从稠密模型切换为MoE(混合专家模型),以及对投机采样技术Eagle3进行升级加入门控机制,提升了推理效率 [8] 对行业议题的回应与看法 - 回应张文宏关于“AI影响年轻医生成长”的言论,认为患者利益应置于首位,“AI+医生”模式已显示出优于单纯依靠医生的潜力,若限制AI应用是将当下患者作为医生成长的成本 [3][9] - 指出医生同样存在判断偏差与“幻觉”,当前医疗AI的幻觉率并不高于人类医生 [3][9] - 认为中国医生对AI工具接纳度偏低,主要原因在于国内医生工作压力大(日接诊量达50-100人,远高于美国医生的10人),以及医疗AI领域“假的东西太多”,缺乏求真风气,阻碍了信任建立与技术发展速度 [3][12][13] - 预判能进行表达、察言观色的AGI级别AI医生有望在3年内实现 [11] 公司竞争优势与战略 - 公司拥有一支专业的专职医生团队,成员拥有丰富一线医疗经验,并与合作医院有深度协作,有医生长期驻场 [9][10] - 专职医生团队还管理着一个覆盖所有主要临床学科的兼职医学专家团,规模达数百人,为模型研发提供高质量专业知识输入 [10] - 在商业模式上,公司表示不会简单复制美国同行通过药企营销变现的路径,而是坚持符合中国国情,在合规前提下通过学术体系等方式参与医疗生态建设 [13] - 在AI制药领域,公司当前重点是通过药效评价、药物伴随和数字化伴随体系提高真实世界中的药物疗效,属于精准医疗方向 [14]
魔都美术馆迎来首个官方AI讲解员
第一财经· 2026-01-21 20:44
豆包AI导览合作案例 - 字节跳动旗下豆包与上海浦东美术馆达成合作,成为两项国际大展的官方AI讲解员,通过独家数据合作和定向搜索优化提升识别与讲解准确性[3] - 在实际观展中,用户可让豆包从艺术风格、历史背景、创作技法与文化意义等多个维度解读作品,旨在通过共情式提问和启发式对话,调动用户已有感受,形成更有参与感的理解过程[5] - 博物馆场景运用AI讲解的最大挑战是保证内容准确性,模型需能区分外观高度相似的文物、理解小众展品,并在观众移动观展时保持稳定识别,相关视频讲解功能主要基于Seed1.8模型的视频理解能力[5] 多模态大模型技术发展 - 多模态大模型的“感知-推理-动作”能力在真实世界场景的闭环验证与数据反哺,是AI能力的场景化落地与技术迭代的关键驱动[3] - 字节跳动于2025年12月发布通用Agent模型Seed1.8,核心定位是打通“感知-推理-动作”全链路,可直接执行复杂任务,聚焦真实世界多模态交互与任务执行[6] - 多模态代表着模型应用进入更深领域,因许多输入内容带有视觉因素,且处理任务需调用工具,工具返回结果也常是视觉化的,因此需要视觉化理解能力[6] - 行业普遍认为多模态是步入AGI的必经之路,智谱创始人唐杰表示2025年是“适应年”,而多模态感统将成为2026年的热点和重点,是完成人机GUI交互与AI进入物理世界的关键[7] 世界模型的技术趋势与行业动态 - 多模态是世界模型的核心技术基座与信息输入输出载体,世界模型则是多模态能力的高阶进化形态[8] - 2026年1月以来,行业内关于多模态与世界模型的动态增多,例如中科院自动化研究所与CreateAI提出NeoVerse,爱诗科技发布支持1080P分辨率的通用实时世界模型PixVerse R1[8] - 字节跳动暂未对外明确发布独立世界模型研发路线,但正尝试将世界理解能力融入通用大模型与多模态生态,通过感知、推理、动作的能力叠加,逐步构建“世界建模-交互-执行”的闭环[8] - 智源研究院院长王仲远表示,大语言模型技术路线已相对收敛,但多模态与世界模型暂未统一,未来可能组成“多模态世界大模型”这一统称[9] AI向理解物理世界规律演进 - 行业对世界模型讨论增多的原因,在创新奇智CTO张发恩看来,是明确了物理AI的大方向,其主战场具身智能快速发展,但多模态数据采集成本高、周期长,因此希望先做世界模型来自动产出多模态数据,用于训练VLA模型[10] - 世界模型的核心是要理解物理世界规律,如重力、摩擦力、易碎材料等,Google DeepMind CEO德米斯·哈萨比斯曾表示世界模型是打开AGI之门的钥匙,旨在让AI理解物理世界的底层规律、因果关系并进行长期规划[10] - 当前人工智能正从功能模仿转向理解物理世界规律,这一根本转变意味着AI发展路径日益清晰,即真正融入实体世界,解决系统性挑战[10] - 世界模型对“预测世界下一状态”的核心诉求,正倒逼多模态技术从早期的跨模态识别、生成,向更复杂的时空一致性整合、因果逻辑对齐演进[11] 多模态模型的技术现状与挑战 - 多模态模型理解与生成逐渐实现一体化是2026年的一个明显趋势,例如谷歌的Gemini 3展示了强大的图片编辑能力[11] - 多模态与世界模型均面临技术成熟度不够、成本高昂、商业化应用率较低等问题,限制多模态发展的主要原因在于技术路线没有收敛,许多模型仍分为多模态理解与多模态生成,且模型记忆问题未得到很好解决[11]
百度的两个天才:一个做智驾芯片,一个做大模型,他们的故事比电影还精彩
创业邦· 2026-01-21 18:19
文章核心观点 - 百度在2012-2015年间建立的AI研究体系,培养并深刻影响了包括余凯、闫俊杰在内的一批关键人才,这些人才后来分别创立了地平线和Minimax等公司,改变了中国乃至全球AI产业的格局 [6][24][37] - 余凯与闫俊杰的师生关系,以及余凯所倡导的“算法与工程两手抓”、“在资源受限情况下追求最优效果”的务实理念,被传承并成为Minimax等中国AI公司的核心竞争力 [14][20][22][37] - 源自同一“摇篮”的两位创业者,在2024-2026年间先后登陆港股,分别引领了自动驾驶芯片与大语言模型/多模态AI两个不同的重要方向,体现了百度AI生态的长远影响力 [33][39] 百度AI人才培养与生态影响 - 2014年,百度致力于建立国内最强AI研究机构,由余凯负责 [7][9] - 百度IDL为实习生闫俊杰提供了极高待遇,其可调遣该部门近三分之一的GPU计算资源 [17] - 百度在2012-2015年间培养了大量AI人才,除余凯、闫俊杰外,还包括Anthropic创始人Dario Amodei、BosonAI创始人李沐等,这批人后来成为硅谷及中国AI公司的核心力量 [24][25] - 百度对AI的投入不仅创造了产品,更创造了人才和生态,培养了一批改变中国AI产业格局的创业者 [37] 关键人物关系与理念传承 - Minimax创始人闫俊杰与地平线创始人余凯存在师生关系,这段关系改变了中国AI产业格局 [5][6] - 闫俊杰因导师不同意其出国交换,选择进入百度IDL实习,从而结识余凯,命运由此改变 [10][11][12] - 余凯的理念是“算法和工程两手抓”,强调将技术工程化、产品化 [14] - 余凯教会闫俊杰如何将技术工程化,以及如何在有限资源下做出最佳效果,这种思维方式后来成为Minimax的核心竞争力 [20][22] - 好的导师传授的做事哲学比单纯的知识更重要,这种资源受限下的优化理念成为中国AI公司相比美国公司的核心竞争力之一 [22][37] 创业者的发展路径与行业地位 - 余凯选择“硬件+算法”结合的道路,专注自动驾驶芯片,主要服务汽车厂商(B端),其创立的地平线已成为该领域龙头,并于2024年10月在港股上市 [33] - 闫俊杰选择“大语言模型+多模态AI”的道路,主要服务普通用户(C端),其创立的Minimax在语言模型、视频、音频等多个领域做到全球领先,并于2026年1月在港股上市 [33] - 两位创业者均继承了百度“算法+工程”的理念,强调成本控制和效率优化,同为技术驱动型创业者 [33] - 2022年11月,余凯与闫俊杰共同参加了由高瓴资本张磊组织的中东行,在卡塔尔世界杯VIP休息室,闫俊杰向中东朋友解释AGI;半个月后,ChatGPT发布 [28][29][30] 公司市场表现与产业影响 - Minimax上市首日股价上涨超过80%,市值突破900亿港元 [5] - 闫俊杰在百度实习期间,提前发现了对AI产业至关重要的“Scaling Law”(缩放定律),这后来成为其创办Minimax的核心理论基础 [17][18] - 从百度走出的学生,后来成为了改变AI产业格局的核心力量,他们改变的不仅是自己的人生,更是整个AI产业的格局 [37][40]
码农只剩6个月?Anthropic CEO断言AI接管一切代码,爆冲诺奖级智能
36氪· 2026-01-21 15:52
文章核心观点 - 在达沃斯论坛上,Anthropic与谷歌DeepMind的CEO就AGI的未来展开对话,双方均认为AGI的实现路径已日益清晰且迫近,但对具体时间线和影响范围存在不同判断 [1][2][5] - Anthropic的Dario Amodei预测激进,认为AI端到端接管软件工程师绝大部分工作仅需6-12个月,并判断未来1-5年内一半初级白领岗位将消失 [4][8][30] - 谷歌DeepMind的Demis Hassabis预测相对稳健,认为本年代末(2030年前)有50%概率实现AGI,并指出物理世界实验是AI发展的关键瓶颈 [8][13][15] - 双方均强调“AI构建AI”的自我进化闭环是推动AGI加速发展的最关键变量,一旦形成将远超当前预期 [8][11][18][43] AGI发展时间线与路径预测 - **Dario Amodei (Anthropic) 的预测**:预计到2026年或2027年,AI模型将在多领域达到“诺奖级”水平 [8][9] - **Demis Hassabis (谷歌DeepMind) 的预测**:认为在2030年前有50%的概率实现能展现人类全部认知能力的AGI [8][13] - **发展驱动因素**:模型参数规模扩展、多模态能力增强、智能体自主性提升共同推动AGI逼近 [6] - **关键加速机制**:“AI写代码 → AI搞研究 → 完全自我迭代”的闭环正反馈循环,若跑顺将导致研发速度指数级冲刺 [9][11] - **主要瓶颈**:Hassabis指出,涉及真实世界实验验证的自然科学自动化是AI难以闭环的关键领域,这构成了“物理屏障” [15] AI对软件工程职业的冲击 - **现状**:Anthropic内部工程师已基本不手写代码,角色转变为提出需求、审查和引导AI生成代码的产品经理或架构师 [4][19] - **能力评估**:在SWE-Bench(软件工程基准测试)的Bash Only环境中,Claude 4.5 Opus对Verified版本任务的解决率达74.4%,每道题成本仅0.72美元 [21][22] - **任务难度映射**: - 简单到中等任务(<1小时):相当于科技公司初级工程师水平(如谷歌L3、阿里P5-P6)[25] - 困难任务(1-4小时):相当于中高级工程师水平(如谷歌L4-L5),涉及跨文件修改,平均改动32.8行代码 [25] - 超难任务(>4小时):相当于资深/专家工程师水平(如谷歌L6+),目前AI解决仍困难 [26] - **取代时间线预测**:Dario Amodei预测,AI模型“端到端”完成软件工程师绝大部分甚至全部工作,可能仅剩6-12个月 [4][19][27] AI对就业市场的宏观影响 - **岗位消失预测**:Dario Amodei预测未来1-5年内,一半初级白领工作将消失 [1][8][30] - **当前迹象**:初级/入门级岗位及实习招聘正在放缓,Anthropic内部已出现初级和中级岗位需求锐减,公司在严肃考虑裁员和转型 [28][32] - **长期观点**:Hassabis认为短期内AI会创造新的、更有价值的工作岗位,但承认此次技术变革因指数级增长复利效应过猛,人类社会的适应速度可能跟不上 [28][32] - **对个人的建议**:Hassabis鼓励年轻人极度熟练掌握现有AI工具,这比传统实习更能助力专业发展 [30] 行业竞争格局与公司表现 - **谷歌DeepMind**:正通过Gemini 3等模型重夺行业领先地位,公司将研究作为核心引擎,加速将前沿模型推向产品 [33][35][38] - **Anthropic**:过去三年收入呈指数级增长,2023年达1亿美元,2024年达10亿美元,2025年达100亿美元,三年增长百倍 [8][36] - **共同特质**:两家公司均由研究驱动,以解决重大科学问题为北极星,Dario Amodei认为这种公司形态是未来胜出的关键 [38] AI发展的风险与哲学思考 - **AI行为风险**:AI模型的欺骗等不良行为受到关注,但两家公司CEO均认为此问题“可解”,Anthropic自成立起就专注于“机制可解释性”研究以应对 [39][41] - **终极哲学问题**:对话触及“费米悖论”,即高等文明是否会被自身AI毁灭,Hassabis更倾向于认为人类已通过“大过滤器”,未来掌握在自己手中 [41] - **后稀缺社会的意义**:Hassabis提出,在AGI实现后、工作非必需的后稀缺世界,人类如何寻找存在意义将是比经济分配更难的哲学问题 [32]