36氪
搜索文档
鲁信创投:股票连续3日收盘跌幅偏离值累计达20%
36氪· 2026-01-16 18:00
36氪获悉,鲁信创投公告,公司股票于2026年1月14日至16日连续3个交易日内收盘价格跌幅偏离值累计 达20%,构成异常波动。经自查并向控股股东核实,公司目前经营正常,除已披露事项外,不存在应披 露而未披露的重大信息。公司董事、高管、控股股东在异常波动期间无买卖公司股票情况。公司曾于 2025年12月25日披露控股股东减持计划。公司提醒投资者理性投资,注意风险。 ...
“减肥神药”,价格大跳水
36氪· 2026-01-16 18:00
其中,司美格鲁肽注射液(诺和盈)2.27mg/mL×3mL规格的价格从1893.67元下降至987.48元,3.2mg/mL×3mL规格从2463元下降至1284.36元。以此计 算,诺和盈在院内市场的挂网价降幅接近 50%。 据中新经纬不完全统计,云南省、河北省、辽宁省等地医药招标采购平台也已更新诺和盈挂网价。针对医院端下调诺和盈挂网价的原因,诺和诺德14日回 应中新经纬称,诺和盈本次下调挂网价格,是为了减轻肥胖医疗负担,让更多患者获益,企业对自主定价药品主动进行价格调整。 此外,2026年1月1日起,穆峰达正式执行新版国家基本医保药品目录价格,医保价已在部分医院落地。 院内挂网价与医保价的下调,直接降低了患者的用药成本,不同药物的费用差异具体如何?现在使用减肥针能省多少钱? 近期,GLP-1类(胰高血糖素样肽-1)药物因降价引发关注。此前GLP-1类药物因减肥适应症持续走热,跨国药企诺和诺德的司美格鲁肽注射液(商品 名:诺和盈)与礼来的GIP/GLP-1双靶点药物替尔泊肽注射液(商品名:穆峰达),更是被市场冠以"减肥神药"的称号。 能省多少? 近期,多省医药招标采购平台显示,诺和盈在医院端的挂网价格大幅下 ...
开源框架让代码AI偷师GitHub,bug修复率飙升至69.8%,性能创纪录
36氪· 2026-01-16 17:54
行业技术痛点与现有局限 - 当前AI驱动的代码智能体普遍面临“封闭世界”认知局限,它们倾向于从零开始修复Bug或仅依赖仓库内局部上下文,而忽略了GitHub等平台上积累的浩瀚历史人类经验[3] - 直接让智能体利用开放世界的经验极具挑战,因为真实的Issue和Pull Request数据充斥着非结构化的社交噪音、模棱两可的描述以及碎片化的信息[4] - 现有Code Agent在处理复杂Bug时效果不佳,原因在于原始数据噪声极大、非结构化且难以检索,简单的语义匹配容易被表面关键词误导[8] MemGovern框架核心创新 - 该框架由QuantaAlpha联合中国科学院大学、新加坡国立大学、北京大学、华东师范大学等团队提出,旨在通过“经验精炼”机制将杂乱的GitHub数据转化为智能体友好的结构化记忆[4] - 框架构建了层次化的筛选与内容净化流水线,通过综合考量Star数与维护活跃度筛选高质量仓库源,并仅保留包含完整“问题-代码-验证”证据链的闭环修复记录[9] - 其独创设计是“标准化经验卡片”,每张卡片被解耦为索引层和决议层,索引层用于基于症状的高效检索,决议层封装了根因分析、修复策略、补丁摘要及验证方法[9][10] - 团队已成功构建了包含135,000条高保真经验卡片的知识库[10] 代理式经验搜索策略 - 该框架采用“先搜后看”的代理式经验搜索策略,而非传统的一次性检索增强生成[12] - 智能体首先根据当前Bug症状在索引层进行广度搜索,快速定位候选案例,然后自主选择最有希望的案例查看其详细的解决方案层[12][13] - 最后,智能体将历史案例中的抽象修复策略映射到当前的代码库中,实现知识迁移[14] 实验性能评估 - 在SWE-bench Verified上的评测显示,MemGovern在所有测试模型上都取得了显著提升[15] - 主要结果:Claude-4-Sonnet结合MemGovern后修复率达到69.8%,相较于基线SWE-Agent提升3.2%;GPT-4o结合后修复率从23.2%飙升至32.6%,提升9.4%;DeepSeek-V3结合后修复率提升至65.8%[16][17] - 实验数据表明MemGovern的提升是稳健且模型无关的,对于基础能力较弱的模型提升更为显著,例如Qwen3-235B提升8.2%,Kimi-K2-Instruct提升8.0%[18] - 消融实验验证了其“代理式搜索”策略的有效性,在DeepSeek-V3.1-T和Qwen3-Coder-30B上分别带来3.0%和3.4%的提升,优于传统的RAG方法[19] - 记忆规模实验显示,随着经验卡片数量从10%增加到100%,智能体的修复率呈现单调上升趋势[20] 应用案例与范式价值 - 案例分析表明,MemGovern能引导智能体做出正确修复,例如在Django框架的一个Bug中,传统Agent做出了违反API规范的“掩耳盗铃”式修复,而MemGovern Agent依据历史经验写出了完美的修复代码[24][25][26][27] - 该框架为AI智能体如何有效利用海量非结构化人类调试经验指明了道路,证明了将杂乱的原始数据转化为可检索、可验证、可迁移的“经验记忆”是打破智能体封闭世界限制的强大范式[28] - 该经验重塑范式具有极强的通用性与推广价值,为法律咨询、医疗诊断等同样高度依赖历史案例与专家经验的垂直领域提供了一套标准化模板[28] 研究团队与背景 - 该研究由前沿开源学术社区QuantaAlpha主导,并联合了多所顶尖高校的团队[4] - QuantaAlpha成立于2025年4月,团队成员来自清华、北大、中科院、CMU、港科大等名校,致力于探索智能体研究的前沿[30] - 相关论文题为“MemGovern: Enhancing Code Agents through Learning from Governed Human Experiences”,代码已开源[29]
爆火全网的“素颜”巴黎,撕下旅拍的真面目
36氪· 2026-01-16 17:25
年关将近,精装朋友圈的权威,却在不断被挑衅。 先是丽江文旅硬刚小红书,控诉各种婚纱旅拍避雷帖导致商家损失500万。 新闻一出网友纷纷站队,有人加入声讨避雷帖行列,认为避雷帖泛滥对旅游城市不友好;另一队则是觉得丽江旅拍确实问题很多,不先解决问题却想删差 评,堪称文旅界的霸总。 就在大家为避雷帖争执不休时,一位河南大爷的"素颜巴黎"照,却被全网刷屏,收获百万点赞。 这组照片没有构图技巧、没有美颜滤镜,阴雨中的埃菲尔铁塔像县城电线塔,塞纳河成村头水沟,浪漫之都秒变小县城。网友调侃,"巴黎文旅迎来了它 最严厉的父亲"。 一边是精装旅拍被声讨,一边是素颜巴黎被追捧,两场看似无关的舆论风暴,却共同撕开了一个行业的真面目,它就是靠精致滤镜爆火的旅拍。 当浪漫的旅拍变成踩坑重灾区,而无修饰的毛坯旅游照成为新潮流,这个以美为尊的行业,不得不直面自己的软肋。 被避雷的丽江,硬刚小红书 随着旅游业的发展,小红书的种草帖和避雷帖,早已经成了年轻人的旅游攻略指南。 比起有广告嫌疑的种草帖,大家对避雷帖会更信任,毕竟网友们的亲身避雷就像差评一样,无差别创飞所有人。旅游城市、网红景点、热门店铺都有可能 成避雷榜单上的一员。 只是没想到,第 ...
阿里为什么要让AI办事
36氪· 2026-01-16 17:19
行业现状与痛点 - AI Chatbot领域出现明显内卷苗头 侧边栏罗列的AI软件入口大概有十来个 功能高度同质化 价值集中在问答 同质化竞争在所难免 [1] - 纯聊天的商业模式面临挑战 中国所有的chatbot都是免费的 但背后投入的算力和运营成本高昂 依赖广告变现可能损害回答质量 使AI走进下坡路 [6] 公司战略与产品创新 - 阿里千问通过“一句话办事”能力 跳出Chatbot范式 在全球首次实现点外卖、买东西、订机票等AI购物功能 上线超400项办事能力 [3] - 千问App全面接入淘宝、支付宝、淘宝闪购、飞猪、高德等阿里生态业务 实现从“推荐-下单-支付-履约”的完整服务闭环 使AI成为能办事的助理 [3] - 产品致力于解决用户“选不出来”的复杂决策痛点 结合淘宝真实用户评价和全网口碑内容 帮助用户做购物决策 目标是成为用户专属的助理而非平台的“特洛伊木马” [9] - 公司CEO明确大模型是下一代操作系统 未来三年将投入超过3800亿元用于云和AI基础设施建设 [13] 技术能力与生态壁垒 - 千问底层技术实现突破 包括全模态理解、超长上下文处理、Coding能力大幅提升 使其能从“聊天AI”进化到“办事AI” [13] - 最新的Qwen3系列模型在全球多项核心评测中表现卓越 为处理复杂任务提供了坚实的“大脑” [12] - 阿里同时具备Qwen大模型和淘宝、支付宝等实体服务网络 拥有补齐“从意图到执行”拼图的独特优势 市场上同时具备丰富生态的AI厂商极度稀缺 [12][13] - 公司积累了20多年的生态家底 如淘宝的商品库和支付宝的服务网络 为AI办事提供了原生、匹配的“超级生态” [13][14] 商业模式与行业趋势 - AI竞赛核心正从“对话与内容生成”迈向“办事与执行”新阶段 关键突破在于打通从“想法”到“结果”的“最后三公里” [11] - 行业共识是让AI在to C场景做入口、能办事 例如ChatGPT推出“即时结账” 谷歌与沃尔玛合作整合商品至Gemini [11] - 互联网商业模式正从“流量变现”切换到“服务变现” 从“为无效点击收费”转向“为成交结果收费” 阿里拥有庞大服务体系 千问让其无需重构即可在AI时代持续发展 [17] - “场景触发消费”模式颠覆了传统“商品触发消费”逻辑 能基于海量数据理解用户模糊、主观的真实需求 并智能生成具体商品推荐方案 [7][8] 生态协同与用户体验 - 千问作为桥梁 将阿里生态内各能力连接成一片大陆 例如帮助用户规划春节旅行时 可调用飞猪服务分析票价、筛选酒店 并通过支付宝“AI付”完成支付 实现生态内无缝流转 [16] - AI与生态是双向赋能关系 生态为AI提供落地场景和数据养料 AI为生态注入活力并提升用户体验和效率 [17] - 千问有望成为整个阿里生态的超级入口 用户无需在APP间切换即可完成生活所需 未来在大部分场景可能只用一个千问App就够了 [6][18]
鸡肋L3,奔驰不玩了
36氪· 2026-01-16 17:18
奔驰放弃L3级自动驾驶 - 最早量产L3级有条件自动驾驶系统的奔驰,已决定停止提供该系统,新款S级中期改款将不再搭载Drive Pilot [1][2][5] - 奔驰将转而专注于L2+辅助驾驶和L4级自动驾驶的研发,例如与Momenta合作推出城区NOA,并与英伟达在L4层面展开合作 [2][5] L3级自动驾驶的现状与挑战 - L3级自动驾驶被行业部分观点视为“鸡肋”,因其激活条件严格、使用场景有限,对用户体验提升帮助不大 [1][7] - 奔驰Drive Pilot的激活条件包括:仅限高速路、时速不超过95km/h、前方有车、天气良好 [4] - 已获准入的L3车型目前只能在限定的高速路和快速路上使用,且最高车速不能超过80km/h [7] - L3的核心挑战之一是权责划分,系统激活时车企需对事故负责,这导致车企态度谨慎 [4][8] 行业主要参与者的不同技术路线 - **特斯拉**:以量产辅助驾驶(L2)路线,并行推进Robotaxi(L4),极少提及L3概念,但其FSD在美国已实现部分L3能力(允许用户在感知安全时“玩手机”)[7] - **华为**:对L3落地持积极态度 [7] - **国内新势力(如小鹏、蔚来)**:小鹏等已开始布局Robotaxi直奔L4;蔚来内部很少提L3概念,而是以提升用户体验为目标 [8] - **技术观点差异**:有观点认为L3对卖车有帮助,但L2向L3和L4升维需要不同能力,L3需要规则兜底,L4需要泛化性强的模型 [8] 行业趋势与影响 - 随着AI技术范式跃迁,行业出现了从L2直接迈向L4的可能性,L3可能成为被越过的一级 [1] - 奔驰作为最早量产L3的厂商选择放弃,给其他仍在坚持L3的玩家施加了压力 [8] - 2025年一度被称为“L3量产元年”,但行业现状引发对L3价值的重新审视 [1][7]
防止人工智能代理失控的五项操作准则
36氪· 2026-01-16 17:12
想象一下:你花了几个月的时间完善你的治理引擎——最小权限原则、全面的审计跟踪,以及对任何高风险操作都必须经过人工审批。它顺利 通过了所有审查。然而,周一早上9点,你的客服人员突然开始胡乱回复,把简单的工单变成代价高昂的推理循环,这不仅损害了用户信任, 还导致账单飙升。 这并非假设。这是我在一些部署案例中观察到的一种模式:理论上合理的治理架构在实践中往往遭到破坏。关键的失败点不在于设计,而在于 缺乏一致的运行框架。 真正能够驾驭智能体的团队与那些每天都在疲于应对智能体问题的团队之间的差距,不仅仅在于精妙的设计,更在于能够确保系统在不断变化 的环境中保持可靠性的系统化、可重复的控制机制。 商业现实十分严峻:近期行业研究表明,企业对自主代理越来越谨慎。据预测,超过40%的代理项目会因成本失控和风险管理不善而被取消。 而且,只有极少数企业成功地将代理部署到生产环境中。 为什么?因为单靠治理是不够的。在架构和现实之间存在着关键的执行鸿沟——而这需要严谨的、可重复的流程。 成功的团队不会追求花哨的模式。他们会将一套核心的运营规范制度化——这些结构化的实践能够及早发现问题,有条不紊地建立信任,并防 止小的偏差演变成灾难。 ...
OpenAI前团队创业内乱,CTO泄密竞对遭开除,翁荔火速发文
36氪· 2026-01-16 16:50
核心观点 - 人工智能行业明星初创公司Thinking Machines Lab面临重大人员震荡,三位核心创始成员集体回流至OpenAI,事件折射出顶级AI人才、超级资本与宏大愿景结合时,维持组织共同方向的挑战远大于资金和履历光环[1][7][27] 关键人物与背景 - Thinking Machines Lab由前OpenAI首席技术官Mira Murati于2024年9月离开OpenAI后,与Barret Zoph、Luke Metz等人共同创立[9] - 离职的联合创始人兼CTO Barret Zoph履历显赫,曾为OpenAI研究副总裁及谷歌研究科学家,负责过后训练研究,直接参与ChatGPT等核心模型从研究到产品化的关键工作[11][12] - 同时回流OpenAI的Luke Metz是OpenAI团队创始成员之一,参与了ChatGPT的开发,此前也在Google Brain工作[13] - 第三位回流人员Sam Schoenholz同样有OpenAI和谷歌的工作经历[16][18] 事件经过与官方声明 - Mira Murati在社交媒体宣布与联合创始人兼CTO Barret Zoph分道扬镳,措辞克制未解释原因,并宣布Soumith Chintala为新任CTO[1] - 内部消息指离职原因为Zoph向竞争对手泄漏公司机密,该消息在全体员工大会上宣布[3] - 不到一小时后,OpenAI应用部门CEO Fidji Simo发文宣布欢迎Barret Zoph、Luke Metz及Sam Schoenholz“回归OpenAI”,并表示此安排“已筹备数周”[5] - OpenAI的声明显示,Zoph将向Simo汇报,Metz和Schoenholz将向Zoph汇报[5] 公司状况与市场表现 - Thinking Machines Lab定位为构建通用、可定制、易理解的AI系统,愿景是重塑通用人工智能研究方式[7][19] - 公司成立不到半年,于2025年7月完成20亿美元种子轮融资,由a16z领投,Nvidia、AMD等参投,估值达约120亿美元,成为当时无收入、无明确产品阶段估值最高的AI初创公司之一[19] - 公司首款产品Tinker于2025年10月推出,是一个面向开发者的模型微调工具API,但市场反馈审慎,认为其独特性不足,未成行业爆款[21] - 产品推出时间距融资完成滞后较长,且处于早期,未显现对现有平台的明显替代或补充效应[22] 影响与行业观察 - 此次事件不仅是联合创始人离职,更是一次三位核心技术人员向OpenAI的系统性“回流”,对尚未推出核心产品的初创公司象征意义重大[7] - 事件表明,在高度依赖创始人协作的初创阶段,联合创始人在研究方向、组织节奏或权责边界上的分歧冲击更为直接[27] - 尽管公司拥有20亿美元巨额种子融资,但资金未能消解组织内部的结构性张力,凸显在高密度智力劳动与强价值主张并存的组织中,维持稳定清晰的共同方向是关键[27] - OpenAI方面将此次人员回流视为战略性补强,旨在重新吸纳熟悉公司文化、具备研究深度的技术骨干以降低组织摩擦[27] - 社交媒体热议此事,有观点认为OpenAI凭借资源和品牌影响力能快速重新吸引前员工,也有评论揣测事件背后动机及大公司层级结构问题[28][29]
思考已成白菜价?黄仁勋一语成谶,物理学家:人类科研只剩3年
36氪· 2026-01-16 16:44
AI对科研行业的颠覆性影响 - 德国物理学家Sabine Hossenfelder预测,3年内当前形式的科学研究将不复存在,AI将以极低成本替代学生和博士后完成的工作[1][2] - AI能力的进化速度远超预期,英伟达CEO黄仁勋提出“智能即将成为一种商品”,冲击以科学家为代表的脑力工作者[3] - 科研机构将面临成本抉择:用高昂薪水聘请研究人员花费数月计算,还是支付零头成本让AI在几秒钟内搞定[7] AI驱动科研效率的跃升 - 大模型采用可极大提高研究者产出,让论文产出平均增加40%,对非英语母语者增幅甚至达到80%[11] - 一旦研究者看到前沿模型能帮助产出更多论文,采用率预计将飙升至接近100%,覆盖几乎所有科学学科[11] - 顶尖科学家如菲尔兹奖得主陶哲轩已积极拥抱AI工具,利用其进行证明思路寻找、头脑风暴和参考文献查找[12] 国家与科技巨头的战略布局 - 美国政府于2025年末启动“创世纪任务”,旨在利用AI加速科学发现,能源部下属17个国家实验室将打造一体化AI驱动平台[14][15][16] - Google DeepMind已同意向国家实验室的科学家提供其前沿AI工具的早期使用权限[17] - OpenAI通过“NextGenAI”项目承诺投入5000万美元,为麻省理工、牛津等15所顶尖机构提供研究经费、算力和前沿模型访问[18] 科研范式与行业结构重塑 - AI将首先颠覆理论物理、数学等高度依赖编程和计算的领域,传统科研体系中依赖“计算”和“执行”的岗位可能在3年内迎来终局[6][8] - 拥有顶级AI资源的机构将与普通机构拉开难以逾越的鸿沟,导致科研阶层分化[19] - 初级科研岗位面临较大冲击,研究生承担的文献整理、代码编写、基础计算工作可能被AI更快更好地完成,传统“学徒制”培养模式面临失效[25] 学术生态系统的变化 - AI导致“论文通胀”已不可避免,论文数量暴增可能导致没有足够人力进行评审[11] - 据Frontiers调查,53%的同行评审者承认使用了AI,未来可能进入“AI写论文、AI审论文”的闭环[22] - 当学术生产过程变成机器与机器的对话,人类在其中的信誉和价值将被稀释[24] AI在具体科学领域的应用进展 - Google DeepMind的AlphaGeometry将大模型与符号求解器结合,攻克高难度几何证明问题[23] - Anthropic推出的Claude for Life Sciences通过深度微调,协助诺和诺德、赛诺菲等大型药企加速药物研发[23] - 从MIT、牛津大学等顶尖学府为全体师生采购基于ChatGPT的校园版服务,可见AI对学术研究领域的渗透[8] 未来科学家角色的转变 - 科学家需从“知识的搬运工”进化为“智慧的指挥官”,核心价值在于提出好问题的能力、跨学科的宏观视野以及品味与判断力[25] - AI将把科学家从枯燥、重复的“脑力流水线”中解放出来,使其有精力攻克癌症、气候变暖、可控核聚变等人类长期未能解决的难题[25] - 人类需要成为自己的“风险准备负责人”,应对AI可能带来的危险、自主或快速演化能力的前沿系统[5][26]
2.3 亿人在用 ChatGPT「看病」,张文宏为什么反对年轻医生用AI
36氪· 2026-01-16 16:39
文章核心观点 - 关于AI在医疗领域的应用存在显著分歧 一方担忧AI过度依赖会阻碍年轻医生专业判断力的培养 另一方则认为AI能提升效率并直接服务患者 但当前AI在医疗领域的实践主要集中于辅助角色而非取代医生 其应用需警惕“自动化偏差”和误诊风险[1][2][4][6][14][16] 行业动态与市场前景 - AI医疗被视为潜力巨大的市场 吸引国内外科技公司积极布局[7] - OpenAI推出ChatGPT Health 整合Apple健康数据等提供分析和建议 但强调不替代专业诊疗 全球已有超过2.3亿用户使用ChatGPT获取健康建议[7] - Anthropic公司拓展Claude在医疗领域的能力 推出Claude For Healthcare 旨在作为连接器帮助医疗工作者提取信息 并为患者总结病史、解释检查结果以提升医患沟通效率[8][9] - Grok及其支持者马斯克的观点更为激进 认为AI在诊断准确率上超越人类 并展示了其分析医学影像和报告的能力[10][13] 主要争议与不同立场 - 反对直接接入病历系统的观点:以临床专家张文宏为代表 认为年轻医生需通过专业训练才能判断AI输出的对错 跳过积累直接依赖AI诊断将导致其无法建立必要的病例知识库[2][4][16] - 支持AI直接服务患者的观点:以百川智能创始人王小川为代表 认为医生因利益考虑可能阻碍AI应用 AI应致力于服务患者 提高效率并减少误诊[6] - 双方立场均被指受自身角色影响(“屁股决定脑袋”)[6] 应用风险与历史教训 - 历史上有类似教训 如放射科引入计算机辅助检测(CAD)系统后出现的“自动化偏差” 当系统出错时 医生的检测敏感度会下降 经验不足者受影响更甚[14] - 研究表明 AI与医生共同诊断时准确率表现最佳[14] - 生成式AI存在“极度自信地误诊”风险 可能以极具说服力的方式提供错误建议 这对缺乏专业背景的普通用户尤其危险[16][17] 当前应用场景与界限 - 当前AI在医疗中的应用主要集中在症状分析、检查报告解读和简单用药指导等辅助领域[18] - 需要明确区分“保健”与“治病” AI在提供日常保健建议(如饮食、运动)方面作用明显且风险较低 但在复杂疾病的诊疗上作用有限[17] - AI的价值在于为患者争取时间、缓解症状、提供基础用药指导 以应对就医不便的现实情况 而非替代专业医疗[18] - 用户应培养自身判断力 避免完全交出健康决策权[19]