大语言模型
搜索文档
Nature:首个能写综述论文的开源AI模型来了,大幅减少科研“幻觉”,堪比人类专家
生物世界· 2026-02-06 12:26
文章核心观点 - 华盛顿大学和艾伦人工智能研究所的研究团队在《自然》期刊发表了一项研究,推出了名为OpenScholar的AI科研助手,该工具旨在解决大语言模型在科研领域的“幻觉”问题,能够从4500万篇开放获取论文中检索信息,生成引用准确的科学综述,其性能在多项测试中超越了GPT-4o等主流模型[2][5] - OpenScholar是一个检索增强的语言模型,其核心创新在于构建了专用的开放数据存储和全开源架构,通过检索、生成和自反馈循环三步工作流程,确保输出内容的准确性和事实性[5][7][8][9] - 研究团队同时发布了首个大规模、多领域的科学文献合成基准ScholarQABench,用于严格评估AI的科研能力,OpenScholar在该基准测试中表现优异,尤其在引用准确性和多论文合成任务上大幅领先[12][13][16] - 尽管OpenScholar-8B模型的参数量仅为80亿,远小于GPT-4o,但在人类专家盲测中,其回答在50.8%的情况下被选中,优于GPT-4o的31.9%,显示出小模型在特定任务上的高效能和成本效益[16][17][18] OpenScholar的技术架构与工作流程 - 系统构建了一个包含4500万篇开放获取论文的专用数据存储,不依赖“黑箱”API,确保了透明度和可复现性[5][7] - 工作流程分为三步:首先从多来源智能检索相关论文段落,然后基于检索内容生成带引用的答案草案,最后通过自反馈循环迭代优化答案,确保事实性和覆盖范围[7][8][9] - 这种设计直接针对了当前AI在科学领域的痛点,例如研究显示,GPT-4o在78%-90%的情况下会编造计算机科学或生物医学等领域的近期文献引用,而OpenScholar的引用准确性堪比人类专家[11] ScholarQABench评估基准 - ScholarQABench是首个大规模、多领域的科学文献合成基准,包含近3000个由专家编写的问题,覆盖计算机科学、物理、神经科学和生物医学等领域[13] - 该基准要求模型生成长篇、多论文支持的答案,并引入了多维评估协议,包括自动指标和人类专家基于量表的评分,避免了AI“刷分”的可能[13][15] OpenScholar的性能表现 - 在ScholarQABench的测试中,OpenScholar-8B在多项任务中表现优异,例如在需要多论文合成的任务中,其正确率比GPT-4o高出6.1%,比PaperQA2高出5.5%[16][18] - 在引用准确性方面,OpenScholar的引用F1分数达到47.9%,而GPT-4o几乎为0[18] - 人类专家盲测结果显示,人类专家在50.8%的情况下选择了OpenScholar-8B的回答,在70.0%的情况下选择了OpenScholar-GPT-4o的回答,而选择GPT-4o回答的比例仅为31.9%,专家认为OpenScholar的回答更全面、信息深度更大[16][17] - 在细粒度评估中,OpenScholar-GPT-4o在组织性、覆盖范围和整体有用性上得分较高,整体有用性达到80.0%,相比GPT-4o的69.7%有显著提升[19] - 成本效益方面,使用高效检索管道的OpenScholar-8B,其处理每个问题的成本为0.003美元,低于基于GPT-4o的商业系统[17][18] 行业影响与未来展望 - OpenScholar的推出标志着AI在科学领域的应用迈出重要一步,有望将文献回顾从耗时的工作变为高效探索,降低科研门槛[21] - 该研究体现了开放科学的精神,研究团队全面开源了OpenScholar,为科研社区提供了透明、可复现的工具[5] - 未来,通过整合多模态学习和用户反馈,OpenScholar可能成为科研人员的真正“协作者”,让科研工作更聚焦于创新而非信息筛选[23]
RGF薪酬观察2026:中国大陆篇(英文版)
搜狐财经· 2026-02-06 11:17
报告核心观点 - 报告基于2025年1月至2026年1月期间超过50万名候选人数据,聚焦五大行业薪酬趋势、就业市场动态及招聘核心挑战,为企业薪酬策略与个人职业规划提供参考 [1] - 2025年就业市场呈现“前三季度调整、第四季度复苏”态势,第四季度招聘需求同比激增31%,人才供给在第三季度增长32%,面试接受率在第三、四季度分别同比上升14%和7% [1] - 2026年市场平均薪资增幅较2025年略有上升,高需求岗位如医疗销售、新零售岗位外部招聘薪资涨幅或达20%,自动驾驶算法专家可达30% [2] - 薪资预期不匹配是2025年招聘失败的首要原因,超三分之一(31%-50%)的未填补岗位因此落空 [2][25][26] - 在薪资满足预期后,职业发展机会成为最关键的非货币激励因素,占比57% [2][28] - 67%的招聘经理认为,将薪资预算增加10%能有效缩短招聘周期或吸引更高质量人才 [2][29][30] 就业市场动态 - **招聘需求**:2025年前三季度温和收缩,第四季度同比激增31% [1][17] - **人才供给**:全年保持稳健增长,第三季度增幅达32% [1][20] - **面试接受率**:自年中起持续改善,第三季度同比上升14%,第四季度同比上升7% [1][23] 薪酬趋势与挑战 - **平均薪资增幅**:2026年市场平均薪资增幅较2025年略有上升 [2] - **高需求岗位涨幅**:医疗行业销售、消费品行业新零售相关岗位外部招聘薪资涨幅或达20%,自动驾驶领域算法专家涨幅有望达到30% [2] - **主要薪酬挑战**:“新聘员工薪资高于现有员工”的内部薪资倒挂问题最为突出,占比33%;其次是薪酬政策或审批流程繁琐,占比30%;市场薪资快速上涨导致现有结构难以匹配候选人预期,占比24% [2][27] - **招聘失败主因**:薪资预期不匹配是2025年招聘失败的首要原因,超三分之一(31%-50%)的未填补岗位因此落空 [2][25][26] - **关键非货币因素**:薪资满足候选人预期后,职业发展机会成为最关键的非货币激励因素,占比57%,远超人际关系、企业文化及工作灵活性等因素 [2][28] - **预算增长效果**:67%的招聘经理认为,10%的薪资预算增长能有效缩短招聘周期或吸引更高质量人才,提升招聘投资回报率 [2][29][30] 五大行业薪酬特色 - **科技、媒体与通信行业**:人工智能(机器人/自动驾驶方向)岗位跳槽薪资涨幅达30%,大语言模型相关岗位跳槽薪资涨幅达28%,CEO岗位年薪最高可达500万元 [3][36] - **工业制造业**:薪资增幅相对温和,AI工程师跳槽薪资涨幅达30%,汽车、航空及供应链领域CEO年薪最高至500万元 [3] - **消费品与零售行业**:新零售相关岗位薪资涨幅达25%,销售与业务发展领域总监级岗位年薪最高300万元 [3] - **医疗与生命科学行业**:销售及营销岗位跳槽薪资涨幅为20%,CEO年薪区间在200万-500万元 [3] - **企业服务行业**:HRBP岗位跳槽薪资涨幅达18%,跨国企业CHRO年薪最高可达720万元 [3] 报告建议 - **对企业建议**:制定薪酬策略时应结合自身发展阶段、业务战略与人才规划,构建合理可持续的薪酬体系;跨国企业需兼顾全球标准与本地实践,强化绩效导向的可变薪酬占比,通过长期激励绑定核心人才 [3] - **对个人建议**:职场人士需聚焦价值创造逻辑,持续提升专业技能以实现薪资增长 [3]
Snap-on(SNA) - 2025 Q4 - Earnings Call Transcript
2026-02-06 00:02
财务数据和关键指标变化 - 第四季度净销售额为12.319亿美元,同比增长2.8%,其中有机增长1.4%,有利的外汇换算贡献了1560万美元 [6][35] - 第四季度运营公司(OpCo)的营业利润为2.552亿美元,与去年持平,营业利润率为21.5%,同比下降60个基点 [7] - 金融服务部门第四季度营业利润为7440万美元,同比增长770万美元或11.5%,主要得益于2025财年53周额外一周对信用卡业务的独特利好 [7] - 公司整体第四季度收益为3.396亿美元,同比增长2.3%,总利润率为25.3% [7] - 第四季度每股收益(EPS)为4.94美元,较去年的4.82美元增长0.12美元 [8] - 第四季度综合毛利率为49.2%,较去年同期的49.7%下降50个基点,主要反映了材料和成本上升以及C&I集团中低毛利率业务销售额增加的影响 [35][36] - 第四季度营业费用占净销售额的27.7%,去年同期为27.6% [36] - 第四季度有效所得税率为22.3%,去年同期为22.5% [39] - 2025财年包含53周运营结果,额外一周对财务服务部门产生了额外740万美元的利息收入,但对综合净收益影响不大,主要被额外一周的固定费用所抵消 [37][38] - 第四季度财务服务收入为1.08亿美元,去年同期为1.005亿美元;营业利润为7440万美元,去年同期为6670万美元 [38] - 第四季度经营活动产生的现金流为26.81亿美元,较去年同期减少2540万美元,主要反映了所得税现金支付增加5270万美元,部分被营运资本投资减少2300万美元所抵消 [48] - 年末现金头寸为16.245亿美元,上年末为13.605亿美元,公司还有超过9亿美元的信贷额度可用 [51] - 公司预计2026年每季度公司费用约为2800万美元,资本支出约1亿美元,全年有效所得税率预计在22%-23%之间 [51] 各条业务线数据和关键指标变化 - **商业与工业集团(C&I)**:第四季度销售额为3.981亿美元,同比增长1890万美元或5%,其中有机增长280万美元,有利的外汇换算贡献790万美元 [17][40]。营业利润为6060万美元,去年同期为6350万美元;营业利润率为15.2%,去年同期为16.7% [19][42]。毛利率为38.6%,去年同期为41.0% [41] - **Snap-on工具集团**:第四季度销售额为5.05亿美元,去年同期为5.066亿美元,有机销售额下降0.7% [24][43]。营业利润为1.073亿美元,去年同期为1.069亿美元;营业利润率为21.2%,同比上升10个基点 [24][44]。毛利率为46.1%,同比大幅提升150个基点 [25][43] - **维修系统与信息集团(RS&I)**:第四季度销售额为4.678亿美元,同比增长1120万美元,有机销售额增长480万美元,这是该集团连续第五个季度实现增长 [28][44]。营业利润为1.177亿美元,营业利润率为25.2%,较去年同期的26.6%下降140个基点 [29][45]。毛利率为46.9%,与去年同期的47.0%基本持平 [29][45] - **财务服务**:第四季度贷款发放额为2.851亿美元,与去年持平 [47]。美国60天以上逾期率为2.1%,较2024年第四季度上升10个基点,也较上季度上升10个基点,反映了典型的季节性增长 [47]。过去12个月净损失为7210万美元,占年末未偿贷款的3.67% [47] 各个市场数据和关键指标变化 - **汽车维修市场**:市场环境依然非常有利,平均车龄持续上升至12.8年,新车平台日益复杂导致维修更困难耗时,家庭在车辆维修上的支出持续攀升 [8][9]。技术人员工时增加,工资上涨,财务状况和前景持续改善,对熟练技工的需求旺盛且预计将持续数年 [9] - **关键工业市场**:该市场是公司全球足迹最大的领域,面临国际逆风,如政府协议、经济差异和汇率波动 [16]。欧洲持续受到乌克兰战争影响,亚洲则受到对中国经济信心普遍下降以及美国关税政策演变的影响 [16] - **工具存储类别**:在当前环境下,工具存储仍是受影响最大的类别,但对小型工具箱的需求显现,且各类配件销售开始强劲增长 [13]。第四季度贷款发放(originations)几乎持平,显示出显著改善 [13] 公司战略和发展方向和行业竞争 - 公司坚持平衡的增长与改进方法,投资于品牌建设、产品开发和人员优势 [4][5]。通过Snap-on价值创造流程(安全、质量、客户连接、创新和快速持续改进)巩固增长跑道的基础 [17] - **产品创新与定位**:公司拥有超过85,000种产品,其中工具集团超过40,000种 [25]。在C&I领域,公司专注于为苛刻环境提供精密、耐用、可靠和可重复性高的产品,并持续投资以强化优势 [15]。在汽车维修领域,公司利用庞大的专有数据库和大型语言模型,快速匹配问题与维修方案,提升维修效率 [12] - **应对市场不确定性**:面对关税波动、政府停摆等带来的技术员不确定性,工具集团调整策略,推出更多回报周期更短的产品,带来了高价值和更强的毛利率 [24][25]。RS&I集团则持续投资于软件开发和品牌建设,以强化其在数据和软件方面的优势 [29][30] - **竞争优势**:管理层认为公司拥有强大的产品、品牌和人员优势 [54][55]。在关键工业领域拥有决定性优势 [15]。在汽车诊断和维修信息领域,凭借庞大的数据点和软件能力处于有利地位 [12][31]。公司相对受当前关税环境影响较小,因其主要在销售市场进行生产 [36]。管理层认为Snap-on与竞争对手定位不同,不直接竞争同一客户群 [117][118] 管理层对经营环境和未来前景的评论 - 经营环境充满挑战,包括波动的关税、前所未有的国内外事件、长期的政府停摆等 [4]。但公司展现了韧性,在动荡中实现了销售增长和稳固的盈利能力 [4][5][34] - 汽车维修市场前景依然强劲,对熟练技工的需求将持续,车辆维修工作是“防AI”的职业之一 [9][10] - 尽管面临国际逆风和不确定性,公司对克服挑战并持续进步充满信心 [16]。管理层认为市场的不确定性可能即将解冻,市场的韧性将持续 [53] - 展望未来,公司相信持续投资于构建自身优势将带来益处,并预计将延续积极的发展轨迹 [53][55] 其他重要信息 - 公司自1939年以来每个季度都支付股息,从未中断或减少,并在2025年11月将股息提高了14%,这是连续第16年增加股息 [8] - 第四季度,C&I集团优化了其业务布局和市场进入策略,带来了4500万美元的净收益(主要来自建筑物出售收益,部分被商标注销和重组费用抵消) [19][42] - 公司第四季度回购了22.7万股普通股,耗资8040万美元,根据现有授权,还有约2.6亿美元的回购额度 [49]。现金使用的核心优先事项包括:支持营运资本需求、维持并增长股息、进行收购以及股票回购 [107][108] - 应收账款增加6580万美元,部分由于外汇换算和销售付款条件较长;存货增加8180万美元,部分由于外汇换算;存货周转率与去年持平,为2.4次 [50] 总结问答环节所有的提问和回答 问题: 关于工具集团业绩波动及技术员需求疲软或产品组合转向快回报项目的疑问 [58] - 管理层认为季度业绩基本持平,并将波动归因于动荡的环境(如政府停摆、关税新闻)导致的技术员不确定性 [59]。但看到了积极迹象,如贷款发放(originations)趋于平稳,可能预示着市场开始解冻 [60]。同时强调,在销量持平的情况下,工具集团的毛利率大幅提升150个基点,表明执行良好 [61] 问题: 工具存储、手动工具、诊断设备等子细分市场的表现 [62] - 管理层澄清,贷款发放(originations,代表加盟商对客户的销售)基本持平是积极信号 [63]。在工具集团对加盟商的销售中,工具存储仍同比下降,手动工具表现较好,诊断设备销售下降,电动工具销售上升 [63] 问题: 对加盟商的销售(on the van)与加盟商对客户的销售(off the van)对比 [66] - 管理层指出,本季度加盟商对客户的销售额明显高于公司对加盟商的销售额,这可能是一个积极的“绿芽”信号,但强调单季度数据波动大,不宜过度解读 [66][67] 问题: 工具集团诊断设备销售下降的原因,是否与前期产品发布强劲有关 [72] - 管理层解释,这更多是由于产品发布特性带来的固有波动性 [73]。上一季度发布了高端的Triton诊断平台(价格约4000-4500美元),而本季度发布了入门级的MT2600(价格低得多),尽管对加盟商而言都是销售,但单价差异影响了销售额 [73][74] 问题: 关键工业领域的增长势头能否延续至下一年 [75] - 管理层表示对关键工业领域的业务持乐观态度,定制化套件能力增强,且本季度后期业务强劲反弹,预计将带来一些增长动力,但未提供具体指引 [75][76] 问题: 电动工具业务强劲反弹的持续性,以及新产品发布的历史影响周期 [77] - 管理层指出,像Nano这样的全新产品线往往具有较长的生命周期,但电动工具销售总体上可能具有阶段性 [78][80]。目前工程资源已全力投入新产品开发,近期产品成功具有可重复性,对前景感觉良好 [79][80] 问题: 工具集团品牌建设费用的具体内容及未来展望 [84] - 品牌建设费用包括培训、品牌广告、软件开发、社交媒体运营支持等 [84]。管理层未提供具体费用构成细节,也未对未来费用水平给出明确指引 [84] 问题: 53周对财务的具体影响 [86] - 管理层说明,53周对财务服务部门是显著的正面影响(约740万美元额外利润),但对运营公司是轻微的负面影响,因为假期周费用照常发生而销售减少,不过总体影响不重大 [86][87] 问题: 关于上半年强劲的SFC(Snapshot From the Customer)订单与下半年工具集团有机增长基本持平之间的差异 [92] - 管理层解释,SFC是订单而非最终销售额,可能被取消 [93]。实际季度销售额是SFC订单、下半年启动活动(kickoffs)以及各种常规促销活动共同作用的结果,因此难以仅凭SFC订单预测最终销售 [97][98][99]。本季度环境特别动荡,影响了整体表现 [103] 问题: 区域启动活动(kickoffs)的进行情况 [100] - 管理层表示,他们参加的启动活动反馈积极,订单情况也相当稳健,但这并非未来业绩的确定性指标 [103]。结合毛利率提升、贷款发放改善、加盟商对客户销售强劲等积极信号,公司对前景持乐观态度 [104] 问题: 公司充裕现金的运用优先级 [106] - 现金使用优先级为:1) 支持营运资本需求(因业务模式需要较多营运资金);2) 保障股息的永续性和增长(已连续16年增加股息);3) 进行收购(持续评估但谨慎选择);4) 股票回购(上一财年回购超8000万美元) [107][108] 问题: 美国工具集团的竞争格局变化,包括定价、产品组合或营销策略 [116] - 管理层表示未看到竞争格局有显著变化 [116]。认为Snap-on定位独特,与竞争对手不直接争夺同一客户群 [117]。由于公司主要在销售市场生产,受关税压力小于许多同行,也未听说竞争对手有降价或提价行为 [118][119]
Meta内部备忘录:全新Avocado成公司迄今“最强能力”大模型
新浪财经· 2026-02-05 18:08
Meta AI 新模型“Avocado”的技术进展与内部评估 - 下一代大语言模型“Avocado”已完成预训练,被内部备忘录评价为“Meta迄今能力最强的预训练基础模型”[2][7] - 备忘录称,尽管Avocado尚未完成后训练,但其在知识储备、视觉感知及多语言能力上,已与顶尖的后训练模型持平[2][7] - 在文本相关任务中,Avocado的计算效率较上一代模型Maverick提升10倍,较另一版本Behemoth提升超100倍[4][9] Meta AI业务的重组与资本投入 - 公司于去年6月以143亿美元收购Scale AI,其CEO王士立加入并负责统领新成立的Meta超级智能实验室[3][9] - 公司近期预测,2026年包含AI算力成本在内的资本支出将较2025年增长约73%,达到1150亿至1350亿美元[3][9] - 技术效率的提升(如获取更高质量数据、投入基础设施、采用确定性训练)有助于降低AI研发的能耗与成本[4][10] 高管公开表态与未来展望 - 首席技术官安德鲁・博斯沃思在达沃斯论坛暗示了效率提升,并称AI模型“表现非常出色”[5][10] - 首席执行官马克・扎克伯格在财报电话会议上表示,预计首批模型会表现不错,更重要的是展现快速的发展轨迹,并计划今年持续推出新模型[5][10] - 博斯沃思同时指出,要开发出面向消费者的可用模型,仍需进行大量的后训练工作[5][10] 历史背景与潜在挑战 - 2025年,上一代大模型Llama 4表现未达预期,迫使公司推迟发布,最终推出的Maverick与Scout版本令部分开发者失望[3][8] - 在Avocado正式发布前,其内部乐观评估能否经受外界检验尚无定论,考虑到过去的坎坷经历,内部过度宣传也存在风险[3][8]
Vibe Coding“血洗”开源,社区吵翻了:封杀菜鸡AI开发者?不如给维护者打钱!
AI前线· 2026-02-05 17:00
文章核心观点 - 一篇预印本论文及社区讨论指出,“氛围编码”(AI辅助编程)的广泛应用对开源软件生态系统的可持续性构成严重威胁,可能通过减少用户互动、降低新项目启动、侵蚀维护者收益等方式损害生态[2][4][9] - 尽管“氛围编码”能带来显著的生产力提升,但其改变了软件生产与消费方式,引发了关于开源软件长期均衡的担忧,需要商业模式和制度的重新设计以回馈维护者[10] - 开发者社区对此观点存在分歧,一方认为AI将损害开源,另一方则认为AI将加速开源发展并更早威胁商业软件[11][13] 根据相关目录分别进行总结 “氛围编码”对开源生态的潜在负面影响 - 用户互动从开源项目中剥离:大语言模型聊天机器人替代了代码下载、文档查阅和社区论坛(如Stack Overflow)使用,导致项目官网访问量下滑,削弱了项目推广、募资和社区运营的基础[2] - 新开源项目启动难度大幅提升:氛围编码的广泛采用会减少新开源项目的进入和分享[9] - 错误报告质量下降且维护者负担加重:cURL项目作者抱怨因“AI垃圾”导致错误报告质量下降,该项目已决定从2026年2月1日起暂停漏洞赏金计划[7] - 破坏开源自然筛选与反馈机制:大语言模型生成代码时倾向于选用训练集中占比最高的技术方案,且不会与开发者互动、提交可用错误报告或意识到潜在问题[6] - 可能降低开发效率与代码质量:2024年有研究报告指出使用Copilot等工具进行氛围编码未带来实际好处,除非将增加41%的bug视为成功标准;2025年有观点认为氛围编码会降低19%的开发效率[6] 对开源可持续性与维护者收益的冲击 - 侵蚀开源软件的资金供给与开发动力:开源项目依赖用户关注和参与(如文档访问、错误报告、声誉)来维持运营并获取私人回报,AI介入取代直接交互可能侵蚀这一基础[9] - 绝大多数开源项目难以从氛围编码中获益:在氛围编码模式下,AI智能体端到端地选择、组合和修改软件包,人类开发者可能不清楚使用了哪些上游组件,导致价值无法回馈[8][9] - 提出的补贴方案可能无效:论文提出当开源代码被大语言模型使用时,OpenAI或谷歌可给予少量资金补贴,但此模式类似Spotify,约80%的创作者作品播放量极低,基本无法获得收益[9] - 长期均衡下整体福利可能下降:尽管生产力提高,但氛围编码更广泛采用会降低开源软件的可用性和质量,导致整体福利下降[9] 开发者社区的不同观点与反馈 支持“氛围编码”的正面反馈 - 赋能非专业开发者完成项目:有超过30年经验的开发者表示,AI帮助其完成了第一个从头到尾完整的应用程序,包括测试等全套环节,使其能专注于老板和需求方的角色[12] - 提升特定工作效率:AI帮助处理bug报告的速度比人工快很多,已有用该方法解决约30个别人报告bug的实例;AI也能帮助筛选信息,快速从海量数据中找到有用答案,省去在Stack Overflow等平台翻阅的麻烦[13] 认为“氛围编码”危及开源生态的观点 - 加剧开源领域信息失衡:用户不再参与bug排查,反馈的信息往往无关紧要;大语言模型可能更倾向于复制并修改开源项目,而非正规引入;开源领域有效与无效信息失衡问题比以往更严重[13] - 增加项目维护负担:水平堪忧的开发者会给开源项目的“守门人”增加额外负担,可能需要直接禁止那些只会提交AI劣质代码的人[14] 认为“氛围编码”将加速开源并威胁商业软件的观点 - 专业开发者效率更高将推动开源发展:拥有大语言模型的专业开发者效率更高,代码质量远胜非程序员使用大语言模型所写代码,这将使开源软件发展速度远超以往,并在功能、稳定性上超越商业软件[13] - 降低创造门槛将促进开源分享:编写工具不再花费数百小时,会有更多人创建并更乐于分享工具,更新和创建开源代码会越来越容易,营利性软件公司更应感到担忧[13] 受冲击最严重的领域 - JavaScript、Python和各类Web技术相关的软件生态系统很可能首当其冲,因为其用户群体对氛围编码接受度更高,且相关技术在大语言模型训练数据集中占比最大[7]
美股软件抛售潮拖累港股,黄仁勋发声驳斥
第一财经资讯· 2026-02-05 14:53
美股软件板块遭遇抛售与市场担忧 - 美股软件板块正面临惨烈抛售压力,预计痛苦状态可能持续一段时间 [2] - 市场担忧从“AI赋能软件”转向“AI取代软件”,认为AI可能直接替代中间环节SaaS产品 [2] - 港股软件、SaaS、AI应用板块集体低开低走,普跌明显 [2] 抛售的触发因素 - Anthropic发布面向企业法务的Claude Cowork插件,可自动化完成合同审查等核心法务工作,直接冲击法律信息服务与专业SaaS板块 [2] - 市场对美股软件板块受损的担忧发酵,叠加极致的顺周期交易风格 [2] - 微软、Service Now等企业四季报平稳但缺乏亮点,加剧市场看衰情绪 [2] 企业高管对AI冲击的回应 - 谷歌母公司Alphabet CEO桑达尔·皮查伊不认可“AI工具可能会损害大型软件SaaS公司定价权”的观点 [3] - 皮查伊认为当前最关键问题是计算能力相关的限制,包括电力、土地、供应链约束,以及如何扩大产能满足激增需求 [3] - 英伟达CEO黄仁勋表示,AI不会做工具,而是会用工具,会直接使用已经成熟的软件,通过调用接口、组合功能来完成任务 [3] AI与软件的未来关系及发展现状 - 黄仁勋认为,未来AI需要始终在场、积累、记录,企业最值钱的是问题本身,代表其关注方向与挑战 [4] - 软件公司需考虑如何实现工具可被AI调用,加上接口或开放调用能力,软件将成为未来AI工作流程中的入口 [4] - 中信证券认为,从LLM自身能力和落地应用场景看,市场当下的判断明显过于乐观且不切实际 [4] 当前AI技术的局限性 - 模型层面,当前LLM仍停留在概率统计游戏层面,尚未触及人类认知核心,在幻觉、多模态对齐、推理能力等层面存在明显理论局限性 [5] - 应用层面,以标普500企业为样本,AI应用场景仍主要集中于Coding、客服等逻辑简洁、容错率高的领域 [5] - 在要求严苛、逻辑链条复杂的场景中AI仍很难胜任,且AI Agent在企业应用场景中的准确度伴随任务步骤和复杂度提升而快速下降 [5] 软件企业的应对策略与前景 - 面对GenAI技术浪潮,软件企业短期最有效的应对方式是激进的兼并与收购手段 [5] - 资本市场历史上对软件板块M&A一直持有负面看法,主要担心企业内生增速放缓及并购后整合风险 [5] - 伴随美国宏观环境持续改善与AI产品逐步落地,预计美股软件企业业绩有望逐季改善,但斜率难言理想 [5] 市场反应案例 - Palantir Technologies发布了一份高于华尔街预期的财报,但股价最终收跌11.62% [3]
美股软件抛售潮拖累港股,黄仁勋发声驳斥
第一财经· 2026-02-05 14:47
美股软件板块现状与市场情绪 - 美股软件板块正面临惨烈抛售压力,预计痛苦状态可能持续一段时间[3] - 港股软件、SaaS、AI应用板块集体低开低走,普跌明显[3] - 抛售由市场对AI冲击的担忧、顺周期交易风格及部分企业平淡财报共同引发,演变为非理性踩踏式抛售[3] - 即使发布高于预期的财报,Palantir Technologies股价仍收跌11.62%[3] AI技术发展对软件行业的潜在冲击 - Anthropic发布面向企业法务的Claude Cowork插件,可自动化完成合同审查、合规追踪等核心法务工作,直接冲击法律信息服务与专业SaaS板块[3] - 市场情绪从“AI赋能软件”迅速转向“AI取代软件”,担忧AI从工具升级为替代者,淘汰中间环节SaaS产品[3] - 谷歌CEO桑达尔·皮查伊不认可“AI工具会损害大型软件SaaS公司定价权”的观点,认为当前关键限制在于计算能力相关的产能约束[4] - 英伟达CEO黄仁勋认为AI不会做工具,而是会使用现有成熟软件,通过调用接口和组合功能来完成任务[4] AI技术的当前局限性与挑战 - 从大语言模型能力及落地应用场景看,市场判断过于乐观且不切实际[5] - 模型层面:当前LLM仍停留在概率统计层面,在幻觉、多模态对齐、推理能力等方面存在明显理论局限性[5] - 应用层面:以标普500企业为样本,AI应用仍主要集中于Coding、客服等逻辑简洁、容错率高的领域,在复杂场景中难以胜任[5] - Salesforce研究表明,AI Agent在企业应用场景中准确度难以令人满意,且随任务步骤和复杂度提升,准确度快速下降[5] 软件企业的应对策略与未来展望 - 面对GenAI浪潮,软件企业短期最有效的应对方式是激进的兼并与收购手段[6] - 资本市场历史上对软件板块M&A持负面看法,担心内生增速放缓、并购后整合风险及产品重叠加剧竞争[6] - 伴随美国宏观环境改善及AI产品逐步落地,预计美股软件企业业绩有望逐季改善,但改善斜率难言理想[6] - 英伟达CEO黄仁勋指出,软件公司需考虑如何让工具被AI调用,未来软件将成为AI工作流程的入口而非重点[4][5] - 英伟达认为企业最值钱的是问题本身,代表其关注方向与挑战,通过软件可将动作与思考沉淀为可复用的知识资产和流程[4]
刚刚,全球首个完全开放科学文献综述AI,登上Nature
36氪· 2026-02-05 10:24
产品发布与定位 - 华盛顿大学与艾伦人工智能研究所主导研发了全球首个专为科学研究设计的全开源检索增强生成语言模型OpenScholar [1] - 该产品于2月4日在《自然》期刊上发布,旨在帮助科学家处理复杂且繁重的科学文献综述任务 [1] 技术架构与创新 - 系统整合了4500万篇开放获取论文和2.36亿个段落嵌入向量,构建了专属知识库OSDS [3][4] - 核心技术包括自适应检索,能根据查询语义深度精准定位相关文献段落 [4] - 引入了自反馈推理循环机制,在生成初步回答后进行检查和迭代优化,以提升事实性、覆盖率和引用准确性 [4][6] 性能表现与评估 - 在专门构建的大规模多领域评测基准ScholarQABench上,OpenScholar表现全面超越现有系统 [7] - 轻量模型OpenScholar-8B的综合正确率超过GPT-4o 6.1%,超过专用系统PaperQA2 5.5% [8] - 在引用准确性方面,OpenScholar-8B的表现仅略低于人类专家2.9分,而人类答案比无检索的GPT-4o高出9.6分 [8] - 在人类专家评估中,OpenScholar使用8B模型和GPT-4o分别以51%和70%的胜率击败人工生成答案,而原始GPT-4o胜率仅为31% [10][12] 现有模型问题与市场机会 - 大语言模型在科研辅助任务中面临挑战,难以跟上科学文献快速增长,且伴随严重“幻觉” [3] - 实验数据显示,GPT-4o在引用科学文献时产生错误引用的比例高达78%至90% [3] 竞争优势与实用性 - OpenScholar的引文准确率与人类专家相当 [1] - 其采用的轻量级专用检索器相比依赖庞大通用模型的方案,显著降低了系统的运行与计算成本 [12] 局限性 - 当前评测框架主要关注计算机科学、生物医学和物理学,尚未涵盖社会科学、工程学等其他重要学科 [13] - 基于人工标注的评估集规模较小,可能引入方差和专业偏差 [13] - 在某些复杂查询中,仍无法保证始终检索到最具代表性或最新的相关论文 [13] - 80亿参数的OpenScholar-8B模型在指令遵循和科学知识理解方面能力有限,可能导致输出存在事实性偏差 [13] - 系统仅使用开放获取论文,如何合理合法整合受版权保护的学术文献仍是待解决问题 [13] 未来发展计划 - 研究团队已经开源了OpenScholar的核心资源,包括代码、数据、模型检查点和评测基准 [14] - 未来工作将致力于整合用户反馈,优化检索质量、引用准确性及整体可用性 [15] - 计划将支持范围延伸至更多科学领域及多语言场景,并寻求与学术出版机构合作探索合规数据使用机制 [15]
海致科技集团2月5日至2月10日招股 预计2月13日上市
智通财经· 2026-02-05 07:47
公司业务与产品 - 公司是中国领先的企业,专注于通过图模融合技术开发Atlas图谱解决方案及产业级智能体,并提供产业级人工智能解决方案 [2] - 核心产品之一是Atlas图谱解决方案,基于行业领先的图计算与数据分析能力构建,包含DMC数据智能平台、Atlas知识图谱平台及AtlasGraph图数据库,用于高效整合、处理、管理多源数据,并构建、分析知识图谱及进行复杂关系挖掘与可视化分析 [2] - 另一核心产品Atlas智能体基于图模融合技术开发,通过融合大语言模型的推理能力与知识图谱的准确性及可解释性,赋能企业实现智能自动化、场景化推理及自然语言交互 [2] - 公司向客户提供两项人工智能解决方案:Atlas图谱解决方案和Atlas智能体,已在反欺诈、智能营销、智能营运、风险识别、数据治理及智能制造等百余种应用场景中落地 [4] - 公司的战略重点是Atlas图谱解决方案及Atlas智能体并行开发,以满足不同数字化转型阶段的客户需求,并提供全面的协同解决方案 [5] 市场地位与竞争优势 - 按2024年营业收入计,公司在中国产业级AI智能体提供商中位列第五,市场份额为2.8% [3] - 按2024年营业收入计,公司在中国以图为核心的AI智能体提供商中位列第一,市场份额约为50% [3] - 公司是行业内中国首家通过知识图谱有效减少大模型幻觉的企业,在事实准确度、幻觉率及复杂逻辑推理能力三大维度构建了核心竞争力与技术壁垒 [3] - 凭借在多应用场景知识图谱构建领域的专长、积累的经验以及客户提供的受控且经过验证的数据集,公司在减少AI系统幻觉方面实现突破 [3] 财务表现与增长 - 公司的营业收入由2022年的人民币3.13亿元增至2024年的人民币5.03亿元,复合年增长率为26.8% [3] - 来自Atlas智能体的收入由2023年的人民币890万元增至2024年的人民币8660万元,增幅达872.2% [3] 行业背景与公司定位 - 人工智能技术(尤其是大语言模型技术)的进步正在重塑AI应用形态,但大语言模型的幻觉效应(准确性不足及输出结果不可解释)阻碍了产业级人工智能应用的规模化推广 [4] - 公司致力于解决大语言模型的幻觉问题,于2023年9月推出Atlas智能体,赋予大语言模型在特定行业情景中的精确推理能力 [4] - 截至2025年9月30日,公司已与360多家客户合作,业务覆盖百余种应用场景 [4] 本次全球发售详情 - 公司于2026年2月5日至2026年2月10日招股,拟全球发售28,030,200股H股,其中香港发售占10%(可予重新分配),国际发售占90%(可予重新分配) [1] - 发售价为每股发售股份不高于28.0港元,每手200股,预期股份将于2026年2月13日在联交所开始买卖 [1] - 已与JSC International Investment Fund SPC(代表Etown SP)、JINGSHENG HENGXING、Infini、Mega Prime订立基石投资协议,基石投资者同意认购总金额约为1500万美元的发售股份 [5][6] - 假设发售价为每股26.80港元(指示性发售价范围中位数),预计全球发售所得款项净额约6.48亿港元 [6] 募集资金用途 - 约45.0%将用于研发以强化图模融合技术 [6] - 约20.0%将用于优化Atlas智能体 [6] - 约15.0%将用于深化与客户的合作,探索新应用场景以及拓展香港及新加坡市场 [6] - 约10.0%将用于战略投资、合并及收购 [6] - 约10.0%将用于营运资金及一般公司用途 [6]
海致科技集团(02706)2月5日至2月10日招股 预计2月13日上市
智通财经网· 2026-02-05 07:44
公司招股与发行概况 - 海致科技集团(02706)于2026年2月5日至2月10日招股,计划全球发售2803.02万股H股,其中香港发售占10%,国际发售占90%,发售价不高于每股28.0港元,每手200股,预期股份于2026年2月13日在联交所开始买卖 [1] - 公司已与JSC International Investment Fund SPC(代表Etown SP)、JINGSHENG HENGXING、Infini、Mega Prime订立基石投资协议,基石投资者同意认购总金额约1500万美元的发售股份 [5][6] - 假设发售价为每股26.80港元,公司预计全球发售所得款项净额约6.48亿港元,计划将约45.0%用于研发图模融合技术,20.0%用于优化Atlas智能体,15.0%用于深化客户合作及拓展香港和新加坡市场,10.0%用于战略投资及并购,10.0%用于营运资金及一般公司用途 [6] 公司业务与核心技术 - 公司是中国领先的企业,专注于通过图模融合技术开发Atlas图谱解决方案及产业级智能体,并提供产业级人工智能解决方案 [2] - Atlas图谱解决方案是核心产品之一,基于图计算与数据分析能力构建,包含DMC数据智能平台、Atlas知识图谱平台及AtlasGraph图数据库,帮助企业整合、处理及管理多源数据,构建分析知识图谱,并进行复杂关系挖掘与可视化分析 [2] - Atlas智能体基于图模融合技术开发,通过融合大语言模型的推理能力与知识图谱的准确性及可解释性,赋能企业实现智能自动化、场景化推理及自然语言交互 [2] - 公司致力于解决大语言模型的幻觉问题,于2023年9月推出Atlas智能体,赋予大语言模型在特定行业情景中的精确推理能力 [4] 市场地位与财务表现 - 按2024年营业收入计,公司在中国产业级AI智能体提供商中位列第五,市场份额为2.8%;并在中国以图为核心的AI智能体提供商中位列第一,市场份额约为50% [3] - 公司是行业内中国首家通过知识图谱有效减少大模型幻觉的企业,能够在事实准确度、幻觉率及复杂逻辑推理能力三大维度构建核心竞争力与技术壁垒 [3] - 公司营业收入由2022年的人民币3.13亿元增至2024年的人民币5.03亿元,复合年增长率为26.8% [3] - 来自Atlas智能体的收入由2023年的人民币890万元增至2024年的人民币8660万元,增幅达872.2% [3] 产品应用与客户基础 - 公司向客户提供两项人工智能解决方案:Atlas图谱解决方案和Atlas智能体,解决方案已在反欺诈、智能营销、智能营运、风险识别、数据治理及智能制造等多类应用场景中落地 [4] - 公司拓展新的应用场景以赋能客户整体运营与决策流程,截至2025年9月30日,已与360多家客户合作,业务覆盖百余种应用场景 [4] - 公司战略重点是Atlas图谱解决方案及Atlas智能体并行开发,以满足广泛的客户需求,并支持标准化及不断演变的业务场景 [5]