Workflow
Seek .(SKLTY)
icon
搜索文档
比DeepSeek风暴还惨烈,华尔街“抛AI”妖风祸从何来?
36氪· 2026-02-05 17:02
市场动态与极端波动 - 2026年2月4日,高盛的无约束动量组合(GSPRHIMO)创下自2022年以来表现最糟糕的一天,跌幅超过2025年1月Deepseek风暴后的AI抛售潮 [1] - 标普500指数成分股平均的1周实际波动率与整体指数波动率之比在近期达到6.88,处于2023年以来第99个百分位,意味着个股平均波动幅度约为大盘指数的7倍 [2][4] - 周三市场行情特殊,盘中近四分之三个股跑赢标普500指数,但指数本身持续下行,凸显市场痛苦领域高度集中 [14] 抛售驱动因素与特征 - 周三抛售主要源于多头策略(“过往赢家”组合GSXUHMOM)的严重拖累,该策略倾向于周期性高波动高贝塔主题 [6] - 抛售是极端因子逆转,动量因子遭受逾三年最严重回撤,主要由多头减持驱动,投资者积极减持今年以来的赢家 [8] - 市场疲软重度来源于早期领涨的拥挤主题:AI受益股、AI电力、国家安全板块、比特币矿商及其他高贝塔、高动量板块,而前期滞涨板块则强劲反弹 [8] - 杠杆ETF再平衡成为主要推手,摩根士丹利估算周三杠杆ETF面临约180亿美元的抛压需求,使当天跻身历史前十之列,抛压集中于纳斯达克、科技股和半导体板块 [12] - 做市商的伽马动态未能有效缓解压力,市场实质上呈现净Short Gamma状态,导致抛售压力累积时日内波动加剧 [12] 板块与主题表现反转 - 今年以来表现强劲的板块正经历剧烈反转:存储芯片、稀土及未盈利科技股均回吐大部分年内涨幅 [15] - 根据高盛数据,高动量主题在2月4日普遍大跌:高贝塔12个月赢家组合(GSXUHMOM)下跌9%,全球稀土组合(GSXGRARE)下跌551%,量子计算指数(GSX1QNT1)下跌8%,存储组合(GSTMTMEM)下跌6%,未盈利科技指数(GSX1NPTC)下跌8% [16] - 与此同时,具有负动量的主题全线反弹:高贝塔12个月输家组合(GSXULMOM)上涨2%,防御股(除商品)指数(GSX1DEFS)上涨1%,日常消费品组合(GSXUSTAP)上涨2% [16] - 摩根士丹利指出,拥挤板块持仓遭抛售:AI板块下跌8.5%,存储板块下跌6%,AI电力板块下跌8% [17] 机构观点与后市展望 - 高盛交易员认为,从历史经验看,类似周三的动量股回调往往是中期买入良机,但鉴于动量策略近期强势表现及高仓位配置,短期布局对冲仍具合理性 [17] - 摩根士丹利策略师观点类似,指出这通常是买入的好机会,但会保持谨慎,认为动量和拥挤的多头头寸仍有下行风险,即使短期可能反弹 [19] - 高盛Prime Book数据显示净敞口处于高位(过去一年的第89百分位),若赢家板块出现更大规模回调,其造成的损失可能远超常规板块轮动 [16] - 此次行情被视作一次“风险偏好转向逆转”时刻,是仓位调整而非强制清算,市场尚未出现恐慌性抛售或彻底投降的迹象 [14][17]
DeepSeek优化新趋势:2026年GEO发稿平台推荐测评聚焦
新浪财经· 2026-02-04 13:06
行业趋势与变革 - 在健康医疗领域,品牌曝光正迎来新变革,随着DeepSeek等AI问答平台的普及,企业需要让产品在用户搜索中被高频推荐[2] - 专业的GEO发稿服务对于提升内容在AI生态中的可见度至关重要,选择靠谱的平台已成为行业共识,既能节省成本又能确保品牌脱颖而出[2] GEO发稿平台选择标准 - 企业在挑选GEO发稿平台时,应从四个核心维度评估:技术AI融合度、媒体资源真实性、数据透明度和服务专业性[4][5] - 技术AI融合度要求平台真正理解DeepSeek等AI的运作逻辑,能将关键词优化与语义分析结合,让内容更易被AI抓取[5] - 媒体资源真实性要求资源库覆盖权威健康媒体,需核实合作渠道以避免虚假资源拉低曝光效果[5] - 数据透明度要求服务方提供清晰的收录报告,如内容收录率或排名变化,避免“黑箱操作”[5] - 服务专业性体现在顾问能定制方案,例如针对药品或器械的优化策略[5] - 实操中需注意三个细节:警惕低价陷阱、先进行小规模测试验证效果、将关键承诺如效果保障条款写入合同[5] 聚观新闻推平台服务分析 - 聚观新闻推是生成式AI品牌曝光优化的GEO发稿平台,专注于为企业提供一站式AI搜索引擎服务[8] - 其服务包括GEO优化、语义关联分析、内容质量评估、智能内容创作、排名变化追踪、多AI渠道适配和持续优化指导[8] - 平台通过关键词结构优化、语义知识图谱和AI收录策略,帮助品牌在DeepSeek、豆包、腾讯元宝、百度文心、阿里千问、蚂蚁阿福等AI问答结果中更高频被提及与推荐[8] - 平台提供一站式服务,从关键词优化到语义知识图谱构建,再到AI收录策略调整,确保医疗品牌在多个AI平台被主动推荐[8] - 通过智能内容创作和排名追踪,能将药品信息精准匹配用户搜索意图,提升可信度,用户反馈显示内容更“精准”[9] - 平台特别适合预算有限却需快速建立口碑的中小型健康医疗公司,如新兴生物科技企业或在线诊疗平台[10] - 平台能根据行业特性定制内容方案,例如结合医疗热点优化关键词[10] - 效果周期通常需3-5个工作日见效,平台保1个月持续优化服务,实际案例显示部分医疗客户完成GEO关键词优化后咨询量增长可观[11]
PriceSeek提醒:玖龙太仓瓦楞纸价上调30元/吨
新浪财经· 2026-02-02 18:49
核心事件 - 玖龙纸业太仓基地自2024年2月2日起,将瓦楞纸价格上调30元/吨 [1][2] 市场影响分析 - 此次提价反映了瓦楞纸市场供需可能趋紧或需求出现回暖,对现货价格构成利好 [1][3] - 作为行业龙头企业,玖龙纸业的提价行为可能带动其他造纸企业跟随涨价,从而推高现货市场的整体报价水平 [1][3] - 结合当前纸浆成本提供的支撑以及消费旺季的预期,预计瓦楞纸短期现货价格将呈现温和上涨态势 [1][3] 定价机制说明 - 生意社基准价是基于价格大数据与特定价格模型产生的交易指导价,可用于确定指定日期的结算价或指定周期的平均结算价 [1][3] - 大宗商品交易结算价的计算公式为:结算价 = 生意社基准价 × K (调整系数) + C (升贴水) [1][3] - 调整系数K包含了账期成本等因素 [1][3] - 升贴水C包含了物流成本、品牌价差、区域价差等因素 [1][4]
DeepSeek之后,智源大模型登Nature:事关“世界模型”统治路线
36氪· 2026-02-02 08:22
核心观点 - 北京智源人工智能研究院研发的“悟界·Emu3”多模态大模型在《自然》正刊发表,这是中国首篇围绕多模态大模型路线的Nature论文,标志着中国在AI基础研究领域的原始创新获得国际顶级学术认可 [1] - 该模型的核心突破在于仅采用“预测下一个token”的自回归路线,实现了文本、图像和视频的统一学习与生成,其性能可与针对特定任务设计的专用模型相媲美,为构建统一、可扩展的多模态智能系统提供了新范式 [3][10] - 该技术路线因其架构极简,被认为具备强大的扩展潜力,能有效降低大模型研发门槛和成本,对推动原生多模态助手、世界模型及具身智能等产业发展具有重大意义 [4][34] 技术突破与架构创新 - **统一的技术路线**:Emu3开创性地仅采用“预测下一个token”的自回归路线,将图像、文本和视频统一离散化到同一表示空间,并联合训练单一的Transformer,实现了多模态的统一学习与生成 [10] - **极简的架构优势**:模型保留了Llama-2等大语言模型的解码器架构,主要修改在于扩展嵌入层以容纳离散视觉标记,这种极简架构简化了多模态AI设计,减少了研发复杂性和潜在错误 [4][35] - **框架核心组件**:包含五个紧密集成的组件:1)大型混合多模态训练数据集;2)统一的标记器(视觉分词器);3)基于Transformer的仅解码器架构;4)两阶段优化方案(预训练与后训练);5)高效的推理后端 [35][37] 模型性能表现 - **图像生成**:在MSCOCO-30K23等基准测试中,Emu3得分70.0,超越了SD-1.5(59.3)和SDXL(66.9)等扩散模型 [3][4] - **视觉语言理解**:在相关测评中得分62.1,略高于LLaVA-1.6(61.8) [3][4] - **视频生成**:在VBench评分中达81.0,超过Open-Sora-1.2(79.8) [3][4] - **综合竞争力**:在文生图任务上,其CLIP-I得分0.689,CLIP-T得分0.313,综合得分(Overall)0.66,与DALL-E 3(0.67)和FLUX.1(Dev)(0.66)等先进模型相当 [13][14] - **视频扩展能力**:可原生生成24帧/秒的5秒视频,并通过自回归方式预测未来帧进行扩展,在与其他视频扩散模型的对比中展现出强竞争力 [25][29][30] 研发历程与产业影响 - **研发背景与挑战**:项目于2024年2月由约50人团队立项,旨在验证自回归路线能否统一多模态,面临技术路径质疑、资源竞争及“多模态能否提升模型智能”等未定论的挑战 [8][12] - **持续迭代与升级**:“悟界·Emu”系列持续迭代,2024年10月发布的Emu3实现了统一多模态理解与生成;2025年10月发布的Emu3.5进一步升级为多模态世界模型,实现了从“预测下一个token”到“预测下一个状态”的能力跃迁 [6][34][42] - **对产业的影响**:模型发布两年多以来,已对多模态领域产生显著影响,推动了产业发展脉络,其极简统一的架构有望降低研发门槛和成本,具有重大的产业应用前景 [12][34] 机构背景与行业地位 - **智源研究院的贡献**:智源研究院自2018年创立以来,持续聚焦大模型原始创新,2021年发布中国首个大语言模型“悟道1.0”,被称为“大模型的黄埔军校” [40] - **开源开放理念**:智源始终坚持开源开放,已开源200多款模型,全球下载量超7.6亿次,并开源180多个数据集,下载量超500万次,有力促进了开源生态和产业链发展 [43] - **北京AI产业生态**:作为“大模型第一城”和“开源之都”,北京通过政策支持与扎实投入,培育了包括智源、智谱、百度、月之暗面等在内的领先AI机构,在AI基础研究领域展现出深远价值 [44][45]
字节阿里DeepSeek决战春节:一场关乎14亿人的重磅AI大战
36氪· 2026-01-30 19:01
文章核心观点 - 中国AI产业在即将到来的春节将迎来关键竞争节点,字节跳动、阿里巴巴和DeepSeek等公司计划发布重磅AI产品,争夺14亿用户的生活入口和未来互联网秩序的主导权 [1][18] 字节跳动战略与产品 - 公司计划在下个月(春节前后)密集发布三款旗舰模型:大语言模型Doubao 2.0、图像生成模型Seedream 5.0以及视频生成模型SeedDance 2.0,形成“全模态三件套” [2] - 此举旨在巩固其“内容之王”的护城河,确保用户通过AI生成和修改视频等活动发生在自有生态内,同时为其高速增长的云业务提供顶级模型弹药以挑战阿里云 [3][4] - 公司旗下AI应用“豆包”的周活跃用户已达1.55亿,并已将AI能力深入集成至抖音这一庞大流量平台 [3] 阿里巴巴战略与产品 - 公司将在春节期间推出新一代旗舰模型Qwen 3.5,该模型在数学、代码能力和复杂推理任务上实现质的飞跃 [5][6] - 公司正对“通义千问”App进行脱胎换骨改造,在1月的更新中打通了电商、酒旅和支付等核心生态服务,使其从一个聊天机器人转变为能处理点外卖、订机票等事务的“全能助理智能体” [6][7] - 公司的战略意图是通过千问App接管用户的生活服务,以对抗字节跳动对用户娱乐时间的占据,并计划在2026年完成阿里生态所有服务与千问App的深度整合 [7][8] - 目前千问App的月活跃用户已突破1亿,春节营销战是缩小与字节差距的关键战役 [8] DeepSeek战略与产品 - 公司计划在春节前后发布代号为V4的新一代模型,这不是一次常规迭代,而是在代码编写和超长上下文处理上展现出惊人统治力,据称某些关键指标超越了OpenAI的GPT和谷歌Gemini [9][10] - V4模型能处理极长的代码提示词并在长训练过程中保持数据模式不退化,这对构建复杂软件系统至关重要 [10] - 公司的独特优势在于其CEO梁文锋主导研发的新型训练架构,使其能在不按比例增加芯片数量的情况下训练出更大规模模型 [13] - V4模型的发布旨在证明中国公司在底层逻辑推理和代码生成上拥有定义行业标准的能力 [13] 行业竞争格局与影响 - 腾讯随着姚顺雨的入职及战略调整,也将在AI领域发力以加速追赶第一梯队 [15] - 此次春节的竞争标志着AI将从科技圈的谈资和玩具,真正渗入14亿人生活的毛细血管,具体表现为字节的“全模态生成”、阿里的“生活代理”以及DeepSeek的“极致推理”的全面落地 [16] - 这场竞争本质上是关于“入口”的战争,谁能成为AI时代的超级应用,谁就能定义下一个十年的互联网秩序 [18]
DeepSeek V4即将发布,关注AI应用板块回调时布局机会,软件ETF易方达(562930)连续6个交易日“揽金”
每日经济新闻· 2026-01-30 14:41
市场动态与资金流向 - 1月30日午后大盘震荡回暖,AI应用板块跌幅收窄,截至14:03,中证软件服务指数下跌2.5% [1] - 软件ETF易方达(562930)近期获市场关注,连续6个交易日获资金净流入,合计超1.5亿元 [1] 行业技术进展与竞争格局 - DeepSeek计划于2月发布新一代旗舰AI模型DeepSeek V4,该模型具备强大的编程能力 [1] - DeepSeek V4的发布可能对当前的AI竞争格局产生重大影响 [1] 机构观点与行业前景 - 渤海证券认为,国内DeepSeek V4等大模型迭代升级有望推动技术创新与应用落地加速普及 [1] - 机构持续看好AI应用板块在技术落地提速与场景需求释放的双重驱动下的增长潜力 [1] - 建议关注应用端具备AI技术落地实力与场景适配优势的头部企业 [1] 相关投资工具与指数构成 - 软件ETF易方达(562930)跟踪中证软件服务指数,该指数由30只业务涉及软件开发、软件服务等领域的股票组成 [1] - 指数覆盖AI+办公、AI+金融、AI+教育等各类落地场景 [1] - 指数前十大权重股包括科大讯飞、金山办公、同花顺、指南针、恒生电子等,合计占比超60% [1] - 该ETF为投资者布局AI应用赛道提供了便捷工具 [1]
DeepSeek即将发布V4大模型,软件ETF(159852)掘金计算机软件行业投资机遇
新浪财经· 2026-01-30 13:22
市场行情与指数表现 - 2026年1月30日A股回调整理,截至午间收盘,中证软件服务指数下跌3.06% [1] - 指数成分股中,深信服领跌,中科星图、广联达、卫宁健康、朗新科技跟跌 [1] - 截至2025年12月31日,中证软件服务指数前十大权重股合计占比60.89% [2] - 前十大权重股包括科大讯飞、金山办公、同花顺、指南针、恒生电子、拓维信息、润和软件、三六零、软通动力、深信服 [2] 大模型技术进展与影响 - DeepSeek即将发布V4大模型,其编程能力被预期将对标并超越Claude与GPT系列闭源模型 [1] - 中原证券指出,V4在编码能力、长上下文理解及训练稳定性方面实现质变式跃迁 [1] - V4依托mHC新架构与Engram条件记忆模块,在降低训练成本的同时缓解GPU内存瓶颈 [1] - 该技术进展有望显著改善国产AI芯片HBM受限局面,并加速国产算力生态建设 [1] 智能体(Agent)发展趋势与硬件需求 - 华创证券指出,智能体应用爆发正推动CPU需求结构升级 [1] - 域外CPU在多线程调度、低延迟响应与能效比方面成为性能决定性环节 [1] - IDC预计活跃Agent数量将从2025年的2860万飙升至2030年的22.16亿,年复合增速达139% [1] - 叠加AIDC扩容与先进制程产能倾斜,服务器CPU已进入紧平衡格局 [1] - 国产CPU龙头有望凭借定制化能力切入增量市场 [1] 相关投资工具 - 软件ETF(159852)跟踪中证软件服务指数,是掘金计算机软件行业的便利工具 [2] - 场外投资者还可以通过软件ETF联接基金(012620)布局AI软件投资机遇 [3]
千问、DeepSeek、Kimi齐出手,国产大模型密集上新,“工程化”闯关还有三道坎
每日经济新闻· 2026-01-29 22:52
国内大模型厂商近期动态 - 近期多家国产大模型厂商密集更新模型进展,包括阿里发布千问旗舰推理模型Qwen3-Max-Thinking,DeepSeek开源DeepSeek-OCR 2模型,Kimi发布并开源Kimi K2.5模型 [1] - 1月29日,MiniMax推出Music2.5音乐生成模型,宣布突破两大AI音乐技术难题,引爆港股AI行情,MiniMax股价盘中一度涨超20%,智谱股价盘中也一度涨超10% [1] - 行业更新方向显示,大模型能力进阶及市场竞争焦点已从比拼参数与对话表现,转向更深层的工程化与系统级能力重塑 [1] 行业发展的核心转变 - 行业发展目标是让大模型完成从“科研成果”向“工业产品”的跨越,使非AI专业的业务团队也能稳定安全、高可用、低成本地使用大模型 [1] - 与前期一味堆算力不同,当前阶段更考验大模型的综合能力,标志着国内大模型迈入工程化阶段 [1] 工程化阶段面临的主要挑战 - 第一道坎是成本与效能的平衡难题,大模型尤其是高参数模型的训练与推理成本高昂,堪称“算力吞金兽”,企业自建或频繁调用顶尖模型财务压力巨大,规模化应用需在保持核心性能的同时大幅降低部署与使用门槛 [2] - 第二道坎是稳定性与可解释性的工业级要求,大模型存在“幻觉”及输出结果随机波动等问题,在金融风控、医疗诊断等严肃场景可能带来重大风险,市场需要可预期、可审计、可追溯的工业级模型方案 [2] - 第三道坎是与现有系统的融合之困,大模型能力融入现有系统涉及复杂的API对接、数据格式转换、工作流重组及安全体系适配,当前许多模型仍缺乏与企业核心业务系统深度集成的“中间件”与标准接口 [2] 突破挑战的技术与商业路径 - 技术路径需从“追求极致参数”转向“优化单位算力效能”,目标是让企业用得起、用得好,例如DeepSeek开源OCR模型即在特定任务上追求极致效能与成本优势,在工程化初期比“全能但昂贵”的通用模型更具吸引力 [3] - 交付形态应从单纯提供模型向提供综合服务与解决方案转变,企业客户购买的是解决问题的稳定能力而非技术参数 [3] - 需通过提示词工程、检索增强生成等技术为关键应用场景构建“护栏”,以有效控制幻觉,提升结果可靠性与可解释性 [3] - 唯有跨过工程化深水区,国产大模型才能从“密集上新”走向“深度用上”,其创造的产业价值与市场回报方能坚实而持久 [3]
纳米漫剧流水线公测开启,漫剧“DeepSeek时刻”正式到来
金融界· 2026-01-29 17:43
公司产品发布 - 360公司于1月29日正式启动国内首个工业级AI漫剧智能体生产平台“纳米漫剧流水线”的公开测试 [1] - 该平台专为漫剧工作室、视频制作公司及专业创作者打造,旨在破解行业“效率与品质不可兼得”的核心痛点 [1] - 平台目标为实现“高效量产、品质可控、风格独特”的精品AI漫剧生产新体验,开启AI漫剧工业化生产新时代 [1] 行业背景与挑战 - 国内AI漫剧市场增长迅猛,年上线量增速超过80%,2025年市场规模已突破200亿元 [5] - 行业面临多重挑战:量产与精品化难以兼顾,追求高产易导致粗制滥造,打磨精品则耗时耗力 [5] - 传统AI工具存在“黑盒抽卡、品质失控、内容同质化”等顽疾,导致在生成环节,图片和视频的平均抽卡成功率仅为15% [5] - 行业痛点催生出职业抽卡师,造成严重的算力与人力的双重浪费,制约了行业创新与可持续发展 [5] 平台核心功能与优势 - 平台将剧本解析、资产生成、分镜制作、动态合成等环节整合为一体化工作流,系统性将创作控制权交还创作者 [5] - 高效量产,操作便捷:制作速度达到主流工具的3倍以上,单集生产时间可压缩至30分钟至1小时 [5] - 素材生成成功率突破90%,远超行业平均水平,使制作精品漫剧无需浪费时间抽卡 [5] - 通过“流水线推进+智能画布调整”双模式交互,实现精品内容的规模化高效产出 [5] - 搭载专属“视频世界模型”,构建“三维场景+一维时间线”的四维影视空间,使漫剧创作具备空间、资产、视觉三大记忆能力 [6] - 该模型保障全流程风格与叙事一致性,助力创作者聚焦于故事与创意的表达 [6] - 支持影视级分镜设计与动态演绎,增强镜头叙事感染力,实现创作过程100%可控 [6] - 开放私有智能体接入,支持打造独特视觉风格,兼顾专业品质与操作友好性 [6] 市场合作与生态构建 - 纳米漫剧流水线已与保利影业、华视娱乐、奇想文化、友和文化、兴艺凯晨、九紫源AI等多家头部影视及漫剧公司达成合作 [9] - 合作方将共同探索基于工业化流程的漫剧生产新模式,以系统性提升内容质量与产能 [9] - 已有部分合作项目完成制作,将于近期陆续上线 [9] - 合作方九紫源AI是爆款金奖AI拟真人剧《机甲局》的制作方,双方将合作推出《机甲局》第二季 [9] - 该平台不仅是生产力工具,更是360推动构建AI漫剧行业标准的重要载体,体现了“以技术赋能创意”的核心主张 [9] - 产品公测通道已正式开放,用户可登录 namistory.com 申请体验 [9] - 公司期待与行业伙伴携手,逐步建立高效、可控、可持续的AI漫剧工业化生态,共同开启内容创作新阶段 [9]
国产大模型同日转向:DeepSeek向左,Kimi向右,拼落地的时代开始了?
36氪· 2026-01-29 08:29
文章核心观点 - 国内两大AI模型公司DeepSeek与Kimi几乎同时发布重要开源更新,标志着大模型的发展重点从提升参数规模和对话能力,转向重构底层工程化能力,以解决实际应用中的效率与协作问题[6] - 行业共识是AI的升级方向正从“模型有多强”转向“能否真正用起来”,核心在于让AI更深一步嵌入真实工作环境,价值衡量标准变为是否更省成本、更少出错、更值得长期依赖[15][23] DeepSeek-OCR 2的关键升级 - 该模型是对去年震动行业的DeepSeek-OCR的关键升级,核心是重新设计AI“读文档”的方式,通过新的视觉编码机制让大模型学习人类的视觉逻辑[1][8] - 其技术路径从上一代的CLIP架构转向以Qwen2为基础的LM视觉编码器,使模型能像人一样先看版面、抓重点,再理解含义,区分标题、表格及相关信息[8] - 直接价值体现在具体体验提升:处理几十页报告时无需逐字读完;处理复杂表格时减少错位问题;由于输入被高度压缩,相同任务能以更低成本、更短时间完成[10] - 此次升级解决的是一个长期存在的“用起来不顺”的工程化问题,有潜力让AI更适合被放进真实的文档流程,如检索、比对、摘要及结构化信息抽取[10] Kimi K2.5的核心进展 - Kimi K2.5继续推进其超长上下文、多模态与“智能体化”路线,目标是将AI从“答题模式”推向“执行模式”,打造更接近“数字助理”的体验[1][4][12] - 模型宣称是迄今最智能、最全能的模型,同时支持视觉与文本输入、思考与非思考模式、对话与Agent任务[4] - 升级重点在于“长记忆+多模态+智能体”:超长上下文让模型能长期记住对话与中间结论;多模态能力使其能理解图片、界面截图等;智能体能力则让AI能拆解复杂任务并执行,实现了“Agent集群”在不同阶段调用不同能力[12] - 其追求并非单一能力点的极限,而是能否承接更长、更复杂、更接近真实工作的任务链条,让AI真正进入工作流[14] 行业升级趋势与共识 - 近期主流大模型(包括OpenAI GPT-5.2、Anthropic Claude 4.5、Google Gemini 3、字节跳动豆包1.8、阿里巴巴千问Qwen3-Max-Thinking)的升级方向异常一致,重心从“模型有多强”转向“让AI更深一步进入真实的工作环境”[15] - 具体升级围绕几个核心维度打磨:记得住、看得懂、接得住流程、干得完事情[16] - **记忆能力被集体拉高**:各模型通过更长的上下文和更稳定的状态保持,让AI能够跟随长任务协作,减少用户重复解释背景的需要,例如GPT-5.2将长上下文产品化,Kimi K2.5将其嵌入智能体流程[17] - **对“看”的能力重新理解**:升级重点从“能识图”转向“能不能看懂”,强调理解图像中的结构、版面和信息组织方式,DeepSeek-OCR 2是此方向的激进代表,GPT、Claude、Gemini也都在强化对截图、界面等复杂图像的理解[18][19][21] - **AI角色从“顾问”向“执行者”转移**:模型设计开始强调拆任务、接工具、跑流程,价值判断标准从“说得对不对”转向“能不能跑完、稳不稳”,“工程化”重要性凸显[22] - **国内外公司均强调产品封装与部署**:DeepSeek、Kimi、千问、豆包等国内公司强调模型是否好部署、好接入现有系统;国内外AI都通过产品封装将复杂能力隐藏在界面和服务之下,目标都是让AI从“演示”走向“可用”、“好用”[22]