开源大模型
搜索文档
Anthropic指控中国AI“抄袭”,背后有何资本算计?
搜狐财经· 2026-02-27 16:32
事件背景与指控 - 美国AI独角兽Anthropic于2026年2月开工日,突然指控DeepSeek、月之暗面(Kimi)等3家中国AI企业,通过“蒸馏攻击”抄袭其技术 [2] - 指控发出后一天,Anthropic宣布对其核心安全政策进行“软化”,表示一旦竞争对手发布“同类或更先进”的模型,将不再以模型“具有危险性”为由暂停开发 [2] - 埃隆·马斯克对此事件发表嘲讽评论:“他们怎么敢偷Anthropic从人类程序员那里偷来的东西?” [2] - “蒸馏”是全球部分AI公司训练大模型的常用手段,而Anthropic自身也是该技术的使用者,且存在更激进的数据抓取行为 [4] - 2025年9月,Anthropic在官方文件中明确封禁对中资企业的服务,成为人工智能领域对中国最不友好的公司之一 [4] - 2026年2月12日,OpenAI向美国国会提交内部备忘录,指控DeepSeek通过复杂手段绕过安全防护对GPT系列模型实施蒸馏行为 [4] 指控背后的市场与资本动因 - 进入2026年2月,美国AI概念股出现多轮明显下跌,资本市场对人工智能的未来产生了“颠覆传统商业模式”的担忧 [4] - CNN评论指出,不少所谓大模型,其实只是精心包装过的搜索引擎 [4] - 有观点认为,Anthropic面临估值承压,此时指控中国企业,本质是向资本市场传递“自身技术领先”的信号,以保住其高估值 [6] - 此举也暴露了市场对闭源AI系统越来越深的不信任 [6] - Anthropic等大模型也借此为自身的安全政策“松绑”,营造更宽松的政策氛围 [6] 中国AI企业的回应与发展路径 - 对于Anthropic的单方面指责,DeepSeek、月之暗面、MiniMax均未予以回应 [7] - 业内人士认为,中国企业的沉默源于对自身技术实力的自信,且不想陪美国舆论炒作 [7] - 中国AI企业已走出破局之路,其快速进步得益于国内庞大的工程师群体、丰富的数据资源、相对完善的产业链以及对开源开放路线的坚持 [9][10] - 月之暗面最新一轮估值超过40亿美元,由阿里、腾讯、五源、九安等机构联合领投 [9] - 中国的AI应用(如豆包、千问、元宝等)通过大规模补贴吸引新用户,完成了从“爆发式增长”向“规模投入换用户增长”的转型 [12] - 春节红包大战印证了这一趋势,中国市场强调用补贴+高速增长培育场景和用户习惯,与欧美更注重企业级付费或平台变现的策略形成对比 [12] - 中国企业在本土规模和应用场景拓展上形成强大生态推动力,从消费端App到行业级部署都在快速推进 [12] 全球AI产业竞争格局演变 - 随着英伟达对OpenAI的超大规模投资,资本在可预见的未来将围绕算力和平台生态形成新级别的“产业壁垒”,通过资本深化产业绑定 [12] - AI产业正从单纯的技术革命阶段,迈入“资本赋能+商业生态重构+全球竞争分化”的新阶段 [15] - 未来的赢家将不仅仅是技术最强者,更是能够构建持续变现生态和全球网络效应的平台型企业 [15] - 美国企业通过资本集中、算力布局、产品领导地位等方式强化全球优势 [12] - 中国AI从“技术秀”转向产业深耕,制造、医疗、消费三大领域规模化落地,开源+生态成为关键 [22] - 美国AI从“通用模型”走向专用智能体,在自动驾驶、企业服务、军事AI等领域寻求突破,以定制算力+垂直模型构建壁垒 [22] AI投资趋势与核心瓶颈转移 - 华尔街AI概念股大跌,折射出资本对新技术短期前景的疑虑,但对其作为商业基础设施的稳定增长已无质疑 [16] - 全球AI投资已从“押注技术不确定性”,进入“押注确定性扩张路径”的阶段 [16] - 随着算力资源日趋稀缺,AI的核心瓶颈已不在模型,而在于谁能长期、稳定、低成本地获得算力 [18] - GPU/AI专用芯片、算力租赁、算力云等相关板块,更具投资潜力 [18] - AI领域正经历从模型到智能体、再到平台的演进,未来行业核心竞争力在于对Agent调度的控制、工具接口的定义以及用户行为数据的沉淀 [18] 中国市场独特的AI投资机会 - 字节跳动豆包、阿里巴巴通义千问、腾讯元宝等产品通过大规模补贴拉新,本质是通过占领用户交互入口,获取真实世界的AI行为数据 [20] - AI时代,开放更多AI入口的目的是让更多人使用AI、迭代AI、通过AI协作形成行为记录,这类数据无法通过爬虫获取,只能依靠真实用户规模积累 [20] - 未来超级AI应用、AI与社交、内容、办公、搜索的结合,以及具备分发能力的平台型公司将具有一定的发展潜力 [20] - 这类投资短期会压制企业利润,但中长期有望培育出中国的AI平台型巨头 [20] - AI投资的兑现点还在于AI行业化应用,最早实现稳定盈利的往往是行业应用 [21] - 2026年2月,国内各大厂的AI应用进入爆发式发展 [21] - 字节跳动的Seedance 2.0:AI视频生成模型,支持文本、图像、音频多模态输入,视频音频同步生成,60秒出片,成本降至人工拍摄的1/10,海外创作者使用率破千万 [21] - 千问可以在对话框联动淘宝/支付宝,AI一句话即可激发下单近2亿次 [21] - 2026年1月,开源AI项目Clawdbot引爆全球技术圈,其核心突破在于将AI从“被动对话工具”转变为“主动执行的数字智能体” [22]
沙利文:中国企业级大模型日均调用量提升至37.0万亿tokens 阿里千问领先优势扩大占比第一
智通财经网· 2026-02-24 11:14
全球AI厂商发布策略分化 - 2025年下半年,全球AI厂商发布策略显著分化,中国厂商依托规模化投入在开源生态中占据主导地位,海外厂商则持续聚焦闭源主线,发布频次与覆盖广度相对有限,呈现出“少而影响力集中的闭源发布特征” [1][2] - 中国闭源基础模型赛道快速收敛,头部效应在2025年下半年集中显现,而开源模型全面爆发,中国成为全球开源大模型创新引擎 [2] 中国企业级大模型调用量跃迁 - 2025年下半年,中国企业级大模型日均调用量提升至37.00万亿tokens,较2025年上半年的10.19万亿tokens增长263%,实现阶段性跃迁 [1][4] - 调用量跃迁反映出AI在企业中的定位发生变化,正从零散辅助走向关键流程的深度嵌入,增长核心来自单个业务流程中AI调用频次与覆盖环节的提升,大模型逐步成为企业提升生产效率的重要通用能力 [4] - 增长的核心驱动来自Agent相关架构在企业侧加速落地,以及模型能力与工程化配套持续提升,2025年12月日均tokens达到阶段高点并显著高于下半年均值 [4] 开源与闭源模型调用格局变化 - 2025年下半年,开源模型和闭源模型的调用量均呈现显著提升,其中开源模型调用量占比反超闭源模型,成为企业级大模型的主流部署模式 [7] - 企业新增调用主要来自两类需求:面向核心系统与对外服务的扩容(优先选择闭源模型),以及内部效率工具与业务支撑应用的新增或快速扩张(更适合由开源模型承接),两类需求同步增长 [7] - 随着应用进入持续、高频的规模化使用,成本与可控性的重要性显著上升,开源模型通过本地化部署等方式降低单位tokens使用成本,推动其在新增调用中占比提升 [7] 企业模型迁移意愿与方向 - 企业级大模型调用流转意愿整体增强,且迁移结构仍明显偏向“闭源转向开源”,闭源用户向开源增配的意愿由22.6%升至48.5%,开源用户向闭源增配的意愿由5.0%升至7.5% [9] - 随着调用规模扩大,闭源模型按调用计费带来的成本压力被放大,促使企业将一部分可标准化、可替代的通用场景逐步迁移或增配到开源体系,以提升成本可控性 [9] 主要应用场景与增长方向 - 文本内容创作(19.4%)、问答助手(13.7%)、数据处理与分析(12.9%)、内部知识问答(12.6%)、代码生成与辅助(12.4%)是企业大模型应用占比最高的基础场景 [11] - 从增长维度看,多模态内容创作以+11.9%的增速位居首位,显著高于AI搜索(+4.7%)与智能客服(+4.4%),成为2025年下半年增长最快的业务场景 [11] 市场集中度与厂商格局 - 2025年下半年企业级大模型市场向头部厂商高度集中,企业在调用规模扩大阶段,对供应商的选择逐步收敛为两条路径:依托云平台的一体化能力,或在非核心场景中以更低成本承接部分流量作为补充 [14] - 随着模型嵌入关键业务流程,企业更倾向于压缩供应商数量以降低长期运维负担,在日均调用规模提升至万亿级tokens后,高并发、长周期场景下的新增流量通常优先投向已验证具备稳定承载能力的头部厂商 [14] - 以阿里云千问为代表的模型,凭借算力调控能力、生态适配能力与规模化成本优势,更容易在增量需求中获得持续导入,推动企业级市场份额进一步集中,其占比从2025年上半年的17.7%跃升至下半年的32.1%,几乎翻倍 [1][14]
还有高手?千问新模型压轴亮相
搜狐财经· 2026-02-17 00:25
阿里发布新一代大模型Qwen3.5 - 阿里在大年初一前发布了新一代大模型Qwen3.5 [1] - Qwen系列在开源阵营中通常“发布即登顶” [1] Qwen3.5-Plus的核心技术突破 - Qwen3.5-Plus总参数为3970亿,相比上一代旗舰Qwen3-Max的万亿参数不增反降 [2] - 该模型以不到前代模型40%的参数量,将性能做到了Gemini 3 Pro的级别 [2] - 每次响应的激活参数只有170亿,相当于只用5%的算力资源调动满血智能 [2] - 交付给用户的token成本只有Gemini 3 Pro的1/18 [2] - 模型引入了混合注意力模式,学会“有详有略的读” [2] - 其重大突破的门控技术,源自阿里在2025 NeurIPS上斩获最佳的论文,成果可供所有科技公司吸收 [3] 模型架构的演进路径 - 千问大模型持续死磕MoE架构 [2] - 从Qwen1.5启动细粒度专家模式开始,到Qwen3摒弃共享专家改用路由专家,再到Qwen3.5引入混合注意力模式 [2] - 历次更新都在推翻和重建,是开源大模型中前沿含量最高的一个 [1] 行业竞争格局与影响 - 中国厂商(Qwen、GLM、Kimi、DeepSeek等)已彻底领跑开源模型队列,并以无死角的交叉线路完成对闭源模型的全面包围 [3] - 阿里成为在全模态上100%对标谷歌的公司,从预训练第一天起就在文本和视觉的混合数据上联合学习,实现视觉与语言在统一参数空间内的深度融合 [3] - 国产大模型与地表最强SOTA之间的距离已缩短至3个月,超车的身位已经可以看到 [3]
GLM-5真够顶的:超24小时自己跑代码,700次工具调用、800次切上下文
36氪· 2026-02-12 18:40
模型性能突破 - GLM-5具备卓越的长任务处理与工程能力,能够连续运行代码超过24小时,期间稳定完成700次工具调用和800次上下文切换[2] - 模型在无并行、无参考代码、关闭网络搜索的严苛条件下,从零开始手写JavaScript代码,成功创建了一个功能完整的Game Boy Advance模拟器,该任务涉及处理500多条CPU指令集、内存分页、音频子系统和图形渲染时序等复杂工程[7] - 在长任务执行中展现出高度稳定性和可靠性,具体表现为:工具调用在语法、格式和准确度上从第1次到第700次无差异;即使经过800次上下文切换,仍能严格遵守元提示的规范和流程;能自主判断何时进行测试、记录信息或切换策略;每次上下文清空后,能准确从笔记和文件中恢复工作状态[7] 基准测试表现 - 在权威榜单Artificial Analysis的评测中,GLM-5达到了与Claude Opus 4.5比肩的水平[10] - 在业内主流基准测试中,GLM-5的编程能力实现了与Claude Opus 4.5对齐[12] - 在衡量模型经营能力的Vending Bench 2测试中,GLM-5取得了开源模型第一的成绩[18] 实际应用与开发潜力 - 模型能够从零生成复杂的3D游戏,例如3D版大富翁,并能根据更精细的提示实现如“龙虾版3D大富翁”对战等高级功能[22][24] - 已有用户利用GLM-5开发了学术版“抖音”应用,并已提交上架苹果App Store,另有10余款APP准备上架[24] - 模型能精准理解并实现复杂的物理规律描述和视觉效果需求,例如使用three.js创建具有多层玻璃壳和动态外观变化的十二面体[27] - 模型具备全栈开发能力,可以制作完整且有设计感的电商网站,以及手搓3D版可交互的《我的世界》[27] 行业影响与意义 - GLM-5标志着开源大模型完成了一次从“助手”到“独立工程师”的质变,能够接受目标后自主执行长任务,极大减少人工调试[29] - 其开源特性将原本属于闭源巨头的长任务和工程能力交到了所有开发者手中,可能对SaaS行业构成冲击,此前市场已因Claude Opus等闭源模型的长任务能力而出现恐慌,导致金融数据服务商FactSet盘中暴跌10%,以及S&P Global、穆迪等公司股价下跌[29] - 模型的出现可能重塑软件行业,引发投资者对年费软件模式的担忧,因为AI能够现场创建如CRM系统等复杂软件[29] 市场反响与公司动态 - GLM系列模型从4.5版本开始专注于AI编程,其“coding套餐”在国内外市场反响火爆[30] - GLM-5发布后,智谱公司采取了限售策略,导致外国网友出现“求”购状态[30] - 智谱公司大楼已成为一个打卡点,显示出产品的高关注度[30]
GLM-5真够顶的:超24小时自己跑代码,700次工具调用、800次切上下文!
量子位· 2026-02-12 15:52
GLM-5模型的技术突破与工程能力 - 模型在无并行、无参考代码、关闭网络搜索的条件下,连续运行超过24小时,完成了700次工具调用和800次上下文切换,成功从零手搓了一个Game Boy Advance模拟器[3][11] - 该模拟器工程任务复杂,涉及500多条CPU指令集、内存分页机制、音频子系统和图形渲染时序,对AI的指令遵循和工程稳定性要求极高[9][10] - 在长任务执行中,模型展现出稳定的工具调用能力,第700次与第一次调用在语法、格式和准确度上无差异,且能稳定进行工作判断和上下文状态恢复[12][17] GLM-5模型的性能与基准测试表现 - 在权威榜单Artificial Analysis中,GLM-5达到了与Claude Opus 4.5比肩的水平[15] - 在衡量模型经营能力的Vending Bench 2基准测试中,GLM-5取得了开源第一的成绩[23] - 在主流基准测试中,其编程能力与Claude Opus 4.5对齐,展现出持久的指令遵循能力,即使在800次上下文切换后仍能遵守规范[17] GLM-5模型的实际应用与产品化案例 - 模型能够从零生成复杂的3D版大富翁游戏,并有人已申请将其上架App Store[26][27] - 用户利用模型制作了学术版“抖音”并提交上架苹果App Store,另有10余款APP计划上架[28] - 模型成功完成了对复杂物理规律描述的理解任务,例如根据详细Prompt使用three.js创建了一个光影交错的玻璃十二面体[33] - 模型能够胜任全栈类型任务,如制作完整且有设计感的电商网站,以及手搓3D版可交互的《我的世界》[34][35] GLM-5模型对行业的影响与意义 - 开源大模型GLM-5的出现,标志着AI从助手到独立工程师的质变,能够独立完成长周期、复杂的目标任务[37] - 其能力可能对SaaS行业构成冲击,此前Claude Opus等闭源模型展现长任务能力时,已引发市场对SaaS软件类股票的抛售担忧[38][39][40] - GLM-5将原本属于闭源巨头的长任务能力开源化,为所有开发者提供了重塑工具和创造的可能性[40] - 智谱公司的GLM系列模型从4.5版本开始专注于AI编程,其“coding套餐”在国内外市场反响热烈,GLM-5发布后甚至出现限售和外国网友“求”购的情况[41]
GLM-5引爆行情!智谱大涨28%
第一财经资讯· 2026-02-12 12:29
智谱GLM-5模型发布与市场反应 - 智谱于2月12日正式上线并开源新模型GLM-5,首个交易日股价上涨28.68% [4] - 此前在全球模型服务平台OpenRouter登顶热度榜首的神秘模型“Pony Alpha”被官方确认为GLM-5 [4] - GLM-5更新重点强化编程与智能体能力,预训练数据从23T提升至28.5T [4] - 模型构建了全新的“Slime”框架以支持更大规模和更复杂的强化学习任务,并首次集成DeepSeek稀疏注意力机制以降低部署成本 [4] GLM-5的技术能力与行业定位 - GLM-5在编程与智能体能力上取得开源SOTA表现,在真实编程场景的使用体感逼近Claude Opus 4.5,擅长复杂系统工程与长程智能体任务 [5] - 其智能体工程典型应用场景包括端到端应用开发、通用智能体助手、全流程编程以及办公文档直接输出等 [5] - 近期热门的开源AI智能体系统OpenClaw可接入GLM-5,实现搜索、资讯整理、发布推文、编程等功能,智谱官方推出的AutoGLM版本支持一键完成OpenClaw与飞书机器人的配置 [5] 近期行业模型更新趋势 - 除智谱外,近期多家模型厂商在“春节档”发布更新,包括阶跃星辰Step 3.5 Flash、阿里Qwen3-Coder-Next、MiniMax的MiniMax-M2.5等 [6] - 行业更新动态显示模型发展更聚焦于推理效率、长上下文、多模态和低成本等方向 [6] - 具体技术进展包括DeepSeek的OCR 2和Engram架构优化算力效率,阿里与Kimi的模型强调推理与多模态融合,以及MoE架构和FP8精度等技术使模型单次调用成本从“元”级降至“分、厘”级 [6] - DeepSeek近期在网页端和APP端更新,支持最高1M Token的上下文长度,较其去年8月发布的DeepSeekV3.1的128K上下文长度大幅提升 [6]
OpenClaw调用量Kimi K2.5冲上榜首;阿里开源智能体编程模型Qwen3-Coder-Next|未来商业早参
每日经济新闻· 2026-02-05 07:04
高鑫零售管理层突发状况 - 公司公告暂时无法与执行董事兼首席执行官李卫平取得联系 [1] - 董事会认为该事项与集团业务及营运无关,且无重大不利影响,业务及营运维持正常 [1] - 事件短期可能带来情绪冲击,长期影响取决于管理层稳定与转型策略的持续推进 [1] AI大模型与智能体竞争格局 - 中国AI模型Kimi K2.5在AI智能体平台OpenClaw的模型调用量中排名第一,超过Gemini 3 Flash、Claude Sonnet 4.5等模型 [2] - 此事件被视为中国开源大模型在全球AI智能体领域竞争力提升的重要信号,行业竞争从“技术追赶”转向“生态竞争” [2] AI编程模型技术进展与成本优化 - 阿里巴巴开源新一代智能体编程模型Qwen3-Coder-Next,其智能体编程性能可媲美DeepSeek-V3.2、GLM-4.7等开源模型 [3] - 该模型仅激活3B参数,实现了智能体训练的创新性扩展,并能处理长上下文和复杂智能体任务 [3] - 模型推理成本显著降低,仅为同等性能模型成本开销的5%~10%,体现了AI模型轻量化、低成本化的技术突破 [3]
中国AI的“Max时刻”!千问最强模型开启第二增长曲线
新浪财经· 2026-01-27 20:07
文章核心观点 - 阿里巴巴通过发布旗舰推理模型Qwen3-Max-Thinking,在关键性能上超越国际顶尖模型,标志着中国AI技术实现代际领先,并可能推动资本市场对阿里巴巴及其AI业务进行价值重估 [8][10][13] - 行业正从依赖算力堆砌的“拼算力”阶段,转向追求高效智能的“拼智能”阶段,阿里巴巴通过技术创新找到了第二增长曲线 [14][17][20] - 阿里巴巴的Qwen系列在开源生态取得统治性地位,其全球采用率已超越美国,并反向影响了硅谷巨头的技术发展,重写了全球AI地缘政治格局 [22][23][25] - 阿里巴巴是中国唯一、全球唯三具备“算力、模型、应用”全栈闭环能力的科技公司,其从底层芯片到上层应用的全栈优势正在转化为坚实的护城河,为估值重构奠定基础 [31][34] 资本市场定价逻辑的演变 - 2024至2025年,市场曾因中国大模型表现而短暂对中国AI资产进行“重估”,但性质更多是情绪修复,华尔街仍将阿里的AI价值视为有潜力的看涨期权,而非核心增长引擎 [6][7] - Qwen3-Max-Thinking在多项全球权威评测中超越GPT-5.2和Gemini 3 Pro,成为首个性能最接近国际顶尖的国产模型,这改变了技术代差,使资本市场对阿里的AI重定价成为必然 [8][10][13] Qwen3-Max-Thinking的技术突破 - 模型性能实现质的飞跃,在启用工具的HLE评测中得分58.3,远超GPT-5.2-Thinking的45.5和Gemini 3 Pro的45.8,超过10分的差距意味着代际领先 [10] - 核心突破在于“测试时扩展”机制,引入“经验提取”式提炼过程,让模型进行多轮自我迭代和慢思考,在同等算力下产出更高密度的智能 [9][18][19] - 模型总参数超万亿,预训练数据高达36T Tokens,其HLE测试高分证明能处理现实世界中模糊、多变的任务 [19] - 模型实现了原生Agent能力的内化,可自主判断并调用工具,边用边思考,大幅降低幻觉,为企业级应用提供可靠性,展现了面向Agent时代规模化落地的可能性 [12][20] 行业发展趋势:从拼算力到拼智能 - 过去五年AI发展遵循Scaling Laws,依赖堆算力和数据,但2025年后遭遇高质量数据枯竭和训练成本指数级爆炸的物理墙 [15][16] - 行业增长曲线正从训练转向推理,迫切需要第二增长曲线 [17] - 阿里巴巴通过Qwen3-Max-Thinking的“系统2”式思维和高效推理机制,探索从“成本叙事”转向“价值叙事”的智能化解决方案 [18][20] 开源生态的格局重塑 - 截至2026年1月,基于Qwen的衍生模型数量突破20万个,成为全球首个达成此目标的开源家族,累计下载量突破10亿次,日均下载110万次,完全超越Llama稳居全球第一 [23] - MIT研究指出,中国开源AI模型的全球采用份额跃升至17.1%,首次超越美国的15.8% [25] - Qwen的胜利源于“全尺寸、全模态”策略,覆盖0.5B到480B全参数段并支持119种语言,使其在东南亚、中东等新兴市场成为首选 [25] - 硅谷内部出现戏剧性信号:Meta内部秘密项目采用“蒸馏”技术向Qwen学习,间接承认了Qwen在特定能力上的领先 [26][27] - 英伟达CEO黄仁勋在2025 GTC大会上直言“中国在开源领域遥遥领先” [27] 阿里巴巴的全栈能力与护城河 - 阿里巴巴是中国唯一、全球唯三具备“算力、模型、应用”全栈闭环能力的科技公司 [31] - 在算力层面,面对芯片限制,阿里平头哥研发的PPU在特定推理任务上性能已与英伟达H20相当,配合倚天710芯片构建了“一云多芯”异构算力体系,市场消息称平头哥可能独立上市 [32] - 在云基础设施层面,阿里云已构建中国最完整的AI基础设施,摩根士丹利预测其收入将在三年内翻倍,从2025财年的1180亿元增长至2028财年的2400亿元,目标是在2026年拿下中国AI云市场增量的80% [33] - 在应用层,千问APP上线首周下载量突破1000万,两个月月活即突破1亿,正从聊天机器人进化为全球首个“能办事”的AI,全面接入淘宝、支付宝等生态,将AI价值从信息层推向交易层 [34] - 公司宣布未来三年将投入超过3800亿元用于建设云和AI硬件基础设施,高达3000亿级别的投入是对未来竞争资格的买断 [34]
DeepSeek概念股短线拉升,OCR 2重磅发布,让AI学会“人类视觉逻辑”
金融界· 2026-01-27 14:18
市场反应 - DeepSeek发布新模型引发相关概念股短线拉升,云赛智联直线触及涨停,宏景科技20cm涨停,开普云、世纪恒通、并行科技短线拉升 [1] 技术突破与性能 - DeepSeek发布DeepSeek-OCR2模型,采用创新的DeepEncoder V2方法,使AI能根据图像含义动态重排图像部分,更接近人类视觉编码逻辑 [1] - 该技术打破传统OCR按固定顺序识别的局限,能更好理解图像语义关联,在复杂排版、扭曲变形、遮挡模糊等场景下识别准确率大幅提升 [6] - 在OmniDocBench v1.5基准测试中,该模型取得91.09%的成绩,较前代DeepSeek-OCR提升3.73% [6] - 模型在保持高精度的同时严格控制计算成本,其视觉Token数量限制在256至1120之间,上限与Google的Gemini-3 Pro保持一致 [6] - 在实际生产环境中,模型处理在线用户日志和PDF预训练数据时的重复率分别下降2.08%和0.81%,显示出极高的实用成熟度 [6] 架构意义与未来方向 - DeepSeek-OCR 2的发布具有深远的架构探索意义,DeepEncoder V2初步验证了使用语言模型架构作为视觉编码器的潜力 [7] - 这种架构天然继承了LLM社区在基础设施优化方面的成果,如混合专家架构和高效注意力机制 [7] - 这为迈向统一的全模态编码器提供了有希望的路径,未来单一编码器可能通过配置特定模态的可学习查询,在同一参数空间内实现对图像、音频和文本的特征提取与压缩 [7] - 模型展示的"两个级联的1D因果推理器"模式,通过将2D理解分解为"阅读逻辑推理"和"视觉任务推理"两个互补子任务,或许代表了实现真正2D推理的一种突破性架构方法 [7] 应用领域与行业机遇 - 模型可广泛应用于金融票据处理、医疗病历录入、政务文件数字化、古籍修复识别等多个领域,帮助相关企业降低人工识别成本,提升信息处理效率 [6] - OCR技术应用行业:为OCR行业带来技术升级方向,相关从事图文信息处理、数字化转型服务的企业可借助该模型优化自身产品,在金融、医疗、政务等领域拓展更多业务场景,迎来业绩增长机遇 [8] - 开源大模型服务行业:DeepSeek坚持开源开放的技术路线,持续推出高性能模型产品,为开发者和企业提供优质的模型底座,专注于大模型二次开发、模型部署与运维服务的企业将受益于行业热度提升,获得更多合作订单与市场关注 [8] - 端侧AI适配:众多企业完成DeepSeek模型在端侧设备上的适配部署,推动AI能力向边缘侧延伸,从事端侧硬件研发、边缘计算方案设计的企业将迎来发展机会,助力智能家居、智能车载、工业物联网等场景下的AI应用快速落地 [8]
北水动向|北水成交净买入139.3亿 北水再度加仓港股ETF 抢筹盈富基金(02800)超41亿港元
智通财经· 2026-01-21 18:08
港股市场南向资金整体流向 - 1月21日,南向资金(北水)成交净买入139.3亿港元,其中港股通(沪)净买入77.89亿港元,港股通(深)净买入61.41亿港元 [1] - 南向资金净买入最多的个股是盈富基金、恒生中国企业、阿里巴巴-W [1] - 南向资金净卖出最多的个股是中国移动、腾讯、华虹半导体 [1] 主要个股资金流向详情 - 盈富基金获净买入26.99亿港元,买卖总额为28.60亿港元 [2] - 恒生中国企业获净买入18.17亿港元 [4] - 阿里巴巴-W获净买入9.45亿港元,买卖总额为42.24亿港元 [2],另据消息,其获净买入10.77亿港元 [5] - 小米集团-W获净买入3.08亿港元,买卖总额为41.87亿港元 [2],另据消息,其获净买入5.89亿港元 [7] - 腾讯控股获净买入2956.91万港元,买卖总额为27.43亿港元 [2],但综合消息遭净卖出2.71亿港元 [7] - 中芯国际遭净卖出1.25亿港元,买卖总额为25.83亿港元 [2],但另据消息其获净买入3.87亿港元 [6] - 中国移动遭净卖出9.21亿港元,买卖总额为20.70亿港元 [2][7] - 华虹半导体遭净卖出1.20亿港元,买卖总额为14.26亿港元 [2][6] - 美团-W获净买入2.05亿港元,买卖总额为8.68亿港元 [4],另据消息其获净买入2.04亿港元 [7] - 快手-W获净买入2.62亿港元,买卖总额为6.07亿港元 [4],另据消息其获净买入7.33亿港元 [5] - 山东黄金获净买入3.03亿港元,买卖总额为6.66亿港元 [4] - 中国人寿获净买入10.07亿港元 [5] - 中海油获净买入3.64亿港元 [7] 行业与公司动态 - 阿里巴巴旗下千问衍生模型数突破20万个,成为全球首个达成此目标的开源大模型,系列模型下载量突破10亿次,平均每天被下载110万次,稳居开源大模型全球第一 [5] - 快手旗下视频生成大模型可灵AI的月活跃用户在1月突破1200万,1月App端付费用户规模较去年12月增长约350%,日均收入水平较12月日均提升约30% [5] - 芯片行业出现分化,台积电将2026年资本开支大幅上调至520-560亿美元,DRAM价格持续上涨,DDR4部分型号周涨幅超12%,美光指出AI需求占比已快速提升至DRAM市场的50-60%,供给紧张或延续至2028年 [6] - 现货黄金价格历史首次升破4876美元/盎司关口,波兰央行批准一项购买多达150吨黄金的计划,将使该国黄金储备总量增加到700吨 [7] - 美国暂未就军事打击伊朗作出决定,转而选择通过经济手段施压,但美伊冲突仍存升级的潜在风险 [7] - 中国人寿方面,开源证券认为其个险和银保开门红均超预期,花旗预期寿险行业将迎来财富重新配置带来的历史性机遇 [5]