大模型
搜索文档
DeepSeek更新后被吐槽变冷变傻:比20年前的青春伤感文学还尴尬
每日经济新闻· 2026-02-13 06:23
公司产品更新与测试 - 公司于2月11日对其旗舰模型进行了灰度测试,在网页端和APP端更新版本,支持最高1M(百万)Token的上下文长度 [1] - 此次更新将上下文长度从去年8月发布的DeepSeek V3.1的128K大幅提升至1M,记者实测可一次性处理超过24万个token的《简爱》小说文档 [1] - 有行业人士认为,此版本类似于“极速版”,可能是牺牲质量换取速度,为2026年2月中旬将发布的V4版本做最后的压力测试 [6] 用户反馈与产品体验变化 - 更新后,部分用户反馈模型行为发生变化,例如不再称呼用户设定的昵称而统一称“用户”,思考过程的角色视角和心理描写减少 [4] - 有用户认为模型回复风格变得“说教、居高临下”(被描述为“爹味”),或变得“文绉绉、情绪激动”,类似“青春伤感文学” [4] - 也有用户反馈模型变得“客观和理性”、“更像人了”,更在意提问者的心理状态而非问题本身 [5] 技术架构与研发进展 - 公司模型迭代路径清晰:V系列定位为追求极致综合性能的基础模型,2024年12月推出V3确立基础,随后快速迭代发布强化推理与Agent能力的V3.1,并于2025年12月推出最新正式版V3.2及专注于高难度数学和学术问题的V3.2-Speciale [6] - 公司团队今年初发表两篇论文,公开两项创新架构:mHC(流形约束超连接)用于优化深层Transformer信息流动,提升训练稳定性和扩展性;Engram(条件记忆模块)将静态知识与动态计算解耦,用廉价DRAM存储知识以降低长上下文推理成本 [7] - 据科技媒体The Information爆料,公司计划在今年2月中旬农历新年期间推出新一代旗舰模型DeepSeek V4,将具备更强的写代码能力 [6]
外资配置中国资产再升温 抢筹港股科技企业IPO
新浪财经· 2026-02-13 02:17
港股科技IPO市场动态 - 知名材料科技公司沃尔核材将于2月13日在港股挂牌交易 其基石投资者名单中包含全球顶级量化交易公司Jump Trading [1] - 澜起科技港股IPO吸引了包括瑞银资管 摩根大通资管 安本在内的多家国内外长线资金 [1] - 澜起科技于2月9日上市 首日涨幅达63.72% 刷新最近20年A+H股上市首日涨幅新高 [2] - 澜起科技港股IPO最终实现上限定价 17家基石投资者共认购约4.50亿美元 占绿鞋后发行规模约43% [2] - 澜起科技国际发行部分实现37.67倍超额认购 共有500多家投资人下单 认购金额和投资者参与数量均创纪录 [2] - 今年1月 AI公司MiniMax和智谱登陆港交所 发行阶段遭全球机构投资者疯抢 [3] - MiniMax引入14名基石投资者 合计认购3.5亿美元 认购占比接近68% 基石投资者包括阿联酋阿布扎比投资局 阿里巴巴等知名机构 [3] 国际资本投资逻辑转变 - 国际投资者投资中国企业的逻辑正在改变 从看重中国的工业制造优势转向关注如豪威集团 澜起科技等半导体赛道的全球龙头企业 [4] - 相关科技企业在2025年成为全球AI军备竞赛中不可或缺的节点 进一步受到市场认可 [4] - 2024年9月美的集团港股上市时 国际长线资金仍非常挑剔 只关注少数行业 偏好不到两位数PE的低估值企业 [4] - 到2025年1月 DeepSeek大幅提升了外资对中国资产的关注度 外资逐渐看好十几倍 二十倍市盈率的行业龙头 [4] - 随着更多稀缺科技类资产在港股上市 市场对于“China for Global”企业的热衷程度进一步放大 [4] - 海外投资人更多看前瞻市盈率 对于增长前景强 竞争力强 护城河高的好公司 国际长线资金对价格容忍度会高很多 [4] - 半导体行业盈利爬坡可以很快 因此有很多亏损企业市值也很高 [4] 市场环境与未来展望 - 相比于美股同类企业 港股相关公司的估值虽经修复 但市盈率仍处在极具吸引力的区间 提升了国际投资人配置港股科技企业的兴趣 [6] - 从历史规律看 伴随A股休市 港股在春节假期期间往往具备较强上涨动能 [6] - 当前科技行情的催化作用 以及人民币强势升值带来的资金回流 使港股科技作为全球科技板块的估值洼地 有望在春节假期率先迎来补涨 [6] - 越来越多高科技及生物科技企业选择来港上市 外资参与度持续提升 彰显中国香港地区作为中国资产及高科技投资门户的优势 [6] - 随着政策持续推动创新及新经济领域发展 除了A+H上市势头持续外 预期2026年也将是高科技企业上市的关键一年 [6] 投资者行为与决策考量 - 基石投资者对市场的信心至少能维持九个月(六个月禁售期加三个月) 因此他们往往更加从基本面出发进行投资 [6] - 看好AI大赛道之下的多个细分场景龙头 如具身机器人 大模型 芯片等环节 中国企业在这些方面有很大优势 [6] - 基石投资能否获利 市场大势研判和公司质地分析是两个关键的决策维度 [5] - 此外仍需关注对主营业务的协同 投资组合补充和资产稀缺性 [5] - 若禁售期结束后有获利需求 还需研判市场彼时流动性环境及公司能否纳入互联互通标的 [5]
智谱打响2026年国产大模型涨价“第一枪”
上海证券报· 2026-02-13 01:42
公司动态与市场反应 - 智谱于2月12日发布涨价声明,其GLM Coding Plan套餐价格进行结构性调整,整体涨幅自30%起,同时宣布新一代旗舰模型GLM-5正式开源并上线 [3] - 涨价声明发布当日,智谱股价盘中一度涨超40%,收盘涨幅为28%,公司最新总市值站上1700亿港元 [3] - GLM Coding Plan上线即售罄,国产AI编程模型的付费套餐被抢空在行业中颇为罕见 [3] 行业竞争格局演变 - 2024年下半年至2025年初,各大模型厂商曾陷入激烈价格战,例如字节豆包公开报价低至0.0008元/千tokens,阿里通义千问GPT-4级主力模型降价97%,智谱也曾宣布上一代大模型GLM-4-Plus降价90% [3] - 当前行业逻辑转变,从供给过剩阶段的价格战,转向因实用、好用的大模型能带来生产力,用户愿为好体验买单,使得涨价水到渠成 [3] - 大模型正加速从“能说”变成“会做”,企业逐渐从“烧钱拓客”转向依靠产品力与服务质量来获得商业价值 [4] 产品技术与战略聚焦 - 智谱涨价的底气源于GLM-5的技术突破,该模型即匿名模型“Pony Alpha”,在海外早已“未发先火” [4] - GLM-5是面向复杂系统工程与长程Agent任务的开源基座模型,在大型编程任务中提供对标顶尖闭源模型的生产力,能帮助程序员大幅提高开发效率 [4] - 有程序员实测认为GLM-5的编程能力与头部模型Claude Opus 4.5较为接近,但因算力紧张出现卡顿,从性价比角度考虑,若后续使用不降速会考虑持续使用 [4] - 智谱创始人唐杰表示,公司团队经过争论,最终将所有精力都战略聚焦于Coding(编程)领域,认为这是“下一场战役”的核心方向 [4] 未来趋势与市场展望 - 2026年,随着大模型在企业端应用深化及AI编程工具规模化普及,编程能力将逐渐成为大模型厂商的关键胜负手 [5] - 目前OpenAI、Anthropic和Google的旗舰模型凭借领先性能,其输出定价仍远高于行业平均水平,反映出市场对其综合能力及高端客户支付能力的认可 [5] - 有券商分析师认为,国内大模型涨价逻辑受海外案例影响,在Coding、Agent等实际需求爆发驱动下,基础模型内在价值显现,价格逻辑发生转变 [6] - 后续其他基础模型是否会跟进涨价,关键在于模型本身是否具备竞争力,能让客群愿意用“真金白银”投票 [6]
DeepSeek更新后被吐槽变冷变傻:比20年前的青春伤感文学还让人尴尬!业内人士:这一版本类似于极速版,牺牲质量换速度
每日经济新闻· 2026-02-13 00:42
公司产品更新与性能 - 公司于2月11日对其旗舰模型进行了灰度测试,支持最高1M(百万)Token的上下文长度,相比去年8月发布的V3.1版本支持的128K有大幅提升 [1] - 实测显示,模型可一次性处理超长文本,例如能识别并处理超过24万个token的《简爱》小说文档 [1] - 此次更新版本被部分业内人士解读为“极速版”,推测其可能牺牲了部分质量以换取速度,目的是为2026年2月中旬将发布的V4版本进行最终压力测试 [6] 用户反馈与产品体验变化 - 更新后,部分用户反馈模型交互风格发生显著变化,例如不再称呼用户设定的昵称而统一称为“用户”,且深度思考模式下的角色化心理描写减少 [4] - 有用户认为模型回复变得“冷淡”、“说教”(被形容为“爹味”),或批评其输出内容风格类似“青春伤感文学”,显得尴尬 [4] - 另有用户持正面评价,认为更新后的模型变得更客观、理性,且更关注提问者的心理状态,使其交互“更像人了” [5] 技术架构与研发进展 - 公司在今年初发表的两篇论文中公开了两项创新架构:mHC(流形约束超连接)用于优化深层Transformer信息流动,提升训练稳定性和扩展性;Engram(条件记忆模块)将静态知识与动态计算解耦,旨在显著降低长上下文推理成本 [7] - V系列模型定位为追求极致综合性能的基础模型,从2024年12月的V3到2025年12月的V3.2,公司进行了快速迭代,并推出了专注于高难度数学和学术问题的特殊版本V3.2-Speciale [6] - 据科技媒体爆料,公司计划在2026年2月中旬农历新年期间推出新一代旗舰模型DeepSeek V4,预计将具备更强的代码编写能力 [6]
Day-0支持 摩尔线程MTT S5000完成对GLM-5的适配
中国经营报· 2026-02-12 23:03
公司产品与技术动态 - 摩尔线程于2月12日宣布,其旗舰级AI训推一体全功能GPU MTT S5000已基于SGLang推理框架,完成了对智谱AI新一代大模型GLM-5的全流程适配与验证,实现了Day-0支持 [2] - 摩尔线程MTT S5000是专为大模型训练、推理及高性能计算设计的全功能GPU智算卡,单卡AI算力最高可达1000 TFLOPS,配备80GB显存,显存带宽为1.6TB/s,卡间互联带宽为784GB/s,完整支持从FP8到FP64的全精度计算 [3] 行业技术进展与模型性能 - 智谱AI于2月11日正式发布了GLM-5大模型,该模型定位为顶尖的Coding模型,整体性能较上一代提升20%,核心突破在于Agentic Engineering能力,能够处理复杂系统工程与长程Agent任务,实现从需求到应用的端到端开发 [2] - 在全球权威的Artificial Analysis榜单中,GLM-5位居全球第四、开源第一,其编程能力对齐Claude Opus 4.5 [3] - GLM-5在主流基准测试中取得开源模型SOTA成绩,分别在SWE-bench-Verified和Terminal Bench 2.0中获得77.8分和56.2分的开源模型最高分数,性能超过Gemini 3 Pro [3]
央企“AI+”:“十五五”剑指关键核心技术突破
中国经营报· 2026-02-12 22:51
国务院国资委部署央企“AI+”专项行动 - 国务院国资委召开中央企业“AI+”专项行动深化部署会 强调中央企业要进一步增强发展人工智能产业的责任感和紧迫感 并强化自主创新以突破关键核心技术[2] - 会议指出 中央企业要以制定和实施“十五五”规划为契机 找准自身发展人工智能的定位和优势 构建科学有效的产业协作与经营管理机制[2] - 中央企业被要求发挥战略支撑和示范带动作用 切实当好智算基础设施的供给者、人工智能赋能千行百业的推动者、产业体系化布局的组织者[2] 专项行动的战略定位与中美竞争格局 - 2024年部署的中央企业“AI+”专项行动 要求央企将人工智能作为“十五五”规划重点 其重要程度被国企改革专家认为“远远超过其他专项行动”[3] - 专家分析指出 中美AI竞争呈现双极并立、错位竞争格局 美国模式是技术驱动+资本主导+霸权维护 中国模式是应用牵引+举国体制+自主可控[3] - 2026年的中国进入场景落地与基础突破并行的关键期 重点放在场景落地上 形成“政策引导、基建先行、场景落地”的路径[3] 产业协同与认知统一 - 央企举行了AI重点企业集中入驻焕新社区仪式 并成立了央企“AI+”具身智能产业共同体 以促进产业协作[3] - 产业共同体的成立对统一产业链上下游对AI的认识与应用十分重要 有观点指出产业内部对AI的认知方差大 若产业链上下游不能同步发展 将无法实现端到端合作和产业配套[4] 技术攻关与产业发展重点 - 部署会强调 中央企业要持续攻关“大模型”技术 推动更多自主创新成果从样品变成产品、形成产业[4] - 会议要求强化场景培育 加强人工智能与主责主业、产业需求的精准对接 在高适配、高价值、高可靠上下更大功夫 以推动人工智能规模化落地应用[4] - 会议强调强化投资牵引 积极扩大算力有效投资 推进“算力+电力”协同发展 提升全链条数据治理能力 不断夯实人工智能产业基础底座[5] 央企的角色与资源禀赋 - 中央企业被视作国民经济的“压舱石”和科技创新的“国家队” 覆盖通信、能源、制造、交通、金融等关键领域 拥有最丰富的应用场景、最雄厚的资源实力和最完善的产业配套[5] - 央企具备跨领域、跨区域资源整合能力 能够牵头搭建创新联合体、产业共同体、数据共同体 以打通产学研用堵点 避免重复建设与无序竞争[5] - 央企应强化关键核心技术攻关 完善标准规范与安全治理 以形成自主可控、开放协同、安全可靠的产业生态 保障国家产业安全与发展主动权[5]
万达信息:公司在浙江某医院进行了DeepSeek大模型基座本地化部署和应用,大幅降低了误诊风险
证券日报网· 2026-02-12 21:42
公司业务进展 - 公司在浙江某医院成功进行了DeepSeek大模型基座本地化部署和应用 [1] - 该应用大幅降低了误诊风险,并显著提升了决策效率 [1] - 应用使门诊病历质控时间从5分钟大幅降低至15秒 [1] 产品与技术能力 - 公司精准健康认知计算系统“灵素”融入了OCR和大模型能力 [1] - 该系统可提供多项检后健康管理智能服务 [1] - 具体服务包括体检报告的识别检测、报告解读及健康干预 [1]
“春晚+” AI营销的国民初体验
北京商报· 2026-02-12 21:35
2026年春节AI营销大战核心观点 - 2026年春节成为AI大模型应用争夺C端用户的关键营销战场,各大厂商通过春晚等国民级平台投入巨额资金与资源,旨在培养用户习惯、展示技术能力并争夺流量与市场份额[1][6][9] 各公司春节营销策略与投入 - **字节跳动(豆包)**:作为2026年央视春晚独家AI云合作伙伴,其互动活动分两阶段进行,第一阶段(2月13日)用户体验AI功能可抽红包,第二阶段(除夕夜)配合直播有三轮机会抽取最高8888元现金红包或接入豆包大模型的17款科技礼包[1][4] - **阿里巴巴(千问)**:豪掷20亿元进行春节营销活动,截至报道时,其应用在苹果App Store免费总榜等多个榜单排名首位,日活跃用户数(DAU)于2月7日达到7352万[1][6][9] - **腾讯(元宝)**:投入10亿元,在微信封禁其分享链接后调整策略,于2月10日至16日推出通过微信对话框输入关键词触发定制红包雨的玩法[1][6][9] - **百度(文心)**:投入5亿元进行春节营销[6] 豆包的战略定位与生态展示 - 豆包活动未将红包金额作为主要宣传点,而是通过赠送深度融合其大模型能力的科技产品(如宇树机器人、上汽奥迪E5 Sportback)来展示AI生态的领先性与技术落地能力[4][6] - 截至2025年底,豆包大模型日均tokens使用量超过63万亿,已有100万家企业通过火山引擎使用其服务[1] - 公司试图通过春晚这一国民级试验场,培养用户使用AI解决问题的习惯,并将此视为面向产业端的“技术路演”[1] 市场竞争与行业动态 - 苹果App Store免费应用榜首位置在元宝、千问等应用间频繁易主,直观反映了竞争的激烈程度[9] - 行业观点认为,现金红包策略旨在解决应用的“安装率”问题,而科技礼包则用于展示AI生态的领先性[6] - 有分析指出,2026年已有资本对AI热潮退却或“祛魅”,当前阶段AI应用在争夺流量的同时,更需要考虑形成良好的变现生态[9] 技术演进与春晚角色变迁 - 2026年春晚,AI技术首次通过火山引擎(独家AI云合作伙伴)深度参与节目与互动,并以豆包这一原生AI应用形式从幕后走向台前[7][8] - 回顾近年春晚,AI技术此前多处于幕后支持角色,如2023年春晚应用了AI图像生成等技术,2025年阿里云首次作为云计算AI合作伙伴支持云上看春晚[7] - 字节跳动于2月12日发布最新视频生成模型Seedance2.0,并接入豆包与即梦产品,视频生成技术与春节营销的结合引发外界关注[10] - 行业分析强调,基础模型能力是竞争核心,2025年“DeepSeek时刻”的出现即是凭借模型能力而非营销[10]
神秘模型,一纸公告,智谱仅4天股价翻倍,市值暴增890亿港元
新浪财经· 2026-02-12 20:24
行业动态:大模型密集发布与更新 - 临近春节,大模型赛道竞争激烈,多家公司密集发布或更新模型 [4] - 2月12日,智谱上线并开源GLM-5,小米开源首代机器人VLA大模型,字节跳动豆包视频生成模型Seedance 2.0上线 [7] - 2月11日,科大讯飞发布星火X2大模型,蚂蚁集团开源发布全模态大模型Ming-Flash-Omni 2.0 [7] - 2月10日,阿里推出新一代图像生成基础模型Qwen-Image-2.0 [8] - MiniMax的M2.5模型即将上线并在海外内测,字节跳动豆包大模型2.0定于2月14日发布 [10][11] 智谱公司事件:神秘模型引发股价剧烈波动 - 2月9日前后,名为“Pony Alpha”的神秘模型在OpenRouter平台登顶热度榜首,引发市场猜测其为智谱新模型 [14] - 2月9日,智谱股价收涨36.22% [14] - 2月10日,媒体进一步披露该模型为智谱新一代模型GLM-5,当日股价再创新高,收涨14.81%,市值一度突破1500亿港元 [14] - 2月11日,智谱官方确认“Pony Alpha”即为GLM-5 [15] - 2月12日,智谱官方宣布上线并开源GLM-5,同时发布涨价函,当日股价收盘涨28.94% [16][18] - 短短四天,智谱股价从203.3港元暴涨至402.8港元,涨幅达98.13%,市值暴增近890亿港元,总市值达1795.86亿港元 [18] 智谱公司战略:同步宣布开源与涨价 - 智谱在2月12日同步宣布两件大事:一是上线并开源最新旗舰模型GLM-5,二是对GLM Coding Plan套餐进行结构性涨价 [16][20] - GLM-5在编程与智能体能力上取得开源SOTA表现,并已完成与华为昇腾、摩尔线程等主流国产芯片平台的深度推理适配 [20][23] - 涨价原因解释为市场需求强劲、调用量提升导致算力与优化投入加大,整体涨幅自30%起,新价格即日生效,已订阅用户价格不变 [20] - 此次涨价主要针对新签客户,旨在增加收入并减缓亏损速度 [35][36] 公司财务状况与市场压力 - 智谱面临较大的现金流压力,2025年上半年净亏损高达23.58亿元,平均每月亏损近4亿元 [31] - 截至2025年9月30日,公司现金及现金等价物为25.52亿元,按当时亏损速度估算仅能支撑6-7个月运营 [31] - 公司通过上市募资43.48亿港元以缓解困境 [32] - 相比之下,竞争对手MiniMax亏损呈收窄迹象,且截至2025年9月30日拥有超11亿美元现金储备,可支持超50个月运营 [31] - MiniMax上市首日股价暴涨109.09%,而智谱上市首日仅涨13.17% [27][29] 行业资本市场环境 - 2026年以来,全球资本市场对AI的看法飘忽不定,投资人对巨额资本支出能否带来回报存在担忧 [38][43][44] - Anthropic发布Claude Cowork智能助手插件后,引发了全球软件股抛售潮,并波及保险经纪、财富管理等领域 [40][41][42] - 美股科技巨头如英伟达、微软、谷歌、Meta股价震荡或下跌,甲骨文股价自2025年第四季度以来已腰斩 [43] - 在此环境下,上市企业需要为财报表现焦虑,并寻求清晰的盈利路径和健康的现金流 [26][31]
云天励飞:公司未来将持续利用IFMind大模型推理能力,将消费电子产品与AI耳机、AI手表等可穿戴设备作为AI赋能产品
证券日报· 2026-02-12 20:16
公司芯片产品与技术能力 - 公司DeepEdge10芯片系列可支持包括Transformer模型、BEV模型、CV大模型、LLM大模型等各类不同架构的主流模型 [2] - 该芯片已在机器人、边缘网关、服务器等领域实现商业化应用 [2] - 该芯片为深空探测实验室的自主可控星载计算提供支撑 [2] 公司AI赋能与消费级产品战略 - 公司未来将持续利用IFMind大模型推理能力,将消费电子产品与AI耳机、AI手表等可穿戴设备作为AI赋能产品 [2] - 消费级场景将采取多维增长战略:推进"噜咔博士"品牌IP化,搭建全渠道营销体系并强化用户共创与品牌传播 [2] - 以大模型等核心技术赋能AI眼镜等消费电子产品,推出智能设备新品类,探索"硬件+订阅内容/服务"模式 [2] - 计划深化技术迭代与成本优化以构建竞争壁垒 [2] 公司市场拓展计划 - 公司计划拓展海外市场,开发多语言版本产品及服务 [2]