Workflow
DeepSeek V3
icon
搜索文档
阿里巴巴:推出玄铁 C950 AI 芯片
2026-03-26 21:20
**涉及的公司与行业** * **公司**:阿里巴巴集团控股 (Alibaba Group Holding, BABA.N, BABA UN) [1][5] * **行业**:中国互联网及其他服务 (China Internet and Other Services) [5] **核心观点与论据** * **重申“首选”评级**:报告重申阿里巴巴为“首选”股票,认为其拥有完整的AI技术栈,包括自研芯片(平头哥/T-Head)、云基础设施(阿里云)、领先的开源模型(通义千问/Qwen)和以消费为中心的应用(Qwen应用)[3] * **发布新AI芯片**:阿里巴巴发布了基于开源RISC-V架构的下一代AI芯片“玄铁C950”5纳米处理器,其性能比前代产品快3倍以上,并原生支持通义千问3和DeepSeek V3等大模型[2] * **自研芯片的战略价值**:拥有自研芯片(平头哥)能减少对第三方供应商的依赖、实现定制化设计、支持需求激增时的快速产能扩张、提高成本效率(降低单token成本)、缓解地缘政治风险(美国出口管制)并降低监管风险(获得政府支持)[3] * **AI商业化能力增强**:近期成立的“阿里巴巴Token Hub”及推出的“悟空”(具备智能体能力的AI原生企业平台)强化了AI(以token计费)的商业化能力,覆盖模型能力、模型即服务、2C和2B智能体应用及未来的创新AI应用[3] * **平头哥业务首次公开关键数据**:在2026财年第三季度财报电话会上,管理层首次公开了平头哥的部分运营和财务数据: * 累计出货量超过47万单元[9] * 收入规模超过人民币100亿元[9] * 超过60%的比例服务于阿里云外部客户[9] * 不排除未来分拆/独立上市的可能性,但未给出具体时间表[9] * **估值分析**:报告采用分类加总估值法,对平头哥的估值为280亿至860亿美元,中值对应每股价值22美元,是阿里巴巴整体目标价245美元/股的一部分[3] * **目标价与评级**:摩根士丹利给予阿里巴巴“增持”评级,目标价为180美元,较2026年3月23日收盘价126.06美元有43%的上涨空间[6] **其他重要信息** * **财务预测**:报告提供了阿里巴巴的财务预测数据(基于摩根士丹利研究估计): * 营收(人民币):2025财年9960亿元,2026财年e 10240亿元,2027财年e 11140亿元,2028财年e 12030亿元[6] * 净利润(人民币):2025财年1290亿元,2026财年e 990亿元,2027财年e 900亿元,2028财年e 1260亿元[6] * 每股收益(人民币):2025财年53.59元,2026财年e 41.72元,2027财年e 37.86元,2028财年e 53.13元[6] * **估值倍数**:报告列出了相应的估值倍数,例如2026财年e市盈率为20.8倍,企业价值倍数(EV/EBITDA)为14.1倍[6] * **风险提示**: * **上行风险**:核心电商货币化能力增强、企业数字化加速推动云收入增长、AI需求超预期强劲[12] * **下行风险**:竞争加剧、再投资成本高于预期、后疫情复苏缓慢导致消费疲软、企业数字化进程放缓、互联网平台面临额外监管审查[12] * **公司基本数据**:截至2026年3月23日,阿里巴巴市值为2994.12亿美元,发行在外稀释后股数为23.75亿股,52周股价区间为94.99-192.67美元[6] * **利益冲突披露**:摩根士丹利声明其与阿里巴巴存在多种业务关系,包括持有超过1%的普通股、在过去12个月内提供/获得投资银行服务及其他服务等,这可能构成利益冲突[17][18][19][20][21]
用AI清退全部外包?网易回应;百度挖DeepSeek核心人才入职;曝宇树对外称弹性双休,内部是另一套规则,非常卷|AI周报
AI前线· 2026-03-22 13:33
行业人事动态 - 有消息称DeepSeek核心技术人员已正式加盟百度模型研发部,但并非传闻中的知名专家郭达雅,具体人员身份未披露 [3][4] - 百度内部进行人事调整,原百度APP研发中心负责人赵世奇离职,由原基础模型研发部大模型算法部负责人何径舟接任,此次调动属于内部轮岗 [4] - 腾讯发布内部通知撤销AI Lab,原有人员调整至大语言模型部和产学研合作中心,公司副总裁蒋杰不再担任AI Lab负责人 [6] - 猎豹移动董事长傅盛在朋友圈发文,称360集团创始人周鸿祎曾承诺还款至少一亿让其停止香港官司但未履行,双方恩怨再度公开 [14] 公司运营与劳资状况 - 机器人公司宇树科技被员工发帖爆料,公司对外标榜弹性双休,但内部实行“早九晚九”的长时间工作制,项目期需通宵 [7] - 宇树科技已向上交所提交科创板IPO申请,拟融资金额42.02亿元 [9] - 网易回应“使用AI清退全部外包员工”传闻,称该信息不实,近期人员变动仅为部分项目的正常业务调整与人员汰换 [10] - 一名男子因在网上捏造散布“科大讯飞裁员30%”的不实信息,被公安机关依法处以行政拘留 [12][13] - PC巨头戴尔宣布2026财年员工总数将削减约10%,涉及约11000名员工,相关遣散费用为5.69亿美元(约合人民币39.2亿元) [21] - 戴尔此次裁员是科技行业趋势的缩影,今年以来已有60家科技公司启动裁员,累计影响超过3.8万人,Meta也计划实施比例或超20%的大规模裁员 [22] 技术产品与市场动态 - AI编程工具Cursor发布新模型Composer 2后,被开发者发现其调用的模型ID指向月之暗面的Kimi K2.5,陷入“套壳”质疑 [15] - Cursor联创回应,承认Composer 2基于Kimi K2.5基础模型,并进行了持续预训练和高计算强度的强化学习,未在博客中提及是疏忽 [17] - 月之暗面团队确认与Cursor存在授权商业合作,Cursor通过FireworksAI平台访问Kimi-k2.5 [18] - 日本乐天集团发布的高性能AI模型Rakuten AI 3.0,被技术社区发现核心架构完全基于中国深度求索的开源模型DeepSeek V3,且初期未标注来源,引发舆论风波 [23][24] - 椰树集团发布招标公告,计划采购50台人形机器人用于椰子破壳削皮工序,要求每小时处理超过360个椰子 [18] 大模型与AI产品发布 - 此前在OpenRouter平台引发猜测的匿名模型“Hunter Alpha”和“Healer Alpha”,被证实为小米MiMo-V2系列大模型的早期内测版本 [34][35] - 小米在春季新品发布会上宣布,未来三年在AI领域的投资计划将至少达到600亿元,今年AI研发与资本开支已超过160亿元 [35] - 小米发布三款模型:旗舰文本基座MiMo-V2-Pro、全模态Agent基座MiMo-V2-Omni、语音合成大模型MiMo-V2-TTS [35] - 字节跳动旗下小云雀AI上线全球首个搭载Seedance2.0的短剧Agent功能,支持10万字剧本一键成片 [36] - 飞书发布多款企业级Agent产品,包括智能体平台飞书aily等 [36] - 阿里巴巴发布全球首个企业级AI原生工作平台“悟空”,将内置到钉钉中 [37][38] - MiniMax发布新一代Agent旗舰大模型M2.7,该模型通过构建Agent Harness体系,在部分研发场景中可承担30%-50%的工作量 [39] - 智谱发布专为龙虾(Agent)场景优化的通用大模型GLM-5-Turbo,并同步将其API价格上涨20% [40] AI行业趋势与战略布局 - 市场出现AI大厂高薪招聘文科生的趋势,字节跳动、百度、美团、小红书等公司放出AI训练师、提示词工程师等岗位,对应届生月薪普遍2.5万-3万,资深岗位年薪直逼50万+ [19][20] - 360创始人周鸿祎认为,随着AI发展,文科生将比理科生更吃香,因为需要他们解决技术应用带来的社会问题及管理智能体 [19] - OpenAI计划收购Python工具初创公司Astral,该团队将加入OpenAI的Codex项目,Codex用户已超200万,自年初以来增长了两倍 [26] - 阿里巴巴成立名为Alibaba Token Hub的新事业群,由CEO吴泳铭亲自挂帅,整合其AI研发、消费应用及相关产品,旨在强化AI业务的战略协同与商业化 [28][29] - 因全球AI需求爆发及供应链涨价,百度智能云和阿里云相继上调AI算力、存储等产品价格,涨幅约5%-34% [29][30] - 据供应链人士透露,字节跳动“豆包AI眼镜”一代产品的生产计划已整体延后,原计划大概率不会上市,因产品差异化不强 [31] - 阿里巴巴集团正推进一项内部计划,向员工提供Token额度,鼓励员工在工作中使用付费AI工具 [40] 企业合作与生态 - 自动驾驶软件公司Applied Intuition宣布与英伟达达成合作,旨在加速面向全球汽车制造商的L2+级驾驶辅助系统的开发与部署 [40] - 阿里旗下跨境电商平台速卖通与YouTube达成合作,正式加入YouTube“购物联盟计划”,YouTube将成为其新的分销渠道 [40][41]
“日本最强AI”光速塌房,都怪中国DeepSeek太强?
创业邦· 2026-03-19 18:35
文章核心观点 - 日本乐天公司发布的号称“日本最大、性能最强”的AI大模型Rakuten AI 3.0,实则是基于中国开源模型DeepSeek-V3的日语“套壳版”,其发布因未充分披露来源且标榜“自主研发”而引发开源社区和日本网友的强烈批评[4][6][8] - 日本AI行业普遍存在基于中国等国的开源大模型进行二次开发的现象,但乐天事件凸显了日本在追求技术自主过程中的尴尬与不体面,反映了日本在由软件和数据驱动的新技术竞赛中已难以独立定义游戏规则[27][38][39] Rakuten AI 3.0 模型发布与争议 - 乐天于3月17日发布Rakuten AI 3.0,宣称是日本最大、性能最强的AI大模型,拥有7000亿参数(具体为671B),并得到日本经济产业省支持的GENIAC项目站台[4][6] - 模型发布数小时内,开源社区通过其Hugging Face配置文件(model_type: deepseek_v3)发现其底层架构直接来自中国开源模型DeepSeek-V3,是后者的日语微调版[8][11] - 乐天在发布时未提及使用DeepSeek-V3架构,并强调“自主研发”、“日本最强”等,被指违背开源精神,直到被社区发现后才补上相关许可证和归属声明[13][14] - 日本网友对此反应负面,批评其用纳税人资金支持的项目仅做出了一个中国模型的微调版[14][25] Rakuten AI 3.0 的性能表现 - 官方数据显示,该模型在多个日语基准测试中表现强劲,如在Japanese MT-Bench上跑赢了GPT-4o,在日本文化理解、敬语表达等本土化任务中表现突出[16] - 具体测试成绩:JamC-QA得分76.9,MMLU-ProX(日语)得分71.7,MATH-100(日语)得分86.9,M-IFEval(日语)得分72.1,均高于GPT-4o等对比模型[24] - 模型采用MoE稀疏架构,虽然总参数近7000亿,但单次推理激活参数少,可将成本压至前沿闭源模型的10%左右[23] - 其优异表现被指出恰恰证明了基座模型DeepSeek的强大[25] 日本AI行业的普遍模式 - 乐天并非个例,日本AI公司普遍采用基于国外开源大模型进行二次开发的“套壳”模式[27] - 例如,ABEJA公司在2025年4月推出的ABEJA QwQ 32b模型,其底座是阿里的Qwen2.5 + QwQ-32B,公司对其进行了日语持续预训练和微调[27][29] - ABEJA的做法相对透明,明确了底座和训练路径,并得到了阿里巴巴官方的转发祝贺[29] - 其他日本公司如Lightblue、ELYZA等也常用Qwen、Llama、DeepSeek、Mistral等作为底座,再结合日语数据进行本土化优化[27] - 日经新闻报道指出,日本企业开发的前10大模型中,有6个是基于DeepSeek或Qwen进行二次开发[27] - 这种模式在全球AI行业是常见做法,关键在于后续的数据、场景和落地能力,乐天引发争议的核心在于其做法“不体面”,试图掩盖依赖并夸大自主性[27] 日本IT行业的整体困境 - 自1990年经济泡沫破裂后,日本经济陷入长期停滞,IT行业的发展是这一停滞的缩影[31] - 日本社会数字化进程严重滞后,直到2024年,政府仍在处理淘汰软盘(floppy disk)的规定,教育系统的数字化改革目标甚至包括“原则上废止学校间使用传真机”[32][35] - 数字化改革面临官僚系统惯性、纸质文件与印章文化依赖、人口老龄化及IT人才短缺等多重阻力[37] - 日本经产省早前测算,到2030年日本IT人才缺口最高可接近45万人[37] - 在此背景下,生成式AI被日本官方和产业界视为弥补程序员不足、加速数字化转型的潜在捷径[37] - Rakuten AI 3.0事件被视为日本IT困境的集中体现:在政府支持下追求技术自主,但最终仍需依赖外国开源技术底座[38] - 事件表明,曾在硬件时代领先的日本,在由软件、数据和大模型主导的新技术竞争中已难以独立掌控全局[39]
「日本最强AI」塌房!扒开代码全是DeepSeek,日本网友集体破防;腾讯年报披露:人均年薪成本超百万;网易否认「使用AI清退全部外包员工」
雷峰网· 2026-03-19 08:41
AI与开源模型 - 日本乐天集团发布号称“国内最大规模”的AI模型Rakuten AI 3.0,但被技术社区发现其核心架构完全照搬中国深度求索的开源模型DeepSeek V3,其配置文件明确标注为“DeepseekV3ForCausalLM”,总参数671B,激活参数37B,与DeepSeek-V3毫无二致[4] - 该事件演变为丑闻的关键在于乐天在宣传时模糊处理,仅称“充分利用开源社区最优成果”,未提及DeepSeek,并在开源时删除了MIT开源协议文件,违背开源精神,被日本网友嘲讽为“伪国产AI”[5] - 日媒报道指出,日本企业开发的前十大AI模型中,有6个是基于DeepSeek或Qwen进行的二次开发[5] 腾讯控股业绩与运营 - 公司2025年第四季度营业收入1943.71亿元,同比增长13%;归母净利润582.6亿元,同比增长14%[6] - 2025年全年营业收入7517.66亿元,同比增长14%;归母净利润2248.42亿元,同比增长16%[6] - 截至2025年底,微信及WeChat合并月活账户数14.18亿,同比增长2%;QQ移动终端月活5.08亿,同比减少3%;收费增值服务订阅会员数2.67亿,同比增长2%[7] - 腾讯云在AI需求增长等因素带动下于2025年实现规模化盈利,HY 3.0大模型正在内部测试,计划4月对外推出[7] - 截至2025年底,公司员工总数115,849名,年度总薪酬成本1307亿元,人均年薪成本约为112.8万元[7] 汽车行业动态 - 吉利集团高级副总裁确认,董明珠个人订购3辆极氪009,连同下属员工等合计订购9辆,按大客户优惠政策采购[7][8] - 极氪009在多个市场登顶细分市场销量榜首,董明珠的选择被视为国产豪车在顶层消费市场欢迎度走高的信号[8] - 奇瑞汽车发布2025年全年业绩,营收首次突破3000亿元,达3002.87亿元,同比增长11.3%;年内利润195.07亿元,同比增长36.1%[35] - 奇瑞2025年自主乘用车总销量263.1万辆,同比增长14.6%;新能源销量82.7万辆,同比激增72.5%;出口销量129.4万辆,同比增长33.2%,海外营收占比超52%[36] - 奇瑞在电池之夜发布犀牛电池技术,称其可充电8分钟续航500公里,循环寿命达5000次[12][13] - 小米汽车宣布新一代SU7全系内置ETC并免费激活,预售价22.99万-30.99万元,Pro版CLTC续航达902公里[27][28] - 大众汽车公布ID.Cross官方谍照,该车为亲民纯电SUV,欧洲起售价约28000欧元(约22.2万人民币),高配版WLTP续航450km[50][51] - 特斯拉官方宣布Model Y连续三年成为全球最畅销乘用车,全球累计销量超400万辆[43] - 某合资车企被曝调整员工绩效管理办法,参照阿里巴巴实践,每年对绩效末位者强制淘汰率不低于5%,并可能实施降级降薪[21] - 乘联会数据显示,2025年国内汽车厂商销量榜前五中,仅一汽大众一家合资品牌,其余为比亚迪、吉利、长安、奇瑞等国产品牌[22] 科技公司战略与人事 - 百度任命原大模型算法部何径舟担任百度App研发中心组织负责人,以推动大模型与搜索、推荐业务的融合[10] - 网易回应“使用AI清退全部外包”消息不实,称是因项目调整及正常人员汰换,对部分基础技能岗位外包人员进行退场[15][16] - 字节跳动安全团队内部发布《OpenClaw安全规范和使用指引》,并推出ByteClaw服务,以规范员工安全调用内部资源[19] - 阿里巴巴启动2027届实习生招聘,AI相关岗位占比超80%,新增七类AI岗位,包括AI应用研发工程师、AI Agent优化工程师等[37] - 三星电子韩国工会罢工授权投票获93%员工赞成,若协商未果,计划于5月21日起启动为期18天的全面停工,核心诉求为薪资与奖金机制改革[42] - 腾讯公司总裁刘炽平回应美国对其游戏投资的审查,称整体风险相对可控,正与美监管进行建设性沟通[46][47] - 吉利汽车集团CTO表示,吉利和英伟达将围绕智能驾驶、智能座舱、智能制造与研发等领域展开深度合作[48] 芯片与半导体 - 博主爆料某厂(预计为华为)自研CIS(图像传感器)已公开,首颗为50Mp 1/1.3" RYYB DCG HDR传感器,采用国产工艺并实现全栈自研[20] - 蔚来神玑科技与爱芯元智合作的M97芯片成功流片,算力超700 TOPS,正积极接触零跑、吉利等车企,计划今年三季度发布[33] - 三星电子若发生大规模罢工,可能影响全球半导体供应,因其在韩国本土生产100%的DRAM芯片和三分之二的NAND芯片[42] 融资与IPO动态 - 机器人租赁平台擎天租完成天使轮及天使+轮融资,累计金额达亿元级别,演员黄晓明创立的明嘉资本及乐华娱乐CEO杜华参投[30][31] - OpenAI正为最早于2026年第四季度进行IPO做准备,目前正组建财务团队[54] - 斑马智能信息技术股份有限公司向港交所递交上市申请,2025年营收8.61亿元,净亏损18.96亿元,阿里巴巴和上汽集团为控股股东[54][55] - 卓驭科技(原大疆车载)正在进行Pre-IPO轮融资,规模20亿元,投前估值约125亿元,并计划年内在港股上市[55][56] - 通用GPU企业登临科技拟最快今年赴港IPO,预期募资3亿至4亿美元[58] 其他行业趋势 - 润泽园教育在杭州宣布成立国内首家商业哲学院,预计2026年6月揭牌,并发布关于AI的四大判断[24][25] - 前REDMI品牌总经理王腾建议手机厂商暂停发布新机,因内存成本飙升且消费者平均换机周期已达42个月,应注重维护老用户[34][35] - 知名编剧于正回应“男二以下用AI演员”话题,认为真人表演无法被替代,AI技术只会淘汰没有才华的人[38] - 马斯克的X平台宣布,为符合印尼新规,自2026年3月28日起,该国用户必须年满16岁才能创建或使用账户,不符合要求的账户将被停用[48][49]
离谱!日本乐天 AI 套壳 DeepSeek,还敢删开源协议。网友:吃相真难看
程序员的那些事· 2026-03-18 19:12
事件概述 - 2026年3月17日,乐天公司高调发布号称“日本最大规模”的AI模型Rakuten AI 3.0,宣称参数约7000亿,日语性能超越GPT-4o,并获得了日本政府GENIAC项目补贴 [1] - 发布后不到12小时,该模型被全球开发者揭露其核心架构与中国DeepSeek V3完全一致,乐天仅做了少量日文数据微调,并涉嫌在宣传中隐瞒真实来源 [2][3] 技术实质与披露问题 - 开发者在HuggingFace平台发现,Rakuten AI 3.0的模型配置文件显示其架构为“DeepseekV3ForCausalLM”,核心参数、层数、维度均与DeepSeek V3完全一致 [2][3] - 乐天公司在上传模型时,最初直接删除了DeepSeek的开源许可证,在被发现后才匆忙补上一个NOTICE文件 [3] - 公司在官方通稿和发布会中,仅提及使用了社区开源成果,全程刻意不提“DeepSeek”,将模型包装为“日本自研” [3] 市场与舆论反应 - 事件引发日本网友强烈不满,批评公司利用纳税人补贴进行“换皮套壳”,违背开源精神,并欺骗国民感情 [4] - DeepSeek V3采用宽松的MIT开源协议,其他厂商可以合规使用,但隐瞒来源的行为被视为信用抄袭 [4]
按参数算,我们1300克的人脑相当于多大的AI模型?
36氪· 2026-02-27 20:25
人脑与AI模型的规模与架构对比 - 若仅按神经元数量计算,人脑约860亿个神经元,相当于86B参数模型,远小于DeepSeek V3的671B参数和Kimi K2.5的约1000B参数 [1] - 若考虑每个神经元约7000个突触,人脑总参数可达860亿*7000,约600T,远超当前AI模型,且当前硬件无法运行如此规模的模型 [1][2] - 人脑是真正的三维立体结构,一个神经元能与上万个邻居连接,复杂度远超本质为2D平面堆叠的硅基芯片 [13][14][15] 人脑的“制程”与信息处理单元 - 以神经元细胞体直径(10-100微米)类比制程,人脑相当于几十年前的电子管计算机水平 [4][5] - 以神经元间突触间隙宽度(20-40纳米)类比,相当于台积电2012年的28nm工艺,约iPhone 5水准 [8][9] - 人脑最底层的电信号传递单元——离子通道蛋白直径仅0.3-0.5纳米,达到原子级别的0.3nm“工艺”,超越当前硅基芯片物理极限 [10][11][12] - 人脑突触传递连续、强弱可调且涉及化学反应,信息量层级高于仅有开/关(0/1)状态的晶体管 [16][17] 人脑与AI的能效对比 - 人脑总功耗约20瓦,且高强度思考时功耗仅比静息态高出约1瓦 [19][21] - 人脑思考5秒额外耗能约0.0014瓦时,而ChatGPT一次查询平均耗能约0.34瓦时,人脑能效领先两个数量级 [21][22][23] 人脑与AI的激活与工作模式 - DeepSeek V3的671B参数中,每次推理仅激活37B,约5%的参数工作,95%处于闲置 [25] - 人脑平均皮层神经元放电频率仅0.16Hz,且超过90%的神经元在任何给定时间都处于沉寂状态,同样采用稀疏激活模式 [26] - 人脑与先进大模型均采用混合专家模型架构 [26] 幻觉、创造力与记忆机制 - 大模型的“幻觉”被视为缺陷,而人脑的幻觉表现为梦、想象力和艺术创造力 [27][28][29][30] - 研究证明幻觉对于大语言模型不可避免,且与创造力是一体两面,此机制与人脑相似 [31][32][33] - 人脑工作记忆容量有限,约为7±2个组块,但长期存储容量巨大,仅大脑皮层突触存储容量估算约74TB [36][37][40][41] - 人脑通过海马体在睡眠时对记忆进行“蒸馏”和“极端有损压缩”,此压缩比远超任何RAG系统 [42][43][44][45][46] - DeepSeek的Engram架构将75%算力用于推理,25%用于记忆查找,模拟了人脑陈述性记忆直接读取与昂贵推理分开的运作方式 [49][50][51][52][53] 训练数据与学习效率 - GPT-4训练数据约13万亿token,DeepSeek V3为14.8万亿token [55] - 人类从出生到成年接触的语言输入仅约2亿词,比AI训练数据少五个数量级,显示人脑样本效率远超AI [56][57][58] - 人脑的高效源于进化预装的先验知识,而AI需从零开始学习 [63] 具身认知与智能的生物学基础 - 认知科学认为思维并非仅发生在大脑,身体也参与思考,例如理解“沉重”一词会激活运动皮层 [64] - 智能是否需要身体仍是未解问题,但人脑与生物学结构相辅相成,构成了碳基生命的独特体验 [64][68][69][70] AI的指数增长与递归自我改进潜力 - 人脑的物理配置(860亿神经元,600T突触参数,20瓦功耗)在数万年间基本保持静态,而AI模型参数从2020年GPT-3的175B增长至当前近万亿,呈指数提升 [79][80][81] - 若AI能效每两年提升10倍,当前领先人脑两个数量级的能效优势可能在4年内被追平,五个数量级的样本效率优势可能在10年内被追平 [82][83] - Google DeepMind的AlphaEvolve系统能用AI设计并优化AI算法,其发现的VAD-CFR和SHOR-PSRO算法击败了人类研究者十几年开发的最优算法,展现了“递归式自我改进”的潜力 [86]
DeepSeek更新后被吐槽变冷变傻:比20年前的青春伤感文学还尴尬
每日经济新闻· 2026-02-13 06:23
公司产品更新与测试 - 公司于2月11日对其旗舰模型进行了灰度测试,在网页端和APP端更新版本,支持最高1M(百万)Token的上下文长度 [1] - 此次更新将上下文长度从去年8月发布的DeepSeek V3.1的128K大幅提升至1M,记者实测可一次性处理超过24万个token的《简爱》小说文档 [1] - 有行业人士认为,此版本类似于“极速版”,可能是牺牲质量换取速度,为2026年2月中旬将发布的V4版本做最后的压力测试 [6] 用户反馈与产品体验变化 - 更新后,部分用户反馈模型行为发生变化,例如不再称呼用户设定的昵称而统一称“用户”,思考过程的角色视角和心理描写减少 [4] - 有用户认为模型回复风格变得“说教、居高临下”(被描述为“爹味”),或变得“文绉绉、情绪激动”,类似“青春伤感文学” [4] - 也有用户反馈模型变得“客观和理性”、“更像人了”,更在意提问者的心理状态而非问题本身 [5] 技术架构与研发进展 - 公司模型迭代路径清晰:V系列定位为追求极致综合性能的基础模型,2024年12月推出V3确立基础,随后快速迭代发布强化推理与Agent能力的V3.1,并于2025年12月推出最新正式版V3.2及专注于高难度数学和学术问题的V3.2-Speciale [6] - 公司团队今年初发表两篇论文,公开两项创新架构:mHC(流形约束超连接)用于优化深层Transformer信息流动,提升训练稳定性和扩展性;Engram(条件记忆模块)将静态知识与动态计算解耦,用廉价DRAM存储知识以降低长上下文推理成本 [7] - 据科技媒体The Information爆料,公司计划在今年2月中旬农历新年期间推出新一代旗舰模型DeepSeek V4,将具备更强的写代码能力 [6]
核心AI场景首超英伟达,一场国产算力的“破局叙事”|甲子光年
新浪财经· 2026-01-29 20:12
公司技术路线与架构突破 - 公司于2025年推出的天数天枢架构,在DeepSeek V3大模型场景下,实测性能领先英伟达Hopper约20%,成为首个实现对国际主流架构实质性超越的国产方案[4][32] - 公司公布了清晰的四代架构路线图,计划在2025至2027年间实现对英伟达Hopper、Blackwell乃至Rubin架构的超越,标志着国产算力从“对标追赶”转向“自主定义”[2][30][34][35] - 2025年落地的天数天枢架构在执行注意力机制计算时,算力实际有效利用率突破90%[5][35] - 2026年将开启“双线超越”,天璇架构对标Blackwell并新增ixFP4精度支持,天玑架构实现全面性能超越并覆盖AI计算到加速计算的全场景[7][37] - 2027年的天权架构将剑指英伟达Rubin,后续将彻底跳出对标框架,转向突破性计算芯片架构设计[8][38] - 公司技术突破由三大核心创新底层赋能:TPC BroadCast(计算组广播机制)、Instruction Co-Exec(多指令并行处理系统)和Dynamic Warp Scheduling(动态线程组调度机制)[10][39] - 公司研发逻辑以问题为导向,针对DeepSeek V3的FP8累加精度不足和矩阵转置开销大等痛点,提供定制化解决方案,在推理场景中带来约10%的性能提升[11][40] 产品性能与市场落地 - 公司产品已服务超300家客户,完成超1000次部署,数千卡集群稳定运行超过1000天[22][33][49] - 公司发布“彤央”系列边端产品,构建覆盖100T至300T实测稠密算力的产品矩阵,标志着其“云+边+端”全场景算力布局成型[18][46] - TY1000算力模组在计算机视觉、自然语言处理、DeepSeek 32B大模型等多个场景中,实测性能优于英伟达AGX Orin,剑指“边端大算力国内第一”地位[21][49] - 在互联网AI领域,公司通过架构优化实现了Token成本减半;在科学探索领域,产品成为多家顶级学府的科研支撑[22][49] - 产品已深入产业场景:在瑞幸咖啡数千家门店处理视频流并支持营销决策;与20个车路云一体化试点城市合作;赋能具身智能机器人[24][51] - 在金融领域将研报生成效率提升70%;在医疗领域将结构化病历生成时间压缩至30秒[24][51] 算力价值主张与软件生态 - 公司提出以高效率、可预期、可持续为核心的高质量算力三维特质,重构算力产业的价值坐标系[12][41] - “高效率”体现为通过全链路优化降低TCO,依托kv cache量化+无损反量化技术将模型推理实际内存使用量降低50%以上[14][43][44] - “可预期性”通过精准的仿真模拟技术实现,让企业在获取芯片前即可预判万卡集群在任意模型下的性能表现,大幅降低试错成本[16][44] - “可持续性”通过通用GPU架构支持全类型数学运算图谱,确保硬件能应对未来算法演进,延长硬件生命周期[16][44] - 公司构建了AI++算力系统新范式,形成从底层AI库、通讯库到上层AI生成式应用、科研探索的全栈支撑能力[18][46] - 软件层面保持与主流编程接口高度兼容,客户仅需投入原计划三分之一的精力即可完成开发调优[25][53] - 公司的天垓系列产品已稳定运行400余种模型及数千种算子,国内新发布大模型在发布当天即可在其平台上跑通[25][53] 行业定位与市场前景 - 公司宣告国产算力正在告别“对标式”的路径依赖,正式驶入自主定义的领航海域[4][32] - 当算力竞争从“量的堆砌”转向“质的较量”,公司证明国产算力不再是实验室备选方案,而是在千亿市场中以现有成果为未来承诺背书[4][33] - 中国通用GPU市场规模已迈入千亿级别,国产化替代需求持续释放,公司凭借技术、产品、生态三重优势站在行业爆发的关键风口[27][55] - 公司采取硬件筑基、软件适配、伙伴协同的三维生态策略,与合作伙伴打通从芯片到系统部署的全产业链,形成完整布局[25][53] - 公司不寻求成为第二个英伟达,而是通过深耕通用算力,确保产品在长达十年的周期内稳定发挥价值,成为具备行业定义能力的长期主义者[25][53]
中国AI“三杰”同日轰炸,召唤百个Agent的门票终于发到每个人手里
观察者网· 2026-01-28 17:37
文章核心观点 - 月之暗面公司发布的Kimi K2.5模型,通过原生多模态和智能体集群等核心能力,将AI从“副驾驶”工具进化为可直接交付生产力的“同事”或“超级个体”,实现了从提供软件(SaaS)到提供服务(Service)的根本性商业范式转移 [8][22][24] 产品与技术能力 - **技术路线图清晰连贯**:K1时代构建超长上下文“记忆”,K2时代通过智能体解决“行动”,K2.5时代通过多模态和集群解决“感知与组织”,最终形成一个能看、能想、能干、能协作的“超级个体” [8] - **硬核基准测试表现卓越**:在SWE-Bench Verified和HLE等测试中,Kimi不仅超越DeepSeek V3位列开源第一,更在多项指标上击败闭源的GPT 5.2和Gemini 3 Pro,实现全球第一 [9] - **原生多模态能力颠覆开发流程**:K2.5的核心升级之一是原生多模态,视觉理解能力与语言、代码能力深度融合,用户仅需提供草图或涂鸦,Kimi即可生成包含完整HTML、CSS和JS的可运行代码,具备“动态理解”和“审美溢价”能力 [11][13][15] - **智能体集群重构组织形式**:K2.5引入的Agent Swarm架构,使主模型能作为“总指挥”自动创建并调度数十个AI分身并行协作,将复杂任务的处理链条大幅坍缩 [17][21] 效率与生产力提升 - **大幅缩短产品开发周期**:传统创意上线流程需数周乃至数月,K2.5将其坍缩为“决策者直连Kimi”的单节点,实现“所见即生成” [14][16] - **智能体集群显著提升效率**:在大规模搜索场景下,与单Agent相比,Agent集群将达成目标所需的最少关键步骤减少3到4.5倍,实际运行时间最高可缩短4.5倍 [19] - **深度集成办公场景提升人效**:K2.5可深度集成进Excel、Word等工作流,将处理万行数据表等需数天的工作量压缩至几分钟,提供强大的“人效杠杆” [20][21] 商业模式与市场影响 - **商业逻辑从“卖铲子”转向“帮你挖井”**:公司瞄准的不是销售软件工具,而是直接提供生产力服务,实现了从软件(Software)到服务(Service)的范式转移 [22] - **通过开源确立标准,通过云端服务盈利**:尽管K2.5开源,但企业自建“数字员工”的算力与运维成本高昂,公司通过极致优化的API服务实现利润,其价值主张极具吸引力 [23] - **市场增长与付费意愿强劲**:2025年下半年,公司全球付费用户数月增速达170%,自11月以来海外大模型API收入增长4倍,证明了开源模型可实现商业闭环且市场愿为“结果”付费 [23] - **切入广阔业务流程外包市场**:公司切入的不仅是软件市场,更是规模超3000亿美元的业务流程外包市场,使AI以“服务交付”形式直接进入劳动力市场 [23] - **估值快速攀升反映市场认可**:公司在12月31日完成5亿美元融资后,不到一个月估值即从43亿美元推升至48亿美元 [22] 行业趋势与未来展望 - **AI从“Copilot”进化为“Coworker”**:AI正在成为一个不可逆的时代洪流,从辅助工具全面进化为可直接协作的“同事” [24] - **重新定义企业核心资产与组织形态**:未来创业可能不再需要庞大团队,而只需足够算力配额;公司的核心资产可能从“人头数”转向“Agent调度能力” [24] - **技术的终极价值在于赋能于人**:技术的价值不在于其本身有多聪明,而在于能让多少人变得更强大,真正被重新定价的是人的想象力边界 [26]
这家国产GPU用七年深蹲,交出一份敢写日期的路线图
是说芯语· 2026-01-28 07:31
公司核心观点与路线图 - 公司于1月26日公布了2025至2027年精确的四代架构路线图,明确列出了超越国际巨头产品的时间点:2025年天枢架构超越英伟达Hopper,2026年天璇架构对标Blackwell、天玑架构超越Blackwell,2027年天权架构超越英伟达Rubin,之后将转向突破性计算芯片架构设计 [3] - 路线图并非空谈,其首代架构“天枢”的性能已在关键场景得到验证,在DeepSeek V3大模型场景下,平均性能已比英伟达Hopper架构高出约20% [5] - 公布路线图被视为公司管理市场预期的行为,而其大胆宣言的底气源于过去七年反常的“保守”与坚持,包括全栈自研和深入客户实战 [18] 技术实力与产品验证 - 公司发布了以自身大量测试为依据的性能白皮书,其天枢架构AI芯片在执行注意力机制计算时,算力实际有效利用效率达到90%,较当前行业平均水平提升60% [8] - 公司新发布了边端产品“彤央系列”,四款产品实测稠密算力覆盖100T到300T,其中入门型号TY1000在计算机视觉、自然语言处理、DeepSeek 32B大模型等多个场景的实测性能已超越行业标杆英伟达AGX Orin [8] - 公司产品支撑的数千卡级计算集群已稳定运行超过1000天,证明了其芯片硬件可靠性、系统软件成熟度及工程支撑体系的实力 [15] 商业化进展与客户价值 - 公司商业化飞轮已转动,拥有超过300家客户和超1000次实战部署,在国产GPU阵营中显著领先 [13] - 公司产品在真实业务中为客户创造了可量化的价值:为太平金科实现万亿资产风控提效;在医院将单份医疗病历结构化时间压至30秒;帮助互联网企业实现单机性能翻倍而Token成本减半 [16] - 客户迁移至公司平台的适配门槛极低,仅需投入原计划1/3的开发调优精力,国内新大模型发布当天即可在其平台上跑通,技术优势能迅速转化为生产力优势 [18] 发展策略与行业定位 - 公司坚持长达七年的全栈自研道路,从架构、核心IP到编译器、驱动,从芯片到系统再到应用,不留盲区,在追逐风口的行业氛围中选择了“笨功夫” [13] - 公司深入金融、医疗、互联网、科研等各行各业“啃硬骨头”,通过解决具体而琐碎的实际问题来积累实战经验 [13] - 公司的发展逻辑已从“技术公司”跑通为“产品公司”,其护城河在于让几百家客户愿意持续使用的综合体验,而非一两个惊艳的参数 [18]