Workflow
月之暗面Kimi
icon
搜索文档
吴恩达最新研判:算力封锁?中国模型抢占17%份额,开源AI完成“反向突围”?
钛媒体APP· 2026-01-13 15:12
中国AI大模型市场增长与全球地位 - 2024年中国大模型市场规模突破200亿元,复合增长率超40% [1] - 中国开源模型的全球下载量占比达17.1%,已反超美国的15.8% [1] - 从2024年底到2025年,中国开源模型在特定领域的全球使用量从1.2%激增至近30% [3] 中国AI领军企业及发展路径转变 - 行业格局由阿里Qwen、DeepSeek、智谱GLM及月之暗面Kimi等领军企业主导 [2] - 中国企业从国内市场竞争转向向全球开发者输出“AI基建”,海外主流开发平台已接入中国模型 [2] - 中国AI已完成从“应用层模仿”到“底层基座输出”的关键跃迁 [3] 技术发展策略与效率革命 - 在高端算力受限背景下,中国企业被迫在算法效率上寻找突破口,催生了“效率革命” [4] - 以DeepSeek为代表的企业采用混合专家(MoE)架构,将单次推理成本压缩至美国同类模型的数分之一 [4] - 中国模型在Token经济学上建立护城河,率先实现“性能与成本的最优解” [4] 开源与闭源的生态路线之争 - 美国模式以OpenAI和Google为代表,坚持闭源,试图通过API构建封闭的商业闭环 [5] - 中国模式选择了Apache 2.0协议的极度开放路径,公开权重并允许商用 [6] - 中国开源力量的崛起旨在打破硅谷巨头的垄断预期,成为全球AI生态多样性的关键变量 [6] 未来行业趋势与核心竞争力演变 - 未来的决胜点在于Agentic Workflow(智能工作流)的构建 [7] - 实验证明,采用迭代工作流的80分模型表现优于追求一次性输出的90分模型 [8][11] - 未来核心竞争力将从“拥有最强模型”转移到“构建最强工作流”,职场将分化为被动的工具使用者和主动的“逻辑架构师” [9]
大模型:第一股,第一考
北京商报· 2026-01-08 23:45
智谱上市与市场意义 - 智谱于1月8日登陆港股,首日股价较发行价上涨超13%,成为“大模型全球第一股” [1] - 公司上市被视为大模型产业从技术探索走向商业验证的缩影,是对“技术逻辑能否跑通商业逻辑”的实战检验 [1] - 上市踩中人工智能资本化风口期,与近期国产GPU公司上市一同推高了市场对AI企业商业化的预期 [1] 公司战略与行业定位 - 公司技术底气和商业野望不容小觑,其大模型基础能力参与全球评测打榜,主攻B端场景的变现策略,意图与大厂分庭抗礼 [1] - 智谱是北京人工智能产业的一分子,同城角逐的还有抖音豆包、月之暗面Kimi、百度文心等200余款已备案大模型 [3] - 北京为人工智能设定了新目标:力争用两年时间实现人工智能核心产业规模破万亿元,即在2025年4500亿元规模基础上再翻一番多 [3] 行业阶段与核心挑战 - 人工智能行业正从参数竞赛转向场景落地的关键节点,从“浅水区”游向“深水区” [2] - 行业面临的核心挑战是如何在实现“从0到1”的技术突破后,完成“从1到100”的商业扩张与自我造血 [2] - 行业普遍存在战略性亏损,这是阶段性的集体困境,技术领先与商业可持续之间需要外部输血 [1] 资本市场审视与未来考验 - 上市是起点,公司需接受公开市场严苛持续的审视,技术和算力必须落地生根,数据和业绩是最终答卷 [1] - 资本市场是加速器也是试金石,奖励前瞻性但不会为纯粹梦想长期买单,投资者开始追问成本下降与盈利时间 [1][2] - AI行业竞争激烈且变化迅速,不推崇传统模式的积累效应,他人的快速突破可能轻松追上领先优势 [2]
中国AI崛起,“根”在这里
贝壳财经· 2026-01-08 16:52
文章核心观点 - 北京凭借顶尖人才密度、浓厚的学术与创业氛围、完善的产业生态系统以及前瞻性的政策支持,已从全球AI科研的“追赶者”转变为“核心策源地”和“引领者”,正全力建设人工智能创新高地,为中国及全球AI发展贡献核心力量 [4][8][22][23] 北京AI产业的整体地位与规模 - 北京已成为全球AI科研核心策源地,以7340.3篇调整后论文数和402.59的AI指数位列全球第一,显著领先于中国香港和旧金山湾区 [8] - 2025年北京人工智能核心产业规模预计达4500亿元,集聚企业超2500家,产业规模全国领先 [16] - 截至2025年末,全国完成备案的生成式人工智能服务共748款,其中北京市备案模型数量为209个,占比达28% [16] 人才与创新生态 - 北京拥有极高的人才密度,尤其是高端、跨学科技术人才,这是创新的核心基础,人才分布具有天然优势 [4][9] - 以清华大学、北京大学等顶尖高校及北京智源人工智能研究院为核心,形成了紧密的产学研生态,地理上的极近距离便于学生参与产业实践,智源研究院被誉为中国AI企业的“黄埔军校” [5] - 行业从业者由AGI(通用人工智能)愿景驱动,工作投入度高,形成了浓厚的奋斗与创新氛围,许多员工工作时间灵活且自愿延长,以探索技术天花板 [3][6] 关键企业与技术成果 - 基础模型领域:抖音豆包、百度文心、智谱GLM、月之暗面Kimi持续迭代,其中豆包在C端用户数量上国内断层领先 [14] - 多模态与端侧模型:生数科技Vidu、快手可灵、抖音即梦等产品受关注;面壁智能的端侧模型MiniCPM-o 2.6性能比肩GPT-4o;银河通用发布了创历史最大数据体量的具身抓取基础大模型GraspVLA [14] - 新架构探索:中国科学院自动化研究所发布全球首个全流程国产化类脑脉冲大模型“瞬悉1.0”;智源研究院发布全球首个跨本体具身大小脑协作框架RoboOS 1.0 [14] - 产业链上游企业:光轮智能作为仿真合成数据提供商,其仿真平台为模型训练提供高质量数据,全球前三的世界模型团队已全部与其合作,国际主要具身智能团队中超过80%的仿真资产和合成数据来自该公司 [12][13] 产业生态系统与协同创新 - 北京构建了完善的人工智能自主生态系统,便于企业与各类产业伙伴协同创新,避免闭门造车 [4][14] - 北京场景多元且复杂,为仿真数据等技术的落地验证提供了丰富基础 [11][14] - 产业链协同案例:光轮智能位于多模态、具身智能企业的上游,为其模型训练提供不可或缺的高质量数据 [13] 政策支持与发展规划 - 北京市政府对科技前沿认知深入,沟通效率高,愿意对长期投入和早期创业项目给予有力支持,提供了良好的政策环境 [4][18] - 北京召开“2026北京人工智能创新高地建设推进会”,会上智源研究院发布了旨在解决不同芯片兼容性问题的系统软件栈——众智FlagOS 1.6 [5] - 北京发布首批人工智能创新街区(如海淀原点社区、经开区模数世界、朝阳区光智空间等),打造以海淀为核心的“一核多点”布局,目标在未来两年内将其建设成为全国人工智能创新地标 [18] - 推行“一委一业、一区一品”发展格局,鼓励各部门、各区结合优势方向先行先试,形成产业闭环 [19] - 具体政策案例:海淀区推动建设全球首个高端数据标注示范基地,强调高阶人才参与数据生产和质量控制 [18] 具体区域与园区发展 - 海淀区“原点社区”(涵盖清华科技园、智源大厦等)AI创业氛围浓厚,是初创团队、工程师、投资人的聚集地 [16] - 朝阳区“光智空间”汇聚了中关村(朝阳)互联网3.0产业园、798·751 AIGC创意设计园等,将重点开展产业发展提质等三大工程 [20] - 中关村互联网3.0产业园(星地中心)已入驻387家企业,园区二期将开园建设,未来聚焦AIGC和人工智能方向 [21] 技术落地与应用示范 - 北京市已会同多部门及各区,在医疗健康、政务服务、法律服务、计算视听、电力保障等领域落地一批典型示范应用,并在商业闭环、企业培育等方面取得阶段性成效 [22]
北京发布首批人工智能创新街区
中国新闻网· 2026-01-05 21:19
文章核心观点 - 北京市发布首批4个人工智能创新街区,旨在打造以海淀为核心的“一核多点”布局,力争在未来两年内使各街区核心区形成示范引领作用,成为北京人工智能核心引擎和全国创新地标 [1] 创新街区布局与定位 - 首批4个创新街区坚持“一区一品”差异化发展,包括海淀原点社区、经开区模数世界、朝阳光智空间、石景山文化智境 [1][2] - 海淀原点社区定位为创新策源、创业首选,打造“全球AI人才创新创业第一站”,以五道口为核心,面积约3平方公里,形成“两核爆点+两支撑极”布局 [2] - 朝阳光智空间定位为光算融合、智启新境,面向量子计算、光子计算等下一代算力,位于中关村朝阳园,核心区面积约2.67平方公里 [2] - 石景山文化智境定位为文智共生、焕新蝶变,聚焦“AI+文化”融合,以石景山大模型集聚区和首钢园北区为载体,面积0.4平方公里 [3] - 经开区模数世界定位为模数拓界、端引新潮,聚焦前沿算法、具身智能和智能硬件,位于通明湖环湖科技带,总面积约2平方公里 [3] 北京人工智能产业基础 - 北京人工智能人才、企业、核心产业规模均在全国明显领先,占全国半壁江山 [1] - 已形成抖音豆包、智谱GLM、月之暗面Kimi、百度文心等一批基础模型,以及生数、面壁、可灵、深势等一批垂类模型,呈现平台企业迭代、新锐企业竞逐的态势 [1] 政府支持措施 - 在技术创新上,支持创新主体开展前沿共性技术攻关、关键核心技术攻关、人工智能产业共性平台和创新平台建设 [4] - 在应用示范上,对“人工智能+”应用示范给予支持,优先将新产品新服务纳入首台(套)认定,并支持优先选用国产大模型 [4] - 在要素保障上,为创新主体提供算力、数据支持,优先布局重大项目和政策,并优先向各类基金推荐街区内企业和项目 [4] - 在环境提升上,支持城市公共空间改造、标准厂房建设、低效产业空间及楼宇改造、老旧厂房改造和配套基础设施改造 [4] - 各区还将持续在住房保障、算力券、人才落户等方面加大对街区内企业的支持力度 [5]
大模型方向适合去工作还是读博?
具身智能之心· 2025-10-16 08:03
文章核心观点 - 文章探讨了大模型领域从业者面临的职业发展选择问题 即继续深造读博还是参与AI Agent创业潮 [1] - 决策需基于个人是否具备扎实的大模型基础以及是否适合扮演“开拓者”的研究角色 [1][2] - 大模型之心Tech知识星球被定位为一个综合性的学习与交流平台 旨在为不同阶段的从业者提供系统化支持 [2][4] 大模型行业现状与人才需求 - 大模型技术范围广泛 涉及生成、多模态、微调、强化学习、基准测试及多个下游应用领域 [1] - 通用大模型研发存在高壁垒 主要由顶级公司主导 [1] - 行业存在导师半路出家、学生基础不扎实的现象 凸显了系统性学习的重要性 [1][2] 大模型之心Tech知识星球资源 - 社区形式为视频、图文、学习路线、问答与求职交流的综合体 [2] - 已邀请40余位来自国内外顶尖高校(如清华、北大、上交、港科大等)和头部公司(如阿里、百度、字节、月之暗面等)的嘉宾 [4][66] - 提供大模型全栈学习路线图 覆盖RAG、AI Agent、多模态大模型等核心方向 [4] 技术路线覆盖详情 - RAG技术路线细分为Graph RAG、Knowledge RAG、多模态RAG、Reasoning RAG等8个子领域 [9][10][16][18][20][22][24][25] - AI Agent技术路线包括前沿综述、评测、强化学习、多模态Agent、通讯协议等7个细分方向 [26][27][29][31][33][35][36][38][40][42] - 多模态大模型训练涵盖MLLM、VLM、微调、RLHF、MoE等9个技术模块 [44][47][49][51][53][54][55][56][58] - 大模型量化、部署及推理被列为独立的技术板块 [60][61][62][63] 社区附加价值 - 提供大模型学术进展与工业应用的最新信息 [7] - 具备工作岗位推荐功能 可第一时间对接企业需求 [7][68] - 计划通过行业大佬直播分享和独家岗位招聘信息进一步赋能社区成员 [64][65][67][68]
但我还是想说:建议个人和小团队不要碰大模型训练!
自动驾驶之心· 2025-09-21 00:03
大模型应用策略 - 对于小规模团队,部署开源大语言模型结合检索增强生成技术已能满足99%的需求,在触及开源模型性能边界前不建议进行模型微调[2] - 若开源模型在特定垂直领域效果不佳,应优先尝试检索增强生成技术和上下文学习等低成本方案,而非直接进行模型微调[3] - 建议将最复杂的任务分配给o1系列模型,将需要较高智能的任务分配给4o等第一梯队模型[3] - 除付费模型外,可考虑采用DeepSeek、豆包、Qwen等国产开源大模型[4] - 基础模型能力的每次重大提升都如同一次技术版本更新,从业者需敏锐识别现有模型能力与业务需求的差异[6] - 应避免在低收益赛道进行无意义投入,采取错位竞争和降维打击策略更为有效[7] 核心技术趋势与人才需求 - 检索增强生成和智能体技术是当前大模型领域最具代表性的技术,企业对掌握这些技能的人才需求高涨[8] - 行业正积极构建技术社区,汇集来自上海交通大学、清华大学、北京大学、上海人工智能实验室、香港科技大学、香港大学等顶尖高校及阿里千问、美团LongCat、深度求索DeepSeek、字节豆包、百度文心一言、月之暗面Kimi等头部企业的专家[10][43] 技术社区资源体系 - 社区提供集视频、图文、学习路线、问答、求职交流为一体的综合型大模型技术平台[8][10] - 技术学习路线图全面覆盖检索增强生成、智能体、多模态大模型三大方向,包括Graph RAG、知识导向RAG、多模态RAG、推理RAG、智能体强化学习、多模态智能体、多智能体等细分领域[10] - 社区已邀请40余位学术界和工业界专家,计划不定期举办行业大佬直播分享活动[41][43] - 提供大模型相关工作岗位推荐和行业机会挖掘服务,助力职业发展[13][44]
黄仁勋谈中国AI创新:以令人难以置信的速度前进
快讯· 2025-07-16 16:44
中国人工智能发展 - 中国人工智能行业正在以令人难以置信的速度前进 [1] - 模型层有DeepSeek、阿里巴巴、月之暗面Kimi等优秀技术公司 [1] - DeepSeek是世界上第一个开源推理模型 这是一个毫无疑问的突破 [1] - 中国在模型层进步非常快 应用层发展也很快 [1] - 中国人工智能行业竞争激烈 参与者都致力于建立伟大公司或开展伟大业务 [1] - 越来越多优秀功能被开发出来 [1]
六大AI模型出战高考作文,人工智能ETF(159819)、科创人工智能ETF(588730)助力布局AI全产业链
每日经济新闻· 2025-06-09 11:20
市场表现 - 中证人工智能主题指数上涨0.3%,上证科创板人工智能指数上涨0.2% [1] - 人工智能ETF(159819)最新规模超160亿元,居同类产品第一 [1] AI技术进展 - 六大AI大语言模型(DeepSeek、百度文心一言、阿里通义千问、字节跳动豆包、月之暗面Kimi、GPT4o)在高考作文测试中评分均不低于50分(满分60分),展现语言理解与创作实力 [1] 行业观点 - 科技板块自底部抬升,整体仍处于高性价比区间,海外不确定性降温带动科技板块大涨,对A股科技成长板块形成映射 [1] - 建议以AI产业链为抓手,关注上游算力自主可控与中下游应用创新 [1] 产品信息 - 人工智能ETF(159819)、科创人工智能ETF(588730)覆盖AI全产业链,为投资者提供布局工具 [1] - 上证科创板人工智能指数覆盖30只科创板人工智能龙头股,聚焦算力和应用环节,电子和计算机行业占比超85% [4]
九大AI模型再答高考作文:座次剧烈变动
第一财经· 2025-06-07 23:24
AI模型高考作文表现 - 2025年九大AI模型高考作文测评显示,谷歌Gemini和DeepSeek以61.5分并列第一,元宝(61分)、通义千问(59.75分)、Kimi(59.5分)紧随其后,豆包(59分)、文心一言(58.5分)表现中等,智谱清言(50.75分)和ChatGPT(50.5分)垫底 [3][4][20][28][36][46][62][70][80][92][94] - 新晋模型Gemini和DeepSeek首次参评即登顶,去年前三名通义千问、元宝、豆包排名下滑至第三、第四和第六位 [3][4] - 测评采用上海卷思辨性作文题目,AI在逻辑明确的任务中表现更优;全国一卷诗歌类题目则普遍审题不清 [6][7] AI作文能力进步与局限 - 教师评价AI作文语言规范、材料丰富、逻辑性强,审题准确且结构程式化,但缺乏个性化思考和情感共鸣 [97][98][99] - 相比2024年,AI在情感表达和思想深度上有进步,但仍存在案例堆砌、逻辑错误和"论文味过重"问题 [1][2][99] - 高分作文如Gemini和DeepSeek的共性:论点鲜明、论据充实(引用爱因斯坦相对论、马尔克斯《百年孤独》等),结构完整且扣题紧密 [20][28] 头部模型厂商格局变化 - 测评覆盖国内外头部厂商,包括谷歌、DeepSeek、腾讯(元宝)、阿里(通义千问)、字节(豆包)、百度(文心一言)、月之暗面(Kimi)、智谱和OpenAI(ChatGPT) [5] - 谷歌Gemini和DeepSeek凭借技术迭代迅速崛起,成为新头部;国内厂商中腾讯元宝稳定性较强,阿里通义千问和字节豆包排名波动较大 [3][4][36][46] - 智谱清言和ChatGPT因内容生硬、分析浅显垫底,反映部分厂商在语言理解和逻辑构建上的技术短板 [92][94][96] 作文内容与评分细节 - 高分作文典型结构:Gemini采用"点题-关系阐述-正反论证-结论"框架,DeepSeek通过历史典故(孔子、钱锺书)强化思辨 [20][24][28] - 评分差异体现教师偏好:元宝获左建国最高分(63分)但文旭仅给52分,通义千问获文旭和许珊68分高分但左建国仅评51分 [36][46] - AI仍存在事实错误(如将黄庭坚诗句误标为苏轼),显示幻觉问题未完全解决 [47]
“有提升”,高考阅卷名师再评AI高考作文:九大模型座次剧烈变动
第一财经· 2025-06-07 22:00
AI模型高考作文表现 - 2024年九大AI模型参与上海高考思辨类作文测评,新增谷歌Gemini和DeepSeek两大头部模型,与去年通义千问、元宝、豆包等形成新竞争格局[2] - Gemini与DeepSeek以61.5平均分并列第一,元宝61分第三,通义千问59.75分第四,豆包降至第六名59分,ChatGPT和智谱清言分别以50.5分和50.75分包尾[3][4][20][42][52] - 头部模型优势体现在:审题准确度、逻辑严密性、材料丰富度,Gemini作文获65分最高单评,引用爱因斯坦相对论等案例论证多元传播路径[12][13] AI写作能力进化与局限 - 教师评价显示AI较去年进步明显:情感表达更自然,思想深度提升,但仍缺乏个性化思考与生命温度,难以产出满分作文[1][4][53] - 技术短板集中体现在:案例堆砌(如智谱清言)、论文腔调(ChatGPT)、结构模板化(Kimi),且存在引用错误等"幻觉"问题[21][42][52] - 任务适应性差异显著:思辨类明确题目(上海卷)平均分超60,而开放式诗歌命题(全国一卷)表现混乱[5][53] 行业竞争格局变化 - 国际厂商突破本土壁垒:谷歌Gemini首战登顶,与国产元宝、通义千问形成三强格局,OpenAI的ChatGPT表现垫底[2][3][52] - 新锐厂商快速崛起:DeepSeek空降榜首,月之暗面Kimi以59.5分超过百度文心一言(58.5分),显示技术迭代加速[13][32][36] - 测评标准影响排名:同一模型(如豆包)分差达13分(56-69),反映评价体系主观性对结果的影响[20][29]