Workflow
开源
icon
搜索文档
中金:从规模经济看DeepSeek对创新发展的启示
中金点睛· 2025-02-27 09:46
核心观点 - DeepSeek的出现打破了AI大模型研发需要巨额资金和技术积累的固有认知,由一家中国金融领域的初创企业开发出性能卓越的开源大模型[1][4][5] - DeepSeek的成功在于通过算法优化提升算力的边际产出,以技术进步突破规模定律的约束,这背后体现了中国在数字基础设施和人才规模方面的优势[1][8][11] - AI发展同时受规模定律和规模效应影响,规模定律带来后发优势,规模效应带来先发优势,中美在AI领域各有比较优势[15][16][22] - DeepSeek选择开源模式有利于构建更大规模的创新生态,加速AI应用层的渗透,发挥中国在应用端的规模优势[24][26][28] - 金融与科技存在天然联系,金融领域的创新本就是数字科技创新的一部分,金融科技与科技金融需要协同发展[36][38][39] AI经济学:规模定律与规模效应 - 规模定律指在给定算法框架下,增加数据、参数、算力投入可提升AI性能但边际收益递减,规模效应指规模扩大带来单位成本下降和效率提升[8][9][10] - DeepSeek通过算法优化提升算力边际产出,以技术进步突破规模定律约束,在算法框架改善下AI性能可呈现规模报酬递增[11][12][14] - 算法创新依赖于规模经济构建的创新生态,包括企业内部规模经济和上下游协同的外部规模经济[14] - 中国在数字基础设施和人才规模方面的优势为算法创新提供了支撑,体现大国规模经济效应[1][14][15] AI经济学:后发优势与先发优势 - 规模定律隐含后发优势,落后者要素投入边际产出更高,有利于差距收敛;规模效应隐含先发优势,规模报酬递增强化领先者地位[15][16][22] - 中美AI发展指数显示两国在研发端和应用端均具规模优势,美国研发端略强,中国应用端略强[16] - 中美发展路径分化:美国侧重算力优势,中国侧重算法优化和人才规模,2022年中国培养的AI优秀人才占比已达47%[18][19][21] - 美国限制算力出口可能促使中国更聚焦算法优化,强化比较优势,算法技术进步是AI发展的核心驱动力[19][22] 开源促进外部规模经济 - DeepSeek开源模式降低应用层商业壁垒,有利于加速"人工智能+"进程,2025年1月其APP在157个国家和地区下载排名第一[24][26] - 开源系统更依赖外部规模经济,闭源系统更依赖内部规模经济,如Android用户数近iOS三倍但开发者收入更低[25][28] - AI应用层潜在市场规模是算力层和模型层总和的两倍,开源加速渗透可释放大国规模优势,促进经济增长[27][28] - 开源将规模经济收益更多分配给生态伙伴,实现创新社会正外部性,弱化技术进步的贫富分化效果[28] 创新发展模式 - 科技创新与产业创新需要融合发展,中国需摆脱重供给轻需求、重资产轻人才的路径依赖[31][32] - 大市场需求优势是产业创新根本驱动力,如《黑神话悟空》《哪吒之魔童闹海》等成功案例[32] - 大企业擅长渐进式创新,小企业更具颠覆式创新活力,CVC模式可实现两者优势互补[33][34] - 知识产权保护与个人破产制度对激励人才创新创业至关重要[34] 金融与科技关系 - 金融活动尤其是资本市场关键在解决信息不对称,金融领域创新本就是数字科技创新的一部分[36][39] - 量化基金等金融科技是科技工具在金融领域的重要应用场景,AI大模型要素也是其竞争力所在[38] - 资本市场通过外部规模经济支持创新生态,与多样化创新生态更契合,大国资本市场更具优势[37] - 需平衡金融科技监管与包容"动物精神",重点防范不当行为而非限制超额收益本身[39]
微软CEO纳德拉最新访谈:开源是对赢者通吃的最大制约
IPO早知道· 2025-02-25 10:39
微软量子计算突破 - 微软发布全球首款拓扑量子芯片Majorana 1,采用半导体砷化铟和超导体铝材料,基于全新"拓扑"物质状态构建[3][4] - 该芯片历时近20年研发,目标在2030年前上市并实现百万量子比特规模,被视为量子计算的"晶体管时刻"[3][15][16] - 技术突破在于验证了马约拉纳零能模在新物相中的存在,使量子信息可被可靠隐藏和测量[15][16] 量子计算战略布局 - 微软采用软硬件分离策略,同时与中性原子、离子阱团队合作开发多种量子计算机类型[17] - 计划2027-2029年推出容错量子计算机,预计可容纳百万物理量子比特和数千逻辑量子比特[17] - 量子计算将专注于化学物理、生物学等非数据密集型但需探索指数级状态空间的领域[17][18] AI与量子计算协同 - AI可作为"模拟器的模拟器",量子计算则作为"自然模拟器",两者结合可生成合成数据训练更优模型[18] - 量子计算不会取代经典计算,但能增强高性能计算能力,尤其在材料科学等领域的模拟应用[17][18] AI市场格局判断 - 超大规模云服务(如Azure)和模型层将共存,但AI市场不会形成赢者通吃格局,企业客户会要求多供应商并存[7][8] - 开源模型将制约闭源垄断,政府监管也将介入防止私营公司主导AI领域[7] 计算基础设施需求 - AI工作负载(如ChatGPT)推动计算需求指数级增长,训练和推理阶段均需大规模计算集群[6][9] - 全球分布式计算集群成为刚需,需就近部署存储与计算资源以突破"光速限制"[9] AGI经济影响标准 - AGI实现的真正标志是全球经济增长率达到10%(当前发达国家平均2%),而非技术基准炒作[10][20] - 若实现10%增长,全球年新增价值将达10万亿美元(基于100万亿美元全球经济规模)[10] 智能成本与普及 - 遵循"杰文斯悖论",智能成本下降将刺激需求弹性,尤其在发展中国家医疗等领域的应用[14] - 智能需同时提升能力并降低成本,类似云计算通过弹性付费模式扩展市场的历史路径[14] 技术投资方法论 - 公司选择进入TAM(潜在市场总量)大且能容纳多个赢家的赛道,避免押注赢者通吃领域[8] - 研发需平衡短期需求与长期相关性,保持对失败的高容忍度以探索未来技术[23] 认知劳动演变 - 当前认知劳动可能被自动化,但会催生更高层次的认知任务,形成动态平衡而非完全替代[23][24] - AI工具应作为人类认知增强器,例如开发具备长期记忆的会议协调代理提升决策效率[25] 材料科学革命愿景 - 量子计算+AI有望加速新材料研发,目标在25年内实现传统需250年完成的工业革命级突破[25]
DeepSeek Inside:彻底的技术开放,成就的商业奇观
晚点LatePost· 2025-02-17 23:35
文章核心观点 - 中国正在经历“ChatGPT时刻”,DeepSeek通过彻底的技术开放与开源策略,在未进行营销投入的情况下,实现了现象级的商业扩散与生态构建,其模型被众多竞争对手及大型科技公司的产品广泛接入,引发了一场行业性的流量与算力竞赛 [3][4][6] DeepSeek现象级爆发的背景与动因 - 中国互联网用户每日在线时间长达6小时,抖音、小红书、微信、微博等社交平台接力传播,结合春节假期的社交裂变效应,推动了DeepSeek的全民级破圈 [5][6] - DeepSeek采取与OpenAI不同的路径,持续开源其最佳模型(如V3、R1),并采用宽松的MIT开源协议,保持技术中立且未引入任何投资方或与大厂深度绑定,降低了其他公司接入的决策压力 [6][29][30] - 其模型性能比肩第一梯队闭源模型,且训练和部署成本较低,构成了爆发的内核基础 [29] 算力云平台的竞速与影响 - 算力云平台是DeepSeek流量最直接的受益者,硅基流动在春节假期紧急加班,于2月1日率先接入DeepSeek模型,网站访问量在之后10天增长30多倍突破100万,一度超过阿里云 [10][12] - 腾讯云、阿里云、百度云、火山引擎等头部公有云平台紧随其后上线服务,但因晚了48小时,增长幅度远不及硅基流动 [12] - 流量远超预期,硅基流动、字节火山引擎等平台的API服务均一度陷入瘫痪,云厂商需紧急限流并寻找更多算力卡 [16][17] - 用于本地部署的硬件(如英伟达GeForce RTX 4090显卡)价格从去年中的1.4万元涨至1.9万元,英伟达市值也回升至3.4万亿美元 [17] - 有观点认为,中小云平台不应盲目参与API接入竞赛,因为该业务是“标品”,比拼的是“钞能力”,难以做出差异化 [18] 生态奇观:需求外溢与竞争对手的接入 - DeepSeek官方应用自1月27日起持续位居中国苹果App Store免费总榜第一,但其官方服务容量有限,导致需求外溢 [20] - 据SimilarWeb数据,DeepSeek网页版访问量在1月28日达到3786万高峰,半月后下跌超一半至1683万,而同期微信中讨论DeepSeek的热度(微信指数)增长了27% [20] - 竞争对手产品流量因接入DeepSeek而增长:豆包网页版春节后高峰访问量较节前高了27%,Kimi增长了54% [23] - 众多大型科技公司及AI创业公司接入了DeepSeek-R1模型,包括百度(文心一言、搜索)、阿里(钉钉、通义灵码)、腾讯(元宝、微信、QQ浏览器等至少14个产品)、字节(飞书),以及创业公司MiniMax、阶跃星辰等 [3][23][24][25] - 腾讯元宝在2月13日宣布接入R1后,其网页版当天流量上涨250% [24] - 微信在AI搜索功能中灰度测试接入R1模型,尽管入口隐蔽,仍很快被冲击到崩溃 [24] - 拼多多是少数未接入DeepSeek的大型科技公司,其自2023年起独立于AI竞争 [24] 公司战略与组织架构的调整 - 将DeepSeek接入核心产品的决策,在互联网巨头中多由一号位(如腾讯最高管理层、百度CEO李彦宏)最终拍板 [25] - 腾讯和阿里近期都调整了组织架构,将大模型研发团队与应用开发团队拆分开 [26] - 字节跳动的模型研发和产品组织依然紧密耦合,其主力AI产品豆包暂未接入DeepSeek,公司认为用户与自身模型迭代之间存在正反馈 [25][26] - 创业公司如MiniMax认为,模型技术与产品应分开看待,产品应优先满足用户需求,因此在其产品中接入了DeepSeek模型 [27] - 投资界观点认为,AI产品与模型当前是“松耦合”,产品本身短中期内已非关键胜负手 [27] - 各公司在接入DeepSeek的同时,也在迅速迭代自己的模型,腾讯元宝在上线R1后不久也上线了自研的混元T1模型,形成“赛马”机制 [27] 开源模式的行业影响与启示 - DeepSeek的彻底开源被业界视为“开源对闭源的胜利”,其不仅开源模型,还公开训练秘诀,延续了“开放、前沿的研究,赋能所有人”的初心 [28] - DeepSeek的成功证明开源道路在中国能走通,改变了行业认知,据了解至少有两家此前闭源的大模型公司可能将开源自研的领先模型 [31] - DeepSeek并非典型创业公司,其基于母公司幻方9年的积累,在相对充足的资金和算力环境下实践了开源路径 [31] - 创始人梁文锋对“开放”极为执着,曾因投资对象不开源而放弃投资 [31]
我所见过的梁文锋
投资界· 2025-02-07 15:54
量化投资行业发展 - 2018年量化市场初现格局,幻方量化当时管理客户资金约45亿,自营盘约10亿,已是行业第一梯队 [5] - 2019年幻方规模超过百亿,稳居国内量化私募"四巨头" [8] - 量化私募行业进步符合摩尔定律,每18个月投资能力翻一倍 [14] - 量化投资使命是提高中国二级市场有效性 [8][14] 幻方量化发展历程 - 2015年成立幻方科技,目标是打造世界一流量化私募团队 [11] - 2019年投入近2亿自研深度学习训练平台"萤火一号",2021年"萤火二号"投入达10亿 [9] - 萤火一号机房面积约1个篮球场,萤火二号预计达10个篮球场 [9] - 采用独特报酬计提方式:客户赎回时才提成,对客户友好 [5] 梁文锋个人特质与理念 - 技术理想主义者,专注编程开发,生活简朴 [5] - 愿景是建立不收业绩报酬和管理费的公司 [6] - 2019年提出想做开源策略平台让普通投资人使用 [8] - 2023年成立人工智能研究公司深度求索,推进"最终梦想" [6] 人工智能领域布局 - 认为开源是文化行为而非商业行为,给予是额外荣誉 [8][15] - 中国AI发展需要原创而非模仿,需建立技术生态 [15] - DeepSeek定位基础模型和前沿创新,希望业界在其技术上构建业务 [15] - 团队选人标准是热爱和好奇心,专注解决世界最难问题 [15][16] 量化投资方法论 - 金融市场公平透明,人类与计算机模型站在同一起跑线 [13] - 市场有效时直接买指数就是价值投资 [14] - 需要大量程序员和研究员支持量化投资发展 [13] - 引用西蒙斯理念"一定有办法对价格建模" [10][13] 技术创新理念 - 硬核创新需要信心和高密度人才组织 [15] - 创新驱动不仅靠商业,还需好奇心和创造欲 [15] - 颠覆性技术面前闭源护城河短暂 [15] - 价值沉淀在团队成长和组织文化上 [15]
​晚点财经丨全文翻译:黄仁勋对话扎克伯格:个人AI、开源和下一代计算平台;瑞幸季度利润下滑,放慢开店速度
晚点LatePost· 2024-07-31 18:33
黄仁勋与扎克伯格对话 - 扎克伯格认为大模型与具体应用场景结合是未来方向,即使基础模型停止发展,现有技术也足够支撑5年产品创新 [2] - Meta开源策略部分源于竞争考量,因计算设施建设较晚失去先发优势,通过开源可借助生态反哺自身 [2][30] - 双方认为开源生态将主导下一代计算平台,Meta推出Horizon OS开放操作系统对标Android模式 [31] - Llama 2开源激活全行业AI开发,4050亿参数版本推理成本仅为GPT-4o一半 [30][40] - Meta人工智能Studio计划让用户创建个性化AI代理,解决社交难题模拟等需求 [9][10] 瑞幸咖啡 - 二季度营收创新高达84亿元但净利润同比下滑超10%至87亿元,自营门店同店销售额暴跌209% [71] - 价格战导致行业整体承压,星巴克中国同店销售额下降11%,独立咖啡馆批量倒闭 [71] - 上半年净增2600家门店占行业总量25%,但二季度新开店环比减少41%,加盟商盈利压力显现 [71] 科技行业动态 - 比亚迪方程豹5全系降价5万元,月销不足3000辆拟转向主流市场 [72] - 特斯拉FSD被测试者指出存在危险变道行为,对Robotaxi计划持怀疑态度 [79] - 苹果首次在印度生产iPhone 16 Pro系列,生产周期已与中国同步 [80] - CapCut月活突破3亿占据移动视频剪辑80%份额,字节跳动重点投入 [81] 医药与消费 - 默沙东抗肿瘤药Keytruda季度销售额727亿美元,推动全年营收预期上调至644亿美元 [85] - 辉瑞实现2023年来首次营收增长达133亿美元,成本削减计划目标节省15亿美元 [86] - 宝洁二季度美容部门下滑1%,SK-II与大中华区表现疲软致股价下跌6% [84] 硬件与技术 - 苹果AI模型训练疑似采用Google定制TPU,未使用英伟达GPU或因历史纠纷 [82] - Meta智能眼镜聚焦AI交互功能,预计300美元价位产品将覆盖数亿用户 [51][52] - 极米科技净利润暴跌96%至367万元,投影仪市场需求持续承压 [77]