DeepSeek

搜索文档
晚点播客丨硅谷怎么看 DeepSeek?与 FusionFund 张璐聊开源、Agent 和除了 AI
晚点LatePost· 2025-02-13 21:01
开源生态与AI模型发展 - DeepSeek发布开源推理模型R1,以较低成本在部分Benchmark上比肩甚至超越闭源模型o1,引发全球讨论[7] - DeepSeek的成功被视为开源生态的胜利,其创新建立在开源社区积累的基础上,同时推动了无监督强化学习和合成数据应用[11][12] - 开源生态有利于初创企业,促进多样性创新,而闭源更有利于大企业[13] DeepSeek的影响与行业反应 - DeepSeek改变了国际对中国AI公司的认知,展示底层架构创新能力而非仅工程优化[14] - AMD宣布与DeepSeek合作,但开源模型降低行业使用门槛可能长期增加算力需求而非利空英伟达[8][15] - Meta面临压力,其Llama架构受益于DeepSeek的结构探索,但品牌公关层面受到挑战[16] 闭源模型与开源模型的竞争 - OpenAI和Anthropic仍为行业Benchmark,但开源模型追赶速度超预期[16] - xAI凭借特斯拉和SpaceX的3D产业数据优势,内部迭代速度惊人[17] - 开源生态的多样性可能催生新架构,使AI模型在CPU上高效运行,改变芯片市场格局[19] Agent应用与行业机会 - OpenAI的Operator和Anthropic的Computer Use展示了智能体应用的潜力,但当前速度慢且存在信息编造问题[21] - Agent应用在医疗、金融、保险、太空科技等领域有垂直机会,与传统RPA的区别在于交互革新[24][23] - 用户对AI的信任度高于人类服务提供者,尤其在隐私信息分享方面,年轻一代行为模式变化显著[25] 中美AI投资差异 - 美国生态中巨头聚焦基础模型,初创企业在应用层与巨头形成协同,垂直领域受监管行业更倾向与初创合作[26][27] - 国内投资人担忧单一环节公司易受巨头挤压,而美国初创企业在高度监管行业有更多合作机会[26] 非AI领域的热点方向 - BioTech方向从延长寿命转向提升生命质量,AI加速医疗技术创新如数字化诊断和治疗[28] - SpaceTech因SpaceX降低发射成本,未来3-5年可能迎来爆发,洛杉矶形成太空科技聚集地[28][30] - 美国创新核心分布在硅谷、波士顿、纽约、奥斯汀和洛杉矶[30]
极氪、领克完成重要工商变更;OPPO东南亚销量超过三星;古茗港股上市破发丨百亿美元公司动向
晚点LatePost· 2025-02-13 21:01
吉利控股集团品牌整合 - 沃尔沃和吉利控股退出领克汽车科技股东行列[1][2] - 极氪收购沃尔沃原持有领克30%股份 持股比例达51%成为最大股东[2] - 品牌重新划分产品路线:领克主攻20万以上市场(小型车纯电/中大型车混动) 极氪主攻30万以上市场(中型车纯电/大型车电混)[2] - 2025年极氪和领克销量目标71万台 较去年增长近40%[2] - 两品牌共享研发和供应链资源 领克新SUV高阶智驾由极氪团队提供[2] 中国手机品牌东南亚市场表现 - 东南亚市场2023年智能手机销量9670万部 约为中国市场三分之一[3] - 四家中国品牌合计销售6050万部:OPPO约1690万部、vivo约1260万部、小米约1550万部、传音约1550万部[3] - OPPO首次超越三星成为销量第一[3] - 传音通过高性价比策略(价格区间数百元至千元)和本地化功能(非洲人脸识别/东南亚美颜适配)开拓市场[3] 茶饮行业动态 - 古茗港交所上市首日破发 收盘价9.3港元 总市值216.9亿港元[4] - 采用围绕仓库开店策略保障原材料供应并降低物流成本 现有9778家门店(中国第二大茶饮品牌)[5] - 主要收入来自加盟商支付的货品采购、设备费及管理服务费[5] - 古茗年推百款新品 自建冷链物流体系(低线城市每两日配送一次)[4] - 蜜雪冰城计划本月在港上市[4] 饮料食品行业趋势 - 可口可乐2023年四季度产品定价上涨9% 销量同比增长2% 营收同比增长6.4%至115.4亿美元[6] - 北美市场通过增加迷你罐包装实现销量增长1% 非洲推出高性价比可回收包装[6] - 国际咖啡期货价格创47年新高 阿拉比卡咖啡突破430美分/磅 近一年涨幅超70%[12] - 国内咖啡品牌通过锁定采购订单和云南豆替代缓解成本压力[12] 消费娱乐产业投资 - 上海锦江乐园将建哈利·波特主题乐园 占地5.3万平方米 预计2027年开放[7] - 园区包含室内外场景重现 同步升级原有摩天轮等设施[7] 科技与汽车行业合作 - 苹果与阿里巴巴合作为国行iPhone开发AI功能(海外市场合作方为OpenAI)[8] - 超过20家车企接入DeepSeek 包括比亚迪/吉利/奇瑞/长城及合资品牌[14][15] - DeepSeek因算力要求低易部署 主要用于座舱对话和场景服务推荐[15] 新能源与半导体产业 - 宁德时代递交港交所上市申请 拟筹资至少50亿美元(约365亿元人民币)用于海外产能扩张[9][10] - 2024年前三季度海外收入占总营收30% 当前总市值约1.1万亿元人民币[10] - 中芯国际2024年营收80.3亿美元(同比增长27%) 首次超越联电/格芯成全球第二大纯晶圆代工厂[11] - 归母净利润10.76亿美元(同比下滑38.4%) 主因资金收益下降[11] 咖啡行业竞争格局 - 库迪咖啡拓展门店模式:部分门店提供早午餐快餐 新开便利店销售啤酒/饮料/方便面[13] - 目前为全球规模第四/国内第二的万店咖啡品牌 曾推出3万元投资便捷店模式[13] - 2024年目标新开4万家店 年底总数达5万家(若达成将超星巴克成全球第一)[13] 汽车市场格局变化 - 日系车市场份额同比减少3.3%至13.4% 日产/本田1月在华销量分别下滑30.7%和31.8%[16] - 自主品牌零售份额增至61% 德系品牌份额18.4%(微降0.7%)[16] - 日产与本田合并谈判破裂 日产寻求新合作方[16]
DeepSeek 刷新全球 AI 格局;50 美元模型蒸馏术;美国公司们宣布 8000 亿美元算力投资丨AI 月报
晚点LatePost· 2025-02-10 17:50
格局变化 - DeepSeek推出R1模型,性能比肩OpenAI o1但API价格仅为1/30,迅速改变全球大模型竞争格局 [4][6] - R1发布后DeepSeek应用登顶美区App Store,两周下载量达ChatGPT同期两倍,中国DAU突破3000万 [8][12] - 英伟达股价因市场担忧GPU需求受冲击一度暴跌,但10天后反弹至3万亿美元市值 [7] 技术突破 - "蒸馏"技术成为焦点:伯克利团队用450美元、李飞飞团队用50美元即开发出接近o1性能的垂直领域模型 [15][16] - DeepSeek论文显示通过生成80万数据精调开源模型,可显著提升推理能力 [14] - 中国公司密集发布新模型,Chatbot Arena前20名中中国模型占比达5个,较上月增加2个 [17][18][22] 企业动态 - OpenAI年化收入超60亿美元,ChatGPT付费用户达1550万,企业API收入年化32亿美元 [5][29] - 微软考虑用DeepSeek模型替代OpenAI,Databricks超1000家客户半月内采用R1/V3 [12] - 英伟达发布Project Digits个人算力平台,可本地运行2000亿参数模型,售价3000美元 [31][32] 资本动向 - 1月26家AI公司获超5000万美元融资,中国占2家,医疗AI和算力优化领域最活跃 [39][45] - OpenAI启动400亿美元融资估值达3000亿,Anthropic获30亿美元估值600亿 [40] - 四大科技公司+OpenAI联盟计划超8000亿美元算力投资,但微软暂停33亿数据中心建设 [33][36][37] 行业趋势 - Agent应用成竞争焦点:OpenAI推出Task/Operator功能,Anthropic/智谱同步跟进 [27][28][30] - 数据争夺白热化:OpenAI爬虫导致网站崩溃,反爬虫"下毒"程序在开发者论坛流行 [52][54][56] - 开源模型冲击商业市场:Meta组建团队研究DeepSeek技术,计划用于Llama新版 [9]
晚点对话王小川丨不是文本创作、不是物理模型,AGI 的尽头是生命科学
晚点LatePost· 2025-02-10 17:50
公司战略与定位 - 百川智能聚焦医疗领域,认为医疗是大模型皇冠上的明珠,而非垂直场景,因医疗需求不会被超级模型覆盖[7][19] - 公司提出"造医生等价于AGI",将医生职业复杂度作为AGI标尺,计划2025年实现AI医生助理覆盖海淀居民[7][9][61] - 采取"水涨船高"策略而非"沿途下蛋",医疗场景天花板高,模型能力提升会持续增强应用价值[19] 技术路线与产品进展 - 发布首个全场景推理大模型Baichuan-M1-preview,具备复杂病症诊断能力,案例显示其诊断水平达市一级医院之上[6][12] - 医疗模型采用强化学习技术,2024年7月后明确医疗增强方向,计划2025年Q1推出超级医生模型并落地北京儿童医院[11][24][62] - 坚持语言是智能主轴的观点,认为多模态主要用于交互增强而非智力提升,技术重点在AI使用工具和制造工具的能力[69][75] 商业化与落地规划 - 已与北京儿童医院、海淀卫健委等机构合作,推出"一大四小"产品矩阵,涵盖居家至医院多场景[61][62] - 商业模式设计包含G端(政府)、H端(医院)和C端三层,AI辅助诊断已进入国家医保局服务项目立项指南[63] - 中国年就诊84亿人次,百度日健康搜索请求超5000万人,公司认为医疗具备超级应用潜力[48][49] 行业竞争与差异化 - 避开通用模型红海竞争,选择医疗赛道定位"在大厂射程之外",观察到百度腾讯等减少医疗投入[53][8] - 累计融资超50亿元但未大规模烧钱,被部分投资人评价为"最稳的大模型独角兽之一"[5][27] - 开源14B医疗增强模型促进产学研合作,医疗评测得分超过72B版本,可用消费级GPU部署[34] 创始人理念与长期愿景 - 创始人王小川从2000年基因测序研究起持续关注生命科学,提出"把生命变数学"的技术理想[5][39][30] - 认为AI将推动从科学时代到智能时代的范式迁移,医疗数据未来可支持生命科学研究突破[45][38] - 长期目标是实现"生物自由",通过AI医生解决医疗资源不可能三角,并推动新医学科研范式[87][100]
2900亿,史上最大融资要来了
投资界· 2025-02-10 16:12
孙正义牵头。 作者 I 吴琼 杨文静 报道 I 投资界PEdaily 奥特曼迫不及待。 当De e pSe e k正在全球掀起风暴,Op e nAI近日释放一则信息:软银集团即将敲定4 00亿美 元对Op e nAI的首轮投资。融资完成后,软银将超越微软成为Op e nAI的最大投资方。 4 0 0亿美元,约合人民币2 900亿元,这无疑是全球风投史上最大一笔融资。 官方介绍,软银和Ope nAI作为星际之门项目的牵头,将由软银负责新公司的财务事宜, Ope nAI负责运营事宜,孙正义将担任董事长。据悉,此次融资的部分资金将用于兑现 Ope nAI对"星际之门"项目的承诺。 以"投资狂人"著称,孙正义一向热衷于大手笔押注。有意思的是,他曾多次在公开场合 表达对错过Ope nAI早期投资的遗憾——在Op e nAI成立早期,孙正义曾计划向其注资, 但对方最终选择了微软作为主要投资方。 AI是当下最大的风口,孙正义不愿再错过了。本轮融资完成后,软银将取代微软,成为 Ope nAI最大股东。显然,孙正义正在践行他要将余生全部投入到AI的誓言。 此时,De e pSe e k爆红,正在成为Op e nAI最大的对手。 ...
今年杭州最火独角兽
投资界· 2025-01-30 15:04
核心观点 - DeepSeek被视为拉开中国科技爆炸序幕的现象级企业,成为2024年第一个全球瞩目的中国科技公司 [5] - DeepSeek通过算法创新大幅降低AI训练成本,以557.6万美元预训练费用实现OpenAI GPT-4不到十分之一的成本 [13] - 杭州正在崛起为科技创新中心,形成以DeepSeek为代表的"杭州六小龙"科技企业集群 [14][20] DeepSeek发展历程 - 创始人梁文锋1985年生于广东湛江,2002年考入浙江大学电子信息工程专业,2015年与同学创立幻方量化并实现管理规模超百亿 [7] - 2023年4月梁文锋宣布进军通用人工智能领域,11月发布首个开源代码大模型 [8] - 2024年5月发布DeepSeek-V2开源MoE模型引发行业价格战,1月发布DeepSeek-V3和R1模型震动硅谷 [8][10] - 公司团队仅130多名工程师,成员主要来自清华、北大等国内高校,雷军曾开出千万年薪挖角研究员 [8] 技术突破与市场影响 - DeepSeek R1在数学、代码、自然语言推理等任务性能比肩OpenAI o1模型 [11] - 应用登顶中美苹果App Store免费榜,首次有中国应用同时占据两国榜首 [10] - 发布引发美国科技股震荡,英伟达单日市值蒸发6000亿美元创纪录 [13] - 除夕发布开源多模态模型Janus-Pro进军文生图领域,OpenAI被迫加速推出o3-mini应对竞争 [13] 杭州科技产业生态 - 宇树科技2025年春晚机器人表演引发关注,2024年完成近10亿元B2轮融资 [16][18] - 强脑科技与Neuralink并列全球脑机接口融资超2亿美元公司,实现10万台便携式产品量产 [19] - 云深处科技机器人完成海外电力系统首单,群核科技家居设计软件市占率达70% [19] - 游戏科学《黑神话:悟空》团队2019年迁至杭州,看重当地艺术设计人才环境 [18] 城市发展战略 - 杭州提出2025年打造"三个地"目标:全球创新策源地、科技成果转化首选地、新质生产力重要阵地 [20] - 政府明确"财力再紧张也不压减科技投入"的政策导向,持续强化城市创新气质 [20]
假的
猫笔刀· 2025-01-29 22:18
春晚节目分析 - 春晚歌曲节目预制菜含量高 部分歌手采用预录形式 如王菲2024年表演被识别为预录 而薛之谦和onepublic的表演被识别为真唱 [1] - 语言类节目表现普遍低于演员日常水平 如林黛玉扮演者、岳云鹏和沈腾的表演效果与视频号数据(点赞转发10万+)形成反差 [1] - 舞蹈和魔术类节目保持行业顶尖水准 但刘谦2024年魔术被评价为"前半幼稚后半潦草" [1] 影视行业观察 - 《哪吒2》维持系列高质量水准 预计豆瓣评分8-8.5分 与第一部8.4分持平 故事为原创剧本 与封神原著无关 [2] - 申公豹角色塑造成为亮点 结尾埋下第三部伏笔 显示系列化开发策略 [2] - 动画制作水平超越前作 重要斗法场面展现细节与想象力 影片节奏紧凑 [4] - 票房预测达40亿元 有望成为春节档冠军 光线传媒可能受益 [5] - 春节档市场规模达百亿级别 影视类账号存在商业合作倾向 [6] 科技行业动态 - 英伟达股价单日大涨9% 收复周一半数跌幅 [6] - OpenAI指控Deepseek使用其专有模型训练开源模型 涉及数据蒸馏技术 但未提供具体证据 [6] - 数据蒸馏在AI行业普遍存在 被类比为"AI仿制药" 目前缺乏明确版权监管 [6]
晚点对话 MiniMax 闫俊杰:千万别套用移动互联网的逻辑来做 AI
晚点LatePost· 2025-01-17 15:46
核心观点 - 公司认为AI行业的核心驱动力是技术迭代而非用户增长,智能水平的提升不依赖大量用户反馈[8][17][19] - 公司明确自身定位为技术驱动型企业,在技术路线与产品需求冲突时优先选择技术突破[22][23] - 行业存在方法论误区,多数企业仍用移动互联网推荐系统思维开发AI产品[12][20][97] - 开源是加速技术进化的有效路径,公司首个开源模型MiniMax-01采用创新线性注意力机制架构[9][14][15] 技术路线 - MiniMax-01系列模型突破性采用线性注意力机制新架构,可高效处理400万token长上下文[9][45] - 模型参数规模超4000亿,是全球首个在此量级实现线性注意力机制的大模型[76] - 技术目标聚焦Agent能力提升,重点突破长上下文记忆、多Agent协同等方向[40][44] - 明确不跟风o系列模型开发,认为蒸馏技术虽可行但非核心创新路径[53][54][58] 产品策略 - 旗下海螺视频生成模型月访问量已达全球第一梯队水平[77] - AI社区产品"星野"用户留存率优于字节等大厂竞品[7][92] - 放弃移动互联网式增长目标,2025年核心KPI转为技术研发指标[106][129] - 测试中的信息获取产品尝试重构推荐逻辑,实现精准学术内容推送[62][63] 行业认知 - 中美AI差距在于中国缺乏原创性技术benchmark,过度依赖对齐国外模型输出[72] - 大模型与推荐系统存在本质差异:前者依赖预设能力分级,后者依赖AB测试[21][66] - 行业已从"Scaling Law信仰"转向寻求算法、组织等层面的持续创新[33][34] - 竞争格局不应区分创业公司与大公司,关键在于技术进化速度[98][114] 组织管理 - 团队结构保持三级扁平化管理,强调客观技术评估文化[79][81] - 人才策略承认字节跳动的人才密度优势,但认为创业公司更利技术人才成长[82][130] - 决策机制建立在共同技术认知基座上,弱化明确分工边界[125][126] - 主动优化团队结构,淘汰非技术驱动型人员[115][116] 创始人反思 - 复盘早期失误包括过度关注用户指标、未及时开源、产品定位摇摆[13][15][24] - 认知升级关键点在于明确技术迭代优先于商业化目标[132][133] - 创业方法论强调简单专注,拒绝"天选之子"叙事[30][140] - 自我定位非技术天才型创始人,重视团队协作价值[96][136]