Workflow
Deepseek R1
icon
搜索文档
MiniMax闫俊杰:AI领域会多玩家共存,成本也会更可控
21世纪经济报道· 2025-07-26 23:44
行业竞争格局 - 年初Deepseek R1开源模型引发行业震动,几乎成为所有下游AI应用厂商的选择,部分资本市场人士认为大模型战争已结束 [1] - MiniMax CEO闫俊杰认为AI领域将维持多玩家并存格局,不同模型因对齐目标差异而具备独特优势(如程序员能力、情商对话、想象力等)[2] - 开源模型影响力持续扩大,最佳开源模型性能已逼近闭源模型,例如月之暗面Kimi K2在代码和Agent任务能力上接近OpenAI/Anthropic水平 [3] 技术演进趋势 - MiniMax推出全球首个开源大规模混合架构推理模型MiniMax-M1,在长文本处理任务中计算量仅为DeepSeek R1的25% [4] - 模型优化带来显著成本优势:8万Token深度推理时算力需求为竞品30%,10万Token生成时仅需25%算力 [4] - 行业算力增长未导致模型规模同比扩张(如Kimi K2总参数1T,激活参数32B),因公司需平衡参数量与计算速度 [4] 成本与需求动态 - 未来1-2年顶级模型的推理成本可能再降一个数量级,单模型训练成本不会显著增加 [5] - 算力消耗呈指数级增长:单个对话Token消耗从几千增至几百万,因AI解决更复杂问题且用户基数扩大 [5] - 混合架构技术(如闪电注意力机制)推动效率提升,使模型在保持性能同时降低资源需求 [4]
各方关于H20的观点
傅里叶的猫· 2025-07-16 23:04
H20芯片库存与生产情况 - 大摩预计H20芯片库存可达100万片 其中成品芯片库存约70万个 需采购1万片CoWoS-S晶圆进行封装 KYEC可能额外提供20-30万个芯片 [1][2] - JP Morgan预测H20初期季度需求高达100万个 主要受中国AI推理需求驱动且无替代产品 库存可能在一个季度内消耗完毕 [3][4] - 瑞银估算H20销售额将达130亿美元 按每台1.2万美元均价计算对应销量略超100万台 销量恢复比例或达15%-20% [5][6] - Jefferies推测现有H20库存约55-60万个 基于150亿美元收入损失推算 后续将推出采用GDDR6内存的降级版本 [7] 市场需求与行业动态 - JP Morgan指出H20需求旺盛源于中国AI推理市场及客户提前下单行为 与2025年Q2 Deepseek R1的60万需求形成对比 [3] - 瑞银提到中国市场占英伟达数据中心销售额百分之十几 H20出口放宽将支撑下半年业绩 GB200产能提升及GB300量产将推动增长 [5] - Jefferies透露美国可能重新引入数据传输速度限制 HBM3内存的H20将停产 转向GDDR6版本 [7] 行业信息与资源 - 英伟达B系列服务器已在国内开放样品订单 接受行业客户咨询 [8] - 行业研究平台持续更新投行数据及关键信息 提供网盘资源整合服务 [10]
中信建投|下半年展望,寻找确定性与预期差
2025-06-19 17:46
纪要涉及的行业和公司 行业:A股市场、内需消费、有色金属、医药生物、金融、公用事业、煤炭、人工智能、人形机器人、创新药、新消费 纪要提到的核心观点和论据 - **弱美元周期显现及影响**:美元走势脱离利差框架且美国财政赤字扩大,预计2026年赤字率恶化至7%,2023 - 2024年或恶化至7.8%,弱美元成重要宏观背景;过去三段弱美元时期A股宽基指数上涨,消费风格最佳,内需消费、有色金属、医药生物和金融行业表现不错[1][2][4] - **资本市场新政策周期利好**:2024年9月以来出台多项利好政策,央行互换工具操作规模达1050亿,回购操作贷款上限总额达1374亿,合计约2400亿,为市场提供底部修复流动性支持[1][5] - **全球流动性宽松影响A股**:全球三大央行M2同比增长与A股走势相关,2019 - 2021年宽松推动A股牛市,2022年转负致熊市,2024年8月M2转正、9月美联储降息,开启新一轮牛市[1][6] - **全球货币政策处于宽松周期**:美联储短期暂停降息但周期未结束,2025年可能继续降息两次;欧洲央行多次降息,中国央行明确降准降息方向[1][7] - **外资态度转变**:外资从看空中国转向加仓,源于对中国财政和货币政策的信心、科技硬资产崛起、美国形象受损及中国软实力提升[3][8][9] - **下半年市场预期差**:外需可能不疲弱,通胀削减法案或提振美国需求;中美贸易战可能停战或修复;增量财政政策加码发力,结构性政策有望年中落地[3][11] - **下半年市场走势**:预计先震荡后向上,震荡中枢逐步上移,当前因基本面制约震荡,未来受弱美元、政策支持和流动性改善推动[12] - **市场向上突破因素**:全球基本面超预期改善、国内增量政策落地、新兴产业突破性发展,如人工智能、人形机器人、创新药、新消费等[13][16] - **A股中长期展望**:使用择时指标预测全A未来三年年化回报为8.64%,权益资产性价比高,建议维持60%中长期仓位配置,大趋势震荡上行[14] 其他重要但是可能被忽略的内容 - 2025年全年A股业绩增速预测年底仅零增长左右,全A剔除金融、石油、石化后的业绩增速可能负增长[12] - 市场存在对出口订单需求减弱、经济通缩、财政和货币政策乘数效应不足等悲观预期[10][11]
四月游戏收入同比增长超20%,游戏ETF(516010)涨超3%
每日经济新闻· 2025-06-03 11:01
中国游戏市场规模 - 2025年4月中国游戏市场规模达273.51亿元,同比增长21.93% [1] - 移动游戏同比增长28.41%,出海收入同比增长9.62% [1] Deepseek R1技术进展 - R1在AIME2024和LiveCodeBench测试中超越o3和Gemini 2.5 Pro,较旧版提升15% [1] - 推理能力蒸馏至Qwen3-8B小模型,数学测试结果较蒸馏前高10% [1] - 文字理解和创作能力提升:改写润色、总结摘要、阅读理解的幻觉率降低45%-50%,长篇写作和角色扮演能力增长明显 [1] 人工智能与游戏行业结合 - 人工智能持续发展有望提振游戏板块,游戏是成熟的人工智能应用领域 [1] - 大语言模型可能催生新玩法,例如剧本编写:通过提纲生成剧本并优化调优 [1] - 未来或通过大语言模型赋予游戏人物独立人格,使其在虚拟世界中自主行动 [1]
国泰海通|电子:Deepseek R1更新,商业场景拓展加速
Deepseek R1模型性能升级 - 深度思考能力对标国际顶尖模型OpenAI-o3和Gemini-2-5-Pro-0506 在数学、编程与通用逻辑等多个基准测评中整体表现接近[3] - 蒸馏训练性能显著提升 基于Deepseek-R1-0528思维链训练的Qwen3-8B Base模型在AIME2024数学测试中性能仅次于原模型 与Qwen3-235B相当[3] - 幻觉率降低45-50% 在改写润色、阅读理解等场景表现优化 同时支持议论文、小说等文体的长篇内容生成及工具调用[3] 商业化应用前景 - 性能迭代有望提升用户渗透率和使用频次 带动国产算力产业链需求增长[4] - 蒸馏模型在端侧设备表现优异 加速大模型在手机、PC、眼镜等终端设备的落地应用[4] 行业影响 - 模型更新被视为行业催化剂 推动国产大模型技术持续迭代[5] - 技术突破可能重塑AI赋能终端设备的竞争格局[4]
Openai重回非营利性 商业路之殇
小熊跑的快· 2025-05-06 18:37
OpenAI组织架构调整 - OpenAI宣布将保持慈善组织身份,并将营利性子公司转型为公益公司(PBC),非营利组织作为大股东控制PBC [1] - 此次调整强调公司的非营利性定位,与2023年人事动荡中关于商业化与安全性的争议有关 [1] - 前首席科学家Ilya Sutskever因反对过度商业化离职,其新项目SSI估值达200亿美元,而OpenAI当前估值3000亿美元 [1] 开源与闭源之争 - 行业质疑OpenAI闭源商用模式的可持续性,原预计2026年面临挑战,但开源模型的快速追赶使压力提前 [1] - Llama4、Deepseek R1等开源模型性能已接近GPT-4初代水平,代际差距缩短至14个月以内 [1][2] - Claude 3.5/3.7凭借开放态度和API调用便利性在亚洲市场占据优势 [2] 商业化与竞争格局 - OpenAI的API定价比竞争对手(R1、豆包)高一倍多,而最新季度行业API调用量环比增长4-5倍 [3] - 云计算厂商大力推广其他基础模型,性价比优势对OpenAI形成冲击 [3] - 苹果未投资OpenAI,反映市场对基础模型商业化前景的谨慎态度 [2] 行业技术发展 - 开源模型通过社区生态加速迭代,投资者更倾向支持可延展开发的平台 [2] - 模型代际追赶速度超预期,开源阵营已接近2024年初GPT-4水平 [1][2]
AI 取代人类的第一步,就是剥夺我们“慢思考”的能力
AI科技大本营· 2025-04-28 17:58
AI大模型发展历程 - 1980年代AI主要依赖规则基础的专家系统 如医疗诊断系统通过预定义规则快速处理信息但缺乏灵活性和学习能力 [1] - 21世纪机器学习兴起 垃圾邮件过滤器通过算法从数据中学习识别邮件类型 引入神经网络等复杂模型实现更深入分析 [1] - 当前AI大模型如GPT/BERT具备复杂语言理解和生成能力 关注上下文/情感/逻辑推理 决策表现更接近人类慢思考 [12] 卡尼曼双系统理论对AI的影响 - 系统1(快思考)自动快速运行依赖直觉 占日常决策90%以上 系统2(慢思考)需专注处理复杂问题占深度决策10%以下 [6][10][11] - ChatGPT思维链技术基于双系统理论 通过逻辑推导/因果关系分析实现系统化决策 如Deepseek R1/o1的思维链推理 [12] - 前景理论帮助AI模拟人类损失厌恶心理 启发式与偏差理论优化算法避免认知偏差导致的决策错误 [12][13] AI与人类认知模式对比 - AI向慢思考进化 如360AI深度搜索调用多模型模拟人类思考步骤(意图识别/推理等)提供精准信息 [12] - 人类在信息爆炸时代趋向快思考 依赖短视频/碎片化新闻导致深度思考能力弱化 [15] - AI生成内容(图片/视频/声音)逼真度提升 被用于诈骗如AI换脸案件造成单笔430万元损失 [20][21] AI技术应用与互补 - AI可辅助人类慢思考 如MIT实验室认为AI是工具 能快速分析海量数据为决策提供依据 [25] - AI心理咨询功能通过对话分析用户认知偏差 提升自我认知减少焦虑 [26] - 人类创造力/情感理解力与AI高效性形成互补 如创造性想法和情感连接是AI无法替代的能力 [27] 行业技术动态 - AMD举办2025 GPU挑战赛 设置FP8 GEMM/MLA with ROPE/Fused MoE三大算子赛道 总奖金10万美元 [32][34] - 参赛需通过Github CLI工具提交内核 中国大陆开发者可参与 获奖者或受邀参加硅谷AI日活动 [35][37]