Workflow
推理模型
icon
搜索文档
AI转向”推理模型和Agent时代“,对AI交易意味着什么?
硬AI· 2025-03-10 18:32
行业趋势转变 - AI行业正经历从传统大模型向推理模型和Agent的转变 强调"巧"而非"大" [2][4] - 模型进化方向从死记硬背转向链式思考(CoT) 实现多步验证和精准输出 [5] - 应用范式从聊天机器人升级为能执行任务的Agent 覆盖客户服务 金融分析等场景 [7] 技术路径分化 - 两种发展情景:Chinchilla缩放持续有效则2028年模型达65万亿参数 或预训练停滞转向推理优化 [10][11] - 推理模型代表如OpenAI的o1/o3和DeepSeek R1 已展现更高基准测试成绩及成本优势 [5] - 算力需求结构变化:推理计算占比将超50% 2028年推理算力缺口达2500亿exaFLOPS [13] 产业链影响 - 芯片需求从通用训练芯片转向定制推理芯片 网络设备商持续受益 [9][18] - 开源模型(Llama/DeepSeek)发展迅速 但微调成本仅为大模型训练的小部分 [15][16] - 科技巨头自由现金流可能改善 因推理成本下降减少资本支出压力 [19] 投资逻辑重构 - 缩放定律有效时优先布局芯片/设备供应商 警惕高资本支出科技企业 [1][18] - 预训练停滞则关注科技巨头现金流回升及用户基数大的应用类公司 [1][19] - ChatGPT两月新增1亿用户显示Agent应用爆发潜力 [7]
算力又演绎到了 熟悉的节奏
小熊跑的快· 2025-03-06 07:37
文章核心观点 算力演绎到23年云租赁逻辑,仍在云框架内,阿里新模型QwQ - 32B性能出色且开源,推动国内推理需求和应用部署 [1] 行业动态 - 算力发展演绎到23年云租赁逻辑,未脱离云的整体框架 [1] 公司动态 - 阿里Qwen团队发布QwQ - 32B大语言模型,拥有320亿参数,性能可与具备6710亿参数(370亿被激活)的DeepSeek - R1媲美,在约1/21参数量情况下用强化学习实现性能跨越 [1] - 阿里在推理模型中集成与Agent相关能力,使其能使用工具、批判性思考并根据环境反馈调整推理过程 [1] - QwQ - 32B在Hugging Face和ModelScope开源,推动国内推理需求和应用部署,模型更小成本更低利于垂直部署 [1]
【太平洋科技-每日观点&资讯】(2025-02-28)
远峰电子· 2025-02-27 20:03
行情速递 - 主板领涨个股包括德明利(+6.12%)、和而泰(+4.03%)、盈方微(+2.86%)、歌尔股份(+2.61%)、有研新材(+2.55%)[1] - 科创板领涨个股包括云从科技-UW(+19.98%)、天德钰(+13.56%)、翱捷科技-U(+10.04%)、英集芯(+8.28%)、思特威-W(+6.83%)[1] - 活跃子行业中,SW数字芯片设计(+0.55%)和SW被动元件(+0.33%)表现突出[1] 国内新闻 - 2024年中国半导体产业投资总额为6831亿人民币,同比下降41.6%,但半导体设备投资逆势增长1.0%,达到402.3亿人民币[1] - 晶合集成与思特威签署战略合作协议,第一阶段将提供月产能1.5万片Stacked晶圆,第二阶段提升至4.5万片[1] - DeepSeek开源三项优化并行策略,详细展示DeepSeek-V3和R1模型的并行计算优化技术[1] - 芯原股份推出AI图像处理系列IP,包括AINR1000、AINR2000(智能降噪)和AISR1000、AISR2000(超分辨率),覆盖汽车、监控等领域[1] 公司公告 - 华海诚科2024年营收3.32亿元(+17.21%),归母净利润4080万元(+28.97%)[2] - 天承科技2024年营收3.81亿元(+12.32%),归母净利润7684万元(+31.19%)[2] - 微导纳米2024年营收27.00亿元(+60.74%),主要因光伏和半导体设备验收数量增长[2] - 芯源微2024年营收17.70亿元(+3.09%),归母净利润2.11亿元,高温硫酸清洗机台通过客户验证[2] 海外新闻 - 2024年全球电视出货量2.3亿台(+2%),中国出货量首次超过韩国[2] - 2024年全球智能眼镜销量298.3万副,2025年预计增长超4倍,苹果、谷歌等40余家厂商布局[2] - 英伟达财报显示推理需求加速,Blackwell Ultra芯片预计下半年推出[2] - 2024年Q4全球DRAM营收突破280亿美元(+9.9%),Server DDR5合约价上涨及HBM出货推动增长[2] 行业研究团队 - 孙远峰为太平洋证券科技行业首席分析师,团队专注于产业资源赋能研究,获2023年君鼎奖及Wind金牌分析师进步最快奖[3]
速递|英伟达黄仁勋强调DeepSeek利好英伟达,将2025年实现强劲增长
Z Potentials· 2025-02-27 12:09
Nvidia CEO 黄仁勋(Jensen Huang) 对公司的未来一如既往地充满信心,他在2月26日周三的最新财报电话会议上重申, DeepSeek 不会影响销售。 有关 DeepSeek 的 R1 模型训练所需芯片数量大幅减少的猜测,推动了 Nvidia 股价上个月创纪录的下跌。 图片来源: Nvidia 但在财报电话会议上,黄仁勋将 R1 誉为"卓越的创新",并强调它和其他"推理"模型对 Nvidia 来说是重大利好消息,因为它们需要更多的计算资源。 "推理模型的计算消耗可能是现在的 100 倍,而未来的推理模型将消耗更多的计算资源,"黄说。 " DeepSeek R1 已经点燃了全球的热情。这是一项卓越的 创新,但更重要的是,它开源了一个世界级的推理 AI 模型。几乎每一位 AI 开发者都在应用 R1 。" Nvidia 的销售未见放缓迹象。 Nvidia 报告了又一个破纪录的季度,其收入达到 393 亿美元——超过了公司自身的预测和华尔街的预期。 公司还表示,预计 下一季度的收入将再次增长,达到约 430 亿美元。 的确,尽管上个月人们对 DeepSeek 的恐慌情绪蔓延,但 AI 芯片市场并未显 ...
OpenAI 再次给大模型 “泡沫” 续命
晚点LatePost· 2024-09-13 23:58
OpenAI o1模型发布 - OpenAI发布新型推理模型o1系列,包括o1-preview和o1-mini,性能在数学、编程等领域大幅超越GPT-4o [3][5][7] - o1采用强化学习和思维链技术,通过自我纠偏和分步推理提升逻辑能力,解题时处理字符量达6632个,是GPT-4o的4.2倍 [8][9][19][25] - 模型响应时间显著延长,o1-preview回答简单问题需32秒,是GPT-4o的10倍,且目前功能受限,开发者API调用被限制为每分钟20次 [25][29] 技术路径革新 - o1突破传统Scaling Laws瓶颈,通过增加"答题时思考"的算力分配(test-time compute)实现性能跃升,AIME数学竞赛得分达GPT-4o的4倍 [5][19][26][27] - 训练数据来源扩展至三类:公开数据集、合作伙伴专有数据和内部定制数据,研发团队规模与GPT-4o相当(212人) [21] - 模型架构可能向"推理核心+知识存储"方向演进,OpenAI暗示将把o1技术整合至下一代GPT模型 [27][29] 行业影响 - o1发布刺激英伟达股价两天累计上涨10%,缓解市场对AI进步停滞的担忧,此前英伟达市值从6月高点已下跌20% [3][4][29] - 红杉研究显示AI领域2023年投入产出差达1200亿美元,2024年可能扩大至5000亿美元,除英伟达外多数公司未实现收入大幅增长 [4] - 中国部分科技公司已暂缓基础模型训练转向应用开发,o1发布可能重启算力竞赛,OpenAI借此时机以1500亿美元估值寻求70亿美元融资 [4][6][30] 产品特性对比 - o1在数学/编程测试中表现突出:Codeforces编程竞赛成绩超GPT-4o 5.6倍,但语言创作能力弱于GPT-4o [19][22][24] - 相比GPT-4o,o1系列暂缺网页浏览、文件处理等功能,付费用户使用频次受限(每周30次o1-preview) [25][29] - 下一代o1模型在物理/化学等学科测试表现预计达到博士生水平,当前模型相当于硕士生水平 [21]