Workflow
混元Turbo S
icon
搜索文档
AI展望:NewScaling,NewParadigm,NewTAM
华泰证券· 2025-06-10 09:43
报告核心观点 - 全球AI发展呈现模型端新架构探索、算力端需求上行与硬件设计进入新范式、应用端商业模式变革的趋势,持续看好AI产业投资主线,全球AI应用将进入业绩收获期 [1] 模型:预训练Scaling Law有望开启新起点 - 大模型技术路线从预训练到后训练发展,2018 - 2024年9月为预训练阶段,2024年9月后进入后训练阶段 [13][15] - 腾讯混元Turbo - S通过创新架构实现性能与效率平衡,Google Gemini Diffusion在文本生成上有突破,大厂在预训练参数量和数据量扩大上有尝试,大规模算力集群支持预训练探索,模型架构改进或使预训练Scaling Law开启新起点 [23][24][25] 算力:训练推理两条主线共同推动算力需求持续上行 训练端 - 后训练阶段Scaling Law成大厂共识,新Scaling路径不断涌现,新架构探索有望重启预训练阶段算力需求叙事 [33][34] - 以“星际之门”为代表的大规模算力集群进展顺利,中东版“星际之门”落地,主权AI逐步落地,台积电新产能规划预示算力需求乐观 [38][41][42] 推理端 - Agent需求增长或使推理算力提升几十至上百倍,大量工具调用和信息交互使tokens消耗量大幅提升,产品用户数量增长带动算力需求提升 [43][46][52] 算力硬件新范式 - 大模型对系统综合能力要求提高,NVLink Fusion强化英伟达硬件生态优势,国产算力加速迭代,华为云推出新服务器,高密度机架方案为性能追赶提供路径 [57][58][60] 应用:Agent进展提速,看好AI应用进入业绩收获期 Agent发展情况 - Agent可能是AI应用终极形态,目前雏形初具,但完成复杂长期任务能力有限,“任务长度”是关键衡量指标且提升速度快 [68][73][74] - MCP统一了Agent工具调用生态,促进其快速构建和发展 [79] 海外AI应用 - AI Coding是重要垂类赛道,细分垂类商业化效果好,25Q1业绩大部分超预期,头部2B软件AI产品存量客户渗透率接近10%,全年收入有望加速增长 [82][84][85] 国内AI应用 - 加速从简单环节到复杂环节产品升级,25Q1利润指标率先改善,AI商业化24年初步验证,25年有望加速复制推广,MCP有望加速产业节奏 [88][90][94] 落地节奏展望:商业模式变革有望成为共识,看好细分领域率先放量 商业模式变革 - Agent应用从交付工具转变为交付结果,按效果付费新范式有望成行业共识 [99] 细分场景放量 - 数据复杂度低、幻觉容忍度高的场景率先实现规模化商业落地,2C场景商业化进展领先,2B应用分场景和行业来看,数据复杂度和预算影响落地节奏 [103][104][110] AI + 营销/销售 - 数据丰富、可量化ROI和流程标准化驱动AI快速商业化,企业需求从单一工具向全链路智能中枢升级,市场格局分散,AI有望重塑格局 [113][114][119] 重点公司推荐 - 推荐金山办公、福昕软件、泛微网络等多家公司,均给予“买入”评级 [7]
加大AI投入!腾讯汤道生:加速AI大模型、智能体、知识库和基础设施建设
新浪科技· 2025-05-21 11:07
腾讯云AI产业应用峰会核心观点 - 生成式AI已从"量变"发展到"质变",公司持续加大AI投入,业务全面拥抱AI,通过大模型、智能体、知识库和基础设施"四个加速"打造"好用的AI" [1] - 行业对大模型API调用量和算力需求快速增长,未来需从"可用"到"好用",从"一部分人用"到"人人能用",需优化交互体验、执行能力、内容准确性和落地成本 [3] 腾讯AI技术进展 - 腾讯混元T1和Turbo S持续迭代,混元TurboS进入全球Chatbot Arena前8,中国大模型中仅次于DeepSeek [3] - 多模态领域,腾讯混元在视觉理解、语音交互、3D、实时生图等能力获行业认可 [3] - 智能体开发平台助力企业快速构建应用,QQ浏览器、腾讯健康、腾讯云代码助手CodeBuddy等已接入智能体能力 [3] 知识库与基础设施优化 - 发布腾讯乐享企业AI知识库,管控知识有效性、更新时间和权限,解决企业场景专业知识缺失问题 [4] - 行业智算需求从训练转向推理主导,公司通过IaaS层与工具层协同优化,提升推理场景的响应速度、延时和性价比 [4] 行业应用与愿景 - AI需走进千行百业,通过技术升级降低使用门槛,使其服务于企业经营者、开发者和普通用户 [1][4]
财通证券:1Q2025计算机板块业绩企稳 行业投资迎来很好加仓窗口
智通财经网· 2025-05-12 11:26
计算机行业基本面与投资机会 - 1Q2025申万计算机行业整体营业收入同比增长15.9%,归母净利润同比增长671.5% [1] - 1Q2025毛利率同比下降3.4pcts,净利率同比提升0.6pcts,主要因传统订单拖累毛利率但费用率显著下降 [1] - AI产品落地放量及化债推进有望带动毛利率企稳回升,行业迎来加仓窗口 [1] AI大模型发展态势 - 国内AI大模型呈现"百家争鸣",DeepSeek通过算法创新成为头部玩家 [2] - 腾讯混元Turbo S降低训练推理成本,MiniMax扩展线性注意力机制至商用级 [2] - 智谱GLM-Z1-Air以小参数实现高性能,阿里Qwen3采用混合推理模式降低硬件消耗 [2] AI产业链高景气领域 - 国产AI芯片、算力租赁、服务器电源、液冷等环节景气度上行 [3] - C端生产力工具加速融合大模型,AI Agent优先落地营销客服领域 [3] - 智能驾驶处于L2.5向更高级突破期,低空经济与电力信息化高速发展 [3]
腾讯研究院AI速递 20250429
腾讯研究院· 2025-04-28 23:48
1. 第三方团队TNG成功将DeepSeek V3-0324和R1模型融合,创建出DeepSeek-R1T- Chimera,兼具R1能力与V3速度; 1. 多位OpenAI前高管选择创业进军AI领域,如Ilya Sutskever创立SSI、Mira Murati成立 Thinking Machines Lab等,获得大额融资; 2. 创业方向多元化,涵盖安全AI研究、教育科技、搜索引擎、机器人等领域,显示AI应用场 景广泛; 一、 DeepSeek R2等太久?第三方基 于 新 版 V 3 推 出 融合 模型 3. 这些创业公司估值普遍较高,如Anthropic达615亿美元,xAI估值1130亿美元,投资者对 AI前景乐观。 2. 新模型在"7米甘蔗过2米门"问题上展现出深度思考能力,虽用时101秒但推理过程更严 谨; 3. 模型融合成为新趋势,除TNG外,KIMI和Sakana AI等团队也在探索不同的融合方法。 生成式AI https://mp.weixin.qq.com/s/pBN5me3_AYN5JT3Id3Oe9A 二、 离职OpenAI的大牛们,竟然创立了这么多公司, 企业盘点 https: ...
腾讯在 AI 拐点到来前的 700 天
晚点LatePost· 2025-03-24 18:58
新节奏、不赛马、好运气。 文 丨 高洪浩 编辑 丨 黄俊杰 DeepSeek 今年春节火遍中国之后,腾讯是第一个全线产品尽数接入的巨头,从微信、QQ 到腾讯自己 的 AI 助手元宝和才上线几个月的工作台产品 ima。这被认为是腾讯 AI 投入爆发的开始。 但据我们了解,改变比这早几个月。从去年下半年起,微信便探索起了 AI 相关的能力。DeepSeek 出来 以前,腾讯高层也已着手,将分散在各事业群里的工具产品打包起来,统一管理。 2023 年初,ChatGPT 问世几个月后的一次管理层战略会上,腾讯技术与工程事业群总裁卢山以 ChatGPT 举例,认为 OpenAI 从推出 GPT 模型开始,"花了三年时间才真正产品化,而腾讯的大模型肯 定会很多坑要踩,所以不会着急。" 一位在场人士转述他的话。腾讯的 AI 助手产品元宝在 2024 年 5 月 底才发布,比豆包、Kimi 晚了近一年。 当阿里与字节在大模型、软件和硬件上全面出击时,一位腾讯人士记得,腾讯董事局主席兼 CEO 马化 腾跟一些 AI 团队说,"要好好与外部合作,不要想着什么都自己做"。2024 年,字节在为豆包大举投 放、成为英伟达重要客户时, ...
腾讯,大动作!价格为DeepSeek-R1的1/4
21世纪经济报道· 2025-03-22 19:41
腾讯混元T1模型发布 - 腾讯于3月21日深夜推出自研深度思考模型混元T1正式版并在腾讯云官网上线 与阿里发布QwQ-32B类似 选择深夜时段发布主要面向海外开发者 显示中国大模型正走向海外市场 [1] - 混元T1通过大规模强化学习及理科专项优化 推理能力显著提升 综合效果较此前混元T1-preview模型有明显进步 在MMLU-PRO基准测试中评分仅次于OpenAI-o1 优于DeepSeek-R1 [1] - 在DROP F1逻辑推理测试中 混元T1评分超越DeepSeek-R1和OpenAI-o1 但在数学和代码测试中低于DeepSeek-R1 中文理解能力与DeepSeek-R1持平 整体达到业界领先水平 [2] 技术架构创新 - 混元T1以混元Turbo S为基座 Turbo S采用Hybrid-Mamba-Transformer融合架构 结合Mamba长序列处理优势与Transformer复杂上下文捕捉能力 显著降低计算复杂度和内存占用 [3] - 该架构使混元T1吐字速度达80 tokens/s Turbo S是工业界首次将Mamba架构无损应用于超大型MoE模型 T1则是首次在超大型推理模型中实现混合Mamba架构无损应用 [3][4] 商业化定价策略 - 混元T1定价为输入每百万tokens 1元 输出每百万tokens 4元 与DeepSeek-R1夜间时段价格持平 但标准时段价格仅为对手四分之一 显示较强价格竞争力 [4] - 腾讯未披露混元T1参数量级 训练数据规模尚不明确 但通过架构创新实现成本优化 为商业化应用提供基础 [2][3]
宇树科技下轮估值或突破200亿,40%认购者来自海外;小米、小鹏、蔚来等宣布切入“人形机器人”;苹果智能4月支持中文丨AI周报
创业邦· 2025-03-02 10:25
国内AI行业动态 - 纵目科技创始人唐锐回应"跑路"传闻,表示正在处理国内业务重整和海外蚕丛业务投资人寻求事宜 [4] - 澜码科技因融资问题裁员并寻求被并购,创始人已自筹资金支付部分员工薪资 [5] - 沐曦集成电路否认上市前裁员20%传闻,称人员调整属正常范畴并推进上市进程 [5] 自动驾驶与车企动态 - 特斯拉FSD中国版试驾需求旺盛,部分车主日租金达2888元,马斯克称系统已适应中国交通规则 [6][7] - 理想汽车CEO李想公开挑战特斯拉FSD,称其AD Max V13模型有信心与之对比 [8] - 小米、小鹏、蔚来等18家车企布局人形机器人赛道,何小鹏称当前行业处于L2初阶阶段 [13] 机器人领域进展 - 宇树科技发布功夫机器人Unitree G1,下轮估值或突破200亿元,40%老股认购需求来自海外 [9][11] - 众擎机器人完成全球首例人形机器人前空翻特技,突破直膝步态技术 [11] - 深圳拟发布人形机器人专项政策,通过"揭榜挂帅"支持关键技术攻关 [30] AI大模型与开源生态 - DeepSeek开源并行优化策略并下调API价格,夜间时段降幅最高达75% [14][15] - 阿里Qwen团队推出深度思考模型QwQ,支持完整思维链展示 [23] - 月之暗面开源30亿/160亿参数混合专家模型Moonlight,提升训练效率 [25] 海外AI前沿 - 英伟达Q4营收393亿美元同比增78%,Blackwell芯片首季销售额达数十亿美元 [30] - OpenAI推出GPT4.5研究预览版,优化推理能力并减少幻觉 [32] - Anthropic发布Claude 3.7 Sonnet模型,首创混合架构实现深度推理与实时响应 [36] 投融资概况 - 全球AI领域本周融资总额21.19亿元,国内占比24%(5.08亿元),海外占比76%(16.11亿元) [43][49][51] - 国内融资集中在广东(4起)、北京/浙江(各3起),LiblibAI获数亿元A+轮融资 [46][49] - 海外Genspark完成1亿美元A轮融资,采用多模型处理搜索任务 [51]
陆家嘴财经早餐2025年2月28日星期五
Wind万得· 2025-02-28 06:43
// 热点聚焦 // 1、 开源周第四天,DeepSeek宣布开源Optimized Parallelism Strategies(优化并行策略)。该策略是为了提高计算效率、减少资源浪费并最大化系统性能 而设计的并行计算方案。这些策略通过合理分配任务、协调资源利用和减少通信开销,实现在多核、分布式或异构系统中的高效并行执行。 2、 小米召开新品发布会,小米两款重磅"Ultra"亮相,分别是顶级旗舰新机小米15 Ultra和高性能轿车小米SU7 Ultra。其中,小米15 Ultra售价6499元 起,搭载骁龙8至尊版芯片,6000mAh电池,定位巅峰影像科技旗舰;小米SU7 Ultra起售价为52.99万元,此前预售价为81.49万元 ,其搭载小米超级三电 机系统,标配赛道版散热系统、制动系统,纽北调校底盘系统。发会上,小米还发布了首款AI PC新品REDMI Book Pro 16 2025,首次搭载"小米AI PC引 擎",内置端云融合大模型。 // 环球市场 // 8、欧债收益率多数下跌,法国10年期国债收益率跌0.9个基点报3.138%,德国10年期国债收益率跌2个基点报2.412%,英国10年期国债 ...
腾讯,重磅发布!
证券时报· 2025-02-27 20:47
事实上,在2月19日,腾讯混元已宣布深度思考模型混元T1面向所有用户开放,可以在腾讯元宝体验测试。作为与DeepSeek - R1类似的推理模型,T1能理解问题的 多重维度和潜在逻辑关系,特别适合完成复杂任务。 2月27日,腾讯混元官方微信账号发布消息称,腾讯混元新一代快思考模型Turbo S正式发布。 据介绍,区别于DeepSeek-R1、混元T1等需要"想一下再回答"的慢思考模型,混元Turbo S能够实现"秒回",更快速输出答案,吐字速度提升一倍,首字时延降低 44%。 腾讯混元表示,作为旗舰模型,混元Turbo S未来将成为腾讯混元系列衍生模型的核心基座,为推理、长文、代码等衍生模型提供基础能力。目前,开发者和企业用 户已经可以在腾讯云上通过API调用腾讯混元Turbo S。对于普通用户,腾讯元宝即将逐步灰度上线混元Turbo S,用户在元宝内选择"Hunyuan"模型并关闭深度思考 即可体验使用。 快慢结合,让大模型更智能更高效 在使用DeepSeek - R1等推理模型时,由于模型需要进行深度思考,并在提供回答前列出详细的思维链,虽然能够体现较高的智能化水平,但存在响应速度慢、不够 高效的短板。 ...
【财闻联播】新晋中国首富?雷军辟谣!段永平:准备卖点英伟达看跌期权
券商中国· 2025-02-27 20:38
★ 宏观动态 ★ 香港证监会:建议放宽主要交易所买卖衍生工具持仓限额 香港证监会发文,为紧贴市场发展,建议提高以香港三大股票指数为基础的交易所买卖衍生工具的持仓限额, 今天就建议展开咨询。为便利市场参与者对冲风险,有关建议会将恒生指数、恒生中国企业指数和恒生科技指 数的期货及期权合约的现有持仓限额,分别提高50%、108%及43%至15000、25000及30000份对冲指定资产价 格转变风险的持仓。 广东:下大力气解决民营企业融资难融资贵问题 广东省省长、省委金融委员会主任王伟中主持召开省委金融委员会第二次全体会议。会议强调,要进一步发挥 好金融对投资、消费、外贸的促进作用,综合运用债券、REITs等多种方式支持"两重"建设,更好满足项目融 资需要,围绕"两新"工作和提振消费专项行动,支持金融机构推出更多让利惠民的产品和服务,加大对外贸新 业态的金融支持力度,提高跨境投融资便利化水平。要发展风险投资,壮大耐心资本,优化省级政府投资基金 运营管理,引导更多风投创投机构投早、投小、投硬科技,加快发展科技保险,孵化培育更多瞪羚企业、专精 特新企业、独角兽企业,有力支持科技创新和现代化产业体系建设。要加大对民营经济 ...