Workflow
豆包1.5·深度思考模型
icon
搜索文档
全网都在等梁文锋
凤凰网财经· 2025-04-29 20:39
中美科技巨头AI模型竞争 - 4月中旬OpenAI发布GPT-4.1 o3、o4 mini系列模型 [3] - 谷歌同期推出Gemini 2.5 Flash Preview混合推理模型 [3] - 豆包发布1.5·深度思考模型,多模态能力显著提升 [3] - 阿里下一代大模型Qwen3预计本月发布 [3] DeepSeek R2模型发布传闻 - Hugging Face CEO发布神秘动态暗示DeepSeek R2即将发布 [4][7] - 传闻称R2模型拥有1.2万亿参数,活跃参数780亿,采用混合MoE架构 [12] - 成本比GPT-4o低97.3%(输入0.07美元/百万次,输出0.27美元/百万次) [12] - 使用5.2PB训练数据,C-Eval2.0测试得分89.7%,COCO视觉测试92.4% [12] - 公司对传闻不予置评,但知情人士称真实性较低 [14] DeepSeek技术迭代与市场影响 - 公司保持季度重大更新节奏:2024年9月V2.5,12月V3,2025年3月V3-0324 [14] - V3-0324版本在基准测试中超越Google Gemini 2.0 Pro等顶尖模型 [17] - R2预计提升代码生成和多语种推理能力 [17] - 3月发布的V3-0324采用6850亿参数MoE架构,代码能力显著增强 [20] 国产芯片与AI发展 - 美国对英伟达H20芯片禁令促使华为昇腾910C、寒武纪MLUarch04等国产芯片加速发展 [21] - 公司已与部分国产芯片头部企业展开合作 [26] - 创始人梁文锋表示真正挑战是高端芯片出口禁令而非资金 [22] - 公司曾推出针对英伟达H卡的算力优化方案 [21] 公司战略与行业定位 - 创始人梁文锋致力于探索通用人工智能(AGI)本质 [18][20] - 公司早期主要依托自有资金,排除有退出顾虑的投资机构 [20] - 创始人认为技术实力比产品黏性更重要,可通过技术优势获取用户 [20] - 公司目标是通过技术创新改变全球AI格局而非仅服务用户 [20]
【数字经济周报】美国限制英伟达H20 GPU、AMDMI308等AI芯片对华出口-20250421
国泰海通证券· 2025-04-21 22:37
报告行业投资评级 未提及 报告的核心观点 报告聚焦2025年4月12 - 18日数字经济领域科技产业动态,涵盖融资、上市、二级市场表现及各板块动态,反映行业发展态势与潜在投资机会 [2] 根据相关目录分别进行总结 一周资本市场概览 - 上周科技产业融资概况:2025年4月12 - 18日,国内外科技产业14起融资事件均在国内,先进制造、人工智能、VR/AR行业融资事件数位列前三 [2][9] - 一周科技产业上市、过会情况:宏工科技、Everbright Digital、肯特催化、信凯科技、正力新能分别在深交所创业板、纳斯达克、上交所主板、深交所主板、港交所挂牌上市 [12][13][16][17][19] - 一周科技产业招股书递交情况:“博雷顿”通过港交所上市聆讯拟港股挂牌,“滴普科技”和“钧达股份”递交招股书拟港股挂牌 [21][23][24] - 一周科技产业二级市场涨跌幅、换手率、估值水平跟踪:上证指数上涨1.19%,深证成指、创业板指下跌;半导体等指数跌幅为0.77% - 1.15%;半导体、人工智能指数换手率较高;半导体等指数PE估值环比下跌,人工智能指数PB估值环比上涨 [4][28][30][33] 半导体板块动态 - 英特尔接近出售Altera芯片部门51%股份,银湖资本87.5亿美元接盘,是英特尔剥离非核心业务举措 [35][36] - 美国限制英伟达H20 GPU、AMD MI308等AI芯片对华出口,英伟达或损失55亿美元,AMD或受8亿美元财务冲击 [38][39] - AMD公布首款2nm芯片核心复合芯片(CCD),用于第六代EPYC "Venice"处理器 [39][40] 汽车电子板块动态 - 安森美取消69亿美元收购Allegro计划,战略布局暂时搁浅 [41][42] - 亿咖通科技单芯片“舱行泊一体”通过实车验证,可降本20%,还将推高阶方案 [42][43] - 上汽与华为联合发布新品牌“SAIC尚界”,采用华为智选车模式,开启智能出行新篇章 [43][44][46] AI板块动态 - OpenAI发布o3/o4 - mini,擅长编码和视觉推理,开源Codex CLI,效率和成本控制表现优 [46][47] - 谷歌发布海豚大模型DolphinGemma,可初步理解海豚语言,能参与跨物种交流 [47][48][49] - 豆包1.5·深度思考模型上线,多项测试表现优,具备“边想边搜”和视觉理解能力 [50][51] - 书生·万象3.0升级发布,多模态基础能力全面提升,拓展多方面多模态能力 [51][52] 元宇宙板块动态 - 华为发布新款智能眼镜2钛空圆框光学镜,支持翻译、头部控制等功能 [52][53][55] - 李未可科技与中国移动合作推出定制化AI智能音频眼镜,提供全方位AI服务 [55][56] - 秋果计划科技Wigain XR眼镜亮相香港国际创科展,视场角53度创纪录,有多项技术亮点 [56][57]
豆包1.5深度思考模型发布:暴砍参数量,能看图思考,数学编程超DeepSeek-R1
36氪· 2025-04-17 16:54
文章核心观点 火山引擎发布豆包1.5·深度思考模型,在性能、能力和应用场景上有显著提升,同时升级了相关模型,其新能力或成推理模型升级重要方向,同日还发布了其他解决方案和套件 [1][3][21] 分组1:豆包1.5·深度思考模型发布及基础情况 - 火山引擎发布豆包1.5·深度思考模型,采用MoE架构,总参数量200B,激活参数20B,在多项基准测试达或接近全球第一梯队水平 [1] - 截至2025年3月底,豆包大模型日均tokens调用量超12.7万亿,是2024年12月的3倍,是一年前的106倍,2024年火山引擎以46.4%市场份额居中国公有云大模型调用量市场第一 [3] 分组2:豆包1.5·深度思考模型能力特点 - 较小参数量和激活参数量使其训练和推理成本低,高并发场景延迟仅20毫秒 [4] - 具备“边想边搜”能力,豆包App基于此模型定向训练,如推荐露营装备时可拆解需求、规划信息并补充搜索 [4] - 具备视觉理解能力,能基于文字、图像信息思考,如给出预算内点餐推荐 [6] - 模型团队优化数据处理策略,融合可验证与创意性数据,采用创新双轨奖励机制优化算法 [7] 分组3:豆包1.5·深度思考模型测试表现 - 在AIME 2024、2025数学测试中得分与OpenAI o3 - mini - high基本打平,Beyond AIME测试有明显差距 [8] - 在GPQA Diamond测试集得分为77.3,与OpenAI o1、o3 - mini - high仅有微小差距 [10] - 在Code Forces和SWE - bench编程基准测试接近或超越DeepSeek - R1 [10] - 在ARC - AGI测试得分39.9分,大幅超过OpenAI o1和o3 - mini - high [10] - 在创意写作等非推理任务展示泛化能力,能胜任更广泛复杂场景 [10] 分组4:相关模型升级情况 - 豆包·文生图模型3.0能实现更好文字排版、实拍级图像生成和2K高清图片生成,应用于多场景,在Artificial Analysis竞技场排名全球第一梯队 [11][13][15] - 豆包·视觉理解模型新版本视觉定位能力强,支持多种定位方式,应用于多场景,视频理解能力大幅提升,结合向量搜索可对视频语义搜索 [17][20] 分组5:其他发布内容及行业趋势 - 推理模型成国内厂商角逐重要方向,豆包1.5·深度思考模型新能力或成下一轮升级重要方向 [21] - 火山引擎同日发布OS Agent解决方案、GUI Agent大模型(豆包1.5·UI - TARS)和AI云原生·ServingKit推理套件 [21]