Workflow
Mistral Medium 3
icon
搜索文档
AI动态汇总:英伟达Llama-Nemotron模型表现优异,小米Mi-BRAG智能引擎亮相
中邮证券· 2025-05-14 21:08
根据提供的研报内容,以下是量化模型与因子的详细总结: 量化模型与构建方式 1. **模型名称:Llama-Nemotron** - **模型构建思路**:通过神经架构搜索(NAS)和垂直压缩技术优化推理效率,结合知识蒸馏和强化学习提升模型推理能力[14][15][16] - **具体构建过程**: 1. **神经架构搜索阶段**:使用Puzzle框架进行块级局部蒸馏,构建Transformer模块库,通过混合整数规划(MIP)求解器选择最优配置 $$ \text{MIP目标函数:} \min \sum_{i=1}^{n} c_i x_i \quad \text{s.t.} \quad Ax \leq b $$ (其中$c_i$代表模块计算成本,$x_i$为选择变量)[16][17] 2. **FFN融合技术**:识别连续FFN块并替换为更宽的并行层,减少序列深度[19][20] 3. **知识蒸馏与预训练**:使用Llama 3.1-405B-Instruct作为参考模型恢复质量损失[21] 4. **监督微调**:采用带推理轨迹的合成数据训练,构建"推理开关"指令响应机制[22][23] 5. **强化学习**:采用GRPO算法进行14万H100小时的STEM领域训练[24] - **模型评价**:在GPQA-Diamond基准测试中实现57.1%准确率,推理效率较DeepSeek-R1提升30%[15][23][26] 2. **模型名称:VPP(Video Prediction Policy)** - **构建思路**:基于AIGC视频扩散模型开发两阶段学习框架,解决机器人动作预测与执行问题[36][38] - **具体构建过程**: 1. **第一阶段**:视频扩散模型学习预测性视觉表征,提取单步去噪的中间层特征[40] 2. **第二阶段**:通过Video Former和DiT扩散策略生成动作指令,控制频率达50Hz[38][40] 3. **多本体适配**:直接学习不同机器人/人类视频数据,消除动作维度限制[41] - **模型评价**:在Calvin ABC-D测试中任务完成长度达4.33(满分5.0),真机成功率67%[42][44] 模型的回测效果 1. **Llama-Nemotron模型** - GPQA-Diamond准确率:57.1%(5-shot CoT)[53] - MMLU Pro准确率:77.2%(5-shot CoT)[53] - 推理延迟:较基线降低40%[16][20] 2. **VPP模型** - Calvin ABC-D任务长度:4.33/5.0[42] - 真机操作成功率:67%[42] - 预测频率:6-10Hz,控制频率50Hz[40] 量化因子与构建方式 1. **因子名称:FFN Fusion效率因子** - **构建思路**:通过前馈网络融合技术提升Transformer计算利用率[19][20] - **具体构建**: $$ \text{融合效率}=1-\frac{T_{\text{原始}}}{T_{\text{融合后}}} $$ 其中$T$代表序列计算步骤数,实测提升多GPU环境吞吐量28%[20] 2. **因子名称:视频扩散预测置信度** - **构建思路**:量化单步去噪特征包含的未来信息量[40] - **具体构建**: $$ \text{置信度}=\frac{\|F_{t+1}-F_{\text{pred}}\|}{\|F_{t+1}\|} $$ ($F$为特征向量,实测150ms预测窗口准确率达92%)[40][41] 因子的回测效果 1. **FFN Fusion效率因子** - 计算利用率提升:28%[20] - 跨GPU通信开销降低:35%[20] 2. **视频扩散预测置信度** - 动作预测准确率:92%[40] - 错误率衰减速度:每帧降低15%[41] 注:部分模型(如Mi-BRAG、NetMaster)因缺乏量化构建细节未列入,测试结果均来自原文基准数据集[53][42]
全球AI周报:多个海外AI应用公司财报超预期,阿里提出未来所有业务以AI为驱动
天风证券· 2025-05-13 13:45
报告行业投资评级 未提及 报告的核心观点 - 本季度多个美股科技AI应用公司财报超预期,验证AI应用作为2025年投资主线逻辑 [5] - AI技术升级提升广告效率、加快商业化进程,企业服务需求稳健、AI基础设施升级支撑增长,AI赋能电商运营提升客户留存与变现 [5] - 建议关注多类AI相关公司,包括应用、云服务、算力、智能驾驶等领域,以及中国头部AI科技企业 [5] 各部分总结 海外科技公司财报AI进展 - Palantir一季度营收8.84亿美元,AI驱动下客户指标向好,美国商业TCV达8.1亿美元创历史新高,客户数量增长 [5] - AppLovin一季度营收净利润超预期,Q1收入14.8亿美元,净利润5.76亿美元,AI驱动技术改进优化平台 [5] - Datadog第一季度营收7.62亿美元,AI相关订单增长,超4000家客户使用人工智能集成 [5] - Shopify GMV达748亿美元,同比增长23%,推出智能关税计算工具,完成收购助力AI搜索技术开发 [5] - Claudeflare一季度营收4.791亿美元,同比增长27%,签订大额合同,Cloudflare Workers AI发展迅猛 [5] 全球AI动态 - OpenAI启动全球版“星际之门”计划,首批覆盖10个国家,推出“OpenAI for Countries”计划,营利部门转为公益公司 [5][42] - 谷歌提前发布Gemini 2.5 Pro Preview(I/O版),登顶LMAreana,编码性能碾压Claude 3.7 [5][43] - Mistral AI发布多模态新模型Mistral Medium 3,平衡性能与成本,在编程和STEM任务表现突出 [5][48] 重点公司业绩情况 Palantir - 业绩整体营收同比增长39%达8.84亿美元,调整后营业利润率44%,规则40得分提升 [12] - AI驱动下客户指标向好,美国商业TCV达8.1亿美元,客户数量增长 [12] - 预计2025年二季度营收9.34 - 9.38亿美元,全年营收指引上调至38.9 - 39.02亿美元 [12] AppLovin - 一季度营收净利润超预期,Q1收入14.8亿美元,净利润5.76亿美元,广告收入增长 [18] - 业务剥离应用业务,网页广告试点表现好,电商签约广告主多,广告收入超90%来自移动游戏 [18] Datadog - 业绩营收7.62亿美元,同比增长25%,非GAAP毛利润6.12亿美元,账单金额和RPO增长 [23] - 业务AI原生客户贡献ARR增长,超4000家客户使用人工智能集成,部分业务增长快速 [23] - 指引二季度预计营收7.87 - 7.91亿美元,2025财年预计总营收32.15 - 32.35亿美元 [23] AMD - 业绩第一季度营收74亿美元,同比增长36%,毛利率54%,EPS为0.96美元 [26] - 分业务数据中心部门收入增长,客户端和游戏部门有增有减,嵌入式部门收入下降 [26] - 业务面临出口管制挑战,数据中心AI业务增长,推进新产品开发 [26] - 指引预计二季度营收约74亿美元,有27%同比增长 [26] Shopify - 业绩GMV达748亿美元,同比增长23%,各业务板块GMV有不同程度增长 [31] - 业务推出智能关税计算工具,完成收购助力AI搜索技术开发 [31] - 指引2025年第二季度预计收入同比增长约25%,营业费用和自由现金流利润率有预期 [31] Cloudflare - 业绩一季度营收4.79亿美元,同比增长27%,毛利率77.1%,营业利润和付费客户等指标良好 [35] - 业务签订大额合同,Cloudflare Workers AI发展迅猛,构建MCP服务器 [35] - 指引预计二季度和全年营收、营业利润、每股净收益等指标增长 [35]
全球AI周报:多个海外AI应用公司财报超预期,阿里提出未来所有业务以AI为驱动-20250513
天风证券· 2025-05-13 13:18
报告行业投资评级 未提及 报告的核心观点 - 本季度多个美股科技AI应用公司财报超预期,验证AI应用作为2025年投资主线逻辑 [5] - AI技术升级提升广告效率、加快商业化进程,企业服务需求稳健、AI基础设施升级支撑增长,AI赋能电商运营提升客户留存与变现 [5] - 建议关注多类AI相关公司,包括应用、云服务、算力、智能驾驶等领域,以及中国头部AI科技企业 [5] 根据相关目录分别进行总结 海外科技公司财报AI进展 - Palantir一季度营收8.84亿美元,AI驱动下客户指标向好,美国商业TCV达8.1亿美元创历史新高,客户数量增长 [5] - AppLovin一季度营收净利润超预期,Q1收入14.8亿美元同比增40%,净利润5.76亿美元,AI优化技术使广告主效果更佳 [5] - Datadog第一季度营收7.62亿美元同比增长25%,AI相关订单持续增长,超4000家客户使用人工智能集成 [5] - Shopify GMV达748亿美元同比增长23%,推出智能关税计算工具,收购公司助力AI多向量搜索技术开发 [5] - Claudeflare一季度营收4.791亿美元同比增长27%,签订超10亿美元合同,Cloudflare Workers AI发展迅猛 [5] 全球AI动态 - OpenAI启动全球版“星际之门”计划首批覆盖10个国家,推出“OpenAI for Countries”计划,营利部门转为公益公司 [5] - 谷歌提前发布Gemini 2.5 Pro Preview(I/O版),登顶LMAreana,编码性能碾压Claude 3.7 [5] - Mistral AI发布多模态新模型Mistral Medium 3,性能与成本平衡,后续开展“大型”项目 [5] 重点公司业绩情况 - Palantir整体营收同比增长39%达8.84亿美元,调整后营业利润率44%,预计二季度营收9.34 - 9.38亿美元,上调全年营收指引 [12] - AppLovin一季度营收净利润超预期,Q1收入14.8亿美元同比增长40%,将剥离Apps业务聚焦广告业务 [18] - Datadog营收7.62亿美元同比增长25%,预计二季度营收7.87 - 7.91亿美元,2025财年预计总营收32.15 - 32.35亿美元 [23] - AMD第一季度营收74亿美元同比增长36%,分业务表现分化,预计二季度营收约74亿美元 [26] - Shopify GMV达748亿美元同比增长23%,预计二季度收入同比增长约25% [31] - Cloudflare一季度营收4.79亿美元同比增长27%,预计二季度营收5 - 5.01亿美元,2025年全年预计营收20.9 - 20.94亿美元 [35] 全球AI动态更新 - OpenAI启动全球版“星际之门”计划,公司结构调整营利部门转公益公司,推动各国AI发展并确保造福人类 [42] - 谷歌提前发布Gemini 2.5 Pro Preview(I/O版),在多领域表现优异,开发者可使用开发,热度高 [43] - Mistral AI发布Mistral Medium 3,性能与成本平衡,在编程和STEM任务突出,推出企业聊天机器人服务 [48]
Mistral 拿出杀手锏叫阵 DeepSeek!性价比卷出天际、开源模型却断供,社区粉丝失望透顶
AI前线· 2025-05-08 13:57
Mistral Medium 3模型发布 - 推出新模型Mistral Medium 3,具有三大亮点:兼顾SOTA性能、成本降低87.5%、简化企业部署方式[1] - 在编程和多模态理解等专业场景表现突出,基准测试达到或超过Claude Sonnet 3.7的90%,但成本更低(每百万token输入0.4美元/输出2美元)[1] - 性能超越开源模型Llama 4 Maverick和企业级模型Cohere Command A,价格优于DeepSeek V3等低价模型[1] - 在编码和STEM任务中表现优异,与参数更大但速度更慢的竞争对手相当[2] - 支持任意云平台部署,包括四块GPU及以上的自托管环境[5] 技术性能与基准测试 - 在HumanEval 0-shot测试中达到92.1%,与Claude Sonnet 3.7持平,略低于DeepSeek 3.1的93.3%[3] - LiveCodeBench (v6)0-shot测试中表现较弱,仅为30.3%,显著低于DeepSeek 3.1的42.9%[3] - 在Math500 Instruct 0-shot测试中达到91.0%,优于GPT-40的76.4%和Claude Sonnet 3.7的83.0%[3] - MMLU Pro 5-shot CoT测试中达到77.2%,略低于Llama 4 Maverick的80.4%[3] - 在多模态任务DocVQA 0-shot测试中表现优异,达到95.3%,显著高于GPT-40的85.9%[3] 开源策略与社区反响 - 2023年9月开源Mistral 7B模型引发社区轰动,但后续未推出有影响力的开源模型[8] - 网友批评公司未履行开源承诺,四个月内发布三款受限的"开放权重"模型,仅限企业客户使用[11] - 社区对公司仅小幅更新Mistral Small 3.1反响平平,期待发布高质量开源模型[12][13] - 网友认为Mistral Medium 3无法与Qwen3等开源模型比较,缺乏开放权重[11] 公司战略与竞争环境 - 创始团队来自Google DeepMind和Meta,被誉为"将欧洲推上科技顶尖舞台的英雄"[16] - 以成本效率为核心优势,称使用的算力比美国竞争对手少100倍,但开发出前沿水平模型[18] - 获得微软投资与合作,成为微软在OpenAI之外的首笔大模型公司投资[18] - 正被DeepSeek等新兴竞争对手超越,中国公司被视为OpenAI的"快速追随者"[19] - 部分投资者认为聚焦"高效率"在资本充足的AI竞赛中是战术失误[19] 融资与市场地位 - 成立不足两年完成6亿欧元融资,估值接近60亿欧元[23] - 员工约150人,远少于拥有数千名员工的美国竞争对手[24] - 年化运行率(ARR)达数千万美元,远低于Anthropic的10亿美元和OpenAI的40亿美元[25] - 在企业级AI市场排名第五,市占率仅5%,远落后于OpenAI[26] - 领先AI企业已筹集超500亿美元资金,远超Mistral[28] 欧洲市场定位与未来前景 - 获法国总统马克龙支持,被视为欧洲"主权化"AI的代表[21] - 目前是欧洲唯一重量级大模型开发者,德国Aleph Alpha已退出该领域[21] - 市场传闻可能被收购,但CEO坚称希望保持独立并上市[22] - 部分投资人私下认为公司需要出售,可能面临被大型科技公司"人才收购"[22][25] - 处于尴尬困境:融资规模过大无法悄然退出,但不足以在全球AI竞赛中保持领先[23]
时隔两月,Mistral AI终于上新Medium 3,近期还有「One more thing」
机器之心· 2025-05-08 13:51
机器之心报道 编辑:蛋酱、张倩 只是 Mistral Medium 3 并未开源,目前可通过 Mistral 的官网和 API 或其合作伙伴的 API 使用。Mistral Medium 3 将于周三上线亚马逊云科技的 Sagemaker 平台,后 续也会登陆其他主机平台,包括微软的 Azure AI Foundry 和谷歌的 Vertex AI 平台。 该模型专为企业使用而设计,其性能在基准测试中达到了 Claude 3.7 Sonnet 的 90% 以上,但成本仅为后者的 1/8 —— 输入每百万 token 仅需 0.4 美元,输出每百万 token 仅需 2 美元。 相比之下,Sonnet 的输入 / 输出价格分别为 3 美元和 15 美元。 另外,Mistral AI 还预告了「One more thing」: 随着三月份 Mistral Small 和今天 Mistral Medium 的发布,我们在接下来的几周内正在筹备一款「大型」产品,这早已不是什么秘密了。即使 是我们的中型型号,其性能也远超 Llama 4 Maverick 等旗舰开源型号,我们非常期待「揭开」未来的神秘面纱 :) 会是什么 ...
科技风向标丨小米汽车深夜致歉;谷歌股价逆势大跌7.51%;人形机器人运动会要来了
21世纪经济报道· 2025-05-08 10:06
早上好,新的一天又开始了。在过去的24小时内,科技行业发生了哪些有意思的事情?来跟21tech一起 看看吧。 【巨头风向标】 谷歌股价逆势大跌7.51%。当地时间5月7日收盘,谷歌股价逆势走低,以7.51%收跌,报152.8美元/股。 此前苹果公司高级副总裁Eddy Cue表示,4 月Safari的搜索量首次出现了下降,其将此归因人们使用AI 搜索。他认为 AI 搜索引擎(如 OpenAI、Perplexity AI)最终会取代 Google 这样的传统搜索引擎。因 此,苹果正在探索在浏览器中加入人工智能搜索功能。此外,苹果公司称与微软已达成年度搜索合作协 议。苹果无意开发自己的通用搜索引擎。 21世纪经济报道新质生产力研究院综合报道 小米汽车深夜致歉。5月7日深夜,小米汽车官方发布《关于大家关心问题的回答》一文,回应小米 SU7Ultra最近引发广泛关注的限制马力和碳纤维双风道前舱盖问题,并两次致歉。小米汽车表示,之前 推送的更新版本中"排位模式"功能添加了解锁条件,"给部分用户带来了困扰,对此,我们深表歉意"。 收到反馈后,小米汽车已暂停了这次推送。已升级的少量用户,小米汽车将会在下个版本更新中解决。 此 ...
新鲜早科技丨小米汽车深夜致歉;谷歌股价逆势大跌7.51%;人形机器人运动会要来了
21世纪经济报道· 2025-05-08 09:54
21世纪经济报道新质生产力研究院综合报道 早上好,新的一天又开始了。在过去的24小时内,科技行业发生了哪些有意思的事情?来跟21tech一起 看看吧。 法国公司Mistral AI推出新模型Medium 3。法国AI初创公司Mistral AI宣布推出新模型Mistral Medium 3。据介绍,在各项基准测试中,该模型性能达到或超过Claude Sonnet 3.7的90%,而成本更低(每百万 token输入0.4美元/输出2美元)。定价方面,无论是API还是自部署系统,该模型都优于DeepSeek V3等 模型。 淘宝天猫与小红书达成战略合作。5月7日,淘宝天猫与小红书宣布签订战略合作,打造"红猫计划"。双 方共同新增小红书笔记下方"广告挂链"功能。加入试点的优质品牌在小红书投放种草笔记,可直接跳转 至淘宝APP。同时,小红书和淘宝天猫首次开放UD合作,新增效果广告模式,也可以帮助品牌商家实 现内容投放直接引流至淘宝天猫店铺/商品。淘宝天猫将在效果广告链路提供数字化能力的支持,助力 营销转化。 理想汽车CEO谈特斯拉FSD:基本功非常扎实。理想汽车官微发布对其CEO兼董事长李想的访谈实 录。李想在访谈中 ...
法国Mistral AI推出新模型Medium 3
快讯· 2025-05-07 22:41
法国AI初创公司Mistral AI今日宣布推出新模型Mistral Medium 3。据介绍,在各项基准测试中,该模型 性能达到或超过Claude Sonnet 3.7的90%,而成本显著更低(每百万token输入0.4美元/输出2美元)。定 价方面,无论是API还是自部署系统,该模型都优于DeepSeek V3等模型。 ...