Gemini 2.5 Pro模型

搜索文档
腾讯研究院AI速递 20250718
腾讯研究院· 2025-07-17 22:12
生成式AI 一、 谷歌DeepMind 推 出 新架构MoR实现两倍推理速度 1. MoR架构实现参数共享与自适应计算相结合,以更少参数达到大模型性能; 2. 动态路由机制根据token复杂度分配不同递归深度,减少冗余计算并优化KV缓存; 3. 实验证明MoR推理吞吐量最高提升2.06倍,训练时间减少19%,峰值内存下降25%。 https://mp.weixin.qq.com/s/6IUoCHjm9P_FZllxBlQHPQ 二、 亚马逊推Agent全家桶!5招连发,吹响AI集结号 1. 亚马逊发布Bedrock AgentCore预览版,提供7大AI agents核心服务,包括运行时、记 忆、身份验证等; 2. 推出Nova定制选项和Strands Agents V1.0,使agents开发更简单,实现多agents协同工 作; 四、 谷歌搜索A I将可以 替你电话约服务,还会谈价砍单 1. 谷歌搜索推出AI代打电话功能,可为用户自动联系并预约本地服务,如宠物美容; 2. 搜索集成Gemini 2.5 Pro模型和Deep Search功能,能处理复杂查询并生成深度报告; 3. 发布Amazon S3 V ...
OpenAI甩开英伟达,谷歌TPU“横刀夺爱”
36氪· 2025-07-03 07:10
行业动态 - 英伟达超越微软重夺全球市值第一宝座 [1] - OpenAI计划采购谷歌TPU芯片以替代部分英伟达GPU [1][3] - 谷歌TPUv5p因低成本特性获苹果和OpenAI订单 [5][13] 技术对比 - 英伟达B200芯片拥有2080亿晶体管、192GB HBM3E内存、8TB/s带宽,FP8/FP6性能达20PFLOPS,是H100的2.5倍 [3] - 谷歌TPUv5p单价仅数千美元,远低于英伟达DGX B200服务器50万美元售价 [5][8] - TPU专为AI计算优化,采用脉动阵列设计,比通用GPU更高效且成本更低 [8][11] 市场趋势 - 英伟达Blackwell GPU未来12个月产能已被预订一空 [5] - 行业需求从"预训练"转向"推理",TPUv5p因支持混合精度更适配推理场景 [13][15] - DeepSeek开源模型推动AI厂商转向智能体和应用开发,降低训练算力需求 [13][15] 企业策略 - OpenAI通过采购TPU实现算力供应多元化,减少对英伟达依赖 [3][5] - 谷歌TPU商用化突破"自家玩具"定位,获大厂订单 [3][13] - 国内AI厂商或受益于TPU替代GPU的可行性 [15] 产品定价 - OpenAI GPT-3输入/输出定价为10美元/40美元每百万tokens [5] - 谷歌Gemini 2.5 Pro输入/输出定价仅1美元/4美元每百万tokens [6]
AI开发工具领域正经历重要变革,科创100指数ETF(588030)午后翻红上扬,近2周规模增长显著
新浪财经· 2025-07-01 14:19
科创100指数ETF表现 - 截至2025年7月1日13:58 科创100指数上涨0.30% 成分股荣昌生物上涨10.76% 心脉医疗上涨8.22% 泽璟制药上涨7.26% 神州细胞上涨5.56% 芯源微上涨4.96% [3] - 科创100指数ETF最新价报1.02元 近1周累计上涨3.99% [3] - 近1年日均成交4.02亿元 排名可比基金第一 盘中换手3.52% 当日成交2.22亿元 [3] - 近2周规模增长2.56亿元 新增规模位居可比基金2/11 [4] - 最新融资买入额达1250.05万元 融资余额达2.17亿元 [4] 科创100指数ETF历史业绩 - 近6月净值上涨13.69% 在指数股票型基金中排名416/3427(前12.14%) [5] - 成立以来最高单月回报27.67% 最长连涨月数3个月 最长连涨涨幅37.87% 上涨月份平均收益率8.57% [5] - 近3个月超越基准年化收益0.92% 近1年夏普比率1.03 [5] - 今年以来相对基准回撤0.20% [5] - 管理费率0.15% 托管费率0.05% 为可比基金最低 [5] - 近半年跟踪误差0.021% 跟踪精度较高 [5] 上证科创板100指数构成 - 从科创板选取市值中等且流动性较好的100只证券作为样本 与科创板50指数共同构成规模指数系列 [6] - 前十大权重股合计占比22.99% 包括百济神州 睿创微纳 华虹公司 泽璟制药 翱捷科技 中科飞测 安集科技 纳芯微 芯源微 国盾量子 [6] 人工智能开发工具进展 - 谷歌开源Gemini CLI项目 基于Gemini 2.5 Pro模型 支持100万token上下文窗口 [4] - 整合文本 图像 视频等多模态能力 可能成为未来多模态本地Agent标准入口 [4] - 采用开源+高额度免费策略降低使用门槛 与Google Cloud形成协同效应 [4]