谷歌Gemini

搜索文档
OpenAI甩开英伟达,谷歌TPU“横刀夺爱”
36氪· 2025-07-03 07:10
行业动态 - 英伟达超越微软重夺全球市值第一宝座 [1] - OpenAI计划采购谷歌TPU芯片以替代部分英伟达GPU [1][3] - 谷歌TPUv5p因低成本特性获苹果和OpenAI订单 [5][13] 技术对比 - 英伟达B200芯片拥有2080亿晶体管、192GB HBM3E内存、8TB/s带宽,FP8/FP6性能达20PFLOPS,是H100的2.5倍 [3] - 谷歌TPUv5p单价仅数千美元,远低于英伟达DGX B200服务器50万美元售价 [5][8] - TPU专为AI计算优化,采用脉动阵列设计,比通用GPU更高效且成本更低 [8][11] 市场趋势 - 英伟达Blackwell GPU未来12个月产能已被预订一空 [5] - 行业需求从"预训练"转向"推理",TPUv5p因支持混合精度更适配推理场景 [13][15] - DeepSeek开源模型推动AI厂商转向智能体和应用开发,降低训练算力需求 [13][15] 企业策略 - OpenAI通过采购TPU实现算力供应多元化,减少对英伟达依赖 [3][5] - 谷歌TPU商用化突破"自家玩具"定位,获大厂订单 [3][13] - 国内AI厂商或受益于TPU替代GPU的可行性 [15] 产品定价 - OpenAI GPT-3输入/输出定价为10美元/40美元每百万tokens [5] - 谷歌Gemini 2.5 Pro输入/输出定价仅1美元/4美元每百万tokens [6]
AI产业跟踪海外:海外特斯拉Robotaxi上线,MetaAI眼镜能拍3K视频
国泰海通证券· 2025-07-02 15:53
报告行业投资评级 未提及 报告的核心观点 报告对AI行业近期动态、应用、大模型、科技前沿等方面进行跟踪,展示行业新进展与创新成果,涵盖企业人才流动、融资、产品更新及技术突破等内容,反映AI行业的活跃发展态势 根据相关目录分别进行总结 AI行业动态 - Meta从OpenAI挖走四位华人学者,他们是OpenAI重要模型核心贡献者,专长于模型微调和多模态对齐,或助Meta弥补技术短板 [4] - AI创业公司Delphi获红杉领投1600万美元A轮融资,创建数字化身实现数字疗愈,提供多级订阅服务吸引用户 [5] - OpenAI前CTO创立的AI初创公司Thinking Machines Lab完成20亿美元种子轮融资,估值达100亿美元,业务方向未公开 [6] AI应用资讯 - Anthropic的Claude聊天机器人新增功能,允许用户对话构建AI应用,无需编程知识,功能在所有订阅层级开放 [7] - 谷歌推出开源免费的Gemini CLI,支持终端访问Gemini,功能全面,采用Apache 2.0开源协议,引发开发者社区热议 [8] - 谷歌DeepMind发布AI工具AlphaGenome,能精准预测基因突变影响,填补DNA非编码区域解读空白,推动生物学发展 [9] - 谷歌Gemini Robotics On - Device是首个能在机器人本地运行的视觉 - 语言 - 动作模型,适用于延迟敏感型应用 [10] - 谷歌将Imagen 4和Imagen 4 Ultra文生图模型上线AI Studio和API,生成速度接近实时,未来AI Studio将更新 [11] - ODDY工作室创作的《名作艺术秀》将经典艺术元素以时装秀形式呈现,引发观众情感共鸣 [12] - 斯坦福等机构联合开发通用生物医学AI智能体Biomni,能自主执行跨领域研究任务,已上线免费使用 [13] - 谷歌Gemini推出七段纸艺ASMR解压视频,采用纸质艺术形式,有助放松情绪 [14] - ElevenLabs发布11ai语音助手,主打语音优先设计和多通道处理,集成多种工具,中文能力待提升 [15] - 谷歌真AR眼镜原型曝光,代号"Martha",基于Android XR平台设计,配备相关硬件和功能 [16] - 特斯拉Robotaxi服务在德州奥斯汀启动,仅向受邀用户开放,存在需远程操作介入等问题,马斯克计划扩大规模 [17] - Deezer将对AI生成曲目专辑进行标注,拦截大量AI生成音乐,为检测技术申请两项专利 [18][19] - 多所大学研究者开发出“虚拟社区”,智能体可在开放世界场景交互,在“竞选”任务中展示社交说服能力 [20] - Meta与欧克利合作推出Oakley Meta HSTN智能眼镜,能拍3K视频,具备防水性能和长续航,销量已超200万副 [21] AI大模型资讯 - 微软发布Mu模型,仅3.3亿参数,性能比肩参数量大10倍的Phi - 3.5 - mini,支持Windows智能体功能 [22] - Sakana AI提出“强化学习教师”(RLT)新范式,降低训练成本,缩短训练速度,为构建高效推理模型开辟新路径 [23] 科技前沿 - CMU等团队开发MPK编译器,可将LLM自动编译为优化巨型内核,降低推理延迟,仅需几十行Python代码实现 [24] - Netflix宣布在Netflix House推出沉浸式VR体验,由Sandbox VR提供技术支持,新合作项目已上线 [25] - 微软发布4D拓扑量子纠错码,降低量子比特错误率,减少所需物理量子比特数量,已应用于Azure Quantum平台 [26]
大家都在用AI,程度远超你想象
36氪· 2025-06-30 15:18
神译局是36氪旗下编译团队,关注科技、商业、职场、生活等领域,重点介绍国外的新技术、新观点、新风向。 编者按:当公众的目光都聚焦在AI模型迭代时,一场真正的革命已悄然发生:全球企业级AI推理用量正呈指数级飙升,其商业变现能力远超预期。本文用 硬核数据揭示这场静默爆发的产业质变。文章来自编译。 很长时间以来,大多数AI服务(尤其是推理API)的使用量与收入的增长都极其迅猛。SemiAnalysis的Dylan Patel指出,这些API对企业来说利润非常高—— 毛利率有时候高达75%甚至更高。这在搞AI的人当中是众所周知的一个公开事实,但在新模型发布与功能炒作此起彼伏的喧嚣当中,广大公众反而可能忽视 了这一点。 我认为向普通用户提供订阅服务也是盈利的,但重度用户很可能会成为AI公司的成本负担,再加上训练尖端模型还需要明显的资本支出。尽管如此,即便 模型保持不变,其使用量也在呈指数级增长,而且其中很大一部分都在盈利范围内。 早在今年上半年我们看到整个行业取得诸多惊人进展之前,AI使用的极端(某些情况下是指数级)增长就已经发生了。推理模型将推理答案从几百个token 扩展到有时数万个token,这会让使用量图走势限 ...
腾讯研究院AI速递 20250625
腾讯研究院· 2025-06-24 23:13
谷歌ASMR纸艺视频 - 谷歌Gemini推出七段纸艺ASMR解压视频,内容涵盖火烈鸟水中起舞、圣托里尼落日等场景,采用高精准提示词生成和定格动画技术 [1] - 视频通过纸质艺术形式结合恰当背景音呈现梦幻效果,研究显示此类内容因帮助放松情绪而广泛传播 [1] - ASMR被视为从生产力工具转向美学与治愈的另类方式 [1] ElevenLabs语音助手11ai - ElevenLabs发布11ai语音助手,主打语音优先设计和多通道处理,支持日程管理、任务安排和信息查询 [2] - 集成Perplexity搜索并与Notion、Linear等工具对接,探索对话式AI在工作流程中的实际应用 [2] - 技术覆盖32种语言,已应用于有声书、游戏配音及医疗训练领域,中文能力待提升 [2] 微软Mu模型 - 微软Mu模型仅3 3亿参数,性能媲美参数量大10倍的Phi-3 5-mini,NPU设备上每秒响应超100 tokens [3] - 采用双重层归一化、旋转位置嵌入和分组查询注意力三大创新,优化Transformer架构效率 [3] - 支持Windows智能体功能,可将自然语言指令实时转化为系统操作,响应时间低于500毫秒 [3] 商汤科技任务规划助手 - 商汤科技推出办公小浣熊"任务规划助手",通过交互式AI将复杂问题拆解为可执行步骤 [4][5] - 工具通过持续对话挖掘需求细节,思维链条可追溯,适用于职业规划、投资分析等领域 [5] - 最终生成逻辑严密的图文规划报告,实测在学业选择等场景表现突出 [5] QQ浏览器AI高考通 - QQ浏览器"AI高考通"可在3-5分钟内生成高考志愿报告,包含院校解读、风险提示等六大板块 [6] - 提供个性化"冲稳保"院校专业清单,含分数线、学费等数据,支持多方案对比 [6] 码上飞AI Agent平台 - "码上飞"平台支持通过自然语言直接生成鸿蒙应用,采用多智能体系统实现全流程自动化开发 [7] - 用户仅需5分钟即可生成完整应用,支持一键发布为小程序、APP或网站并获取源代码 [7] 谷歌AR眼镜Martha - 谷歌AR眼镜开发者版本代号"Martha",基于Android XR平台,配备棱镜显示屏和内置相机 [8] - 配套应用界面类似Pixel Watch,含通知、视图记录等功能,明显针对测试人员设计 [8] 充电宝召回事件 - 安克创新和罗马仕共召回120万个充电宝,因电芯供应商安普瑞斯未经批准变更隔膜材料 [10] - 锂电池隔膜是关键安全组件,安普瑞斯因扩产导致制程管理问题,相关认证已被暂停 [10] 马斯克创业观点 - 马斯克强调第一性原理思维,主张从公理推演而非传统分析,以"效用乘以受益人数"衡量价值 [11] - 预测数字超级智能即将实现,成为多行星物种将显著延长人类文明寿命 [11] AI Native产品理念 - AI Native核心是构建AI与人的新关系,需考虑情商和生命感,而非单纯工具化 [12] - 实现需宽输入(环境感知)和柔输出(分步协同),创业者需同时服务用户与AI [12]
MiniMax追着DeepSeek打
经济观察网· 2025-06-18 19:32
模型技术规格 - MiniMax M1模型支持100万个token的上下文长度,是DeepSeek R1(12.8万Token)的8倍,仅次于谷歌Gemini 2.5 Pro [1] - MiniMax M1总参数量为4560亿,每个token激活459亿参数,而DeepSeek R1总参数量6710亿但每个token仅激活370亿参数 [1] - 采用混合专家(MoE)架构,与DeepSeek R1相同 [1] 性能与成本优势 - 生成10万个token时仅消耗25%的浮点运算,64000个token推理任务计算能力需求不到DeepSeek R1一半 [2] - 强化学习阶段仅使用512块H800 GPU,耗时3周,成本53.5万美元,比预期低一个数量级 [2] - 核心技术包括线性注意力机制(Lightning Attention)和强化学习算法CISPO,后者通过裁剪采样权重提升效率 [2] 商业化定价策略 - API服务采用分级计费:0-32k Token档输入0.8元/百万Token,输出8元/百万Token;32k-128k档输入1.2元/百万Token,输出16元/百万Token;128k-1M档输入2.4元/百万Token,输出24元/百万Token [3] - 前两档定价低于DeepSeek R1(输入3.95元/百万Token,输出15.4元/百万Token),第三档为独有超长文本服务 [3] 行业动态与开源计划 - 宣布未来5天内每天发布一项新产品或新技术 [1] - 模型代码和权重已在Hugging Face和GitHub开源,支持透明检查与本地部署 [3] - DeepSeek R1曾以500-600万美元GPU成本训练出对标OpenAI o1的模型,引发行业争议 [2]
DeepSeek R1-0528在WebDev竞技场与Claude Opus 4并列第一
快讯· 2025-06-18 07:00
LMArena发布了最新的大模型web开发竞技场排名,DeepSeek R1-0528表现出顶尖水平,和谷歌Gemini 2.5 0605,Claude opus 4共同排名第一。其他亮点包括:综合文本能力排名第6,编程领域第2、高难度 提示第4、数学类第5,MIT开源许可,当前榜单最强开源模型。(AI寒武纪) ...
200亿AI独角兽反击,MiniMax首款推理模型对标DeepSeeK,算力成本仅53万美元
华尔街见闻· 2025-06-17 19:57
核心观点 - 中国AI独角兽MiniMax推出首款推理模型M1,性能接近海外顶尖模型,部分任务超越DeepSeek、阿里、字节及OpenAI等[1][3] - M1采用混合专家架构和线性注意力机制,支持100万Token上下文输入,与谷歌Gemini 2.5 Pro并列业内最高[3] - 训练成本仅53.74万美元(约380万人民币),比预期少一个数量级[1][6] - 在生成64K token时算力消耗不到DeepSeek R1的50%,100K token时仅为其25%[1][7] 模型性能 - 总参数4560亿,每token激活参数459亿[3] - 在17个评测集中,SWE-bench软件工程能力测试超过55%,长上下文理解任务全球第二[4] - 数学测试AIME 2024得分86.0,接近Gemini 2.5 Pro的91.6[5] - 长上下文任务OpenAI-MRCR(128k)得分73.4,超越Claude 4的76.8[5] 技术架构 - 采用混合专家(MoE)架构和线性注意力机制(Lightning Attention)[3] - 开发新型强化学习算法CISPO,比字节DAPO算法训练效率提升2倍[6] - 使用512块英伟达H800 GPU训练三周完成强化学习[6] 商业策略 - 模型已开源并在MiniMax APP/Web端免费升级[8] - API采用区间定价策略,128k-1M区间价格显著低于DeepSeek-R1[8] - 被开发者评价为"性价比新王",成为继字节豆包后的"价格杀手"[8] 行业定位 - 公司为腾讯和阿里巴巴支持的"AI六小龙"成员[9] - M1是5天发布周的首个产品,后续将推出智能体应用及视频/音乐模型[9] - 创始人称"第一次感觉到大山不是不能翻越",展现技术突破信心[1][9]
九大AI模型再答高考作文:座次剧烈变动
第一财经· 2025-06-07 23:24
AI模型高考作文表现 - 2025年九大AI模型高考作文测评显示,谷歌Gemini和DeepSeek以61.5分并列第一,元宝(61分)、通义千问(59.75分)、Kimi(59.5分)紧随其后,豆包(59分)、文心一言(58.5分)表现中等,智谱清言(50.75分)和ChatGPT(50.5分)垫底 [3][4][20][28][36][46][62][70][80][92][94] - 新晋模型Gemini和DeepSeek首次参评即登顶,去年前三名通义千问、元宝、豆包排名下滑至第三、第四和第六位 [3][4] - 测评采用上海卷思辨性作文题目,AI在逻辑明确的任务中表现更优;全国一卷诗歌类题目则普遍审题不清 [6][7] AI作文能力进步与局限 - 教师评价AI作文语言规范、材料丰富、逻辑性强,审题准确且结构程式化,但缺乏个性化思考和情感共鸣 [97][98][99] - 相比2024年,AI在情感表达和思想深度上有进步,但仍存在案例堆砌、逻辑错误和"论文味过重"问题 [1][2][99] - 高分作文如Gemini和DeepSeek的共性:论点鲜明、论据充实(引用爱因斯坦相对论、马尔克斯《百年孤独》等),结构完整且扣题紧密 [20][28] 头部模型厂商格局变化 - 测评覆盖国内外头部厂商,包括谷歌、DeepSeek、腾讯(元宝)、阿里(通义千问)、字节(豆包)、百度(文心一言)、月之暗面(Kimi)、智谱和OpenAI(ChatGPT) [5] - 谷歌Gemini和DeepSeek凭借技术迭代迅速崛起,成为新头部;国内厂商中腾讯元宝稳定性较强,阿里通义千问和字节豆包排名波动较大 [3][4][36][46] - 智谱清言和ChatGPT因内容生硬、分析浅显垫底,反映部分厂商在语言理解和逻辑构建上的技术短板 [92][94][96] 作文内容与评分细节 - 高分作文典型结构:Gemini采用"点题-关系阐述-正反论证-结论"框架,DeepSeek通过历史典故(孔子、钱锺书)强化思辨 [20][24][28] - 评分差异体现教师偏好:元宝获左建国最高分(63分)但文旭仅给52分,通义千问获文旭和许珊68分高分但左建国仅评51分 [36][46] - AI仍存在事实错误(如将黄庭坚诗句误标为苏轼),显示幻觉问题未完全解决 [47]
“有提升”,高考阅卷名师再评AI高考作文:九大模型座次剧烈变动
第一财经· 2025-06-07 22:00
AI模型高考作文表现 - 2024年九大AI模型参与上海高考思辨类作文测评,新增谷歌Gemini和DeepSeek两大头部模型,与去年通义千问、元宝、豆包等形成新竞争格局[2] - Gemini与DeepSeek以61.5平均分并列第一,元宝61分第三,通义千问59.75分第四,豆包降至第六名59分,ChatGPT和智谱清言分别以50.5分和50.75分包尾[3][4][20][42][52] - 头部模型优势体现在:审题准确度、逻辑严密性、材料丰富度,Gemini作文获65分最高单评,引用爱因斯坦相对论等案例论证多元传播路径[12][13] AI写作能力进化与局限 - 教师评价显示AI较去年进步明显:情感表达更自然,思想深度提升,但仍缺乏个性化思考与生命温度,难以产出满分作文[1][4][53] - 技术短板集中体现在:案例堆砌(如智谱清言)、论文腔调(ChatGPT)、结构模板化(Kimi),且存在引用错误等"幻觉"问题[21][42][52] - 任务适应性差异显著:思辨类明确题目(上海卷)平均分超60,而开放式诗歌命题(全国一卷)表现混乱[5][53] 行业竞争格局变化 - 国际厂商突破本土壁垒:谷歌Gemini首战登顶,与国产元宝、通义千问形成三强格局,OpenAI的ChatGPT表现垫底[2][3][52] - 新锐厂商快速崛起:DeepSeek空降榜首,月之暗面Kimi以59.5分超过百度文心一言(58.5分),显示技术迭代加速[13][32][36] - 测评标准影响排名:同一模型(如豆包)分差达13分(56-69),反映评价体系主观性对结果的影响[20][29]
谷歌25年磨一剑,苹果AI掉队有何奇怪
凤凰网· 2025-05-29 10:02
谷歌创始人佩奇在25年前就开始AI布局 凤凰网科技讯 北京时间5月29日,《商业内幕》周三发文称,苹果目前在AI领域的落后其实并不令人意 外,该公司缺乏长期AI技术积累。相比之下,谷歌在2000年就开始为AI布局,一步步走到今天,而苹 果的AI才刚刚开始。 AI有点像建造办公楼。在几个月甚至几年时间里,地面上只有一个大坑,看起来什么都没发生。但突 然之间,钢结构开始搭建,接着是墙体和窗户。人们往往用很少的时间就能看到这些进展,但是地基工 程却要耗费大量时间,没有这些,整栋建筑就无法屹立不倒。 在AI领域,关键的基础构件往往需要数年甚至数十年才能形成。许多基础构件是终端用户看不到的, 但没有这些技术地基,AI产品就无法运作。 谷歌几乎拥有所有这些AI基础构件,微软、亚马逊和Meta也拥有其中大部分。OpenAI正在拼命补齐这 些能力,但还差得远。相比之下,苹果掌握的很少,这是个大问题。 由于这些构件通常在后台运作,用户很难直观感受到差距。但在今年,问题暴露无遗。苹果推迟了其 AI版Siri的大更新,暴露了它在底层能力上的短板。 25年前的AI布局 谷歌联合创始人拉里·佩奇(Larry Page)早在2000年的 ...