ChatGPT Images 2.0
搜索文档
通信行业研究:谷歌Next大会顺利举办,Deepseek发布V4大模型
国金证券· 2026-04-26 18:24
通信周观点: 1)谷歌 Next 大会顺利举办:A)Google 正式发布第八代张量处理单元(TPU)家族,推出 TPU 8t 与 TPU 8i 两款专 用化芯片,彻底打破了通用 AI 加速器的设计范式。B)谷歌 CEO 桑达尔·皮查伊表示,通过客户直接使用 API 的方 式,谷歌的模型每分钟处理超过 160 亿 tokens,而上季度是 100 亿 tokens。他预计到 2026 年,谷歌机器学习计算 总投资的一半以上将用于云业务。C)Anthropic 表示,谷歌承诺以 3800 亿美元的最新估值即刻投入 100 亿美元现 金。谷歌将在 Anthropic 达成业绩里程碑后再追加投资 300 亿美元,同时大力扩充 Anthropic 的算力规模。 Anthropic 是谷歌芯片和云服务的重要客户,而谷歌正大力拓展这些业务,以弥补其核心收入来源——搜索广告业务 增长趋于成熟的不足。谷歌云将在未来五年内为 Anthropic 提供 5 吉瓦的算力,从 2027 年开始陆续上线,后续还可 能追加数吉瓦。2)OpenAI 正式发布新一代图像生成模型 ChatGPT Images 2.0,官方将其定位为"从渲染工 ...
美股科技行业周报:谷歌发布 TPU 8,OpenAI 发布 GPT-5.5 及 ChatGPT Images 2.0,模型迭代加速下 AI 算力链维持高景气度-20260426
国联民生证券· 2026-04-26 17:40
本公司具备证券投资咨询业务资格,请务必阅读最后一页免责声明 证券研究报告 1 美股科技行业周报 谷歌发布 TPU 8,OpenAI 发布 GPT-5.5 及 ChatGPT Images 2.0,模型迭代加速下 AI 算力链维持高景气度 宏观回顾 4 月以来,美股市场反弹行情明确。科技板块内部广度逐渐打开,从前期"光+存储"二元结构,向算力租赁、 CPU 等更多受益板块扩散。4 月美伊相对缓和、流动性改善和空头回补或推动一阶段的快速反弹,但伴随大 模型的强势发布和 Intel 业绩超预期后,市场或开始重新定价 AI 硬件需求的广度。 美股科技公司动态 全球科技行业动态 OpenAI 发布 GPT-5.5。率先上线 ChatGPT、Codex,API 版本预计随后开放。知识工作与真实任务能力 显著提升,多项基准达到行业领先。GPT-5.5 在 GDPval 取得 84.9%,在 OSWorld-Verified 达到 78.7%, Tau2-bench Telecom 复杂客服流程测试达 98.0%。在金融 Agent、投行建模、Office 文档任务等企业高 价值场景表现突出。编程能力上,在 Terminal ...
国内外AI模型密集发布,关注AI3D生成能力进步
国联民生证券· 2026-04-26 16:56
传媒行业周报 20260425 国内外 AI 模型密集发布,关注 AI 3D 生成能力进步 glmszqdatemark 2026 年 04 月 26 日 本周行情 本周(2026 年 4 月 20 日-24 日)传媒指数下跌 2.69%,跑输沪深 300(+0.86%)、 深证成指(+0.37%)、创业板指(-0.29%)、上证指数(+0.7%)、上证中小 (+0.58%)。所有申万二级行业中,传媒涨幅位列第 29。传媒三级行业中,出版 涨幅最大(+0.01%)。 国内外 AI 模型密集更新,可用性进一步提升 近期国内外 AI 模型密集更新,大多聚焦代码与 Agent 能力。在 4 月 20 日-25 日 期间,国内外模型更新动作频频,国内月之暗面、阿里、腾讯、DeepSeek 和海 外 OpenAI 均发布了主力大模型的更新,代码能力、任务执行、上下文等能力成 为更新重点。 3D 生成能力持续迭代,AI 对物理世界认知加深 Seed3D 2.0 定位"更高精度、更强可用性"的 3D 生成大模型。相比 Seed3D 1.0,团队围绕几何精度和材质质量对模型进行了架构升级,并拓展了 3D 内容的 下游可用性, ...
2026.04.18—2026.04.24周报:DeepSeekV4发布,Anthropic估值万亿
浙商证券· 2026-04-26 09:10
行业投资评级 - 行业评级:看好(维持) [2] 报告核心观点 - 本周大模型行业主线围绕Agent企业级工作流落地、模型与多模态能力迭代、商业化体系重构和应用场景落地展开,算力扩容同步推进 [2] - 行业正在从模型能力验证转向付费机制和场景闭环验证 [2] - 国产大模型在前沿能力迭代、推理成本优化与国产算力生态适配上取得阶段性突破 [2] - Agent竞争重点正在从单点工具调用,转向组织协作、企业数据、长期任务执行、经验沉淀和多Agent协同能力 [2] - 模型升级正在从单纯通用能力提升,逐步转向Agent编程、多模态理解、视觉创作和专业工作流交付 [2] 行业主线动态总结 Agent企业级工作流落地 - OpenAI Codex周活跃用户已超过400万(4月初为300万),并发布Workspace Agents、Chronicle和Codex Labs [2][5] - Google Cloud Next 2026以Agentic Enterprise为核心,发布Gemini Enterprise App、Agentic Data Cloud和Workspace大规模更新 [2] - Kimi开源K2.6并开启Claw群组内测,智谱AutoClaw上线自进化与Skill商店 [2] 模型与多模态能力迭代 - OpenAI发布GPT-5.5,强化Agentic Coding、计算机使用、知识工作和早期科学研究能力,并推出ChatGPT Images 2.0 [2][5] - Anthropic发布Claude Design,支持通过自然语言协作生成设计、原型和幻灯片 [2][5] - 通义开源Qwen3.6-27B并发布Qwen3.6-Max-Preview,Kimi开源K2.6,字节跳动发布Seed 3D 2.0 [2][4] 商业化体系与应用场景推进 - OpenAI GPT-5.5设置Flex和Priority等不同优先级定价,延续按量加使用时间计费的方向 [2] - Anthropic对Claude Code新订阅用户访问权限进行小规模A/B测试 [2][5] - 字节跳动通过豆包大模型与DeepSeek模型进入车载语音和车主手册查询场景,通义开放AI办事能力并接入东方航空全流程AI机票服务 [2][4] 算力扩容支撑 - Anthropic与Amazon达成重大算力合作;Google发布第八代TPU,分别面向训练和推理优化 [4][7] - 头部厂商正同步强化底层资源保障与成本控制能力 [4] 国内厂商动态总结 DeepSeek - 发布并开源DeepSeek V4预览版,包含Pro与Flash两个版本,采用MoE架构并支持百万级上下文窗口 [4] - 模型通过CSA+HCA混合注意力机制降低超长上下文场景下的计算量与KV Cache占用,强化对国产芯片和软件栈的适配 [2][3] 字节跳动 - 2026年3月,豆包月活达3.45亿,稳居中国AI原生App第一,人均使用54.8次(同比+22.0%),活跃率33.5%(同比+11.2%) [4] - 特斯拉Model车型将搭载豆包大模型与DeepSeek模型,豆包承担语音命令功能及车主手册查询 [4] - 发布Seed 3D 2.0:3D生成大模型,MoE架构 [4] 通义 - 2026年3月,千问月活达1.66亿,人均使用19.8次(同比+4.3%),活跃率17.1%(同比+4.9%) [4] - 千问宣布对外开放“AI办事”能力,首家接入东方航空,上线全流程AI机票服务 [4] - 宣布开源Qwen3.6-27B:270亿参数稠密多模态模型 [4] - 发布Qwen3.6-Max-Preview,在Artificial Analysis榜单登顶最佳国产模型 [4] 智谱 - 智谱AutoClaw上线自进化与Skill商店,同步上线GLM Office五件套 [2][4] Kimi - 2026年3月Kimi月活834万,人均使用23.8次(同比+3.1%),活跃率15.4% [4] - 发布并开源K2.6:在测试中可不间断编码13小时,编写/修改超4000行代码;支持300个子Agent并行完成4000个协作步骤 [4] 海外厂商动态总结 Anthropic - 在私募二级市场估值已突破1万亿美元 [5] - 与Amazon达成重大算力合作扩容:未来十年将投入超过1000亿美元用于AWS技术,锁定最高5GW新增容量;Amazon追加5亿美元投资,未来可能追加200亿美元 [5] - 暂时移除了新订阅用户对Claude Code的访问权限,后续澄清是对约2%新专业消费者注册用户的小规模A/B测试 [5] OpenAI - 发布GPT-5.5:定价较GPT-5.4翻倍(/1M tokens:$5/$30),提供Flex(标准版一半)与Priority(标准版2.5倍)分层定价 [5] - 推出ChatGPT Images 2.0图像生成模型:首次内置“思考”能力 [5] - 上线新功能Chronicle:让Codex能利用最近的屏幕上下文改进记忆 [5] Google (Gemini) - Google Cloud Next ‘26主题聚焦“Agentic Enterprise” [5] - 发布第八代TPU(TPU 8t & TPU 8i):TPU 8t专为训练优化,可扩展至9,600颗TPU Superpod(121 Eflops算力 + 2PB内存带宽);TPU 8i专为推理优化,推理性能/美元提升80% [7] - 2026年第一季度,Gemini处理160亿+ tokens/min,较上个季度100亿tokens/min显著增长;过去12个月,Google Cloud处理token 1万亿+的客户330家,处理10万亿token客户35家 [7]
2026.04.18—2026.04.24周报:DeepSeekV4发布,Anthropic估值万亿-20260425
浙商证券· 2026-04-25 20:03
行业投资评级 - 行业评级:看好(维持) [2] 报告核心观点 - 本周大模型行业主线围绕Agent企业级工作流落地、模型与多模态能力迭代、商业化体系重构和应用场景落地展开,算力扩容同步推进 [2] - 行业正在从模型能力验证转向付费机制和场景闭环验证 [2] - 国产大模型在前沿能力迭代、推理成本优化与国产算力生态适配方面取得阶段性突破 [2] 行业主线分析 Agent企业级工作流落地 - Agent正从开发者工具向企业级工作流加速延伸,竞争重点从单点工具调用转向组织协作、企业数据、长期任务执行、经验沉淀和多Agent协同能力 [2] - OpenAI Codex周活跃用户已超过400万,并发布Workspace Agents、Chronicle和Codex Labs,分别面向团队共享Agent、屏幕上下文记忆和企业内部落地服务 [2] - Google Cloud Next 2026以Agentic Enterprise为核心,发布Gemini Enterprise App、Agentic Data Cloud和Workspace大规模更新,覆盖无代码Agent创建、长流程Agent、企业数据连接与管理、MCP Server、办公套件协同及第三方Agent生态 [2] - Kimi开源K2.6并开启Claw群组内测,智谱AutoClaw上线自进化与Skill商店 [2] 模型与多模态能力迭代 - 模型与多模态能力继续迭代,前沿能力竞争仍围绕编程、视觉、知识工作和复杂任务展开 [2] - 模型升级正在从单纯通用能力提升,逐步转向Agent编程、多模态理解、视觉创作和专业工作流交付 [2] - OpenAI发布GPT-5.5,强化Agentic Coding、计算机使用、知识工作和早期科学研究能力,并推出ChatGPT Images 2.0,首次内置思考能力 [2] - Anthropic发布Claude Design,支持通过自然语言协作生成设计、原型和幻灯片 [2] - 通义开源Qwen3.6-27B并发布Qwen3.6-Max-Preview,Kimi开源K2.6,字节跳动发布Seed 3D 2.0 [2] 商业化体系与应用场景推进 - 商业化体系与应用场景同步推进,头部厂商正在围绕Agent场景下波动较大的推理消耗,建立更细颗粒度的价格分层、服务优先级、预算控制和使用限制 [2] - OpenAI GPT-5.5设置Flex和Priority等不同优先级定价,延续按量加使用时间计费的方向,定价较GPT-5.4翻倍(/1M tokens:$5/$30) [5] - Anthropic对Claude Code新订阅用户访问权限进行小规模A/B测试,测试范围约2%新专业消费者注册用户 [5] - 字节跳动通过豆包大模型与DeepSeek模型进入车载语音和车主手册查询场景,通义开放AI办事能力并接入东方航空全流程AI机票服务,智谱AutoClaw上线自进化与Skill商店并同步推出GLM Office五件套 [2] 算力扩容支撑 - 算力扩容作为重要支撑同步推进,随着Agent任务转向多步骤、长链条和持续执行,算力供给、推理成本和交付稳定性的重要性持续上升 [4] - Anthropic与Amazon达成重大算力合作,未来十年将投入超过1000亿美元用于AWS技术,锁定最高5GW新增容量;Amazon追加5亿美元投资,未来可能追加200亿美元 [5] - Google发布第八代TPU(TPU 8t & TPU 8i),分别面向训练和推理优化 [4][7] - TPU 8t专为训练优化,可扩展至9,600颗TPU Superpod(121 Eflops算力 + 2PB内存带宽),处理能力高3倍,性能/Watt最高提升2倍 [7] - TPU 8i专为推理优化,较上代片上SRAM容量增加3倍(384MB),提供288 GB高带宽内存(HBM),推理性能/美元提升80% [7] 国内厂商动态 DeepSeek - 发布并开源DeepSeek V4预览版,包含Pro与Flash两个版本,采用MoE架构并支持百万级上下文窗口,重点提升Agent能力、代码能力、世界知识和复杂推理 [4] - 强化对国产芯片和软件栈的适配,推动模型能力从单一GPU生态向国产算力平台迁移 [2] - 通过CSA+HCA混合注意力机制降低超长上下文场景下的计算量与KV Cache占用,改善长上下文推理成本 [2] 字节跳动 - 2026年3月,豆包月活达3.45亿,稳居中国AI原生App第一,超千问+DeepSeek总和,人均使用54.8次(同比+22.0%),活跃率33.5%(同比+11.2%) [4] - 特斯拉Model车型将搭载豆包大模型与DeepSeek模型,豆包承担语音命令功能(导航、媒体、空调等)及车主手册查询 [4] - 发布Seed 3D 2.0:3D生成大模型,MoE架构,围绕几何精度和纹理材质升级 [4] 通义 - 2026年3月,千问月活达1.66亿,人均使用19.8次(同比+4.3%),活跃率17.1%(同比+4.9%) [4] - 千问宣布对外开放“AI办事”能力,首家接入东方航空,上线全流程AI机票服务 [4] - 宣布开源Qwen3.6-27B:270亿参数稠密多模态模型,智能体编程达旗舰级表现 [4] - 发布生态级AI助手数字人形象“千问小酒窝”(Qwen Little Dimple),将覆盖千问App及阿里全生态 [4] - 发布Qwen3.6-Max-Preview,下一代旗舰早期预览版,在Artificial Analysis榜单登顶最佳国产模型 [4] 智谱 - 智谱AutoClaw上线自进化与Skill商店:新增对话后经验自进化、经审批写入能力,支持关键词与自动检测;同步上线Skill商店及GLM Office五件套 [4] Kimi - 2026年3月Kimi月活834万,人均使用23.8次(同比+3.1%),活跃率15.4% [4] - 发布并开源K2.6:通用Agent、代码、视觉理解全面提升;在测试中可不间断编码13小时,编写/修改超4000行代码;支持300个子Agent并行完成4000个协作步骤;针对OpenClaw等主动式Agent框架,支持长达5天持续自主运行 [4] - 开启小范围Claw群组内测,用户可接入多来源全天候Agent,由K2.6担任协调者 [4] 海外厂商动态 Anthropic - 在私募二级市场估值已突破1万亿美元 [5] - Dario Amodei最新采访预计开源模型和中国开发者将在6-12个月内复现Mythos的能力 [5] - 与Amazon达成重大算力合作扩容 [5] - 发布Claude Design:由Claude Opus 4.7视觉模型驱动,支持用户通过自然语言协作生成设计、原型、幻灯片等视觉作品 [5] - Anthropic STEM Fellows Program启动招募:招募STEM领域专家为特定专业领域设计高质量模型评估体系 [5] OpenAI - Codex周活跃用户(WAU)已增长至超过400万(4月初为300万) [5] - 发布GPT-5.5:显著提升Agentic Coding、计算机使用、知识工作、早期科学研究能力 [5] - 推出ChatGPT Images 2.0图像生成模型:首次内置“思考”能力,显著提升细节遵循、文本渲染和复杂场景生成能力 [5] - Codex CLI中意外泄露5+未发布模型:GPT-5.5和oai-2.1均被标注为「最前沿的AI智能体编程模型」 [5] Google (Gemini) - Google Cloud Next '26于2026年4月22日–24日举办,主题聚焦“Agentic Enterprise” [5] - 推出Gemini Enterprise Agent Platform:Vertex AI升级版,用于构建、扩展、治理和优化AI代理 [5] - 发布Agentic Data Cloud:核心功能包括Cross-Cloud Lakehouse、Data Agent Kit、Knowledge Catalog、Deep Research Agent等 [7] - Google Workspace大规模更新(10+ 新功能),包括Workspace Intelligence、Sheets(SOTA性能)、Skills、自动浏览、Workspace MCP Server等,从Microsoft 365迁移速度提升5倍 [7] - 2026年第一季度,Gemini处理160亿+ tokens/min,较上个季度100亿tokens/min显著增长;过去12个月,Google Cloud处理token 1万亿+的客户330家,处理10万亿token客户35家 [7] - 谷歌DeepMind组建“strike team”专项团队,旨在追赶Anthropic在AI编程领域的差距 [7]
AI 产业跟踪:DeepSeek 首次启动外部融资
国泰海通证券· 2026-04-25 17:45
产业观察 [table_Header]2026.04.25 【AI 产业跟踪】DeepSeek 首次启动外部融资 摘要:产业最新趋势跟踪,点评产业最新风向 AI 大模型资讯 OpenAI 正式发布 GPT-5.5,智能得分登顶但 API 价格翻三倍 ChatGPT Images 2.0 发布,文字渲染能力实现巨大提升 Anthropic 发布 Claude Opus 4.7,金融分析能力登顶全球公开模型 DeepSeek-V4 预览版正式上线并开源 蚂蚁百灵发布万亿级综合旗舰模型 Ling-2.6-1T,主打"快思考" 阿里通义千问上线 Qwen3.6-Max-Preview,智能体编程显著提升 字节跳动发布 3D 生成大模型 Seed3D 2.0,几何纹理均达 SOTA 亚马逊向 Anthropic 追加投资至多 250 亿美元 DeepSeek 首次启动外部融资,计划募集至少 3 亿美元 AI capex 投资计划变动,AI 产品及大模型研发不及预期,AI 软件销售不 及预期等 产业研究中心 | [Table_Authors] | 张艺晟(分析师) | | --- | --- | | | 021-3803 ...
从估值修复到内部重排:七姐妹来到财报季前夜
格隆汇APP· 2026-04-24 23:38
核心观点 - 美股“七姐妹”科技巨头的市场逻辑已从“整体估值修复”转向“内部排序分化”,投资重点在于识别哪些公司修复已较充分,哪些仍留有空间,以及谁的AI基本面与商业化前景能支撑新一轮定价 [4][8][12] - 近期上涨由地缘风险缓解带来的风险偏好回暖及AI叙事从“担忧投入”转向“关注确定性与商业化”共同驱动,资金流向在AI基础设施、云、算力及产品催化方面具备确定性的公司 [13][15][16] - 随着财报季开启,市场关注点将细化至各公司的收入兑现能力、利润率稳定性、AI资本开支及下半年指引,财报表现将推动“七姐妹”内部吸引力进一步分化 [17][18][19][20] 市场表现与估值层次 - 过去两周,“七姐妹”股价普遍上涨,但涨幅分化:微软上涨11.77%,亚马逊上涨10.37%,英伟达上涨8.8%,特斯拉上涨7.73%,谷歌上涨6.38%,苹果上涨5.4%,Meta上涨4.11% [7] - 估值层面已拉开明显层次:苹果和亚马逊市盈率已回到约30倍区间;谷歌位于高20倍区间;微软、英伟达、Meta则主要落在20倍出头区间,结合其盈利弹性与AI催化,估值位置被认为相对更舒服 [12] - “七姐妹”已从一篮子整体机会,转变为几类处于不同定价阶段的资产,当前阶段的核心是判断“该先看谁”而非“能不能重新看” [12] 上涨驱动因素分析 - 外部环境改善是上涨先导因素:中东局势趋向缓和,市场对最坏情形的定价退却,此前压制大型科技股的地缘风险溢价松动,推动4月中旬以来美股风险偏好回暖与资金回流 [13] - 市场对AI的看法趋于理性:从担忧巨额资本开支和成本压力,转向认识到AI发展进程不可逆转,资金重新聚焦于最具确定性的方向 [14][15] - AI确定性溢价具体体现在:1)新产品节奏(如OpenAI推出GPT-5.5和ChatGPT Images 2.0)抬升市场对模型迭代速度的预期;2)市场进入重新评估谁能承接下一轮AI需求和定价的阶段 [15] 个股分化逻辑 - **微软、亚马逊、英伟达、谷歌**:更容易获得“确定性”溢价。微软和亚马逊卡位云与企业工作负载,并与OpenAI、Anthropic等核心AI应用方深度绑定;英伟直接受益于算力需求;谷歌则因其Gemini模型、TPU及与Broadcom的下一代AI芯片合作(签至2031年)而被置于AI基础设施路线中重新评估 [16] - **Meta**:上涨逻辑不同,主要依靠产品催化(如Muse Spark)重新吸引市场关注,焦点在于其AI能力能否持续提升推荐、广告及整体流量效率 [16] - **特斯拉**:虽在“七姐妹”框架内讨论,但本轮修复行情更多围绕AI算力、云、平台和广告效率展开,特斯拉并非核心 [8] 财报季关注重点 - 市场关注点将从风险偏好和估值修复,转向具体的财务兑现能力:收入承接、利润率稳定性、AI相关投入趋势以及下半年管理层指引 [18] - 各公司核心看点: - **Meta**:广告效率与AI投入能否同步推进 [18] - **微软**:云业务与AI工作负载的承接情况 [18] - **亚马逊**:AWS与AI服务的收入线索是否更清晰 [18] - **谷歌**:搜索与云业务外,模型更新(Gemini)节奏及其与云、TPU、基础设施路线的整合叙事 [18] - **英伟达**:数据中心需求,以及推理需求能否接续增长势头 [19] - 财报表现与指引将回答关键问题:谁的云资产更值钱、谁的模型与平台更具延展性、谁的AI投入更容易转化为收入,从而直接影响市场对“七姐妹”的重新排序 [19][20] - 关键变量包括下半年展望、资本开支预期以及AI商业化进度 [20]
【太平洋科技-每日观点&资讯】(2026-04-24)
远峰电子· 2026-04-23 22:32
大盘与板块表现 - 主要股指普遍下跌,其中北证50指数跌幅最大,达-3.04%,科创50指数下跌-1.28% [1] - TMT板块内部分化,通信线缆及配套(+0.95%)、被动元件(+0.72%)、品牌消费电子(+0.63%)领涨 [1] - TMT板块内光学元件(-3.65%)、分立器件(-3.20%)、其他通信设备(-3.18%)领跌 [1] 国内科技与半导体产业动态 - **AI/AR终端**:豪鹏科技完成对AI+AR技术公司Rokid的战略投资,旨在从供应商转向深度合作伙伴,以把握新一代AI终端机遇 [1] - **光通信芯片**:东山精密自研的1000 PAM4 EML芯片在400G及800G光模块中累计使用超千万颗,200G PAM4 EML芯片已量产,为1.6T光模块提供支撑 [1] - **先进制程**:台积电公布至2029年技术路线图,重点包括1.2nm(A12)和1.3nm(A13)制程、N2U工艺,并计划在2029年前不采用High-NA EUV光刻技术 [1] - **先进封装**:长电科技在先进封装领域推动多芯片异构集成产品规模化量产,光电合封产品已交付客户样品,玻璃基板在大尺寸FCBGA应用上取得积极进展 [1] 海外科技巨头与半导体行业 - **AI基础设施投资**:谷歌计划2024年投入1750亿至1850亿美元用于资本支出,以构建AI“智能体时代”所需的基础设施 [2] - **存储芯片业绩**:SK海力士2025年第一季度营收达52.58万亿韩元,同比增长198.1%,营业利润达37.61万亿韩元,同比增长405.5%,营收和利润均创历史新高 [2] - **半导体并购与集成**:Marvell Technology收购开发等离子体硅光子器件的Polariton Technologies,以增强其光学技术组合和下一代相干光互连能力 [2] - **第三代半导体进展**:博世集团开始向全球汽车制造商提供第三代碳化硅芯片样品,新一代芯片性能提升20%,尺寸显著缩小 [2] AI技术应用与治理 - **3D内容生成**:火山引擎发布Seed3D 2.0模型,可通过单张图片生成结构准确、材质真实的3D模型,应用于游戏、设计和工业仿真 [2] - **AI+体育**:XBotGo与TeamSnap合作,将AI自动追踪与4K拍摄整合,提升视频质量并新增自动剪辑高光功能,打造一体化赛事体验 [2] - **AI内容治理**:2026年以来,抖音累计下架AI侵权视频超53.8万条,处罚违规账号4000余个,其中针对AI仿冒蹭热行为下架视频超36万条,处置AI肖像、声音侵权内容8.5万条 [2] - **多模态AI模型**:OpenAI发布ChatGPT Images 2.0,支持复杂视觉任务和高密度文本渲染,最高2K分辨率,可联网获取实时信息,单次提示最多生成8张一致性图像 [2] “十五五”前瞻产业追踪 - **深空经济**:航升卫星、中科天算、炎和科技合作布局太空算力赛道,计划于2027年3月前完成两颗算力卫星的发射及在轨验证 [3] - **具身智能**:北京便利店已部署具身大模型机器人,可自主迎客、解答咨询、提供促销并完成送货,标志该技术在零售场景的进一步落地 [3] - **量子科技**:科罗拉多量子孵化器将建设美国首个面向商用、开放共享的第三方量子授时技术验证测试平台,为量子技术产业化提供关键支撑 [3] - **新材料应用**:冀中股份冀中新材自主研发的煤矿用纤维增强聚乙烯液体管获得矿用产品安全标志证书,打通玻纤产品进入煤矿领域的通道 [3] 半导体材料价格数据 - 根据百川盈孚2025年4月23日数据,所列半导体材料(包括锌系粉体、高纯金属、晶片衬底)当日市场均价与前一日相比无变化(日均变化为0) [4][5] - 价格数据覆盖广泛品类,例如:4N氧化锌粉市场均价1755元/千克,5N高纯锑750元/千克,2寸砷化镓衬底2300元/片,导电N型6寸D级单晶碳化硅衬底2150元/片 [5] 上市公司业绩 - **达瑞电子**:2025年总营业收入31.88亿元,同比增长24.24%;归母净利润2.82亿元,同比增长16.72% [6] - **海能实业**:2025年总营业收入32.59亿元,同比增长47.3%;归母净利润0.95亿元,同比增长23.47% [6] - **新易盛**:2025年总营业收入248.42亿元,同比增长187.29%;归母净利润95.32亿元,同比增长235.89% [6] - **智微智能**:2025年总营业收入40.87亿元,同比增长1.3%;归母净利润1.71亿元,同比增长36.84% [6]
Altman、Brockman十年来首次同台:砍掉Sora不是因为它不够好,第一优先级是Agent
Founder Park· 2026-04-23 21:21
公司战略与产品优先级 - 公司当前三大战略优先级为:构建极致的Agent平台、推出面向所有人的Codex、以及实现Personal AGI [3] - 第一优先级是构建极致的Agent平台,模型已从“产品本身”转变为“产品的一部分”,公司正在为模型(大脑)构建“身体”(如skill、连接器、计算机操作、上下文管理等软件层)[13] - 第二优先级是将Agent应用到所有“computer work”(电脑工作)中,而不仅是知识工作,Codex将面向所有人,并计划通过合作领域专家、生产评估和训练数据,将AI能力应用到法律、金融、写作、做表格、做PPT等垂直行业[13] - 第三优先级是实现Personal AGI,目标是让一个模型真正了解用户的全部上下文,包括身份、生活、在乎的人和事,并能访问其电脑和浏览器,从而彻底改变使用体验 [4][28] - 公司内部将Personal AGI作为目标,旨在构建一个真正了解用户、拥有其上下文、可被信任的AI,用于深度电脑工作和个人生活 [45][46] 产品调整与资源分配 - 砍掉了图像生成模型Sora,原因是其技术路径与核心GPT系列不统一,使用场景不在公司未来3到12个月的核心产品路径上 [16] - 公司正处在向Agent转型的时刻,产品战略聚焦于Agent平台和Codex的整合 [12] - 公司认为算力是利润中心而非成本中心,商业模式是租或买算力,加上利润率后卖出,只要有正毛利就能无限扩展,因为需求是无限的 [17] - 公司否认缩减“Stargate”等基础设施投入的报道,并表示会继续尽最大可能建设算力 [18] - 自研芯片和数据中心硬件项目仍在全力推进中 [19] - “超级App”是公司内部对统一Agent基础设施的简称,其核心是让Codex面向所有人升级,公司计划模糊To C和To B的界限,聚焦于在所有场景下帮助用户达成目标 [20] - 机器人、浏览器项目在继续,但社交网络不做,机器人方向的“ChatGPT时刻”仍需时间 [20] 技术发展与能力认知 - AI的能力边界是“锯齿状”的,在不同领域进展不均 [22] - 过去几天,公司的AI解决了一个长期悬而未决的数学问题,揭示了不同数学领域间此前未被发现的联系 [22] - 技术发展分为两步:第一步是无监督学习,模型通过公开数据预测下一个词;第二步是强化学习,模型尝试想法并根据表现获得信号 [22] - 评判AI在开放性领域(如写作)的表现是难点,因为标准模糊,公司正在扩展可被评分的任务集合,并利用AI自身提供奖励信号 [23] - 评估技术进步不应只看当前位置,而应看其发展斜率,并将其拟合到指数曲线上 [23] - 公司致力于让模型满足10亿用户的个性化需求,使其在不同用户眼中都是“好作家” [23] - 新的图像生成模型ChatGPT Images 2.0即将发布,能生成极其出色的图像,包括文字渲染能力也将很快得到改进 [25][27] - ChatGPT拥有10亿用户,但公司认为其远非最令人印象深刻的技术,发布前的技术(如赢得电子游戏竞赛、解魔方机器人)虽令人惊叹但未产生广泛实际影响,而ChatGPT让用户能亲手感受并产生“aha时刻” [27] - 模型能力和用户期望值正以巨大幅度逐月或逐季提升,当前模型相对于未来还很“笨”,且对用户个人生活几乎一无所知 [28] 公司治理与创始人关系 - 两位联合创始人Sam Altman和Greg Brockman是公司十年搭档,保持每日同步(至少5个电话,每次几分钟),分歧是让公司强大的原因 [9] - Greg Brockman擅长推动公司聚焦于最重要的事,而Sam Altman则在算力规模上不断提高野心,这种平衡被视作公司成功的关键 [10][11] - 近期Greg Brockman接管了产品和研究整合工作,虽上任仅几周,但给公司内部带来了显著的能量和兴奋感 [12] 行业竞争与定位 - 在编程领域,公司在“真实世界代码”应用上起步比Anthropic慢,但竞争提升了公司执行力,目前Codex对比Claude已在很多维度领先 [39][40] - 公司认为某些参与者(暗指竞争对手)只相信自己能做对AI,并出于对无限赌注的考虑而不信任他人,这导致了一些有害的行为 [41] - 公司认为Anthropic在与美国联邦政府的公开冲突事件中未受到公平对待,反对使用《国防生产法》(DPA)和供应链风险认定来威胁AI实验室 [42] - 公司认为领先的AI实验室应协助美国政府,随着模型越来越强大,这种合作会越来越重要 [42] - 公司一直试图在与美国政府的关系中保持温和、中立、理性 [43] - 对于谁先实现AGI,公司认为关键不在于此,而在于如何帮助人们理解技术能为他们做什么,这是所有创造者的责任 [44] 安全与部署理念 - 公司对安全与对齐的谈论方式已改变,早期作为技术极客犯了一个错误:只说要构建超级智能且对人类很好,但未说明中间过程如何实现 [29] - 公司认为人们真正想要的是繁荣、主体性以及继续拥有有意义的工作,而非所有事都被代劳 [30] - 公司找到了不同的方式来谈论安全,核心是“迭代部署”理念:在风险逐步升高的过程中,让产品变得越来越安全 [31] - 公司非营利机构(OpenAI基金会)的核心支柱之一是“AI韧性”(AI resilience),其含义是让AI成为对世界有正面意义的东西,这需要一整套深层的社会调整,而非单点技术干预 [31] - 如果先使用一项不那么强大但能正面改变世界的技术,那么后续部署更强大的变革性技术时,事情会顺利得多,这种思维导向韧性思维和迭代部署 [32] - 早期的恐惧叙事与2017、2018年设想的多智能体竞争模拟技术路线有关,该路线可能产生聪明但与人类价值观无联系的系统,非常可怕且难以对齐 [32][33] - 后来转向的语言模型路线扎根于人类价值观和理解,拥有可监控的思维链,是一条乐观得多的技术路径 [33] 社会影响与访问权 - AI可能带来两种未来:一种是生活水平(地板)大幅抬升,每个人主观上感觉更富裕,但不平等加剧,出现利用AI杠杆的万亿富翁;另一种是生活水平上升较少,但不平等也较小 [35] - 公司创始人认为人们显然应更想要第一种未来,但情感上很多人难以接受 [35] - 无论选择哪种未来,共识是需要更多算力、更多基础设施,以及尽可能便宜的AI访问权,否则将加剧不平等 [37] - AI本质上是机会,但前提是拥有访问权,如果没有算力,再擅长使用Agent也无用 [37] - OpenAI基金会持有公司约25%到30%的股权,价值超过1500亿美元,如果公司成功,这些价值将锁在非营利架构中用于造福世界 [37] - 正在成长的一代人使用Agent的能力将比上一代强10倍 [37] 对Elon Musk诉讼的回应 - 公司认为Elon Musk的诉讼是一个讲出真相的机会 [47] - 诉讼的核心历史分歧点在于:当所有人都同意公司必须转型为营利性结构后,Elon Musk要求多数股权、CEO职位和绝对控制权,公司因坚持使命(不应由任何一个人掌控整个未来)而在这一步说了“不” [49] - 公司此前从未公开讲述过这段故事 [49]
腾讯研究院AI速递 20260423
腾讯研究院· 2026-04-23 00:21
生成式AI - OpenAI发布ChatGPT Images 2.0,支持复杂视觉任务和高密度文本渲染,最高支持2K分辨率,宽高比可在3:1至1:3间灵活调整 [1] - ChatGPT Images 2.0模型首次引入“思考能力”,可联网获取实时信息,单次提示最多生成8张角色与元素保持一致的图像 [1] - 模型多语言渲染能力显著增强,中日韩印地孟加拉语文本表现突出,已向ChatGPT、Codex与API全量用户开放 [1] - Anthropic推出STEM Fellow项目,招募各学科专家驻场旧金山三个月,每周提供3800美元津贴,机器学习经验非必需 [2] - 该项目核心是让科学家用专业判断力校准Claude“自信但错误”的输出,以弥补模型在长周期科研任务中的能力短板 [2] - 这是三代Fellowship的深化,标志着AI竞争从算力比拼转向行业专家资源的争夺 [2] - 谷歌发布Deep Research和Deep Research Max两款自主研究智能体,基于Gemini 3.1 Pro构建,通过Gemini API付费套餐开放预览 [3] - 智能体新增MCP协议支持,可安全连接企业私有数据库与第三方数据源,已与FactSet、标普、PitchBook等金融数据商达成合作 [3] - 报告中可原生生成图表和信息图,支持多模态输入与协作式规划,向企业级研究分析基础设施方向演进 [3] - Anthropic对约2%新专业用户测试更贵订阅方案,部分Pro(每月20美元)用户的Claude Code使用权被取消,新增实名验证引发不满 [4] - OpenAI趁机对用户开放Codex测试,免费与付费套餐均可使用,其负责人发文直接对标Claude Code [4] - Codex近期新增Computer Use、内置浏览器、Chronicle屏幕记忆与90多项插件,目标从代码工具演变为全能桌面助手 [4] - 商汤绝影发布端侧多模态智能体基座大模型Sage,采用MoE架构,总参数320亿、激活参数仅30亿,已在英伟达Orin X平台部署 [6] - 在PinchBench评测中,Sage模型最佳任务完成率达94%,超越Claude Opus 4.6(93.3%)、GPT-5.4(90.5%)等云端旗舰模型 [6] - 依托自研SCOUT分级协同学习与ERL可擦除强化学习技术,Sage模型训练算力节省60%、复杂任务完成率提升20% [6] 行业并购与资本动态 - 马斯克旗下SpaceX宣布拟以600亿美元收购AI编程工具Cursor,较去年11月估值翻倍,亦可选择以100亿美元建立合作关系 [5] - 此前SpaceX以1.25万亿美元并购xAI,但Grok追赶OpenAI与Anthropic效果不佳,收购旨在借Cursor工程师生态补齐短板 [5] - SpaceX筹备6月IPO目标估值1.5万亿美元,Cursor或可接入百万H100当量的Colossus超算以提升模型训练能力 [5] - 《福布斯》发布第八届AI 50榜单,OpenAI与Anthropic累计融资2426亿美元,占上榜企业总融资额3056亿美元的约80% [8] - 榜单中有20家新面孔入围,包括开源模型公司Reflection(估值80亿美元)、AI演示工具Gamma、AI药物研发Chai Discovery等 [8] - 四家女性创始企业上榜,包含穆拉蒂的Thinking Machine Labs与李飞飞的World Labs,并首次推出AI 50 Brink早期榜单 [8] 前沿科技与开源生态 - 智平方联合港科大(广州)发布AlphaBrain Platform,这是全球首个一站式具身智能模型开源社区,打通数据、训练、模型与评测全链路 [7] - 该平台一次性开源三大“全球首创”:类脑VLA模型NeuroVLA、基于RL Token的VLA训练架构、可插拔世界模型架构WA [7] - 其RL后训练参数从39亿压缩至1.37亿,单张4090显卡即可微调,覆盖LIBERO等8大主流Benchmark,显著降低研究门槛 [7]