Workflow
Responses API
icon
搜索文档
深度|OpenAI API华人工程负责人:模型会把你的脚手架当早餐吃掉,为模型的未来而构建,而非为模型的当下而构建
Z Potentials· 2026-02-24 11:21
文章核心观点 - OpenAI内部AI工具(Codex)的使用已极为广泛和深入,正在从根本上重塑软件工程的工作范式,工程师角色正从代码编写者转变为管理AI智能体的“技术负责人”或“巫师” [5] - AI技术的发展遵循“苦涩的教训”,即当前为弥补模型缺陷而构建的复杂“脚手架”(如特定框架、工具)终将被更强大的模型能力所取代,因此产品开发应为模型的未来而构建,而非基于其当下状态 [5][48] - AI带来的生产力杠杆效应将催生创业生态的繁荣,可能出现“一人十亿美元”级别的初创公司,并引发B2B SaaS领域的黄金时代 [5][30] - 企业AI部署面临负ROI的普遍困境,其核心在于缺乏自下而上的员工认同与赋能,成功的关键在于组建内部“虎队”进行探索和布道 [43][45] - OpenAI坚定其平台与生态战略,致力于通过开放的API和工具赋能开发者,认为当前是科技与创业领域前所未有的机遇期 [60][70] OpenAI内部AI工具使用现状与影响 - **使用普及率极高**:OpenAI内部95%的工程师每天都在使用Codex,且100%的代码合并请求(PR)都由Codex进行审核 [5][7] - **代码生成主导**:绝大多数代码首先由AI生成,工程经理等管理者的代码也全部由Codex编写,工程师的工作重心已转向审核和引导AI生成的代码 [5][6] - **显著提升生产效率**:频繁使用Codex的工程师提交的PR数量比使用较少的工程师高出70%,并且这一效率差距还在持续扩大 [7] - **自动化代码审查**:Codex(特别是5.2版本)非常擅长代码审查,能将原本需10-15分钟的审查任务缩短至2-3分钟,对于小型PR,有时甚至无需人工二次审查 [21] - **开发流程自动化**:公司内部利用Codex高度自动化了持续集成(CI)、Lint错误修复等部署前流程,进一步释放了工程师的产能 [22] 软件工程师角色的演变 - **从编码者到管理者/巫师**:工程师的角色正在演变为“技术负责人”,管理着成群的AI智能体,工作内容从编写代码转变为施展“咒语”(指令)来引导AI完成任务,并同时管理10到20个并行线程 [5][13][15] - **需要更高阶技能**:有效使用AI工具需要资历、技能和大量思考,以确保模型不会“脱轨”,类似于《魔法师的学徒》中掌控魔法的比喻 [15] - **工具赋能顶尖表现者**:AI工具让高能动性、擅长使用工具的工程师变得“超级充能”,极大地拉开了团队内部的生产力分布,顶尖表现者变得更加多产 [24][25] AI技术发展趋势与产品构建启示 - **“模型吃掉脚手架”**:AI发展史表明,许多为弥补早期模型缺陷而构建的复杂框架(如向量存储、智能体框架)最终都会被更智能的模型本身所取代 [5][48][49] - **为未来而构建**:开发者应瞄准模型未来1-2年的能力方向(即使当前只实现80%)来构建产品,这样当模型能力提升时,产品体验将迎来爆发式改善,而非被困在基于当前能力的“局部最优解”中 [50][52] - **任务时长大幅延伸**:当前AI产品主要优化几分钟的短任务,但在未来12-18个月内,将出现能够连贯执行数小时甚至长达六小时任务的模型,这将催生全新的产品形态 [5][53] - **音频/语音成为关键赛道**:多模态能力持续升级,未来6-12个月音频和语音到语音模型的能力将有质的飞跃,商业世界的音频沟通场景存在巨大且被低估的AI应用潜力 [54] - **商业流程自动化是巨大机会**:与硅谷的开放式知识工作不同,传统行业中大量可重复的标准商业流程(SOP)是AI自动化潜力巨大但被严重低估的领域 [55][56][58] 创业生态与市场展望 - **“一人十亿美元”公司与二阶效应**:个人生产力的极高杠杆可能催生“一人十亿美元”级别的初创公司,而这将进一步引发创业生态繁荣,为支持这些公司,可能会出现数以百计的其他小型初创公司提供定制化软件,从而进入B2B SaaS的黄金时代 [5][30][31] - **风险投资格局可能变化**:如果未来出现大量价值1000万至5000万美元的小型成功企业,它们可能不适合追求百倍回报的传统风险投资模式,但对创业者个人而言价值巨大 [33] - **市场足够容纳创新者**:AI领域机会空前广阔,初创公司失败的主因是产品未打动市场,而非被大厂挤压,专注打造用户真正热爱的产品是关键 [59] - **当前是历史性机遇期**:未来2-3年将是科技和初创领域有史以来最具机遇的时期,AI正在重构世界运行和工作方式 [70] 企业AI部署的成功之道 - **普遍面临负ROI困境**:许多企业AI部署项目投资回报率为负,部分源于硅谷与外部世界在AI认知和应用上的巨大“信息泡沫” [43] - **成功需要双向结合**:成功的AI部署必须同时具备自上而下的战略支持(管理层推动、资源投入)和自下而上的员工认同(一线员工主动学习、分享最佳实践) [44] - **组建内部“虎队”**:企业应在内部组建全职的AI“虎队”,由对技术充满热情、具备技术相邻技能(如客服运营、Excel高手)的员工组成,负责深度探索AI应用、开展内部知识分享和布道,这是打破僵局的关键 [45][46][47] - **避免错误模式**:最大的反模式是仅有自上而下的强制推动,将AI使用与绩效挂钩,却不培育自下而上的学习文化和支持体系 [47] OpenAI的平台战略与开发者支持 - **定位为生态平台公司**:OpenAI从根本上将自己定位为生态系统平台公司,培育健康的AI生态、支持开发者是其核心目标 [60] - **坚持开放与中立**:公司坚持“吃自己的狗粮”,在自有产品中使用的模型都会同步开放给API用户,不保留核心能力,不屏蔽竞争对手,保持平台中立 [60] - **提供多层次开发者工具**:平台提供从底层原语到高层抽象的多种工具选择,包括:1) 底层的Responses API,用于构建长时间运行的智能体;2) 基于此的Agents SDK,提供智能体开发框架;3) Agent Kit,提供现成的UI组件;4) Evals API等测评工具 [67][68][69] - **生态繁荣驱动增长**:坚信“水涨船高”,整个AI生态的繁荣将使所有参与者受益,这也是OpenAI API实现爆发式增长的原因 [61] - **使命驱动开放**:让AGI福祉惠及全人类的使命,决定了必须通过开放平台赋能全球开发者去覆盖OpenAI自身无法触及的细分场景和应用 [62] - **ChatGPT应用商店扩展生态**:拥有8亿周活跃用户的ChatGPT推出应用商店,旨在吸引更多开发者为海量用户构建专属产品,实现生态共赢 [63][65]
OpenAI高管:工程师变成“魔法师”,AI将开启新一轮创业狂潮
华尔街见闻· 2026-02-15 16:01
OpenAI内部AI应用现状 - 公司内部95%的工程师在日常工作中使用Codex编程模型,100%的代码拉取请求(PR)每天由Codex审查 [2][4][9] - 深度使用Codex的工程师开启的PR数量比不常使用的工程师多出70%,并且这个生产力差距还在随着时间的推移而扩大 [4][18] - 公司内部有一个实验团队正在维护一个100%由Codex编写的代码库,这代表了开发模式的根本性转变 [4][12][29] 软件工程职业重塑 - 独立贡献者角色的工程师正在转变为“技术负责人”或管理者,其工作内容从逐行写代码转变为同时管理10到20个并行的AI线程(智能体) [6][24] - 工程师的角色被比喻为“巫师”,通过“咒语”(指令)引导AI智能体完成任务,高绩效人才的杠杆率被极度放大 [6][25][26] - 代码审查工作已高度自动化,Codex审查所有PR,将审查时间从10-15分钟缩短至2-3分钟,甚至无需人工介入 [31][32] AI技术演进路径与能力预测 - 目前前沿模型能处理不到一小时的任务,预计在未来12到24个月内,将出现能够非常连贯地执行数小时复杂任务的模型 [2][7][84] - 音频和语音等多模态能力将在未来6到12个月内变得更重要,尤其是在企业业务流程自动化领域,其潜力被严重低估 [7][85] - 模型能力的快速进步会“吞噬”掉为弥补其当前缺陷而建立的工具链和中间层(脚手架),开发者应为模型未来的发展方向而构建 [4][14][73][77] 对SaaS行业与创业生态的影响 - 为赋能“一人十亿美元创业公司”这类超级个体,市场将需要大量定制化软件工具,这可能标志着B2B SaaS黄金时代的到来 [7][10][43] - 更确定的机会在于出现成百上千个服务于超级个体的“千万美元级”小微SaaS公司,这将改变风险投资生态系统并大幅降低创业门槛 [7][43][44] - 构建者应专注于为模型将要发展的方向开发产品,而非其当前形态,这样能创造出随着模型能力提升而自然解锁的卓越体验 [15][80][81] OpenAI的平台战略与市场定位 - 公司明确将自身定位为生态系统平台,致力于“提高水位”以支持整个生态发展,而非通过发布竞品扼杀初创公司 [8][93] - 公司认为当前市场机会巨大,创业公司应专注于构建用户真正喜爱的产品,而非过度担忧被平台方复制 [91][92] - 公司的使命是让人工智能惠及全人类,通过提供API、ChatGPT免费版等产品推动技术民主化,并将持续投资于医疗、教育等领域 [94][95][100][101] AI在企业中的部署与采纳 - 许多企业的AI部署可能呈现负投资回报率,部分原因在于缺乏自下而上的员工采纳,而只有自上而下的强制指令 [63][66] - 成功的AI部署需要结合自上而下的管理层支持与自下而上的员工认同,建议企业建立内部攻坚团队探索最佳实践并进行知识传播 [66][69] - 在非科技公司中,大量工作是重复性的业务流程自动化,这是一个被硅谷视野低估但潜力巨大的AI应用领域 [87][88][90]
盘点2025:模型服务,成为基础设施
第一财经· 2025-12-30 18:15
全球MaaS市场格局与火山引擎的崛起 - 截至2025年10月,全球MaaS市场前三名为OpenAI、谷歌云、火山引擎,市场份额分别为31%、19%、15%,三家合计占据全球市场65%的份额[1] - 火山引擎以30万亿日均Tokens调用量位居全球第三,仅次于OpenAI的70万亿和谷歌云的43万亿[3] - 火山引擎是前三名中唯一的中国厂商,正凭借MaaS服务在AI云市场快速突围[3] 火山引擎的增长与市场地位 - 2025年,火山引擎实现100%的同比增长,营收超过200亿人民币[6] - 由于MaaS商业化和模型迭代超预期,公司原计划于2030年实现的1000亿营收目标被上调了百分之几十[6] - 2025年上半年,火山引擎在中国公有云大模型服务市场份额扩大至49.2%,意味着中国公有云上每产生两个tokens就有一个由其生产[14] - 在Gartner 2025年度全球《AI应用开发平台魔力象限》中,火山引擎领跑“挑战者”象限,其“执行能力”位列全球第五、中国第一[14] 关键增长驱动与战略举措 - 2024年5月15日,火山引擎推出豆包大模型API服务,通过技术创新将主力模型定价从“分计价”拉入“厘计价”时代,降幅高达99.3%,引发了行业降价潮并推动了市场“从无到有”般的增长[6] - 2025年2月1日,DeepSeek-R1登陆火山方舟,模型推理服务全面爆发,火山引擎成为市场上吃到最多DeepSeek推理服务红利的云厂商[7] - 豆包大模型与DeepSeek的爆红,共同催生了中国MaaS市场,IDC报告显示2024年7月和2025年2月是中国公有云大模型调用量月度环比增长率最高的两个拐点[8][10] - 豆包大模型调用量呈指数增长,推出不到600天,其最新日均调用量已达63万亿Tokens[3][4] 产品迭代与调用量增长的正循环 - 2025年6月以来,豆包大模型家族密集发布了1.6、1.8版本以及视频生成、图像编辑、语音、图像创作等多个模型,每次模型能力提升都解锁了更多应用场景并带动调用量增长[10] - 伴随模型发布节奏,几乎每3个月模型调用就会迎来一次更陡峭的增长[11] - 公司认为,大的模型调用量能打磨出更好的模型和基础设施,来自B端场景的真实反馈可以指导下一代模型的训练路线图[15][16][18] - 大规模调用量能迭代出更极致的基础设施,优化推理成本,例如通过PD分离、xLLM推理框架等方式在2024年5月大幅降低模型推理价格[18] - MaaS服务已成为火山引擎增长最快、毛利最高的AI云计算产品,参照DeepSeek公布的推理服务最高成本利润率可达545%[18] 字节跳动的技术溢出与协同优势 - 火山引擎63万亿日均Tokens调用量的用户基础,部分来源于字节跳动的溢出效应[20] - 公司受益于B端和C端的极致协同,字节跳动的C端产品(如豆包App)拥有大量用户并大规模调用模型,这帮助火山引擎优化服务,同时豆包App也成为向企业客户展示能力的窗口[20][21] - 字节跳动内部50多个业务线在AI实践上走得更靠前,尝试了众多Agent,这为火山引擎提供了宝贵的认知和know-how[23] - 云计算是规模体系的比拼,火山引擎的崛起得益于字节跳动庞大的业务体系托举和技术外溢,这与AWS、谷歌、阿里等头部云厂商的路径类似[24] - 字节跳动通过火山引擎持续把新模型、新技术开放给企业客户,以在更大市场经受检验[24][25] 未来战略:从MaaS到AI云原生 - 在取得MaaS份额第一后,火山引擎的战略目标依旧是MaaS优先[27] - 公司致力于降低AI应用门槛,通过更高层次的封装和成本优化加速AI普惠[27] - 在基础MaaS层,追求模型效果更好、成本更低、易用性更高,并推出了Prompt Pilot、Model Router和Responses API等工具[27] - 在更底层,推出了模型的推理代工服务,客户可将自己的模型托管在火山方舟上,无需自建基础设施[27] - 随着应用迈向以Agent为技术主体,公司正构建以模型为中心的AI云原生架构,MaaS是使用模型的最佳方式,云平台和中间件进一步把Tokens组装成Agents[28] - 作为国内率先推出Agent开发、运营全套产品的云厂商,火山引擎已将豆包助手API、即梦API对外提供服务[30] - Agent的商业逻辑从tokens调用的IT预算,转向类似BPO(人力外包)的角度,市场天花板有望扩大很多倍[30]
科创板块全线回暖!广发基金科创50、科创100、科创200及科创成长等ETF全产品矩阵,助力布局科创板硬科技龙头标的
新浪财经· 2025-12-22 14:34
市场表现与资金动向 - 2025年12月22日早盘,三大指数集体高开,海南自贸区、CPO、半导体等板块领涨 [1] - 截至2025年12月22日午间收盘,上证科创板50成份指数强势上涨1.95% [4] - 科创50ETF龙头(588060)上涨1.80%,盘中最高涨超2% [4] - 科创100ETF广发(588980)上涨2.13% [4] - 科创200ETF广发(588140)上涨2.25% [5] - 科创成长ETF(588110)上涨2.11% [6] - 双创50ETF增强(588320)上涨2.28% [6] - 成分股表现突出:拓荆科技上涨6.98%,中芯国际上涨6.49%,盛美上海上涨6.11%,微导纳米上涨10.62%,精智达上涨17.22%,鼎通科技上涨10.22% [4][5][6] - 截至2025年12月19日,科创50ETF龙头近2周规模增长1.77亿元,最新份额达91.75亿份创近3月新高,最新资金净流入2508.16万元,近5个交易日内有4日资金净流入合计1.11亿元 [4] 宏观与政策环境 - 中长期来看中国权益市场具备结构性机遇,企业盈利改善、资金配置转移及政策制度优化将成为主要驱动力 [1] - 美国11月失业率小幅攀升至4.6%,创下2021年9月以来最高水平,10月非农就业人数减少10.5万人 [1] - 美国就业数据印证了此前降息25个基点的决策是合理的,随着货币宽松、财政政策以及贸易不确定性的缓解,加上AI支出作为新增长引擎,预示着2026年宏观背景或将更加有利 [1] - 12月政治局会议、中央经济工作会议陆续召开部署2026年经济工作,延续“坚定信心、用好优势、应对挑战”总基调,2026年经济工作有8大重点任务,扩内需重回首位 [3] 行业趋势与投资主题 - 全球百年未有之大变局加速演进,国内经济底层逻辑转向新质生产力,人工智能、具身智能、新能源、可控核聚变、量子科技、航空航天等“十五五”重点领域值得关注 [1] - AI算力需求持续扩张推动光模块产业景气度上行,800G产品已进入量产放量期,1.6T产品正成为数据中心突破系统瓶颈的关键路径 [2] - 自2025年起,1.6T将从验证期进入规模化部署阶段,其带宽翻倍、光纤减半、TCO下降等优势使其成为下一代算力网络主流方向,有望开启高速互联产业链的第二轮价值重估周期 [2] - 全球云厂商资本开支延续上行通道,叠加AI集群扩容与新一代算力平台放量,构成核心驱动力 [2] - 科技行业更受益于政策导向,中央经济工作会议明确将科技发展“更交给市场”,重点聚焦京津冀、长三角、粤港澳三大区域,并长期投资于人才 [3] - 科技领域需关注平台经济催生的新需求、新就业形态,以及科技金融服务创新,科技(尤其是AI强产业趋势)被列为十五五规划第一任务中的重点细分领域 [3] 公司动态与产品进展 - 火山引擎在2025冬季FORCE原动力大会上围绕智能体(Agent)的规模化生产与应用落地进行了系统化升级,推出新一代Responses API、上线Serverless RL平台,并增强VikingDB向量数据库及记忆库功能,同时发布并升级了企业级AI Agent平台底座AgentKit [2] - 该全链路支撑体系有效降低企业拼装与集成成本,清晰界定工程边界,确立可预期的上线路径,助力开发团队更聚焦于业务价值创造 [2] ETF产品概况 - 科创50ETF龙头(588060)紧密跟踪上证科创板50成份指数,由科创板中市值大、流动性好的50只证券组成,定位科创板“硬科技龙头”标杆 [7] - 科创100ETF广发(588980)、科创100ETF增强指数基金(588680)紧密跟踪上证科创板100指数,聚焦科创板中市值中等、流动性较好的100家企业,与科创50形成互补,定位科创板“中盘成长新锐”代表,其中科创100ETF增强指数基金(588680)采用量化增强策略力求实现超额收益 [7] - 科创200ETF广发(588140)紧密跟踪上证科创板200指数,选取市值较小且流动性较好的200只证券,反映科创板中小市值企业的整体表现,行业高度集中于信息技术、工业和医药卫生等硬科技领域 [7] - 科创成长ETF(588110)紧密跟踪上证科创板成长指数,选取业绩指标增长率较高的50只上市公司证券,反映科创板具有高成长特征的上市公司证券的整体表现,聚焦“业绩高增长”优质标的 [8] - 双创50ETF增强(588320)紧密跟踪中证科创创业50指数,一键布局科创板与创业板50只头部科技公司,采用量化优化策略争取超越基准 [8] - 市场普遍认为科创板块ETF具有打包投资一篮子科创板龙头股票、当日涨跌幅限制±20%、开户门槛低、盘中交易便利等特点 [6]
Wall Street Brunch: Hooray For DevDay
Seeking Alpha· 2025-10-06 02:16
政府停摆与经济影响 - 政府停摆预计将持续近21天,持续超过15天、20天和25天的概率分别为64%、52%和40% [2][3] - 高盛经济学家指出,政府每停摆一周,将使第四季度年化实际GDP增长率降低约0.15个百分点,停摆结束后将在第一季度产生同等规模的正向增长效应 [4] - 政府停摆导致贸易平衡和每周失业救济金数据再次缺失 [10] 人工智能行业动态 - OpenAI举办DevDay活动,首席执行官Sam Altman发表主题演讲并参与炉边谈话 [5] - OpenAI私人市场估值达到5000亿美元,成为全球最具价值的初创公司 [6] - Wedbush分析师认为科技牛市将持续2-3年,对科技泡沫的担忧被过分夸大,企业支出趋势正在加速 [6] - 市场关注OpenAI可能推出名为Aura的AI驱动浏览器以挑战谷歌Chrome,并期待GPT-5、多模态工具Sora和新API的发布 [5][7] 企业财报与公司动态 - 本周将有5家标普500公司公布第三季度财报,重点包括百事可乐和达美航空 [7] - 分析师预计百事可乐每股收益为2.26美元,营收为238.6亿美元,激进投资者Elliott Management呼吁其进行战略调整 [8] - 达美航空预计每股收益为1.53美元,营收为159.4亿美元,分析师认为其业务执行优于同行且估值存在折价 [9] - 好市多会员将可以半价购买减肥药Wegovy和Ozempic,诺和诺德宣布与好市多药房业务建立新合作伙伴关系 [12] 宏观经济与市场数据 - 联邦公开市场委员会会议纪要将被密切关注,市场对今年内再次加息25个基点的预期概率超过85% [10] - 密歇根大学将公布10月份消费者信心指数初值,上周世界大型企业联合会的消费者信心指数降至五个月低点 [10] - 比特币价格首次突破125,000美元,过去七天中有六天上涨,主要受比特币ETF强劲资金流入和机构兴趣重燃推动 [11] 大宗商品与股息信息 - 欧佩克+原则上同意从11月开始将石油产量每日增加13.7万桶,与此前10月份的温和增产相呼应 [11] - 摩根大通、美元树、甲骨文和AT&T将于本周进行除息日操作,并分别于10月31日、10月21日、10月23日和11月3日派息 [12] 投资主题展望 - 美国银行策略师预测2020年代后半期的投资主题将转向安全、国家干预、人口结构/技术变革和新资产玩法,而全球化、美联储独立性和旧市场宠儿则已过巅峰期 [13] - 具体转变包括人类“出局”而机器人“入局”,量化宽松“出局”而收益率曲线控制“入局”,AI牛市变为AI泡沫,美股“七巨头”让位于中国BATX等 [13]
GPT-5差评启示录:用户与AI交互方式还停留在上一个时代
36氪· 2025-08-21 16:49
产品发布与市场反馈 - GPT-5于8月8日正式发布,定位为具有博士水平智能的AI产品,但发布后口碑不佳并引发大量用户退订诉求[1][7] - 官方在发布前下架旧模型,但因使用体验问题被迫紧急恢复旧版模型访问权限[1] - 尽管技术测试和跑分显示其优势明显,但用户实际体验中存在严重问题[1] 技术能力与性能表现 - 在数学、真实世界编码、多模态理解和健康领域表现突出,被评测人员称为"理科生"[4][5] - 处理大型代码库重构、复杂Bug修复及从零构建完整应用的能力显著提升,相当于全栈工程师水平[13][14] - Tau-Bench测试(零售场景)分数从73.9%提升至78.2%,体现性能优化[23] - 逻辑推理、常识理解和创造力较旧版本增强,但存在智能不稳定性,简单任务可能出错[5][15] 核心功能演进 - 智能体任务性能:从问答式交互升级为可自主规划步骤、选择工具并持续完成复杂任务的项目管理模式[10][12] - 可引导性:对指令细微差别高度敏感,支持精确控制行为、语气和输出风格[17][18][19] - Responses API新增支持远程连接MCP服务器和图像生成,通过"previous_response_id"实现上下文记忆,降低token消耗成本[20][21][22] 用户交互模式变革 - 需从传统搜索引擎式交互转变为与"数字心智"协作,旧沟通方式导致使用效率低下[8][9] - 新增推理强度(reasoning_effort)和详细度(verbosity)双参数控制系统,分别控制思考深度和回答长度[29][53] - 指令冲突问题显著:严格遵循所有指令的特性导致矛盾指令会引发资源消耗和逻辑混乱[54][56][61] 优化策略与应用场景 - 效率优先场景:通过降低推理强度、设置工具调用预算及提前停止标准来简化输出[29] - 复杂探索场景:提高推理强度并明确困难处理机制,鼓励自主决策[32][33][35] - 代码开发场景:采用"自我反思提示法"先进行需求架构设计再生成代码,提升输出质量[39][42][43] - 风格一致性控制:通过提供详细规则手册确保AI输出与现有项目风格匹配[46] 高阶功能与工具 - 极速模式:在低延迟场景下最小化推理能力以提升速度,但需配合高质量提示词和持久性提醒[69][70][72] - 元提示(Metaprompting):通过AI自我优化提示词设计,降低用户修改负担[73][74] - Prompt optimizer tool官方工具可自动识别指令逻辑冲突问题[65]
科创板人工智能ETF(588930)盘中溢价,芯原股份涨超4%,机构:2025年有望迎来“中国AI”的投资机会
21世纪经济报道· 2025-05-27 09:46
市场表现 - A股三大指数集体低开 科创AI指数跌0.1% [1] - 科创板人工智能ETF(588930)跌0.27% 溢折率0.05% 盘中现溢价交易 [1] - 成分股中芯原股份涨超4% 中邮科技涨超3% 乐鑫科技涨超2% [1] - 上证科创板人工智能指数(950180.CSI)选取30只市值较大且业务涉及AI基础资源、技术及应用的科创板上市公司证券 [1] AI行业动态 - 谷歌I/O开发者大会发布多款AI模型、应用及Agent产品 Gemini系列模型全面升级 [2] - Gemini模型将逐步登陆手机、手表、汽车、电视等多平台 持续赋能终端产品 [2] - OpenAI宣布Responses API支持MCP A2A协议和MCP生态完善将提升AI Agent开发效率及交互能力 [2] 机构观点 - 天风证券指出AI正融入消费级设备 推动人机交互范式变革 建议关注中国头部AI科技企业模型迭代及DeepSeek新模型发布预期 [2] - 华西证券看好AI加速发展 模型能力提升+AI提升企业ROI+AI优化报表等因素将催化前瞻布局AI的企业业绩增长 [2] - 市场空间有望从IT预算进入企业人力预算 带来AI应用企业估值重构 [2]
AI加速落地,算力产业链确定性高
每日经济新闻· 2025-05-27 08:50
通信与半导体行业表现 - 通信ETF(515880)5月26日收涨0.83% [1] - 半导体设备ETF(159516)5月26日收涨1.1% [1] AI大厂动态与模型升级 - 谷歌在I/O开发者大会发布多款AI模型、应用及AI Agent产品,Gemini系列模型全面升级 [3] - Gemini模型将逐步登陆手机、手表、汽车、电视等多平台 [3] - OpenAI宣布Responses API支持MCP,A2A协议和MCP生态完善将提升AI Agent开发效率和交互能力 [3] 海外巨头资本开支情况 - Meta 25Q1 CAPEX为137亿美元(同比+104%,环比-8%),全年指引上调至640~720亿美元(同比+63~84%) [3] - 亚马逊25Q1 CAPEX为263亿美元(同比+74%,环比-7%) [3] - 谷歌25Q1 CAPEX为172亿美元(同比+43%,环比+20%) [3] 国内大厂资本开支加速 - 阿里25Q1 CAPEX为246亿元(同比+120.6%,环比-22.6%),云业务单季度收入301亿元 [4] - 腾讯25Q1 CAPEX为275亿元(同比+91%,环比-25%) [4] 行业趋势与投资机会 - AI大厂持续发布新模型,AI Agent逐步完善,国内外大厂加码资本开支推进IDC建设 [4] - 国产AIDC算力产业链确定性高,通信ETF(515880)和半导体设备ETF(159516)具备长期投资机会 [4]
腾讯研究院AI速递 20250523
腾讯研究院· 2025-05-22 23:09
OpenAI技术更新 - Responses API新增MCP服务支持,开发者可简化外部服务连接流程,无需手动函数调用[1] - 新版API强化安全控制,通过allowed_tools参数和权限管理防止工具滥用[1] - 新增图像生成、Code Interpreter、文件搜索功能,并引入后台模式等新特性[1] 微软开源项目 - 发布Web Agent项目Magentic-UI,支持自动浏览网页和代码操作,用户可实时监控干预[2] - 采用协同规划和执行机制,生成任务计划需用户确认,集成神经样式引擎等创新技术[2] Mistral开源模型 - 发布240亿参数模型Devstral,可在RTX 4090或32GB Mac上运行,SWE-Bench测试得分46.8%超越GPT-4.1-mini[3] - 采用Apache 2.0许可证,商用定价为每百万输入Token 0.10美元,输出Token 0.30美元[3] xAI实时数据API - 推出Live Search API为Grok AI提供实时数据访问,支持X平台和网页内容检索[4][5] - 提供搜索控制功能如结果数量限制和时间范围指定,结合DeepSearch展示推理过程[5] OpenAI硬件布局 - 以65亿美元收购前苹果设计官Jony Ive的硬件团队io,开发AI耳机和可穿戴设备,预计2026年发布[6] - 关联公司LoveFrom将承担ChatGPT界面设计,Ive称此为职业生涯最重要工作[6] 昆仑万维AI办公产品 - 发布天工超级智能体,集成5个专家智能体,支持文档、PPT、表格生成,成本为OpenAI的40%[7] - 基于deep research技术,支持信息溯源和个人知识库构建,已开源相关框架[7] 微软大气AI模型 - 推出大气模型Aurora,计算速度比IFS数值预报系统快5000倍,训练周期仅4-8周[8] - 在空气质量、热带气旋预测中表现优异,采用3D Swin Transformer架构[8] Gartner智能应用原则 - 提出智能应用五大原则:自适应体验、嵌入式智能、自主编排、互联数据和可组合架构[9] - 强调AI需深度嵌入业务逻辑,实现跨系统自然语言交互和自动化流程优化[9] AI编程市场趋势 - AI Coding市场价值约3万亿美元,开发者角色将向产品经理或QA工程师转变[10] - 新范式降低编程门槛,但系统架构等专业知识仍为软件开发核心[10]
OpenAI教你做Agent:2025年,评估标准和如何产品化是Agent的重点
Founder Park· 2025-04-25 21:29
AI Agent技术演进 - 2024年至2025年AI agent的行动能力和交互方式发生质变,头部模型厂商将agentic能力融入模型,成为模型竞赛重点之一 [2] - agent获取信息方式从单次搜索决策模式转变为完全自主的Deep Research模式,能同时打开多个网页节省时间 [3] - OpenAI判断agent可调用的工具数量将在几个月内从10个量级扩展到100个量级 [4] - multi agent系统具备更高可控性和优化潜力,通过任务分拆提升整体工作效率 [5] - vertical agent将直接受益于multi-agent系统发展 [6] 开发者工具与评估 - 开发者需要构建agent评估微调飞轮,通过强化微调能力让模型找到正确tool use路径 [7] - 评估器需能将模型输出与权威资料对比或执行代码验证数学正确性,而非简单字符串比对 [8] - 强化微调方法可推动模型在特定行业深入应用,实现专业化能力提升 [20] - 目前AI领域核心问题是评分机制,如何构建高质量任务和评分器成为重要课题 [21] Computer Use创新 - Computer Use处于早期阶段,VM(虚拟机)需要开发者填补空白,可能出现专门做iPhone VM的公司 [10] - computer use应用场景包括无API的传统软件系统自动化,如医疗行业手工操作和Google Maps街景分析 [22] - BrowserBase和Scrapybara等公司提供computer use模型托管服务,开发者可便捷访问底层控制 [25][26] - Arc浏览器开发的Dia项目将agent深度集成到浏览器中,成为浏览器本身的一部分 [29] 开发者实践与API设计 - multi agent系统通过任务分拆使调试更独立,降低修改风险 [31][33] - OpenAI采用"阶梯式API"设计理念,平衡易用性与可定制性,如向量搜索默认配置可逐步调整 [34] - Assistants API的tool use功能(如文件搜索)找到市场契合点,但使用门槛过高需优化 [36] - Responses API优化多轮交互体验,与MCP生态互补,需深入思考如何更好整合 [37] 行业应用与前景 - AI infra公司垂直化发展仍有市场需求,如Runloop AI为AI coding初创企业提供测试虚拟机 [38] - computer use在网络安全领域应用,如探测网站系统漏洞 [42] - 模型在科学研究领域应用被低估,可能加速科研进程 [53] - 旅游行业存在创新机会,期待AI agent打破传统格局 [56]