Agent Kit

搜索文档
Sora2 :AI视频的“GPT-3.5”时刻
2025-10-09 10:00
行业与公司 * 涉及的行业为人工智能(AI)行业,特别是生成式AI和视频生成领域 [1] * 涉及的公司包括OpenAI(及其产品Sora、ChatGPT)、Google(及其产品Vue)、字节跳动、阿里巴巴、Uber、TripAdvisor、Shutterstock、快手、可灵(Keling)、吉梦(Jimu)等 [1][2][3][6] 核心观点与论据 **1 OpenAI开发者大会与生态构建** * OpenAI开发者大会推出APP、SDK、Agent Kit和Chat Kit等新工具,展示其商业帝国雏形 [1][2] * 与Uber、TripAdvisor等11家知名企业合作,通过ChatGPT实现自然语言交互,可自动调起合作伙伴的APP [1][3] * MCP协议实现标准化,使OpenAI能快速对接产品服务企业,提供超越传统数据交互的服务(如返回旅游目的地照片、3D装修设计) [1][5] * OpenAI的APP SDK被视为接近基于大语言模型的操作系统或小程序市场,未来想象空间巨大 [6] **2 AI编程与效率提升** * Agent Kit实现拖拽式编程,使非IT开发者也能轻松创建应用,单人5-6分钟完成的应用相当于人工3人1周工作量,人效提升20倍以上 [7][8] * 在头部和二线互联网企业中,超过50%的程序通过AI编写,超过75%的代码通过AI审核 [10] * Code X是一套高级工具,其底层逻辑认为所有事物最终通向通用人工智能(AGI),通过自我编写代码解决问题 [11][12] **3 Sora 2.0 视频生成技术的特点与竞争** * Sora 2.0专注于解决影视动漫工作流的实际问题,与Shutterstock等合作获取高质量视频数据,并与业内专家合作结合传统工作流 [1][13][14] * 通过让视频片段有3到5秒重叠训练模型,能生成1分钟以上长视频,效果优于普遍只能生成10到15秒短视频的其他模型 [16] * 当前使用挑战包括成本(单秒生成价格0.7元至3元不等)和算力不足,通过优化模型和降价策略(如降至1/5)可扩大受众 [17] * 与Google Vue 3相比,Sora风格更超现实(含赛博朋克),Vue 3风格偏向电影纪录片且数据来源包括YouTube等,Vue 3按月收费费用较高,Sora按次收费相对灵活但仍昂贵 [18] **4 应用前景与市场方向** * 未来大模型产品发展方向包括更广泛应用于C端市场,通过授权使用真人肖像实现裂变效应,各大IP(如迪士尼)也可能授权形象创造故事 [3][24] * 视频生成技术在教育、医疗行业应用前景巨大,可实现讲师视频一次拍摄终身复用,解决资源稀缺问题 [21] * 在AI带货、网红经济、短剧等领域,Sora可每天生成数百条不同风格视频,提高真实性和效率,基于物理世界推理生成视频效果较好 [31][32] * AI技术对影视行业有影响,目前可制作1至3分钟预告片,减少分镜师工作量,改善多镜头一致性,AI短剧会更快突破,长篇电影还需时日 [33] **5 行业竞争格局与企业应对策略** * 大模型迭代速度在减缓,知识积累基本完成,更新集中在标注数据时间范围和推理速度优化,应用侧探索更为广泛 [24][25] * 视频生成领域难以一家独大,Sora价格比可灵(Keling)高出三倍以上,企业考虑成本仍倾向使用可灵,可灵在精确控制和一致性方面表现优异 [27][28] * 大模型企业可能对B端软件企业产生影响,B端软件企业应提前布局,将自身业务(如招聘、客户关系管理系统)封装成标准化模块(如GMCP模块),以便被大平台调用,融入生态系统 [35][36][37] 其他重要内容 * Sora Two主要依靠大模型本身能力生成视频,不依赖外部素材,具备对世界知识的理解能力,可推理视频内容合理性 [22] * OpenAI未来发展方向包括培养用户习惯,将自身打造成大入口,可能涉及更多企业联动及硬件入口形式(如眼镜、耳机) [34] * 国内视频生成行业需区分C端(要求快速便捷)和B端(关注高质量、精确控制的一致性)需求 [29]
国投证券-计算机行业周报:海内外科技共振,看好AI产业趋势-251008
新浪财经· 2025-10-08 23:58
炒股就看金麒麟分析师研报,权威,专业,及时,全面,助您挖掘潜力主题机会! 9月29日,DeepSeek正式发布DeepSeek-V3.2-Exp模型,这是一个实验性(Experimental)的版本。作为迈向 新一代架构的中间步骤,V3.2-Exp在V3.1-Terminus的基础上引入了DeepSeek SparseAttention(一种稀疏 注意力机制),针对长文本的训练和推理效率进行了探索性的优化和验证。在新模型的研究过程中,公 司使用高级语言TileLang进行快速原型开发,以支持更深入的探索。此次DeepSeek使用的TileLang是由 北京大学计算机学院杨智副教授团队主导开发的一款开源AI算子编程语言,其核心价值在于能够将高 级别的数据流描述,自动转换并优化为高效的底层代码(如CUDA或AscendC)此外,华为云和寒武纪当 日同时宣布,Day0适配DeepSeek-V3.2-Exp,最大可支持160K长序列上下文长度。 应用侧:Sora2与AppsSDK等发布,OpenAI生态闭环再进一步 10月1日,OpenAI发布了下一代视频生成模型Sora2。新模型在拟真视频效果上有明显提升,并新增音 ...
海内外科技共振,看好AI产业趋势算力侧:openAI与AMD签署数百亿美元芯片交易
国投证券· 2025-10-08 23:15
报告行业投资评级 - 行业投资评级为“领先大市-A” [6] 报告核心观点 - 海内外科技共振,看好 AI 产业趋势 [1] - 建议关注 AI 算力、应用、物理 AI、AIGC、反生成式 AI 等产业的投资机会 [14] 算力侧动态 - OpenAI 与 AMD 签署价值数百亿美元的芯片交易,共同开发基于 AMD 处理器的 AI 数据中心 [1][11] - OpenAI 承诺购买价值 6 千兆瓦的 AI 芯片,合作将从 AMD Instinct MI450 系列及机架级解决方案开始 [1][11] - OpenAI 获得 AMD 认股权证,允许其以每股 1 美分的价格收购该芯片制造商最多 10% 的股份 [1][11] 模型侧进展 - DeepSeek 发布 DeepSeek-V3.2-Exp 模型,引入稀疏注意力机制以优化长文本训练和推理效率 [2][12] - 新模型研发使用北京大学团队开发的开源 AI 算子编程语言 TileLang 进行快速原型开发 [2][12] - 华为云和寒武纪宣布 Day 0 适配 DeepSeek-V3.2-Exp,最大可支持 160K 长序列上下文长度 [2][12] 应用侧生态 - OpenAI 发布下一代视频生成模型 Sora2,拟真效果提升并新增音频生成能力 [3][13] - OpenAI 开发者大会发布 Apps SDK、Agent Kit 和 Codex 等平台级工具,覆盖应用生态、智能代理开发与编程辅助 [3][13] - Apps SDK 允许开发者在 ChatGPT 内构建可交互的付费应用,形成“开发-分发-变现”闭环 [3][13] 市场行情回顾 - 上周计算机行业指数上涨 2.68%,跑赢上证综指 1.25 个百分点,跑赢深证成指 0.28 个百分点 [15] - 计算机行业指数在中信 30 个行业指数中排名第 8,在 TMT 四大行业中排名第 2 [18] - 年初至今计算机行业指数累计上涨 35.88% [16] 行业重要新闻 - 阿里云通义千问开源 Qwen3-VL-30B-A3B 模型,在多个领域性能媲美 GPT-5-Mini [22] - 量子计算领域首获诺贝尔物理学奖,表彰三位教授在量子隧穿领域的突破性贡献 [22]
OpenAI要成为“AI版苹果”:ChatGPT直接装App变身“操作系统” Agent Kit几分钟开发复杂应用
每日经济新闻· 2025-10-07 15:46
公司核心数据与战略方向 - ChatGPT周活跃用户数达到8亿,较2024年2月的4亿增长100% [1][4] - 开发者社区规模从200万扩展至400万 [1] - API处理能力达到每分钟60亿个token [1] - 公司战略从“模型提供商”向“全栈AI生态构建者”进阶 [1] - 确认正在开发多款AI硬件产品,苹果前首席设计师Jony Ive参与合作 [1][27] 应用生态构建:Apps SDK - 推出Apps SDK,允许开发者在ChatGPT内构建可交互的应用程序,包括付费应用 [5] - 通过Agentic Commerce Protocol实现“开发-分发-变现”闭环 [5] - 用户无需切换应用,在ChatGPT内即可直接调用服务,例如输入“Figma,将草图变成图表”即可使用Figma功能 [5][6] - 已上线的合作伙伴应用包括Booking.com、Expedia、Spotify、Figma、Coursera、Zillow和Canva等 [5] - Apps SDK预览版已向开发者提供,计划在2024年晚些时候推出应用审核发布机制和应用目录 [11] 智能代理开发:Agent Kit - Agent Kit旨在解决AI代理开发中的工具碎片化问题,包含Agent Builder、ChatKit和Evals三大核心组件 [12][13][14] - Agent Builder为可视化画布工具,可通过拖拽节点设计业务流程,演示中8分钟内为活动官网构建智能问答代理 [12][15] - 金融科技公司Ramp借助该工具,将原本需数月的代理构建工作缩短至几小时 [17] - Agent Builder处于测试阶段,ChatKit和评估功能已正式发布,Connector Registry面向部分用户推出Beta版 [17] - 行业趋势显示谷歌和微软等公司也推出了类似的代理开发工具 [17] 编程辅助工具:Codex正式版 - AI编程助手Codex从研究预览版转为正式版,累计已处理40万亿个Token [18] - 新增三项核心功能:Slack集成、Codex SDK和全新管理工具 [18] - Slack集成允许开发者在Slack频道中直接向Codex委派任务 [18] - Codex SDK可将智能体嵌入到自定义工作流和工具中 [18] - 管理工具为工作区管理员提供环境控制、监测和分析仪表盘功能 [18] - Slack集成和Codex SDK面向ChatGPT Plus、Pro、Business、Edu和Enterprise用户开放,新管理功能仅限Business、Edu和Enterprise用户使用 [19] 模型API升级 - GPT-5 Pro正式通过API向所有开发者开放,针对复杂任务的推理、代码质量和指令遵循进行了优化 [21] - 推出GPT Real-time Mini语音模型,价格较此前版本降低70% [21] - 文生视频模型Sora 2开放API预览,提升了对物理定律的理解和指令执行的复杂性 [21] - 美泰公司合作案例显示,Sora 2可将草图快速转化为动态产品概念视频 [22] 资本市场影响 - OpenAI的发布引发相关上市公司股价波动,Figma股价一度大涨近16%,收盘上涨7.39% [23] - HubSpot收涨2.6%,赛富时收涨2.25%,Expedia短线一度拉涨7% [23] - 美泰股价一度拉涨超5% [23] - 市场观点认为这种波动类似于“互联网泡沫时代的狂欢”,部分投资者忽略基本面追逐动量 [26]
OpenAI要成为“AI版苹果”:ChatGPT直接装App,变身“操作系统”,Agent Kit几分钟开发复杂应用,多款AI硬件正在研发
每日经济新闻· 2025-10-07 15:08
每经记者|兰素英 每经编辑|王嘉琦 OpenAI的第一个重磅发布瞄准的是其核心流量入口——周活用户已达8亿的ChatGPT。要知道,在今年2月时,这个数字还是4亿。 而在大会的压轴环节,苹果前首席设计师Jony Ive与阿尔特曼进行了一场"炉边对话"。双方确认,OpenAI正在开发不止一款硬件产品。Jony Ive称,他希望打 造的硬件设备能让用户"感到快乐、充实、更加平和、更少焦虑"。 图片来源:OpenAI开发者大会视频截图 当地时间10月6日,OpenAI开发者大会DevDay在暌违近两年后,终于在旧金山Fort Mason重磅回归。 一开场,OpenAI CEO阿尔特曼就投下一枚"重磅炸弹":ChatGPT周活用户突破8亿,较2月时翻了一倍;开发者社区也从200万扩容至400万;API每分钟处理 60亿个token。 随后,OpenAI高管相继登台,发布了一系列平台级工具和产品更新,包括Apps SDK、Agent Kit和Codex,覆盖应用生态、智能代理开发与编程辅助三大核 心领域。不仅如此,模型API也迎来全面进化,包括强大的GPT-5 Pro和文生视频模型Sora 2。 这标志着OpenAI正 ...