Workflow
OpenAI Sora
icon
搜索文档
美科技巨头角逐五角大楼大单,向AI要营收 | 企服国际观察
钛媒体APP· 2025-07-08 11:43
图片来源@unsplash 上月,OpenAI与美国国防部签署了一份价值2亿美元为期一年的合同订单。根据该合同,OpenAI将为其 提供AI工具,以应对作战和企业领域的关键国家安全挑战。美国国防部表示:"根据该合同,履约方将 开发原型前沿AI能力,以应对作战和企业领域的关键国家安全挑战。" 近年来,美国白宫及五角大楼与硅谷多家巨头科技公司签订合同协议,从颇有争议的百亿美元云计算大 单,到聚焦生成式AI在军事领域的应用拓展,市场潜力虽巨大,但诸多政策、原则、合作策略上的转 变,致使政府订单采购市场的争夺,变得愈发激烈。 拉近政府关系的,不止有老牌巨头 最先吃上政府铁饭碗的是大数据厂商Palantir。20年前成立之初,Palantir就服务于CIA等情报机关,为其 提供辅助分析服务,随后多年将其服务机构扩展到多个美国政府机关、军方,以及商业领域。 得益于这一点,Palantir近些年持续实现业务收入强劲增长,2024年至今,该公司股价实现飙升,最高 涨幅超过7倍。其收入60%来自于政府业务,作为Project Maven项目的主要承接单位,Palantir在2024年 与美国国防部签署了更大的合同,以扩展该项目 ...
Adobe(ADBE.US)掀起“AI+创意软件风暴”! AI驱动业绩与展望超预期
智通财经网· 2025-06-13 08:29
公司业绩与展望 - 公司预计2025财年第三财季整体销售额将达到58.8亿至59.3亿美元,高于华尔街分析师平均预期的58.8亿美元 [1] - 公司预计Non-GAAP准则下每股利润为5.15至5.20美元,高于华尔街平均预期的5.11美元 [1] - 2025财年第二财季整体销售额同比增长11%至58.7亿美元,高于华尔街预期的58亿美元 [8] - 第二财季Non-GAAP每股利润为5.06美元,超过华尔街预期的4.98美元 [8] AI战略与产品进展 - 公司推出基于AI视频生成器的单独订阅服务,直接对标OpenAI Sora和Runway等竞品 [2] - Firefly AI系列已被使用超过240亿次,生成逾240亿单元AI内容,较3月的200亿次显著增加 [3] - 公司推出Firefly Video Model和"Text-to-Video"功能,已嵌入Premiere Pro等核心工作流程 [9] - Firefly Video Model聚焦短片与创意片段生产,尚未达到Sora级长时复杂叙事效果 [9] - 公司强调其AI大模型训练数据来自授权或自有素材,便于商业化合规使用 [10] 业务部门表现 - 数字媒体业务部门销售额同比增长11%至43.5亿美元,年化经常性营收达181亿美元 [8] - 营销与分析软件部门销售额同比增长10%至14.6亿美元 [8] 行业趋势与竞争格局 - 公司被视为投资者讨论AI应用软件是否会颠覆传统软件巨头业绩的核心焦点 [2] - 行业正经历"AI应用浪潮",投资者押注软件公司未来业绩将大幅增长 [11] - 企业调查显示AI软件类支出占企业软件预算比例预计将从2025年的27.7%升至2026年的31.6% [16] - 公司以"版权合规+工作流整合"策略与Sora、Runway等AI新贵竞争 [11] 市场反应与估值 - 公司股价在盘后交易中一度大涨超6%,但最终回落至下跌超1% [6] - 今年以来公司股价下跌约7%,跑输涨超2%的标普500指数 [6]
AI生图迎来大升级:图像编辑达到像素级!背后团队大多来自Stable Diffusion模型基础技术发明团队
AI前线· 2025-05-30 13:38
公司动态 - Black Forest Labs(BFL)发布全新图像生成模型FLUX1 Kontext,支持文本和图像输入实现基于上下文的生成和编辑[1] - 该模型通过流匹配架构统一图像生成和编辑功能,在1MP分辨率下保持3~5秒交互速度,实现跨多轮编辑的顶尖字符一致性[3] - 公司推出BFL Playground供用户测试,并发布两个商业版本FLUX1 Kontext [pro]和[max],已在KreaAI等平台上线[3] 技术特性 - FLUX1 Kontext支持基于参考图像的上下文生成,避免从零开始创作[4] - 四大核心能力包括:角色一致性、局部编辑、风格迁移和低延迟输出(具体数值未披露)[7] - 采用流模型架构,与Diffusion模型技术路线不同,实现更灵活的噪声数据路径学习[19] - 在文生图基准测试中,模型在美观度、提示词遵循性等维度达到顶尖水平[20] 公司背景 - BFL成立于2023年8月,由Stable Diffusion核心开发者Robin Rombach创立,团队包含12名前Stability AI员工[6][14] - 已完成3100万美元种子轮融资,投资方包括General Catalyst和Andreessen Horowitz[6][15] - 目前团队规模30人,正在德国和美国招聘6个远程技术岗位[14] 产品矩阵 - FLUX1 Kontext [pro]定位快速迭代编辑,速度较先进模型快一个数量级[17] - [max]版本在保持速度的同时提升提示词遵循性和编辑一致性[17] - 即将推出12B参数的开放权重版本FLUX1 Kontext [dev][18] 市场反馈 - 用户实测显示模型可在10秒内完成头像生成/编辑,接近实拍效果[23] - 局部编辑能力获认可,能实现像素级修改(如添加绿龙案例)[28] - 此前发布的Flux 11 Pro模型已通过API集成至第三方应用[22] 行业竞争 - 需直面MidJourney、Adobe Firefly等成熟产品的竞争,后者已具备参考图编辑功能[17] - 技术路线差异化为竞争优势,流模型架构区别于主流Diffusion方案[19]
加码多模态能力,夸克发布全新“AI相机”
观察者网· 2025-04-28 17:29
夸克AI相机功能升级 - 公司发布全新AI相机功能"拍照问夸克",基于视觉理解与推理模型创新下一代搜索体验[1] - 功能覆盖旅游(行程制定、景点识别)、文物识别(中外语音讲解)、跨国翻译(菜单翻译)、图像处理(杂物消除、表情调整)及社交文案生成[3] - 生活场景支持故障诊断(电器蓝屏拍照解决方案)、物品购买指导(灯泡/螺丝型号识别)[5] - 健康管理功能包括体检报告解读、用药禁忌查询及定制化食谱生成(如尿酸偏高食谱)[7] - 工作学习场景支持合同补全、图表计算、代码注释复现等[10] 多模态AI行业动态 - 行业竞争聚焦多模态能力,OpenAI推出视频生成工具Sora,谷歌发布跨模态模型Gemini[13] - 国内企业快速跟进:腾讯混元大模型新增视频生成,月之暗面发布Kimi1.5支持跨模态推理,字节豆包1.5实现视觉推理[13] - 公司通过"AI超级框"迭代拓展多模态应用场景,3月发布后持续升级用户体验[12] 技术实现与定位 - 产品定位为阿里巴巴AI旗舰应用,目标打造生活/工作/学习的超级入口[1] - 核心技术依托视觉理解与思考推理模型,实现物理世界问题的交互解答[1] - 交互方式创新体现在拍照即搜索的跨场景应用(旅游/健康/工作等)[3][5][7][10]
11B模型拿下开源视频生成新SOTA!仅用224张GPU训练,训练成本省10倍
量子位· 2025-03-13 11:28
Open-Sora 2.0正式发布。 11B参数规模,性能可直追HunyuanVideo和Step-Video(30B)。 要知道,市面上诸多效果相近的闭源视频生成模型,动辄花费数百万美元训练成本。 而Open-Sora 2.0,将这一数字压缩到了 20万美元 。 同时,此次发布 全面开源模型权重、推理代码及分布式训练全流程 ,开发者们可以看过来! GitHub开源仓库:https://github.com/hpcaitech/Open-Sora 小明 发自 凹非寺 量子位 | 公众号 QbitAI 224张GPU,训出开源视频生成新SOTA! 支持720P、24FPS高画质生成 来看Open-Sora 2.0 Demo。 在动作幅度上 ,可以根据需求设定,更好展现人物或场景的细腻动作。 生成的视频里,男人做俯卧撑动作流畅、幅度合理,和真实世界情况别无二致。 或者是让番茄冲浪这种虚拟场景,水花、叶子船、番茄之间的动作也没有违背物理规律。 画质和流畅度上, 提供 72 0P 高分辨率和 24FPS 流畅度,让最终视频拥有稳定帧率与细节表现。 同时 支持丰富场景切换 ,从乡村景色到自然风光,Open-Sora 2 ...
月访问用户环比激增113%,被低估的可灵AI终于迎来爆发?
雷峰网· 2025-03-07 14:21
自去年6月发布以来,可灵AI已经迭代升级20余次,最新发布的1.6模型在文本响应度、动态质量、模型画 面质量等方面均有明显的效果提升。在大模型测评网站 artificialanalaysis.ai 的排名中,可灵AI位列前 茅,技术实力处于国际第一梯队。 | CREATOR | NAME | ARENA ELO | # APPEARANCES | | --- | --- | --- | --- | | Google | Veo 2 | 1144 | 5,500 | | Kuaishou | Kling 1.5 (Pro) | 1080 | 78,730 | | S OpenAl | OpenAl Sora | 1076 | 98,442 | | MiniMax | MiniMax T2V-01 | 1064 | 122,840 | | Pika Art | Pika 2.0 | 1064 | 61,240 | | Alibaba | Wan 2.1 14B | 1063 | 5,326 | | 80 Kuaishou | Kling 1.6 (Standard) | 1056 | 34,054 | | -19 ...