Workflow
Genie 3
icon
搜索文档
GPT-5官宣发布前,谷歌和Anthorpic继续给OpenAI上强度
36氪· 2025-08-07 17:01
划重点: 1、OpenAI 官宣GPT5发布会将于北京时间周五的凌晨1 点开始。目前有三个版本:GPT-5;GPT-5-mini; GPT-5-nano。就在GPT5官宣前, OpenAI的最大竞争对手谷歌和Anthorpic,先后发布重磅新品,把这场AI竞争的强度直接拉满。 2、三个半小时内,谷歌DeepMind发布Genie 3、Anthorpic发布Claude Opus 4.1、OpenAI开源2个推理模型。谷歌Genie 3成为最大赢家,一句话 +分钟级的"世界模拟器"吸足眼球,并且被称为通往AGI关键的一块拼图。 3、OpenAI时隔6年再度开源,但在整体AI进程中略显滞后之态。开源两个性能逼近其闭源SOTA模型的gpt-oss,能帮助OpenAI在开源社区中重 新建立领导地位和话语权。有一点可以肯定:GPT-5只是新战局的起点,而不是终点。 新一代通用世界模型Genie 3:一句话生成可交互3D世界 谷歌DeepMind发布的Genie 3,最大的亮点,就是一句话可以生成逼真的3D世界,像这样: OpenAI 官宣:LIVE5TREAM(直播)将在周四上午 10 点(太平洋时间),也就是北京时间 ...
Aurora Mobile’s GPTBots.ai to Integrate Google DeepMind’s Genie 3 World Model
GlobeNewswire· 2025-08-07 17:00
SHENZHEN, China, Aug. 07, 2025 (GLOBE NEWSWIRE) -- Aurora Mobile Limited (NASDAQ: JG) (“Aurora Mobile” or the “Company”), a leading provider of customer engagement and marketing technology services in China, today announced that its AI agent platform, GPTBots.ai, will integrate Genie 3, the latest general-purpose world model released by Google DeepMind. Through this collaboration, developers will be able to access Genie 3 directly via the GPTBots.ai platform, allowing them to create highly dynamic and physi ...
国内外大模型加速迭代,关注AI多模态应用及AIAgent进展
长城证券· 2025-08-07 12:54
行业投资评级 - 强于大市(维持评级)[3][4] 核心观点 - 国内外大模型加速迭代,AI多模态应用及AI Agent生态有望繁荣[1][2] - 2025年为AI多模态应用及AI Agent商业化元年,建议关注商业化进展[3] - 全球基础大模型能力持续升级,成本下降及效果提升推动应用生态发展[2] 国内外大模型迭代进展 国内动态 - 智谱发布GLM-4 5旗舰模型,在12项基准测试中综合性能达全球开源模型SOTA[1] - 阿里开源通义万相Wan2 2视频生成模型,采用MoE架构节省50%计算资源,参数量27B,激活参数14B[1] 海外动态 - 谷歌DeepMind推出Genie 3世界模型,具备实时交互和环境一致性,适用于游戏和自动驾驶[2] - Anthropic发布Claude Opus 4 1,编程能力SWE-Bench Verified得分74 5%,处理复杂问题效率提升[2] - OpenAI发布开源模型GPT-OSS-120B(需80GB内存)和GPT-OSS-20B(支持16GB设备)[2] AI多模态应用商业化 - 文生图领域美图公司C端(美图秀秀、美颜相机)和B端(美图设计室)产品领先[3] - 快手发布"灵动画布"1 0,预计25Q3推出"工作室会员",全年可灵收入或突破10亿人民币[3] AI Agent商业化落地 - 金蝶国际推出苍穹Agent平台2 0,开发财报分析、ChatBI等5类智能体[6] - 迈富时AI-Agentforce智能体中台覆盖医药、汽车等6大行业,提供全生命周期解决方案[6] 相关标的 - 云计算:阿里巴巴-W、百度集团-SW [6] - AI多模态应用:腾讯控股、美图公司、快手-W等7家公司 [6] - AI Agent:金蝶国际、迈富时、焦点科技 [6]
GPT-5,要来了?
财联社· 2025-08-07 10:58
今日,OpenAI官方账号在社交平台X上发文称,将于太平洋时间周四上午10点(北京时间周五凌晨1点)举办直播活动。值得注意的是,官 方推文巧妙地将"LIVESTREAM"(意为网络直播)一词的字母"S"替换为数字"5",让人不禁联想到此前被大力宣传的GPT-5模型。 市场期待已久的GPT-5,或许即将面世。 尽管无任何资料显示GPT-5将会开源,奥尔特曼在今年2月确实作出承诺,称用户将能免费用上这款模型。而关于GPT-5的具体规格,浙商 证券表示,该模型将整合GPT系列基础模型、o系列推理模型、4o全模态模型三方能力。 近日来,国内外大模型更新层出不穷。谷歌推出通用型世界模型Genie 3,能以每秒24帧的速度实时生成可供自由探索的动态世界,并在 720p分辨率下保持数分钟的画面一致性。Kimi发布了拥有更强代码能力的K2,智谱发布GLM-4.5,以期在推理及Agent能力上取得突破。 中信证券认为, 下一代模型(如GPT-5)将望实现技术、能力、生态的全面发展,模型有望以2-3倍规模实现近10倍智能水平 ,推理性价 比提升一倍以提高应用盈利潜力。 该机构进一步指出,下一代模型基于规模扩增和算法优化,逻辑推理 ...
谷歌发布世界模型Genie 3;微软宣布将OpenAI的gpt-oss模型引入Azure AI Foundry丨AIGC日报
创业邦· 2025-08-07 08:09
微软与OpenAI合作 - 微软宣布将OpenAI的GPT-oss模型引入Azure AI Foundry 用户可通过混合AI灵活组合不同模型优化性能与成本并直接在数据所在位置处理 [1] - OpenAI发布两个开放权重AI模型分别为GPT-oss-120b和GPT-oss-20b [1] 谷歌AI进展 - 谷歌DeepMind发布世界模型Genie 3 可生成实时互动的3D环境 模型能记住物体位置即使用户移开视线后也能准确定位 [2][3] OpenAI估值动态 - OpenAI员工股票二次出售计划显示公司估值达5000亿美元 计划出售价值数十亿美元股票 上一轮融资估值为3000亿美元 [3] 华为开源AI模型 - 华为开源盘古70亿参数稠密模型和盘古Pro MoE 720亿参数混合专家模型 基于昇腾的模型推理技术已上线开源平台 [4] 行业数据服务 - 提供人形机器人商业航天AGI等热门赛道行业图谱和报告 包含2万+LP数据10万+基金数据1万+专精特新小巨人企业数据 [5]
谷歌“世界模拟器”深夜上线!一句话生成3D世界,支持分钟级超长记忆
具身智能之心· 2025-08-07 08:03
谷歌DeepMind Genie 3技术突破 - 新一代通用世界模型Genie 3支持720P画质、每秒24帧实时导航及分钟级一致性保持,性能显著优于Genie 2的360P画质和非实时交互 [3][4][12] - 生成内容具备3D空间一致性,可逐帧创建动态丰富的世界,支持长达57秒的连续场景生成 [5][13] - 能够模拟物理特性(如水面效果)和复杂环境相互作用,并可构建虚拟场景(如童话世界、魔法森林) [14][16][18][20][21] 技术对比与优势 - 横向对比显示Genie 3在分辨率(720P)、交互时长(分钟级)、控制方式(支持文本提示事件)上超越GameNGen、Genie 2等同类模型 [13] - 长期环境一致性表现突出:物体在几分钟内保持物理一致性,视觉记忆可追溯至一分钟前(如雅典建筑场景中树木的一致性) [25][26][28][29] - 支持基于文本提示动态生成事件(如草原背景中替换拖拉机为棕熊,或伦敦河畔添加恐龙) [31][33] 应用与行业影响 - 推动具身智能体研究:与SIMA智能体兼容,可模拟未来事件以支持复杂目标训练(如面包店、农贸市场场景交互) [35][37][38][39][41] - 被行业评价为“通往AGI的关键拼图”,潜在应用包括开放式学习、机器人技术及虚拟环境开发 [9][44] - 目前以研究预览形式开放测试,主要面向专业研究者和创作者 [11] (注:社群推广、论文辅导等非技术内容已按规则跳过)
财信证券晨会纪要-20250807
财信证券· 2025-08-07 07:30
晨会纪要(R3) 晨会纪要 2025 年 08 月 07 日 | 市场数据 | | | | --- | --- | --- | | 指数名称 | 收盘 | 涨跌% | | 上证指数 | 3633.99 | 0.45 | | 深证成指 | 11177.78 | 0.64 | | 创业板指 | 2358.95 | 0.66 | | 科创 50 | 1059.76 | 0.58 | | 北证 50 | 1459.51 | 1.58 | | 沪深 300 | 4113.49 | 0.24 | 上证指数-沪深 300 走势图 黄红卫 分析师 执业证书编号:S0530519010001 huanghongwei@hnchasing.com 周舒鹏 研究助理 -6% 4% 14% 24% 34% 2024-08 2024-11 2025-02 2025-05 上证指数 沪深300 zhoushupeng@hnchasing.com 晨会聚焦 一、财信研究观点 【市场策略】大盘震荡走高,军工、机器人板块活跃 【基金研究】基金数据日跟踪(20250806) 【债券研究】债券市场综述 二、重要财经资讯 【宏观经济】央行公开市场开 ...
腾讯研究院AI速递 20250807
腾讯研究院· 2025-08-07 00:01
生成式AI - Anthropic发布Claude Opus 4 1,提升Agent代理任务、真实世界编码和推理能力,在SWE-bench Verified基准测试中达到74 5%,相比Opus 4提升2个百分点,大幅领先GPT-4 1(54 6%)[1] - OpenAI开源gpt-oss-120b和gpt-oss-20b两款推理模型,性能与o4-mini相当,分别采用117B和21B总参数,原生支持128k上下文长度,gpt-oss-120b可在单个H100 GPU上运行[2] - 谷歌DeepMind发布Genie 3,能一句话生成动态可交互世界,以每秒20-24帧速度实时生成720p画面,支持实时交互且生成内容连贯性可维持数分钟[3] - 谷歌Gemini新增"Storybook"功能,用户简单描述情节即可自动生成10页完整图文故事书,支持多种艺术风格和个性化定制[4] AI竞赛与性能 - 首届Kaggle AI国际象棋竞赛中,Grok 4表现最佳,显示"GM级别"战术策略与速度,与Gemini 2 5 Pro一起挺进半决赛[5] - ElevenLabs发布AI音乐模型Eleven Music,能生成从流行嘻哈到管弦乐各种风格,用户可通过文本prompt精确控制音乐底层乐器、调式、和弦和节奏[6] 人形机器人 - 傅利叶发布第三代人形机器人GR-3,采用柔和淡黄配色和柔性材质,嵌入微表情系统,能通过眼球转动、眨眼和神态表情传达情绪,覆盖导览问答、儿童互动等陪伴交互场景[7] 人机交互技术 - Meta开发的非侵入性表面肌电图(sEMG)技术通过记录放大肌肉神经信号实现实时手势解码和计算机交互,在连续手势控制任务中每秒能够互动0 66次,离散手势识别准确度达89-95%[8] AI智能体发展 - LangChain CEO认为未来会从聊天模式转向"环境化/常驻"智能体,环境化智能体可主动监听事件流并异步行动,多智能体系统是趋势[9] 创业模式 - Gamma以30人团队服务近5000万用户,ARR超5000万美元,采用"球员兼教练"管理模式,招募具有主动性、强学习意愿的"通才"而非"专才"[10][11]
AI日报丨增长神话破灭!价格战”威胁利润率,超微电脑盘后大跌16%
美股研究社· 2025-08-06 18:23
AI对劳动力市场的影响 - 高盛指出生成式AI已开始影响美国劳动力市场 科技行业出现招聘放缓迹象 年轻从业者受冲击最大 但整体就业市场尚未显著受影响因大多数公司未在生产中部署AI [5] 特斯拉联合创始人的电池回收与AI应用 - 特斯拉前首席科技官JB Straubel通过Redwood Materials公司回收电动汽车废旧电池 用于支持AI数据中心 [6][7][8] AMD的AI芯片进展 - AMD提前量产MI350 AI芯片 预计Q3收入增长 年度AI收入有望达数百亿美元 消费者需求超预期 新款芯片应用速度快于公司预期 [9] OpenAI的开源模型策略 - OpenAI发布两款免费开源模型GPT-oss-120b和GPT-oss-20b 支持文本生成但未提供训练数据 对标Meta和Mistral等竞争对手 [9] 谷歌DeepMind的世界模型突破 - 谷歌DeepMind推出Genie 3世界模型 可生成动态交互环境 支持720p分辨率实时导航 一致性和真实感优于前代 是首个允许实时交互的世界模型 [9] 超微电脑的业绩困境 - 超微电脑Q4营收57.6亿美元同比增7.5% 调整后每股收益0.41美元 均低于预期 下季度营收指引60-70亿美元显著低于预期 运营利润率仅5%远低于预期的7% 面临库存积压和定价压力双重挑战 [10] 科技巨头的AI增长潜力 - Wedbush看好Nvidia、Meta、微软、Palantir和特斯拉 认为微软、Meta、Alphabet和Palantir描绘了AI革命乐观故事 华尔街低估七大巨头AI增长潜力 [14][15] - 分析师预计未来3年企业和政府AI支出将达2万亿美元 2025年是生成式AI规模化转折点 Nvidia、Palantir、Meta和微软被视为AI革命核心标的 [15][16]
计算机行业重大事项点评:Genie3实现世界交互,AGI迈出关键一步
华创证券· 2025-08-06 17:34
行业投资评级 - 计算机行业评级为"推荐"(维持)[5] 核心观点 - Genie 3 实现实时交互模拟能力,可生成高度多样化的虚拟环境,标志着AGI迈出关键一步 [2] - Genie 3 基于海量视频数据集训练,支持720p分辨率、24fps帧率下实时生成高自由度动态三维场景,并能回溯长达一分钟的历史时序信息 [9] - 引入Promptable World Events功能,支持文本构建多样化虚构世界,允许实时调整环境参数和添加新角色 [9] - Genie 3 与Gemini大模型系列未来将深度整合,通过协同工作机制执行新型任务 [9] - 海内外世界模型加速突破,OpenAI的Sora支持1080p高分辨率、60秒时长视频生成,腾讯混元团队发布HunyuanWorld 1.0实现高质量可交互3D场景 [9] 行业数据 - 计算机行业股票家数337只,占总市值4.68%(50,833.86亿元),流通市值占比5.16%(44,617.66亿元)[6] - 行业绝对表现:1个月9.1%,6个月12.5%,12个月77.7%;相对表现分别超基准6.1%、4.4%、54.9% [7] 投资标的 国内企业 - 企业级服务:金山办公、合合信息、福昕软件等办公软件;迈富时、明源云等营销服务;金蝶国际ERP;泛微网络OA;万兴科技等多模态应用 [9] - 行业场景:金融(恒生电子、同花顺)、教育(科大讯飞)、医疗(卫宁健康)、工业(华大九天)、军用(中科星图)等 [9] 海外企业 - 办公(MSFT)、金融(AFRM)、工业(CDNS)、医疗(TEM)、创意(ADOBE)、电商(SHOP)、企业服务(CRM)、安全(PANW)、云服务(AMZN)等 [9] 技术突破 - Genie 3 采用单智能体架构,未来将优化多Agent代理交互机制 [9] - 国际模型如Sora采用时空Patch统一表征技术,国内HunyuanWorld 1.0融合全景图像合成与分层3D重建技术 [9]