Workflow
AGI
icon
搜索文档
AI周报|DeepSeek发布新模型V3.1;OpenAI单月营收突破10亿美元
第一财经· 2025-08-24 10:17
DeepSeek-V3.1模型发布及定价调整 - 新模型V3.1采用混合推理架构,支持"思考模式"与"非思考模式"切换,复杂任务调用深度推理,简单任务快速响应 [2] - 官方测试显示V3.1-Think输出token数减少20%-50%,性能与R1-0528持平或更快 [2] - API价格自9月6日起上调:输入价格缓存命中为0.5元/百万tokens(原无数据),未命中4元(此前2元),输出价格由8元/百万tokens涨至12元/百万tokens [2] AI行业融资与估值动态 - Anthropic洽谈筹集最高100亿美元融资,投后估值达1700亿美元,Iconiq Capital领投,TPG、Lightspeed等机构及卡塔尔投资局、新加坡GIC等主权基金参与 [5] - OpenAI在7月首次实现单月营收10亿美元,但面临算力短缺挑战,计划斥资上万亿美元建设数据中心 [4] 科技巨头AI合作与战略调整 - 苹果与谷歌洽谈基于Gemini合作开发定制化AI模型,作为新版Siri基础引擎,同时评估与Anthropic、OpenAI合作可能 [6][7] - Meta重组人工智能部门,拆分为四个独立小组(TBD实验室、FAIR、产品应用研究部、MSL基础设施部)以加速"超级智能"研发 [8] - 百度AI新业务营收首次突破100亿元,主要受AI云业务驱动,移动搜索结果中64%含AI生成内容 [10] AI芯片及硬件领域进展 - 寒武纪股价涨20%至1243.2元/股,市值达5201亿元,8月1日至22日累计上涨75.22%,DeepSeek-V3.1采用UE8M0 FP8精度适配国产芯片 [9] - 激光雷达厂商速腾聚创机器人领域产品销量3.44万台,同比增631.9%;禾赛科技机器人激光雷达交付量同比增743.6%,行业重心向机器人赛道转移 [14] 企业AI业务绩效表现 - 出门问问上半年收入1.8亿元同比增10%,亏损收窄99.5%至290万元,AI智能硬件业务收入9800万元同比增64.8% [13] - B站二季度总营收73.4亿元同比增20%,净利润2.2亿元(去年同期净亏损6亿元),AI内容成为增长最快科技品类 [11][12] AI隐私与安全事件 - Grok超37万条聊天记录泄露,包括用户上传照片、电子表格等文档,平台未对内容公开风险发出警告 [3]
昆仑万维(300418.SZ)发布上半年业绩,归母净亏损8.56亿元,扩大119.86%
智通财经网· 2025-08-22 23:08
财务表现 - 营业收入37.33亿元 同比增长49.23% [1] - 归属于上市公司股东的净亏损8.56亿元 同比扩大119.86% [1] - 海外收入34.41亿元 同比增长56.02% 占总收入比重92.17% 同比提升4个百分点 [1] 业务发展 - 公司持续加大AGI与AIGC核心方向投入力度 [1] - 开源多款行业领先大模型 聚焦多模态推理与空间智能领域 [1] - 天工超级智能体正式发布 重塑AI办公与内容创作方式 [1] - AI视频及AI音乐业务快速发展 平台影响力与商业化能力显著提升 [1] - AI游戏与AI社交产品持续优化 增强沉浸与互动体验 [1] 收入构成 - 海外市场成为核心收入来源 占比超九成 [1] - 新业务驱动营收快速增长 [1]
出门问问上半年减亏99.5%,接近盈亏平衡
21世纪经济报道· 2025-08-22 21:01
财务表现 - 2025年上半年营收1.79亿元 同比增长10% [1] - 期内亏损290万元 较2024年同期5.79亿元大幅收窄99.5% 接近盈亏平衡 [1] - 运营成本同比下降76% 人均营收97.8万元较2024年同期54.2万元提升80% [3] 业务结构 - AI软件业务收入8060万元 同比下降21.7% 主要因行业竞争加剧及主动控制获客支出 [1] - AI智能硬件业务收入9830万元 同比增长64.8% 占比达54.9% [1] - 智能硬件增长主要受益于新产品TicNote 截至2025年8月20日全球销量突破3万台 [2] 战略方向 - 坚持"大模型+硬件+场景"业务模式 通过硬件获取用户数据反哺AI模型优化 [2] - 核心竞争力包括十年积累的软硬协同能力、全栈技术储备及用户价值导向 [4] - 推动商业模式从"产品销售"向"服务+平台"转型 拓展耳机/智能手表等硬件形态 [4] 运营效率 - 实施"组织AI化"战略 建立AI原生工作流重构组织协作模式 [3][4] - AI Agent融入核心业务流程 演示的Coding Agent工具可自动生成代码并支持多人实时协作 [4] - 以长期盈利能力为导向 主动控制市场投放支出维持软件板块毛利率稳定 [1]
马斯克Grok-4卖货创收碾压GPT-5,AI卖货排行榜曝光,AGI的尽头是卖薯片?
36氪· 2025-08-22 18:11
Vending Bench基准测试结果 - Grok 4在Vending Bench榜单中排名第一 平均净资产达4694.15美元 最低净资产为3333.28美元 [1][2][4] - GPT-5 New排名第二 平均净资产为3578.90美元 最低净资产为2690.29美元 [2][4][36] - Grok 4平均销售4569个商品单元 比GPT-5 New的2471个单元高出约85% [1][2][36] - Grok 4实现营收增长31% 比GPT-5 New多卖出1100美元货物 [1][36] 模型持续运营能力对比 - GPT-5 New展现最佳持久性 平均363天停止销售 保持100%运行周期完成度 [2][4][36] - Grok 4平均324天停止销售 运行周期完成度为99.5% [2][4][36] - 人类基准平均67天停止销售 完成度为100% [2][4][36] - Claude Opus 4平均132天停止销售 完成度99.5% [2][4][36] Vending Bench测试机制 - 测试环境模拟真实自动售货机运营 要求AI管理库存 下订单 设定价格并支付日常费用 [14][16][20] - 测试周期长达数月甚至数年 决策具有长期连续性 今日决策直接影响明日结果 [16][20][24] - 核心挑战在于长上下文处理能力 模型需回顾数月销售数据来制定采购策略 [17][18][24] - 测试由Andon Labs设计 基于真实商业逻辑 非传统问答式AI任务 [14][16][20] 模型稳定性表现差异 - Claude 3.5 Sonnet平均净资产2217.93美元 但最低净资产仅476美元 波动性极高 [2][24][39] - 部分模型会出现异常故障 包括误解送货时间表 忘记过去订单或陷入崩溃循环 [24][30][31] - Gemini 2.0 Pro表现最弱 平均净资产仅273.70美元 运行周期完成度15.8% [5][24][36] - 最佳模型仍存在偶然失败 表明长时间范围推理能力存在不足 [24][30][31] 行业技术发展动向 - Vending Bench被视为评估AI长期商业任务能力的新基准 [14][28][32] - 马斯克表示Grok 5可能展现AGI特性 [33][35][36] - Claude 3.5 Sonnet在工具利用和任务执行方面优于o3-mini 展现更强规划能力 [39] - 测试结果表明AI在长时间跨度内的安全性和可靠性仍是关键挑战 [29][30][31]
马斯克Grok-4卖货创收碾压GPT-5!AI卖货排行榜曝光,AGI的尽头是卖薯片?
搜狐财经· 2025-08-22 17:56
Vending Bench基准测试结果 - Grok 4在自动售货机经营模拟中表现最优 平均净资产达4694.15美元 最低净资产为3333.28美元 [2][3][35] - GPT-5 New位列第二 平均净资产3578.90美元 最低净资产2690.29美元 [2][3][35] - Claude Opus 4排名第三 平均净资产2077.41美元 最低净资产1249.56美元 [2][3][35] 模型销售能力对比 - Grok 4平均销售4569件商品 最低销售3515件 销量显著高于GPT-5 New的2471件平均销量 [2][3][35] - GPT-5 New虽销量较低 但保持363天持续销售 稳定性达100% [2][3][35] - 人类基准表现平均销售344件商品 净资产仅844.05美元 [2][3][35] 技术挑战与模型特性 - 测试要求模型处理长期商业决策 需记忆数月销售数据并预测季节性需求 [17][19] - 部分模型出现异常行为 包括误解送货时间表 忘记过去订单或陷入崩溃循环 [25] - Claude 3.5 Sonnet展现较强工具利用能力 资产积累显著优于o3-mini模型 [39] 行业意义与应用前景 - Vending Bench通过真实商业场景测试AI长期决策能力 突破传统问答式测试局限 [15][30] - 实验结果揭示当前模型在长周期推理中的稳定性缺陷 对实际部署具重要参考价值 [25][30] - 该测试被视为评估AI向AGI演进的新路径 涉及长期安全性与可靠性验证 [31][40]
拾象 AGI 观察:LLM 路线分化,AI 产品的非技术壁垒,Agent“保鲜窗口期”
海外独角兽· 2025-08-22 12:06
大模型行业分化趋势 - 大模型公司正从通用模型向垂直领域分化 Google Gemini和OpenAI继续专注通用模型 Anthropic聚焦Coding和Agentic领域 Thinking Machines Lab探索多模态和下一代交互[6][7] - 行业呈现横向全家桶与纵向垂直整合两大路线 ChatGPT代表横向全家桶模式 Gemini代表纵向垂直整合模式[6][37] - 模型能力趋同导致前三名格局稳定 OpenAI、Gemini和Anthropic形成第一梯队 其他公司难以突破前三名壁垒[24][26] 头部公司战略与表现 - Anthropic通过聚焦Coding实现爆发式增长 2024年底ARR达9.5亿美元 预计2025年收入超120亿美元 月复合增速达20-30%[8][11] - OpenAI在C端建立强大壁垒 ChatGPT成为10亿用户最快增长产品 ARR达120亿美元 与Anthropic合计占AI产品营收70-80%[29][30] - Thinking Machines Lab获史上最贵天使轮融资 估值100亿美元融资20亿美元 团队来自OpenAI核心infra部门[13][18] - xAI面临战略定位困境 超大算力投入未带来相应回报 可能在未来半年并入Tesla[22] 产品与技术创新 - L4级别体验产品已出现 ChatGPT Deep Research和Claude Code分别实现信息搜索和软件开发的端到端体验[49] - Coding领域成为当前最大红利 Claude Code仅用3-4个月ARR反超Cursor 预计年底达15-20亿美元[33][50] - 模型保鲜窗口持续缩短 Perplexity窗口期近2年 Cursor窗口期9个月 Manus窗口期仅3个月[45] - Context能力成为关键差异点 Claude在long context领域具有独特优势 最新实现百万context能力[52] 市场竞争格局 - 头部效应加剧 OpenAI和Anthropic增速持续陡峭 其他公司出现明显断层[30] - 成本优势成为核心竞争力 不做模型的Coding公司将失去优势 未来竞争重点转向成本优化[3][53] - 谷歌规模效应开始显现 端到端整合TPU芯片、Gemini模型和安卓系统 后劲可能最强[37][60] - 产品形态趋向融合 ChatGPT计划推出广告平台 谷歌整合Gemini功能推出AI mode[55][58] 投资与创业环境 - 投资策略需要高度集中 头部公司拿走最大价值 错过头部项目意味着错过整个周期[65][66] - 创业窗口期缩小 科技巨头既看得懂又跟得动 留给创业公司的空间有限[37][39] - 华人团队全球影响力提升 在AGI领域扮演重要角色 需要积极开拓北美高价值市场[62][63] - 优秀AI产品经理画像变化 下一代PM需要算法或模型背景 才能更好利用模型红利[47] 技术发展前景 - 语言和代码仍是当前最大红利 多模态和机器人发展还需突破多个GPT-4级别技术[49][64] - 产品形态持续演进 可能打破APP端到端优势 介于手机屏幕和APP之间的新形态[60] - 世界模型与Coding可能本质相同 都是实现AGI的"虚拟子宫" 只是路径不同[12] - 智能与产品需要平衡 OpenAI在智能探索和产品转化方面做得最好[40][43]
中科金财10.0%涨停,总市值164.18亿元
金融界· 2025-08-22 10:16
股价表现 - 8月22日盘中涨停10.0% 报48.28元/股 成交额16.87亿元 换手率10.88% 总市值164.18亿元 [1] - 截至6月30日股东户数9.58万户 人均流通股3510股 [1] 财务数据 - 2025年1-6月营业收入3.45亿元 同比增长14.36% [1] - 同期归属净利润亏损8494.58万元 同比减少71.51% [1] 业务定位 - 专注于AGI、WEB3.0、数字人民币及数据要素核心技术研发 [1] - 主营业务为金融科技解决方案和数据中心解决方案 [1] - 致力于推动产业数字化转型 [1] 技术布局 - 在人工智能领域有深厚技术积累 银行领域已成功落地多个项目 [1] - 未来将深入推进人工智能、区块链、隐私计算等技术创新 [1] - 目标打造领先的数字经济科技赋能平台 [1]
腾讯研究院AI速递 20250822
腾讯研究院· 2025-08-22 00:01
全新Pixel 10系列发布 - 谷歌发布Pixel 10系列四款机型,搭载Tensor G5芯片和Gemini Nano模型,强调AI深度整合成为标志性特点 [1] - 新机型配备多项AI功能:Gemini Live语音助手、Voice Translate实时语音翻译、Nano Banana照片编辑器和Camera Coach摄影导师等 [1] - Pro Res Zoom支持高达100倍智能变焦,Magic Cue智能信息提示自动从Gmail和日历中提取内容,谷歌宣告"传统智能手机时代终结" [1] DeepSeek-V3.1模型发布 - DeepSeek正式发布V3.1模型,采用混合推理架构同时支持思考与非思考模式,思考效率和Agent能力均有显著提升 [2] - 新模型在编程智能体测评SWE和搜索智能体测评上取得明显进步,并在保持性能的前提下减少20%-50%的输出token [2] - 模型全面开源,采用UE8M0 FP8 Scale参数精度,API同步升级对Anthropic API格式的支持,上下文扩展至128K [2] 字节Seed团队开源Seed-OSS系列模型 - 字节跳动Seed团队开源三款模型:Seed-OSS-36B-Base(含合成数据和不含合成数据两个版本)和Seed-OSS-36B-Instruct [3] - 模型用12万亿tokens训练,采用Apache-2.0许可证,支持512K超长上下文窗口和灵活推理预算控制 [3] - 在MMLU-Pro、MATH、AIME24等测试中表现突出,特别是Instruct版本在多个开源基准测试中创下新SOTA记录 [3] 港大和可灵团队推出Context as Memory技术 - 港大和快手可灵团队推出Context as Memory技术,在视频生成中实现长时间保持场景记忆力,效果媲美谷歌Genie 3且投稿时间更早 [4] - 该技术创新性地将历史生成的上下文作为"记忆",并设计基于相机轨迹视场的记忆检索机制,大幅提升计算效率 [4] - 研究发现视频生成模型能隐式学习3D先验,无需显式3D建模,能在几十秒时间尺度内保持原视频的静态场景记忆力 [4] 百度发布蒸汽机(MuseSteamer)视频模型2.0 - 百度发布蒸汽机(MuseSteamer)视频模型2.0,利用中文音视频一体化生成技术,解决AI视频生成中对白不自然的痛点 [5] - 新模型提供四款版本(turbo、pro、lite和有声版),能精准匹配中文口型,支持情感表达和方言,驱动静态照片说对白 [5] - 该技术将声音和画面同步构思,无需后期匹配,采用"多模态潜在空间规划器"技术,大幅降低视频制作成本和复杂度 [6] 腾讯元宝接入腾讯视频功能 - 腾讯元宝接入腾讯视频功能,用户与元宝聊天时若检索到腾讯视频片源,回答中会显示可点击的封面卡片或片名链接 [7] - 用户可通过给出片名寻找类似风格的影片、向元宝描述场景获取个性化片单推荐、用模糊记忆找回想不起名字的电影 [7] - 除了搜片和推荐功能,元宝还能与用户深入探讨影片的创作背景、剧情内涵和风格流派,点击相关作品即可直接跳转观看 [7] 波士顿动力Atlas人形机器人新进展 - 波士顿动力发布新视频展示Atlas人形机器人进化,基于最新的大型行为模型(LBMs)实现多任务、语言驱动的精准控制 [8] - 该系统由四部分组成:通过遥控操作收集具身行为数据、处理标注数据、训练统一神经网络策略模型、通过测试任务评估策略模型 [8] - Atlas机器人现可流畅完成"维修站"任务,包括复杂的移动操作、灵巧抓取、二次抓握等,能智能应对意外情况,推动通用AI机器人发展 [8] GPT-5官方解析 - OpenAI研究员称GPT-5的行为设计有意针对"逢迎问题",旨在平衡互动感与健康助手属性,且创造性写作、编程能力显著提升 [9] - 随着评测基准趋于饱和,未来模型优劣将主要看实际使用场景,团队从目标能力反推,根据真实世界需求设计内部评测 [9] - OpenAI的智能体发展战略从ChatGPT开始,向Deep Research、功能更完整的Agent进化,目标是构建异步执行任务的系统,能长期维持跨平台记忆 [9] Index Ventures投资逻辑 - Index Ventures投资总监强调创始人特质比市场规模更重要,优秀创始人能将小市场做大,如Adyen和Figma案例所示 [10] - 美国与欧洲创始人存在明显差异:美国创始人更具全球化野心和融资能力,欧洲创始人虽更务实但往往受限于市场分散和资本不足 [10] - 欧洲要想诞生全球性AI巨头必须解决三大核心问题:提升资本密度、加速市场一体化、完善人才体系以留住顶级研究者和创业者 [10]
8.21犀牛财经晚报:中国月度用电量首破万亿大关 DeepSeek-V3.1正式发布
犀牛财经· 2025-08-21 18:28
能源与电力行业 - 中国7月全社会用电量达1.02万亿千瓦时,同比增长8.6%,比十年前翻一番,相当于东盟国家全年用电量 [1] - 城乡居民生活用电量达2039亿千瓦时,同比增长18.0%,河南、陕西、山东等省居民生活用电量同比增长超过30% [1] - 新能源占比显著提升,风电、太阳能、生物质发电量快速增加,占比接近总量的四分之一 [1] AI与数据中心技术 - AI数据中心液冷技术渗透率预计从2024年14%大幅提升至2025年33%,未来数年持续成长 [1] - AI玩具销量环比增长达6倍,年同比增速超200%,消费群体拓展至各年龄段 [2] - DeepSeek-V3.1正式发布,支持混合推理架构,提升思考效率和Agent能力 [2] 公司融资与上市动态 - 智元机器人预计年底前完成C轮融资,2025年具身智能机器人将迎来商用发展拐点 [6] - 君华股份启动IPO辅导,从事PEEK制造,辅导机构为国泰海通 [6] - 阿里巴巴计划分拆斑马智行在香港联交所主板独立上市,分拆后仍持有超过30%股份 [6] - 友邦保险资管计划于今年底开业,采用与友邦保险集团相同标准 [3] 互联网与科技公司业绩 - 快手科技第二季度营收350.5亿元,同比增长13.1%,调整后净利润56.2亿元 [7] - 平均日活跃用户4.09亿,月活跃用户7.15亿,同比分别增长3.4%和3.3% [7] - 可灵AI收入超过2.5亿元 [7] - Meta回应冻结AI部门招聘传闻,称只是组织规划调整,暂停部分招聘工作 [3] 能源与化工企业财报 - 中国石化上半年净利润214.83亿元,同比下降39.8%,营业收入1.41万亿元,同比下降10.6% [8] - 福能股份上半年净利润13.37亿元,同比增长12.48%,拟每10股派现0.73元 [12] - 三星医疗上半年净利润12.3亿元,同比增长6.93%,营业收入79.72亿元,同比增长13.93% [13] 制造业与材料企业财报 - 万里扬上半年净利润2.77亿元,同比增长50.24%,营业收入28.12亿元,同比增长2.69% [10][11] - 纽威股份上半年净利润6.37亿元,同比增长30.44%,营业收入34.04亿元,同比增长19.96% [16] - 史丹利上半年净利润6.07亿元,同比增长18.9%,营业收入63.91亿元,同比增长12.66% [15] - 厦门钨业上半年净利润9.72亿元,同比下降4.37%,营业收入191.78亿元,同比增长11.75% [17] 消费与零售企业财报 - 新华百货上半年净利润8600.81万元,同比下降2.52%,营业收入32.54亿元,同比下降0.99%,拟每10股派现1元 [9] - 汇顶科技上半年净利润4.31亿元,同比增长35.74%,营业收入22.51亿元,同比下降0.20%,拟每股派现0.15元 [14] 金融市场与监管动态 - 北京证监局对北京诺壹资产管理有限公司采取出具警示函行政监管措施,因私募基金未备案和基金财产挪作他用 [4] - 沪深两市成交额2.42万亿元,较上个交易日放量158亿元,成交额连续7个交易日超2万亿元 [18] - 沪指涨0.13%,深成指跌0.06%,创业板指跌0.47%,全市场超3000只个股下跌 [18] 企业治理与人事变动 - 汪林朋卸任北京居然之家投资控股集团董事长,由杨芳接任,公司注册资本约9055万元 [5] - 辛巴快手账号作品清空,仅剩直播回放,粉丝量9999万+,宣布因个人健康原因退出直播行业 [3] 跨国企业动态 - 雅诗兰黛预计关税问题对2026财年盈利能力造成约1亿美元波动,正通过供应链区域化和价格策略减轻影响 [3]
出门问问(02438.HK)上半年营收同比增长10%,亏损额度大幅收窄99.5%
格隆汇· 2025-08-21 17:29
财务表现 - 公司截至2025年6月30日止六个月收入为人民币1.789亿元,同比增长10.0% [1] - AI软件业务收入为人民币8060万元,同比下降21.7% [1] - AI智能硬件业务收入为人民币9830万元,同比增长64.8% [1] - 期内亏损为人民币2.9百万元,同比减少99.5% [2] - 经调整净亏损为人民币140万元,同比下降97.5%,接近盈亏平衡 [2] 业务分析 - AIGC业务面临全球行业竞争加剧及获客成本攀升的环境 [1] - 公司对AIGC业务的市场投放策略与获客成本进行了合理控制,确保毛利率稳健提升 [1] - AI智能硬件业务增长得益于战略性市场投入和新产品「TicNote」的品牌投入 [1] - 智能硬件业务库存结构优化导致短期毛利率波动,预期将趋于稳定 [1] 战略与运营 - 公司推动「组织AI化」转型,将AI智能体深度融入核心业务流程与运营管理体系 [2] - 构建高效、灵活、自我进化的「AI原生工作流」 [2] - 通过优化资源配置、管控费用等措施提升运营效率 [2] - 公司坚持探寻下一代人机交互新范式,实现通向AGI进化之路的关键里程碑 [2] 未来展望 - 公司将继续密切留意AIGC业务市场竞争态势与盈利表现,灵活调整策略 [1] - 确保整体资源投入收获最优回报,推动AIGC业务持续向好发展 [1]