Workflow
AGI
icon
搜索文档
谷歌大脑之父首次坦白,茶水间闲聊引爆万亿帝国,AI自我突破触及门槛
36氪· 2025-08-25 11:35
个人成长与早期经历 - 童年时期频繁搬家,12年内更换11所学校,培养了适应能力 [7] - 9岁时接触早期Intel 8080计算机套件,通过BASIC语言书籍自学编程 [9][11][13] - 13岁时打印400页游戏源码学习并发编程,完成首个复杂软件移植 [14] - 本科期间接触遗传编程和神经网络,1990年尝试用32处理器并行训练神经网络 [15][17] 神经网络与工程突破 - 90年代提出数据并行/模型并行概念,早于相关术语普及 [8] - 2011年与吴恩达在谷歌茶水间交流后,启动Google Brain项目,目标是用GPU训练超大规模神经网络 [25][26] - 使用2000台计算机(16000核心)训练分布式神经网络,在视觉任务中实现无监督学习,生成"平均猫"图像 [26][27][30] - 无监督模型在Imagenet数据集上使错误率降低60%,监督语音模型在800台机器训练5天后错误率降低30% [30] - 推动定制机器学习硬件TPU开发,支持神经网络规模化应用 [30] 技术演进与核心贡献 - 推动词向量(word2vec)技术,用高维向量表示词汇语义 [32] - 序列到序列模型与LSTM网络应用于机器翻译,提升序列处理能力 [34][36] - 注意力机制与Transformer架构突破,实现n平方复杂度下的高性能序列处理 [38][40] - 谷歌大脑框架被数百个团队采用,支持搜索、广告等核心业务 [26] AI发展现状与未来方向 - LLM在非物理任务上超越普通人表现,但在专业领域尚未达到人类专家水平 [47] - 可解释性研究通过可视化或直接询问模型决策机制推进 [43][44] - 未来突破依赖自动化闭环:自动生成想法、测试、反馈及大规模解决方案搜索 [49] - 强化学习与大规模计算加速科学、工程领域发展,预计影响未来5-20年进程 [49] - 未来5年聚焦开发更强大、成本效益更高的模型,服务数十亿用户 [50] 行业影响与里程碑 - Google Brain项目促成神经网络在谷歌产品中的大规模部署 [26][30] - 纽约时报报道"猫图像"突破,成为AI认知里程碑事件 [27] - TensorFlow与TPU硬件推动行业机器学习基础设施标准化 [1][30]
SpaceX正争取拓展中东机上Wi-Fi业务;国内首台套136吨级纯电动矿用自卸车成功交付用户丨智能制造日报
创业邦· 2025-08-24 11:54
钙钛矿光伏技术 - 全球首个5兆瓦商用级钙钛矿光伏实证基地在青海省共和光伏园区建成投产 标志着钙钛矿光伏技术从实验室阶段迈向规模化示范应用 [2] - 项目将验证钙钛矿光伏在强紫外高辐照环境下的发电性能与可靠性 支撑技术迭代升级 [2] 纯电动矿用装备 - 国内首台套136吨级纯电动矿用自卸车成功交付 集大电量、长续航与快速充电于一体 [2] 燃气轮机技术突破 - 自主研制F级燃气轮机透平一级动叶累计服役等效运行超2000小时 创造国产动叶实际运行时长新纪录 [2] - 透平一级动叶涉及高温合金材料研发设计、精密铸造加工等核心技术工艺 属于重型燃机热端关键零部件 [2] 卫星通信业务拓展 - SpaceX正与中东豪华航空公司磋商星链合作 已与阿联酋航空展开谈判 并与沙特航空进行高级别谈判 [2]
AI周报|DeepSeek发布新模型V3.1;OpenAI单月营收突破10亿美元
第一财经· 2025-08-24 10:17
DeepSeek-V3.1模型发布及定价调整 - 新模型V3.1采用混合推理架构,支持"思考模式"与"非思考模式"切换,复杂任务调用深度推理,简单任务快速响应 [2] - 官方测试显示V3.1-Think输出token数减少20%-50%,性能与R1-0528持平或更快 [2] - API价格自9月6日起上调:输入价格缓存命中为0.5元/百万tokens(原无数据),未命中4元(此前2元),输出价格由8元/百万tokens涨至12元/百万tokens [2] AI行业融资与估值动态 - Anthropic洽谈筹集最高100亿美元融资,投后估值达1700亿美元,Iconiq Capital领投,TPG、Lightspeed等机构及卡塔尔投资局、新加坡GIC等主权基金参与 [5] - OpenAI在7月首次实现单月营收10亿美元,但面临算力短缺挑战,计划斥资上万亿美元建设数据中心 [4] 科技巨头AI合作与战略调整 - 苹果与谷歌洽谈基于Gemini合作开发定制化AI模型,作为新版Siri基础引擎,同时评估与Anthropic、OpenAI合作可能 [6][7] - Meta重组人工智能部门,拆分为四个独立小组(TBD实验室、FAIR、产品应用研究部、MSL基础设施部)以加速"超级智能"研发 [8] - 百度AI新业务营收首次突破100亿元,主要受AI云业务驱动,移动搜索结果中64%含AI生成内容 [10] AI芯片及硬件领域进展 - 寒武纪股价涨20%至1243.2元/股,市值达5201亿元,8月1日至22日累计上涨75.22%,DeepSeek-V3.1采用UE8M0 FP8精度适配国产芯片 [9] - 激光雷达厂商速腾聚创机器人领域产品销量3.44万台,同比增631.9%;禾赛科技机器人激光雷达交付量同比增743.6%,行业重心向机器人赛道转移 [14] 企业AI业务绩效表现 - 出门问问上半年收入1.8亿元同比增10%,亏损收窄99.5%至290万元,AI智能硬件业务收入9800万元同比增64.8% [13] - B站二季度总营收73.4亿元同比增20%,净利润2.2亿元(去年同期净亏损6亿元),AI内容成为增长最快科技品类 [11][12] AI隐私与安全事件 - Grok超37万条聊天记录泄露,包括用户上传照片、电子表格等文档,平台未对内容公开风险发出警告 [3]
昆仑万维(300418.SZ)发布上半年业绩,归母净亏损8.56亿元,扩大119.86%
智通财经网· 2025-08-22 23:08
财务表现 - 营业收入37.33亿元 同比增长49.23% [1] - 归属于上市公司股东的净亏损8.56亿元 同比扩大119.86% [1] - 海外收入34.41亿元 同比增长56.02% 占总收入比重92.17% 同比提升4个百分点 [1] 业务发展 - 公司持续加大AGI与AIGC核心方向投入力度 [1] - 开源多款行业领先大模型 聚焦多模态推理与空间智能领域 [1] - 天工超级智能体正式发布 重塑AI办公与内容创作方式 [1] - AI视频及AI音乐业务快速发展 平台影响力与商业化能力显著提升 [1] - AI游戏与AI社交产品持续优化 增强沉浸与互动体验 [1] 收入构成 - 海外市场成为核心收入来源 占比超九成 [1] - 新业务驱动营收快速增长 [1]
出门问问上半年减亏99.5%,接近盈亏平衡
21世纪经济报道· 2025-08-22 21:01
财务表现 - 2025年上半年营收1.79亿元 同比增长10% [1] - 期内亏损290万元 较2024年同期5.79亿元大幅收窄99.5% 接近盈亏平衡 [1] - 运营成本同比下降76% 人均营收97.8万元较2024年同期54.2万元提升80% [3] 业务结构 - AI软件业务收入8060万元 同比下降21.7% 主要因行业竞争加剧及主动控制获客支出 [1] - AI智能硬件业务收入9830万元 同比增长64.8% 占比达54.9% [1] - 智能硬件增长主要受益于新产品TicNote 截至2025年8月20日全球销量突破3万台 [2] 战略方向 - 坚持"大模型+硬件+场景"业务模式 通过硬件获取用户数据反哺AI模型优化 [2] - 核心竞争力包括十年积累的软硬协同能力、全栈技术储备及用户价值导向 [4] - 推动商业模式从"产品销售"向"服务+平台"转型 拓展耳机/智能手表等硬件形态 [4] 运营效率 - 实施"组织AI化"战略 建立AI原生工作流重构组织协作模式 [3][4] - AI Agent融入核心业务流程 演示的Coding Agent工具可自动生成代码并支持多人实时协作 [4] - 以长期盈利能力为导向 主动控制市场投放支出维持软件板块毛利率稳定 [1]
马斯克Grok-4卖货创收碾压GPT-5,AI卖货排行榜曝光,AGI的尽头是卖薯片?
36氪· 2025-08-22 18:11
Vending Bench基准测试结果 - Grok 4在Vending Bench榜单中排名第一 平均净资产达4694.15美元 最低净资产为3333.28美元 [1][2][4] - GPT-5 New排名第二 平均净资产为3578.90美元 最低净资产为2690.29美元 [2][4][36] - Grok 4平均销售4569个商品单元 比GPT-5 New的2471个单元高出约85% [1][2][36] - Grok 4实现营收增长31% 比GPT-5 New多卖出1100美元货物 [1][36] 模型持续运营能力对比 - GPT-5 New展现最佳持久性 平均363天停止销售 保持100%运行周期完成度 [2][4][36] - Grok 4平均324天停止销售 运行周期完成度为99.5% [2][4][36] - 人类基准平均67天停止销售 完成度为100% [2][4][36] - Claude Opus 4平均132天停止销售 完成度99.5% [2][4][36] Vending Bench测试机制 - 测试环境模拟真实自动售货机运营 要求AI管理库存 下订单 设定价格并支付日常费用 [14][16][20] - 测试周期长达数月甚至数年 决策具有长期连续性 今日决策直接影响明日结果 [16][20][24] - 核心挑战在于长上下文处理能力 模型需回顾数月销售数据来制定采购策略 [17][18][24] - 测试由Andon Labs设计 基于真实商业逻辑 非传统问答式AI任务 [14][16][20] 模型稳定性表现差异 - Claude 3.5 Sonnet平均净资产2217.93美元 但最低净资产仅476美元 波动性极高 [2][24][39] - 部分模型会出现异常故障 包括误解送货时间表 忘记过去订单或陷入崩溃循环 [24][30][31] - Gemini 2.0 Pro表现最弱 平均净资产仅273.70美元 运行周期完成度15.8% [5][24][36] - 最佳模型仍存在偶然失败 表明长时间范围推理能力存在不足 [24][30][31] 行业技术发展动向 - Vending Bench被视为评估AI长期商业任务能力的新基准 [14][28][32] - 马斯克表示Grok 5可能展现AGI特性 [33][35][36] - Claude 3.5 Sonnet在工具利用和任务执行方面优于o3-mini 展现更强规划能力 [39] - 测试结果表明AI在长时间跨度内的安全性和可靠性仍是关键挑战 [29][30][31]
马斯克Grok-4卖货创收碾压GPT-5!AI卖货排行榜曝光,AGI的尽头是卖薯片?
搜狐财经· 2025-08-22 17:56
Vending Bench基准测试结果 - Grok 4在自动售货机经营模拟中表现最优 平均净资产达4694.15美元 最低净资产为3333.28美元 [2][3][35] - GPT-5 New位列第二 平均净资产3578.90美元 最低净资产2690.29美元 [2][3][35] - Claude Opus 4排名第三 平均净资产2077.41美元 最低净资产1249.56美元 [2][3][35] 模型销售能力对比 - Grok 4平均销售4569件商品 最低销售3515件 销量显著高于GPT-5 New的2471件平均销量 [2][3][35] - GPT-5 New虽销量较低 但保持363天持续销售 稳定性达100% [2][3][35] - 人类基准表现平均销售344件商品 净资产仅844.05美元 [2][3][35] 技术挑战与模型特性 - 测试要求模型处理长期商业决策 需记忆数月销售数据并预测季节性需求 [17][19] - 部分模型出现异常行为 包括误解送货时间表 忘记过去订单或陷入崩溃循环 [25] - Claude 3.5 Sonnet展现较强工具利用能力 资产积累显著优于o3-mini模型 [39] 行业意义与应用前景 - Vending Bench通过真实商业场景测试AI长期决策能力 突破传统问答式测试局限 [15][30] - 实验结果揭示当前模型在长周期推理中的稳定性缺陷 对实际部署具重要参考价值 [25][30] - 该测试被视为评估AI向AGI演进的新路径 涉及长期安全性与可靠性验证 [31][40]
拾象 AGI 观察:LLM 路线分化,AI 产品的非技术壁垒,Agent“保鲜窗口期”
海外独角兽· 2025-08-22 12:06
大模型行业分化趋势 - 大模型公司正从通用模型向垂直领域分化 Google Gemini和OpenAI继续专注通用模型 Anthropic聚焦Coding和Agentic领域 Thinking Machines Lab探索多模态和下一代交互[6][7] - 行业呈现横向全家桶与纵向垂直整合两大路线 ChatGPT代表横向全家桶模式 Gemini代表纵向垂直整合模式[6][37] - 模型能力趋同导致前三名格局稳定 OpenAI、Gemini和Anthropic形成第一梯队 其他公司难以突破前三名壁垒[24][26] 头部公司战略与表现 - Anthropic通过聚焦Coding实现爆发式增长 2024年底ARR达9.5亿美元 预计2025年收入超120亿美元 月复合增速达20-30%[8][11] - OpenAI在C端建立强大壁垒 ChatGPT成为10亿用户最快增长产品 ARR达120亿美元 与Anthropic合计占AI产品营收70-80%[29][30] - Thinking Machines Lab获史上最贵天使轮融资 估值100亿美元融资20亿美元 团队来自OpenAI核心infra部门[13][18] - xAI面临战略定位困境 超大算力投入未带来相应回报 可能在未来半年并入Tesla[22] 产品与技术创新 - L4级别体验产品已出现 ChatGPT Deep Research和Claude Code分别实现信息搜索和软件开发的端到端体验[49] - Coding领域成为当前最大红利 Claude Code仅用3-4个月ARR反超Cursor 预计年底达15-20亿美元[33][50] - 模型保鲜窗口持续缩短 Perplexity窗口期近2年 Cursor窗口期9个月 Manus窗口期仅3个月[45] - Context能力成为关键差异点 Claude在long context领域具有独特优势 最新实现百万context能力[52] 市场竞争格局 - 头部效应加剧 OpenAI和Anthropic增速持续陡峭 其他公司出现明显断层[30] - 成本优势成为核心竞争力 不做模型的Coding公司将失去优势 未来竞争重点转向成本优化[3][53] - 谷歌规模效应开始显现 端到端整合TPU芯片、Gemini模型和安卓系统 后劲可能最强[37][60] - 产品形态趋向融合 ChatGPT计划推出广告平台 谷歌整合Gemini功能推出AI mode[55][58] 投资与创业环境 - 投资策略需要高度集中 头部公司拿走最大价值 错过头部项目意味着错过整个周期[65][66] - 创业窗口期缩小 科技巨头既看得懂又跟得动 留给创业公司的空间有限[37][39] - 华人团队全球影响力提升 在AGI领域扮演重要角色 需要积极开拓北美高价值市场[62][63] - 优秀AI产品经理画像变化 下一代PM需要算法或模型背景 才能更好利用模型红利[47] 技术发展前景 - 语言和代码仍是当前最大红利 多模态和机器人发展还需突破多个GPT-4级别技术[49][64] - 产品形态持续演进 可能打破APP端到端优势 介于手机屏幕和APP之间的新形态[60] - 世界模型与Coding可能本质相同 都是实现AGI的"虚拟子宫" 只是路径不同[12] - 智能与产品需要平衡 OpenAI在智能探索和产品转化方面做得最好[40][43]
中科金财10.0%涨停,总市值164.18亿元
金融界· 2025-08-22 10:16
股价表现 - 8月22日盘中涨停10.0% 报48.28元/股 成交额16.87亿元 换手率10.88% 总市值164.18亿元 [1] - 截至6月30日股东户数9.58万户 人均流通股3510股 [1] 财务数据 - 2025年1-6月营业收入3.45亿元 同比增长14.36% [1] - 同期归属净利润亏损8494.58万元 同比减少71.51% [1] 业务定位 - 专注于AGI、WEB3.0、数字人民币及数据要素核心技术研发 [1] - 主营业务为金融科技解决方案和数据中心解决方案 [1] - 致力于推动产业数字化转型 [1] 技术布局 - 在人工智能领域有深厚技术积累 银行领域已成功落地多个项目 [1] - 未来将深入推进人工智能、区块链、隐私计算等技术创新 [1] - 目标打造领先的数字经济科技赋能平台 [1]
腾讯研究院AI速递 20250822
腾讯研究院· 2025-08-22 00:01
全新Pixel 10系列发布 - 谷歌发布Pixel 10系列四款机型,搭载Tensor G5芯片和Gemini Nano模型,强调AI深度整合成为标志性特点 [1] - 新机型配备多项AI功能:Gemini Live语音助手、Voice Translate实时语音翻译、Nano Banana照片编辑器和Camera Coach摄影导师等 [1] - Pro Res Zoom支持高达100倍智能变焦,Magic Cue智能信息提示自动从Gmail和日历中提取内容,谷歌宣告"传统智能手机时代终结" [1] DeepSeek-V3.1模型发布 - DeepSeek正式发布V3.1模型,采用混合推理架构同时支持思考与非思考模式,思考效率和Agent能力均有显著提升 [2] - 新模型在编程智能体测评SWE和搜索智能体测评上取得明显进步,并在保持性能的前提下减少20%-50%的输出token [2] - 模型全面开源,采用UE8M0 FP8 Scale参数精度,API同步升级对Anthropic API格式的支持,上下文扩展至128K [2] 字节Seed团队开源Seed-OSS系列模型 - 字节跳动Seed团队开源三款模型:Seed-OSS-36B-Base(含合成数据和不含合成数据两个版本)和Seed-OSS-36B-Instruct [3] - 模型用12万亿tokens训练,采用Apache-2.0许可证,支持512K超长上下文窗口和灵活推理预算控制 [3] - 在MMLU-Pro、MATH、AIME24等测试中表现突出,特别是Instruct版本在多个开源基准测试中创下新SOTA记录 [3] 港大和可灵团队推出Context as Memory技术 - 港大和快手可灵团队推出Context as Memory技术,在视频生成中实现长时间保持场景记忆力,效果媲美谷歌Genie 3且投稿时间更早 [4] - 该技术创新性地将历史生成的上下文作为"记忆",并设计基于相机轨迹视场的记忆检索机制,大幅提升计算效率 [4] - 研究发现视频生成模型能隐式学习3D先验,无需显式3D建模,能在几十秒时间尺度内保持原视频的静态场景记忆力 [4] 百度发布蒸汽机(MuseSteamer)视频模型2.0 - 百度发布蒸汽机(MuseSteamer)视频模型2.0,利用中文音视频一体化生成技术,解决AI视频生成中对白不自然的痛点 [5] - 新模型提供四款版本(turbo、pro、lite和有声版),能精准匹配中文口型,支持情感表达和方言,驱动静态照片说对白 [5] - 该技术将声音和画面同步构思,无需后期匹配,采用"多模态潜在空间规划器"技术,大幅降低视频制作成本和复杂度 [6] 腾讯元宝接入腾讯视频功能 - 腾讯元宝接入腾讯视频功能,用户与元宝聊天时若检索到腾讯视频片源,回答中会显示可点击的封面卡片或片名链接 [7] - 用户可通过给出片名寻找类似风格的影片、向元宝描述场景获取个性化片单推荐、用模糊记忆找回想不起名字的电影 [7] - 除了搜片和推荐功能,元宝还能与用户深入探讨影片的创作背景、剧情内涵和风格流派,点击相关作品即可直接跳转观看 [7] 波士顿动力Atlas人形机器人新进展 - 波士顿动力发布新视频展示Atlas人形机器人进化,基于最新的大型行为模型(LBMs)实现多任务、语言驱动的精准控制 [8] - 该系统由四部分组成:通过遥控操作收集具身行为数据、处理标注数据、训练统一神经网络策略模型、通过测试任务评估策略模型 [8] - Atlas机器人现可流畅完成"维修站"任务,包括复杂的移动操作、灵巧抓取、二次抓握等,能智能应对意外情况,推动通用AI机器人发展 [8] GPT-5官方解析 - OpenAI研究员称GPT-5的行为设计有意针对"逢迎问题",旨在平衡互动感与健康助手属性,且创造性写作、编程能力显著提升 [9] - 随着评测基准趋于饱和,未来模型优劣将主要看实际使用场景,团队从目标能力反推,根据真实世界需求设计内部评测 [9] - OpenAI的智能体发展战略从ChatGPT开始,向Deep Research、功能更完整的Agent进化,目标是构建异步执行任务的系统,能长期维持跨平台记忆 [9] Index Ventures投资逻辑 - Index Ventures投资总监强调创始人特质比市场规模更重要,优秀创始人能将小市场做大,如Adyen和Figma案例所示 [10] - 美国与欧洲创始人存在明显差异:美国创始人更具全球化野心和融资能力,欧洲创始人虽更务实但往往受限于市场分散和资本不足 [10] - 欧洲要想诞生全球性AI巨头必须解决三大核心问题:提升资本密度、加速市场一体化、完善人才体系以留住顶级研究者和创业者 [10]