AGI(通用人工智能)

搜索文档
DeepSeek首次披露:理论成本利润率545%!
证券时报· 2025-03-01 16:38
DeepSeek-V3/R1推理系统概览 - 公司首次披露V3/R1推理系统的理论成本和利润率,在GPU租赁成本为2美元/小时的假设下,日总成本为87072美元,理论日收入为562027美元,成本利润率高达545% [1][4][5] - 优化目标聚焦于提升吞吐量和降低延迟,采用大规模跨节点专家并行(EP)技术,通过增加batch size提高GPU矩阵乘法效率,同时分散专家计算以减少访存需求 [2][3] - 系统面临跨节点通信、负载均衡等挑战,公司通过双批次重叠策略和最优负载均衡方案保证高性能与稳定性 [3] 成本控制与定价策略 - 采用动态节点调度机制,白天高峰时段使用278个节点(每节点含8块H800 GPU),夜间低峰时段缩减至平均226.75个节点以降低运营成本 [4] - 实施错峰定价策略,夜间(00:30-08:30)API调用价格大幅下调:V3输入/输出价格降至标准时段的50%(0.25元/百万tokens输入,4元/百万tokens输出),R1降至25% [6] - 标准时段V3与R1的定价差异显著,R1输入/输出价格均为V3的两倍(1元 vs 0.5元输入,16元 vs 8元输出) [6] 行业竞争与市场定位 - 对比OpenAI最新GPT-4.5模型,其输入价格高达75美元/百万tokens,是DeepSeek-V3标准时段的280倍(按汇率换算),引发用户对高定价的质疑 [10] - 公司通过开源周活动连续7天发布技术组件,构建协同系统以最大化GPU利用率,获得国际社区高度评价,被推测技术能力可能超越公开水平 [7][11] - 加速研发中的DeepSeek-R2模型或将提前发布,重点提升多语言推理和代码生成能力,进一步强化行业竞争力 [11] 技术突破与行业影响 - 大规模跨节点专家并行技术实现批处理规模扩展与延迟降低,但需平衡系统复杂度与性能,成为行业技术创新的典型案例 [2][3] - 动态资源调度与错峰定价形成独特商业模式,在保证服务体验的同时优化成本结构 [4][6] - 开源策略与技术透明度显著提升品牌影响力,推动行业对高效推理系统的重新评估 [7][11]
刷新中的阿里:当它不再被认为只是一家电商公司
晚点LatePost· 2025-02-21 23:30
阿里向 "科技 + 零售" 公司转型。 2 月 20 日阿里巴巴发布 2024 年四季报,远超预期的业绩、单日涨超 10% 和一个月内涨近 50% 的股价, 让很多长期关注阿里的人感叹:"这还是阿里吗?" CEO 吴泳铭也不再像过去那样低调,在电话会中回答第一个提问时,就抛出了四个 "最",阿里巴巴集团 是 "最重要 AI 玩家""亚洲最大""规模最大""to C 最多应用场景"。分析师的提问几乎全部围绕 "AI",而此 前的 10 年,电商才是他们最关心的话题。 除了电话会,财报的数据中最值得在意的是,阿里本季度的资本开支 —— 318 亿元,环比增长 80%。吴 泳铭还强调,阿里将加大投入三大 AI 领域,未来三年将是云建设最集中的三年,在云和 AI 的基础设施投 入预计将超越过去十年的总和。这给了资本市场非常大的想象空间,提振了全球投资者对中国科技行业的 投资信心。 过去一年半,是阿里 "重新创业" 的一年半,也是阿里坚定 AI 投入的一年半,这家公司试图向市场提供一 个他们真正认可的新增长故事。 从吴泳铭 2023 年 9 月出任阿里 CEO 后不久提出的 "用户为先,AI 驱动" 战略,到当年互联网 ...
阿里预计未来资本开支超过去十年总和;瑞幸利润微增,迎接成本挑战;游戏和广告让B站连续两个季度盈利丨百亿美元公司动向
晚点LatePost· 2025-02-21 23:30
阿里AI战略与资本开支 - 阿里集团CEO表示AI是几十年一遇的机会 战略第一目标是实现AGI 可能影响或替代全球50%的GDP构成[1] - 阿里具备亚洲最大云服务和自研AI模型 未来三年云和AI基础设施投入将超3800亿元 为过去十年总和[1] - 阿里股价年初至今上涨49% 财报发布后盘前涨超10%至138.2港元[1] 瑞幸咖啡经营状况 - 瑞幸去年营收增长近40%至344.7亿元 但净利润仅微增至29.3亿元 自营门店同店销售增长率为-16.7%[2] - 四季度配送费用和营销费用同比分别增长79%和43% 部分单品涨价2-3元 9.9元专区仅限基本款[2] B站盈利情况 - B站连续两个季度盈利 四季度调整后净利润4.5亿元 美国会计准则下净利润8900万元[3] - 去年收入268.3亿元 全年亏损13.47亿元但同比减亏72% 游戏和广告业务贡献显著[4] - 四季度日活用户1.03亿 日均观看时长99分钟[4] 苹果新产品发布 - 苹果发布入门机型iPhone 16e 搭载A18处理器和自研5G基带 售价4499元起 支持Apple Intelligence功能[5] AI行业动态 - xAI宣布Grok3模型免费开放 当日登顶美区App Store免费榜[6] - DeepSeek否认融资传闻 此前主要研发资金来自创始人旗下量化交易公司[7] 汽车行业并购与业绩 - 海尔18亿美元收购汽车之家42%股份 成为控股股东[8] - 奔驰2024年息税前利润同比下降30% 在华销量下滑6.7% 计划推出专为中国市场开发的车型[9] 新能源汽车进展 - 尊界S800将于5月底上市 预售价100-150万元 搭载4个激光雷达和800V 6C电池包[10] - 乘联会预计2月乘用车零售125万辆 同比增长13.6% 新能源渗透率预计达48%[11] 黄金珠宝行业 - 老铺黄金预计2024年净利润14-15亿元 同比增长236%-260% 新增7家门店[12] - 产品采用古法工艺 定价1-5万元 全国约40家直营店主要位于一线城市核心商圈[13] 航空制造业 - 空客2023年交付766架商用飞机 净利润42.3亿欧元同比增长12% 波音仅交付348架[14]
智联:25%职场人每天工作超十小时;苹果、华为降价换国补;小红书上线一键翻译丨百亿美元公司动向
晚点LatePost· 2025-01-21 21:45
职场满意度与加班情况 - 2024年职场人整体工作满意度为2.72,与2023年持平,薪酬满意度是主要影响因素中最低的[1] - 25.6%的职场人每天工作超10小时,17.6%的人每天工作10-12小时[1] - 服务业、制造业、交通/运输等蓝领行业加班更严重,超3成制造业从业者每日工作超10小时[1] 手机行业补贴动态 - 2025年手机国补上线,iPhone 16 Plus 128G版本从6999元降至5999元,补贴覆盖iPhone15/16及华为Mate60/70系列[2] - 国补首次纳入数码产品,要求单价≤6000元,补贴15%且单件上限500元[2] - 部分品牌通过降价参补换销量,但京东、淘宝部分商品国补后价格仍高于此前大促价[2] 社交媒体与AI技术 - 小红书上线多语种翻译功能,支持网络用语翻译及图片文字提取,仅面向外国用户[3] - OpenAI CEO否认AGI即将推出,称需降低预期100倍,但透露将在数周内发布新推理模型o3 mini[5][6] 加密货币与名人效应 - 特朗普夫妇发行迷因币TRUMP和MELANIA,TRUMP币首发2亿枚,80%由关联实体持有,市值一度飙升至特朗普家族财富4倍[7] - 迷因币被质疑为投机工具,此前马斯克推出的狗狗币也曾引发类似热潮[8] 游戏与互联网公司动态 - 米哈游子公司因侵犯儿童隐私和欺骗性营销指控向FTC支付2000万美元和解,未来将限制16岁以下用户内购[9] - 大窑汽水被传计划赴港IPO募资5亿美元,公司否认但2023年销售额达32亿元[10] 餐饮与汽车行业数据 - 九毛九2023年Q4门店数减少17家至807家,太二酸菜鱼和怂火锅翻台率及日均销售额均下降约20%[11] - 小鹏MONA M03上市5个月交付超6万辆,推动小鹏月销量从1万辆跃升至3.7万辆[14] 新能源汽车与海外战略 - 理想汽车成立德国研发中心,为首个海外研发中心,加速出海布局应对欧盟关税壁垒[12][13] - 奔驰CEO呼吁欧盟鼓励中国车企赴欧建厂,类比当年欧洲车企入华模式解决贸易争端[16][17] 其他行业动态 - 极越汽车员工工资赔偿陆续到账,并对未提车用户启动全额退款[15]
晚点对话李开复|零一万物部分团队并入阿里,“灵魂拷问来得太快了”
晚点LatePost· 2025-01-08 16:36
分享一篇文章。 晚点对话 晚点对话李开复丨他第一个讲了出来,不再追求 AGI 原创 阅读全文 ...
深度 | AI 智能体赛道持续升温,Super Agent还有多远?
深思SenseAI· 2024-10-24 10:17
AI Agent发展趋势 - 2024年被多位科技巨头视为AI Agent发展元年,吴恩达预测AI智能体将推动比下一代基础模型更大的进步[1] - 行业共识认为AI Agent是AI时代的APP,类比移动互联网时代的应用程序[2][6] - 百度CEO李彦宏预测AI智能体数量可能超过人类数量,形成跨行业生态[6] 技术特性与应用场景 - AI Agent具备记忆、规划、行动和使用工具能力,能执行跨应用任务并理解用户行为模式[2] - 典型案例包括Cursor帮助非技术人员8分钟创建网站,文心平台的"躺平之城推荐官"提供城市数据分析[10][11] - 垂直领域应用如"武守恭医生AI分身"整合40年临床经验解决医疗咨询需求[13] 行业竞争现状 - 微软Copilot、Anthropic Claude、OpenAI Canvas等产品显示科技公司加速布局[7] - VC资金大量涌入AI Agent赛道,成为最活跃的投资方向之一[10] - 当前产品功能同质化严重,B端聚焦效率提升,C端侧重生产力解放[10] Super Agent发展瓶颈 - 大语言模型存在长尾推理能力不足和幻觉问题,限制复杂场景应用[12] - 落地场景挖掘困难,需在医疗/法律等高壁垒行业寻找专业锚点[12][13] - OpenAI将AI Agent定位为AGI五级方法的第二级,显示技术成熟度仍需提升[7] 未来展望 - OpenAI高管预测2025年为AI智能体主流化关键节点[15] - 技术演进方向从通用型转向专业化,聚焦垂直领域问题解决[14] - 行业预期从概念炒作转向务实应用,推动实际工作效率提升[15]
对话香港大学马毅:“如果相信只靠 Scaling Laws 就能实现 AGI,你该改行了”
晚点LatePost· 2024-06-04 18:05
马毅的学术观点与研究方向 - 马毅认为当前AI大模型仅实现局部记忆功能,本质是数据压缩而非真正智能,知识不等于智能,智能应能自我纠正和发现新知识[4][5][51] - 反对Scaling Laws路线,认为单纯扩大数据、算力和参数规模无法实现AGI,现有模型依赖记忆和统计而非因果推理[16][17][22] - 提出智能的简约与自洽原则:规律表达需简洁高效(简约),预测需与外部世界一致(自洽),引用爱因斯坦名言作为理论依据[52][53][54] 白盒大模型技术路径 - 团队开发白盒框架CRATE,用数学解释深度学习网络的压缩过程,目标提升效率并超越黑盒模型[33][34][35] - CRATE在同等参数下性能接近ViT(如CRATE-L参数77.64M,ImageNet-1K准确率71.3%,ViT-S参数22.05M准确率72.4%),新版本CRATE-α通过编码优化已媲美ViT[41][43][47] - 白盒模型可降低试错成本,训练资源仅为经验方法的1/3-1/4,算子更稳定且可解释[38][39][49] 行业现状与批判 - AI行业存在同质化问题,过度追逐Scaling Laws导致研究趋同,国内投入规模大但创新不足[19][21][22] - 批评AI威胁论是"无知或别有目的",指出当前模型无自主意识,危险论调可能阻碍创新[26][28][29] - 工业界更关注实用效果而非理论突破,学界与工业界算力差距加剧模型效果分化[8][9][10] 商业化与教育实践 - 创立忆生科技推动白盒路线产业化,公司定位"下一代智能系统",聚焦完整记忆和闭环学习[83][84][85] - 在香港大学设计AI通识课程,面向所有专业学生教授计算思想,强调正确理解AI基础[81][82] - 认为资源应投向有创造力的年轻人,中国需建立支持年轻团队的创新机制[94][95][96] 历史视角与跨学科启发 - 梳理AI历史发现理论重复现象,如去噪扩散模型本质是250年前的拉普拉斯方法[69][70] - 借鉴神经科学发现,猴子大脑的低维编码与白盒压缩结构相似,闭环反馈机制受生物智能启发[70][71][72] - 区分科学家与工程师思维,前者追求必要性(简约),后者接受冗余(经验试错)[73][74][75]