Workflow
大语言模型
icon
搜索文档
27亿美元天价回归,谷歌最贵“叛徒”、Transformer作者揭秘AGI下一步
36氪· 2025-09-22 16:48
大模型核心需求 - 大模型最核心需求是算力 具体表现为更多FLOPS意味着更好性能 [5][9][21] - 内存容量和带宽对模型结构灵活性至关重要 不足会限制非线性层添加 [24][26] - 网络带宽是关键但常被忽视因素 影响分布式训练和推理时参数访问速度 [27][28] 硬件资源需求 - 计算资源需求急剧增长 从2015年32个GPU训练发展到需要数十万个GPU [12] - 内存系统需要多层次优化 包括片上SRAM、HBM和DRAM等中高速缓存 [14][26] - 集群需要更大更快设备 更大内存带宽直接决定推理速度 [15][28] 精度与性能平衡 - 低精度运算成为趋势 可使用8-bit甚至4-bit换取更多FLOPs [32][33] - 需确保训练精度足够和推理误差小 accumulator使用更高精度或进行裁剪防止溢出 [34][40] - 可重复性至关重要 除非获得10倍性能否则不应牺牲确定性 [35][39] AI技术发展路径 - AI发展处于早期阶段 当前LLM只是单步预测引擎 [47] - 未来将加入持久记忆和长期预测能力 发展为具备完整规划能力的行动型AI [48] - 技术飞跃可能在2026年底前实现 一切都将发生深刻变化 [49] 行业影响与社会挑战 - AI将导致大规模失业潮 未来20年内白领认知劳动将被高效替代 [52] - 需要政府通过税收等再分配机制缓冲社会巨变 [52] - 面临"遏制困境"挑战 当执行想法成本趋近零时可能引发大量冲突 [54][55] 安全与治理框架 - 设定四条不可逾越红线:递归式自我改进、自主设定目标、获取自身资源、在世界上自主行动 [56] - AI存在于物理数据中心 可通过"拔掉电源"方式控制 [56] - 需要建立识别和集体决策机制来应对可能出现的失控情况 [56]
美股异动|百度盘前涨超3% 海通国际上调其估值 予目标价188美元
格隆汇· 2025-09-22 16:40
股价表现 - 港股百度逆势收涨超3% 带动美股盘前涨超3%至139.59美元[1] - 美股盘前涨幅达3.13% 上涨4.24美元[2] - 总市值465.29亿美元 市盈率(TTM)12.36倍[2] 估值调整 - 海通国际将估值方法从市盈率改为分部估值法 因应新任CFO提出释放隐藏资产策略[1] - 新目标价定为每股ADR 188美元 对应2025财年22倍市盈率[1] - 综合企业折让45%后得出总估值640亿美元[1] 战略转型 - 公司在大语言模型浪潮下重塑传统业务 包括调整搜寻业务及丰富AI SaaS产品[1] - 寻求云端市场超越机会 提供具成本效益且高可靠性的云端基础设施[1] - 致力于打造开放的基础模型生态系统[1] 交易数据 - 当日最高价138.18美元 最低价134.86美元 振幅2.46%[2] - 成交量766.49万股 成交额10.43亿美元[2] - 流通市值373.61亿美元 换手率2.78%[2]
美团发布高效推理模型LongCat
环球网· 2025-09-22 16:09
技术能力突破 - 增强智能体自主调用工具能力并扩展形式化定理证明能力 [3] - 成为国内首个同时具备深度思考+工具调用与非形式化+形式化推理能力的大语言模型 [3] - 在高复杂度任务(如数学、代码、智能体任务)处理上具备显著优势 [3] 开源与平台部署 - 已在HuggingFace、Github全面开源 [3] - 用户可通过官网直接体验模型功能 [3]
美团发布高效推理模型LongCat-Flash-Thinking,聚焦高复杂度任务
环球网· 2025-09-22 16:02
技术能力 - 增强智能体自主调用工具能力并扩展形式化定理证明能力 [3] - 成为国内首个同时具备深度思考+工具调用与非形式化+形式化推理能力的大语言模型 [3] - 在高复杂度任务(如数学、代码、智能体任务)处理上具备显著优势 [3] 开源与体验 - 已在HuggingFace、Github全面开源 [3] - 用户可在官网体验 [3]
AI无处不在的小应用,与行业发展的大困局
虎嗅· 2025-09-22 15:07
前段时间重点关注AI领域的新突破,结果众多大厂的新版本都低于预期,许多新技术和理念禁不起推 敲,目前的窘境不由得使我对未来发展多了一丝担忧。 阿朱说,如今的AI能听、会说、会看、会写,还能交流,所以现在就是AI时代。 我是认可阿朱这个说法的,现在AI可以完成很多辅助性的工作,大幅提升了数字化能力。已经有大量 的案例,就是利用常规的AI工具对数字化系统的输入进行结构化处理。 比如,通过语音和语义识别,在线会议软件将会议过程进行自动转录,法院专用软件将庭审自动生成为 文书,客服系统把用户的语音内容自动转化并进行结构化分类和处理,客户经理用语音方式回顾走访客 户的过程,由系统转化为结构化的走访记录,并以此为基础自动完成客户画像、梳理商机等动作。 比如,一线人员对服务现场进行拍照,系统自动进行图像识别,完成数据采集和录入工作,既减轻了一 线人员的工作负荷,又大幅提高了数据的准确性。 但在参加几次AI落地实践有关的交流后,我对AI的态度又变得乐观了:AI已经大面积铺开,在千行百 业发挥着作用,潜移默化地在改变我们的世界。 用简单的AI能力破解数字化难题 什么样的系统才算是AI系统? 有专业人士觉得,AI是高科技领域的创 ...
美团(03690)发布高效推理模型LongCat-Flash-Thinking
智通财经网· 2025-09-22 14:40
公司技术发布 - 美团于9月22日发布高效推理模型LongCat-Flash-Thinking [1] - 模型在HuggingFace和Github平台全面开源 [1] 技术性能表现 - 基于AIME25实测数据 模型在确保90%准确率前提下比不使用工具调用节省64.5%的Tokens [1] - 在逻辑、数学、代码、智能体等多个领域推理任务中达到全球开源模型最先进水平(SOTA) [1] - 在超高复杂度任务(如数学、代码、智能体任务)处理上具备显著优势 [1] 技术能力突破 - 增强智能体自主调用工具能力并扩展形式化定理证明能力 [1] - 成为国内首个同时具备"深度思考+工具调用"与"非形式化+形式化"推理能力相结合的大语言模型 [1]
美团发布高效推理模型,部分任务性能接近GPT5
新浪科技· 2025-09-22 14:10
模型性能特点 - 新模型保持龙猫模型一贯"快"的特点 [1] - 在逻辑、数学、代码、智能体等多个领域的推理任务中达到全球开源模型最先进水平(SOTA) [1] - 部分任务性能接近闭源模型GPT5-Thinking [1] 技术能力突破 - 增强智能体自主调用工具的能力 [1] - 扩展形式化定理证明能力 [1] - 成为国内首个同时具备"深度思考+工具调用"与"非形式化+形式化"推理能力相结合的大语言模型 [1] 应用领域优势 - 在高复杂度的任务(如数学、代码、智能体任务)处理上具备显著优势 [1] 开源与发布信息 - 已在HuggingFace、Github全面开源 [1] - 在官网可体验 [1]
Gemini 数据好过chatgpt
小熊跑的快· 2025-09-21 19:30
大模型应用与算力需求 - 生成式AI应用ChatGPT的日活跃用户数增长已进入平台期,趋势走平 [2] - 谷歌的Gemini与Anthropic的Claude等竞争对手的用户增长势头依然强劲,仍在冲刺阶段 [2] 云端AI算力租赁市场动态 - 亚马逊云科技AWS提供的基于NVIDIA A10 GPU的实例租赁价格表现相对坚挺,市场状况较好 [4] - 微软Azure云提供的多种基于NVIDIA A10 GPU的实例(如Standard_NV18ads_A10_v5, Standard_NV36adms_A10_v5等)租赁价格近期呈现上涨趋势 [5]
中国公司全球化周报|DeepSeek-R1成为全球首个经过同行评审的主流大语言模型/曼格纳与小鹏汽车达成整车组装合约
36氪· 2025-09-21 14:54
公司动态 - DeepSeek团队论文登上《自然》封面 披露更多模型训练细节并回应蒸馏质疑 成为全球首个经过同行评审的主流大语言模型[2] - 阿里团队上线全球首个AI Agent交易市场MuleRun 面向所有用户开放 同时发布全球AI Agent Creator支持计划[2] - 曼格纳国际与小鹏汽车就欧洲市场达成整车组装合约 计划2025年第三季度启动生产 系曼格纳首次为中国汽车制造商提供整车组装项目[2] - 吉利银河星舰7 EM-i登陆澳大利亚市场 系吉利在澳洲推出的第二款智能电动车 品牌销量环比增速超50% 已建立47家经销商门店覆盖全境[3] - 文远知行与Grab合作在新加坡推出自动驾驶汽车服务 初期涵盖11辆汽车 小马智行同期宣布与康福德高合作在榜鹅地区推出自动驾驶服务[3] - 滴滴旗下99在巴西追加20亿雷亚尔(约26亿元人民币)投资外卖平台99Food 计划年底前覆盖15座城市 2026年1月再新增20个城市[4] - 美团旗下Keeta在科威特启动运营 系中东第三站 沙特地区已覆盖20多个城市并成为最受欢迎外卖平台之一[4] - TikTok Shop东南亚平台将自2025年9月15日起加强内容原创性审核 对非原创内容实施冻结佣金及取消流量扶持等措施[4] 跨境支付与金融合作 - 沙特央行与蚂蚁国际签署协议 预计2026年在沙特全国支付系统开通Alipay+跨境支付服务[5] 资源开发与制造业 - 紫金矿业阿根廷3Q锂盐湖年产2万吨碳酸锂项目正式投产[6] 投融资活动 - 医鹭久歌完成数千万元人民币B轮融资 由永丰县母基金和梅花创投联合投资 计划未来十年在100个国家建立200个海外仓并派驻超5000名海外人员[6] - 恩瑞恺诺完成逾2亿元人民币A轮融资 由深创投、横琴创投及松禾资本领投 资金用于推进核心管线临床试验及国际化布局[6] - 青昀新材完成数亿元人民币C轮融资 由元禾璞华领投 资金用于新一代鲲纶超材料研发及全球化产能扩张[7] - 坚蛋运动完成数千万元人民币B轮融资 由上海宥世基金和动潮投资共同投资 资金用于智能化升级及海外市场开拓 目前门店超400家覆盖60多个城市[7] 政策监管 - 泰国贸易竞争委员会推进数字电商平台新监管指南 重点禁止低于成本定价及强制使用指定物流等行为 预计2025年10月前颁布[7] 媒体服务 - KrASIA英文媒体服务面向中国出海企业 读者中60%为东南亚核心国家商业人群 通过彭博终端等平台提升企业全球品牌[8] 行业社群 - 36氪出海学习交流群已吸引超17,000位出海人加入 提供每日跨境资讯及交流活动[9]
谷歌Gemini IMO和ICPC夺金功臣之一被xAI挖走,马斯克直呼:起飞
机器之心· 2025-09-21 13:26
行业人才流动趋势 - 特斯拉Optimus AI团队负责人Ashish Kumar被Meta挖走 [2] - 谷歌DeepMind资深研究科学家Dustin Tran被xAI挖走 [2][5] - 马斯克在社交媒体公开祝贺新成员加入并用火箭符号表示"起飞啦" [3] 核心人才背景与贡献 - Dustin Tran在谷歌DeepMind工作近9年 离职前担任资深首席研究员 [5] - 是谷歌Gemini-0801共同创造者 该模型是谷歌首个在LMSYS登顶的模型 [5] - 作为Gemini 2.5系列模型评测专家 在WebDev Arena和HLE等榜单取得第一名 [5] - 参与Gemini 1/1.5/2/2.5核心开发 涵盖强化学习、评测与数据等基础环节 [5] - 主导Gemini后训练评测 在100天内完成追赶并成功发布 带领团队登顶LMArena并保持一年多 [7] - 参与Gemini推理突破性创新 在IMO与ICPC中夺得金牌 [7] 技术发展历程 - 从LaMDA模型进化到通过RLHF生成长篇有内容回答的聊天机器人 [9] - 通过长链思维训练和全新环境推动推理与深度思考能力 [9] - 初期外界舆论普遍不看好 认为谷歌会因搜索历史包袱和组织政治而失败 [9] - 最终Gemini在用户偏好上稳定占据第一并引领科学突破 [10] 行业竞争格局 - OpenAI曾通过抢先宣布消息方式抢占AI舆论周期 [10] - 目前认为OpenAI的想法储备已经见底 [10] - xAI认为算力、数据及约100位聪明勤奋人员足以训练前沿大语言模型 [12] - xAI人均芯片拥有量超过谷歌 即将投入10万块GB200与30万块芯片 [12] - Grok 4在强化学习和后训练规模化方面做出最大押注 [12] 技术性能表现 - Grok 4 Fast在LMArena排名第8 而Gemini 2.5 Flash仅排第18 [12] - 在AIME等核心推理评测中表现与Grok 4相当 但成本降低15倍 [12] - 根据评测数据 Grok-4-fast得分为1421分 Grok-4-0709得分为1420分 [13] - 模型排名显示OpenAI的gpt-4.5-preview以1441分位居榜首 [13]