Workflow
大语言模型
icon
搜索文档
27亿美元天价回归,谷歌最贵“叛徒”、Transformer作者揭秘AGI下一步
36氪· 2025-09-22 16:48
大模型核心需求 - 大模型最核心需求是算力 具体表现为更多FLOPS意味着更好性能 [5][9][21] - 内存容量和带宽对模型结构灵活性至关重要 不足会限制非线性层添加 [24][26] - 网络带宽是关键但常被忽视因素 影响分布式训练和推理时参数访问速度 [27][28] 硬件资源需求 - 计算资源需求急剧增长 从2015年32个GPU训练发展到需要数十万个GPU [12] - 内存系统需要多层次优化 包括片上SRAM、HBM和DRAM等中高速缓存 [14][26] - 集群需要更大更快设备 更大内存带宽直接决定推理速度 [15][28] 精度与性能平衡 - 低精度运算成为趋势 可使用8-bit甚至4-bit换取更多FLOPs [32][33] - 需确保训练精度足够和推理误差小 accumulator使用更高精度或进行裁剪防止溢出 [34][40] - 可重复性至关重要 除非获得10倍性能否则不应牺牲确定性 [35][39] AI技术发展路径 - AI发展处于早期阶段 当前LLM只是单步预测引擎 [47] - 未来将加入持久记忆和长期预测能力 发展为具备完整规划能力的行动型AI [48] - 技术飞跃可能在2026年底前实现 一切都将发生深刻变化 [49] 行业影响与社会挑战 - AI将导致大规模失业潮 未来20年内白领认知劳动将被高效替代 [52] - 需要政府通过税收等再分配机制缓冲社会巨变 [52] - 面临"遏制困境"挑战 当执行想法成本趋近零时可能引发大量冲突 [54][55] 安全与治理框架 - 设定四条不可逾越红线:递归式自我改进、自主设定目标、获取自身资源、在世界上自主行动 [56] - AI存在于物理数据中心 可通过"拔掉电源"方式控制 [56] - 需要建立识别和集体决策机制来应对可能出现的失控情况 [56]
美股异动|百度盘前涨超3% 海通国际上调其估值 予目标价188美元
格隆汇· 2025-09-22 16:40
股价表现 - 港股百度逆势收涨超3% 带动美股盘前涨超3%至139.59美元[1] - 美股盘前涨幅达3.13% 上涨4.24美元[2] - 总市值465.29亿美元 市盈率(TTM)12.36倍[2] 估值调整 - 海通国际将估值方法从市盈率改为分部估值法 因应新任CFO提出释放隐藏资产策略[1] - 新目标价定为每股ADR 188美元 对应2025财年22倍市盈率[1] - 综合企业折让45%后得出总估值640亿美元[1] 战略转型 - 公司在大语言模型浪潮下重塑传统业务 包括调整搜寻业务及丰富AI SaaS产品[1] - 寻求云端市场超越机会 提供具成本效益且高可靠性的云端基础设施[1] - 致力于打造开放的基础模型生态系统[1] 交易数据 - 当日最高价138.18美元 最低价134.86美元 振幅2.46%[2] - 成交量766.49万股 成交额10.43亿美元[2] - 流通市值373.61亿美元 换手率2.78%[2]
美团发布高效推理模型LongCat
环球网· 2025-09-22 16:09
技术能力突破 - 增强智能体自主调用工具能力并扩展形式化定理证明能力 [3] - 成为国内首个同时具备深度思考+工具调用与非形式化+形式化推理能力的大语言模型 [3] - 在高复杂度任务(如数学、代码、智能体任务)处理上具备显著优势 [3] 开源与平台部署 - 已在HuggingFace、Github全面开源 [3] - 用户可通过官网直接体验模型功能 [3]
美团发布高效推理模型LongCat-Flash-Thinking,聚焦高复杂度任务
环球网· 2025-09-22 16:02
技术能力 - 增强智能体自主调用工具能力并扩展形式化定理证明能力 [3] - 成为国内首个同时具备深度思考+工具调用与非形式化+形式化推理能力的大语言模型 [3] - 在高复杂度任务(如数学、代码、智能体任务)处理上具备显著优势 [3] 开源与体验 - 已在HuggingFace、Github全面开源 [3] - 用户可在官网体验 [3]
AI无处不在的小应用,与行业发展的大困局
虎嗅· 2025-09-22 15:07
前段时间重点关注AI领域的新突破,结果众多大厂的新版本都低于预期,许多新技术和理念禁不起推 敲,目前的窘境不由得使我对未来发展多了一丝担忧。 阿朱说,如今的AI能听、会说、会看、会写,还能交流,所以现在就是AI时代。 我是认可阿朱这个说法的,现在AI可以完成很多辅助性的工作,大幅提升了数字化能力。已经有大量 的案例,就是利用常规的AI工具对数字化系统的输入进行结构化处理。 比如,通过语音和语义识别,在线会议软件将会议过程进行自动转录,法院专用软件将庭审自动生成为 文书,客服系统把用户的语音内容自动转化并进行结构化分类和处理,客户经理用语音方式回顾走访客 户的过程,由系统转化为结构化的走访记录,并以此为基础自动完成客户画像、梳理商机等动作。 比如,一线人员对服务现场进行拍照,系统自动进行图像识别,完成数据采集和录入工作,既减轻了一 线人员的工作负荷,又大幅提高了数据的准确性。 但在参加几次AI落地实践有关的交流后,我对AI的态度又变得乐观了:AI已经大面积铺开,在千行百 业发挥着作用,潜移默化地在改变我们的世界。 用简单的AI能力破解数字化难题 什么样的系统才算是AI系统? 有专业人士觉得,AI是高科技领域的创 ...
美团(03690)发布高效推理模型LongCat-Flash-Thinking
智通财经网· 2025-09-22 14:40
公司技术发布 - 美团于9月22日发布高效推理模型LongCat-Flash-Thinking [1] - 模型在HuggingFace和Github平台全面开源 [1] 技术性能表现 - 基于AIME25实测数据 模型在确保90%准确率前提下比不使用工具调用节省64.5%的Tokens [1] - 在逻辑、数学、代码、智能体等多个领域推理任务中达到全球开源模型最先进水平(SOTA) [1] - 在超高复杂度任务(如数学、代码、智能体任务)处理上具备显著优势 [1] 技术能力突破 - 增强智能体自主调用工具能力并扩展形式化定理证明能力 [1] - 成为国内首个同时具备"深度思考+工具调用"与"非形式化+形式化"推理能力相结合的大语言模型 [1]
美团发布高效推理模型,部分任务性能接近GPT5
新浪科技· 2025-09-22 14:10
模型性能特点 - 新模型保持龙猫模型一贯"快"的特点 [1] - 在逻辑、数学、代码、智能体等多个领域的推理任务中达到全球开源模型最先进水平(SOTA) [1] - 部分任务性能接近闭源模型GPT5-Thinking [1] 技术能力突破 - 增强智能体自主调用工具的能力 [1] - 扩展形式化定理证明能力 [1] - 成为国内首个同时具备"深度思考+工具调用"与"非形式化+形式化"推理能力相结合的大语言模型 [1] 应用领域优势 - 在高复杂度的任务(如数学、代码、智能体任务)处理上具备显著优势 [1] 开源与发布信息 - 已在HuggingFace、Github全面开源 [1] - 在官网可体验 [1]
001234盘中上演“天地板”!OpenAI大动作,融资客大手笔加仓这些业绩有望持续高增长股
证券时报· 2025-09-22 12:27
消费电子行业动态 - 9-10月是消费电子板块新品密集发布期 产业链进入量产高峰 [1][4] - 消费电子板块具备补涨空间 多家公司早盘涨停包括立讯精密 和而泰 国光电器 [3] - AI行情从云侧逐步切向端侧 带来端侧设备 算力芯片 通信模组等广泛机会 [4] - OpenAI与中国果链龙头企业立讯精密达成战略合作 共同开发革命性AI设备 [3] - OpenAI与歌尔股份接触 设备设计成口袋大小 具备上下文感知能力并深度配合大语言模型运行 [3] 市场表现与资金流向 - 年内13只消费电子概念股股价翻倍 芯原股份上涨229.96% 工业富联上涨213.47% [5] - 9月以来超30家消费电子概念股获机构调研 澜起科技 深南电路 领益智造调研家数超百家 [5] - 澜起科技获231家机构调研 第二季度营业收入 互连类芯片销售收入 归母净利润均创单季度历史新高 [5] - 9月以来超半数概念股获融资客加仓 寒武纪-U 立讯精密 东山精密等8股融资净买入额超10亿元 [6] - 13只获融资客加仓超3亿元的概念股 机构预测2025年和2026年净利润增长率持续超30% [6] 个股与板块表现 - 半导体芯片股延续强势 德明利 万润科技封板 算力概念股活跃 机器人板块继续走强 [1] - 黄金股走势活跃 湖南白银涨超8% 中金黄金一度涨超7% [1] - 旅游 影视 光伏设备 锂矿等板块领跌 [1] - 泰慕士早盘炸板后直线跳水跌停 上演天地板 早盘收盘跌3.24% 成交总额5.43亿元 换手率15.9% [1][2] - 公司股票交易价格连续2个交易日涨幅偏离值累计超20% 属于异常波动 控股股东签署股份转让协议导致控制权拟发生变更 [1] 公司业务与前景 - 东山精密表示AI算力需求增长将提升PCB产品层数和单价 行业需求与产品价值均呈上升趋势 [5] - 公司凭借Multek技术壁垒与提前布局产能优势 在市场竞争中占据有利地位 [5] - 澜起科技DDR5内存接口芯片渗透率较2024年大幅提升 受益于AI产业趋势推动 [5]
Gemini 数据好过chatgpt
小熊跑的快· 2025-09-21 19:30
Gemini和Cla ude 还在冲! 如上图,chatgpt 日活走平了! - Standard_NV18ads_A10_v5 Standard_NV36adms_A10_v5 - Standard_NV12ads_A10_v5 = - Standard_NV36ads_A10_v5 -Standard_NV6ads_A10_v5 Standard_NV72ads_A10_v5 2.5 2 1.5 1 0.5 0 s and and and the state of the start of the state of the state 1 2 8 2 8 2 all of the 如上图azure云 A10 价格最近还在上 租赁价格 如上图AWS A10租赁价格 还比较好。 ...
中国公司全球化周报|DeepSeek-R1成为全球首个经过同行评审的主流大语言模型/曼格纳与小鹏汽车达成整车组装合约
36氪· 2025-09-21 14:54
公司动态 - DeepSeek团队论文登上《自然》封面 披露更多模型训练细节并回应蒸馏质疑 成为全球首个经过同行评审的主流大语言模型[2] - 阿里团队上线全球首个AI Agent交易市场MuleRun 面向所有用户开放 同时发布全球AI Agent Creator支持计划[2] - 曼格纳国际与小鹏汽车就欧洲市场达成整车组装合约 计划2025年第三季度启动生产 系曼格纳首次为中国汽车制造商提供整车组装项目[2] - 吉利银河星舰7 EM-i登陆澳大利亚市场 系吉利在澳洲推出的第二款智能电动车 品牌销量环比增速超50% 已建立47家经销商门店覆盖全境[3] - 文远知行与Grab合作在新加坡推出自动驾驶汽车服务 初期涵盖11辆汽车 小马智行同期宣布与康福德高合作在榜鹅地区推出自动驾驶服务[3] - 滴滴旗下99在巴西追加20亿雷亚尔(约26亿元人民币)投资外卖平台99Food 计划年底前覆盖15座城市 2026年1月再新增20个城市[4] - 美团旗下Keeta在科威特启动运营 系中东第三站 沙特地区已覆盖20多个城市并成为最受欢迎外卖平台之一[4] - TikTok Shop东南亚平台将自2025年9月15日起加强内容原创性审核 对非原创内容实施冻结佣金及取消流量扶持等措施[4] 跨境支付与金融合作 - 沙特央行与蚂蚁国际签署协议 预计2026年在沙特全国支付系统开通Alipay+跨境支付服务[5] 资源开发与制造业 - 紫金矿业阿根廷3Q锂盐湖年产2万吨碳酸锂项目正式投产[6] 投融资活动 - 医鹭久歌完成数千万元人民币B轮融资 由永丰县母基金和梅花创投联合投资 计划未来十年在100个国家建立200个海外仓并派驻超5000名海外人员[6] - 恩瑞恺诺完成逾2亿元人民币A轮融资 由深创投、横琴创投及松禾资本领投 资金用于推进核心管线临床试验及国际化布局[6] - 青昀新材完成数亿元人民币C轮融资 由元禾璞华领投 资金用于新一代鲲纶超材料研发及全球化产能扩张[7] - 坚蛋运动完成数千万元人民币B轮融资 由上海宥世基金和动潮投资共同投资 资金用于智能化升级及海外市场开拓 目前门店超400家覆盖60多个城市[7] 政策监管 - 泰国贸易竞争委员会推进数字电商平台新监管指南 重点禁止低于成本定价及强制使用指定物流等行为 预计2025年10月前颁布[7] 媒体服务 - KrASIA英文媒体服务面向中国出海企业 读者中60%为东南亚核心国家商业人群 通过彭博终端等平台提升企业全球品牌[8] 行业社群 - 36氪出海学习交流群已吸引超17,000位出海人加入 提供每日跨境资讯及交流活动[9]