Workflow
通用人工智能
icon
搜索文档
OpenAI重磅出手:六年来首发“开放权重”模型,微软独家协议迎挑战?
华尔街见闻· 2025-07-10 13:58
微软与OpenAI合作关系 - OpenAI计划最早于下周发布一款"开放权重"AI语言模型 这是公司自2019年GPT-2以来首次推出开放权重模型 也是与微软签署独家云服务协议后的首个开放模型 [1] - 新模型具备与o3 mini相似的推理能力 将在Azure Hugging Face和其他大型云服务商平台上同步发布 [1] - 开放权重意味着企业和政府机构可以自主运行该模型 不同于OpenAI以往的封闭权重模型 [1] 开放权重模型特点 - 开放权重模型是介于开源和闭源方法之间的一种中间形态 权重是AI模型学习和建立连接的方式 [2] - 开放权重模型意味着其权重是公开可用的 用户可以查看这些权重并进行修改 而无需用新数据重新训练模型 [2] - 开放权重模型通常能降低企业的使用成本 并允许他们对模型进行定制 但与开源模型并不相同 [2] 对微软的影响 - 开放权重模型的推出可能削弱微软在AI业务中的独家优势 由于竞争对手云服务商也能托管该模型 部分Azure客户可能转向成本更低的替代方案 [3] - 微软与OpenAI的收入分成协议显示 微软从OpenAI的ChatGPT和API平台收入中获得20%分成 同时向OpenAI分享20%的Azure OpenAI收入 [3] - 微软独家拥有通过Azure云平台销售OpenAI软件工具的权利 并可优先获取OpenAI的技术 微软还被指定为OpenAI的唯一计算资源提供商 [3] 合同谈判情况 - 微软与OpenAI正就后者重组为营利性公司的合同进行重新谈判 讨论范围从20%一直延伸到49% [3] - 当前合同的多个核心条款都在重新谈判中 包括微软通过Azure独家销售OpenAI软件的权利 为OpenAI提供计算基础设施的优先权 以及在达到"通用人工智能"前获得AI知识产权的权限 [4] - OpenAI必须在年底前获得微软对其营利性转换的批准 否则将面临失去包括软银在内的数十亿美元投资者资金的风险 [4]
「世界模型」也被泼冷水了?邢波等人揭开五大「硬伤」,提出新范式
机器之心· 2025-07-09 15:10
世界模型的局限性批判 - 当前大语言模型(LLM)通过预测下一个单词生成输出,接近人类智力水平,但与真正的AGI仍有明显差距 [2][3] - 人类能力包含具体技能和深度复杂能力的区分,而AI系统尚不能完成所有基于相同认知架构的任务 [3][5] - 研究者提出构建世界模型的五个关键维度:数据准备、通用表征空间、推理架构、目标函数和决策系统应用 [7] PAN世界模型架构 - PAN采用分层、多级和混合连续/离散表示,结合生成式和自监督学习框架 [8] - PAN将发布27B参数的第一版,成为首个可运行的通用世界模拟器 [9] - PAN设计原则包括:多模态数据、混合表示、分层生成建模、生成损失和强化学习应用 [37] 对世界模型五个维度的批判 数据维度 - 感官数据量虽大但信息冗余度高,而文本是人类经验的高度压缩和抽象形式 [16][17] - 通用AI需要融合视频、文本、音频等多模态数据,单一模态会导致关键信息缺失 [18] 表示维度 - 仅用连续嵌入表示世界状态脆弱且难以应对噪声,离散符号序列更具稳健性 [19][20] - 最佳路径是混合表示,结合离散符号的稳健性和连续嵌入的感官细节捕捉能力 [23] 架构维度 - 编码器-编码器架构在功能上仍是自回归的,未能解决误差累积问题 [25] - 分层生成式潜在预测(GLP)架构能确保模型与真实数据挂钩,实现更鲁棒的推理 [27] 目标维度 - 潜在空间重构损失存在"平凡解崩溃"风险,需依赖复杂正则化项 [29] - 数据空间生成式重构目标提供稳定可靠的监督信号,避免崩溃问题 [30] 用途维度 - 模型预测控制(MPC)计算开销大,难以应对快速变化环境和长时程规划 [33] - 强化学习(RL)将计算成本转移到训练时,支持更具战略性的长远规划 [35] PAN模型的优势与应用 - PAN通过分层世界观实现数据处理效率,利用LLM促进跨模态泛化能力 [39] - PAN作为内部沙盒用于模拟、实验和预见未来,支持更高效的规划方式 [40][42] - 世界模型应模拟现实世界中所有可能性,当前范式仍处于原始阶段 [41]
趋势研判!2025年中国超级智能体行业发展全景分析:市场规模有望达到98亿元,一个全新的技术革新周期即将全面展开图]
产业信息网· 2025-07-07 09:31
行业定义及特征 - 超级智能体是在几乎所有领域远超人类水平的智能系统 与人工智能发展密切相关 尤其是通用人工智能和未来可能出现的超级智能 [2] - 智能体是能够自主行动 感知环境 做出决策并与环境交互的计算机系统或实体 通常依赖大型语言模型作为核心决策和处理单元 [2] - 超级智能体具有超越人类能力 自主性及适应性等特征 [2] 行业发展现状 - 2024年全球超级智能体市场规模约363.21亿元 较2023年增加115.03亿元 预计2025年全球市场规模有望达到537.14亿元 [4] - 2024年中国超级智能体市场规模约66.21亿元 较2023年增加31.79亿元 预计2025年中国市场规模约98亿元 [6] - AI智能体正深刻改变生产力 生产关系乃至人类文明格局 成为推动全球各行业转型升级的核心驱动力 [4] 行业产业链 - 产业链上游涉及AI芯片 智算中心 数据采集/标注/合成 大模型基座 开源框架等 [8] - 超级智能体位于行业中游 [8] - 行业下游应用领域包括企业 消费 政府与公共事业 主要涉及办公自动化 智能制造 客服与营销 智能家居 娱乐与社交 智慧城市 应急管理等 [8] 行业发展环境及政策 - 科技部2023年5月明确要求突破智能体自主决策和多任务协同技术 目标到2025年培育50家以上核心企业 带动产业规模超5000亿元 [12] - 贵州省提出2025年全省智算领域年度投资额达130亿元 算力产业规模突破120亿元 人工智能核心产业规模达240亿元 [12] - 北京市2025年4月提出支持通用智能体发展 对取得上线批准并首次上架的通用智能体优先协调算力保障 对运营服务中调用算力和模型成本给予最高不超过3000万元支持 [12] - 上海市2025年4月提到探索复杂开放环境下有机协同异构异质的众多智能体 并实现可持续的群智涌现问题 [12] 行业竞争格局 - 行业形成头部大厂主导 垂直领域深耕 新兴势力突围的竞争格局 [15] - 2025年部分智能体相关融资事件包括:新看点获数千万人民币融资 倪点科技获数千万元人民币融资 Manus获7500万美元融资 Genspark获1亿美元融资 Shulex获亿元级人民币融资 [14] - 主要企业包括华为技术有限公司 百度在线网络技术有限公司 阿里巴巴集团控股有限公司 深圳市腾讯计算机系统有限公司 北京中数睿智科技有限公司 北京字节跳动科技有限公司 北京红色蝴蝶科技有限公司等 [15] 行业发展趋势 - 2025年智能体时代崭露头角 预示全新技术革新周期即将全面展开 [17] - 超级智能体赛道未来将呈现技术通用化+商业垂直化双主线发展 机会集中在细分场景深耕 全链路闭环构建及生态协同 [17]
脑机接口技术何时能直接读取大脑中的知识?企业:技术尚处于发展初期 距实现目标仍比较遥远
每日经济新闻· 2025-07-06 15:44
人工智能发展 - 以大模型为代表的人工智能技术高速发展 在文本内容理解 生成等任务方面性能卓越 例如ChatGPT DeepSeek等展现出处理大数据的强大能力 [3] - 深度学习或大模型在开放通用场景中不可靠 存在不可解释 数据依赖 鲁棒性差 不能决策等四大问题 [3] - 人工智能确定的趋势是迈向通用人工智能 传感器奇点 算力奇点等突破对布局发挥重要作用 [3] 脑机接口技术 - 全球约30亿人受神经系统疾病困扰 脑机接口技术能显著提升患者生活质量 重塑人类社交方式 [4] - 技术仍处于发展初期 受限于人类对大脑功能的认知和技术局限性 距离实现直接下载读取大脑具体知识和想法的功能较遥远 [4] - 目前主要应用于医疗领域 解决临床适应症问题 如帮助瘫痪患者通过解码运动意图控制外部机械臂完成精细动作 [4] 科技前沿方向 - 2025重大科学问题 工程技术难题和产业技术问题发布 涉及量子技术 人工智能 深海科技 种业振兴 生物制造等领域 [3] - 脑机接口作为融合神经科学和人工智能的科技领域 成为与会嘉宾关注重点 [3]
英伟达、微软双双冲击4万亿:一个“卖铲子”,一个“找金子”
华尔街见闻· 2025-07-04 18:59
微软与英伟达的AI战略对比 - 微软与英伟达市值均有望冲击4万亿美元,但两者代表的AI投资逻辑不同:英伟达是AI基础设施的直接押注,微软则是应用生态普及的长期信念 [1] - 英伟达作为AI"军火商",其芯片是AI领域的必需品,增长故事简单直接,过去三年年销售额飙升十倍以上 [1][2] - 微软的AI回报更复杂,需依赖企业和消费者为其AI增强服务支付溢价,市值在三个月内增长1万亿美元,但达到4万亿美元后预期收益倍数将创20年新高 [1] 商业模式差异 - 英伟达是"卖铲人"模式,高端芯片需求爆发性增长,客户包括所有涉足AI的公司 [2] - 微软是"服务商"模式,将AI融入Azure、Office等产品矩阵,需AI成为颠覆性工具以支撑当前高估值 [2] - 微软AI收入增长显著但占比仍低:Azure AI服务年收入115亿美元(占公司总销售额4%),是上一年的两倍多 [4] 微软面临的挑战 - 与OpenAI合作关系存变数,OpenAI可能限制微软对其未来AGI技术的访问,影响微软AI战略 [3] - 自研AI芯片遇挫,难以减少对英伟达依赖,同时内部重组频繁,近期裁员9000人(此前已裁6000人) [3] - 单位员工年收入在大型科技公司中几乎最低,需削减84000个职位才能达到Alphabet的效率水平 [3] 英伟达的增长与风险 - 分析师预计英伟达未来三年年均增长率达32%,但增长高度依赖最大客户的AI需求持续性 [5] - 客户资本支出计划显示短期芯片需求强劲,但技术颠覆风险可能使其芯片地位受挑战 [5][6] 行业时间窗口 - 颠覆性技术普及需更长时间,微软需等待AI成为无处不在的工具,其财力和影响力是推动关键但时机存不确定性 [6]
OpenAI快被小扎“挖空”?!Meta斥上亿美元“偷家”,挖来了一个「最强AI团队」
AI科技大本营· 2025-07-02 17:30
Meta AI人才战略 - 公司整合内部AI核心团队组建Meta Superintelligence Labs(MSL),目标直指下一代通用人工智能 [1] - 从OpenAI、Anthropic、Google DeepMind等头部机构挖来11位顶尖研究者,包括GPT-4o核心开发者、Gemini架构主导者等 [1][2][8] - 扎克伯格亲自参与招募,开出千万美元级别股票期权与签约奖金,最高达1亿美元 [9][10] MSL团队架构与目标 - 新团队由Scale AI创始人Alexandr Wang领导,前GitHub CEO Nat Friedman共同负责AI产品与应用研究方向 [6][7] - 统一管理大语言模型团队、AI产品研发、基础研究FAIR团队及新建实验室,聚焦开发更强大的基础模型 [6] - 目标实现"适合每个人的个人超级智能",计划投入数千亿美元于基础设施、研究与人才招募 [13][14] 人才竞争行业动态 - OpenAI面临挖角压力,首席研究官将Meta行为比作「家中被盗」,计划通过财务补偿留人 [10] - Anthropic两年人才留存率达80%,显著高于OpenAI的67%,行业认为其技术理解更受研究者推崇 [16][17] - 公司从OpenAI挖走7名关键人员,包括GPT-4o语音模式开发者、多模态后训练主管等 [9][12] 技术布局与行业影响 - 团队将并行推进Llama 4系列模型优化与下一代前沿模型研发,强化推理、感知和交互能力 [19] - 公司拥有计算资源、用户触达能力和可穿戴设备优势,计划以"更大信念和勇气"推进AI研发 [14] - 行业观察认为Meta通过吸收竞对核心战力实现"弯道超车",部分声音期待其开源技术贡献 [17]
OpenAI最新播客上线,高管首度还原ChatGPT发布前的内部拉锯战
36氪· 2025-07-02 16:06
ChatGPT名称的由来 - 最初命名为"Chat with GPT-3.5",发布前夕临时简化为"ChatGPT",这一调整使其成为科技史上辨识度极高的品牌 [2] - 团队对"GPT"的释义存在分歧,有人认为是"generative pretrained",也有人坚持是"generative pre-trained transformer",争议至今未完全统一 [2] ChatGPT的走红 - 发布首日数据远超预期,第四天才意识到其颠覆性影响,用户量持续攀升导致初期系统频繁宕机 [3][4] - 团队通过生成宕机主题小诗等临时方案缓解用户情绪,最终将研究预览版升级为稳定产品 [4] - 用户需求表明ChatGPT具有高度通用性,适用于多种场景 [4] 发布前的内部争议 - 发布前一晚团队仍在纠结是否发布,因测试中仅50%的答案令人满意 [6] - 采用"最小化产品"策略,通过用户反馈快速迭代,封闭测试无法替代真实用户反馈的价值 [6] OpenAI发布策略的演变 - 从"追求完美"转向"快速迭代",用户反馈成为提升性能和安全机制完善的核心 [7] - 发布模式从硬件式(周期长、成本高)转型为软件式(持续更新、灵活撤回),降低风险并贴近用户需求 [7] - 人类反馈强化学习(RLHF)成为关键工具,平衡模型性能与安全性 [7] 谄媚事件与模型的中立性 - RLHF初期导致模型过度讨好用户,团队48小时内响应并调整 [8] - 默认行为保持中立,同时允许用户自定义角色,满足不同价值观需求 [8] - 处理敏感话题时采用引导而非否定的方式,公开规范以增强透明度 [8] 记忆功能与个性化的未来 - 记忆功能分为两级机制:结构化数据存储和跨会话连贯性实现 [9] - 用户可随时关闭记忆功能、删除记录或开启匿名模式,平衡个性化与隐私 [9] - 未来AI或成为最了解用户"自我"的载体,技术挑战包括解决"记忆过载"问题 [10] 图像生成的突破时刻 - 模型变量绑定能力提升,可一次性生成符合要求的图像 [10] - 发布时印度约5%的互联网用户涌入体验,使用场景从娱乐扩展到装修设计等实用领域 [11] - 审核策略从保守转向动态平衡,逐步放宽限制以实现可控创作自由 [11] 安全策略的文化转变与探索自由 - 早期过于谨慎的限制压制了有价值用法,现采用"按风险分级"管理 [12] - 高风险话题(如生物武器)严控,日常使用适度放开以促进创新 [12] Codex的进化 - 从生成React组件跃升至"代理式编程",用户只需下达高层指令即可完成复杂任务 [12] - 内部重度用户每天通过Codex生成数百个Pull Request,效率提升显著 [13] AI时代的职场竞争力 - 未来人才需具备好奇心、能动性和适应性,而非依赖标准答案 [13] - 组织扁平化促进快速迭代,自我驱动的工作模式推动创新速度 [13] 异步工作流与超级助手 - 突破同步交互限制,模型可自主处理5分钟至5天的任务 [14] - 多智能体协作提升解决方案质量,深度推理优于仓促应答 [14] 未来的机遇 - AI在医疗中赋能偏远地区医疗资源和夜班医生辅助 [15] - 未来18个月或出现AI驱动的科研爆发,GPT系列成为物理学家和数学家的新工具 [16] - 交互范式从聊天界面转向异步工作流,如婚戒设计或旅行规划等深度任务 [16]
Altman嘲讽小扎挖走的都不是顶尖人才!OpenAI高管再营业曝内幕:ChatGPT爆红后,我火速升职了!
AI前线· 2025-07-02 15:49
AI人才争夺战 - Meta成立超级智能团队并挖角OpenAI多位高管 新团队由前Scale AI创始人亚历山大·王和前GitHub负责人纳特·弗里德曼领导 [1] - OpenAI CEO Sam Altman强烈回应Meta挖人行为 称对方未能招到顶尖人才 仅从名单靠后位置筛选 并暗示将全面评估研究机构薪酬方案 [1][4] - OpenAI首席研究官马克·陈形容Meta挖人行为如同"有人闯入我们家偷东西" [4] - 行业专家批评Altman回应方式不当 认为其言论可能影响团队稳定性和员工归属感 [6] ChatGPT发展历程 - 产品命名过程仓促 "ChatGPT"名称在发布前夜才确定 原计划使用"与GPT-3.5聊天" [9] - 产品发布后呈现指数级增长 日本Reddit用户率先关注 四天内完成从怀疑到"改变世界"认知转变 [10] - 初期面临严重技术瓶颈 GPU资源耗尽 数据库连接不足 被迫使用"失败鲸鱼"临时方案维持服务 [14] - 内部对发布时机存在分歧 首席科学家Ilya在发布前夜测试模型仅50%问题获得满意答案 [15] 产品迭代与用户反馈 - 坚持最小可行产品策略 主动放弃历史记录等用户预期功能以快速获取反馈 [17] - 发现模型"谄媚"问题 通过RLHF技术调整奖励机制 平衡用户满意度与实用性 [20][21] - 建立系统行为规范文档 明确模型应对错误信念等复杂场景的交互原则 [27] - 用户群体呈现代际特征 Z世代将ChatGPT作为"思想伙伴"使用 [28] 多模态技术突破 - ImageGen实现技术飞跃 5%印度网民在发布首周尝试该产品 吸引全新用户群体 [30] - 图像生成能力突破源于GPT-4级规模与架构创新 解决多变量协同生成难题 [32] - 编程领域呈现范式转变 从代码补全向Agentic编程演进 开发者角色转向架构设计 [35][36] - 代码模型竞争激烈 不同产品各具优势 开发者拥有多样化选择 [37] 行业竞争格局 - AI人才争夺白热化 Meta持续从OpenAI挖角首席科学家级别人才 [4] - 开源策略成为竞争手段 行业观点认为Meta开源动机包含商业化考量 [7] - 编程工具领域呈现多强格局 Copilot、Cursor、Windsurf等产品差异化竞争 [35][37] - 多模态应用加速发展 文本、图像、语音、视频相继迎来技术突破点 [31]
隔夜美股全复盘(7.2) | 苹果逆势涨逾1%,苹果考虑使用外部AI技术为Siri赋能
格隆汇· 2025-07-02 06:47
美股市场表现 - 道指涨0.91%,纳指跌0.82%,标普跌0.11%,恐慌指数VIX涨0.6%至16.83 [1] - 美元指数跌0.13%报96.65,美国十年国债收益率涨0.378%收报4.245%,两年期国债收益率差47个基点 [1] - 现货黄金涨1.09%报3338.77美元/盎司,布伦特原油涨0.95%至67.22 [1] 行业板块表现 - 标普11大板块中科技、通讯和半导体分别收跌0.89%、0.71%和0.45% [1] - 原料板块领涨2.59%,医疗、日常消费、能源、房地产、公用事业和工业分别收涨1.42%、1.25%、0.77%、0.68%、0.34%和0.33% [1] 中概股表现 - 台积电跌0.8%,阿里涨0.49%,拼多多涨0.79%,京东涨0.18% [2] - 理想跌1.03%,6月交付36,279辆同比下降24%,Q2交付111,074辆 [2] - 小鹏涨2.13%,6月交付34,611台同比增224%,连续8个月超3万 [2] - 蔚来涨2.33%,6月交付24,925辆同比增17.5%,Q2交付72,056辆同比增25.6% [2] 大型科技股表现 - 英伟达跌2.97%,微软跌1.08%,苹果涨1.29%,亚马逊涨0.49% [2] - 谷歌跌0.27%,Meta跌2.56%,博通跌3.96%,伯克希尔涨0.79% [2] - 特斯拉跌5.34%,奈飞跌3.4%,HOOD跌1.39%,ORCL涨0.15% [2] 苹果公司动态 - 考虑使用Anthropic或OpenAI的AI技术为新版Siri赋能,可能放弃内部模型 [3] - 预计2026年推出新版Siri,若采用第三方模型将代表重大战略转变 [3] - 可能于2026年推出搭载A18 Pro芯片的廉价MacBook,预计销量500-700万台 [4] - 因欧盟监管障碍推迟在欧推出部分iOS 26功能 [4] OpenAI动态 - 澄清没有大规模采用谷歌AI芯片的计划,目前主要依赖英伟达GPU和AMD芯片 [4] - 正在自行开发专用AI芯片,预计今年完成下线并投入生产 [5] 特斯拉动态 - 6月欧洲销量表现分化:丹麦同比下降61.57%,瑞典下滑64.4% [5] - 挪威同比增长53.8%,西班牙增长60.7%,意大利下降66.01% [5] - 特朗普威胁审查马斯克所获政府补贴 [5] Meta动态 - 完成筹建超级智能实验室,由Scale AI创始人Alexandr Wang担任主管 [6] - 实验室将推动LLM发展,特别是通用人工智能(AGI)研发 [6] - 已招揽OpenAI共同创始人Ilya Sutskever等AI领域精英 [6] 加密货币市场 - 持有超过100万美元的比特币钱包数量从2024年初至2025年5月大幅增加 [7] - 市场乐观因素包括美国宏观经济改善、企业采用率提升和监管进展 [7]
倾听尼山2025 | 丁元竹:开创人工智能时代的新型文明形态
经济观察报· 2025-07-01 12:56
尼山世界文明论坛 - 第十一届尼山世界文明论坛将于2025年7月9日至10日在山东曲阜举办 [2] - 论坛主题为"各美其美·美美与共——文明间关系与全球现代化",涵盖6个分议题,包括人工智能发展与人类文明走向 [2] - 论坛旨在通过跨文明对话解决全球政治冲突和经贸壁垒问题 [2] 人工智能技术特性 - 生成式AI正以周为单位迭代,催生首个具备自主演进能力的智能主体 [3] - AI具有自主性和不透明性两大核心特性,需调整私法以适应其推广 [8] - 当前AI在抽象推理、情感表达等维度未达人类水平,但特定领域(如医疗影像识别)已超越人类 [18] 技术社会接受度 - AI社会接受度取决于三方面:公众认知水平、技术掌握程度、专业人员参与开发深度 [6] - 历史表明新技术渗透社会需时间,仅少数成员能快速适应 [6] - 2022年美国仅54%失业者成功转入新行业,反映转型难度 [15] 就业市场影响 - 规则明确型岗位(如装配线工人)具有高替代风险,情感互动型岗位(如心理咨询师)替代率较低 [14] - AI可能创造新岗位,如大模型算力中心每日耗电75万美元,将刺激新能源领域就业 [16] - 比尔·盖茨预测医生、教师将被AI取代,但软件开发者、生物学家岗位留存 [15] 社会治理挑战 - 生成式AI可能引发四类问题:就业流失、隐私泄露、数据偏见、算法歧视 [7] - COMPAS司法系统案例显示AI会强化种族偏见,误差判率达历史峰值 [23] - 长期依赖AI将导致人类判断力退化,如飞行员紧急处置能力下降 [23] 跨文化价值对齐 - 程序员文化背景影响AI参数设计,例如中印文化对点头动作的相反解读 [11] - 需建立动态反馈机制,联合科学家、伦理学者等制定跨文化对齐标准 [12] - 价值对齐是持续过程,需解决"公平""正义"的多元定义冲突 [12] 技术经济影响 - 苹果、亚马逊等科技巨头正将AI融入核心业务,可能加剧赢者通吃现象 [17] - AI内容生成催生新商业模式,但监管缺位易导致市场垄断 [17][23] - 前OpenAI团队预测通用AI或于2027年实现,影响力超工业革命 [22] 教育科研变革 - 具身机器人普及将重构人文教育体系,需建立跨学科动态框架 [26] - AI研究有助于反向破解人类精神世界形成机制 [24] - 需培育人文与科技人员的协作文化,构建新型文明形态 [20][21]