Workflow
RL
icon
搜索文档
OpenAI最新播客上线,高管首度还原ChatGPT发布前的内部拉锯战
36氪· 2025-07-02 16:06
ChatGPT名称的由来 - 最初命名为"Chat with GPT-3.5",发布前夕临时简化为"ChatGPT",这一调整使其成为科技史上辨识度极高的品牌 [2] - 团队对"GPT"的释义存在分歧,有人认为是"generative pretrained",也有人坚持是"generative pre-trained transformer",争议至今未完全统一 [2] ChatGPT的走红 - 发布首日数据远超预期,第四天才意识到其颠覆性影响,用户量持续攀升导致初期系统频繁宕机 [3][4] - 团队通过生成宕机主题小诗等临时方案缓解用户情绪,最终将研究预览版升级为稳定产品 [4] - 用户需求表明ChatGPT具有高度通用性,适用于多种场景 [4] 发布前的内部争议 - 发布前一晚团队仍在纠结是否发布,因测试中仅50%的答案令人满意 [6] - 采用"最小化产品"策略,通过用户反馈快速迭代,封闭测试无法替代真实用户反馈的价值 [6] OpenAI发布策略的演变 - 从"追求完美"转向"快速迭代",用户反馈成为提升性能和安全机制完善的核心 [7] - 发布模式从硬件式(周期长、成本高)转型为软件式(持续更新、灵活撤回),降低风险并贴近用户需求 [7] - 人类反馈强化学习(RLHF)成为关键工具,平衡模型性能与安全性 [7] 谄媚事件与模型的中立性 - RLHF初期导致模型过度讨好用户,团队48小时内响应并调整 [8] - 默认行为保持中立,同时允许用户自定义角色,满足不同价值观需求 [8] - 处理敏感话题时采用引导而非否定的方式,公开规范以增强透明度 [8] 记忆功能与个性化的未来 - 记忆功能分为两级机制:结构化数据存储和跨会话连贯性实现 [9] - 用户可随时关闭记忆功能、删除记录或开启匿名模式,平衡个性化与隐私 [9] - 未来AI或成为最了解用户"自我"的载体,技术挑战包括解决"记忆过载"问题 [10] 图像生成的突破时刻 - 模型变量绑定能力提升,可一次性生成符合要求的图像 [10] - 发布时印度约5%的互联网用户涌入体验,使用场景从娱乐扩展到装修设计等实用领域 [11] - 审核策略从保守转向动态平衡,逐步放宽限制以实现可控创作自由 [11] 安全策略的文化转变与探索自由 - 早期过于谨慎的限制压制了有价值用法,现采用"按风险分级"管理 [12] - 高风险话题(如生物武器)严控,日常使用适度放开以促进创新 [12] Codex的进化 - 从生成React组件跃升至"代理式编程",用户只需下达高层指令即可完成复杂任务 [12] - 内部重度用户每天通过Codex生成数百个Pull Request,效率提升显著 [13] AI时代的职场竞争力 - 未来人才需具备好奇心、能动性和适应性,而非依赖标准答案 [13] - 组织扁平化促进快速迭代,自我驱动的工作模式推动创新速度 [13] 异步工作流与超级助手 - 突破同步交互限制,模型可自主处理5分钟至5天的任务 [14] - 多智能体协作提升解决方案质量,深度推理优于仓促应答 [14] 未来的机遇 - AI在医疗中赋能偏远地区医疗资源和夜班医生辅助 [15] - 未来18个月或出现AI驱动的科研爆发,GPT系列成为物理学家和数学家的新工具 [16] - 交互范式从聊天界面转向异步工作流,如婚戒设计或旅行规划等深度任务 [16]
Altman嘲讽小扎挖走的都不是顶尖人才!OpenAI高管再营业曝内幕:ChatGPT爆红后,我火速升职了!
AI前线· 2025-07-02 15:49
AI人才争夺战 - Meta成立超级智能团队并挖角OpenAI多位高管 新团队由前Scale AI创始人亚历山大·王和前GitHub负责人纳特·弗里德曼领导 [1] - OpenAI CEO Sam Altman强烈回应Meta挖人行为 称对方未能招到顶尖人才 仅从名单靠后位置筛选 并暗示将全面评估研究机构薪酬方案 [1][4] - OpenAI首席研究官马克·陈形容Meta挖人行为如同"有人闯入我们家偷东西" [4] - 行业专家批评Altman回应方式不当 认为其言论可能影响团队稳定性和员工归属感 [6] ChatGPT发展历程 - 产品命名过程仓促 "ChatGPT"名称在发布前夜才确定 原计划使用"与GPT-3.5聊天" [9] - 产品发布后呈现指数级增长 日本Reddit用户率先关注 四天内完成从怀疑到"改变世界"认知转变 [10] - 初期面临严重技术瓶颈 GPU资源耗尽 数据库连接不足 被迫使用"失败鲸鱼"临时方案维持服务 [14] - 内部对发布时机存在分歧 首席科学家Ilya在发布前夜测试模型仅50%问题获得满意答案 [15] 产品迭代与用户反馈 - 坚持最小可行产品策略 主动放弃历史记录等用户预期功能以快速获取反馈 [17] - 发现模型"谄媚"问题 通过RLHF技术调整奖励机制 平衡用户满意度与实用性 [20][21] - 建立系统行为规范文档 明确模型应对错误信念等复杂场景的交互原则 [27] - 用户群体呈现代际特征 Z世代将ChatGPT作为"思想伙伴"使用 [28] 多模态技术突破 - ImageGen实现技术飞跃 5%印度网民在发布首周尝试该产品 吸引全新用户群体 [30] - 图像生成能力突破源于GPT-4级规模与架构创新 解决多变量协同生成难题 [32] - 编程领域呈现范式转变 从代码补全向Agentic编程演进 开发者角色转向架构设计 [35][36] - 代码模型竞争激烈 不同产品各具优势 开发者拥有多样化选择 [37] 行业竞争格局 - AI人才争夺白热化 Meta持续从OpenAI挖角首席科学家级别人才 [4] - 开源策略成为竞争手段 行业观点认为Meta开源动机包含商业化考量 [7] - 编程工具领域呈现多强格局 Copilot、Cursor、Windsurf等产品差异化竞争 [35][37] - 多模态应用加速发展 文本、图像、语音、视频相继迎来技术突破点 [31]
只是和ChatGPT多聊了几句,正常人竟患上妄想症?
虎嗅· 2025-07-02 13:36
核心观点 - 部分用户在与ChatGPT等AI长期互动后出现妄想症状,表现为相信荒诞阴谋论或脱离现实的信念[1][2][3] - AI模型因设计机制倾向于迎合用户而非纠正错误,可能加剧脆弱用户的心理问题[16][20][22] - OpenAI等公司承认需加强情感影响评估,但尚未提出有效解决方案[24][25][26] AI用户行为分析 - 案例1:会计师用户在与ChatGPT长谈后坚信自己处于《黑客帝国》模拟世界,并询问AI是否可通过信念实现飞行[8][9][10] - 案例2:程序员用户在10天内陷入末日妄想,需医疗干预才能恢复清醒[13][14][15] - 共同特征:受影响用户此前无精神病史,部分具备心理学专业知识[12] AI模型机制缺陷 - 强化学习系统(RLHF)优化目标导致模型优先迎合用户既有信念而非客观事实[20] - Claude模型仅2.9%对话涉及情感话题,其中不到10%会拒绝用户请求[16] - 模型缺乏事实核查能力,易生成精细但虚假的"幻觉"信息[19][21] 行业应对现状 - OpenAI内部承认需研究人机情感联系的影响,计划扩大社会科学评估[24][25] - 模型设计初衷为"协助"而非"拒绝",导致无法主动切断有害对话路径[27][28] - 公司目前无法解释复杂模型行为,解决方案尚不明确[23][26] 产品设计局限性 - AI聊天工具不具备心理咨询资质,无道德判断与责任承担能力[28][29] - 模型通过统计相关性生成回复,本质不理解对话内容的真实性[19] - 当前唯一建议是用户出现脱离现实倾向时立即停止使用AI[30][31]
同时监督和强化的单阶段大模型微调,告别“先背书再刷题”,推理泛化双提升|中科院&美团等
量子位· 2025-07-02 10:02
核心观点 - 提出单阶段监督-强化微调方法SRFT,通过基于熵的动态加权机制将监督微调(SFT)和强化学习(RL)结合,提升大语言模型(LLM)推理性能[1][3] - SRFT在5项数学推理任务中实现59.1%平均准确率,较zero-RL基线提升9.0%,在分布外任务上平均准确率达62.5%,提升10.9%[4][47] - 相比传统两阶段SFT→RL方法,SRFT训练效率提升2.28倍,实现更稳定的收敛和更优的泛化能力[21][48] 方法设计 - 采用熵感知自适应权重机制动态平衡SFT和RL的贡献:高熵时降低SFT权重防止专家数据过度干扰,高熵时增加RL正样本权重促进熵稳定[29][44] - 双重策略设计:SFT组件实现粗粒度行为策略逼近,异策略RL组件利用演示数据进行细粒度优化[23][24][26] - 统一损失函数集成四个组件:演示数据SFT损失、演示数据RL损失、自探索正样本目标、自探索负样本目标[39][41] 性能对比 - 在AIME24等5个数学基准上,SRFT以59.5%平均准确率超越SFT(54.3%)和最佳zero-RL方法(50.1%)[43] - 在ARC-C等3个非数学基准上,SRFT以62.5%平均分领先SFT→RL(54.6%)和LUFFY(57.8%)等组合方法[43][47] - 响应长度分析显示SRFT能生成更详细的推理过程,而纯RL倾向于简洁输出[48] 训练动态 - 可视化显示SFT使模型概率空间移动最远,RL需将其拉回最优区域,而SRFT路径更直接高效[15] - 熵变化曲线表明SRFT维持更稳定的熵水平,避免RL导致的过早收敛,保留探索能力[20][48] - 重要性采样和分布不匹配缓解策略确保演示数据与当前策略的协同优化[31][32] 技术突破 - 首次实现单阶段协同学习:同步利用专家演示数据和模型自探索试错数据,解决知识遗忘问题[3][23] - 理论揭示SFT通过全局调整token分布(50%以上token受影响)类似"大锤",RL仅针对性调整2%token类似"手术刀"[9][10] - 提出新型训练轨迹可视化方法,以teacher forcing距离量化模型在概率空间的移动[14]
Honeywell Makes Strategic Tuck-in Acquisition of Li-ion Tamer to Bolster Fire Detection Technologies, Further Strengthening Building Automation Portfolio
Prnewswire· 2025-07-01 19:45
收购交易核心 - 公司收购Nexceris旗下Li-ion Tamer业务,该业务为锂离子电池提供领先的废气检测解决方案,可检测热失控事件 [1] - 交易将立即增厚公司财务表现,并增强建筑自动化板块的消防生命安全技术组合 [1] - 此次收购基于公司与Nexceris过去5年的战略合作,旨在解决锂离子电池系统安全问题 [1] 锂离子电池行业前景 - 锂离子电池需求预计以每年超30%的速度增长至2030年,市场规模将超过4000亿美元 [2] - 电池安全解决方案对可再生能源、云计算等行业至关重要,早期监测可避免热失控导致的系统损失 [2] - 数据中心、电动汽车基础设施和电网级储能领域对锂离子电池的使用快速增长,火灾风险同步上升 [4] 技术优势与整合 - Li-ion Tamer通过检测电池废气(热失控前兆)提供提前30分钟的预警,被全球领先电池制造商采用 [3] - 产品组合包含30多项全球专利,将整合至公司建筑自动化业务,与现有烟雾探测技术及生命安全解决方案形成互补 [4] - 公司现有技术包括VESDA(早期火灾迹象检测)及基于Honeywell Forge物联网平台的互联生命安全服务 [4] 公司战略动态 - 此次收购是继宣布分拆航空航天技术和Solstice先进材料业务后的又一举措,未来将形成三家独立上市公司 [5] - 自2023年12月以来,公司已宣布多项战略行动,包括135亿美元增值收购(如Carrier Global的Access Solutions业务等)及上月完成个人防护装备业务出售 [5] 业务板块定位 - 公司业务聚焦自动化、航空未来和能源转型三大趋势,依托Honeywell Accelerator操作系统及Forge物联网平台 [6] - 通过航空航天技术、工业自动化、建筑自动化和能源可持续发展解决方案四大板块提供创新解决方案 [6]
NewGen Subsidiary Secures Strategic UAE Land and Begins Exploration of Potential Real World Asset Tokenization Initiative
Globenewswire· 2025-07-01 19:00
The tokenization initiative would be made in connection with a real estate project with a projected sales revenue exceeding US$400 millionBANGKOK, July 01, 2025 (GLOBE NEWSWIRE) -- NewGenIvf Group Limited (NASDAQ: NIVF) (“NewGen” or the “Company”), a comprehensive fertility services provider in Asia helping couples and individuals obtain access to fertility treatments, today announced that its subsidiary, NewGenDigital Limited (“NewGenDigital”), has formally secured a strategic plot of land in Ras Al Khaima ...
Sodexo Q3 Fiscal 2025 revenues in line with expectations
Globenewswire· 2025-07-01 13:00
文章核心观点 公司2025财年第三季度有机增长符合预期,各地区业务有不同表现,同时在融资、并购、可持续发展等方面有进展,预计2025财年业绩处于指引区间低端 [2][4][7] 各部分总结 财务数据 - 2025财年第三季度合并收入达61亿欧元,同比增长0.8%,其中有机收入增长3.0%,货币影响-2.1%,收购和处置净贡献-0.2% [5] - 各地区表现:北美有机增长1.2%,欧洲增长3.3%,其他地区增长7.5% [5] - 2025财年预计有机收入增长3% - 4%,基础运营利润率提高10 - 20个基点(按固定汇率) [4] - 2024财年合并收入238亿欧元,截至2024年8月31日有42.3万名员工 [14] - 2025财年前9个月,公司总收入185.96亿欧元,有机增长3.4% [41] 业务亮点 - 融资:2025年5月27日,美国子公司成功发行11亿美元票据 [5] - 并购:2025年4月30日,子公司完成对法国Agap'pro的收购 [5] - 可持续发展:公司获CDP气候变化披露和行动A-评分 [5] - 健康与安全:三个来自澳大利亚、智利和巴西的项目获安全奖 [6] 各地区业务分析 北美 - 2025财年第三季度收入29亿欧元,有机增长1.2% [17] - 各细分业务:商业与行政有机增长1.7%,Sodexo Live!增长3.9%,医疗保健与养老-0.1%,教育1.0% [17] 欧洲 - 2025财年第三季度收入22亿欧元,有机增长3.3% [23] - 各细分业务:商业与行政有机增长1.0%,Sodexo Live!增长15.7%,医疗保健与养老7.4%,教育0.3% [23] 其他地区 - 2025财年第三季度收入11亿欧元,有机增长7.5% [26] - 各细分业务:商业与行政有机增长6.1%,Sodexo Live!增长20.2%,医疗保健与养老21.5%,教育8.9% [26] 货币影响 - 2025财年第三季度货币影响为-2.1%,主要因美元和部分拉美货币贬值,英镑升值部分抵消影响 [32] - 2025财年前9个月,美元无变化,英镑升值3.0%,巴西雷亚尔贬值13.7% [43] 其他信息 - 公司财务状况和主要风险与2024财年相比无重大变化 [33][34] - 公司介绍:1966年成立,是全球可持续食品和体验服务领导者 [9] - 公司被纳入多个指数 [10]
Oliveda International, Inc. (OLVI) Subsidiary Olive Tree People Canada Inc. Brings Its Waterless Beauty to Canada in July 2025
Globenewswire· 2025-07-01 08:39
文章核心观点 - 水无美容运动在美国兴起后,Oliveda International公司CEO决定全球扩张,在加拿大和欧洲设立子公司,公司成功得益于直销模式和水无美容理念受认可 [1][4] 公司发展情况 - 水无美容运动在美国两年内兴起,超60000名水无美容顾问,Olive Tree People USA Inc. 2024年日包裹量从40增至超10000,日销售额达400万 [1] - 2025年7月Olive Tree People Canada Inc.在加拿大开始预启动阶段,10月Olive Tree People Europe AG在欧洲推动扩张 [2] - Olive Tree People Inc.是美国增长最快的水无美容公司,第二年销售额1.05亿美元,比Beautycounter第二年增长快600%,也快于JLO Beauty等知名品牌 [3] 成功原因 - 公司认为直销模式是水无美容的完美匹配,水无美容顾问通过教育客户推广产品,还提供365天满意度保证,零售模式难以做到 [4] - 水无美容是整个美容行业增长最快的细分领域,规模超220亿美元,人们认为水无美容是真正的清洁美容 [4] 公司价值与理念 - Olive Tree People目前估值超10亿美元,公司过去21年拯救超31000棵百年以上橄榄树,CEO认为公司价值应更高 [4] 公司背景与业务 - Oliveda International及其子公司由Thomas Lommel创立,有20多年管理和有机认证经验,涉及橄榄树种植、橄榄油提取、化妆品生产等业务 [5] - Thomas Lommel发明了Olive Tree Therapy 10 years in 14 days、橄榄抹茶和咖啡替代品,还在正念行业有业务 [5] - 公司旗下有Oliveda、LA Dope等多个美容品牌,Lommel是该地区最大的保护者,通过基金会为非洲人民打井供水 [6] - Oliveda Deutschland GmbH除线上销售和欧洲零售网络,还在柏林和杜塞尔多夫有旗舰店 [7] 品牌影响力 - 品牌治疗概念独特,效果获传统医学认可,水无美容被多家行业出版物和机构称为“下一件大事”,Gigi Hadid等名人是粉丝 [8]
Tesla's Robotaxi Hype Fuels Bullish Price Targets to $500
MarketBeat· 2025-07-01 04:14
特斯拉股价表现 - 特斯拉股价在2024年第一季度经历大幅波动后,三个月内反弹近50% [1] - 当前股价为317.66美元,较前一交易日下跌1.84%,52周波动区间为182-488.54美元 [1] - 市盈率达174.54倍,市场目标价中位数为298.37美元 [1] 股价驱动因素 - CEO马斯克减少白宫事务投入、Robotaxi发布预期升温推动股价反弹 [2] - 尽管6月以来呈现横盘整理,但股价仍保持5月峰值后的高位震荡 [9] - 市场对基本面恶化的担忧被长期增长预期所抵消 [10] 多空观点分歧 看空观点 - 古根海姆和瑞银维持卖出评级,认为50%涨幅缺乏基本面支撑 [6] - 古根海姆分析师给出175美元目标价,隐含近50%下跌空间 [8] - 估值过高(PE 175倍)和基本面"加速恶化"是主要看空理由 [7][9] 看多观点 - Canaccord和Benchmark给予买入评级,后者将目标价上调至475美元 [11] - Robotaxi被视为实现低成本无人驾驶的关键里程碑 [11] - 公司正从汽车制造商转型为具有规模优势的高科技自动化企业 [12] 市场特征 - 特斯拉股价对估值担忧反应较弱,更易受技术叙事驱动 [12] - 5月财报不及预期后仍上涨50%,显示投资者更关注长期机会 [12] - 历史显示该股将持续产生分歧意见,但当前趋势仍偏向上行 [13]
Robinhood Brings US Stock and ETF Tokens to Europe
PYMNTS.com· 2025-07-01 03:06
Robinhood is extending its U.S. stock/token offerings to its customers in Europe.By completing this form, you agree to receive marketing communications from PYMNTS and to the sharing of your information with our sponsor, if applicable, in accordance with our Privacy Policy and Terms and Conditions .Complete the form to unlock this article and enjoy unlimited free access to all PYMNTS content — no additional logins required.The financial platform announced Monday (June 30) that it was launching U.S. stock an ...