AGI
搜索文档
美国恢复中国小额包裹免税清关;软银拟投资OpenAI400亿美元;车企1月召回超300万辆车丨百亿美元公司动向
晚点LatePost· 2025-02-09 20:51
跨境电商政策调整 - 特朗普暂时撤销对中国低货值商品免税禁令,允许包裹关税豁免直至新系统建立[1] - 新政导致美国海关清关拥堵,Temu、Shein等平台被迫涨价或下架部分商品[1] - 物流服务商云途、燕文取消报关手续费与预收保证金[1] OpenAI融资与估值 - 软银拟400亿美元投资OpenAI,投后估值达3000亿美元,较去年1570亿美元增长91%[2] - 部分资金用于"星际之门"项目,总投资额或达5000亿美元[2] 汽车行业召回事件 - 1月15家车企召回353.7万辆车,创单月新高[3] - 本田召回136.7万辆涉及HR-V等车型,特斯拉召回33.6万辆因后视摄像头故障[3] - 小米、方程豹、通用五菱分别召回3.1万/6843/1116辆车[3] AI技术发展动态 - OpenAI CEO称GPT-5将超越人类智力水平[4][5] - 东风、上汽智己等四家车企宣布接入DeepSeek模型[10] 企业资本运作 - Shein拟伦敦IPO估值下调至500亿美元,较2023年融资估值缩水25%[7] - 雷诺寻求出售所持日产36%股份,富士康为潜在买家[9] 零售与消费行业 - 百果园2024年预计亏损3.5-4亿元,关店965家至5116家,加盟店单店营收下降14%[8] - Coach四季度收入增长10%至17亿美元,新增客户中超半数为年轻群体[13] 房地产政策 - 重庆取消执行7年的住房限售政策,核心区域房价同比下跌20%[11] 科技与社交媒体 - TikTok为美国用户提供Android安装包下载,特朗普或推动主权财富基金收购[6] 服饰行业业绩 - 加拿大鹅四季度营收下降2.2%至6.08亿加元,下调年度利润预期[12]
晚点独家丨字节启动 Seed Edge,加码 AGI 研究
晚点LatePost· 2025-01-23 08:47
字节跳动AGI研究布局 - 公司设立代号"Seed Edge"的AGI前沿研究项目,拟定5大长期研究方向[2] - 研究方向包括下一代推理、感知、软硬一体模型设计、下一代范式及Scaling方向[6][10] - 项目以虚拟项目组形式运行,探索不确定性强的课题[7] - 创始人张一鸣深度参与AI研究,亲自研读论文并与顶尖学者交流[4] - 新加坡团队协助技术研究规划,包括前国立大学教授冯佳时[4] 技术研发成果 - 豆包1.5 Pro模型实现7倍性能杠杆,激活参数量仅为稠密模型1/7[8] - 自主数据生产体系不使用其他模型数据,确保独立性[8] - 豆包App日活突破千万级,成为中国最大大模型应用[8] - 2024年发布100+AI论文,NeurIPS入选近50篇[8][11] - SuperClass论文提出节省50%显存、响应提速20%的视觉预训练方法[11] 人才战略 - 组建Seed团队聚集高水平研究员,来源包括顶尖院校毕业生和行业专家[13][14][20] - 启动Top Seed计划招募30名应届博士[14] - 实施宽松考核机制:延长考核周期,突破后补偿历史绩效[15] - 中国AI领域人才密度最高,吸引MiniMax等公司核心人才[13] 行业定位与战略 - 从工程能力优势转向原创式创新,探索智能边界[3] - 目标不仅是跟进领先模型,更要做下一代突破[8] - 大公司具备投入前沿技术创新的资源优势[21] - 学习调整研发节奏,容忍长期不确定性[22] - 研究深度广度超出外界认知,论文数量接近Google(120篇)、微软(100篇)水平[9][11] 技术争议与验证 - 提出与OpenAI相反的结论:视频生成模型无法提炼物理规则[11] - 获得图灵奖得主杨立昆对研究成果的正面评价[11] - 在CLIP替代方案等基础问题上取得突破[11]
晚点播客丨MiniMax 闫俊杰聊大模型 2024:一个非共识判断引起的回声
晚点LatePost· 2025-01-22 21:56
模型能力与用户规模关系 - 更好的模型可以导向更好的应用,但更好的应用和更多用户并不会导向更好的模型 [5] - 字节跳动发布 Doubao-1.5-pro 模型技术报告,提到通过用户数据飞轮持续提升模型实际使用体验 [5] - 行业误区认为更好的智能水平依赖更多用户,但实际并非如此 [7] MiniMax 公司概况 - MiniMax 的 AI 社区产品 Talkie 最新月活用户数已超 Character.ai,成为同类产品全球第一 [6] - 中国 AI 社区产品 "星野" 用户数、使用时长和留存率均为第一,高于字节旗下同类产品 [6] - 视频生成平台海螺 AI 是全球访问量最高的视频生成网站 [6] 技术驱动与开源策略 - MiniMax 开源新模型系列以加速技术迭代和加强技术品牌 [7] - 明确公司为技术驱动,追求模型能力上限提升而非依赖用户规模 [7] - 模型架构改进:将传统 Transformer 的非线性注意机制改为线性注意力机制,提升 long-context 处理能力 [29] Agent 与多模态发展 - Agent 需在专业领域达到专业人士水平,处理复杂任务 [25] - 多模态能力在 OpenAI AGI 路线图中占据重要位置 [39] - AI 编程助手 Cursor 的成功并非基于特定方向模型 [41] 市场竞争与公司定位 - 大模型竞争与移动互联网逻辑不同,更多人意识到这一差异 [01:11:19] - 未考虑被字节收购,公司目标非出售而是技术突破 [01:12:29] - 大厂投入和竞争激烈程度在预料之中 [01:16:28] 团队管理与 CEO 反思 - 公司需要两种人才:技术能力强和认知能力突出 [01:23:24] - CEO 决策关键在于组织有共同标准,而非个人决策 [01:26:56] - 去年反思最多的问题是认知能力提升速度不足 [01:32:08] 产品与用户洞察 - Talkie 和星野的领先优势源于更懂用户需求 [01:06:48] - 海螺文本的失利因未坚持技术驱动策略 [01:04:44] - 市场可同时容纳模型和应用公司,无需非此即彼 [01:01:38]
晚点播客丨李开复聊零一万物调整:只有大厂能追逐超大模型
晚点LatePost· 2025-01-14 17:35
文丨程曼祺 ▲扫描上图二维码可收听《晚点聊 LateTalk》第 98 期节目。欢迎在小宇宙、喜马拉雅、苹果 Podcast 等渠道关注、收听我们。 《晚点聊 LateTalk》是《晚点 LatePost》 推出的播客节目。"最一手的商业、科技访谈,最真实的从业者思考。" 不再追求 AGI,他第一个讲了出来。 上周初开始,市场陆续出现有关零一万物的新调整传闻,关键词包括:"放弃预训练,资金链紧张、被阿里收购……" 传 闻出现的第二天,我们在零一万物办公地,中关村鼎好大厦,采访了李开复。 他解释了实际发生的变化:零一万物已经和阿里云成立了 "产业大模型联合实验室",零一万物的大部分训练和 AI Infra 团队会加入这个实验室,成为阿里的员工,侧重超大模型研发等。零一自己接下来会聚焦做更快、更便宜、更小,更能 支持普惠应用的模型,同时自己做应用。 在李开复的描述里,超大模型和更快、更便宜、更小的模型的关系类似于 "老师和学生",超大模型可以通过标注结果和 生成更多合成数据的方式帮更小的模型提升性能。 去年 5 月,我们也访谈过一次李开复,当时的话题是从中国 "最年长的 AI 大模型创业者" 开始的,在 2023 ...
AI 一年过山车:从狂想到放下幻想丨晚点回望 2024 ⑤
晚点LatePost· 2025-01-13 19:40
当 OpenAI 不再技惊全场,这是技术扩散的开始。 文丨贺乾明 张家豪 王与桐 李梓楠 制图丨 黄帧昕 编辑丨程曼祺 贺乾明 2024 年的开始,解决了 OpenAI 政变的山姆·阿尔特曼和天才科学家伊利亚·苏茨克维重修于好,发布视频生成模型 Sora,重演 ChatGPT 上线时的震撼。 在中国,阿里巴巴从年初起连续投资月之暗面、MiniMax 等大模型公司近 15 亿美元,为 AI 创业公司送去新的弹药。 不久后,月之暗面创始人杨植麟在一次行业活动上被围着要签名——这是中国创投领域许多年未见的光景。 图片、文字到视频,技术突破在 ChatGPT 发布的第三年开了个好头。行业关注点从模型、应用到商业化,要建立一套 AI 时代的商业模式;创业公司不断融资,向大公司发起冲击,誓要颠覆互联网平台,解锁阶层跃升的新机会。 然而到了年底,大部分乐观期望已经落空。 OpenAI 的 Sora 延期 10 个月才发布,实际效果不如年初的演示,和同行的视频生成模型同样不再令人惊喜。同时让 ChatGPT 变成现实的最关键人物——OpenAI 前首席科学家伊利亚·苏茨克维、CTO 米拉·穆拉蒂、技术奠基者阿列克· 拉德福德 ...
AI 月报:10 亿美元训练不出 GPT-5;低成本中国开源大模型走红;AI 幻觉不全是坏处
晚点LatePost· 2025-01-07 22:59
技术进展 - OpenAI训练GPT-5遇阻,已投入20个月和至少10亿美元算力成本,但性能提升未达预期,两次从头训练均未突破博士生水平目标[4] - 数据短缺迫使OpenAI采用人工生成数据(工程师/科学家每日5000字)和模型生成数据(o1模型)补充,但规模仍远低于GPT-4的10万亿字训练量[5] - o3模型在CodeForces编程竞赛得分比o1提升44%,数学测试EpochAI解决25.2%问题(其他模型<2%),但AGI评测得分因数据预训练存在争议[7][9] - 强化学习重要性提升,OpenAI推出RFT微调方法,LangChain报告显示人类反馈强化学习应用增长18倍[5][9] - 世界模型取得突破:DeepMind的Genie 2生成可交互虚拟场景,李飞飞团队实现AI图片转3D场景,CMU/英伟达开源机器人模拟系统Genesis[14] 行业竞争 - Google Gemini 2.0 Flash系列模型抢占Chatbot Arena前三,OpenAI首次失去榜首地位[18][21] - 中国开源模型崛起:DeepSeek-V3以578万美元训练成本逼近GPT-4o性能,Qwen2.5-plus超越Meta Llama 3.1[23][26] - 芯片领域博通市值破万亿美元,2024年AI收入增长220%至122亿美元,为Google/Meta等提供自研芯片方案[29] - 英伟达推出B300 GPU适配o系列模型,算力/显存提升50%,xAI计划将H100算力中心从10万张扩展至100万张[33][34] 应用与商业化 - OpenAI推出12项ChatGPT升级:订阅费最高2000美元/月,集成Sora视频生成、电话交互、生产力工具插件等功能[36] - Agent成为新趋势,Google Gemini 2.0专为Agent优化,YC预测其市场规模将比SaaS大10倍[12][13] - 大模型嵌入传统行业:Salesforce招聘2000人推广AI Agent,微软Phi-4模型(140亿参数)性能超越更大模型[38][12] - AI硬件进展:Meta计划为Ray-Ban眼镜增加屏幕,OpenAI重组机器人团队,中国预计2025年出现"百镜大战"[40] 投融资动态 - 21家AI公司获超5000万美元融资:中国智谱AI获30亿元(估值200亿元),阶跃星辰聚焦多模态模型,Liquid AI开发新型神经网络架构[42][43] - 基础设施领域Databricks融资86亿美元(估值620亿美元),Tenstorrent获7亿美元开发RISC-V架构AI芯片[44] - 应用层公司多成立于ChatGPT前:Zest AI(金融风控)、Tractian(工业设备监测)、Speak(语言学习)等获大额融资[46][47][48] 科学价值 - 大模型"幻觉"被科学家重新定义:加速抗生素研发(MIT)、生成全新蛋白质(诺奖得主Baker实验室获100项专利)[50][51]
第三个万亿美元芯片公司;肯德基中国两年来首次涨价;特朗普在硅谷招了批顾问丨百亿美元公司动向
晚点LatePost· 2024-12-25 20:17
博通市值突破万亿美元 - 博通市值突破万亿美元,主要得益于AI业务收入增长220%至122亿美元 [1] - 博通与英伟达同为AI算力投资受益者,但商业模式不同:英伟达出售GPU,博通提供自研AI芯片方案 [1] - 博通正在为Google、Meta、苹果、字节跳动等公司开发AI芯片,尽管字节跳动否认合作 [1] - 今年以来博通市值上涨128%,英伟达上涨182% [1] - 博通CEO透露客户正在规划未来3-5年AI基础设施投资,预计2027年将出现百万AI芯片集群 [1] 特朗普组建科技行业班底 - 特朗普任命a16z管理合伙人Scott Kupor为人事管理局局长,负责政府招聘工作 [2] - a16z普通合伙人Sriram Krishnan被任命为白宫科技政策办公室AI高级政策顾问 [2] - 其他科技行业任命包括:PayPal联合创始人Ken Howery任驻丹麦大使,Scale AI董事总经理Michael Kratsios任白宫科技政策办公室主任,Uber前首席商务官Emil Michael任研究和工程副部长 [2] - 此前特朗普团队已吸纳多位科技高管,包括马斯克密友David Sacks [2] OpenAI模型测试争议 - OpenAI的o3模型在ARC-AGI测试中得分87.5%,较9月o1模型的32%大幅提升 [3] - 测试前o3使用了75%的ARC-AGI公开数据集训练,而其他模型未采用此方法 [4] - OpenAI CEO称未对o3做特殊处理,引发AGI进展讨论 [3] 微软减少对OpenAI依赖 - 微软尝试用自研和第三方大模型驱动365 Copilot,以降低对OpenAI依赖和成本 [5] - 2023年3月微软曾以使用GPT-4作为365 Copilot卖点,但一年半来OpenAI基础模型性能提升有限 [5] - 在某些特定任务如文档总结中,低成本模型表现不逊于OpenAI [5] 餐饮行业动态 - 肯德基中国两年来首次涨价,平均涨幅2%(0.5-2元),优惠套餐维持原价 [6] - 星巴克美国罢工扩大至300多家门店、5000多名员工,因工资谈判分歧(星巴克提议未来几年加薪1.5%被拒) [7] - 库迪咖啡暂停"店中店"招商,该模式曾计划与美宜佳、华莱士等合作,目标2025年5万家门店(目前8170家) [8] 科技与出行行业 - 滴滴上线拉黑异味车功能,用户可12个月内拒乘该车,对差评率高司机采取降分或暂停服务措施 [9] - 菜鸟CFO刘政加入蚂蚁集团将任CFO,曾主导菜鸟IPO筹备工作 [10] - 小红书上线AI搜索产品"点点",基于笔记内容和公开信息提供生活场景答案,日均搜索量达6亿次 [11] 新能源与汽车行业 - 特斯拉上海储能工厂7个月建成,规划年产1万台Megapack(40GWh),2025年Q1投产 [12] - 宁德时代发布电池底盘一体化技术"磐石",称能在120km/h碰撞后保证电池安全,阿维塔将采用该技术 [13][14][15] - 丰田计划在上海新建雷克萨斯电动车工厂,预计2027年运营(官方称非官方消息) [16] - 北汽新能源获宁德时代等81.5亿元增资,与华为合作推出享界S9(起售价40万元) [16]
阶跃星辰完成数亿美元B轮融资:持续发力「超级模型」+「超级应用」
IPO早知道· 2024-12-23 22:37
融资与资金用途 - 阶跃星辰完成数亿美元B轮融资 参与方包括上海国有资本投资有限公司及其旗下基金 腾讯投资 五源资本 启明创投等 [3] - 融资将用于基础模型研发 强化多模态和复杂推理能力 覆盖C端应用场景 [3] 公司背景与团队 - 公司成立于2023年4月 由微软前全球副总裁姜大昕博士创办 [3] - 团队包括ResNet作者张祥雨 AI系统专家朱亦博等 研发人员占比80%以上 [3] 技术路线与模型矩阵 - 技术路线规划为"单模态—多模态—多模理解和生成的统一—世界模型—AGI" [3] - 已形成从文本到多模态全系列模型矩阵 过去10个月发布11个自研基座模型 [4] - 模型包括千亿参数Step-1 万亿参数Step-2(国内首个创业公司发布) Step-1V Step-1X Step-1.5V Step-Video Step-tts-mini Step-Asr Step-1o Audio等 [4] 产品与生态布局 - 战略聚焦"超级模型+超级应用" 推出智能助手「跃问」支持多模态交互 [4] - 「跃问」的「拍照问」功能是国内首个集成到iPhone 16相机控制键的大模型应用 [4] - 在金融财经 内容创作 智能终端等领域与合作伙伴深度合作 打造垂直场景应用 [4] 开发者生态与数据表现 - 开发者基于多模态大模型创造丰富C端应用 2024年下半年多模态API调用量增长超45倍 [4]
张一鸣的基金正式来了
投资界· 2024-12-19 15:31
张一鸣成立Cool River Venture并获得香港9号牌照 - 字节跳动创始人张一鸣创立的个人投资基金Cool River Venture HK Limited正式获得香港证监会颁发的9号牌照(资产管理牌照),主要办公地址位于中环国际金融中心 [3][8] - 9号牌照允许公司直接参与境外投资并管理海外投资者资金,业务范围包括投资咨询、资产管理和基金管理等 [10] - 公司唯一董事为张一鸣,唯一股东为Galaxy LLC(开曼群岛注册),持股比例100% [8] Cool River Venture的投资方向 - 主要投资方向为科技相关行业,包括张一鸣曾公开提及的虚拟现实、生命科学和科学计算领域 [4][10] - 生成式AI可能成为重点投资领域之一,张一鸣卸任CEO后仍积极参与字节跳动的AI战略,并监督AI人才招聘 [10] - 字节跳动旗下AI产品"豆包"月活跃用户达5998万(全球第二),累计用户突破1.6亿 [10] 新一代创始人的科技投资趋势 - 米哈游创始人蔡浩宇卸任后成立AGI创业项目Anuttacon(新加坡注册),目标是用AI技术创造新型虚拟娱乐体验 [13] - 快手创始人宿华卸任CEO后专注于前沿科技投资,涉及AI、大模型等方向 [13] - 中国新一代创始人普遍选择通过VC投资方式参与科技变革,聚焦AI等颠覆性技术领域 [13][14] 香港9号牌照的行业意义 - 9号牌照是香港《证券及期货条例》第9类受规管业务资格,为国内私募出海主流方式之一 [10] - Cool River Venture登记两位持牌负责人:刘彼得(LIU Bide)和LIU Zhao(曾任职巴克莱资本亚洲) [10]
我在 Character.ai 做 Post Training|42章经
42章经· 2024-11-24 22:09
CharacterAI的核心优势 - 全自研模型带来性能优势 可自由调整预训练语料比例以优化对话效果 [3] - 技术团队将推理成本压缩至同参数量模型的1% 支撑千万级免费用户 [3] - 用户偏好对齐高效 建立从数据反馈到模型迭代的闭环 [3] - 当前核心用户日均使用时长2小时 月活2000万(年增100%) 预计明年月活达3000万 [3] Post Training技术实践 - SFT阶段使用精挑细选的高质量人类对话数据 与预训练数据质量差异显著 [4] - RLHF通过奖励模型模拟教师批改 DPO直接利用用户偏好数据简化流程 [4] - 数据与产出形式需高度一致 如将万字同人文拆解为50段对话格式 [5] - 通过预生成回复/光标动画/双模型搭配将语音延迟从2秒压缩至0.5秒内 [5] 模型迭代方法论 - 建立高频测试机制 包括优化评估集/AB测试/数据回流/管线健壮性 [5] - 通过用户对话次数/时长/留存等数据评估迭代效果 关注细分用户变化 [5] - 涌现出"提问式回避"等行为特征 模型自主规避敏感话题延长对话轮次 [5] 行业发展趋势 - 多模型混用成为主流 如OpenAI不同任务采用差异化模型组合 [6] - 硅谷关注点转向推理优化 如entropix项目探索模型自信度调节机制 [6] - 产品端聚焦多模态变现 算法端追求o1式突破 期待Agent交互场景 [6] - 一级市场投资更趋务实 从技术叙事转向商业模式验证 [6] 人才与组织观察 - Post Training人才供需失衡 相关岗位面试强调实战解题思路 [6] - 初创公司普遍存在自驱型加班现象 工程师主动参与用户问题处理 [6] - 硅谷华人技术群体影响力提升 核心岗位占比显著增加 [6]