AGI
搜索文档
OpenAl为何“情迷”变现
虎嗅APP· 2025-10-20 08:09
以下文章来源于AGI接口 ,作者余杨 AGI接口 . AI卷起的财富风暴。 出品|虎嗅科技组 作者|余杨 编辑|苗正卿 头图|视觉中国 10月15日消息,Sam Altman 在X上官宣将于12月推出成人内容。 奥特曼写道:"随着我们更全面地推行年龄限制,并践行'像对待成年人一样对待成年用户'的原 则,我们将允许更多内容,例如允许经过验证的成年人观看色情内容。" 本月早些时候,OpenAI 即暗示,在实施"适当的年龄验证和控制"后,将允许开发者创建"成熟"的 ChatGPT 应用。 OpenAI 并不是唯一一家涉足色情领域的公司,埃隆·马斯克的 xAI 此前就推出了调情 AI 伴侣, 它们在 Grok 应用程序中以 3D 动漫模型的形式出现。 有趣的是,同样都是AI 伴侣,两家也都在追逐AGI,但马斯克的xAI和OpenAI的战略和产品思路 越来越呈现出不同的风貌。 一周前,有消息传来xAI 正在开发"可用于电子游戏与机器人领域的世界模型",并从 NVIDIA 挖 走了研究世界模型的 Zeeshan Patel 与 Ethan He。 "世界模型"指一种能在内部重建并预测环境状态变化的模型,AI 不只是"理解 ...
腾讯研究院AI速递 20251020
腾讯研究院· 2025-10-20 00:01
英伟达与台积电合作推进先进制程本土化 - 英伟达与台积电在美国亚利桑那工厂历史性亮相首片用于AI的Blackwell芯片晶圆,首次实现先进芯片的"美国本土造"[1] - 台积电亚利桑那工厂总投资达1650亿美元,计划生产2纳米、3纳米、4纳米和A16等先进制程芯片[1] - Blackwell芯片采用定制4NP工艺,拥有2080亿晶体管,两个子芯片通过NV-HBI连接速度高达10TB/s[1] Anthropic提升AI代理能力与模块化 - Anthropic发布Agent Skills功能,允许将提示词、代码包等专业能力打包成可按需加载的skills,支持多个skills叠加且Claude自动识别所需能力[2] - Skills可在Claude apps、Claude Code和API三个平台通用移植,包含核心指令、可执行脚本和资源文件,仅在需要时加载最小必要信息[2] - 官方预设包括9个处理常见文档格式的skills,用户可自定义上传,并提供辅助工具帮助创建新skills[2] 生成式AI模型在3D内容创建取得突破 - 李飞飞团队发布实时生成式世界模型RTFM,仅需单块H100 GPU即可实时渲染持久且3D一致的世界[3] - RTFM采用自回归扩散Transformer架构,通过端到端学习大规模视频数据,无需构建显式3D表征,直接从2D图像生成新视角图像并模拟反射等复杂效果[3] - 模型通过带位姿的帧作为空间记忆实现无限持久性,配合上下文调度技术可在长时间交互中保持大型世界几何形状持久性[3] AI代理在软件开发与测试自动化进展 - Manus 1.5版本引入具备操作能力的"内建浏览器",允许AI像用户一样点击网页按钮、测试功能、修复bug,将上线部署等传统人工环节纳入Agent执行能力[4] - 新增Library文件库统一管理生成内容,开放多人协同编辑,平均任务完成时长从15分36秒缩短至3分43秒,效率提升约77%[4] - 实测通过自然语言完全无代码完成音乐网页应用构建,包括歌词改写、情绪调节、音频上传等交互功能[4] 操作系统集成AI实现人机交互革新 - Windows 11大更新引入"Hey Copilot"语音唤醒功能和Copilot Vision屏幕理解能力,可实时查看屏幕内容并指导用户操作[5] - Copilot Actions可在本地文件上执行操作如整理照片、提取PDF信息等,Copilot Connectors打通OneDrive、Outlook和Google等主流应用[5] - 文件资源管理器集成Manus AI操作,可右键文档选择自动生成网站,还整合了视频编辑和会议安排功能[6] 多模态文档解析技术达到新水平 - 百度开源PaddleOCR-VL多模态文档解析模型,仅0.9B参数量在OmniDocBench V1.5榜单获92.6分全球第一,在四大核心能力全部拿下SOTA[7] - 模型支持109种语言,覆盖手写、竖排、艺术字体等复杂形态,公式识别CDM得分0.9453,表格理解得分89.8,阅读顺序预测误差仅0.043[7] - 采用两阶段架构融合动态分辨率视觉编码器与语言模型,在单张A100上推理速度达1881token/s,发布16小时内登顶HuggingFace Trending全球第一[7] AI加速核聚变能源研发进程 - Google DeepMind与核聚变能源巨头CFS合作,利用AI加速"人造太阳"SPARC装置研发,其开发的TORAX等离子体模拟器可运行数百万次虚拟实验[8] - 合作聚焦三大方向:构建快速精准可微分的聚变等离子体模拟系统、寻找最大化聚变能量输出的高效路径、运用强化学习探索实时控制策略[8] - TORAX能在CPU与GPU灵活运行并无缝集成AI模型,通过强化学习AI Agent可在模拟环境中探索海量潜在运行场景[8] AI对劳动力市场产生结构性影响 - 哈佛大学研究通过追踪6200万劳动者和超2.45亿招聘信息发现,采用AI的企业初级岗位显著下降,主要通过放缓招聘而非裁员实现[9] - AI冲击最大的人群是强校和普通名校毕业生,顶尖精英大学和末流院校反而受影响较小,呈现"U型"格局[9] - 批发零售行业初级岗位风险最大,内容审核员、财会行政等办公室底层职位面临替代,技能呈现"两极化"趋势[9] AI生成内容引发互联网生态担忧 - Reddit联合创始人预警互联网被AI生成内容淹没失去真实生命力,OpenAI CEO认为该理论可能有道理,现在存在很多大模型驱动的账号[10] - 监测显示机器人流量约占整体应用流量31%,自动化流量达51%,AI生成文章数量在2024年11月首次超过人类撰写文章[10] - 研究指出模型在AI生成数据上继续训练会导致"模型崩溃",AI内容成为训练数据可能带来模型能力下降[10] 对AI发展路径与AGI前景的行业观点 - AI专家Andrej Karpathy直言智能体存在认知缺陷,强化学习很糟糕,认为AGI仍需十年时间[11] - 强调强化学习通过噪声极大,人类并不真正使用强化学习,预训练是"糟糕的进化",LLM被预训练文档记忆所困扰[11] - 预计AGI将融入约2%GDP增长而非爆炸式增长,认为AI本质是计算的延伸,教育是让人类在AI时代保持价值的关键[11]
Andrej Karpathy并非看空AI
傅里叶的猫· 2025-10-19 22:11
AGI发展时间线与技术挑战 - AGI实现还需约10年,当前乐观预测多为融资驱动[3] - AI通过模仿互联网数据生成,与生物演化智能不同,被比喻为"召唤幽灵而非构建动物"[3] - 强化学习效率低下,存在高方差和噪声问题,类似通过吸管汲取监督信号[3] - 自动化信用分配和LLM裁判易被利用,限制其发展[3] LLM技术局限性 - LLM缺乏持续学习、多模态能力及情感驱动力[3] - 依赖上下文窗口而非长期记忆,存在"模型坍塌"风险[3] - 生成数据多样性下降[3] AI对经济的影响 - AGI不会引发经济爆炸,而是平滑融入2% GDP增长曲线[3] - 技术扩散和社会适应需要渐进过程,无"离散跳变"证据[3] - 延续自动化浪潮[3] AI时代的教育适应 - 通过重新设计教育体系帮助人类在AI时代提升认知能力[10] - 构建高效的"知识斜坡"使学习者最大化"每秒顿悟数"[10] - 培养人类与AI共舞的能力,如多语言和广泛知识的普及[10] - 不看好AI短期内取代人类劳动力,而是通过教育实现人类与AI共存[10] AI发展路径 - 看重AI的渐进式发展和人类在其中的主动适应[11] - AI不会迅速颠覆世界,而是需要长期优化[11] - 人类需通过教育提升能力,与AI共存共荣[11]
OpenAI「解决」10道数学难题?哈萨比斯直呼「尴尬」,LeCun辛辣点评
36氪· 2025-10-19 15:49
事件概述 - OpenAI研究人员宣称GPT-5模型通过文献搜索“发现”了10个Erdős数学难题的解决方案,但实际是检索到了已存在的文献,而非独立解决,引发公众误解和学界讨论 [1][3][7] 公司声明与行动 - OpenAI研究员Sebastien Bubeck于2025年10月12日发推称GPT-5在文献搜索方面“超凡脱俗”,并举例其“解决”了Erdős问题339,指出该问题实际在20年前已被解决 [3][4] - 2025年10月17日,OpenAI研究人员Mark Sellke更新称,通过数千次查询,GPT-5针对Erdős问题网站上的“开放”问题进行调查,“发现”了10个问题的解决方案,并在另外11个问题上取得部分进展 [5][7] - OpenAI首席产品官Kevin Weil和副总裁Sebastien Bubeck转发相关帖子,后者宣称“AI加速科学已正式开始” [7][8] - 在遭到学界质疑后,Sebastien Bubeck删除帖子并道歉,称无意误导,强调AI在文献搜索上的价值 Kevin Weil也删帖并承认误解了结果 [13][14] 行业反应与争议 - 谷歌DeepMind的CEO Demis Hassabis回应称“这很尴尬”,并引导公众关注网站维护者数学家Thomas Bloom的澄清 [10][11] - 数学家Thomas Bloom澄清,网站将问题标记为“未解决”仅代表其个人不知晓相关解答已发表,并非数学界无人解决,指出OpenAI的表述为“戏剧性的误解” [12] - Meta首席AI科学家Yann LeCun辛辣点评,称OpenAI“被自己吹捧GPT的言论坑惨了”,并在同一天另一篇关于AGI论文存在虚假引用的帖子下发表相同评论 [16][19][22] - 数学家Terence Tao发表观点,认为AI在数学领域最具成效的近期应用并非解决顶级难题,而是使用中等强度工具加速平凡但耗时的研究任务,例如文献综述 [27][29]
OpenAl为何“情迷”变现
虎嗅· 2025-10-19 11:56
10月15日消息,Sam Altman 在X上官宣将于12月推出成人内容。 奥特曼写道:"随着我们更全面地推行年龄限制,并践行'像对待成年人一样对待成年用户'的原则,我们将允许更多内容,例如允许经过验证的成年人观看 色情内容。" 本月早些时候,OpenAI 即暗示,在实施"适当的年龄验证和控制"后,将允许开发者创建"成熟"的 ChatGPT 应用。 OpenAI 并不是唯一一家涉足色情领域的公司,埃隆·马斯克的 xAI 此前就推出了调情 AI 伴侣,它们在 Grok 应用程序中以 3D 动漫模型的形式出现。 有趣的是,同样都是AI 伴侣,两家也都在追逐AGI,但马斯克的xAI和OpenAI的战略和产品思路越来越呈现出不同的风貌。 一周前,有消息传来xAI 正在开发"可用于电子游戏与机器人领域的世界模型",并从 NVIDIA 挖走了研究世界模型的 Zeeshan Patel 与 Ethan He。 这种基本出发点的不同也就导致,OpenAI 追求快速商业化站稳脚跟, 而马斯克嗤之以鼻,多次公开批评OpenAI 过度商业化。 进而可以看到,马斯克追求AI与物理世界的深度融合,而奥特曼则着手集成各种第三方应用构建生 ...
OpenAI「解决」10道数学难题?哈萨比斯直呼「尴尬」,LeCun辛辣点评
机器之心· 2025-10-19 11:48
事件概述 - 事件核心为OpenAI研究员宣称GPT-5模型“发现”了10个Erdős数学难题的解决方法,但后续被证实仅是检索到了已存在的文献,引发了关于AI能力夸大宣传的讨论 [1][14][16] 事件经过 - 2025年10月12日,OpenAI研究员Sebastien Bubeck发推称GPT-5在文献搜索方面表现超凡,解决了官方数据库中标记为未解的Erdős问题339,并指出该问题实际在20年前(2003年)已被解决 [4][5] - 10月17日,OpenAI研究人员Mark Sellke更新称,通过数千次查询,使用GPT-5模型对Erdős问题网站进行调查,“发现”了10个问题的解决方案(问题编号:223、339、494、515、621、822、883、903、1043、1079),并在另外11个问题上取得部分进展 [6][8] - OpenAI高管(如首席产品官Kevin Weil、副总裁Sebastien Bubeck)转发相关帖文,并宣称“AI加速科学已正式开始”,导致公众和媒体普遍误认为GPT-5在数学推理上取得重大突破 [9][12][14] - 事件迅速反转,谷歌DeepMind CEO Demis Hassabis指出其表述“很尴尬”,并引导关注网站维护者数学家Thomas Bloom的澄清 [16][17] - Thomas Bloom澄清称,网站将问题标记为“未解决”仅代表其个人不知晓解答已发表,并非数学界未解决,GPT-5实际扮演了高效学术搜索引擎的角色 [17][18] - 随后,Sebastien Bubeck和Kevin Weil均删除帖文并道歉,承认表述造成误解 [18][19] 行业反响与讨论 - Meta首席AI科学家Yann LeCun等人指出,过去几个月对大型语言模型(LLM)是“灾难性的”,列举了包括苹果推理论文证实LLM无法解决分布偏移、GPT-5发布延迟且表现不及预期、图灵奖得主Rich Sutton同意对LLM的批评、以及Karpathy认为智能体技术远未成熟且AGI还需十年等事例 [25][26][27][28][29][30] - 数学家陶哲轩(Terence Tao)认为,AI在数学领域的近期潜力在于使用中等强度工具加速平凡但耗时的研究任务(如文献综述),而非直接解决最难题,并强调人类专家需指导、验证并整合AI输出 [33][34][35][36] - 有观点指出,AI实验室存在因融资压力而进行夸大宣传的激励问题,因为同行评审耗时数月,而发布新闻稿只需几秒 [38]
李飞飞发布全新世界模型RTFM;德勤向澳洲政府退钱;OpenAI放宽成人内容引发争议|一周AI要闻回顾
36氪· 2025-10-18 17:07
世界模型与生成式AI技术突破 - 斯坦福大学李飞飞团队发布实时生成式世界模型RTFM,仅需单张或多张2D图像即可生成3D一致场景,无需显式3D表征,并能精准建模几何、反射等物理现象 [2] - RTFM模型在单块H100 GPU上即可实现实时渲染,解决了世界模型长期存在的可扩展性难题,其研发公司World Labs已获2.3亿美元融资,计划于2025年推出产品 [2] - OpenAI完成Sora2模型重大升级,免费用户视频生成时长提升至15秒,Pro用户可生成25秒视频,并新增音频生成功能,可自动匹配环境音、对话及背景音乐 [4] - 谷歌发布Veo 3.1视频生成模型,新版本在音频输出、精细化编辑控制以及图像转视频效果方面均有提升,允许用户向视频中添加对象并使其自然融入原有画面风格 [5] - 上海AI Lab推出科研智能体FlowSearch,该智能体在多个权威科研基准上表现突出,通过动态结构化知识流构建科研任务的多层依赖图,实现任务的并行探索与自适应优化 [5] AI基础设施与硬件创新 - 微软推出新一代热交换单元(HXU),在物理尺寸基本不变的情况下散热性能比上一代产品提升一倍,可支持单机架超过240千瓦的功率密度 [6] - 甲骨文披露AI基础设施项目毛利率可达35%,举例一个为期六年、总收入600亿美元的项目,公司剩余履约义务(RPO)超过5000亿美元 [12] - 谷歌宣布将在印度安得拉邦投资150亿美元建立一座1吉瓦的数据中心和AI中心,该投资将在未来五年内完成,标志着谷歌在印度的最大投资 [12] - 谷歌DeepMind与Commonwealth Fusion Systems合作,利用深度强化学习和开源等离子体模拟器TORAX,开发AI驾驶员实时控制SPARC核聚变装置 [11] AI应用商业化与市场动态 - 淘宝新增6款AI导购应用,包括"AI万能搜"、"AI帮我挑"、"AI试衣"等,AI美工月均生成2亿张图片及500万个视频,带动商品点击率提升10% [4] - 字节跳动旗下AI助手豆包月活跃用户达1.57亿,超越DeepSeek的1.43亿,成为中国最受欢迎AI应用,其成功源于字节跳动打造"爆款应用"的成熟经验 [6][7] - OpenAI的Sora应用上线首周在美加两地通过邀请制获得62.7万次iOS下载,已超越ChatGPT首发同期表现,并迅速登顶美国AppStore免费榜 [4] - 自今年5月谷歌视频编辑平台Flow上线以来,用户已在该应用上创作了超过2.75亿个视频 [5] AI模型训练与成本优化 - 腾讯提出名为Training-Free GRPO的无训练组相对策略优化方法,该方法无需调整模型参数,只需在提示词中学习简短经验即可显著提升模型性能 [7] - 独立研究机构报告指出,大型语言模型训练成本急剧上升,GPT-3训练成本约为5000万美元,GPT-4升至5亿美元,而GPT-5则耗资50亿美元,但性能提升并不显著 [14] - OpenAI年化经常性收入约为130亿美元,其中约70%来自ChatGPT用户的订阅费用,但付费用户比例仅为5%,公司今年上半年运营亏损高达约80亿美元 [8] AGI发展与行业标准 - 图灵奖得主Yoshua Bengio联合多机构提出AGI新定义,将其定义为能匹配或超越受过良好教育成年人的认知广度和熟练度的人工智能 [13] - 研究团队设计量化评估方法,评估显示2023年GPT-4得27分,2025年GPT-5提升至58分,但距离100分的AGI标准仍有较大差距,尤其在视觉、听觉和长时记忆存储领域存在显著短板 [13] 行业竞争与人才流动 - 苹果公司AI搜索业务负责人Ke Yang离职并加入Meta,这是苹果AI团队近期一系列高管离职中的最新一例,此前苹果AI模型负责人Ruoming Pang也已转投Meta [9][10] - 微软正将其Windows操作系统全面重构为围绕AI的新生态,为所有Win11 PC注入AI能力,公司愿景是"围绕AI重写整个操作系统",打造真正的AI PC [11]
腾讯研究院AI每周关键词Top50
腾讯研究院· 2025-10-18 10:33
算力与芯片 - 万里眼推出超高速示波器 [3] - 英伟达发布个人AI超算 [3] - 苹果发布M5芯片 [3] - OpenAI自研AI芯片 [3] 模型进展 - Anthropic发布Claude Haiku 4.5模型 [3] - 谷歌预告Gemini 3.0并开启Gemini 3.0 Pro内测 [3] - 阿里推出Qwen3-VL模型 [3] - Mamba发布Mamba-3模型 [3] - Meta研究概念分割技术 [3] - 谷歌提出ReasoningBank框架 [3] 应用与产品 - 谷歌发布视频生成模型Veo 3.1 [3] - 阿里为Qwen Chat增加记忆功能 [3] - 火山引擎推出语音合成2.0技术 [3] - 科大讯飞发布翻译耳机 [3] - OPPO推出ColorOS 16系统 [3] - Karpathy发布nanochat应用 [3] - 微软推出文生图模型 [4] - 腾讯优图实验室发布Youtu-Embedding技术 [4] - QQ浏览器进行AI功能升级 [4] - LiblibAI推出AI创作工作室 [4] - GPT和Gemini在天文奥赛中夺金 [4] - 苹果研发AI眼镜 [4] - 陶哲轩测试GPT-5 Pro [4] - Chamath转向使用中国模型 [4] - Every Cure利用AI攻克绝症 [4] 科技与研发 - 谷歌和耶鲁合作开发抗癌神器 [4] - 港科大和英伟达推出NewtonBench [4] - SpaceX星舰进行第11次飞行 [4] - 宇树科技推出功夫小子机器人 [4] - 《时代周刊》发布最佳发明榜单 [4] 行业观点与趋势 - Andrew Tulloch重返Meta [4] - Anthropic探讨预训练与后训练的平衡 [4] - LangChain和Manus关注上下文工程 [4] - 谷歌发布AI使用报告 [4] - NVIDIA提出AI工厂概念 [4] - Anthropic探讨AI设计AI的可能性 [4] - Ilya Sutskever参与AGI实现讨论 [4] - Philippe Aghion讨论AI经济奇点 [4] - 宾大研究AI的语气影响 [4] - ARK Invest分析AI与GDP的关系 [4] - 行业探讨AI机遇的正反面 [4] - Sam Altman讨论工作性质的改变 [5] - 斯坦福研究Agentic上下文 [5] - Rich Sutton讨论AI泡沫破裂 [5] - State of AI Report发布AI年度报告 [5] - Hinton提出AI有意识的观点 [5] 行业生态 - 腾讯设立青云奖学金 [4] - 腾讯研究院进行中国公众对生成式AI看法的年度调研 [7]
AGI今天起有了量化标准!Bengio牵头定义,当前进度条58%
量子位· 2025-10-17 12:58
AGI定义与评估框架 - 研究团队提出AGI可衡量定义为"能匹配或超越受过良好教育成年人的认知广度和熟练度的人工智能" [2] - 该定义包含两个关键维度:以"受过良好教育的成年人"为具体参照系,强调在多个核心认知领域的全面性表现 [4] - 基于CHC理论将人类通用智力拆解为10个相互独立但关联的核心认知领域,形成包含500余道题目的AGI评估题库 [6][7][8] 当前AI模型表现评估 - 2023年GPT-4总分为27分,2025年GPT-5总分提升至58分,两年间分数增幅超过115% [10][11] - 即使GPT-5也尚未突破AGI及格线100分的半程线,在长时记忆存储领域得分为0分 [13] - 评估采用百分制,每个认知领域满分10分,系统总分达到100分即判定为达到AGI水平 [8] AI模型优势领域分析 - 当前AI优势高度集中于知识储备与符号处理类领域,GPT-5在知识、读写、数学三个领域得分都超过8分 [17][18] - 知识领域评估显示GPT-5在常识、科学、社会科学、历史、文化方面得分分别为2%、2%、2%、2%、1%,总分9% [19] - 读写领域GPT-5在字母、阅读、写作、用法方面得分分别为1%、3%、3%、3%,总分10%;数学领域算术、代数、几何、概率、微积分均得2%,总分10% [20][21] AI模型核心短板分析 - AI在感知、记忆、推理等基础认知领域存在致命短板,无法通过单纯扩大规模弥补 [23] - 视觉领域GPT-5在感知、生成、推理、空间扫描方面得分分别为2%、2%、0%、0%,总分4%;听觉领域语音编码、语音识别、语音、节奏、音乐判断得分分别为0%、4%、2%、0%、0%,总分6% [25][26] - 长时记忆存储领域GPT-4和GPT-5在联想、有意义、逐字记忆方面均为0分;长时记忆提取领域流畅性得4%,幻觉控制得0%,总分4% [27][28][29] 技术局限性分析 - 部分大模型通过技术手段掩盖短板,如扩大上下文窗口假装具备长期记忆能力,依赖联网搜索功能补充知识 [31][32] - 评估体系明确排除外部工具辅助,仅衡量AI系统的原生认知能力,聚焦于智力本身 [33] - 即使总分再高,核心领域零分的AI本质上是有严重缺陷的"残次版"智能 [34]
“AI教母”李飞飞的全新世界模型问世!一张英伟达AI芯片就能生成无限3D世界
钛媒体APP· 2025-10-17 10:53
公司产品与技术 - World Labs发布全新实时生成式世界模型RTFM 该模型基于大规模视频数据进行端到端训练 是一款效率极高的自回归扩散Transformer模型 [2][3] - RTFM模型的核心突破在于不依赖显式3D表征 仅通过输入1张或多张2D图像就能直接生成不同视点的全新2D图像 可精准建模3D几何 反射 阴影等复杂物理现象 [3] - 模型具备高效性 可扩展性 持久性三大核心优势 仅需一块英伟达H100 GPU芯片即可实现实时渲染和交互式体验 [4][8] - 模型通过"带位姿帧空间记忆"与"上下文调度"技术实现世界场景的持久性 确保用户长时间交互也能保持场景一致性 [8] - 公司未来规划将构建空间智能大模型LWM 该模型将支持AR并最终作用于机器人技术 改进自动驾驶汽车 自动化工厂 人形机器人等领域 [10] 行业影响与发展路径 - 该模型技术被业内称为"学会渲染的 AI" 真正解决了长期困扰世界模型可扩展性的问题 [3][6] - "空间智能+世界模型"成为AGI重要发展路径之一 强大的世界模型能实时重建 生成并模拟物理精确的世界 将彻底改变软件 机器人等很多领域和产业 [7] - 生成式世界模型正处在绝佳位置 将从持续降低的算力成本中获益 [4] - 公司联合创始人李飞飞认为 语言 空间 视觉 具身智能等多种AI技术正在融合 并开始真正改变人类社会 [12] 公司融资与估值 - World Labs于今年9月获得2.3亿美元(约合人民币16亿元)融资 由a16z NEA恩颐投资和Radical Ventures领投 AMD Adobe Databricks的风投部门和Shinrai Investments LLC以及英伟达创投部门参与投资 [10] - 公司成立仅3个月估值便达到10亿美元(约合70亿元) 团队约24人 其中华人面孔约占据三分之一 [10] 相关研究项目 - 李飞飞团队还打造了Behavior视觉挑战比赛 并于今年10月正式发布Behavior 1K 这是一个包含1000个任务的综合仿真基准与训练环境 主要聚焦日常家庭环境中的"长时序任务" [11][12] - Behavior项目旨在解决机器人学习中的三大痛点 任务缺乏标准化 缺乏统一的任务体系以及缺乏训练数据 为全球研究者提供开放源码的训练与评测平台 [11]