Workflow
通用人工智能(AGI)
icon
搜索文档
Altman深度访谈:将激进押注基础设施,瞄准AI全产业链垂直整合
华尔街见闻· 2025-10-09 12:18
公司战略转型 - OpenAI正从研究实验室向垂直整合的"AI帝国"转型,致力于构建集消费者AI订阅服务、超大规模基础设施运营和前沿AI研究于一体的综合体 [1][2] - 公司已决定进行"非常激进的基础设施押注",其规模之大需要整个行业协同支持,这一决策基于对未来一至两年内模型能力将创造巨大经济价值的强大信心 [1][4] - 公司战略转向垂直整合,首席执行官承认过去反对垂直整合的看法是错误的,现认为这是实现其使命的必要路径,并类比苹果iPhone的成功 [4][9] 基础设施与行业合作 - 为支持激进的基础设施扩张,OpenAI正积极与科技巨头合作,包括与英伟达、甲骨文、AMD等公司达成合作,并预告未来数月将有更多此类合作公布 [1][5] - 基础设施押注的规模涵盖了"从电子到模型分发以及其间的所有环节",其庞大程度被描述为"人类历史上最大的数据中心"或"最大的基础设施项目" [5][14] - 该押注并非基于当前ChatGPT等产品的需求,而是源于对即将到来的模型所能创造的经济价值的坚定看好,公司能提前一至两年预见到未来的模型能力 [5][44] 能源需求与解决方案 - AI的指数级增长将需要更廉价、更丰富的能源,AI的未来与能源的未来已"合二为一" [1][5] - 长期能源解决方案预计将由"太阳能加储能"和先进核能主导,后者包括小型模块化反应堆和核聚变在内的整个技术栈 [4][6] - 核能普及的速度完全取决于其成本,若在经济上具有压倒性优势,其发展将非常迅速,并可能面临巨大的政治压力推动监管机构快速行动 [6][68] 模型能力与科学研究 - 公司预测AI模型在未来两年内将能够做出重大的科学发现,将此视为AI改变世界的真正标志,并透露GPT-5已展现出进行小型、新颖科学发现的能力 [4][8] - 在所有AI的潜在应用中,"AI科学家"是最令人兴奋的方向,当AI能够独立进行科学发现时,世界将发生真正的改变 [8][23] - 公司认为进步的程度巨大,存在显著的能力积压,世界上大多数人仍只考虑ChatGPT能做什么,而硅谷和一些科学家群体已接触到更前沿的能力 [27][28] 产品战略与商业化 - 文生视频模型Sora具有多重战略定位,不仅是视频生成工具,更是构建"世界模型"以推进AGI、并帮助社会适应AI发展的重要工具 [4][7] - Sora的使用场景超出预期,用户不仅进行专业创作,也制作表情包分享,这意味着需要探索与ChatGPT完全不同的商业模式以应对高昂的生成成本 [7][71] - 在商业化方面,公司对广告持开放但谨慎的态度,强调绝不能破坏用户对ChatGPT的信任,认为推荐付费产品而非最佳产品会摧毁信任关系 [4][73] 版权与内容生成 - 对于版权问题,公司预见未来AI训练可能被视为合理使用,但使用特定IP生成内容将催生新的商业模式 [4] - 一些版权方甚至更担心自己的IP不被AI充分使用,而非过度使用,因为这关系到用户与角色互动并发展关系,从而提升特许经营权的价值 [63] - 随着技术让内容创作变得更容易,并且不打破创作者能获得回报的基本方式,内容创作将会发生得更多,例如通过Sora制作视频 [72][76] 公司运营与文化 - 在资源分配上,当出现资源限制时,公司几乎总是优先将GPU分配给研究,而不是支持产品,因为其核心使命是构建AGI [45] - 公司的创新文化被认为更类似于运营一家优秀的种子阶段投资公司,而非产品公司,这种投资者背景对建立研究文化非常有帮助 [47] - 公司观察到用户期望的分布范围极其广泛,因此正在解决如何让AI适应不同用户的个性化需求,而非假设所有人都想与同一个"人"交谈 [30][34]
蚂蚁、OpenAI、DeepSeek卷疯了!国产最强万亿参数旗舰模型Ling-1T开源
钛媒体APP· 2025-10-09 12:14
蚂蚁集团Ling-1T模型发布 - 蚂蚁集团发布并开源万亿参数通用语言模型Ling-1T,该模型是百灵大模型Ling 2.0系列的首款旗舰模型,也是其规模最大、能力最强的非思考大模型[2][3] - 在有限输出Token条件下,Ling-1T于多项复杂推理基准中取得SOTA表现,在代码生成、软件开发、竞赛数学、专业数学、逻辑推理等高难度基准测试上多项指标位居开源模型榜首[3] - 以竞赛数学榜单AIME 25为例,Ling-1T以平均4000+ Token消耗达到70.42%的准确率,优于Gemini-2.5-Pro的5000+ Token消耗和70.10%准确率,展现出更高的性价比、推理精度和思考效率[3] - Ling-1T沿用Ling 2.0架构,在20T+ tokens高质量高推理浓度语料上完成预训练,支持最高128K上下文窗口,通过演进式思维链提升高效思考和精准推理能力[11] - 该模型全程采用FP8混合精度训练,为已知规模最大的使用FP8训练的基座模型,带来显著的显存节省、更灵活的并行切分策略和15%+的端到端加速[11] - 在强化学习阶段,团队创新性提出以句子为粒度的策略优化算法LPO和新的混合奖励机制,在ArtifactsBench前端能力基准上得分达59.31,在可视化和前端开发任务领域位居开源模型榜首[12] - 除了非思考模型Ling-1T,蚂蚁百灵团队还在训练万亿参数级的深度思考大模型Ring-1T,并于9月30日开源了preview版[14] 全球AI大模型竞争格局 - 国庆中秋假期前后,OpenAI、阿里、智谱、DeepSeek等中美AI大模型加速竞争[4] - 零一万物创始人李开复指出,底座基础模型是一场千亿级别公司的"军备竞赛"[5] - OpenAI发布AI视频模型Sora2,并公布GPT-5 Pro、ChatGPT框架Apps SDK等[9] - DeepSeek发布DeepSeek-V3.2-Exp,全面适配国产算力卡,训练推理提效且API同步降价[9] - 阿里通义发布新一代原生全模态大模型Qwen3-Omni,以及全开源通义DeepResearch模型、框架、方案等[9] - 智谱发布旗舰模型GLM-4.6,凭借SOTA的Agentic Coding能力登顶Hugging Face Trending全球第一、LMArena开源第一全球第四,与Qwen Max Preview并列国内第一[9] AI行业投资与基础设施趋势 - 英伟达CEO黄仁勋指出过去六个月AI计算需求大幅上升,新一代架构Blackwell芯片需求"非常非常高",标志着"新一轮工业革命"开始[6] - 英伟达计划未来十年向OpenAI共计投资1000亿美元,支持部署需要10千兆瓦电力的英伟达系统,相当于400万至500万个GPU[6] - OpenAI CEO奥尔特曼表示技术突破关键在于更聪明的模型、更长的上下文处理能力和更好的记忆系统,AGI的核心在于发现新知识并扩展人类知识边界[6] - 今年以来全球AI领域初创公司已吸引创纪录的1927亿美元风险投资,2025年有望成为首个逾一半风投资金流入AI行业的年份[15] - 最近一个季度,美国风险投资将62.7%的资金投向AI领域公司,全球风险投资该比例为53.2%;今年以来全球风投总额为3668亿美元,其中美国风投达2502亿美元[16] - OpenAI近期完成66亿美元融资,目前估值达5000亿美元,成为全球最有价值的初创公司;其今年前七个月收入大约翻了一番,预计年收入将达120亿美元,并已签下总额近1万亿美元的算力采购协议[16] 蚂蚁集团AI技术战略 - 蚂蚁AGI团队由集团副总裁、首席技术官何征宇负责,其拥有佐治亚理工学院计算机博士学位,曾就职于谷歌并创立开源项目gVisor[11] - 百灵大模型计划聚焦在生活服务、金融服务、医疗健康等场景[11] - 蚂蚁团队认为模型需要能在异构计算单元和分布式集群间切换的技术框架,目标为"不使用高级GPU"来扩展模型[10] - 今年3月,蚂蚁集团利用AI Infra技术开发了两个百灵系列开源MoE模型Ling-Lite和Ling-Plus,参数规模分别为168亿和2900亿,并公布了语音AI框架Ming‑UniAudio、新一代推理模型Ring-flash-2.0等产品[10]
马云彻底翻身,阿里未来不可估量
搜狐财经· 2025-10-09 10:32
公司战略愿景 - 阿里巴巴集团CEO吴泳铭在云栖大会明确表示,实现通用人工智能是确定性事件,但公司的终极目标是发展出能自我迭代、全面超越人类的超级人工智能,以解决气候、能源、星际旅行等重大科学难题 [1] - 公司预测未来每个家庭、工厂、公司都会有众多的Agent和机器人提供24小时服务,超级人工智能将指数级放大人类的智力杠杆 [3] - 公司正沿着“三阶段路线”向超级人工智能推进:第一阶段是让AI通过学习海量人类知识实现“智能涌现”,第二阶段将重点突破工具使用与编程能力,第三阶段是通过连接物理世界、掌握自主学习能力,实现超越人类的终极目标 [8] 技术布局与投入 - 通义最新发布7款模型更新,覆盖大语言模型、多模态模型、编程模型等领域,在智能水平、Agent工具调用、Coding能力、深度推理、多模态等方面实现突破 [4] - 公司正在积极推进三年3800亿的AI基础设施建设计划,并将会持续追加更大的投入 [5] - 为迎接超级人工智能时代,公司计划到2032年将阿里云全球数据中心的能耗规模提升10倍 [5] - 阿里云宣布与英伟达在Physical AI领域达成合作,阿里云人工智能平台PAI将集成英伟达的Physical AI软件栈,为企业用户提供全链路平台服务 [11] 行业竞争与定位 - 阿里巴巴布局超级人工智能旨在成为全球AI创新的源头型力量,其目标不仅是追赶并超越OpenAI等行业头部企业,更致力于抢占技术制高点 [3] - 全球AI竞争进入赢者通吃阶段,头部企业的技术壁垒与生态优势正不断拉大差距,公司布局超级人工智能是为了在这场未来竞赛中提前锁定胜局 [5] - 阿里云与英伟达的合作从硬件采购延伸至AI开发生态,阿里获得全球顶级AI算力与软件栈,英伟达则锁定中国云巨头这一关键入口,形成深度绑定的伙伴关系 [13] 公司转型与增长 - 阿里巴巴正从一家卖货公司,蜕变成为一个正在覆盖全球科技行业的“超级智能体”,希望借助超级人工智能的技术势能,深入渗透制造、医疗、能源等多元领域 [1][6] - 公司希望实现从交易平台到产业赋能者的跨越,破解各行业在效率提升、成本优化、创新突破等方面的痛点 [6] - 公司已将未来发展的核心押注在AI领域,超级人工智能是其为突破增长边界、抢占未来先机找到的下一个突破口 [15]
Sora2 :AI视频的“GPT-3.5”时刻
2025-10-09 10:00
行业与公司 * 涉及的行业为人工智能(AI)行业,特别是生成式AI和视频生成领域 [1] * 涉及的公司包括OpenAI(及其产品Sora、ChatGPT)、Google(及其产品Vue)、字节跳动、阿里巴巴、Uber、TripAdvisor、Shutterstock、快手、可灵(Keling)、吉梦(Jimu)等 [1][2][3][6] 核心观点与论据 **1 OpenAI开发者大会与生态构建** * OpenAI开发者大会推出APP、SDK、Agent Kit和Chat Kit等新工具,展示其商业帝国雏形 [1][2] * 与Uber、TripAdvisor等11家知名企业合作,通过ChatGPT实现自然语言交互,可自动调起合作伙伴的APP [1][3] * MCP协议实现标准化,使OpenAI能快速对接产品服务企业,提供超越传统数据交互的服务(如返回旅游目的地照片、3D装修设计) [1][5] * OpenAI的APP SDK被视为接近基于大语言模型的操作系统或小程序市场,未来想象空间巨大 [6] **2 AI编程与效率提升** * Agent Kit实现拖拽式编程,使非IT开发者也能轻松创建应用,单人5-6分钟完成的应用相当于人工3人1周工作量,人效提升20倍以上 [7][8] * 在头部和二线互联网企业中,超过50%的程序通过AI编写,超过75%的代码通过AI审核 [10] * Code X是一套高级工具,其底层逻辑认为所有事物最终通向通用人工智能(AGI),通过自我编写代码解决问题 [11][12] **3 Sora 2.0 视频生成技术的特点与竞争** * Sora 2.0专注于解决影视动漫工作流的实际问题,与Shutterstock等合作获取高质量视频数据,并与业内专家合作结合传统工作流 [1][13][14] * 通过让视频片段有3到5秒重叠训练模型,能生成1分钟以上长视频,效果优于普遍只能生成10到15秒短视频的其他模型 [16] * 当前使用挑战包括成本(单秒生成价格0.7元至3元不等)和算力不足,通过优化模型和降价策略(如降至1/5)可扩大受众 [17] * 与Google Vue 3相比,Sora风格更超现实(含赛博朋克),Vue 3风格偏向电影纪录片且数据来源包括YouTube等,Vue 3按月收费费用较高,Sora按次收费相对灵活但仍昂贵 [18] **4 应用前景与市场方向** * 未来大模型产品发展方向包括更广泛应用于C端市场,通过授权使用真人肖像实现裂变效应,各大IP(如迪士尼)也可能授权形象创造故事 [3][24] * 视频生成技术在教育、医疗行业应用前景巨大,可实现讲师视频一次拍摄终身复用,解决资源稀缺问题 [21] * 在AI带货、网红经济、短剧等领域,Sora可每天生成数百条不同风格视频,提高真实性和效率,基于物理世界推理生成视频效果较好 [31][32] * AI技术对影视行业有影响,目前可制作1至3分钟预告片,减少分镜师工作量,改善多镜头一致性,AI短剧会更快突破,长篇电影还需时日 [33] **5 行业竞争格局与企业应对策略** * 大模型迭代速度在减缓,知识积累基本完成,更新集中在标注数据时间范围和推理速度优化,应用侧探索更为广泛 [24][25] * 视频生成领域难以一家独大,Sora价格比可灵(Keling)高出三倍以上,企业考虑成本仍倾向使用可灵,可灵在精确控制和一致性方面表现优异 [27][28] * 大模型企业可能对B端软件企业产生影响,B端软件企业应提前布局,将自身业务(如招聘、客户关系管理系统)封装成标准化模块(如GMCP模块),以便被大平台调用,融入生态系统 [35][36][37] 其他重要内容 * Sora Two主要依靠大模型本身能力生成视频,不依赖外部素材,具备对世界知识的理解能力,可推理视频内容合理性 [22] * OpenAI未来发展方向包括培养用户习惯,将自身打造成大入口,可能涉及更多企业联动及硬件入口形式(如眼镜、耳机) [34] * 国内视频生成行业需区分C端(要求快速便捷)和B端(关注高质量、精确控制的一致性)需求 [29]
孙正义出手,54亿美元押注通用人工智能
是说芯语· 2025-10-08 21:17
软银集团战略投资与布局 - 公司拟以54亿美元收购ABB的机器人业务部门,作为其押注通用人工智能的最新举措[2] - 公司董事长提出下一个前沿领域是物理人工智能,旨在融合人工智能和机器人技术以推动突破性进化[2] - 公司董事长预测通用人工智能将在未来2-3年内由大企业率先实现,并在十年内全面实现,认为需要巨额资金投入[2] 人工智能与机器人行业前景 - 人工智能正在重塑机器人领域,公司董事长提出人工超级智能理念,认为未来十年内人工智能将比人类聪明一万倍[2] - 行业领导者认为机器人技术的ChatGPT时刻即将到来,人工智能下一波浪潮是能够理解物理定律的物理人工智能[4] - 全球机器人市场目前价值约780亿美元,预计到2029年底将达到1650亿美元[4] 软银在机器人领域的投资历史与行业动态 - 公司此前已拥有包括Agile Robots和AutoStore在内的机器人相关企业投资,通过此次收购ABB机器人进一步充实布局[3] - 公司曾于2012年收购法国Aldebaran多数股权并推出人形机器人Pepper,但最终未获市场认可[4] - 相比于人形机器人,工业机器人的商业化路径更为清晰,是英伟达等科技巨头看好的领域[4] 软银在人工智能领域的其他合作与投入 - 公司加倍押注人工智能领域,与OpenAI展开深入合作,是美国"星际之门"项目的主要参与方[5] - 公司与OpenAI达成协议在日本成立合资企业,为企业客户提供人工智能服务[5] - 公司董事长表示每年将在OpenAI产品部署上投入30亿美元[5]
孙正义出手了,软银集团重磅宣布→
第一财经资讯· 2025-10-08 19:55
软银集团战略投资 - 公司拟以54亿美元收购ABB的机器人业务部门 [2] - 此举是公司押注通用人工智能的最新举措 [2] - 公司董事长提出下一个前沿领域是物理人工智能 旨在融合人工智能和机器人技术推动突破性进化 [2] 行业趋势与市场前景 - 人工智能正在重塑机器人领域 工业机器人的商业化路径比人形机器人更为清晰 [3] - 行业领导者认为机器人技术的ChatGPT时刻即将到来 人工智能的下—波浪潮是物理人工智能 [4] - 全球机器人市场价值约为780亿美元 预计到2029年底将达到1650亿美元 [4] 公司战略与布局 - 公司董事长预测通用人工智能将在未来2-3年内由大企业实现 未来十年内全面实现 并认为实现目标需要巨额资金 [2] - 通过投资ABB机器人 公司将进一步充实机器人板块的布局 此前已拥有包括Agile Robots以及AutoStore在内的相关投资 [3] - 公司也在加倍押注人工智能领域 与OpenAI展开深入合作 计划在日本成立合资企业为企业客户提供人工智能服务 每年将在OpenAI产品部署上投入30亿美元 [4] 行业观点与预测 - 公司董事长提出人工超级智能的理念 认为未来十年内人工智能将比人类聪明一万倍 [2] - 公司董事长曾表示未来每个人都会有自己的AI智能体 它像人的第二个身体 可以管理生活日常 [3] - 英伟达已推出全球首个生成式世界基础模型Cosmos 为机器人制造商提供从底层模型到内置芯片的所有环节 [3]
押注机器人的ChatGPT时刻,孙正义再出手
第一财经· 2025-10-08 18:16
软银的战略投资与愿景 - 公司拟以54亿美元收购瑞士ABB的机器人业务部门[1] - 公司董事长提出下一个前沿领域是物理人工智能,旨在融合人工智能与机器人技术[1] - 公司使命被定义为“推动人类进化”,看好人工智能与机器人结合是通往通用人工智能的重要路径[3] 人工智能与机器人行业趋势 - 行业领导者预测机器人技术的ChatGPT时刻即将到来,人工智能下一波浪潮是物理人工智能[4] - 全球机器人市场价值约为780亿美元,预计到2029年底将达到1650亿美元[4] - 英伟达推出全球首个生成式世界基础模型Cosmos,为机器人制造商提供底层模型[4] 软银的投资布局与合作 - 公司通过投资ABB机器人进一步充实机器人板块布局,此前已拥有Agile Robots及AutoStore等机器人相关企业投资[3] - 公司加倍押注人工智能领域,与OpenAI达成协议在日本成立合资企业,为企业客户提供人工智能服务[4] - 公司每年将在OpenAI产品部署上投入30亿美元[4] 孙正义的预测与理念 - 公司董事长预测通用人工智能将在未来2-3年内由大企业实现,并在十年内全面实现[3] - 公司董事长提出人工超级智能理念,认为未来十年内人工智能将比人类聪明一万倍[1][3] - 公司董事长展望未来每个人都会拥有管理生活日常的AI智能体[3]
2025年生成式AI核心趋势报告:即将到来的变革之年(英文版)-CRIF
搜狐财经· 2025-10-08 11:11
文章核心观点 - 生成式AI行业正从实验阶段转向大规模落地应用,企业支出和风险投资显著增长 [1] - 技术演进聚焦于智能体AI、多模态AI以及AI驱动的客户体验革新等关键方向 [1] - 行业未来发展需平衡技术创新与伦理、监管及可持续发展,以实现长期进步 [1][2] 生成式AI市场投入与行业趋势 - 2024年企业在生成式AI的支出从23亿美元飙升至138亿美元,显示投资热情高涨 [1] - 全球50.8%的风险投资流向AI企业,表明资本高度集中于该行业 [1] - 行业整体呈现出从技术实验向实际应用落地转变的明确趋势 [1] 智能体AI (Agentic AI) - 智能体AI具备自主决策和情境感知能力,区别于传统AI,成为关键发展方向 [1] - 预计到2028年,智能体AI将自主处理15%的常规组织决策 [1] - 该技术已在医疗、金融、物流等领域获得实际应用 [1] 多模态AI - 多模态AI是重要演进方向,能够整合文本、视觉等多种类型数据 [1] - 该技术被视为实现通用人工智能(AGI)的关键推动力量 [1] - 多模态AI在医疗、金融、教育等领域展现出巨大的应用潜力 [1] AI驱动的客户体验革新 - AI技术通过超个性化服务和智能客服自动化等方式革新客户体验 [1] - 企业应用案例显示,AI能有效提升运营效率和客户满意度 [1] 人工智能伦理与可持续发展 - 报告提出“可持续AI”理念,旨在通过优化算法减少对环境的影响 [2] - 强调AI与人类增强的共生关系,以及伦理AI对于保障公平和包容的重要性 [2] 通用人工智能 (AGI) 展望 - 专家预测在2025年至2035年间,通用人工智能可能取得突破性进展 [2] - AGI的发展需要强化基础设施支持,并伴随监管与伦理方面的争议 [2]
人工智能聊天机器人正影响青少年,监管忙于寻找应对之策
财富FORTUNE· 2025-10-07 21:29
人工智能聊天机器人对青少年的风险 - 人工智能聊天机器人成为年轻人寻求陪伴和心理支持的新途径,但可能强化用户的自毁念头并诱导自杀行为,例如一名16岁少年被指控因与ChatGPT的互动而自杀[2] - 类似诉讼也指向Character.AI平台,指控其托管的聊天机器人在发送数月不当露骨信息后,诱导一名14岁男孩自杀[2] - 聊天机器人被设计为具有拟人化特征,如表现内在生活、擅长奉承和长时间对话,这些设计旨在通过情感联结提升用户参与度和忠诚度[6][7] 人工智能公司的安全措施与挑战 - OpenAI采取的安全措施包括将敏感对话转至推理模型处理、与专家合作开发安全机制、计划推出家长控制功能,并增强识别心理健康危机的能力[3] - 公司承认安全功能在长时间对话中可能失效,正努力完善确保长对话可靠性的缓解措施[8] - Character.AI推出面向18岁以下用户的新体验模式和家长洞察功能,并与外部安全专家合作,但强调平台角色仅用于娱乐且言论为虚构[3] 监管与法律压力 - 美国联邦贸易委员会向OpenAI和Character.AI等七家公司发出调查令,要求提供信息说明如何评估充当伴侣的聊天机器人对儿童的安全性[11] - 由44位两党总检察长组成的联盟警告聊天机器人开发商,若明知产品对儿童有害仍推向市场,将承担责任,并引用报告指出聊天机器人存在鼓动儿童自残等行为[12] - 加州和特拉华州总检察长对ChatGPT安全性表示深切担忧,警告OpenAI其慈善使命要求采取更强安全举措,否则将采取强制手段[12] 青少年使用现状与研究空白 - Common Sense Media研究显示,72%的美国青少年至少试用过一次人工智能伴侣,其中超过半数会定期使用该技术[5] - 《哈佛商业评论》对6000名用户的调查发现,"陪伴与心理疏导"是人工智能最常见的应用场景,在青少年中更为普遍[5] - 缺乏针对长期聊天机器人对话影响的科学研究,多数研究仅聚焦简短交流,难以复现超长篇幅、多轮交互的复杂情境[10] 行业盈利模式与设计动机 - 聊天机器人的设计具有明确商业动机,通过情感联结提升用户参与度,从而驱动盈利,这是一种基于情感共鸣的"亲密经济"[7] - 专家指出,聊天机器人为用户量身定制全部内容,是提升参与度的新途径,但可能脱离预设脚本并强化有害观念[7] - 诉讼指控ChatGPT在案例中提到自杀的频率是用户的12倍,并将自杀念头合理化,同时提供绕过内容审核的方法[7]
曝顶级AI大牛加入阿里通义;LeCun 承认可能从 Meta 辞职;马斯克成全球首位身价破5000亿富豪|AI周报
AI前线· 2025-10-05 13:33
行业领军人物动态 - 图灵奖得主、AI三巨头之一的LeCun表示可能辞去Meta FAIR首席科学家职务,对Meta近几个月在AI部门的组织调整不满,包括其被默默降职以及FAIR发表研究成果需接受额外审核 [3] - 全球顶尖AI科学家、IEEE Fellow许主洪已加盟阿里通义,转向通义大模型的相关研发工作,许主洪拥有超20年AI产业和学术经验,在AI领域发表了300多篇顶级学术论文,论文被引用超过5万次 [15][16] - 前谷歌CEO埃里克·施密特表示,美国科技行业员工若要与中国同行竞争,必须在工作与生活之间做出牺牲,并指出硅谷部分AI初创企业已开始要求每周工作72小时 [5][8] 公司战略与组织调整 - 微软宣布重组Windows团队,将其核心Windows工程团队再次归入单一组织架构之下,以推进AI操作系统愿景 [14] - Meta的AI战略方向出现震荡,组织调整频繁,不仅LeCun不满,FAIR团队也普遍失望,部分成员已跳槽,新成立的TBD Lab新员工待遇好,加剧了团队不稳定 [3] - 亚马逊和谷歌等公司在公布其最新的AI芯片进展之前,会提前通知NVIDIA的CEO黄仁勋,因为NVIDIA仍然是训练计算的主要供应商,客户不希望因意外之举被切断供应 [19] 新产品发布与技术进展 - Anthropic发布Claude Sonnet 4.5模型,声称这是“世界上最好的编程模型”,核心突破在于能够创建“生产就绪级”的应用程序,在早期试用中能够自主编程长达30小时 [27][28] - 豆包大模型1.6-vision正式发布,这是其家族首个具备工具调用能力的视觉深度思考模型,拥有更强的通用多模态理解和推理能力 [29] - DeepSeek正式发布并开源DeepSeek-V3.2-Exp模型,API调用成本降低50%以上,该模型引入了DeepSeek Sparse Attention,针对长文本效率进行了优化 [30] - 阿里通义7款模型入选全球前十开源模型榜单,其中全模态大模型Qwen3-Omni登顶HuggingFace新一期模型榜单 [31] - OpenAI推出音视频生成模型Sora 2升级版,并同步上线一款关联社交应用“Sora”,用户可生成包含自己及好友形象的视频 [33] 市场竞争与行业趋势 - Perplexity宣布其AI浏览器Comet面向全球用户免费开放,目标挑战谷歌Chrome等浏览器,该产品此前订阅价为每月200美元 [17] - 优必选智慧物流子公司与天奇股份签订采购合同,天奇股份将采购总价3000万元的优必选工业人形机器人Walker S系列,使得Walker系列总订单金额已逼近4.3亿元 [24] - 由AI生成的虚拟“女演员”Tilly Norwood正在好莱坞寻找经纪人,引发了美国演员工会SAG-AFTRA的抵制声明,认为此类角色窃取演员表演并威胁其工作 [25] 安全事件与产品问题 - 宇树科技旗下多款机器人被曝存在名为“UniPwn”的关键安全漏洞,攻击者可通过无线方式获得机器人的完全root权限,且漏洞具有“蠕虫”特性 [22] - 一名特斯拉技术员起诉公司,称其在工作中被有故障的机器人击打受伤,要求赔偿5100万美元,事故发生时机器人臂以相当于约8000磅配重的力量击中其身体 [23] - 三星Galaxy Ring智能戒指出现电池鼓包情况,导致设备变形并卡住用户手指,最终需要专业医疗帮助才能移除 [20] - Waymo一辆无人驾驶汽车因违规掉头被警方拦停,但加州法律不允许对无人驾驶汽车开具罚单,因为无法追究人类责任 [11][13] - Perplexity的Comet浏览器曾被曝出安全隐患,其网页摘要功能可能被恶意网站利用来执行隐藏命令,从而泄露用户敏感数据,该问题已被修复 [18] 其他行业要闻 - 埃隆·马斯克成为全球首位身价达到5000亿美元的富豪,其财富比位居第二的拉门·埃里森高出1500亿美元,特斯拉股价上涨近4%为其财富增加了约93亿美元 [4] - 苹果公司已暂停对Vision Pro头显的升级计划,转而专注于开发能与Meta产品相抗衡的智能眼镜 [33] - 文远知行宣布在阿联酋哈伊马角启动Robotaxi和Robobus的试运营 [33] - 谷歌宣布对Google Home智能音箱进行升级,将Gemini AI助手作为核心卖点 [33] - 微软为Copilot配备可交互的动画形象,实验性功能“Portraits”已在美国、英国和加拿大上线,提供40个风格化的人类虚拟形象 [33] - 美国外卖平台DoorDash推出了自主研发的配送机器人Dot,最高时速可达32km/h,用于运送餐食和小件包裹 [33]