主权AI
搜索文档
腾讯研究院AI速递 20251017
腾讯研究院· 2025-10-17 07:06
谷歌视频生成模型Veo 3.1 - 谷歌发布视频生成模型Veo 3.1,具备更强叙事与音频控制、首尾帧与多图参考等精控功能,并接入Gemini API与Vertex AI [1] - 模型支持720p或1080p分辨率24fps视频,原生时长4-8秒,使用Extend功能最长可扩展至148秒,可合成多人物场景并实现音画同步 [1] - 用户已在Flow中生成超过2.75亿个视频,但成片质感较Veo 3进步有限,基础物理表现有所改善但人物表演与复杂调度仍存在问题 [1] Anthropic轻量模型Claude Haiku 4.5 - Anthropic发布轻量级模型Claude Haiku 4.5,编码性能可与Claude Sonnet 4相媲美,成本仅为其三分之一(每百万输入token 1美元,输出5美元),推理速度提升一倍多 [2] - 在计算机使用基准OSWorld上得分50.7%超越Sonnet 4的42.2%,数学推理测试中借助Python工具成绩高达96.3%远超Sonnet 4的70.5% [2] - 模型主打实时低延迟任务场景如聊天助手、客服、协同编程,通过严格安全性评估,偏差行为发生率显著低于其他Claude模型 [2] 阿里通义千问记忆功能 - 阿里通义千问正式上线Qwen Chat Memory功能,使AI能够记录并理解用户在过去对话中的重要信息,包括个人偏好、兴趣方向或特定任务背景 [3] - 该功能可跨越多轮甚至多天对话保留个性化认知,是AI助手向长期陪伴型智能体迈出的关键一步 [3] - 所有记忆内容可由用户查看、管理和删除,用户拥有完整控制权,首先在网页版Qwen Chat上线,未来推广至更多终端 [3] 字节跳动语音模型升级 - 火山引擎升级豆包语音合成模型2.0和声音复刻模型2.0,通过Query-Response能力实现情境理解与语气把控,可通过细节描述精准生成对应情感 [4] - 语音合成2.0提供默认模式、语音指令和引入上文三种模式,可控制整段情绪基调、方言类型、语速音调等,模型能自动理解上下文情绪连贯生成 [4] - 声音复刻2.0可精准复现动漫人物和真人音色语速情绪,对公式朗读测试准确率接近90%,在教育场景专项优化 [4] 谷歌与耶鲁大学AI抗癌研究 - 谷歌与耶鲁大学联合发布270亿参数大模型Cell2Sentence-Scale(C2S-Scale),基于Gemma模型构建,提出并验证让肿瘤对免疫系统更易被识别的全新抗癌假设 [5][6] - 模型通过双环境虚拟筛选流程对4000多种药物进行模拟,发现激酶CK2抑制剂silmitasertib仅在免疫信号活跃环境中显著增强抗原呈递,该预测已在体外实验中多次验证 [6] - 研究展示AI模型生成原创科学假设的潜力,有望打开人类抗癌新途径,模型及代码已在Hugging Face和GitHub全面开放 [6] AI模型训练与工程挑战 - Anthropic预训练团队负责人强调预训练核心是推动损失函数下降,如何平衡预训练和后训练、各自作用叠加还是互补仍在早期探索阶段 [7] - 当前AI研究最大瓶颈是计算资源受限而非算法突破,真正的挑战在于如何有效利用算力并解决规模扩展中的工程难题 [7] - 对齐问题核心是让模型分享人类目标,预训练与后训练各有优势,后训练迭代快适合调整模型,某些对齐可融入预训练增强鲁棒性和智能性 [7] 上下文工程技术 - LangChain创始工程师与Manus联合创始人探讨上下文工程,强调AI Agents执行复杂长期任务时上下文窗口会因大量工具调用急剧膨胀导致性能下降 [8] - 有效的上下文工程通过卸载、精简、检索、隔离和缓存等技术,将恰到好处的信息填入上下文窗口,Manus设计了基于多层阈值的自动化流程协同使用压缩和总结 [8] - 核心设计哲学是避免上下文过度工程化,最大性能飞跃来自简化架构和信任模型,优先选择上下文工程而非过早模型专业化 [8] AI在开发领域的应用现状 - Google Cloud DORA 2025报告显示90%开发者已在日常工作中使用AI,每天中位数使用时长2小时约占工作日四分之一,但只有24%表示高度信任AI输出 [9] - AI不是单向效率药丸而是放大镜,在文化健康协作顺畅团队中作为加速器提升效率,但在环境存在问题的团队会放大裂缝导致交付更加不稳定 [9] - 报告首次提出七种典型团队人设和DORA AI能力模型,包括用户导向、版本控制、数据可用性等七项关键能力 [9] NVIDIA发展历程与AI战略 - 黄仁勋回顾1993年红杉100万美元投资NVIDIA,三十年后成长为超过1万亿美元市值实现100万倍回报,强调从第一性原理推演未来是突破关键 [10] - CUDA的诞生让GPU从图形设备变成通用加速平台,2012年AlexNet在ImageNet竞赛获胜成为转折点,NVIDIA为神经网络开发CUDNN库使模型训练速度成倍提升 [11] - AI工厂核心是系统整合而非芯片性能,从建筑供电到软件栈提供完整算力生产线,主权AI成为新一轮国家竞争核心 [11]
台积电,挣疯了
半导体芯闻· 2025-10-16 18:43
2025年第三季度财务业绩 - 第三季度税后净利润达4523亿元新台币,创下单季历史新高,同比增长39.1% [1] - 第三季度合并营收为9899.2亿元新台币,同比增长30.3%,以美元计算营收为331亿美元,同比增长40.8% [11] - 第三季度毛利率为59.5%,营业利益率为50.6%,税后纯益率为45.7% [11] 2025年全年业绩展望 - 公司将全年美元营收成长幅度从7月预测的接近30%,上修至mid-thirties百分比(约34%-36%)[2][8][11] - 第四季度营收展望为322亿至334亿美元,毛利率预计介于59%-61%之间,营业利益率预计介于49%-51%之间 [11] 资本支出规划 - 2025年资本支出区间调整为400-420亿美元,平均值410亿美元较先前平均400亿美元增加 [3][12] - 2025年前三季美元资本支出已达293.9亿美元 [3][12] - 资本支出分配中,约70%用于先进制程,10%-20%用于特殊制程,10%-20%用于先进封装、测试与光罩制造 [12] 人工智能(AI)需求驱动 - AI投资热潮是业绩增长主要驱动力,公司受益于辉达、OpenAI等科技巨头的需求 [1] - 公司观察到大型语言模型词元数量爆炸性增长、企业AI和主权AI的兴起,持续带动对先进半导体的需求 [9] - 公司对AI业务前景非常乐观,回应未来几年AI业务年复合成长率可维持约40%或更高 [5][6] 先进制程与技术进展 - 2纳米(N2)制程进展顺利,预计第四季度进入试量产,2026年快速量产 [13] - N2P制程预定2026年下半年量产,A16制程专为高效能运算设计,也预计2026年下半年量产 [13] - 公司强调创新焦点从单一芯片微缩扩大到“整体系统效能”的协同设计,通过整合前段、后段与先进封装提升性能 [6] 全球布局与产能规划 - 全球布局遵循三大原则:客户需求、地理弹性及政府支持 [12] - 美国亚利桑那州厂计划加速导入N2及更先进制程,日本熊本厂第二座厂已动工,欧洲德国厂已启动建厂 [12][13] - 在台湾将持续强化先进制程与先进封装能力,于新竹与高雄科学园区准备多座2纳米生产基地 [12] 市场环境与风险管理 - 公司面临全球贸易环境挑战,包括美国对台湾可能加征的20%关税以及美国要求半导体产能“五五分”的压力 [1] - 公司定调全球AI基础设施升级趋势不改,即使特定市场短期受限,长期成长趋势非常正向 [5][6] - 非AI相关的终端市场已触底并出现温和复苏,公司不担心智能手机库存建立问题,认为属健康季节因素 [7][8] 先进封装产能 - CoWoS先进封装持续供不应求,公司计划在2026年持续增加产能以缩小供需差距 [13]
台积电25Q3法说会:对人工智能大趋势的信心正在“增强”,上调全年销售预期和资本支出下限(附纪要全文)
美股IPO· 2025-10-16 16:06
业绩指引 - 2025年营收增长预期上调至30%区间中段水平 [1][4] - 预计第四季度销售额322亿美元至334亿美元,市场预估312.3亿美元 [2][4] - 预计第四季度毛利率59%至61%,市场预估57% [2][4] - 2025年第三季度收入达到331亿美元,环比增长6%,美元计价环比增长10% [8] - 第三季度毛利率为59.5%,营业利润率为50.4% [8] - 预计2025年下半年海外工厂爬坡对毛利率的稀释约为2个百分点,全年稀释为1-2个百分点,低于此前预期的2-3个百分点 [9] 人工智能需求 - 公司认为目前正处于人工智能应用的早期阶段,对AI增长前景保持乐观 [2][5] - AI需求持续强劲,且比3个月前预期的还要强劲,对人工智能大趋势的信心正在增强 [2][5] - AI相关产能非常紧张,公司仍在努力于2026年提升CoWoS封装产能 [2][5] - AI需求强劲,Token增长呈指数级,每三个月就有指数级增长,驱动先进制程半导体需求 [11][16] - 公司此前给出的AI市场年复合增长率(CAGR)指引为mid 40s(40%区间中段),目前看略好于该指引 [14] 资本支出 - 预计2025年全年资本支出为400亿美元至420亿美元,较此前预期的380亿美元至420亿美元有所上调 [1][4][10] - 资本支出规模在任何一年都不太可能突然下降,高资本支出与高增长机会挂钩 [2][4] - 2025年前9个月资本支出总计293.9亿美元,第三季度资本支出达到97亿美元 [2][8] - 资本支出中70%用于先进制程扩产,10-20%用于特色工艺,10-20%用于先进封装和光罩等 [10] 工艺技术与产能 - 2纳米(N2)制程预计在本季度晚些时候实现量产,预计2026年爬坡加速,主要受智能手机和HPC需求驱动 [2][5][14] - A16制程预计2025年下半年实现量产,适合专门的HPC产品 [2][5] - 正在台湾筹备多期2纳米晶圆厂建设,并引入N2P作为N2的延伸,预计2026年下半年量产 [2][14] - 第三季度3纳米晶圆收入占比23%,5纳米占比37%,7纳米占比14%,先进制程(7纳米及更先进)收入占比达到74% [8] 全球产能布局 - 日本第二座晶圆厂已开工建设 [3] - 正在加快美国亚利桑那州工厂的产能扩张,计划升级制程至N2,并即将拿下第二块大型土地以支持未来多年扩产计划 [3][5][13] - 在欧洲的特色工艺工厂已经开始建设 [13] - 海外工厂的毛利率稀释在未来几年早期阶段预计为2-3个百分点,之后可能达到3-4个百分点 [9][15] 各业务板块表现 - 第三季度高性能计算(HPC)收入环比持平,收入占比57% [8] - 第三季度手机业务收入环比增长19%,收入占比30% [8] - 第三季度物联网(IOT)业务收入环比增长20%,收入占比5% [8] - 第三季度汽车业务收入环比增长18%,收入占比5% [8]
“真正的文化实力,不在于谁的算力更强”
观察者网· 2025-10-15 15:58
主权AI与数字人文自主知识体系的核心概念 - 主权AI的核心是国家对AI的数据、算法、语义拥有自主掌控力,不仅是技术主权更是文化主权,需理解本国语言逻辑、文化常识与价值,对齐本土意识形态 [1] - 中国数字人文自主知识体系指用数字化、智能化手段重建知识结构与阐释体系,实现知识主权再造,让中国历史思想、美学在数字世界里以自主方式被理解、传播 [1] - 数字人文是连接传统文化与AI的桥梁,而桥梁的技术基础决定了能否用自己的方式讲好中国故事 [1] - 中国数字人文自主知识体系离不开主权AI的支撑,二者本应相互促进,若没有主权AI,自主知识体系会陷入依附 [1] 当前通用AI模型的局限性与建设主权AI的必要性 - 当前多数通用大模型以西方语料为主,中文占比仅2%~3%,缺乏中国文化、历史常识,容易产生"AI幻觉" [2] - 通用AI对中国文化的理解仍显机械,尤其在东亚文化相关的图像、多模态资源解读上因缺乏语境易出问题 [2] - 没有独立的算法语义底层和自主知识体系,中国数字人文自主知识体系就是空谈 [2] 主权AI对数字人文建设的四大意义 - 让AI真正懂中国人的世界,基于本土语料训练的主权AI能更精准理解中文典籍灵活的语法和繁多典故,领会语感与历史语境 [3] - 让文化遗产重新"发声",主权AI可支持文字、图像、音频多模态融合分析,科学读取青铜器铭文、碑刻等非文字遗产 [3] - 重建知识间的有机联系,借助知识图谱将人物、思想脉络织成知识地图,实现数字人文的核心关系重构 [3] - 在算法层面嵌入中国价值,主权AI能推动解决文化包容兼容的重要课题,因数字人文与大模型并非价值中立,语料会自带判断倾向 [3] 建设适配中国数字人文的主权AI的关键任务 - 构建本土化高质量数据底座,对古籍、碑帖等文化遗存做统一标准、集中管理,建设带目标性标注的海量专属语料库 [4] - 研发面向场景的专用模型,文化领域需要专属小模型或多智能体系统,针对性解决数字人文的应用需求 [4] - 建设国家级数字人文智能平台,搭建共建共享的平台以打破大量素材分散在不同数据库的资源壁垒 [4] - 形成跨学科人才生态,加快培养既懂AI又懂人文的复合型人才 [4] 主权AI的战略定位与愿景 - 主权AI对数字人文而言不是防御性概念而是创造性工具,应用中国文化逻辑重建AI,其意义不仅是守护数据更是塑造未来形态 [5] - 智能时代真正的文化实力不在于算力更强,而在于能否让AI"理解"自己的文明与文化 [5] - 以主权AI为核心为中国数字人文自主知识体系建设发力,让中华文明在新的语义空间里持续生长、发声、传播 [5]
优刻得与全球AI卓越中心签署战略协议
第一财经· 2025-10-15 14:00
合作概况 - 公司与全球工业人工智能联盟卓越中心正式签署《国际生态共建框架协议》并建立长期战略合作伙伴关系 [1] 合作领域与目标 - 合作将围绕云计算、主权AI等关键领域展开 [1] - 双方计划整合优势资源以提升品牌国际影响力并加速海外市场拓展 [1] - 合作致力于将先进、安全、可控的云计算能力赋能于更广泛的产业与社会应用场景 [1]
没人需要原子弹,但每个人都需要AI
是说芯语· 2025-10-02 15:00
英伟达对OpenAI的战略定位与投资 - OpenAI被定位为共同打造下一代AI工厂的共建者而非普通客户[6] - 公司向OpenAI提出最高可达1000亿美元的投资意向用于建设AI数据中心[8] - 该AI数据中心能耗至少10吉瓦需要10台左右大型核电机组供电将配备400-500万块GPU接近英伟达2025年全年出货计划[8] - 英伟达深度参与工厂设计调试优化部署从芯片驱动到工厂级电力和网络系统[8] AI经济影响与基础设施需求 - AI被定义为帮助社会扩容脑力的基础设施世界上55%-65%的GDP来自人类脑力劳动[9] - AI辅助可使脑力劳动岗位产出翻倍甚至三倍增长[11] - AI作为实时思考系统每次推理需经历检索推理判断生成过程算力需求远超传统软件[11] - 未来智力产能需依靠全年在线的AI工厂支撑[12] 推理算力需求演变 - 推理已演变为轻量级实时的训练过程分为预训练后训练推理三个阶段[13] - 推理过程中AI会先检索再调用内部逻辑可能临时使用工具或调用其他模型辅助判断[13] - 思考时间越长答案质量越高背后潜藏巨大算力需求[15] - 推理量级从一次性回答演进为动态生成消耗真实算力[15] 英伟达的竞争策略与护城河 - 公司竞争优势在于每瓦电力产出效率而非芯片价格即使对手免费提供芯片若每瓦效率仅为十分之一客户仍会亏损[18] - 客户核心关切是在确定功率配额下能产出多少有用token而非芯片零售价[18] - 护城河建立在软硬件系统协同实现在同等能耗下产出更多更快更可靠的结果[20] 技术迭代与系统升级节奏 - 公司每年推出新架构是必要生存策略因token生成速度呈指数级飙升[22][23] - 为降低token成本需不断提升每瓦输出密度[23] - 升级涵盖GPUCPU互联交换芯片及上层软件编译器库的全系统极致协同设计[25] 应对行业自研芯片的生态战略 - 承认ASIC在稳定高频负载下的价值但强调通用平台在算法快速迭代环境下的韧性[29] - CUDA平台允许开发者一周内试验五种方法保障工程速度[29] - 通过推出CPX专用芯片开源Dynamo系统工具与英特尔合作NV Fusion构建可插拔系统生态[29] AI产业链信用体系建设 - 公司通过投资兜底租赁等方式为AI产业链提供信用背书如对CoreWeave投资1亿美元并签署13亿美元GPU租回合同[32] - CoreWeave转型AI云后营收从2500万美元飙升至近20亿美元[32] - 类似安排应用于Lambda等新云玩家通过签署订单帮助其获取融资[32] 主权AI与全球市场布局 - 各国意识到AI系统承载语言文化法律意识形态需建设可控的主权AI基础设施[35] - 建议各国在使用优秀模型的同时建立自身算力工厂团队[35] - 中国市场被定义为战略重要公司将在出口规则内合法合规最大化技术影响力[36] 人才政策与就业影响 - 强调人才是美国核心竞争力建议为STEM毕业生直接发绿卡避免人才流失[42] - AI不会导致大规模失业而是提升效率后承接更多项目增加用工需求如公司工程师数量因AI赋能而增加[43] - AI扩展现有工作能力催生新工种而非取代岗位[45] 未来AI应用场景展望 - 2030年个人将拥有云基数字分身辅助生活工作决策如会议笔记医疗提示等[46] - AI将具象化为机器人具备表情识别语音交互等能力公司正为AI造身体装神经通电源[48] - 面对指数级增长应尽早参与投入而非等待完美预测[49][51]
黄仁勋最新讲话:下一个10年,你的工作方式会被彻底改变
搜狐财经· 2025-09-30 22:19
AI革命的核心驱动力 - AI发展由三大扩展定律叠加效应驱动,算力需求呈现“双重指数级增长”[3][4] - 预训练阶段AI需“吞下”整个互联网信息构建基础认知能力,属于“大力出奇迹”阶段[9][10] - 后训练阶段AI需针对具体任务进行针对性优化,该过程特别消耗算力[12][13] - 推理阶段AI从简单检索转变为“专家开会”式复杂思考,思考时间越长答案质量越高[14] - 三大引擎同时运行导致算力需求“垂直上天”,OpenAI需投入上千亿建设“星际之门”算力设施[15][16] 英伟达的战略定位 - 公司从芯片供应商转型为AI基础设施“包工头”,实施“极端协同设计”[17] - 技术架构从Hopper升级到Blackwell,一年内性能提升30倍[20] - 竞争优势体现在总拥有成本,即使对手芯片免费客户仍会选择英伟达方案[20][21] - 核心价值在于每瓦电力产出的AI性能更高,相同电费预算下可创造几倍至几十倍收入[22][23] 全球AI市场格局 - 全球价值几万亿美元的传统计算设备需从CPU更换为AI驱动设备[25] - 仅将谷歌、Meta、字节跳动等公司的推荐引擎从CPU改为GPU就形成几千亿美元市场[26] - AI将对全球50万亿美元GDP产生加成效应,企业投入1万美元AI工具可使10万年薪员工效率翻倍[26] - 主权AI成为国家经济安全命门,各国需建设符合本国文化、历史、数据规则的AI基础设施[27] - 中国市场的创新能力和工程师资源不容低估,合作比脱钩更符合双方利益[28][29] 未来十年核心趋势 - 算力成为新电力,国家竞争力取决于获取廉价稳定电力及高效AI设施的能力[31][36][37] - AI从工具转变为“同事”,英伟达内部软件工程师和芯片设计师已实现100% AI协作覆盖率[39] - 具身智能将使机器人成为日常伴侣,数字孪生将基于个人生物数据创建虚拟医疗模型[41][42] - AI作为生产力倍增器将推动全球GDP爆发式增长,相当于添加几十亿虚拟工人[44][45] - 主权AI将引发全球性AI基建潮,成为国家战略必争品[46][47] 行业应用影响 - 企业AI应用从可选变为必选,网店可通过AI分析用户行为实现精准营销[58][59] - 制造业通过AI预测性维护可避免单日几十万元停产损失,投入产出比显著[59] - 企业IT采购重心转向AI算力效率,短视频公司渲染时间从2小时缩短至10分钟且电费减半[60] - 小企业可租赁云算力,大企业需自建AI数据中心满足海量需求[60] - 未来企业竞争力取决于能否用AI实现员工效率翻倍,基础是高效使用算力[61]
金融时报:30年不涉政,黄仁勋如何变成了全球AI推销员?
凤凰网· 2025-09-30 16:08
公司战略与高管活动 - 公司创始人黄仁勋近期积极介入国际政治,频繁会晤各国政要,成为公司的全球AI推销员 [1][2] - 黄仁勋在公开活动中宣布向英国本土AI创业公司投资20亿英镑,并点名投资八家公司 [1] - 公司正将通过与当地公司建立战略合作的模式从欧洲、中东复制到日本和马来西亚 [2] - 过去12个月里,黄仁勋已公开会晤至少12位国家元首及政府首脑,为公司海外利益游说 [5] - 公司全球现场业务执行副总裁杰伊·普里透露,所有国家都在主动联系公司,许多已与黄仁勋直接对话 [5] 主权AI战略 - 公司的主权AI战略旨在将市场扩展到各国政府,降低对少数大型科技公司客户的依赖 [2][3][5] - 该战略鼓励各国建立自主AI生产能力,掌握自己的数据,即“主权AI”理念 [3][5] - 公司高层表示,该战略酝酿已久,目标是将AI推广至全球,而非仅服务于大型云服务提供商 [3] - 公司通过直接销售硬件和培育新兴的AI云服务提供商来实施该战略,以挑战现有三巨头的市场地位 [5] - 自年初以来,公司已参与宣布横跨北美、欧洲、中东和亚洲的20余个主权AI项目 [6] 市场表现与财务预期 - 自ChatGPT面世以来的三年间,公司股价上涨了约1000% [3] - 公司当前市值为4.4万亿美元 [2] - 公司首席财务官透露,2025年主权AI业务收入有望突破200亿美元,较2024年增长一倍多 [6] - 公司去年总营收为1300亿美元,目前来自主权AI的实际收入相对较小 [6] - 美国银行分析师预测,主权AI相关交易的总市场规模将在未来几年突破500亿美元 [7] 行业影响与竞争格局 - 戴尔首席AI官指出,一年前只有少数国家有主权AI战略,但转变发生很快,各国都不希望在经济变革中落后 [6] - 有批评指出,公司鼓励各国建立自主AI生态的同时,也推动其依赖公司的产品,存在根本矛盾 [3] - 华盛顿智库高级研究员表示,公司正在效仿其他占据主导地位的美国科技公司的全球战略路径 [7] - 有观点认为,真正的主权AI需要像中国那样建立全新的半导体产业,但这需要巨大投入和决心 [8] - 贝恩咨询公司指出,客户众多的行业存在建设过剩产能的风险,并非所有投资都能看到回报 [9]
黄仁勋2小时反驳「AI泡沫帝国」论,英伟达将成全球首家十万亿市值公司
36氪· 2025-09-29 08:35
英伟达的战略定位与产业角色 - 公司将OpenAI视为共建者而非普通客户,共同打造下一代AI工厂[6] - 公司参与从芯片、驱动到工厂级电力和网络系统的全流程设计、调试、优化和部署[11] - 公司被比作AI世界的政府,通过投资、兜底和租赁等方式为AI产业链提供信用背书[28][29] - 公司采取极致协同设计策略,每年升级包括GPU、CPU、互联、交换芯片及上层软件在内的整套系统[24] AI产业前景与算力需求 - AI被视为帮助社会扩容脑力的关键,全球55%至65%的GDP来自人类脑力劳动,AI辅助可带来巨大增长潜力[12][14] - 推理环节已演变为轻量级实时训练,思考过程越长消耗的算力越大,潜藏着巨大的算力需求[15][16][18] - 未来每个人可能拥有一个住在云端的个人AI数字分身,AI也将被赋予身体,成为能识别表情、听懂语气的机器人[43][45] 英伟达的竞争优势与市场策略 - 公司的核心优势在于每瓦电力的输出效率,而非芯片价格,客户在固定功率配额下最关心的是有用token的产出量[19][21] - 面对大公司自研AI芯片的趋势,公司通过构建开放、可插拔的AI工厂平台生态来保持韧性,支持快速变化的算法环境[25][27] - 公司通过投资和业务合作支持AI云服务商,例如向CoreWeave投资1亿美元并签署13亿美元GPU租回合同,助其营收从2500万飙升至近20亿[29] 全球AI发展趋势与地缘视角 - 主权AI成为新共识,各国需要建设自己能控制的模型和基础设施,AI系统应像交通、通信一样成为国家基础设施[30][32] - 公司对中国市场保持工程师式清醒,认为中国节奏快、制造强、工程师多,中国市场具有战略重要性,公司将在出口规则内最大化技术影响力[33][34][36] - 人才是核心竞争力,建议为STEM毕业生直接发绿卡,吸引并留住全球最聪明的人才是保持竞争力的关键[39] AI对就业与参与方式的看法 - AI不会导致大规模失业,而是改变工作结构,提升效率后团队会承接更多项目,反而增加工程师等岗位需求[40][42] - 面对指数级增长的AI浪潮,最佳策略是尽早参与、边学边干,而非等待完美预测,最早投入的群体将打开发展空间[46][47]
腾讯研究院AI速递 20250929
腾讯研究院· 2025-09-29 00:01
生成式AI行业动态 - OpenAI被曝在用户不知情情况下将GPT-4和GPT-5等模型路由至低算力敏感模型"gpt-5-chat-safety"和"gpt-5-a-t-mini" 当系统判定内容涉及敏感话题或情绪表达时自动触发切换 [1] - OpenAI回应称切换为临时性安全路由系统测试 但未经同意的模型更改行为引发用户权益质疑 [1] - 腾讯发布工业级原生多模态生图模型混元图像3.0 参数规模80B 是目前测评效果最好且参数量最大的开源生图模型 [2] - 混元图像3.0基于50亿级图文对和6T语料训练 具备千字级复杂语义解析能力 支持长文本生成和小文字处理 [2] - 快手推出KAT-Dev-32B开源和KAT-Coder闭源两款Agentic Coding大模型 在SWE-Bench Verified上分别达到62.4%和73.4%解决率 [3] - 快手开发基于熵的树剪枝技术和强化学习训练框架SeamlessFlow 模型经训练后涌现出对话轮次减少和多工具并行调用新能力 [3] AI教育应用进展 - 好未来提出AI教师L1-L5分级理论 学而思"小思AI一对一"对标L3级别 能实现实时观察学生解题步骤并提供针对性引导 [4][5] - L3级AI教师需配备多模态传感器和专用硬件 形成"批改-讲题-推荐"数据飞轮 数学解题正确率达98.1% [5] - 好未来自研"九章"大模型结合20多年教研内容 在线下培训、在家学习和进校学习三大场景实现统一学情画像 [5] 前沿科技战略布局 - Meta计划投入数十亿美元研发人形机器人"Metabot" 战略地位与AR项目同级 聚焦软件开发而非硬件制造 [6] - Meta拟采用软件平台授权模式 与机器人制造商合作建立行业通用标准 新成立超级智能人工智能实验室构建物理"世界模型" [6] - 谷歌DeepMind视频模型Veo 3涌现四层能力:感知经典视觉任务、建模物理定律、操纵图像编辑、推理视觉问题 [10] - Veo 3通过帧链(CoF)技术实现跨时空推理 在七个代表性任务上显著超越Veo 2 可能成为视觉领域的GPT-3时刻 [10] 技术理论与方法创新 - 图灵奖得主Richard Sutton认为大语言模型是错误起点 强调真正智能需通过经验学习实现 而非对人类行为的模仿 [7] - 陈丹琦团队提出RLMT方法 将显式思维链推理融入通用聊天模型 在WildBench等基准测试中表现优异 [8][9] - RLMT要求模型生成推理轨迹后再输出最终答案 通过奖励模型评分 使推理风格从线性规划转变为迭代式思考 [8][9] 行业战略与市场展望 - 英伟达从芯片公司转型为AI基础设施合作伙伴 通过极端协同设计构建AI工厂生态系统 竞争护城河基于总拥有成本优势 [11] - AI推理将迎来十亿倍增长 预训练、后训练和推理三大扩展定律驱动万亿级市场 年度AI基础设施资本支出预计达5万亿美元 [11] - 主权AI时代各国需建立独立AI基础设施 主张通过技术出口最大化影响力而非脱钩 保持美国梦品牌吸引全球人才 [11]