Workflow
TranslateGemma
icon
搜索文档
腾讯研究院AI速递 20260119
腾讯研究院· 2026-01-19 00:01
超大规模计算基础设施与能源挑战 - 马斯克旗下xAI的Colossus 2超算集群正式投入运行,成为全球首个功率达到1吉瓦(GW)的超算集群,计划于4月升级至1.5吉瓦,最终装机容量将达到2吉瓦 [1] - 该集群完工后将内置55.5万张GPU,远超Meta和微软的规模,全部专用于Grok模型,预计将支撑6万亿参数的Grok 5模型训练 [1] - 数据中心用电激增对美国电网构成压力,导致PJM电网区域6700万居民可能面临轮流停电风险,xAI已部署168个特斯拉Megapack储能系统以缓解对电网的冲击 [1] 大模型产品商业化与市场策略 - OpenAI正式启动广告业务,计划在美国的免费版和新推出的ChatGPT Go订阅服务中测试广告,广告将出现在回答底部并明确标记,而Pro、Business和Enterprise版本则无广告 [2] - OpenAI推出低价订阅服务ChatGPT Go,价格为每月8美元,提供GPT-5.2 Instant版本,其消息量和图像创建量是免费版的10倍 [2] - OpenAI承诺广告不影响回答内容,不向广告商出售用户数据,用户可关闭个性化广告并随时清除相关数据 [2] 翻译工具与多语言模型竞争 - OpenAI低调上线ChatGPT Translate翻译工具,支持50多种语言,并提供一键调整译文语气(如“商务正式”、“学术风格”)的功能 [3] - 谷歌强势回应,开源了TranslateGemma模型,支持55种语言,其120亿(12B)参数版本性能超越270亿(27B)参数的基线模型,40亿(4B)参数版本可在手机端运行 [3] - TranslateGemma模型保留了多模态能力,可以翻译图像中的文字,其4B版本采用Apache 2.0许可证,支持商业使用 [3] 高效开源图像生成与编辑模型 - Black Forest Labs开源了FLUX.2 Klein模型,包含40亿(4B)和90亿(9B)参数两个版本,在现代硬件上实现了端到端推理时间低于0.5秒,统一了文生图和图像编辑能力 [4] - 4B模型仅需13GB显存即可在消费级GPU上运行,9B版本性能可与参数规模为其5倍的模型匹敌,4B版本采用Apache 2.0许可证 [4] - 模型提供了FP8和NVFP4量化版本,在RTX GPU上分别实现了最高1.6倍和2.7倍的推理加速,显存占用降低了40%至55% [4] 3D内容生成技术升级 - 混元3D Studio 1.2全面开放公测,其组件生成能力升级为PartGen 1.5,拆分精度从1024³提升至1536³分辨率,并支持笔刷交互进行拆分控制 [5] - 基础模型升级为混元3D 3.1版本,几何细节和纹理颜色还原度大幅提升,支持通过八视角图像输入生成3D模型 [5] - 新版本引入了全尺度组件精细化处理和分割掩码控制,实现了更完整的复杂物体拆分和专业可控的组件生成 [5] 大模型智能体能力与训练方法创新 - 美团发布了5600亿参数的LongCat-Flash-Thinking-2601模型,引入了“重思考”模式,可同时启动8路并行思考后汇总得出结论 [7] - 该模型的智能体能力获得重大提升,在工具调用和搜索等基准测试中达到顶尖水平,团队还提出了自动化环境规模扩展的泛化能力评测方法 [7] - 模型采用环境规模扩展与多环境强化学习进行训练,并引入了面向噪声环境的课程式稳健训练,显著提升了在分布外场景的适应能力 [7] OpenAI内部争议与法律诉讼 - 法庭解封了超过100份与马斯克诉OpenAI案相关的证词文件,文件显示奥特曼通过YC基金间接持有OpenAI股份,同时秘密拥有OpenAI创业基金,与其公开声明存在矛盾 [8] - 文件曝光了Brockman 2017年的日记,其中承认想把OpenAI转为营利公司并踢出马斯克,称“这是摆脱埃隆的唯一机会” [8] - OpenAI反驳称马斯克曾要求获得50%-60%的股权和CEO职位但被拒绝,法官认为证据争议较大,适合由陪审团裁决,审判定于4月27日开始 [8] 脑机接口技术进展与升级路径 - Neuralink首位受试者Noland揭秘,其大脑芯片可通过三种方式升级:Telepathy应用更新、植入体固件OTA无线更新以及硬件迭代 [8] - 此前85%的电极发生脱离后,团队通过软件算法更新让剩余15%的电极性能反超完好状态,实现了不开颅修复问题 [8] - 下一代计划采用“双芯配置”,在大脑和脊髓各植入一枚芯片以搭建“数字桥梁”,目标是让瘫痪者重新行走;奥特曼投资的Merge Labs也已入局脑机接口领域 [8] 行业对AGI发展的判断与预测 - 红杉资本合伙人联合发布博客,指出AGI(通用人工智能)已经到来,其功能性定义为“能把事情搞清楚的能力”,认为长周期智能体已具备形成假设、验证、调整直至找到答案的能力 [9] - 文章举例说明,智能体能在31分钟内自主完成一项招聘任务:从LinkedIn搜索到YouTube筛选演讲者,再交叉比对Twitter找出倦怠信号,最终锁定精准候选人 [9] - 长周期智能体的能力被认为每7个月翻一番,预计到2028年能完成人类专家一天的工作,到2034年能完成一年的工作,并称“你对2030年的梦想,2026年就能实现” [9] 大模型能力演进与个性化方向 - OpenAI后训练负责人表示,GPT-5.1首次让所有聊天模型都变成了推理模型,模型可根据问题难度自主决定思考时长,实现更智能的资源分配 [10] - 团队重点改进了模型的上下文记忆、自动模型切换的风格一致性和指令遵循能力,并新增了“风格与特质”个性化功能,允许用户自定义模型的表达方式 [11] - 未来模型将更加可定制,记忆功能让模型能记住用户背景和偏好,真正的方向是模型主动理解用户,但用户始终掌握主导权 [11] AI对工作效率的影响与潜在风险 - Anthropic发布的新《经济指数报告》显示,任务越复杂,AI带来的效率提升越惊人:完成高中学历水平的任务速度提升9倍,完成大学学历水平的任务速度提升达12倍,颠覆了“AI只擅长简单劳动”的认知 [12] - 报告发现,人机协作能将AI处理任务的时长上限从基准测试的2小时推高至19小时,接近10倍提升,人类学会拆解任务和提供反馈修正是关键 [12] - 报告警示存在“去技能化”风险,AI正系统性剔除工作中的高智力部分,当前AI覆盖的任务平均需要14.4年的教育背景,高于经济活动平均所需的13.2年 [12]
被员工怒怼“磕了”,追觅CEO:我有肚量;AI恋人陪聊涉黄被判刑,2.4万人付费;马斯克、奥特曼又开撕|AI周报
AI前线· 2026-01-18 13:32
AI行业监管与法律案件 - 国内首起AI涉黄刑事案件二审开庭,被告通过接入境外大模型提供虚拟陪伴服务,案发时软件用户达11.6万人,其中付费用户2.4万人,收取会员费300余万元[3][4] - 一审法院抽样鉴定发现,在随机抽取的150个收费用户的12495段聊天中,有3618段属于淫秽物品,涉及141个用户,团队创始人及成员因制作淫秽物品牟利罪分别被判有期徒刑4年及1年6个月[4] - 市场监管总局对携程集团涉嫌滥用市场支配地位实施垄断行为立案调查,公司表示将积极配合[10] 公司战略与高管动态 - 追觅科技CEO俞浩回应员工怒怼其战略目标,称公司目标是打造人类历史上第一个百万亿美金公司生态,但并非一年内实现,并透露公司成立至今连续6年保持100%高速增长且累计盈利[5][6][7] - 追觅科技CEO俞浩表示,公开提出反对意见的员工早已提出离职,其内部对不同意见持包容态度[10] - 智元机器人将灵巧手业务拆分独立,成立名为“临界点”的新公司并完成首轮融资,由前腾讯Robotics X成员熊坤带队[28][29] 国际贸易与政策 - 美国白宫宣布自1月15日起对部分进口半导体、半导体制造设备和衍生品加征25%的进口从价关税[14] - 美国联邦最高法院未就特朗普政府援引《国际紧急经济权力法》实施的大规模关税政策的合法性作出裁决,相关案件仍在审理中[15] AI人才流动与组织变动 - 清华姚班天才、UC伯克利助理教授陈立杰已加盟OpenAI,负责数学推理研究方向[16][17] - OpenAI前研究副总裁Barrett Zoph及其团队核心成员将回归OpenAI,Barrett Zoph此前离职后创立的公司估值约100亿美元[18] - Meta宣布在Reality Labs部门裁减约10%的岗位,以推动公司资源进一步转向人工智能可穿戴设备[27] 巨头诉讼与争议 - 埃隆·马斯克向OpenAI和微软索赔790亿至1340亿美元,理由是其背弃非营利使命,专家证人认为马斯克有权从OpenAI目前5000亿美元的估值中获得相当大份额[19] - OpenAI回应称该诉讼是马斯克持续骚扰行为的一部分,并发布内部证据称马斯克当年谈判破裂是因要求绝对控制权[20][23] - OpenAI CEO Sam Altman在社交媒体回应,称马斯克当时在推动建立新组织架构并要求完全控制权,甚至希望未来由其孩子掌控AGI[21][23] 算力基础设施进展 - 马斯克宣布用于Grok的“Colossus 2”超级计算机已投入运行,这是全球首个吉瓦级训练集群,计划四月升级至1.5吉瓦,该设施此前已配备20万块英伟达H100 GPU[24] - Meta首席执行官扎克伯格宣布启动名为“Meta Compute”的全新AI基础设施计划,计划未来几年成倍扩大能源使用规模,并任命了三位核心负责人[26] 大模型技术进展与排名 - 百度文心大模型5.0以1460分登上LMArena文本榜国内第一、全球第八,超过GPT-5.1-High等模型,其数学能力排名全球第二[33] - 字节跳动Seed团队推出新一代折叠模型SeedFold,在多个蛋白质相关任务性能上超越AlphaFold 3,训练数据集扩充至2650万个样本[34] - 腾讯微信AI团队推出新型扩散语言模型框架WeDLM,通过拓扑重排技术提升推理速度,其WeDLM-8B模型在GSM8K等任务中速度优势显著[35] - 谷歌基于Gemma 3架构推出TranslateGemma开放翻译模型系列,其12B版本翻译质量超越参数量大其两倍的Gemma 3 27B基线模型[38] - 百川智能开源新一代医疗大模型Baichuan-M3,在HealthBench评测中以65.1分位列全球第一,首次在医疗领域全面超越GPT-5.2[39] - 智谱联合华为开源新一代图像生成模型GLM-Image,这是首个在国产昇腾芯片上完成全程训练的SOTA多模态模型[40] - 阶跃星辰原生语音推理模型Step-Audio-R1.1以96.4%准确率登顶Artificial Analysis Speech Reasoning榜单,超越Grok、Gemini等主流模型[42] - DeepSeek发布新论文提出条件记忆架构,并开源记忆模块Engram,该技术有望成为其下一代模型V4的核心基础,V4模型计划于2月中旬前后推出[44][45] 产品与生态整合 - 死了么APP宣布征集全新品牌名,此前曾更名“Demumu”,该APP从开发到上线仅用6小时,其中AI编程占4小时,其iOS版本售价8元并登顶App Store工具类应用排行榜第一[12][13] - 阿里千问App全面接入淘宝、支付宝、飞猪、高德等阿里生态业务,上线400多项新功能,实现AI点外卖、购物、订机票等,支付环节在对话界面内完成无需跳转[36][37] - 苹果发布苹果创作工作室专业创意软件订阅包,定价为每月12.99美元或每年129美元,并为Keynote等生产力应用增加了AI功能[47] - 苹果与谷歌达成多年期合作协议,苹果下一代基础模型将基于谷歌Gemma模型及云技术构建,用于支持更个性化的Siri等功能[47] 融资与收购 - 由OpenAI CEO Sam Altman联合创立的脑机接口公司Merge Labs近期筹集2.52亿美元(约18亿元人民币)融资,由贝恩资本领投,OpenAI是最大投资者[30] - OpenAI宣布收购小型健康记录初创公司Torch,其团队将并入OpenAI,Torch的核心产品是聚合个人医疗数据的应用[32] 行业应用与合作 - 美国国防部长表示,马斯克旗下的AI聊天机器人Grok将被引入五角大楼网络,与谷歌的生成式AI系统一道在国防部内部运行[47] - 逐际动力发布具身智能体OS系统LimX COSA,这是一个面向物理世界原生的具身Agentic OS,将高阶认知与全身运控进行深度融合[46]
原油,大跌!刚刚,白银、黄金跳水
中国基金报· 2026-01-16 09:20
美股市场整体表现 - 美东时间2026年1月15日,美股三大指数收高,道琼斯工业平均指数上涨292.81点,涨幅0.60%,报49442.44点;纳斯达克综合指数上涨58.27点,涨幅0.25%,报23530.02点;标普500指数上涨17.87点,涨幅0.26%,报6944.47点 [2] 宏观经济与货币政策 - CME“美联储观察”工具显示,市场预期美联储在1月会议上降息25个基点的概率仅为5%,维持利率不变的概率为95%;到3月累计降息25个基点的概率为20.8% [4] - 堪萨斯城联邦储备银行行长施密德表示反对降息,认为通胀“过热”,并警告特朗普政府的政策可能进一步推动经济增长 [5] - 芝加哥联邦储备银行总裁古尔斯比表示,在有充分证据表明就业市场稳定的情况下,美联储应将重点放在降低通胀上 [6] - 美国上周初请失业金人数为19.8万人,低于预期的21.5万人,前值自20.8万人修正至20.7万人 [7] 半导体行业动态与市场表现 - 美国白宫发布声明,自1月15日起对部分进口半导体、半导体制造设备和衍生品加征25%进口从价关税,依据《1962年贸易扩展法》第232条款,旨在“应对国家安全威胁” [9] - 加征关税范围包括英伟达H200芯片和超威半导体MI325X人工智能加速器芯片,但用于数据中心、研发、维修和公共部门等领域的半导体产品不在加征范围内 [9][10] - 芯片股多数上涨,费城半导体指数涨1.76%,刷新历史新高 [10] - 科天半导体涨超7%,应用材料涨逾5%,阿斯麦涨超5%,台积电涨逾4%,超微半导体涨近2% [10] - 台积电披露2025年第四季度业绩,该季度净利润飙升35%,达到约160亿美元,创历史新高,远超预期,且连续七个季度实现两位数增长 [11] - 部分芯片股下跌,德州仪器跌超2%,高通跌逾1%,迈威尔科技跌超1% [10] 大型科技股动态与市场表现 - 大型科技股涨跌互现,英伟达涨超2%,脸书涨0.86%,亚马逊涨0.65%,谷歌跌近1%,苹果跌0.67%,微软跌0.59%,特斯拉跌0.14% [12] - 苹果宣布拓展Apple Pay跨境支付支持,新增支持多家中国银行发行的Visa信用卡及借记卡 [13] - 谷歌推出基于Gemma 3构建的全新开放翻译模型TranslateGemma,支持55种语言间的交流 [14] - 奈飞与索尼宣布达成扩展协议,奈飞将在索尼电影影院上映后在全球范围内进行流媒体播放 [14] 银行业市场表现与公司动态 - 银行股多数上涨,摩根士丹利涨近6%,高盛涨超4%,花旗涨逾4%,摩根大通涨0.48%,美国银行涨0.16%,富国银行跌0.34% [16] - 高盛集团和摩根士丹利发布的财报显示,两家公司的股票交易部门去年营收均创下历史新高 [17] - 高盛将发行投资级债券以筹集160亿美元,这将是华尔街银行史上规模最大的此类债券发行 [17] 大宗商品市场表现 - 1月15日,布伦特原油期货下跌2.76美元,跌幅4.15%;2月交割的WTI原油期货价格下跌2.83美元,跌幅4.56%,创下自2025年6月以来最大跌幅 [2][19] - 市场分析认为,原油下跌可能与市场将特朗普提及伊朗杀戮已停止的表述,视作“美国或许会暂缓实施潜在军事行动的信号”有关 [19] - 1月16日开盘,伦敦黄金、白银现货价格双双跳水,截至发稿,伦敦白银现货价格跌幅超1.5% [19]
原油,大跌!刚刚,白银、黄金跳水
中国基金报· 2026-01-16 08:28
美股市场整体表现 - 美股三大指数收高 道指涨292.81点或0.60%至49442.44点 纳指涨58.27点或0.25%至23530.02点 标普500指数涨17.87点或0.26%至6944.47点 [1] - 银行股与芯片股领涨市场 [1] - 原油价格创下自2025年6月以来最大跌幅 [1] 宏观经济与货币政策 - CME美联储观察工具显示 市场预计美联储1月维持利率不变的概率为95% 3月累计降息25个基点的概率为20.8% [3] - 堪萨斯城联储行长施密德反对降息 称通胀“过热”并警告特朗普政府的政策可能进一步推动经济增长 [3] - 芝加哥联储总裁古尔斯比表示 在有充分证据表明就业市场稳定的情况下 美联储应将重点放在降低通胀上 [3] - 美国上周初请失业金人数为19.8万人 低于预期的21.5万人 [3] 半导体行业与芯片股 - 美国白宫宣布自1月15日起对部分进口半导体、半导体制造设备和衍生品加征25%进口从价关税 依据《1962年贸易扩展法》第232条款 [4] - 加征关税范围包括英伟达H200芯片和超威半导体MI325X人工智能加速器芯片 但用于数据中心、研发等领域的半导体产品不在加征范围内 [4] - 芯片股多数上涨 费城半导体指数涨1.76%刷新历史新高 [4] - 科天半导体涨超7% 应用材料涨逾5% 阿斯麦涨超5% 台积电涨逾4% 超微半导体涨近2% [4] - 德州仪器跌超2% 高通跌逾1% 迈威尔科技跌超1% [4] - 台积电披露2025年第四季度业绩 净利润飙升35%达约160亿美元创历史新高 远超预期且连续七个季度两位数增长 [5] - 主要芯片股表现:英伟达涨2.10%至186.990美元 超威半导体涨1.93%至227.920美元 高通跌1.91%至161.390美元 英特尔跌0.85%至48.305美元 博通涨0.92%至343.020美元 阿斯麦涨5.37%至1331.600美元 [5] 大型科技股动态 - 大型科技股涨跌互现 英伟达涨超2% 脸书涨0.86% 亚马逊涨0.65% 谷歌跌近1% 苹果跌0.67% 微软跌0.59% 特斯拉跌0.14% [6] - 苹果宣布拓展Apple Pay跨境支付支持 新增支持多家中国银行发行的Visa信用卡及中信银行Visa借记卡 [7] - 谷歌推出基于Gemma 3构建的开放翻译模型TranslateGemma 支持55种语言间交流 [8] - 奈飞与索尼达成扩展协议 将在索尼电影影院上映后在全球范围内进行流媒体播放 [8] 银行股表现与动态 - 银行股多数上涨 摩根大通涨0.48% 高盛涨超4% 花旗涨逾4% 摩根士丹利涨近6% 美国银行涨0.16% 富国银行跌0.34% [8] - 高盛集团和摩根士丹利的财报显示 两家公司的股票交易部门去年营收均创下历史新高 [9] - 高盛将发行投资级债券以筹集160亿美元 这将是华尔街银行史上规模最大的此类债券发行 [9] 大宗商品市场 - 原油价格大幅下跌 布伦特原油期货下跌2.76美元或4.15% WTI原油期货价格下跌2.83美元或4.56% [10] - 市场将特朗普提及伊朗杀戮已停止的表述 视作美国或许会暂缓实施潜在军事行动的信号 [10] - 伦敦黄金、白银现货价格双双跳水 截至发稿伦敦白银现货价格跌幅超1.5% [10]