Workflow
开源模型
icon
搜索文档
直击CES | 黄仁勋新年第一场发布:物理AI的ChatGPT时刻即将到来
第一财经· 2026-01-06 10:20
英伟达CEO黄仁勋CES前演讲核心观点 - 英伟达CEO黄仁勋在CES开幕前发表演讲,发布多款与物理AI相关的开源模型,并首次详细披露新一代芯片平台Rubin的性能数据[1] - 演讲指出AI和计算架构正同时发生双重变革,AI本身既是应用又是新平台,软件开发范式正从编写代码转向训练模型[6] - 公司认为AI发展的下一站是进入物理世界,并预测自动驾驶汽车的转折点可能正在此时发生[9][12] 行业变革与AI平台 - 计算机行业每10到15年经历一次平台变革,但当前AI和计算架构正同时发生双重变革[6] - AI本身既是应用又是新平台,开发者将在其上构建更多应用[6] - 软件开发范式被彻底颠覆:从编写代码转向训练模型,从预编译执行转向实时生成[6] - 加速计算和人工智能正在彻底重塑计算领域的每个层面[7] - 过去十年价值约10万亿美元的计算基础设施正在进行现代化改造,每年还有数千亿美元的风投资金涌入该领域[7] - 全球100万亿美元的产业正在将研发预算从传统方法转向人工智能[7] - 去年行业最重要的改变之一是开源模型真正起飞,中国的DeepSeek R1等模型激活了全球性的开源运动[7] 物理AI与自动驾驶 - 物理AI是演讲的重中之重,英伟达已为此工作8年,其ChatGPT时刻即将到来[1][9] - 核心挑战在于让AI获得对物理世界的“常识”,如物体恒存性、因果性、摩擦力等[9] - 英伟达建立了一个包含训练、模拟和运行三台计算机的系统,并使用基于物理定律的合成数据来训练AI[9] - 仿真是英伟达几乎所有物理AI工作的核心,推动AI从对话者转变为现实世界的行动者[12] - 自动驾驶被视作最被看好的落地场景,未来十年世界上很大一部分汽车将是自动驾驶或高度自动驾驶的[12] - 英伟达推出开源推理VLA模型Alpamayo,包含开源AI模型、仿真工具和数据集,以加速安全的自动驾驶车辆开发[16] - 英伟达DRIVE AV软件将用于梅赛德斯奔驰车辆,第一辆AV自动驾驶汽车将于2025年第一季度在美国上路,随后进入欧洲和亚洲[16] - 公司将继续更新版本,并扩大合作建造L4 Robotaxi的生态系统[16] 工业制造与机器人 - 工业制造是物理AI的另一核心战场,英伟达宣布与西门子深化合作,将其物理AI模型、Omniverse仿真平台集成至西门子的工业软件组合[16] - 合作覆盖从芯片设计、工厂模拟到生产运营的全生命周期,公司认为正站在一场新工业革命的开端[16] - 物理AI将赋能芯片设计、生产线自动化乃至整个数字孪生系统,实现“在计算机中设计、在计算机中制造”[16] - 机器人系统的下一段征程是不同尺寸的机器人,公司推出了多个与机器人相关的开源模型和开发框架[17] - 新推出的模型包括Cosmos Transfer 2.5和Cosmos Predict 2.5世界模型、面向智能机器人的推理视觉语言模型Isaac GR00T N1.6等[17] Rubin芯片平台性能 - Rubin平台包含六款新芯片:Vera CPU、Rubin GPU、NVLink 6交换机芯片、ConnectX-9 Spectrum-X超级网卡芯片、BlueField-4 DPU、Spectrum-6以太网交换机芯片[18] - Rubin GPU的NVFP4(4位浮点数格式)推理算力为50 PFLOPS,是Blackwell的5倍;NVFP4训练算力为35 PFLOPS,是Blackwell的3.5倍[20] - Rubin GPU的HBM4内存带宽为22 TB/s,是Blackwell的2.8倍;晶体管数量为3360亿个,是Blackwell的1.6倍[20] - 与Blackwell平台相比,Rubin平台通过软硬件协同设计,将推理token成本降低10倍,将训练MoE模型所需的GPU数量减少4倍[20] - ConnectX-9 Spectrum-X超级网卡芯片有230亿个晶体管,支持800 GB/s以太网[21] - BlueField-4 DPU有1260亿个晶体管,其网络能力、计算能力和内存带宽是上一代BlueField-3的2倍、6倍、3倍[21] - Spectrum-X以太网共封装光学器件有3520亿个晶体管,可支持102.4 Tb/s横向扩展交换基础设施[21] 系统级产品与生产计划 - 公司推出了推理上下文内存存储平台,作为一种新型的AI存储基础设施,并由BlueField-4 DPU提供支持[22] - BlueField-4 DPU可为AI基础设施提供单一、可信的控制点,以便配置、隔离和运营大规模AI环境[22] - 新一代NVLink72是一种机架级扩展系统,通过整合多个CPU、GPU等形成单一较高效率的加速单元[22] - Vera Rubin NVL72的NVFP4推理和训练算力分别是3.6 EFLOPS、2.5 EFLOPS,分别是Blackwell的5倍和3.5倍[23] - Vera Rubin NVL72的HBM4内存带宽为1.6 PB/s,是Blackwell的2.8倍;晶体管数量为220万亿个,是Blackwell的1.7倍[23] - 相比使用Blackwell NVL72,使用Rubin NVLink72训练模型所需GPU数量是前者的1/4,思考输出的token数量则是10倍[23] - DGX SuperPOD由一个超节点整合8个Rubin NVL72机架中的576颗GPU,产品将于2025年下半年上市[23] - Rubin平台产品已全面投入生产,基于该平台的产品则将于2026年下半年由合作伙伴推出[23] - 首批使用Rubin的云服务提供商包括AWS、谷歌云、微软等,Anthropic、OpenAI、xAI等AI实验室也将使用其算力[23]
黄仁勋又夸了DeepSeek,新一代“算力巨兽”正在量产,性能暴增5倍!
凤凰网· 2026-01-06 10:19
行业范式迁移 - 计算行业正同时经历两大平台迁移:应用转向以AI为核心构建,以及软件开发运行范式从“编程”转向“训练”、从CPU转向GPU、从执行预编译代码转向实时生成内容 [2] - 驱动变革的资金来自全球研发预算向AI的转移以及海量风险投资,过去十年价值约10万亿美元的计算产业正在被现代化改造 [4] - 开源模型已触及技术前沿,虽然与最前沿专有模型仍有约6个月差距,但其快速迭代正激活全球创新,成为AI迅速扩散的主引擎 [4] AI能力演进:从数字智能到物理AI - AI能力演进的下一个关键阶段是从大语言模型的“记忆与生成”迈向智能体的“推理与行动”,智能体能够进行思维链推理、主动规划步骤并调用工具,以解决新问题 [5] - 智能体架构本质上是多模型、多云、混合式的,能够根据任务动态选择最佳模型,并结合企业私有定制化模型 [7] - 真正的挑战在于让AI理解物理世界,这引出了“物理AI”的核心主题,需要构建由训练计算机、边缘推理计算机和高精度物理模拟计算机组成的完整系统 [7] 开源世界模型与自动驾驶系统 - NVIDIA Cosmos是一个开源的、“前沿级”的世界基础模型,基于对互联网规模视频、真实驾驶数据和3D模拟的学习,建立起对世界运作方式的统一表征 [8] - Cosmos能够根据单张图片生成逼真视频,或从3D场景描述中生成物理合理的运动轨迹,并能在交互式闭环模拟中响应AI动作及进行因果推理,其核心价值在于“将计算转化为数据”,以解决现实世界数据收集的成本与效率瓶颈 [8] - 基于Cosmos生成的海量合成与真实数据,公司训练并开源了首个端到端自动驾驶系统NVIDIA AlphaMio,这是世界上第一个具备思考推理能力的自动驾驶汽车AI,具备行动可解释性,首款搭载该系统的梅赛德斯-奔驰汽车将于2026年第一季度上路 [8] 新一代AI芯片架构Vera Rubin - 面对AI模型规模每年增长10倍、计算需求爆炸的挑战,公司揭示了下一代AI芯片架构NVIDIA Vera Rubin [9] - Vera Rubin架构包含Vera CPU与Rubin GPU,其中新一代CPU性能功耗比提升2倍,GPU的AI浮点性能达到Blackwell架构的5倍 [11] - 架构包含革命性的NVFP4张量核心,能动态自适应调整精度以优化Transformer模型吞吐量 [11] - 这是一次从芯片到系统的全栈革新,包括集成硅光子的Spectrum-X以太网交换机(512个200Gb/s端口)、为AI工作负载重塑的BlueField-4 DPU,以及彻底简化的DGX机箱设计 [11] Vera Rubin的系统性能与生产状态 - Vera Rubin的性能飞跃秘诀在于“极端协同设计”,对公司内部所有芯片进行彻底重新设计,使其作为一个整体系统工作,一次性展示了6款革命性芯片 [12] - 一个包含1152个GPU的Vera Rubin POD机柜重达约2吨,内部含2英里长的铜缆,散热仅需45摄氏度温水,能效显著 [13] - 该架构将使训练一个10万亿参数大模型所需的系统数量减少至Blackwell的四分之一,同时推理成本降低一个数量级 [13] - Vera Rubin芯片架构目前正在全力生产中 [13] 产业生态与未来应用 - 公司与西门子达成重磅合作,将物理AI模型与Omniverse数字孪生平台深度集成到西门子的工业软件与自动化系统中,共同推动从芯片设计到生产运维的全面数字化革命 [13] - 自动驾驶汽车仅是物理AI的第一个主流市场,相同的技术栈正催生机器人革命的到来,从机械臂到人形机器人,机器人领域的“ChatGPT时刻”即将到来 [14] - 公司通过开源关键模型与发布颠覆性硬件,正强势定义“物理AI”时代的技术标准与基础设施,战略核心是以全栈式的开放生态占据从数据中心到机器人指尖的每一个计算节点 [14]
1.6犀牛财经早报:2026年约50万亿元存款到期 流向备受关注
犀牛财经· 2026-01-06 09:35
年金基金与资本市场 - 规模超7万亿元的年金基金迎来长周期考核机制 旨在改变短期主义倾向 促进长期投资 壮大耐心资本 为市场注入源头活水 [1] - 2025年A股上市公司分红总额超2.6万亿元 创历史新高 其中上交所分红2.06万亿元 同比增长11% 深交所分红5475.59亿元 北交所分红63.93亿元 同比增长2.62% [1] 行业趋势与宏观资金 - 券商测算2026年约50万亿元中长期定期存款到期 其流向受市场关注 目前尚未出现大规模转向理财产品的迹象 [2] - 近三年来保险行业发债规模均超千亿元 反映行业在业务扩张、偿付能力改善及资产负债管理方面的资本补充需求 [2] - “冷资源”带动冰雪消费 万亿赛道迸发新动能 长春等地推出多种冰雪旅游新玩法吸引游客 [2] 公司业绩与经营动态 - 超40家A股公司预告2025年度业绩同比增长 电子、机械设备、基础化工、医药生物等行业预增公司较多 [1] - 章源钨业上调2026年1月上半月长单采购报价 55%黑钨精矿报46.00万元/标吨 55%白钨精矿报45.90万元/标吨 仲钨酸铵报67.00万元/吨 [3] - 空中客车2025年交付793架喷气式飞机 达成下调后的关键生产目标 [6] - 航天科工火箭公司29.5904%股权挂牌转让 底价约33亿元 整体估值约112亿元 [7] - 爷爷的农场国际控股有限公司向港交所递交上市申请 主营婴童零辅食及家庭食品 [7] 人工智能与科技 - 桥水创始人达利欧警告AI热潮已进入泡沫初期阶段 并指出2025年美国股市表现显著落后于非美股市及黄金 [4][5] - 英伟达CEO黄仁勋在演讲中提及开源模型崛起是行业创新的催化剂 特别提到中国开源模型DeepSeek R1、Kimi K2、Qwen [5] - SK海力士将在CES 2026首次亮相下一代HBM产品“16层48GB HBM4” 并展出12层36GB HBM3E产品 [6] 公司资本运作与股权变更 - 诺德基金实际控制人变更为四川能源发展集团有限责任公司 [6] - 先导智能拟发行不超过2亿股境外上市普通股(H股)并在香港联交所主板上市 [14] - 威高血净拟收购威高普瑞100%股权 交易价格85.11亿元 交易后主营业务将新增医药包材研发生产销售 [15] 监管与公司风险事件 - 上交所对天普股份及有关责任人予以监管警示 因其在股价异动后设立AI业务子公司但未充分澄清及提示风险 [8][9] - 登云股份实际控制人杨涛因涉嫌非法吸收公众存款罪被批准逮捕 公司称其未在公司任职 经营正常 [10] - 清越科技因涉嫌定期报告等财务数据虚假记载被证监会立案调查 若认定触及重大违法强制退市情形 股票将被实施退市 [12] - 烽火电子及控股子公司累计诉讼仲裁涉案金额达1.973亿元 占最近一期经审计净资产的11.14% [13] 金融市场与资产表现 - 美股三大指数集体收涨 道指涨1.23%再创历史新高 纳指涨0.69% 标普500指数涨0.64% [15] - 避险情绪推动贵金属大涨 现货黄金涨超2.5% 现货白银大涨5% 伦铜首次升至13000美元 [18] - 比特币大涨重返9.5万美元附近 以太坊站上3200美元关口 [18]
黄仁勋CES最新演讲:Rubin 今年上市,计算能力是 Blackwell 5 倍、Cursor 彻底改变了英伟达的软件开发方式、开源模型落后先进模型约6个月
AI前线· 2026-01-06 08:48
文章核心观点 - 英伟达在CES 2026上宣告AI发展进入历史性转折点,从理解语言走向改造物理世界,并系统性披露了面向“物理AI”的最新技术路线图 [2] - 公司正试图以一套完整的全栈式计算与软件体系,推动AI从“看懂世界”走向“理解、推理并行动” [2] 双重平台迁移与行业根本性转变 - 计算的核心正从传统CPU转向以GPU为核心的加速计算 [4] - 应用开发的基础正从预定规则代码转向以人工智能为基座,应用程序转变为能理解语境、动态生成内容的全新实体 [4] - 这两种根本性转变同时发生、相互交织,彻底重塑了计算的本质 [4] 2025年AI关键进展与趋势 - 2025年开源模型取得关键突破,虽仍落后尖端模型约六个月,但已触及技术前沿 [3][9] - 具备推理能力的模型出现,创造了“Test Time Scaling”革命性概念,即实时思考的能力 [6] - 能自主思考的Agent系统在2024年诞生,2025年已渗透到各个角落,能推理、检索信息、使用工具、规划未来 [8] - 物理AI是与物理世界交互及理解物理定律的AI,是除大语言模型外最重要的一类AI [8] - 开源模型的突破激活了全球企业、行业,模型下载量呈现爆炸式增长 [9] 英伟达的物理AI战略与三台计算机体系 - 构建物理AI需要三台计算机:用DGX训练AI模型,通过Omniverse和RTX上的Cosmos来仿真、测试与验证模型,最后通过AGX将模型部署到现实世界 [12] - 物理AI浪潮为英伟达物理AI部门带来近万亿美元的机遇 [12] - 公司将物理AI模型分为三大系列:Cosmos World基础模型、通用机器人模型GROOT,以及具备思考能力的自动驾驶模型AlphaMayo [12] Cosmos世界基础模型进展与应用 - Cosmos在对物理世界的理解上已与GPT-40、Gemini等顶级模型并驾齐驱,在物理推理等关键评估中取得更高分数 [14] - 这些模型下载量已突破400万次 [14] - 正驱动制造、物流、医疗健康与出行等各行业的实际应用,例如日立、Lem Surgical、Salesforce、Telet、Uber等公司均已部署 [14] 开源自动驾驶模型AlphaMayo - AlphaMayo是全新的开源AI模型、仿真工具和数据集系列,用于训练物理机器人和车辆,旨在帮助自动驾驶车辆应对复杂情况 [16] - 这是史上首个让自动驾驶车辆具备思考能力的模型,可以让自动驾驶汽车“像人类一样思考”,通过推理解决复杂边缘场景 [16] - 模型拥有100亿参数,既足以处理任务,又轻量化到可在工作站运行 [18] - 公司开源了包含17小时驾驶记录的数据集,成为业内最大最多元的公开自动驾驶数据集 [19] - 同时发布完全开源的AlpaSim仿真框架,用于评估推理模型 [19] 开源机器人模型GROOT 1.6与开发平台 - 发布GROOT 1.6,这是专为人形机器人打造的最新开源推理模型 [24] - 该版本采用Cosmos Reason作为长效思考中枢提升推理能力,并解锁了人形机器人全身协调控制能力 [24] - GROOT 1.6已成为社区热门选择,位列Hugging Face平台下载量最高的机器人基础模型之一 [24] - Isaac机器人平台提供了构建“通专融合型机器人”所需的开放框架、模型与工具库 [24] - 开发了开源控制中心NVIDIA OSMO,整合从数据生成到训练的完整流程 [26] - 发布Isaac Lab Arena,这是全球首个用于在仿真环境中安全测试机器人技能的开源框架 [26][27] 机器人生态合作与硬件支持 - 波士顿动力、Franco Robotics、Lem Surgical、LG电子等先进机器人公司已在Isaac与GROOT基础上构建其新一代物理AI系统 [29] - 英伟达与Hugging Face合作,将200万英伟达机器人专家与1300万Hugging Face AI开发者社区连接起来 [30] - 推出基于Blackwell架构的Jetson T4000,在40-70瓦功耗下提供1,200TOPS的AI算力与64GB内存,其AI性能与能效较AGX Orin提升4倍 [31] AI超算Vera Rubin发布 - 发布面向人工智能数据中心的新计算平台Vera Rubin,该系统目前正在生产中,首批产品将于2026年下半年上市 [32][36] - AI模型规模每年以10倍速度增长,推理变为思考过程导致计算需求爆炸,每年生成的文本量以5倍速度增长 [34] - 每次达到新边界,上一代AI生成文本的成本就会下降约10倍 [34] - Vera Rubin是一个由六种芯片(Vera CPU、Rubin GPU等)通过极致协同设计组成的系统 [38][44] - 系统重近2吨,包含220万亿个晶体管,是100%全液冷设计 [37][41] - 计算板卡可提供100 Petaflops的AI算力,是前代的5倍 [40] - 自设计启动以来累计投入1.5万工程师·年 [41] - 虽然功耗翻倍,但冷却液温度保持45°C,整个系统能效提升约两倍,预计能为全球数据中心节省6%的电力 [47] - 以训练10万亿参数模型为例,Rubin的吞吐量远超Blackwell,仅需1/4数量的系统即可在一个月内完成相同训练 [49]
黄仁勋新年第一场演讲,提了DeepSeek
第一财经· 2026-01-06 07:45
行业核心观点 - 英伟达CEO黄仁勋在发布会上总结AI行业进展,认为开源模型的崛起已成为全球创新的催化剂 [1] - 其中Deepseek R1的出现意外推动了整个行业的变革 [1] - 目前全球涌现出多个开源模型,其性能越来越逼近领先的前沿大模型 [1] 开源模型发展现状 - 全球涌现出多个开源模型,性能正逼近前沿大模型 [1] - 发布会上展示的开源模型图片中,包含了三家中国开源模型,分别是Kimi K2、Qwen、DeepseekV3.2 [1]
黄仁勋新年第一场演讲,提了DeepSeek
第一财经· 2026-01-06 07:18
行业核心观点 - 开源模型的崛起成为全球创新的催化剂,其中Deepseek R1的出现意外推动了整个行业的变革 [1] - 未来十年里,世界上很大一部分汽车将是自动驾驶或高度自动驾驶的 [3][4] AI模型与开源生态 - 全球涌现出多个开源模型,其性能越来越逼近领先的前沿大模型 [1] - 发布会上展示了多家中国开源模型,包括Kimi K2、Qwen、DeepseekV3.2 [1] - 模型规模每年增长10倍,Test-Time Scaling思考产生的token数每年增长5倍,每token的成本每年便宜10倍 [3] - 公司发布了Alpamayo系列VLA开源AI模型和工具,用于自动驾驶车辆开发 [4] 硬件与算力进展 - 公司发布了新一代Rubin GPU [6] - Rubin GPU的NVFP4推理算力为50 PFLOPS,是Blackwell的5倍 [6] - Rubin GPU的NVFP4训练算力为35 PFLOPS,是Blackwell的3.5倍 [6] - Rubin GPU的HBM4带宽为22 TB/s,是Blackwell的2.8倍 [6] - Rubin GPU的晶体管数量为3360亿个,是Blackwell的1.6倍 [6]
黄仁勋新年第一场演讲 提了DeepSeek
第一财经· 2026-01-06 07:17
行业核心观点 - 英伟达CEO黄仁勋在发布会上总结AI行业进展 指出开源模型的崛起是全球创新的催化剂 [1] - 其中Deepseek R1的出现意外推动了整个行业的变革 [1] 开源模型发展现状 - 全球涌现出多个开源模型 其性能越来越逼近领先的前沿大模型 [1] - 发布会上展示的开源模型包括三家中国模型 分别是Kimi K2、Qwen、DeepseekV3.2 [1]
中美AI竞赛:界限日益模糊,下一战关键何在?
财富FORTUNE· 2025-12-31 21:06
文章核心观点 - 当前AI领域存在显著的资本泡沫,部分模型公司在零收入阶段估值已达数亿美元,市场预期将经历价格重置 [2][13] - 尽管存在泡沫,但本轮AI创新由真实的产业需求驱动,且初创企业正加速转向B端,技术“上升”与产业“下沉”的趋势明确,整体发展前景审慎乐观 [3][7] - 中美在AI发展上路径不同但界限正变得模糊,中国在应用层和基础设施有独特优势,美国在技术层和芯片领域领先,硅谷独特的创新生态是其核心优势 [8][10] - AI领域的投资与应用机会目前主要集中在B端,因为B端有未被垄断的产业数据、明确的降本增效需求以及大企业合作并购的活跃生态 [17][18] - AI技术正在多个垂直领域(如医疗、太空科技)快速落地并创造价值,智能体(Agent)被认为是下一个爆发点,但通用人工智能(AGI)仍很遥远 [21][23][32] AI行业现状与泡沫分析 - 多家权威机构评选的年度词汇均与AI相关,如“slop”、“DeepSeek”,而硅谷投资人的年度词汇可能是“泡沫” [2] - AI投资泡沫贯穿全年,体现在美股市场对概念的追捧、科技巨头间的“循环交易”以及巨额融资洽谈,如亚马逊与OpenAI正在洽谈高达100亿美元的投资 [2] - 部分模型公司在产品与收入均为零时,估值已高达数亿美元,市场迟早会迎来价格重置,甲骨文与CoreWeave已出现市值大幅回调 [2][13] - 本轮泡沫与2000年互联网泡沫不同,当时公司缺乏实际收入且偏重C端,而本轮AI创新有真实产业需求支撑,且初创企业加速转向B端 [3][15] - 市场已显现早期调整信号,许多公司在A轮、B轮融资时,投资方会严格考察收入数据质量,未能通过验证的公司将面临融资困难与估值调整 [16] AI技术发展趋势:“上升”与“下沉” - **技术“上升”**:在AI基础设施层,芯片格局正从GPU主导走向多元化,新模型架构在CPU上效率更高,谷歌TPU、高通与英特尔的NPU发展迅猛 [4] - **技术“上升”**:云基础设施的四大难题(算力成本高、能耗大、边缘设备应用难、数据隐私)正逐步解决,例如OpenAI的token价格已从每千个30美元大幅降至9美分 [4] - **技术“上升”**:通信过程中的能耗是计算本身能耗的百倍以上,成为优化重点,新模型与芯片架构不断优化计算效率 [4] - **技术“上升”**:边缘AI快速推进,谷歌等公司正开发参数低于10亿、性能可比肩GPT-4的端侧小模型,未来可在手机本地运行 [4] - **技术“上升”**:数据隐私方面,联邦学习等技术已在金融、医疗等高监管行业部署,配套监管科技同步发展 [4][5] - **应用“下沉”**:在美国,非科技领域如医疗、金融保险、太空科技的AI应用进入快速迭代阶段,初创企业层出不穷,大公司全力冲刺 [6] - **应用“下沉”**:美国大公司与初创企业的合作与并购活跃,Fusion Fund今年有五家公司被大企业收购,其中三家成立不到两年,价格均超过两三亿美元 [6] - **应用“下沉”**:Meta宣布收购通用自主AI智能体公司Manus,交易高达数十亿美元,成为其成立以来规模第三大的收购案,标志着AI正从“工具”加速进化为“行动者” [6] 中美AI发展对比与生态 - 美国在芯片、模型、基础设施层面领先,但电网老化严重,难以满足AI能耗需求,微软、谷歌等巨头不得不转向自建能源系统 [8] - 中国在新能源基础设施、完备的机器人供应链以及全民化的技术应用氛围上已构筑起独特优势 [8] - 在美国,中老年人积极拥抱新技术的现象较少,而中国用户无论处于任何年龄层,都在快速学习使用新技术 [8] - 关于开源模型,中国的DeepSeek、阿里巴巴等公司持续贡献开源模型,而美国科技公司如OpenAI、谷歌、Meta因处于大规模商业化阶段,开源意愿很有限 [8] - 硅谷独特的创新生态在于大公司与初创企业形成新型共生关系:前者为后者提供试错场景和并购出口,后者为前者注入创新活力 [8] - 美国企业CTO的主要职能是投资未来技术,其预算用于采购、合作和并购创新项目,并对合作失败有容错空间 [9][19] - 活跃的并购市场是硅谷的优势,10多人的团队在收入仅数千万美元时获得数亿美元收购的情况屡见不鲜 [19] 投资策略与市场观察 - 作为早期投资人,对估值保持敏感,如果项目估值过高则选择不投,相信企业要遵循自然发展规律,在不同阶段匹配相应估值 [16] - 投资专注于To B项目,涵盖企业级AI、工业自动化与医疗AI等,会深入分析订单质量(如合约年限、预算来源) [17] - 通过构建的CXO社群网络(涵盖45家全球千强企业的CTO)为被投企业带来超过1.5亿美元的订单与战略合作 [19] - 在谈判估值时,不仅能提供订单,还能帮助创始人获取政府补贴等不占股的非稀释性资源,从而以更合理的估值完成投资 [20] - 评估AI公司能否“跑出来”大约需要两年时间,优质公司增长极快 [26] - 投资决策要素排序:最看重市场规模和增量市场时机;其次看团队,尤其是“创始人-产品-市场”契合度;技术需满足“更好、更快、更省”,成本是关键竞争要素 [28] 垂直领域应用与未来展望 - **太空科技**:AI与机器人技术正渗透太空经济,SpaceX已将单次发射成本从数十亿美元降至不到一亿美元,未来很快将降至千万美元级,推动卫星数据应用普及 [20] - **太空科技**:投资了从事卫星交通管理与数据交易的公司,其收入已达数千万美元;还投资了开发全自动化机器人系统在月球提取水并制造太空燃料的公司 [21] - **医疗健康**:今年是医疗大年,AI加速脑部疾病(如帕金森、阿尔茨海默症)领域的创新,涉及诊断与治疗,投资了糖尿病垂直小模型和细胞疗法基础模型公司 [21] - **AI智能体**:代码智能体(Coding Agent)已近乎杀手级应用,目前多数科技公司80%的代码由AI生成,智能体的未来明确,但当前技术仍在发展,预计再有一年时间将趋于成熟 [23] - **AI智能体**:投资了多家智能体基础设施公司,专注于操作系统、成本优化与幻觉消除,一旦基础稳固,应用层将快速涌现 [23] - **未来突破**:期待智能体爆发及各产业(如医疗、金融、保险等占美国GDP超50%的服务业)广泛整合AI,这将是发展的“华彩乐章” [32] - **AGI认知**:距离通用人工智能(AGI)尚远,无需执着追求,各行业可发展垂直应用,在特定场景超越90%的人类就是很大突破 [32] 具体投资案例与绩效 - 自2015年重点布局AI企业,如Otter AI、You.com等,均已成长为独角兽,今年有5家被投AI公司被收购,明年还有3家即将IPO [12] - 投资的一家B2B AI公司,年收入从去年上半年的50万美元增长至现在的1.5亿美元;另一家公司年收入从零增至2000万美元,团队不足10人 [12] - 过去两三年投资的企业中,70%以上年收入增长超过20倍 [12] - 最满意的投资项目是一家赋予AI长期记忆的模型公司,其视频模型可分析视频内容并给出精准总结,主要应用于To B场景如机器人工业安全 [24] - 决策周期最长的项目是一个利用小胶质细胞治疗帕金森症的医疗项目,运用了AI实现个性化治疗,投后获得美国国立卫生研究院(NIH)的政府补贴资金 [24] - 2015年投资了脑机接口公司Paradromics(侵入式),已进入临床实验阶段,可能很快成为独角兽 [29]
腾讯混元开源翻译模型1.5,可手机离线部署
新京报· 2025-12-30 18:48
公司动态 - 腾讯混元于12月30日宣布推出并开源翻译模型1.5,包含Tencent-HY-MT1.5-1.8B和Tencent-HY-MT1.5-7B两个模型 [1] - 两个模型均支持33个语种互译以及5种民汉/方言,覆盖中文、英语、日语等常见语种及捷克语、马拉地语等小语种 [1] - 模型已在腾讯混元官网上线,并可通过开源社区直接下载使用 [1] 产品技术规格 - HY-MT1.5-1.8B模型主要面向手机等消费级设备,支持端侧直接部署和离线实时翻译 [1] - 该模型经过量化,1GB内存即可流畅运行 [1] - 在参数量极小的前提下,其推理速度优于主流商用翻译模型API,处理50个tokens平均耗时0.18秒,而其他模型耗时约0.4秒 [1] 应用部署策略 - 在部分用户实用场景下,可同时使用混元翻译1.8B和7B两个尺寸的模型 [1] - 此策略旨在实现端侧和云侧模型的协同部署 [1]
腾讯混元开源翻译模型1.5
每日经济新闻· 2025-12-30 16:44
公司动态 - 腾讯混元于12月30日正式开源其翻译模型1.5版本 [2] - 开源模型包含两个具体型号:Tencent-HY-MT1.5-1.8B和Tencent-HY-MT1.5-7B [2] - 模型已上线腾讯混元官网,并可在开源社区直接下载使用 [2] 产品与技术 - 开源翻译模型支持33个语种互译 [2] - 模型额外支持5种民汉或方言翻译 [2] - 支持语种不仅包括中文、英语、日语等常见语种,也包含捷克语、马拉地语、爱沙尼亚语、冰岛语等小语种 [2]