Large Language Model (LLM)
搜索文档
推理之父走了,OpenAI七年元老离职:有些研究这里没法做
36氪· 2026-01-06 15:45
核心观点 - OpenAI研发副总裁、核心技术奠基人Jerry Tworek于2026年初离职,其离职理由“想做在OpenAI做不了的研究”引发对公司研究方向与内部文化的深度担忧 [1][6][7] - 此次离职是OpenAI核心人才持续流失的最新案例,此前已有多位联合创始人、研究副总裁、安全负责人等关键人物因理念不合、商业化压力或安全分歧而离开 [1][8][10][11][13] - 公司正面临从理想主义研究机构向商业化巨头转型所带来的内部撕裂,核心矛盾集中在商业化压力与前沿研究/安全优先的理念冲突上,这可能动摇其最核心的资产——人才基础 [14][20][21][23] 关键人物离职详情 - **Jerry Tworek离职**:作为OpenAI七年老兵、研发副总裁,其离职标志着一位“开国功臣”级别的人物离开 [1][6] - **Jerry Tworek的技术贡献**:他是公司两大核心技术路线的奠基人和掌舵者,具体贡献包括:1) 作为“推理模型”之父,是o1/o3系列项目的团队负责人;2) 作为“编程代码”之父,是Codex模型的核心研究员;3) 是GPT-4解决复杂编程能力的关键贡献者;4) 在2025年主导了GPT-5的部署及ChatGPT Agent的研发;5) 其论文是AI解决数学难题的关键研究,在“代码生成”和“强化学习(RLHF)”领域拥有极高的学术引用数 [2] - **历史核心人才流失**:近年来离职的关键人物包括:前研究副总裁Dario Amodei(2021年出走创立竞争对手Anthropic及Claude)、联合创始人兼首席科学家Ilya Sutskever(政变后离开)、强化学习大牛及ChatGPT核心技术推手John Schulman、超级对齐团队负责人Jan Leike(因安全理念不合离职),以及产品、政策、安全等多条线的副总裁级别人物 [8][10][11][13] 公司内部环境与挑战 - **商业化转型的冲击**:公司从确保AGI造福全人类的非营利研究组织,在ChatGPT爆火和微软百亿美金注入后,转变为需要不断推出产品、追求商业回报的赚钱机器,这导致研究文化发生变化 [14] - **研究方向与安全优先级的变化**:部分核心研究人员感到工作重心转向赶产品发布截止日期、卷产品化功能以及讨好投资人和用户,与最初的研究乌托邦理想相悖 [14] - **安全问题的分歧**:前安全团队负责人Jan Leike因公司“把安全放在了次要位置”而“摔门而出”,凸显了在AI安全治理上的内部撕裂 [14] - **领导层与团队稳定性**:Sam Altman在2023年底权力斗争后虽巩固了控制权,但导致反对其的董事被清洗,并与多位元老级研究员关系破裂,权力核心变得“越来越孤独” [15][17][23] 行业竞争格局 - **竞争对手的壮大**:Anthropic(Claude)在编程等领域紧逼OpenAI,谷歌的Gemini在多模态领域不断迭代,Meta、xAI以及开源势力也在后面穷追猛打,行业竞争日益激烈 [17] - **人才流向竞争对手**:OpenAI流失的核心人才(如Dario Amodei)直接加强了竞争对手的实力 [8][17] 公司现状与未来展望 - **冰火两重天的人才流动**:在核心老将持续流失的同时,公司也在吸引新鲜血液,例如AI图像搜索引擎Lexica的创始人Sharif Shameem近期宣布加入,认为OpenAI是“改变世界的最佳舞台” [18] - **市场观点的分歧**:看多观点认为公司拥有GPT系列的技术领先、微软的坚定盟友支持、增长的用户规模与商业收入以及雄厚的技术人才储备;看空观点则指出核心人才持续流失、安全问题悬而未决、商业化透支技术信用以及竞争对手日益逼近等风险 [19] - **根本性挑战**:文章指出,科技公司最核心的资产是“人”,当最聪明的大脑开始“用脚投票”,创始元老纷纷离去,这本身就是一个危险的信号,可能预示着更深层次的危机 [20][21][23]
看完才发现,AI 早已悄悄改变顶尖程序员的工作方式!Flask 之父:传统代码协作工具已经 Out 了
程序员的那些事· 2026-01-02 14:00
文章核心观点 - 资深开发者通过一整年深度使用AI编程工具,工作模式发生根本性转变,从亲自编码转变为管理和指导“虚拟程序员实习生”[6] - 2025年被视作“智能体元年”,以Claude Code为代表的工具结合了大型语言模型与工具执行功能,改变了编程范式[9][10] - 开发者与AI协作的关系引发复杂思考,包括无意识的拟人化倾向以及工具命名的伦理争议[12][13] - 现有的软件开发工具(如版本控制系统、代码审核平台)已无法适应AI生成代码的新工作流程,亟需创新[22][24] - AI编程的普及带来了新的行业挑战,如代码质量审核、开源项目贡献规范以及对外包与自研趋势的潜在影响[18][26][27] 不一样的2025年:工作模式的根本转变 - 开发者彻底改变了编程方式,从主要使用Cursor转变为几乎完全依赖Claude Code,无需亲手敲键盘[6] - 工作角色从编码者转变为工程负责人,管理一个“虚拟程序员实习生”[6] - 因深入探索AI领域,年度博客文章产出大幅增加,全年发布36篇文章,约占其自2007年开通博客以来总内容的18%[7] 智能体元年:工具生态与范式确立 - 核心工具体验:Amp被类比为高端精致的苹果或保时捷,Claude Code是经济实惠的大众,Pi则是黑客的开源首选[14] - Claude Code开创的模式被视为当前最顶尖的,其结合大型语言模型与工具执行的能力令人惊叹[9][10] - 文本用户界面强势回归,开发者常用的Amp、Claude Code和Pi均为命令行操作工具[9] - 大型语言模型的功能从年初的代码生成扩展到日常琐事处理和生活规划,预计2026年将涌现大量消费级AI产品[10] 我与机器:协作关系的困惑与思考 - 开发者容易对常用工具产生“拟社会关系”,这种感觉既奇怪又令人不安[12] - 尽管努力将模型视为字符处理工具,但发现此简化观点已站不住脚,系统已具备某些人的特质,但将其等同于人类是错误的[12] - 反对使用“智能体”一词,因为能动性和责任应属于人类,但缺乏更贴切的术语来描述这些机器[12] - 与坚决抵制AI系统的人共事时,会感到尴尬,行业普遍反对给机器赋予人格[13] 众说纷纭:主观感受与行业共识的动摇 - 关于AI工具的讨论,焦点常集中在使用“感觉”而非纯粹技术上,这挑战了半个世纪以来的软件工程经验[16] - 许多行业共识经不起推敲,但难以证伪,例如开发者认为MCP用起来不顺手,却只能以“对我不适用”作为理由[16] - 模型选择具有高度主观性,例如有人从Claude转向Codex并认为好用,而本文开发者则偏爱Claude,只因“感觉对了”[16] - 需注意网络观点的利益倾向,许多言论来自相关产品的投资者或收费推广博主,可能影响其客观性[16] 外包还是自研:AI对开发模式的影响 - 当前趋势是核心服务外包给专业公司,如使用Stainless、Fern、Mintlify、Clerk等现成服务,提高了用户体验门槛[18] - AI编程工具提供了自研能力,例如开发者让Claude制作了支持Python和TypeScript的SDK生成器,过程并不困难[18] - AI可能鼓励减少对第三方工具的依赖,转向自己动手开发,这与当前普遍的外包趋势形成对比,未来方向尚不确定[18] 心得体会与未来期许:亟待创新的领域 - **新型版本控制系统**:传统工具如Git和GitHub的PR模式无法满足需求,需要能记录每次修改对应提示词及失败尝试的系统,失败经验对机器至关重要[22][23] - **新型代码审核模式**:现有工具(如GitHub)的严格角色权限与AI工作模式不兼容,审核功能应成为版本控制系统的一部分,且需解决本地审核导致的团队协作不透明问题[24] - **新型可观测性方案**:大型语言模型降低了eBPF程序开发和复杂SQL查询的门槛,使得过去因操作复杂而未能落地的可观测性想法有望重生,该领域预计将迎来大量创新[25] - **应对冗余与混乱**:AI生成代码导致开源项目中未经充分审核的贡献增多,对传统开发者构成冒犯,需要行业建立新规范来界定智能体代码库中的合规行为,而非仅靠贡献指南[27][28]
XRP focused VivoPower International to Acquire Norway based Data Center as Part of AI Infrastructure Strategy
Crowdfund Insider· 2026-01-02 11:19
公司战略与交易 - VivoPower International PLC 已签署独家协议,计划收购挪威一座已通电运营、容量超过40兆瓦的数据中心基础设施,该设施由100%可再生水电供电 [1] - 该设施目前拥有超过40兆瓦的运营通电容量,另有40兆瓦容量预计在2026年获得“潜在批准” [1] - 公司计划将该设施从其当前的区块链计算共置业务模式,改造为一个主权人工智能中心,以支持大语言模型的训练和推理,服务于寻求碳中和计算的本地及全球企业客户 [1] - 此次交易预计将于2026年1月完成,可转换优先股的发行需在2026年1月召开的股东大会上获得批准 [1] 交易财务细节与资产优势 - 计划发行的可转换优先股转换价格为6.80美元,附有6%年息的实物支付票息 [1] - 该数据中心设施享有高密度水电接入,成本低于每千瓦时0.035美元,位于气候条件优越的北欧地区,并拥有50年的土地租赁权 [1] - 该资产将成为公司旗下Caret Digital品牌“电力多元化应用”战略的战略基础平台 [1] 公司业务概况 - VivoPower是一家全球可持续能源解决方案B Corp认证企业,成立于2014年,自2016年起在纳斯达克上市,业务遍及英国、澳大利亚、北美、欧洲、中东和东南亚 [1] - 公司拥有三个业务单元:Tembo、Caret Digital和Vivo Federation [1] - Tembo业务专注于为越野和道路定制及加固车队应用提供电气化解决方案,以及相关的融资、充电、电池和微电网解决方案 [1] - Caret Digital是公司的电力多元化应用业务,专注于可再生能源的最高效和最佳用例,包括数字资产挖矿 [1] - Vivo Federation是公司的数字资产部门,专注于基于XRPL的现实世界区块链应用,并持有Ripple Labs股份和XRP代币的风险敞口 [1] 整体战略定位 - 通过Tembo、Caret Digital和Vivo Federation,公司构建了一个涵盖电力、交通、计算和数字基础设施的差异化平台 [1] - 公司目前正将该平台整合,以把握其电力多元化应用战略下的机遇:主权人工智能计算 [1]
China's Zhipu AI launches US$560 million share sale as Hong Kong's IPO tech race heats up
Yahoo Finance· 2025-12-30 17:30
Chinese artificial intelligence firm Zhipu AI kicked off a share sale on Tuesday to raise HK$4.35 billion (US$560 million), moving closer to becoming the first large language model (LLM) developer listed in Hong Kong amid a surge of technology initial public offerings (IPOs). The start-up, officially known as Knowledge Atlas Technology and marketed overseas as Z.ai, set its offer price at HK$116.20 for more than 37 million shares, with 10 per cent allocated to retail investors. The company plans to debut ...
Gartner (IT) Fell Following Weak Results
Yahoo Finance· 2025-12-25 21:59
市场与基金表现 - 2025年第三季度 受人工智能投资持续乐观和企业盈利积极推动 股市继续上涨 [1] - TCW Concentrated Large Cap Growth Fund (I股) 在第三季度回报率为+4.11% 而同期罗素1000增长指数回报率为+10.51% 基金表现落后于基准指数 [1] 加特纳公司(Gartner, Inc.) 财务与市场表现 - 截至2025年12月24日 加特纳公司股价为每股251.18美元 市值为190.23亿美元 [2] - 公司股价在过去一个月回报率为8.62% 但在过去52周内价值下跌了48.73% [2] - 2025年第三季度 公司营收为15亿美元 按报告基准同比增长3% 按汇率中性基准同比增长1% [4] - 第三季度末 共有42只对冲基金投资组合持有加特纳公司股票 较前一季度的45只有所减少 [4] 加特纳公司(Gartner, Inc.) 业务挑战与前景 - 公司季度业绩令人失望 尽管营收和利润超出市场普遍预期 但剔除美国联邦政府业务后的增长出现减速 管理层下调了未来业绩指引 [3] - 管理层预计合同价值增长将从中等个位数减速至低个位数增长 [3] - 管理层指出 约35%至40%的研究合同价值属于受关税影响的行业 这些行业正在实施成本削减并导致销售周期延长 [3] - 人工智能的颠覆性趋势正在影响许多终端市场 客户对大型语言模型研究的信心日益增强 这可能损害加特纳公司的商业模式优势 并可能缩小其总可触达利润空间 [3] - 基于上述挑战 TCW基金已决定完全退出对该股票的投资 [3]
Applied Digital vs. CoreWeave: Better Stock to Own in 2026?
Yahoo Finance· 2025-12-24 01:35
文章核心观点 - 尽管应用数字和CoreWeave在2025年股价波动剧烈 但两者均是当年人工智能股票中的大赢家 且两家公司关系紧密 CoreWeave是应用数字的大客户 文章旨在分析哪只股票可能在2026年表现更优 [1] CoreWeave公司概况与业务模式 - CoreWeave是一家专注于处理大语言模型训练和AI推理的新一代云公司 与传统云计算公司不同 [3] - 公司与英伟达关系密切 能优先获得其最新高端GPU 主营业务是GPU租赁服务 同时也提供存储、高速网络和托管服务 [3] CoreWeave的增长前景与市场状况 - 当前AI服务的云计算需求极其旺盛 公司正积极投资以满足需求 计划明年资本支出增加一倍以上 [4] - 公司采用80/20合资模式以实现快速增长并控制支出 但由于需求过高 据报道已不得不拒绝业务 包括来自微软的约400亿至500亿美元业务 [4] - 只要数据中心项目按计划推进 公司有望在2026年实现超高速增长 花旗银行调研指出其2026年产能已售罄 并已开始与客户洽谈预订2027年初的产能 [5] - 尽管今年IPO后股价表现强劲 但较春季的历史高点仍下跌超过50% 表明股价仍有较大上涨空间 [5] 应用数字公司概况与业务模式 - 应用数字公司业务是帮助建造和管理新一代数据中心 充当建设者和业主角色 这些是专门设计用于应对AI数据中心高强度散热和电力需求的建筑 [6] - 公司不仅负责建造物理外壳 还设计冷却系统和提供电力 其在解决AI基础设施建设的电力瓶颈方面具有优势 [7] 应用数字的竞争优势 - 公司曾是比特币矿商 因此已拥有能够获得廉价稳定电力的园区 [7] - 越来越多拥有电力资源但缺乏高端数据中心建设专业知识的公司正寻求与其合作 [7] 2025年表现与行业需求 - CoreWeave和应用数字在2025年均表现强劲 [8] - 市场对CoreWeave的AI云服务需求极其旺盛 [8] - 应用数字则为新一代云提供商提供专业化建筑和电力接入 [8]
Andrej Karpathy年度复盘:AI大模型正在演变成一种新型智能,今年出现6个关键拐点
华尔街见闻· 2025-12-20 12:41
文章核心观点 - 2025年是大型语言模型领域蓬勃发展的关键一年,出现了六个改变行业格局的“范式转变”拐点,揭示了LLM正在演变成一种全新的智能形态 [1][3] - LLM展现出独特的“锯齿状”智能特征,既是博学的天才,又像思维混乱的小学生,其潜力目前实现尚不足10%,预计未来将持续飞速进展 [1][3] - 从训练范式、智能形态到应用层、交互界面,LLM技术栈的各个层面均发生根本性变革,标志着AI应用进入新的发展阶段 [3] 技术范式转变 - **拐点一:基于可验证奖励的强化学习成为训练新阶段**:传统的LLM生产流程(预训练、指令微调、基于人类反馈的强化学习)被改变,基于可验证奖励的强化学习成为新阶段 [4][5] - RLVR通过在数学题、代码谜题等可自动验证的环境中训练,使LLM自发演化出类似“推理”的策略,如将问题拆解为中间步骤并掌握多种解决方法 [5] - 与指令微调和基于人类反馈的强化学习不同,RLVR针对客观且不可作弊的奖励函数,允许更长周期的优化,具有极高的“能力/成本比” [5] - 2025年大部分能力提升源于各实验室将原本用于预训练的算力转向消化RLVR这一新阶段的“算力积压” [5] - OpenAI o3的发布是真正的拐点,RLVR带来了通过增加“思考时间”来控制推理能力的新调节旋钮 [6] LLM智能形态认知 - **拐点二:“幽灵智能”展现锯齿状性能特征**:业界开始理解LLM是一种与生物智能完全不同的全新智能实体,其神经架构、训练数据、算法和优化压力均不同 [7] - LLM展现出“锯齿状”性能特征:在可验证领域附近能力“激增”,但整体表现极不均衡,既是博学天才,又可能被简单提示词破解 [3][7] - 这种现象导致对基准测试产生信任危机,因为基准测试本质是可验证环境,极易受到RLVR攻击,“面向测试集训练”成为新艺术形式 [7] 应用层与交互范式革新 - **拐点三:Cursor引领新一代LLM应用层崛起**:Cursor的成功揭示了“LLM应用”的全新层级,标志着垂直领域LLM应用的兴起 [8] - 此类LLM应用为特定垂直领域封装并编排LLM调用,核心功能包括处理上下文工程、编排多个LLM调用串联成复杂有向无环图、提供特定图形界面以及提供“自主程度调节滑块” [8] - LLM实验室倾向于培养通用能力的“大学生”,而LLM应用则通过提供私有数据、传感器、执行器和反馈闭环,将这些“大学生”组织成特定领域的专业从业者 [8] - **拐点四:Claude Code开创本地AI智能体新范式**:Claude Code成为LLM智能体的首次令人信服展示,它以循环方式串联工具调用和推理进行长时间问题解决,且运行在用户电脑上,使用私有环境、数据和上下文 [9] - 这种本地化、个性化的AI交互范式改变了AI的样貌,使其从被动访问的网站变为“住”在电脑里的灵体,强调了隐私保护和个性化体验的重要性 [9] - **拐点五:Vibe Coding让编程能力普及化**:2025年AI跨越关键能力阈值,使人们仅凭英语就能构建复杂程序,“Vibe Coding”概念的流行标志着编程门槛的彻底降低 [10] - 编程不再是专业人士专利,普通人从LLM中获益远超专业人士、企业和政府,代码变得免费、瞬时、可塑,用完即弃,将重塑软件生态并让创意实现的成本接近零 [11] - **拐点六:Nano Banana开启LLM图形界面时代**:谷歌Gemini Nano Banana被称为2025年最震撼、最具范式转移意义的模型,预示着LLM交互界面的根本变革 [12] - 文本并非人类偏好的信息消费格式,真正的“LLM GUI”需要以人类偏好的图像、信息图、幻灯片、白板、动画视频、网页应用等方式进行交流 [12] - Nano Banana的显著特征不仅是图像生成,更是文本生成、图像生成和世界知识在模型权重中的交织融合,提供了多模态融合能力的早期雏形 [12]
Knowledge Atlas Technology Joint Stock Company Limited(02513) - PHIP (1st submission)
2025-12-19 00:00
公司发展历程 - 公司2019年成立,是中国领先的AI公司[46] - 2021年推出中国首个自主预训练大模型框架GLM和MaaS平台[46] - 2022年开源首个1000亿规模模型GLM - 130B[46] 业绩总结 - 2022 - 2024年公司收入分别为5740万元、1.245亿元和3.124亿元,复合年增长率超130%[49] - 2024年和2025年上半年公司收入分别为4490万元和1.909亿元[49] - 2022 - 2024年及2025年上半年毛利率超50%[50] - 2022 - 2025年公司净亏损分别为1.437亿元、7.88亿元、2.958亿元、2.3579亿元[104] - 2022 - 2025年公司运营亏损分别为98719千元、625723千元、2538352千元、1899225千元[124] - 2022 - 2025年公司成本占营收比例分别为45.4%、35.4%、43.7%、50.0%[124] - 2022 - 2025年公司毛利润分别为31360千元、80482千元、175889千元、95424千元[124] - 2022 - 2025年本地部署收入占比分别为95.5%、90.4%、84.5%、84.8%[132] - 2022 - 2025年云端部署收入占比分别为4.5%、9.6%、15.5%、15.2%[132] - 2022 - 2025年各阶段经营活动净现金使用情况:2022 - 2025年上半年分别为68246千元、648017千元、2244919千元、1327150千元[151] - 2022 - 2025年各阶段关键财务比率:营收增长率分别无数据、1.2、1.5、3.3;流动比率分别为0.6、0.5、0.4、0.3;速动比率分别为0.5、0.5、0.4、0.3;资产负债率分别为7.1%、27.6%、20.4%、12.0%[160] 用户数据 - 截至2025年6月30日,模型赋能超8000家机构客户,机构客户数量超8000个[46][50] - 截至最近可行日期,赋能约80000万台设备[46] - 开源模型在全球开发者社区下载量超4500万[50] - 2024年公司在通用大模型开发者中按收入计市场份额为6.6%,在中国独立开发者中排名第一,所有开发者中排名第二[46] - 2024年中国LLM市场收入排名中,公司以0.31亿元排第2,市场份额6.6%[94] - 截至2025年9月30日的九个月,公司有超12000家机构客户[176] - 2025年11月,公司平均每日代币消费量为4.2万亿[176] 未来展望 - 预计将从[相关事项]获得约HK$[REDACTED]百万资金,70.0%用于加强通用大模型研发能力,10.0%用于优化MaaS平台,10.0%用于发展业务伙伴网络和战略投资,10.0%用于营运资金和其他一般公司用途[165][168] - 2025年第三季度公司预计收入较2024年同期增长超60%[177] - 2025年公司预计净亏损显著增加[177] 新产品和新技术研发 - GLM - 4.5模型规模为3550亿参数,还有1060亿参数的轻量版GLM - 4.5 - Air[65] - 2025年7 - 8月,公司发布GLM - 4.5、GLM - 4.5V和AutoGLM 2.0;9月发布GLM - 4.6[174] - 2025年7月,GLM - 4.5在十二项行业标准基准测试综合得分为63.2,行业同行得分在46.3 - 65.0之间[67] - 2025年9月,GLM - 4.5在Chatbot Arena和WebDev Arena分别排名全球第五[67] - 2025年9月,GLM - 4.5幻觉率为世界第二低、中国最低[69] - 2025年11月,GLM - 4.6在CodeArena全球编码能力评估中排名第一[69] 市场扩张和并购 - 自2024年起公司本地部署服务从海外客户获取收入,主要来自东南亚[132] 其他新策略 - 公司使用调整后年度亏损作为非国际财务报告准则财务指标,以消除某些项目潜在影响[126] 其他信息 - 截至2025年6月30日,公司研发团队有657人,具备自然语言处理等相关领域背景和经验[100] - 截至最新可行日期,公司在中国有86项注册专利(84项发明专利)、234项专利申请、160项版权、314项商标和58个域名[100] - 公司完成八轮Pre - [REDACTED]投资,筹集资金超83.6亿元[117] - 截至最新可行日期,控股股东合计持有约33.03%股份[116] - 2022 - 2025年各阶段现金消耗率分别为3.0百万人民币、105.9百万人民币、194.5百万人民币和327.3百万人民币[151] - 公司在业绩记录期未宣派或支付股息,目前无正式股息政策和固定派息率,预计近期不支付现金股息[166] - 2025年1月16日,公司及9家子公司被列入美国商务部工业与安全局(BIS)实体清单,目前未对业务和财务表现产生重大不利影响[173] - 2025年7月3日公司向中国证监会提交申请文件,12月15日完成备案[179] - 非上市股份转换为H股的申请于2025年7月3日向中国证监会备案,12月15日证监会发出备案通知[187] - 员工激励计划于2025年6月5日经董事会决议修订[187] - 杭州智谱华章科技有限公司于2023年9月20日成立[189] - 黄石智谱华章科技有限公司于2025年11月11日成立[195]
Cerence AI Set to Showcase Agentic AI and LLM-Powered Innovations at CES 2026
Globenewswire· 2025-12-18 21:00
公司核心动态 - Cerence Inc 将于2026年1月6日至9日在拉斯维加斯举行的CES 2026上展示其最新创新成果 展位位于拉斯维加斯会议中心西厅6826号 [2] - 公司将重点展示其混合式、智能体化AI平台Cerence xUI™的关键进展 包括新的领域专用智能体、增强的多模态边缘AI以及音频AI体验 [2] 核心平台:Cerence xUI - Cerence xUI是一个为AI定义汽车设计的混合式、智能体化平台 旨在解决汽车制造商面临的挑战 包括消费者对基于大语言模型体验的期望快速增长、购车后软件更新的需求 以及在复杂技术选择中控制成本的压力 [3] - 该平台采用混合、模块化且与技术无关的设计 在车内提供由大语言模型驱动的智能体化智能 同时赋予汽车制造商完全灵活性 以集成市场上最佳的第一方和第三方模型、数据源及智能体 [4] - 该平台支持向已上路车辆快速部署升级功能和新的大语言模型能力 支持整个车辆生命周期的持续创新 [4] - 对于终端用户 该平台通过多步骤对话线程、多模态能力和增强的个性化 将车载助手从反应式系统转变为自然、主动且具有情境感知的伙伴 [5] 技术合作与边缘AI进展 - Cerence与SiMa.ai的合作将在CES上展示新进展 即CaLLM™ Edge在SiMa.ai硬件上运行 并为Cerence xUI提供增强的多模态能力、改进的性能和更低的延迟 同时保持卓越的能效 [6] - 该边缘AI解决方案可在不依赖云端连接的情况下实现快速、低功耗的交互 从而在车辆与驾驶员之间实现更强大、更可靠的通信 [6] - 公司还将展示CaLLM™ Edge在多种不同芯片组上运行 以提供更快的性能、更低的延迟以及即使无连接也能实现的可靠车内交互 [9] 新推出的AI智能体 - 公司将在CES上推出两款新的AI智能体 一款是针对车主的拥有者伴侣智能体 它是一个主动的服务和维护助手 帮助驾驶员了解车辆健康状况、处理即将到来的服务需求并发现未充分利用的功能 [8] - 另一款是经销商辅助智能体 旨在通过销售和服务工作流程的智能自动化来支持经销商 这标志着公司业务扩展至更广泛的汽车生态系统 [8] - CES还将首次进行车内演示与微软合作开发的移动工作智能体 该智能体于IAA 2025首次宣布 它支持通过语音优先、更安全地访问Microsoft 365 Copilot 包括Teams、Outlook和OneNote [9] - 作为Cerence xUI的一部分 该移动工作AI智能体将与汽车深度集成 并能提供主动的导航建议 例如与用户的工作日历集成以引导其前往下一个会议地点 [10] 音频AI产品组合 - Cerence将展示其音频AI产品组合 包括先进的多扬声器和多区域能力 [11] - 其音频AI解决方案套件包含先进的语音信号增强、降噪、信号处理和紧急车辆检测等功能 为下一代语音助手和车内通信系统提供支持 确保在不同环境下清晰可靠的音频性能 [11] 合作伙伴生态系统 - Cerence在CES上的展示将体现其合作伙伴生态系统的价值 包括与TCL和MediaTek的集成 [12] - 其开放、模块化的平台使汽车制造商能够加速创新并提供差异化的AI体验 [12] 公司背景 - Cerence Inc 是汽车和交通领域创造直观、无缝、AI驱动体验的全球行业领导者 [14] - 公司利用在语音、生成式AI和大语言模型方面数十年的创新和专业知识 为驾驶员和乘客创造更安全、互联和愉悦的旅程 [14] - 全球已有超过5.25亿辆汽车搭载了Cerence的技术 [14]
Kyivstar and Ukrainian Ministry of Digital Transformation Select Google Gemma as the Foundation for Ukraine’s National LLM
Globenewswire· 2025-12-01 18:00
项目合作与战略定位 - VEON集团旗下公司Kyivstar与乌克兰数字转型部WINWIN AI卓越中心合作,选择谷歌Gemma作为基础模型,以开发乌克兰国家大语言模型[1] - Kyivstar作为该项目的战略合作伙伴,将主导乌克兰大语言模型的运营开发工作[2] - 该项目旨在利用谷歌Vertex AI基础设施提供算力支持[1] 技术选型与开发目标 - 选择谷歌Gemma作为基础模型,因其为开源模型且来自全球技术领导者,有助于构建反映乌克兰语言深度和文化特性的模型[3] - 国家语言模型的目标是全面捕捉乌克兰的方言、术语、历史和背景,同时将敏感的国家数据安全地存储和处理在乌克兰境内[2] - 开发主要任务是在现成开源模型基础上,使用乌克兰独特数据进行进一步训练,以最小化语言和伦理风险[4] - Kyivstar将首先优化Gemma模型以适配乌克兰语,改进分词器,并在精选的乌克兰数据集上进行训练[6] 预期影响与应用领域 - 乌克兰大语言模型预计将成为乌克兰公共和私营部门新一代人工智能服务的基础[5] - 潜在应用案例包括法规和法律分析工具,以及教育、金融、医疗等领域的特定解决方案[5] - 通过使用乌克兰数据训练模型,Kyivstar旨在提供比通用全球模型更准确、更符合本地需求且可操作的输出结果[5] - 该模型将使乌克兰消费者、企业和政府机构能够集成真正理解乌克兰语言和背景的尖端增强智能技术[5] 公司战略与投资背景 - 此项目基于VEON在其市场缩小AI语言差距的更广泛战略,此前已在哈萨克斯坦推出KazLLM,在巴基斯坦推出乌尔都语大语言模型项目[7] - Kyivstar集团计划在2023年至2027年间通过基础设施投资、技术发展、慈善捐赠和战略收购,向乌克兰投资10亿美元[8] - VEON为近1.5亿连接用户和1.2亿数字用户提供融合连接和数字服务,业务覆盖占全球人口6%以上的五个国家[9]