生成式AI
搜索文档
性能提高30倍!英伟达(NVDA.US)联合SK海力士开发AI固态硬盘 拟2027年量产
智通财经· 2025-12-17 08:13
合作项目概述 - 英伟达与SK海力士正合作研发一款以人工智能为核心的固态硬盘,项目在英伟达内部代号为"Storage Next",在SK海力士内部代号为"AI-NP" [1] - 该AI SSD旨在打破当前AI算力体系中存储端的瓶颈 [1] 产品性能与目标 - 产品核心性能目标是实现高达1亿次的每秒输入输出操作,这一数值比目前最顶尖的企业级SSD快出约10倍,在特定环境下性能提升可达30倍 [1] - 该设备将充当高带宽内存与传统大容量存储之间的关键"中间层",通过极高的吞吐量和极低的延迟,确保AI推理过程中的海量数据能被GPU瞬间调用 [1] - 产品预期将显著提升生成式AI响应速度并降低整体能耗 [1] 技术支撑与标准 - SK海力士正与其合作伙伴SanDisk共同推进名为HBF的全新标准,这种仿照HBM的垂直堆叠结构将为这款AI SSD提供必要的硬件基础 [1] 产品开发时间表 - 首个产品原型预计将在2026年下半年面世,并计划于2027年正式量产 [2] - 届时,这款新型存储方案有望与英伟达未来的Rubin CPX系列GPU等尖端硬件深度集成 [2] 行业影响与战略意义 - 此次合作标志着英伟达正在进一步强化其AI生态系统的垂直整合能力 [2] - 合作也预示着SK海力士在继HBM内存市场领跑后,正试图在AI NAND存储领域确立新的霸权 [2] - 业界预测随着AI推理需求的爆发,NAND闪存市场可能会重演DRAM曾出现的供应紧缺与价格波动 [2]
北航学子:在“揭榜挂帅”的果断中锻造创新基因
中国青年报· 2025-12-17 06:47
揭榜之后,团队负责人、北京航空航天大学计算机学院计算机科学与技术专业硕士研究生张宸恺灵光一 闪,为团队起了一个颇具诗意的队名:鸾寓。 张宸恺说,鸾、寓二字取自于《山海经》中记载的两种神鸟——鸾鸟、寓鸟,具有祥瑞、御灾之意,亦 契合着团队攻坚"遥感应急减灾大模型"的主题方向。 在今年"挑战杯"中国青年科技创新"揭榜挂帅"擂台赛上,北京航空航天大学在新一代信息技术、人工智 能、高端装备、生物医药等赛道全面出击、揭榜迎战,一举拿下13个擂主、12个特等奖、14个一等奖、 13个二等奖、14个三等奖,共计66个奖项,再创佳绩,彰显这所高校青年科研团队的努力和实力。 鸾寓:已在全国90余次重大自然灾害中担当重任 近几年来,从2021年云南漾濞6.4级地震、2021年河南郑州"7·20"特大暴雨灾害,到2022年四川泸定县 6.8级地震、2023年甘肃积石山6.2级地震,"鸾寓"遥感应急减灾大模型已在全国90余次4.5级以上地震、 滑坡、洪涝等重大自然灾害中实践并发挥重要作用,覆盖全国12个省份、约450万平方公里。 在今年"揭榜挂帅"擂台赛上,应急管理部国家减灾中心发榜"多模态应急减灾智能体创新解决方案",期 待有志青 ...
腾讯研究院AI速递 20251217
腾讯研究院· 2025-12-17 00:32
苹果AI芯片战略 - 苹果正开发首款代号"Baltra"的AI服务器芯片,与博通合作开发网络技术,采用台积电3nm工艺,预计2027年部署 [1] - 苹果已放弃自建大模型,转而每年支付约10亿美元使用谷歌定制的1.2万亿参数Gemini模型,Baltra芯片主要用于满足庞大的AI推理需求 [1] - 芯片架构将注重时延与吞吐量优化,采用INT8等低精度运算,可能采用64颗芯片互连配合大容量LPDDR内存的方案 [1] 大模型技术进展 - 英伟达推出Nemotron 3系列开源模型,包含Nano、Super和Ultra三种规模,采用突破性异构混合专家架构 [2] - Nemotron 3 Nano的吞吐量比上一代高4倍,在大规模多智能体系统中实现领先的每秒生成token数,推理效率显著提升 [2] - 模型通过先进强化学习技术和大规模并行多环境后训练实现卓越准确率,并提供完整的训练数据集和强化学习库 [2] - 逆向工程发现ChatGPT记忆系统采用四层架构:会话元数据、用户记忆、近期对话摘要和滑动窗口,未使用向量数据库或RAG检索 [3] - ChatGPT通过预生成的轻量级摘要和显式保存的结构化信息实现记忆,GPT-4最大上下文窗口为128k token,超出后最前面的内容会被遗忘 [3] AI应用与内容生成 - 腾讯元宝上线写作模式,支持自动补全剧情人设大纲并一键生成成稿,单次可直出数万字文本 [4] - 元宝可在约14分钟生成约3万字,半小时写出5万字,并支持将长稿一键导出至本地文档或腾讯文档 [4] - 通义万相2.6成为国内首个支持角色扮演的视频模型,支持音画同步、多镜头生成及声音驱动 [5] - 视频生成支持15秒长视频、多镜头叙事和自然音画同步,能参考输入视频角色外观和音色实现单人、多人合拍 [5] - 图像生成升级包括艺术风格高度美学可控、真实人像质感提升、文字生成图表插画、图文混排输出和多图融合生成等功能 [6] - 字节跳动发布Seedance 1.5 pro音视频联合生成模型,支持精准音画同步、多语言方言、电影级运镜和15秒长视频生成 [7] - 模型采用MMDiT架构实现视听流精准协同,原生支持中英日韩等多语种及四川话粤语等方言,音频指令遵循处于业内头部水平 [7] 自动驾驶进展 - 工信部附条件许可长安深蓝SL03和极狐阿尔法S两款L3级自动驾驶车型,成为我国首批获准入的L3车型 [8] - 深蓝SL03可在拥堵环境下最高时速50km/h实现单车道自动驾驶,仅限重庆内环等指定路段;极狐阿尔法S最高时速80km/h,仅限北京京台高速等路段 [8] - 两家企业已完成并通过产品测试与安全评估,将在指定区域开展上路通行试点 [8] AI行业趋势与挑战 - 谷歌前CEO Eric Schmidt提出"旧金山共识",认为语言智能体与推理能力结合将趋近人类核心能力,技术融合到一定阶段会出现AI递归自我改进 [9] - 他预测AI数学家将在未来一年内出现推动新数学理论诞生,行业普遍认为这一变革在2-4年内发生 [9] - 美中AI竞争路径分化:美国聚焦超级智能研发但电力不足,中国全力推动AI商业应用落地且电力充足,两国均依赖私营部门推动发展 [9] - 多款AI模型面对六指手图像无法正确数出手指数量,暴露出当前AI在视觉推理、因果关系理解上的缺陷 [10] - 问题根源在于训练数据中"人手=五指"的强关联和Transformer架构缺乏显式结构约束,单次前向传递无法追踪状态信息 [10]
沐曦股份上市:国产GPU走到分岔口
搜狐财经· 2025-12-16 23:36
文章核心观点 - 国产GPU行业在算力紧缺、国产替代及生成式AI爆发的背景下,正迎来密集的资本市场验证期,其发展焦点已从“能否做出”转向“能否卖出并进入真实场景” [4][8] - 沐曦集成电路股份有限公司作为国产GPU代表,选择了一条更侧重长期主义的技术路径:押注通用GPU,自研核心IP与软件栈,并优先从推理市场切入,再向训推一体发展 [2][9][12] - 公司展现了惊人的商业化增速,但同时也面临高强度研发投入导致的持续亏损,其成功与否取决于技术路线的长期演进能力及生态构建,而非短期财务表现 [13][14][16] 行业背景与驱动因素 - **算力需求分层**:生成式AI爆发导致算力需求分层,高端训练市场由英伟达主导,而推理和中算力应用(如政务、运营商、公共算力平台)为国产GPU提供了现实市场空间 [5] - **外部供给挤压**:在高性能AI芯片出口受限背景下,中国市场对“可持续获取的算力”需求放大,国产GPU在“可用、可交付、可规模化”的区间获得机会 [6] - **发展阶段变化**:国产GPU行业在2019年后创业集中爆发,当前已从完成产品量产(解决“能否做出”)进入商业验证阶段(解决“能否卖出”),这是公司集中冲刺上市的时间拐点 [7][8] 沐曦股份的技术与产品路径 - **技术路线选择**:公司未采用“全功能GPU”路径,而是押注通用GPU,将架构重心放在AI和高性能计算上,更接近AMD的技术传统而非英伟达模式 [9] - **应对现实约束**:在制程工艺受限前提下,公司通过自研核心GPU IP来最大化单位算力效率,并为产品迭代保留自主度,其正在研发的曦云C700系列旨在性能上挑战英伟达H100区间 [10] - **产品演进逻辑**:公司从智算推理芯片(曦思N100)切入,随后迭代至训推一体芯片(曦云C500),产品矩阵已覆盖训推一体、智算推理和图形渲染三大应用场景 [11] - **集群与软件生态**:公司自研MetaXLink高速互连技术,使GPU互连带宽和延迟表现达到与英伟达4nm工艺旗舰产品H200相当的水平,支持2-64卡互连 [12] - **软件兼容性**:公司自研MXMACA软件栈在API层面实现了对国际主流CUDA生态的高度兼容,以最小化用户迁移成本,是国产GPU中生态兼容性最全面的方案之一 [12] 商业化进展与财务表现 - **营收高速增长**:公司营业收入从2022年的42.64万元增长至2024年的7.43亿元,最近三年复合增长率为4074.52%,2025年第一季度营收达3.2亿元 [13] - **收入结构转变**:收入主力已从早期的智算推理GPU板卡迅速转向训推一体芯片,2024年及2025年第一季度,训推一体芯片曦云C500系列收入占比分别达97.28%和97.87% [13] - **产品累计销量**:截至2025年3月底,公司GPU产品累计销量超过2.5万颗 [2] - **高强度研发投入**:2022年至2024年,公司研发投入分别高达6.48亿元、6.99亿元和9.01亿元,合计占最近三年累计营业收入比例的282.11% [14] - **持续亏损状态**:2022年至2024年,公司归属于母公司所有者的净利润分别为-7.77亿元、-8.71亿元和-14.09亿元,截至2025年3月末合并报表未分配利润为-10.48亿元 [15] 行业格局与资本展望 - **行业普遍亏损**:在国产AI芯片公司中,仅海光信息稳定盈利,寒武纪在2024年第四季度扭亏,景嘉微、龙芯中科、摩尔线程等仍处亏损周期,沐曦预计最早2026年达到盈亏平衡 [16] - **市场增长潜力**:2024年中国GPU市场规模约为1073亿元,同比增长32.96%,但国产GPU产业相较海外仍有差距 [17] - **长期验证关键**:资本市场需判断公司技术路线是否具备持续演进空间,其成功依赖于在多个产品周期中不断迭代并逐步形成生态锁定,而非单一代产品 [16] - **上市意义**:上市是公司为高强度研发和产业化补充弹药的过程,也是提前接受市场审视的起点,旨在探索一条在英伟达主导的算力世界中不依赖奇迹的生存路径 [8][17]
美股异动 | 埃森哲(ACN.US)盘前涨逾3% 获大摩上调目标价至320美元
智通财经网· 2025-12-16 22:08
公司评级与股价 - 摩根士丹利分析师James Faucette将埃森哲评级上调至“买入”,目标价从271美元上调至320美元 [1] - 受此消息影响,埃森哲盘前股价上涨逾3%,报283.50美元 [1] 营收预期 - 华尔街分析师普遍预计埃森哲2026财年第一财季总营收为185–186亿美元 [1] - 预计营收同比增长约4.5%–4.9%,延续温和增长态势 [1] - 增长主要受企业客户在生成式AI服务与云计算转型服务方面的持续支出推动 [1] 盈利预期 - 分析师预计埃森哲调整后每股收益(Adjusted EPS)约为3.74美元 [1] - 该预期较上年同期的3.60美元有所增长 [1] - 该预期代表约+23.4%的环比提升预期 [1]
四位院士领衔,2025长三角人工智能产业融合共生发展大会在杭举行
36氪· 2025-12-16 21:35
行业核心观点 - 中国AI产业正经历从“炼大模型”到“炼大应用”的范式转移,技术可行性不再是瓶颈,商业可行性和应用落地成为企业竞争的核心赛道 [6][7] - 产业共识是打破技术壁垒、促进生态融合,才能真正释放人工智能潜力,长三角地区有基础在AI产业协同发展中走在前列 [51] 产业发展阶段与共识 - 2025年被判断为中国AI大模型的破局之年,也是AI原生元年,推理侧用量突飞猛进 [35][39] - 行业普遍认为AI产业正从“技术驱动”向“应用驱动”转型,从“训练周期”向“推理周期”转变 [29][51] - 开源模型被视为中国的“国运级机会”,有助于构建更深的产业协同 [35] 技术挑战与前沿方向 - 工业智能面临核心挑战,当前工业生产因果关系不清,需研究新的“动态系统人工智能”算法,与通用AI的静态本质相区别 [17] - 未来AI格局可能被三个“奇点”改变:传感器、算力和脑智能,底层原创技术突破是决定中国能否从“跟跑”到“领跑”的关键 [20] - 物理世界智能化仍面临实时性、安全工程、世界模拟器构建等技术挑战 [37] 商业化现状与障碍 - 尽管AI技术能力强大,但约95%的企业AI解决方案以失败告终,核心障碍在于组织鸿沟与技术鸿沟 [26] - 纯AI公司靠卖Token的商业化仍处于前期,但未来数字员工与具身智能分别对准数字和物理劳动力市场,市场潜力达百万亿美金级别 [32] - AI成功融入产业需要三个关键要素协同:场景清晰、数据可用,以及在一把手驱动下组织具备变革意愿 [27] 应用落地与实践案例 - 在金融、工业、消费等领域,AI价值已从概念走向实践,例如银行财报分析效率提升20倍,无人配送车帮助客户降低50-60%成本 [37] - 低空经济被视为未来全球佼佼者领域,AI技术可用于构建“空天地海一体化”安全信息网络,实现对低慢小飞行器的有效管控 [14][30] - AI应用呈现“重做vs再生”的产业共识,例如能记住所有历史健康信息的家庭医生是“再生物种”,一人一天译制完成几部剧并出海是颠覆性革命 [39] 产业生态与区域发展 - 杭州临平区前瞻布局算力产业,打造全国首个以“算力”命名的特色小镇,开园四年已集聚企业2600余家,其中科技企业800余家 [7][9] - 算力小镇构建“平台、基金、政策、活动、配套”五位一体支撑体系,设立总规模4亿元的算力产业基金,推出最高200万元的算力券补贴 [48] - 临平区给予人工智能企业90%的租金补助、50%的算力补助、30%的研发补助,以及最高120万元的购房补贴等人才政策配套 [9] 企业动态与战略合作 - 大会期间,奈杜集团、睿微讯科等6家企业签约入驻算力小镇,同时小镇内企业达成2组战略合作,项目涵盖芯片设计、智能硬件、行业应用等AI产业链关键环节 [45] - 签约企业业务形态呈现明显互补性,芯片设计解决算力供给,智能硬件提供应用载体,行业应用直接面对终端需求,体现产业生态协同 [45] - 浙江图灵算力研究院作为产业链“连接器”,旨在通过产业研究、战略咨询、市场对接、资本助力等服务,解决AI企业商业化过程中的真实难题 [8]
11月份非游戏厂商出海收入榜三甲揭晓
证券日报网· 2025-12-16 18:13
公司表现 - 字节跳动、欢聚集团、美图公司包揽11月份中国非游戏厂商出海收入榜前三名[1] - 美图公司近期推出的“AI雪景”功能深受亚欧用户青睐,上月海外收入创年度新高,同比增长超21.4%[1] - 2025年上半年,美图公司中国内地以外市场月活跃用户同比增长15.3%,付费订阅用户规模同比激增42%[1] 行业趋势 - 在生成式AI技术突破的推动下,中国科技公司的出海竞争焦点正从流量获取转向价值挖掘[1] - 本地化运营能力被视为中国科技公司出海竞争的关键[1]
金融壹账通亮相2025亚洲保险科技洞察大会
证券日报网· 2025-12-16 18:13
行业趋势与前沿议题 - 2025亚洲保险科技洞察大会在香港召开,吸引全球保险机构、科技企业、咨询公司、投资机构及监管嘉宾参与,共同探讨生成式AI、数字健康、智能风控与跨境保障等前沿议题 [1] - 生成式AI的快速发展正在改变客户与保险机构的交互方式,服务模式正从被动响应向更加连贯、智能、随时可达的体验转变 [1] - 保险服务正从以产品为中心的单点处理,迈向以关系为核心的全周期陪伴 [1] - 未来的保险服务将呈现出更高频、更低摩擦、更智能的交互形态 [1] - 随着多模态大模型能力增强,保险服务将突破传统边界,融入客户在健康、医疗、资产管理及家庭规划等场景中的日常决策 [1] - 未来保险产品的组合与SKU将呈指数级增长,服务模式将更贴近客户实际需求,以智能方式实现动态匹配 [1] - 保险将成为日常生活和长期规划的一部分,而不再是一纸静态合约 [1] 公司动态与战略 - 平安集团旗下金融壹账通的总经理助理王有东及寿险海外销售解决方案团队经理朱平受邀出席大会,并与多家国际保险集团和金融科技企业交流行业洞察及科技创新趋势 [1] - 金融壹账通作为平安集团唯一对外金融科技输出窗口,正在将平安在客户服务、保险科技、智能风控等领域的成熟能力体系化输往全球市场 [1] - 公司依托在SaaS化平台、业务场景数字化方面的长期积累,持续推动金融科技在东南亚、中东等地区的落地,帮助当地金融机构提升效率、优化体验、加速数字化转型 [1] - 未来,金融壹账通将继续依托平安集团的技术底座与场景优势,以可复制、可规模化、可持续的方式促进中国金融科技能力在国际市场发挥更大价值 [1]
百度秒哒商业应用生成数突破50万个,创造价值超50亿
观察者网· 2025-12-16 17:57
百度秒哒平台进展与影响 - 百度无代码应用搭建平台“秒哒”上线8个月,累计生成超50万个商业应用,日新增应用涨幅超150% [1] - 平台生成的应用中,带有后端的应用占到一半,覆盖教育、商业、内容创作、企业服务等200余个场景 [1] - 平台累计创造的经济与效率价值已超过50亿元 [1][3] 用户与商业化数据 - 秒哒用户中有81%为非程序员用户,主要集中在职场人群与高校群体 [3] - 平台生成的应用已累计服务超过1000万用户,每天约有近10万人在使用这些应用解决真实问题 [3] - 已有超2万个应用接入支付能力,累计完成超过8万笔真实交易 [3] 产品定位与技术支撑 - 平台核心目标是把应用开发从少数专业开发者手中解放出来,通过“自然语言化”方式让更多人构建可用、可运营、可变现的商业应用 [2] - 技术体系由需求模型、代码模型与UI模型协同运转形成数据飞轮,并依托百度智能云的全栈AI能力保障应用在复杂场景下“可用、可交付、可商用” [2] - 真正的AI创造被定义为打造能真正创造价值的工具并实现商业转化,而非“搓玩具” [2] 应用形态与创造者扶持 - 商业化应用主要呈现三类形态:电商小程序/小游戏等直接变现工具、帮助一线人员搭建内部系统的业务软件、落地到具体场景的AI提效应用 [3] - 百度发布“创造者筑梦计划”,未来三年将通过流量扶持、交易分成等方式帮助100万名创造者实现创收 [1] - 2026年将从优质项目中筛选15个高商用潜力项目开通快速通道,个人开发者项目有机会获得百万以上级别投资 [1] 行业趋势与生态竞争 - AI开发工具正在让大量过去因成本过高而“不值得开发”的小众需求首次具备被系统性满足的可能 [4] - 工具的持续进化正在为更多人打开“个人即公司”的新窗口,推动超级个体的加速涌现 [4] - AI时代下一阶段的竞争或将围绕谁能率先构建起覆盖“创作—分发—变现”的完整应用生态,而非单一模型能力 [5][6]
AI的真命之主恐怕还是谷歌
36氪· 2025-12-16 15:56
核心观点 - 谷歌在2025年实现了绝地反击,从2024年初在生成式AI领域的落后与被动,转变为技术领先、业务全面AI化、并对OpenAI构成严重威胁的态势,其股价大幅上涨63%,市值一度逼近4万亿美元 [1][2][4][6] 市场表现与估值 - 截至2025年,谷歌股价累计上涨63%,最高涨幅达70%,大幅跑赢标普500和纳斯达克指数 [1] - 公司市值曾十分逼近4万亿美元,接近成为史上第四家突破此市值的公司 [1] - 尽管增长强劲且AI想象空间大,公司动态市盈率仅为29倍,被认为不存在本质性泡沫 [11] 技术追赶与产品进展 - 2024年5月发布的Gemini 1.5 Flash标志谷歌在基座大模型领域迎头赶上 [4] - 2025年1月的Gemini 2.0和随后的Gemini 3.0证实其处于大模型技术第一集团,并与OpenAI并驾齐驱 [4] - Gemini 3.0完全基于TPU训练,激发了外部客户采购兴趣,预计2026-2027年TPU将大举占领外部市场,谷歌有望成为AI芯片市场第二名 [4] - 公司在AI全栈技术能力上领先,涵盖从AI算力、云计算、基座大模型到消费端应用的大部分环节 [10] 业务整合与AI化转型 - 公司正用生成式AI“重做”整个核心业务,数以亿计用户每天使用搜索引擎的“AI模式” [4] - 安卓操作系统已与Gemini深度融合,相对于iOS形成优势 [4] - 基于AI的新商业模式(如AI导购)在开发中,广告推送精确性持续提升,AI创作工具对YouTube创作者产生正面影响 [4] - 超过20亿谷歌搜索引擎用户可通过“AI总结”方式使用Gemini功能 [6] 竞争格局与用户增长 - 截至2025年四季度,ChatGPT周活用户约8亿,Gemini月活用户为6.5亿,但Gemini用户增速远快于ChatGPT [6] - 预计在2026年的某个时间节点,Gemini用户数可能超过ChatGPT,其企业端API调用也在迅速赶上 [6] - 公司从2022年底被OpenAI严重威胁,转变为2025年对OpenAI构成严重威胁,完成了保护核心领地的任务 [6] 组织调整与成功因素 - 2023年以前,公司未充分意识到生成式AI重要性,资源投入不足 [7] - Google Brain和DeepMind两个AI研发机构于2023年整合,解决了内部混乱问题,之后重回正轨 [8] - 在认识到生成式AI重要性并看到OpenAI验证的道路后,公司的技术积累和资源优势得以充分发挥 [8] - OpenAI在2023年底剧烈震动后核心研发人员流失,技术进步速率下降,为谷歌追赶创造了外部条件 [8] - 联合创始人谢尔盖·布林复出并领导AI研究,可能发挥了重要作用 [8] 潜在短板与未来机会 - 公司在开源大模型领域存在明显薄弱环节,已放弃开源路线数年,目前未真正重返该赛道,开源社区主要由Meta、xAI、阿里巴巴及DeepSeek占据 [10] - 当前是补上开源缺口的时间窗口,Meta的LLaMA-4令人失望,xAI作为创业公司技术尚不稳定,谷歌若想重新统治开源赛道代价可能不大 [10]