量子位
搜索文档
5亿热钱砸向清华AI Infra明星:最大化算力效能筑造智能体基建
量子位· 2025-11-27 15:30
融资情况 - 公司完成近5亿元A+轮融资[3] 累计融资金额近15亿元[1][7] - 本轮融资由珠海科技集团和孚腾资本领投 惠远资本 尚颀资本 弘晖基金跟投 洪泰基金 达晨财智 尚势资本&海棠基金 联想创投 君联资本 申万宏源 徐汇科创投 元智未来等老股东继续加码[5] - 融资阵容实现国资与市场化基金双重背书 既肯定公司技术创新 也代表资本市场对其智能体基础设施路线的肯定[7] 资金用途与战略方向 - 融资资金将用于持续扩大软硬协同 多元异构的技术领先优势 推动AI云产品与AI终端方案在产业中的规模化拓展 加大智能体基础设施研发投入[9] - 公司提出生产智能体 协同智能体 服务智能体的体系化战略 完成面向智能体场景的原生基础设施转型[10] - 公司计划继续推进Agentic Infra战略布局 加速智能体在数字世界与物理世界的融合[27] 技术能力与产品布局 - 公司在全国完成25,000P+算力纳管 覆盖26座城市 53个核心数据中心 服务百余家头部客户和多家科研机构[12] - 云端无穹AI云实现多元异构算力统一纳管 高性能训练&推理优化 智能体服务平台标准化和完整工具链[15] - 终端无垠终端智能解决方案包括无穹天权端侧大模型 以3B计算成本与7B内存需求对标21B级智能水平 无穹开阳终端推理加速引擎在主流硬件上实现3倍时延降低 40%能耗节省和40%内存占用 无穹天璇自研端侧LPU IP实现能效翻倍[16] - 公司还发布Infra Agents云端基础设施智能体蜂群 Kernel Mind终端推理加速与优化平台 RLinf强化学习框架和Cache to Cache无损通信框架[16] 市场地位与客户基础 - 公司成为AI基础设施领域最受资本追捧的黑马企业之一[1] - 服务客户包括Kimi 百川智能 Lovart 理想汽车 联想集团 生数科技 Soul VAST 中国移动 新华三 中兴终端等头部企业 支撑智源 浦江实验室 之江实验室 上海算法创新院 中关村学院等科研机构[12] - 投资方认为公司已在云+端全栈体系中构建成熟产品矩阵与多行业落地案例 为下一代Agentic Infra深化布局奠定坚实基础[19] 创始团队背景 - 公司由清华电子工程系长聘教授 系主任汪玉和其弟子夏立雪牵头创办[22][23] - 汪玉深耕智能芯片领域二十余年 曾成功孵化AI芯片企业深鉴科技 夏立雪本科到博士均毕业于清华大学电子工程系 连续五年入选斯坦福全球学科Top2%科学家榜单 连续两年入选AI2000人工智能全球最具影响力学者榜单[23]
月之暗面公开强化学习训练加速方法:训练速度暴涨97%,长尾延迟狂降93%
量子位· 2025-11-27 12:34
核心技术突破 - 月之暗面联合清华大学推出全新加速引擎Seer,旨在不改变核心训练算法的前提下,大幅提升大语言模型的强化学习训练速度 [1] - Seer框架通过其三大核心模块(推理引擎池、请求缓冲区、上下文管理器)和三项关键技术(分段生成、上下文感知调度、自适应分组推测解码)协同工作,从内存、调度、推理三个维度全面优化rollout效率 [9][10][11][20] - 该技术针对RL训练中耗时的生成阶段,解决了其固有的工作负载不均衡和长尾延迟问题,资源利用率较低 [6] 性能提升数据 - 实验结果显示,Seer在不同工作负载下,相比基线系统veRL,吞吐量提升74%至97% [3][23] - 在长尾延迟方面,Seer表现显著优于veRL,例如在Moonlight任务中,veRL最后10%请求耗时3984秒(占总时长约50%),而Seer仅需364秒,延迟降低85% [23] - 在Qwen2-VL-72B和Kimi-K2任务中,长尾延迟分别降低93%和75% [23][24] - 专项实验表明,Seer的上下文感知调度策略在吞吐量上可达到理想Oracle水平的95%,其长尾延迟仅为无上下文调度策略的13% [27][28] 公司融资与资本动态 - 月之暗面即将完成新一轮融资,融资金额高达数亿美元,完成后公司估值将提升至40亿美元 [32][33] - 公司正与IDG Capital等投资机构洽谈,潜在投资方包括现有股东腾讯 [36] - 预期本轮融资将于今年年底前完成,并计划在明年下半年启动IPO进程 [37]
量子位编辑作者招聘
量子位· 2025-11-27 12:34
公司概况与行业地位 - 公司是一家以追踪AI新进展为核心的内容平台,拥有8年行业积累[1] - 公司在微信公众号平台拥有超过240万订阅用户,全网用户超700万,日均阅读量达200万以上[12] - 公司在新榜和清博等第三方数据平台中,是AI及前沿科技行业的TOP1新媒体[12] 招聘岗位方向 - 公司开放三大方向的岗位招聘:AI产业方向、AI财经商业方向、AI产品方向[2][6] - 岗位面向社招和校招,社招覆盖编辑、主笔、主编各个层级,校招面向应届毕业生并提供实习转正机会[3][6] - 所有岗位不同能力层级的职位均在开放,工作地点为北京中关村[2][4] AI产业方向岗位详情 - 岗位职责为关注基建层创新,包括芯片、AI Infra、云计算领域新进展及核心玩家动态[5][6] - 需对前沿论文、开源社区、技术大会报告进行大众化解读,并参与核心采访,撰写AI云落地案例[6][7] - 任职要求包括对芯片、GPU、NPU、服务器、模型训练架构、云计算等有基本理解,熟悉AI行业供应链与生态,并能进行结构化表达[11] AI财经商业方向岗位详情 - 岗位职责为聚焦创投、AI创业公司、上市公司、商业模式及产业链资本动向,产出相关分析稿件[11] - 需进行访谈对话,对象包括投资人、创业者和产业分析人士[11] - 任职要求包括对数据敏感,对财报和战略规划感兴趣,具备强逻辑和商业叙事能力,并热爱采访[11] AI产品方向岗位详情 - 岗位职责为关注AI在软件应用和硬件终端的落地,撰写产品深度评测并跟踪多终端新品发布[11] - 需对话访谈AI应用创业者、产品专家及终端技术专家[11] - 任职要求包括对智能硬件和AI终端趋势敏锐,是重度AI产品体验人士,熟悉终端厂商生态并具备强表达能力[11] 员工福利与发展 - 员工可第一时间接触AI领域最新技术和产品,构建完整认知体系,并将AI新工具应用于工作[6] - 通过撰写原创内容可建立个人影响力,拓展行业人脉,参与重要科技活动[6] - 公司提供行业TOP薪资待遇,五险一金、餐补、项目绩效、商务绩效、加班补助等福利,团队氛围扁平开放[6] - 应届新人可获得主编级编辑的一对一指导,以更快获得成长[6]
10000个代码文件,我打几把游戏的功夫就搞成Wiki了!
量子位· 2025-11-27 12:34
产品核心定位与差异化 - 产品专注于解决“真实软件”研发痛点,即支撑商业价值、需要严肃迭代且存在大量历史积累(5-10年)的代码项目,而非从零生成新项目的场景[12][13][14] - 该定位旨在切入占开发者95%工作时间的核心研发领域,被认为是信息产业持续产生价值的“价值高地”[12][13] 核心功能与技术能力 - **仓库Wiki自动生成**:能够快速解析大型代码仓库(如包含约7500个文件的Microsoft Terminal项目)并自动生成包含项目概述、架构设计等内容的完整Wiki,支持共享协作[3][4][5][7][8] - **深度代码理解**:在IDE中通过自然语言提问(如“这个controller的findAll方法用到了哪些Service和Repository”),能自动检索并清晰呈现代码调用链和分析过程[20][21][22] - **Quest Mode(AI自主编程)**:基于自然语言需求描述(Spec),自动生成完整需求文档、逐步执行任务并提交总结,实现Spec驱动的自动化开发[25][26][27] - **大规模代码处理**:具备一次检索10万个代码文件的能力,可将电商网站级开发任务从数天压缩至约十分钟[24] - **Debugger集成**:在JetBrains插件中能理解调试上下文,直接引用内存中的变量和调用链提供智能调试建议,无需手动复制信息[38] - **代码安全与审查**:可分析代码风险(如SQL注入),并与GitHub深度集成进行自动代码审查,据称可提升2倍审查质量和10倍审查效率[39][49][50] 产品形态与覆盖范围 - 提供三种产品形态:IDE、JetBrains插件和命令行界面(CLI),覆盖不同开发者偏好[21][30][31][44] - JetBrains插件支持异步委派任务,具备记忆感知功能,能根据开发者习惯和项目特点形成记忆,实现“越用越懂你”的效果[32][40][41][42] - CLI形态内置轻量Agent,支持扩展插件和命令,可与GitHub Issues、Pull Requests交互,被描述为Claude Code的完美平替[44][49][52] 性能与性价比优势 - 采用“全球顶级模型+专项自研模型”组合,在效果评分上领先头部产品13.22%[21][53] - 在同样付费金额、使用SOTA模型的条件下,可完成205%的编程任务,性价比显著[21][54] - 提供模型分级选择器,包括基础轻量、经济高效、极致性能和智能路由四种模式,以匹配不同复杂度研发需求[24] - 据称其RepoWiki模型可节省93%的Credits消耗,SOTA模型耐用度比Cursor高104.9%[53][54] 行业贡献与标准制定 - 公司开源了“AI编程工具耐用度评测集”,为行业提供了可参考的评估标准,涵盖Python、JavaScript、TypeScript、Java和Golang等主流语言[58] - 评测集模拟真实开发环境和复杂场景,计划在明年3月前将真实开发场景案例数量扩展到50多个[58][60][61] - 基于该评测,公司在复杂工程、生成效果、Credits耐用度方面均宣称超过全球头部产品[60]
观众抢位中!锁定MEET2026,让我们畅聊AI|最新嘉宾阵容
量子位· 2025-11-27 12:34
大会核心信息 - 大会主题为“共生无界,智启未来”,关注AI等智能科技如何穿透产业、学科与场景边界,成为社会演进核心动能[2] - 大会将聚焦强化学习、多模态、芯片算力、AI+行业、AI出海等年度热议话题[3] - 内容涵盖学术前沿与商业落地碰撞,以及来自Infra、模型、产品产业的领先技术成果[4] - 大会将权威发布人工智能年度榜单与年度AI趋势报告[5][93] 嘉宾阵容与研究方向 - 张亚勤:数字视频和AI领域世界级科学家,曾任百度总裁,发明多项图像视频压缩传输技术被国际标准采用[11][12] - 孙茂松:主持国家973项目、国家社科基金重大项目等20余项科研项目[15] - 王仲远:发表国际顶级学术会议及期刊论文100余篇,获得ICDE 2015最佳论文奖,研究兴趣包括大模型、多模态等[19] - 王颖:现任百度集团副总裁,负责百度文库、百度网盘等重点业务的产品创新和落地[23][24] - 何晓冬:发表论文200余篇,被引用6万余次,带领团队打造京东JoyAI大模型并应用于零售、物流、金融、健康等行业[28][29] - 韩旭:文远知行创始人,带领公司在全球11国超30城开展自动驾驶研发测试运营,并于2024年登陆纳斯达克[33][34] - Daniel Povey:小米集团首席语音科学家,著名开源语音识别工具Kaldi提出者,谷歌学术引用近52000次[38] - 方汉:昆仑万维董事长兼CEO,拥有31年互联网从业经验,是中文Linux奠基人之一[42][43][46] - 尤洋:潞晨科技创始人,曾获ACM-IEEE CS George Michael Memorial HPC Fellowship,曾任职谷歌、微软、英伟达等公司[48] - 杨帆:商汤科技大装置战略业务负责人,主导推动身份验证、娱乐、安防等核心业务规模化商业落地[51][52] - 万卫星:高通公司AI产品技术中国区负责人,负责高通智能终端侧人工智能引擎软硬件规划及生态系统建设[54][55] - 陈晓建:亚马逊云科技大中华区产品部总经理,负责云服务在大中华区落地、产品管理及业务拓展[58][59] - 朱宁:研究涵盖行为金融学、中国宏观经济等领域,所著《刚性泡沫》等畅销书被译为多国语言[62][63] - 赵俊博:首创数据库大模型TableGPT,参与过PyTorch早期研发,师从图灵奖得主Yann LeCun[66] - 喻友平:提出“平台+应用+服务”大模型落地三级引擎战略,带领公司入选2025《财富》中国科技50强[69][70] - 刘凡平:RockAI CEO,主导实现国内首个非Transformer架构大模型,首倡“群体智能”理念推动AGI发展[73][74] - 乔梁:太初元碁联合创始人,曾主导计算生物、流体力学等AI4S前沿领域国产应用研发及成果转化[78][79] - 王潜:自变量机器人创始人,致力于研发由端到端大模型驱动的通用机器人[81][82] - 杜知恒:小宿科技联合创始人,曾在红杉中国对冲基金、高瓴资本、百度等企业从事投资、战略岗位[86][87] - 徐达峰:蚂蚁集团平台体验技术部负责人,致力于通过AI驱动的前端研发范式革新实现企业级研发效能突破[90][91] 大会发布内容 - 将发布2025人工智能年度榜单,从公司、产品、人物三大维度评选五类奖项[94] - 将发布2025年度AI十大趋势报告,结合技术成熟、落地现状、潜在价值等因素提名十大AI趋势并进行深入分析[95] 大会影响力 - 每年吸引上千名科技从业者参与,百万观众线上围观,近百家合作媒体联合曝光[98] - 已成为智能科技行业年度风向标,汇聚技术、产业、投资领域代表性企业和人物[98]
视频大模型新基元:用Object Tokens重塑细节感知与指代理解
量子位· 2025-11-27 12:34
文章核心观点 - 北大和UCSD团队提出VideoOrion视频理解框架,通过将前景物体的时空动态显式编码为Object Tokens,并与Context Tokens并行输入大语言模型,解决了现有Video-LLM因下采样或特征聚合导致的细节丢失和语义纠缠问题[2][3] - 该方法在多个主流视频理解基准测试中性能全面领先,并自然演化出视频指代问答能力,为细粒度视频理解和需要锁定实例的任务提供了天然接口[4][6][17] 核心方法 - 采用双分支并行编码架构:Context Tokens承载背景/场景等泛化信息;Object Tokens通过检测-分割-跟踪流水线提炼对象随时间的演化特征,形成紧凑且语义解耦的Token[9][10] - 对象动态Token化使大语言模型能沿对象维度整合细节,提升细粒度问答能力,例如能清晰描述“红色三轮滑板车+拖地组件”的细节或“黑色泳装+跳板后空翻”的动作要素[6][7] - 针对视频中前景物体进出画面和场景突变,提出自适应切片策略以稳健检测与关联对象,避免均匀切段带来的跨段错配,最佳组合为RAM++分段 + GroundingDINO提案 + XMem跟踪[14] 性能表现 - 在7B LLM设置下,VideoOrion在MVBench、EgoSchema、Perception-Test、VideoMME、ActivityNet-QA上的准确率分别达到63.5%、65.1%、65.2%、54.6–55.3%、57.7%,相对同骨干网络的VideoLLaMA2/2.1等模型,相对涨幅分别为+10.1%、+14.6%、+15.6%、+8.7%、+7.8%[16][17] - VideoOrion+(使用SigLIP编码器和16帧)性能进一步提升,在上述基准上达到67.4%、65.0%、65.9%、58.9–61.5%、60.3%的准确率[17] - 得益于显式Object Token,模型在VideoRef45K指代理解基准上零样本即有效,经小规模微调后,多项指标(BLEU@4、METEOR、ROUGE_L、CIDEr、SPICE)全面领先Artemis、Merlin等方法[17][18] 消融分析与技术洞察 - 消融实验证实对象分支的必要性:在等数据量下,去掉对象分支的基础模型在各基准上均落后;对象分支预训练整体更优[19][20] - Object Token数量存在适度原则:模型在最多64个Object Token时表现最稳定,过少信息不足,过多分散注意力[21] - 双分支结构优势明显:仅用Object Token会损失背景信息,仅用视频分支缺乏细节,双分支协同在保证全局线索的同时抓取关键对象信息[22][25] - 不同流水线组件组合均显著优于仅视频分支,验证了方法鲁棒性,最佳组合为RAM++分段 + GroundingDINO提案 + XMem跟踪[14][23]
NeurIPS 2025放榜:阿里Qwen门控注意力获最佳论文,何恺明Faster R-CNN获时间检验奖
量子位· 2025-11-27 11:00
最佳论文奖核心观点 - NeurIPS 2025最佳论文奖共评选出4篇获奖论文,其中3篇为华人一作,涵盖大语言模型多样性、注意力机制优化、强化学习深度扩展等前沿方向[1] - 另有3篇论文获得Runner-up奖项,研究领域包括扩散模型理论、自监督强化学习、在线学习理论等突破性进展[2] - 阿里Qwen团队提出的门控注意力机制论文获奖,该技术已应用于Qwen3-Next模型[24] 人工蜂群思维论文 - 提出"人工蜂群思维"概念,揭示大语言模型存在显著模型内重复和模型间同质性问题[7][8] - 实验显示超60%的模型响应相似度超过0.8,即使采用min-p等解码策略仍无法有效提升多样性[8] - 构建INFINITY-CHAT数据集,包含26K真实世界开放式查询和31250条人类标注,形成首个系统评估开放式查询的资源[12] - 研究发现现有大模型评估系统与人类评分校准度较低,难以捕捉人类多元偏好[14] 门控注意力机制论文 - 阿里Qwen团队提出在缩放点积注意力后应用头特定sigmoid门控能持续提升模型性能[18] - 门控机制将基线模型中平均46.7%指向首个token的注意力占比降至4.8%,显著缓解注意力沉陷问题[20] - 在RULER基准上实现超10分的增益,支持更大学习率和批次大小的稳定训练[20][24] - 实验证实元素级门控最优,头特定门控比头共享更有效,sigmoid激活函数表现最佳[21] 深度强化学习论文 - 将网络深度提升至1024层,相比传统2-5层浅层架构实现2-50倍性能提升[28][29] - 在10个任务中的8个超越SAC、TD3+HER等主流基线算法,半数环境实现超20倍性能飞跃[29] - 深度扩展触发质的行为变化,达到临界深度时智能体习得翻墙、坐姿移动等全新技能[31] - 深度扩展比宽度扩展更具计算效率,参数与计算量增长更平缓[34] 扩散模型理论论文 - 识别出泛化时间和记忆化时间两个关键训练时间尺度,泛化时间与训练集大小无关[40] - 记忆化时间随训练集大小呈线性增长,形成随训练集规模扩大而拓宽的泛化窗口[40] - 实验显示不同训练集大小下泛化时间基本稳定,模型容量影响两个时间尺度出现早晚[44] - 理论分析表明过参数化场景下会出现分离的特征值区间,分别对应泛化和记忆化阶段[45] 时间检验奖论文 - Faster R-CNN通过区域提议网络实现端到端接近实时的目标检测,帧率达到5fps[4][53] - 核心创新是引入区域提议网络,仅需300个提议区域即可优于传统Selective Search的2000个提议性能[52][53] - 提议计算耗时仅10ms,在PASCAL VOC和MS COCO等数据集上取得当时最先进检测精度[53] - 该框架的共享特征和锚点机制深刻影响了后续3D目标检测、实例分割等计算机视觉领域发展[55]
没有身体就没有AGI!Hillbot苏昊对谈千寻高阳:具身智能泡沫很大但进展真实
量子位· 2025-11-27 11:00
文章核心观点 - 具身智能是通往通用人工智能的必经之路,其本质与大语言模型无异,核心在于数据规模的扩展[2][3][4] - 行业正处于“全民做科研”的泡沫与真实进展并存阶段,技术突破是连续过程,机器人具身模型的GPT-3.5时刻预计在2-3年内到来[31][33][38][41] - 中国在具身智能领域具备硬件与软件协同设计、供应链效率和现实世界数据采集的显著结构性优势[25][26][27][30] 具身智能的战略重要性 - 具身智能是实现通用物理智能和通用智能的关键出口,缺乏身体则无法验证认知和改变世界[2][16][19] - 无论是虚拟智能体还是物理机器人,与环境的交互和经验学习是获得通用能力的必不可少环节[21][23] - 科学发现和拓展人类生存空间等宏大目标,均需具身智能实现感知与交互的配合[19] 技术路径与突破预期 - 技术路径借鉴大语言模型的成功经验,核心是解决预训练问题,让模型具备先验知识[39][40] - 世界模型是技术框架的重要组成部分,旨在建立对物理世界常识的表征,视觉-语言-动作架构需要其支撑[34][36] - 下一个突破是模型听话程度和完成多样化物理行为能力的连续提升,最终能串联复杂任务[40][41] - 机器人具身模型的GPT-3.5时刻预计还需2-3年,GPT-4时刻则需更长时间[41] 中美竞争与中国优势 - 中美在顶尖技术层面差距不大,美国在人才绝对数量和资本对“世界第一”量级的投入上具有优势[24][25] - 中国的核心优势在于硬件和软件的协同设计能力、供应链效率以及现实世界数据采集的迭代速度[25][26][27] - 硬件迭代周期在中国可比美国快3-10倍,配件获取速度以天为单位,而美国需周以上[25][26] - 中国全社会对具身智能的投入度和决心更强,且在该领域“没有退路”,必须持续支持[30] 行业现状与挑战 - 当前AI行业处于“全民做科研”状态,因问题宏大,资本和研究力量过早介入导致泡沫与真实进展并存[31][33] - 具身智能发展的最短板是数据,其瓶颈与大语言模型的电力瓶颈不同[27] - 芯片供应,特别是端上芯片,是中国面临的一个明确挑战[30]
爆发力超越波士顿动力液压机器人,PHYBOT M1实现全球首次全尺寸重型电驱人形机器人完美拟人态后空翻
量子位· 2025-11-26 17:33
核心观点 - 动易科技推出的全尺寸人形机器人PHYBOT M1,是全球首个实现完美拟人态后空翻的全尺寸重型电驱机器人,其技术突破标志着电驱系统在动态性能上已全面超越传统液压方案 [4][5][16] 产品性能与技术突破 - PHYBOT M1身高近1.8米,体重近70公斤,在成人尺寸平台上实现了后空翻这一高难度动态动作 [2][4] - 机器人最新一代关节峰值扭矩超过800N·m,整机峰值功率输出超过10000W,整机扭矩密度突破10 N·m/kg [16] - 后空翻动作系统性验证了机器人极致的动态平衡、瞬间的万瓦级爆发力以及全身在极端工况下的精准协同能力 [7] 行业背景与挑战 - 行业内能够展示高动态运动能力的人形机器人多数采用小尺寸/中尺寸机体设计,以降低惯量和控制难度 [9] - 全尺寸人形机器人面临体惯量大、关节扭矩不足、步态控制带宽有限等技术挑战,强运动能力与全尺寸难以兼顾 [9][11][12] - 行业尚未真正解决全尺寸人形机器人在“动力—结构—控制”三者之间的平衡 [10] 核心算法创新 - 基于加速度约束的轨迹重映射算法,对不符合物理实际的轨迹进行缩放,提升强化学习对轨迹的跟踪效果 [19] - 基于参数辨识的域随机化方法,在参数辨识基础上进行域随机化,提升策略从仿真到实物的转移成功率 [20] - 采用双阶段训练法,先完成大致动作训练,再进行微调优化,保证机器人在性能极限下的安全与表现 [21] 商业化前景与应用 - 电驱系统在爆发力与响应速度上媲美甚至超越液压方案,并在能量效率、可控性、静音运行与维护成本上实现全面领先 [16] - 机器人平台展示了在生产制造、物流搬运、特种应急等真实、复杂、高强度的生产环境中替代乃至超越人类作业的潜力 [7][16][24] - 动易科技致力于将人形机器人从实验室平台转变为各行各业可信赖的“生产力担当” [24]
观众抢位中!锁定MEET2026,让我们畅聊AI|最新嘉宾阵容
量子位· 2025-11-26 17:33
大会概况 - 大会主题为"共生无界,智启未来",关注AI技术穿透产业、学科与场景边界[2] - 聚焦强化学习、多模态、芯片算力、AI+行业、AI出海等前沿技术话题[3] - 涵盖学术前沿与商业落地的最新碰撞,包括Infra、模型、产品产业的技术成果[4] - 预计吸引上千名科技从业者参与,百万观众线上围观,近百家合作媒体联合曝光[98] 嘉宾阵容 - 张亚勤院士为数字视频和AI领域世界级科学家,曾任百度总裁,拥有多项国际标准技术专利[11][12] - 孙茂松担任清华大学人工智能研究院常务副院长,主持国家973项目、国家社科基金重大项目等20余项科研项目[15] - 王仲远博士为北京智源人工智能研究院院长,发表论文100余篇,获得ICDE 2015最佳论文奖,专注大模型、多模态研究[19] - 何晓冬博士为IEEE Fellow,京东集团高级副总裁,发表论文200余篇被引用6万余次,主导打造JoyAI大模型[28][29] - 韩旭创立文远知行,带领公司在全球11国超30城开展自动驾驶运营,2024年登陆纳斯达克成为"全球Robotaxi第一股"[33][34] - Daniel Povey为小米首席语音科学家,开发开源语音识别工具Kaldi,谷歌学术引用近52000次[38] - 方汉拥有31年互联网经验,为中文Linux奠基人之一,参与创立昆仑万维[42][43] - 尤洋为潞晨科技创始人,高性能计算领域谷歌学术引用最高博士毕业生,曾任职谷歌、英伟达等企业[48] - 杨帆主导商汤科技大装置战略业务规划,推动AI专用计算中心建设,担任工信部人工智能专家库专家[51][52] - 赵俊博首创数据库大模型TableGPT,参与PyTorch早期研发,师从图灵奖得主Yann LeCun[66] 行业趋势与成果发布 - 大会将发布人工智能年度榜单,从公司、产品、人物三大维度评选五类奖项[94] - 发布年度AI十大趋势报告,深入分析技术成熟度、落地现状和潜在价值[95] - 报告将提名代表机构和最佳案例,聚焦释放巨大潜力的AI趋势[95]