计算机视觉
搜索文档
东风汽车申请小目标检测方法专利,提高小目标在边缘设备上的检测精度和速度
金融界· 2026-01-12 08:26
公司技术研发动态 - 东风汽车集团股份有限公司于2025年9月申请了一项名为“小目标检测方法、系统、电子设备及计算机可读介质”的专利,公开号为CN121305026A [1] - 该专利属于计算机视觉技术领域,旨在通过一种结合重复可分组视觉变换器网络的模型,提升对小目标的检测能力 [1] - 专利方法的核心流程包括:获取实时图片、通过骨干网络进行多尺度特征提取、通过特征融合网络处理特征图、最后通过检测头网络输出目标检测结果 [1] - 该技术通过在训练阶段增加网络深度和宽度以增强特征提取能力,在推理阶段通过网络结构重参数化简化模型,从而实现轻量化设计 [1] - 该技术的目标是提高小目标在边缘设备上的检测精度和推理速度 [1] 公司基本情况 - 东风汽车集团股份有限公司成立于2001年,总部位于武汉市,主营业务为汽车制造业 [2] - 公司注册资本为858937万人民币 [2] - 公司对外投资了44家企业,参与了5000次招投标项目,拥有5000条专利信息以及156个行政许可 [2]
这项技术,颠覆芯片堆叠
半导体行业观察· 2026-01-09 09:53
文章核心观点 麻省理工学院的研究团队提出并演示了一种创新的芯片制造方法,通过在传统CMOS芯片的后端工艺(BEOL)区域低温堆叠有源器件层,将逻辑晶体管和存储器晶体管垂直集成,从而显著减少数据在逻辑与内存之间传输的能耗和时间,为人工智能推理、深度学习等以数据为中心的计算工作负载提供高能效解决方案 [1][6][8] 技术原理与架构创新 - 研究团队颠覆传统制造顺序,在芯片后端工艺(BEOL,传统上用于布线的区域)添加有源晶体管层和存储元件,避免了高温前端工艺对底层已完成电路的损坏 [1][2][10] - 该技术创造了一个垂直集成的器件堆叠结构,缩短了计算、嵌入式存储器和互连之间的物理路径,从而减少了传统布局中因数据移动造成的能量浪费 [2][6] - 该方法并非取代先进节点的硅器件,而是在现有芯片主要用于布线的区域添加新的功能层,以提高集成密度和能效 [6][10] 关键材料与工艺突破 - 使用非晶氧化铟作为BEOL晶体管的有源沟道层,因其独特性质,可在约150°C的低温下生长极薄的氧化铟层,不会损坏下方电路 [2][10] - 氧化铟薄膜厚度仅约2纳米,团队通过优化制造工艺,最大限度地减少了材料缺陷(氧空位),使晶体管能够快速且干净地切换,降低了开关所需的额外能量 [4][11] - 集成铁电铪锆氧化物(HZO)层以实现存储器功能,这是一种CMOS兼容的实用材料选择 [4][7] 器件性能与成果 - 制造的BEOL逻辑晶体管开关迅速且缺陷少,降低了开关能耗 [4][11] - 集成的存储器BEOL晶体管尺寸约为20纳米,开关速度达到10纳秒(达到测量极限),且工作电压低于同类器件,功耗更低 [4][11] - 该研究提供了一个可堆叠平台,并完成了从独立器件到电路级集成所需的性能建模(与滑铁卢大学合作) [6][12] 应用前景与影响 - 该技术最直接的受益者是内存流量占主导地位的工作负载,包括人工智能推理、深度学习以及需要反复传输激活值和权重的计算机视觉任务 [6][9] - BEOL中的存储晶体管能够实现存储和计算之间更紧密的耦合,支持内存内和近内存计算方案 [7] - 铁电器件缩小到纳米级为研究单个铁电单元的物理特性提供了平台,可能影响未来存储和计算单元的设计 [7][11] - 该技术有望帮助减少生成式人工智能、深度学习等高要求应用日益增长的计算电力消耗 [9] 后续计划 - 短期计划是将后端存储晶体管集成到单个电路中 [7][12] - 未来将致力于提高晶体管性能,并进一步优化对铁电层特性的控制 [7][12]
理想多次合作的年轻学者之浙大彭思达
理想TOP2· 2026-01-08 23:59
彭思达的学术背景与成就 - 彭思达为浙江大学助理教授及ZJU100青年教授,于2018年获浙大本科学位,2023年获博士学位[2] - 其谷歌学术主页显示,截至统计时,总被引次数为7662次,自2021年以来的被引次数为7470次[3][4] - 其学术影响力指标显著:h-index为36,i10-index为58,表明有36篇论文被引用至少36次,58篇论文被引用至少10次[3][4] - 在GitHub上拥有2.3千名关注者,其分享个人科研经验的仓库获得了9.7千星标和521次分享[5][6] 彭思达的代表性研究成果 - **InfiniDepth (2026年1月)**: 与理想公司合作,彭思达为通讯作者,该论文研究基于神经隐式场的任意分辨率与细粒度深度估计[1] - **StreetCrafter (2024年12月第一版,2025年8月第三版)**: 与理想公司合作,彭思达为通讯作者,该研究为街景合成设计了可控视频扩散模型,利用激光雷达数据实现像素级控制[2] - **Street Gaussians (2024年1月第一版,2024年8月第三版)**: 与理想公司合作,彭思达为通讯作者,该方法使用高斯泼溅为自动驾驶场景创建逼真动态城市街道模型[2] - **高引用论文**: 其论文《PVNet: Pixel-wise Voting Network for 6DoF Object Pose Estimation》(2020年)被引用1512次;《Implicit Neural Representations with Structured Latent Codes for Human Body Modeling》(2023年)被引用1025次;《Animatable Neural Radiance Fields for Modeling Dynamic Human Bodies》(2021年)被引用660次;《Deep Snake for Real-Time Instance Segmentation》(2020年)被引用461次[4] 彭思达的科研影响力与开源贡献 - 其研究成果代码开源并获广泛关注,例如“neuralbody”项目获951星标,“animatable_nerf”获522星标,“snake”项目获1.2千星标,“pvnet”项目获870星标,“mlp_maps”项目获239星标[5] - 在GitHub上开源了名为“learning research”的科研经验总结,旨在帮助实验室成员及外部研究者,内容涵盖如何成为顶尖博士生、科研能力培养、论文写作与学术报告等[6][8][9] - 与多位研究人员在GAMES平台共同开设了《GAMES003:图形视觉科研基本素养》课程,系统化分享科研经验[7][9] 彭思达的师承关系与科研培养 - 彭思达在知乎回答中详细描述了其导师浙江大学周晓巍教授的指导,称其科研能力从零开始到取得显著成果均得益于周老师的培养[11] - 在其导师指导下,彭思达获得了多项荣誉,包括2022年Apple AIML PhD fellowship(全球15人,亚太唯一)、2021年Style3D PhD fellowship(全国10人)、2021年CVPR最佳论文候选(7000多篇中选32篇)、2020年CCF-CV学术新锐奖(全国视觉博士生中选3人),并连续四年在CVPR发表口头报告或最佳论文候选论文[11] - 评论指出,彭思达评价导师的方式及其详实的回答细节具有说服力,其带学生的方式也必然受到导师周晓巍的熏陶,形成良好的师承关系[13]
地缘技术|“武士精神”正在重回硅谷
新浪财经· 2026-01-07 07:41
帕兰蒂尔公司概况 - 公司是美国硅谷一家以软件和大数据技术起家的企业,创始人是彼得·蒂尔 [1] - 公司与美国军方关系极为密切,已成为美国军工复合体中的“新贵”,风头甚至超越雷神等传统防务承包商 [3] - 2025年8月,公司与美国陆军签署一份总额高达100亿美元的长期合同,将在未来十年为陆军作战行动提供数据支持与软件服务,这是迄今美国科技企业获得的规模最大的数字化军事合同 [3] 公司领导层与理念 - 首席执行官亚历山大·卡普是德国裔移民,拥有德国法兰克福歌德大学的博士学位 [3] - 公司领导层积极参与技术、政治、社会伦理等公共辩论,被认为是硅谷的思想家 [3] - 公司高管与董事共同撰写专著,呼吁硅谷科技精英以爱国主义情怀加强与政府合作,更积极地投身于美国的军事防务事业 [3] - “武士精神”正在重回硅谷,这是理解美国科技创新生态变局的一个重要维度 [4] 硅谷与美国军事战略的历史渊源 - 硅谷的出现与发展,和美国军事安全战略的需求密不可分,二战及冷战推动了美国的科技创新和军事技术发展 [5] - 20世纪50年代,仙童公司为中情局研发侦察设备,带动了半导体技术突破 [5] - 美国海军使用的所有弹道导弹都曾在硅谷所在地生产 [5] - 1958年,美国国防部创设高级研究计划局(DARPA),在互联网、全球定位系统、无人机等领域的科技创新中发挥了重要作用 [5] - 大量高技术企业、高校和科研院所从美国国防部和各军种获取合同或订单,硅谷的发展壮大得到美国军事部门的大力支持 [5] - 洛克希德-马丁、诺思罗普-格鲁曼、通用动力等传统防务承包商多在硅谷设立基地 [6] 当前美国防务战略与科技融合 - 在中国崛起的背景下,如何利用人工智能、量子计算、计算机视觉等新兴技术提升美国军事优势,成为美国国防部及各军种战略谋划的重点 [6] - 2015年8月,美国国防部设立“防务创新小组”,总部位于硅谷,旨在促进新兴技术的研发及其军事化应用,更好更快地利用商用技术和私营部门为美军服务 [7] - 该机制在特朗普第一任期获得更多预算支持,为人工智能、自动化、太空等领域的技术企业提供了大量融资支持,主要受益者包括人工智能独角兽安杜里尔公司 [7] - 拜登政府2022年10月发布的《国家防务战略》报告将中国定位为“步步紧逼的挑战”,强调需加快新兴技术的创新和应用以强化美国的“非对称优势” [8] - 2023年8月,国防部副部长宣布将打造“数据驱动、人工智能赋能的军队”,通过“复制器”项目部署低成本、可消耗的自主系统,以对抗中国的军事优势 [8] - 2024年1月,美国发布首份《国防工业战略》报告,提出将打造更具韧性的国防工业生态系统,加强与防务初创企业的合作 [9] 俄乌冲突的影响与新兴防务企业崛起 - 俄乌冲突增强了美军加快新兴技术运用的紧迫感,为帕兰蒂尔、安杜里尔等新兴防务企业的崛起提供了重要动力 [10] - 乌克兰成为无人机、自主系统等武器平台的试验场,SpaceX、星球实验室等美国高技术企业在乌克兰战场大显身手 [10] - 2023年5月,美国国防部发布《国防科技战略》报告,提出将大力应对技术研发与量产之间的“死亡之谷”难题,加快非对称战力的应用部署 [10] - 隶属国防部的联合人工智能中心是推动美国人工智能武器化的核心机构,负责引导人工智能技术从实验室向战场过渡 [11] - 国防部希望推动部署大量相对便宜的智能武器,新兴技术公司通过开发人工智能无人机等作战平台,开始抢占国防部的采购预算份额 [11] - 美国国防部主导的“梅文计划”旨在利用人工智能等技术提升战力,其成果已用于实战,支持该系统的主要数据融合平台由帕兰蒂尔公司负责开发 [12] 中国作为军事假想敌与科技竞争 - 2017年12月,特朗普政府发布的《国家安全战略》报告将中国明确称为“对手”和“修正主义国家”,强调美国必须在研究和技术领域保持领先地位 [12] - 2022年10月,拜登政府发布的《国家安全战略》报告提出“技术是当今地缘政治竞争的核心”,高度重视加快新兴技术的军事化应用以应对可能的中美军事冲突 [13] - 拜登政府于2023年在国防部创设“战略资本办公室”,旨在调动私营资本为人工智能、生物技术等领域的初创企业提供更有力支持 [13] - 美国国会成为宣扬中美军事技术较量的策源地,议员呼吁加大在防务技术领域的投入以确保对华优势 [13] - 2024年2月,美国众议院成立由两党议员组成的人工智能工作组,旨在通过立法在人工智能领域确保针对中国的技术领先优势 [13] - 硅谷科技企业日益成为鼓吹和利用“中国威胁”的力量,帕兰蒂尔公司首席运营官称其研发活动的主要着眼点就是中国 [14] - 安杜里尔公司高管多次渲染中国构成的国家安全威胁,宣称其研发的武器可以阻止中国大陆武统台湾 [14] - 安杜里尔公司创立于2017年,以研发软件起家,后发展为生产智能武器系统的公司,包括攻击型无人机、无人潜航器、高超音速导弹等,在乌克兰冲突中名声大噪 [14] - 据“项目建议书”公司统计,2021—2023年,风险资本向致力于高超音速技术的美国初创公司投资超5亿美元 [14] - 硅谷与美国军事安全战略之间的联系正在变得越发紧密,这一趋势在特朗普第二任期将延续甚至强化 [14]
北大90后副教授董豪出任上纬启元首席科学家, 研究方向聚焦具身智能
新浪财经· 2026-01-06 21:28
公司核心人事与战略布局 - 北京大学90后长聘副教授、科技创新2030国家重大项目负责人董豪加入上纬新材的个人机器人业务品牌上纬启元,出任首席科学家,将聚焦具身智能模型领域的技术研发与战略布局 [1] - 董豪的研究方向聚焦于具身智能、大模型、强化学习、计算机视觉及开源系统,核心目标是探索并构建兼具成本效益与通用性的机器人系统,长期深耕开源AI系统并牵头多个开源项目 [1] - 业内分析认为,董豪在具身智能领域的深厚积淀与上纬启元的技术研发需求高度契合,其加入将强化公司在核心算法、通用机器人系统等关键领域的竞争力,表明公司正在强化消费级人形机器人的顶层科研布局 [4] 公司业务与产品进展 - 上纬启元是上纬新材重点打造的个人机器人业务品牌,公司以该品牌进军个人机器人赛道 [4] - 2025年12月31日,上纬启元正式发布首款全身力控小尺寸人形机器人“启元Q1”,该产品在关节系统、整机尺寸与应用场景上实现多项突破,将实验室级人形机器人能力浓缩至背包大小体量 [4] - 启元Q1主要面向三类核心人群:科研人员、创作者与家庭用户 [4] 公司控制权变更与市场表现 - 2025年7月8日,智元机器人拟通过其与核心团队共同出资设立的持股平台,以“协议转让+要约收购”组合方式获取上纬新材控制权 [4] - 2025年11月25日,上纬新材董事会选举彭志辉(稚晖君)担任公司第四届董事会董事长 [4] - 智元机器人致力于研发和生产通用人形机器人,其创始人彭志辉此前因华为离职“天才少年”身份受到关注 [5] - 因智元机器人入主,上纬新材在资本市场备受热捧,截至2025年12月31日收盘,公司一年以来累计涨幅达1820.29%,成为2025年涨幅榜冠军 [5]
商汤Kapi相机跃居中国区App Store「摄影与录像」榜首,此前在海外多国热度领先
新浪财经· 2026-01-01 00:01
公司产品表现 - 商汤旗下AI相机产品Kapi相机于12月31日成功登顶苹果App Store中国区“摄影与录像”类应用榜首 [2][7] - 该产品于12月20日正式亮相,定位为行业首个真正的“AI拍照助手”,打破了传统相机应用的功能局限 [2][7] - 产品通过复刻Apple Log曲线打造电影级质感直出效果,内置40余款复古滤镜,并能在1-2秒内智能识别场景、主体与时间,自动推荐最优滤镜与构图建议 [2][7] 产品全球市场表现 - 在东南亚市场,Kapi相机于12月8日登顶菲律宾App Store免费应用总榜第一,目前稳居“照片与视频”类应用榜首,总榜位列第三 [3][8] - 在安卓平台,该产品在菲律宾位居同类应用第一,总榜第四 [3][8] - 在欧洲市场,产品在英国、意大利、法国、德国等国的App Store“照片与视频”应用排行榜中,近期均成功跻身前五名 [3][8] 核心技术支撑 - Kapi相机的成功基于商汤科技在计算机视觉、多模态大模型等领域的长期技术积累 [3][8] - 产品通过搭建专业的图像处理工作流,从拍摄源头模仿电影的记录方式,最大程度保留画面的原始光影信息,以呈现柔和细腻的质感 [3][8] - 12月29日,权威评测基准SuperCLUE报告显示,商汤日日新V6.5(SenseNova V6.5 Pro)以75.35的总分位列国内多模态模型第一,并在视觉推理维度上拿下国内最高分 [4][9] - 报告指出,商汤日日新V6.5在基础认知维度已接近头部平均水平,部分看齐Gemini 3.0 Pro,在视觉推理维度上,是国产模型中唯一超过头部平均的模型,处于行业领先地位 [4][10] 行业趋势与意义 - 随着AI技术成熟,消费级AI应用正迎来爆发期 [5][10] - Kapi相机的成功预示着AI正以更接地气的方式融入大众生活,开启人人皆可创作的新时代 [5][10] - 此次突破为AI应用的商业化落地注入了新的信心与动力 [5][10]
中国关税新增两类机器人税目
第一财经· 2025-12-30 15:55
2026年关税调整方案中机器人相关税目变化 - 国务院关税税则委员会发布《2026年关税调整方案》,对进出口税则税目进行调整[3] - 调整后,中国税则税目总数达到8972个[5] 新增机器人税目详情 - 新增“智能仿生机器人”税目,其最惠国税率为0%,普通税率为30%[3] - 新增两项不同规格的“清洁机器人”税目,适用最惠国税率分别为8%和0%,普通税率分别为130%和30%[3] 智能仿生机器人的定义与功能 - 智能仿生机器人是一种在外观、结构或功能上高度模仿人类或动物形态和行为的自主或半自主机器人[4] - 其核心特征在于具备类人或动物的主要身体结构,如头部、躯干、四肢、尾巴等[4] - 该类机器人可通过摄像头、麦克风、传感器、激光雷达等设备感知环境,并依靠人工智能、机器学习和计算机视觉等技术实现自主路径规划、障碍物规避等功能[4] - 部分机器人可利用自身构造或搭载工具独立或多机协同完成任务,并可融合自然语言处理与情感计算,通过语音对话、表情识别及手势响应理解人类意图与情感状态,实现人机交流与反馈[4] 关税调整的政策目标与行业影响 - 增列智能仿生机器人等本国子目,旨在服务科技发展和技术进步,支持循环经济和林下经济发展[5] - 中国机械工业联合会总工程师表示,增加相关税目有助于行业与企业精准掌握贸易数据,研判海外市场发展趋势[5] - 2026年将对935项商品实施低于最惠国税率的进口暂定税率,例如为促进建设现代化产业体系,降低压力机用数控液压气垫、异型复合接点带等关键零部件、先进材料的进口关税[5]
中国关税新增两类机器人税目
第一财经· 2025-12-30 14:40
关税税目调整方案 - 2026年中国进出口税目新增智能仿生机器人税目 最惠国税率为0% 普通税率为30% [1] - 2026年中国进出口税目新增两项不同规格清洁机器人税目 适用最惠国税率分别为8%和0% 普通税率分别为130%和30% [1] - 调整后中国税则税目总数达到8972个 [3] 智能仿生机器人定义 - 智能仿生机器人是一种在外观、结构或功能上高度模仿人类或动物形态和行为的自主或半自主机器人 [2] - 其核心特征在于具备类人或动物的主要身体结构 如头部、躯干、四肢、尾巴等 [2] - 该类机器人通过摄像头、麦克风、传感器、激光雷达等设备感知环境 依靠人工智能、机器学习和计算机视觉等技术实现自主路径规划与障碍物规避 [2] - 该类机器人可利用自身构造或搭载工具独立或多机协同完成任务 部分可融合自然语言处理与情感计算 支持通过语音对话、表情识别及手势响应理解人类意图与情感状态 [2] 调整目的与行业影响 - 新增税目旨在服务科技发展和技术进步 支持循环经济和林下经济发展 [3] - 增加智能仿生机器人和清洁机器人税目有助于行业与企业精准掌握贸易数据 研判海外市场发展趋势 [3] - 2026年将对935项商品实施低于最惠国税率的进口暂定税率 [3] - 为推动高水平科技自立自强及促进现代化产业体系建设 将降低压力机用数控液压气垫、异型复合接点带等关键零部件和先进材料的进口关税 [3]
人工智能专家凌海滨全职加入西湖大学,创立智能计算与应用实验室
生物世界· 2025-12-30 08:18
核心人事任命与研究方向 - 西湖大学宣布,国际电气和电子工程师协会会士凌海滨全职加入工学院,受聘讲席教授,并牵头创立智能计算与应用实验室 [2] - 该实验室致力于开展人工智能以及跨学科的研究与应用,研究方向包括计算机视觉、多模态人工智能、增强现实、AI for Science、量子信息等 [2] 专家背景与职业经历 - 凌海滨于1997年获北京大学学士学位,2000年获北京大学硕士学位,2006年获美国马里兰大学帕克分校博士学位 [4] - 其职业经历包括微软亚洲研究院助理研究员、加州大学洛杉矶分校博士后研究员、西门子研究院科学家 [4] - 2008年起任教于天普大学,先后担任助理教授和副教授,2019-2025年任纽约州立大学石溪分校Empire Innovation教授,2025年加入西湖大学 [5] - 在北京大学期间完成了从数学到计算机的专业跨越,博士阶段选择了计算机视觉方向 [5] - 其博士期间关于“利用计算机识别形状多变的树叶”的研究催生了全球第一款手机植物识别APP——LeafSnap [5] - 博士毕业后聚焦计算机视觉领域,主攻动态目标追踪技术 [5] 研究领域与学术成就 - 凌海滨的研究领域涵盖计算机视觉、增强现实、医学图像分析、机器学习及AI for Science [6] - 曾获ACM UIST最佳学生论文奖、美国自然科学基金CAREER奖、雅虎教授研究发展奖、亚马逊机器学习研究奖及IEEE VR最佳期刊论文奖 [6] - 现任/曾任《IEEE模式分析与机器智能汇刊》、《IEEE可视化与计算机图形学汇刊》、《计算机视觉与图像理解》及《模式识别》等期刊编委,并长期担任CVPR、ICCV、ECCV、ACM MM等人工智能顶级会议领域主席 [6] - 其学术成果引用总计51080次,2020年至今引用35245次,h指数为98,i10指数为315 [8] - 代表性论文包括《LIME: Low-light image enhancement via illumination map estimation》(被引3108次)、《Lasot: A high-quality benchmark for large-scale single object tracking》(被引2027次)和《U2Fusion: A unified unsupervised image fusion network》(被引2021次) [7]
一种制造芯片的新方法
半导体行业观察· 2025-12-13 09:08
文章核心观点 - 麻省理工学院等机构的研究团队开发了一种新型芯片制造方法,通过在已完成芯片的后端互连层上堆叠额外的晶体管和存储单元,有望大幅提升芯片的晶体管密度和能源效率,为延续摩尔定律提供了新的技术路径 [2][3][4] 技术原理与创新 - 传统CMOS芯片制造中,前端(晶体管层)与后端(金属互连层)分开制造,后端堆叠有源器件的高温会破坏前端 [2][5] - 研究团队创新性地在芯片后端互连层上,使用非晶氧化铟作为沟道材料,在仅约150摄氏度的低温下“生长”出仅约2纳米厚的额外晶体管层,避免了前端受损 [2][5][6] - 该团队还通过添加一层铁电氧化铪锆材料,在后端制造出了集成的存储单元 [3][5][6] 性能优势与潜力 - 新方法制造的晶体管尺寸极小,其中集成存储器件的后端晶体管尺寸仅约20纳米 [6] - 这些存储晶体管的开关速度极快,达到10纳秒(为测量仪器极限),且所需电压更低,从而降低了功耗 [6] - 该技术通过将计算(晶体管)与存储单元集成在紧凑结构中,缩短了数据传输距离,可减少能源浪费并提高计算速度,尤其适用于生成式AI、深度学习等高能耗计算任务 [4][5] 行业影响与未来展望 - 该技术若与传统的芯片堆叠技术结合,有望大幅突破晶体管密度的极限 [3] - 研究表明,通过在后端平台集成多功能电子层,可以在非常小的设备中实现高能效和多种功能,为未来芯片架构开辟新道路 [4][7] - 这项研究由麻省理工学院、滑铁卢大学和三星电子的研究人员共同完成,并获得了半导体研究公司和英特尔的资助 [5][7]