深度学习
搜索文档
2025年全球智能视觉处理芯片行业进入壁垒、市场政策、产业链图谱、市场规模、竞争格局及发展趋势研判:中国企业占据主导地位[图]
产业信息网· 2025-11-14 09:28
行业概述 - 智能视觉处理芯片是专门针对图像/视频数据进行采集、解析、处理与分析的专用集成电路,是智能视觉系统的"大脑",具备高算力、低功耗、实时响应的特点 [2] - 芯片可分为终端侧和边缘侧两种,终端侧负责终端侧图像的采集与处理,边缘侧负责边缘侧的存储和解码 [2] - 2023年全球行业市场规模达10.51亿美元,其中终端侧占比超80% [1][9] 市场规模与驱动因素 - 2024年受全球宏观经济增速放缓、消费需求缩减等因素影响,全球市场规模降至10.33亿美元 [1][9] - 长期增长驱动力来自智慧城市项目建设带动的安防监控需求、智能手机/AR/VR设备/扫地机器人等消费电子更新换代需求,以及自动驾驶技术普及带来的车载视觉需求爆发式增长 [1][9] - 安防监控是当前最大需求市场,占比超30%,消费电子市场其次,约占29.8% [8] 竞争格局 - 行业进入壁垒高,市场集中度高,2024年全球市场CR3市场占有率高达56.3% [10] - 富瀚微市场占有率高达21.3%,全球排名第一,全球CR3均为中国企业 [10] - 相关上市企业包括富瀚微(300613)、星宸科技(301536)、芯原股份(688521)等 [2] 代表企业分析 - 富瀚微是领先的芯片设计公司,提供以视频为中心的芯片和完整解决方案,2025年上半年营业总收入为6.88亿元,专业视频处理产品占比58.17% [10] - 星宸科技主营业务为端边侧AISoC芯片的设计、研发及销售,2025年上半年营业总收入为14.03亿元,智能安防业务占比64.82% [11] 产业链与政策环境 - 行业上游为硅晶圆、光刻胶、特种气体等原材料及光刻机、刻蚀机等生产装备供应商,中游为芯片设计、制造、封装测试,下游应用涵盖智能安防、消费电子、工业检测、车载视觉等领域 [6] - 全球各国高度重视集成电路产业,出台一系列政策支持行业发展,为智能视觉处理芯片行业提供了良好的政策环境 [6] 未来发展趋势 - 技术上将通过优化深度学习和神经网络算法、引入高性能计算架构,以实时处理大量复杂图像数据 [13] - 为适应移动设备和边缘计算需求,开发低功耗的视觉处理解决方案、实现高效能与低功耗的平衡将成为重要趋势 [13] - 商业模式将从单纯的产品销售向"产品+服务"一体化解决方案转型,平台化、生态化模式将逐渐兴起 [13]
Yann LeCun离职,要创业?
36氪· 2025-11-12 08:51
核心人事变动 - Meta首席人工智能科学家Yann LeCun计划离开公司并创办自己的初创公司,目前正就筹集资金进行早期洽谈[2] - 此消息尚未得到最终确认,因其内部聊天账号尚未停用[2] - 此前,PyTorch之父Soumith Chintala已宣布将于11月17日离开Meta,结束其长达11年的职业生涯[2] Meta内部AI战略调整 - 自2024年6月扎克伯格斥资143亿美元收购Scale AI并任命Alexandr Wang领导超级智能实验室以来,Meta内部持续动荡[6] - 公司一方面高薪挖人组建新团队,另一方面对内进行大规模调整[6] - 2024年10月底,Meta对内部人工智能团队进行大刀阔斧裁员,约600个职位被裁减,调整波及FAIR、AI产品及基础设施团队,包括田渊栋团队被Alexandr Wang裁撤[9] FAIR实验室的历史与现状 - 2013年扎克伯格力邀Yann LeCun加盟,同意其设立FAIR实验室于纽约并可保留纽约大学教职[11] - LeCun坚持FAIR必须采用开放的学术研究模式,即公开发表论文,以吸引和留住顶尖人才[13] - FAIR为Meta提供了核心技术、开源工具PyTorch以及前沿探索,并通过Llama系列模型使公司在开源AI生态中确立领导地位[13] - 2024年9月,Meta对FAIR实验室施加锁紧论文发表的新政策后,LeCun曾向同事透露辞职意愿[6] 行业背景与影响 - 2012年AlexNet的惊人表现和Google对Hinton团队的收购,点燃了科技巨头对深度学习人才的渴望[9] - 扎克伯格将AI视为下一个大事件,决心建立顶尖AI实验室[9] - 当前AI竞争日益残酷,FAIR实验室面临理想主义退潮,内部新旧冲突加剧、学术自由受限、文化混乱[15]
港中文(深圳)冀晓强教授实验室全奖招收博士/博士后
具身智能之心· 2025-11-12 08:03
研究团队与平台 - 实验室为人工智能控制与决策实验室,是深度融合控制论、人工智能、机器人学、高性能计算、大数据等基础科学的学科交叉平台[11] - 团队导师冀晓强教授为香港中文大学(深圳)理工学院助理教授、博士生导师,并担任广东省具身智能机器人工程技术研究中心副主任等职务[10] - 导师在IEEE Transactions on Automatic Control、Automatica等顶尖国际期刊及会议发表论文五十余篇,是非最小相位系统领域学习控制设计的推动者之一[10] 研究方向与内容 - 核心研究方向包括深度学习以及人工智能理论及算法[2] - 研究需要深度融合控制论、人工智能、机器人学、高性能计算、大数据等基础科学,致力于开展人工智能与智能系统领域的基础理论与原创性研究[11] 任职要求与技能 - 博士后及博士研究生申请人需已获得或即将获得国内外知名高校相关专业的博士学位,并在相关领域国际顶级期刊或会议上发表过研究论文[8] - 硕士研究生申请人需已获得或即将获得相关专业的硕士学位或优秀学士学位,并对控制理论、人工智能、机器人学有浓厚科研兴趣及扎实的数学和编程基础[8] - 通用技能要求熟悉CLIP、BLIP、LLaVA等多模态大模型,以及VAE、Transformer、BERT等经典模型,并具备实现与调试能力[3][4] - 加分项包括了解LLaMA、Qwen等大语言模型架构,具有无监督预训练、SFT、RLHF等实践经验,或在IJRR、ICRA、IROS、RSS、ICML、NeurIPS等顶会发表论文[6][9] 福利待遇 - 博士后可获得省市生活补助每人每年税前21万元(总额不超过42万元),大学提供博士后专项补贴每人每年5万元(总额不超过10万元),合作导师另提供面议薪酬[12] - 符合条件者可申请广东省海外博士后人才支持项目,享受在站补贴税前60万元/2年,出站留粤补贴税前40万元/3年[12] - 博士生可获全奖/半奖(学费全覆盖并额外提供生活津贴),优秀者可申请学校校长奖学金,金额为税后18万/年[13] - 研究型硕士毕业后有转PhD机会,优秀者可额外获得生活津贴[14]
速递|重磅!深度学习巨头Yann LeCun将从Meta离职独立创业,疑因与扎克伯格路线决裂
搜狐财经· 2025-11-12 06:32
公司核心人事与架构变动 - Meta首席人工智能科学家Yann LeCun计划离开公司并筹备创立新的AI初创企业,已开始与潜在投资方进行早期谈判[2] - Meta宣布将旗下所有人工智能业务统一整合为新部门Superintelligence Labs,并由前Scale AI创始人Alexandr Wang出任领导人[2] - LeCun的汇报关系发生变化,从原先向首席产品官Chris Cox汇报改为直接向Alexandr Wang汇报[2] 公司战略方向转变 - Meta的AI研究哲学发生根本转变,新成立的Superintelligence Labs更接近于OpenAI式的激进路线,主打商业落地、算力堆叠与速度优先[3] - 公司将AI视为未来十年的核心战役,将所有资源押注在超智能方向,目标直接对标AGI(人工通用智能)[4] - 公司原有的FAIR研究院地位动摇,被逐步吸收进以Superintelligence Labs为中心的新体系,更多服务于产品导向和商业需求[4] 行业理念分歧与影响 - Yann LeCun的AI理念与当前主流的大语言模型路径存在深刻分歧,他认为大语言模型并不真正理解世界,并更关注让机器具备世界模型与常识推理能力[3] - 工业界与学术界之间的界线正在迅速被抹平,AI巨头的重心急速滑向应用、商业与产品,资本迫切希望看到有结果的智能[5] - LeCun的离开被视为一位科学家对加速主义潮流的无声抗议,其新创业方向可能更侧重于研究的纯粹性及构建接近人类认知机制的解释型AI[4][5]
突发|Yann LeCun离职,要创业?
机器之心· 2025-11-12 01:11
Meta公司人事变动 - Meta首席人工智能科学家Yann LeCun计划离开公司并创办自己的初创公司,目前正进行早期融资洽谈[3][4] - PyTorch之父Soumith Chintala宣布将于11月17日正式离开Meta,结束长达11年的职业生涯[4] - Meta于10月底对人工智能团队进行大规模裁员,裁减约600个职位,波及FAIR实验室、AI产品及基础设施团队[13] Meta战略转型与内部调整 - 公司于今年6月斥资143亿美元收购Scale AI并任命Alexandr Wang领导新成立的超级智能实验室[9] - 公司实施收紧论文发表的新政策,限制FAIR实验室的学术自由度[10] - 内部文化从开放研究转向更注重商业应用的模式,导致原有研究团队地位发生变化[25][26] FAIR实验室历史贡献与地位演变 - 扎克伯格在2013年亲自邀请Yann LeCun加盟并成立FAIR实验室,允许其保留纽约大学教职并采用开放研究模式[15][17][19] - FAIR实验室为Meta提供了核心技术、开源工具PyTorch以及前沿探索,并通过Llama系列模型确立了公司在开源AI生态的领导者地位[21][22][23] - 实验室从深度学习时代到大模型时代与公司关系发生显著变化,反映出行业竞争加剧背景下研究模式的调整[15][25]
群星闪耀时:黄仁勋、李飞飞、杨立昆、G.Hinton、Y.Bengio、B.Dally深度对话|Jinqiu Select
锦秋集· 2025-11-10 15:44
AI发展的核心驱动力 - AI飞跃的关键并非算法突破,而是数据规模与算力基础设施的长期积累[6][9] - 数据匮乏曾是核心瓶颈,ImageNet数据集的创建(1500万张图片)成为深度学习黄金时代的起点[7][8] - 算力等待期长达40年,早期理论(如1984年的微型语言模型)因缺乏算力与数据而无法实现[9][10][32] AI技术范式的现状与分歧 - 当前AI热潮与互联网泡沫存在本质区别,几乎所有GPU都处于全负载运行状态,需求真实且持续增长[16][49] - 算力繁荣具备坚实基础,但大语言模型范式能否通向人类级智能存在显著分歧,需要全新科学突破而非简单扩展[17][18] - 模型能力持续进化,已从记忆概括向推理分析及智能体特征演进,技术演化速度惊人[49][53] 下一代AI的发展方向 - 大语言模型主要处理语言而非世界,下一次飞跃将源于机器对物理世界的理解与互动能力[20][22] - 空间智能(连接感知与行动的能力)是当前模型的核心短板,也是未来机器人与具身智能的关键突破点[21][56] - 自监督学习重新成为重要方向,将从语言数据扩展至视频、传感器等非语言数据领域[44][48] AI的产业影响与基础设施需求 - AI正在从工具向"智能工厂"演进,GPU集群成为生产智能的基础设施,需要上万亿美元投资支撑数万亿美元产业[50] - AI应用仅开发了1%潜力,几乎人类生活的每个方面都将因AI提升效率,使用量呈指数增长[55][52] - 传统软件是预编译的,而AI必须实时计算生成智能,这种生产方式本身创造了庞大的算力需求[50] 对智能本质的重新定义 - AI的目标不是超越或取代人类,而是增强人类能力,让机器承担人类不擅长的任务(如识别上万种物体)[12][13] - 机器智能与人类智能是两种并行、互补的存在,如同飞机与鸟类的飞行方式差异[14][60] - 行业应关注AI如何增强人类在创造力、共情力等独特领域的优势,而非单纯追求"人类级智能"指标[13][15]
远洋鱿钓渔情预报系统“苍鹭”发布
中国自然资源报· 2025-11-10 11:43
系统上线与合作模式 - "苍鹭"AI鱿鱼渔情预报系统于11月5日正式上线,由上海海洋大学、中水集团远洋股份有限公司、中水集团舟山远洋渔业有限公司共同研发 [1] - 合作模式为企业提出需求,大学进行针对性科研攻关,使科研成果直接应用于生产实践 [2] 系统功能与技术特点 - 系统可为全球大洋性鱿鱼作业海域提供未来5天精准渔场预测及下一年度资源丰度预报,填补国内远洋鱿钓渔业智能预报领域空白 [1] - 系统融合人工智能、大数据挖掘、深度学习技术,结合生物学、生态学、渔场学知识,实现鱿鱼中心渔场精准预报与中长期资源量预测 [1] - 系统具备多端覆盖能力,网页端、船载端、手机端适配全场景,可随时获取近20个与安全高效生产相关的海洋要素 [1] - 系统自带船位监控、越界预警功能,能避免海域纠纷,并以"一张图"形式每日定时自动发布作业海域环境、船位、渔情预报信息 [1] 应用成效与产量提升 - 系统已在中水集团舟山远洋渔业有限公司北太平洋鱿钓渔船应用 [2] - 截至2025年10月底,2025年单船产量可达500吨左右,与历史产量每年330多吨相比,提高了48% [2] - 通过渔情预报系统应用,首次将北太平洋西经海域鱿钓作业渔汛延长到11月 [2]
研判2025!中国文本转语音技术行业发展历程、产业链、发展现状、竞争格局及趋势分析:作为人机交互的重要组成部分,行业应用需求不断扩大[图]
产业信息网· 2025-11-10 08:59
文章核心观点 - 文本转语音技术作为人机交互的关键基础设施,正随着人工智能和深度学习技术的发展而快速演进,其应用从传统领域扩展至虚拟主播、个性化语音定制等新兴场景,行业市场规模在2024年达到187.6亿元人民币,同比增长22.77% [1][4][11] - 行业呈现“国际技术引领,国内场景深耕”的竞争格局,未来发展趋势将聚焦于拟人化与长场景适配、多模态融合以及行业规范化发展 [11][14][15][16] 文本转语音技术行业相关概述 - 文本转语音技术是一种将文字内容转换为语音输出的技术,其核心价值在于打破信息传递的媒介限制,已成为人机交互领域的基础设施,广泛应用于智能客服、有声读物、车载导航及无障碍设备等场景 [4] - 技术工作原理主要包括文本预处理、语音合成和语音输出三个部分,通过算法和大量语音数据训练生成自然流畅的语音信号 [5] - 技术发展经历了从18世纪机械式合成到20世纪80年代后的拼接合成,再到2016年至今深度学习驱动的端到端系统的革命性演进 [6][7] 文本转语音技术行业产业链 - 产业链上游为核心硬件、算法框架与基础设施支持,中游是技术核心环节,下游应用领域涵盖教育、金融、医疗、媒体等 [8] - 在教育领域,技术应用于在线课程语音播报、辅助阅读工具等,属于智慧教育范畴,其市场规模从2015年的1864亿元增长至2024年的4176亿元 [8] - 在网络视听领域,技术用于内容制作的语音解说生成,2024年中国网络视听用户规模达10.91亿人,同比增长1.58% [9] 文本转语音技术行业发展现状 - 2024年中国文本转语音技术行业市场规模为187.6亿元人民币,同比增长22.77% [1][11] - 现代技术已从机械模拟演进为能生成接近人类水平自然度的智能系统,在传统及新兴应用场景中展现出巨大潜力 [1][11] 文本转语音技术行业竞争格局 - 行业格局为“国际技术引领,国内场景深耕”,国际企业如Google、微软占据高端市场,国内企业如科大讯飞、百度、云知声等在中文及垂直应用场景具备优势 [11] - 未来竞争将围绕边缘计算部署、多模态交互及伦理安全技术展开 [11] 重点企业分析 - 科大讯飞股份有限公司是智能语音和人工智能上市企业,以语音合成技术为起点,2025年1-9月营业收入为169.89亿元,同比增长14.41%,归母净利润亏损0.67亿元,亏损幅度同比收窄80.60% [12] - 云知声智能科技股份有限公司是专注于物联网人工智能服务的企业,2025年上半年营业收入为4.05亿元,同比增长20.2%,归母净利润亏损2.97亿元 [12] 文本转语音技术行业发展趋势 - 技术将向拟人化与长场景适配发展,聚焦情感化表达和长时音频合成能力,例如实现90分钟连续音频生成与多角色自然对话 [14] - 多模态融合成为核心发展路径,与文本、图像、视频生成等技术协同,构建全链路内容生产生态 [15] - 行业将向规范化发展,政策监管加强,核心关注数据隐私与声音版权保护,通过区块链等技术实现声音资产确权与追溯 [16]
“我不想一辈子只做PyTorch!”PyTorch之父闪电离职,AI 圈进入接班时刻
AI前线· 2025-11-08 13:33
PyTorch创始人离职事件 - PyTorch创始人Soumith Chintala宣布将于11月17日卸任框架负责人并离开就职11年的Meta[2] - 他在Meta的11年职业生涯中仅用8年就从软件工程师晋升至副总裁[4][5] - 离职原因为不希望像Guido或Linus那样被单一项目绑定数十年[2] PyTorch的市场地位与影响力 - PyTorch在人工智能领域有90%以上的应用率[2][7] - 该框架支撑百亿亿级算力的AI训练任务并为几乎所有主流AI公司所采用[2][9] - 从MIT课堂到印度乡村教室都被广泛学习使用[9][16] PyTorch发展历程 - PyTorch初始版本于2016年9月创建2017年在GitHub开源起源于基于Lua的Torch项目[12][13] - 关键发展节点包括与贾扬清主导的Caffe2合并以换取更稳定资金支持[14] - 通过每天手动阅读500多条用户反馈形成用户共创的开发模式[16] Meta AI部门组织变动 - Meta AI进行大裁员在"超级智能实验室"内裁减约600个岗位涉及FAIR研究部门和AI基础设施团队[4] - 首席AI官Alexandr Wang上任后FAIR部门自由度受限Yann LeCun也可能考虑辞职[4] - 裁员目的是减少决策沟通让员工承担更多责任[4] 行业评价与个人规划 - Andrej Karpathy评价PyTorch在20维设计空间中踩中时代最佳组合[19] - Yann LeCun对Chintala表示祝福肯定其早期FAIR建设的贡献[20] - Chintala计划从头开始做小事探索Meta之外的可能性[20][21] 技术架构特点 - PyTorch以更开放治理更迅捷社区响应和易用动态图模型获得研究者青睐[15] - 如果重写会选择更多Python和Triton替代C++内核进行更激进设计[16] - 当前许多用户通过Hugging Face等打包功能使用PyTorch而不自知[16]
AI六巨头同台:AGI,不再是“未来”的事了
36氪· 2025-11-08 09:43
文章核心观点 - 六位AI领域先驱一致认为通用人工智能(AGI)的发展范式正在转变,AGI不再是遥远概念,而是已开始在实际中发挥作用 [1] - 尽管对AGI实现路径和时间线存在分歧,但共识是AI正从语言能力向行动能力演进,从被动响应转向主动执行 [44][45] - AGI是四十年技术积累的结果,而非突变,其发展涉及算法、数据、计算架构和工程化的共同演进 [20] AI发展历史与关键驱动因素 - 今天的AGI是四十年逐步演化的结果,关键驱动因素包括算法突破、数据积累和计算架构创新 [2][20] - Geoffrey Hinton在1984年通过微型语言模型(100个训练样本)预测下一个词,奠定了大型语言模型的原型 [4][5] - Bill Dally在90年代末提出流处理架构解决内存墙问题,后演变为GPU计算;2010年与吴恩达的早餐会谈促使NVIDIA转向深度学习专用GPU设计 [7][8][9] - 李飞飞在2006-2007年创建ImageNet(1500万张图片、2.2万个类别),证明大数据是机器学习的核心基础 [11][12][13] - Yann LeCun自1983年起主张自组织学习,认为智能核心是自我组织而非指令,当前大语言模型训练方式已回归自监督学习 [14][15][16] - 黄仁勋将芯片设计逻辑与深度学习系统开发类比,推动AI从理论走向工程化,实现多GPU、多数据中心的规模化运行 [17][18][19] 对AGI实现时间与路径的分歧 - Yann LeCun认为AGI是渐进过程,未来5-10年或有重大进展,但不会出现奇点时刻 [22][23][24] - 李飞飞指出机器已在特定领域超越人类(如识别2.2万个物体、翻译100种语言),但进化方向未必是人类化 [25][26] - 黄仁勋强调AGI级智能已投入实际应用(如写代码、看病、财务),未来几年将转化为大量社会有用工具 [27][28] - Geoffrey Hinton预测20年内机器能在辩论中战胜人类 [29] - Bill Dally质疑"超越人类"的命题,主张AI应增强人类而非替代,聚焦互补性能力 [30] - Yoshua Bengio认为若规划能力保持指数增长,5年内AI可达工程师水平,且AI自研AI可能催生突破 [31] 智能演进的下阶段方向 - 李飞飞指出当前AI缺乏空间智能(三维感知、推理、行动能力),下一阶段需从语言转向物理世界交互 [36][37][38] - Yann LeCun批评大语言模型范式局限,主张通过环境自学习(如婴儿观察试错)实现突破 [39][40][41] - 黄仁勋提出AI正从"工具"变为"工厂",能实时生成智能并接管工作流程,需数千亿美元投资支撑数万亿美元行业 [42][43] - 行业焦点从参数规模转向AI与人类协作方式、能力边界及集成位置 [45]