深度学习
搜索文档
工信部:鼓励工业互联网平台企业加快基于人工智能的低代码、无代码技术创新
第一财经· 2026-01-07 15:48
工信部印发工业互联网与人工智能融合赋能行动方案 - 工信部印发《工业互联网和人工智能融合赋能行动方案》,旨在推动工业互联网与人工智能技术深度融合 [1] 提高工业互联网平台智能化水平 - 基于深度学习、大模型等技术,强化工业互联网平台的要素连接、智能分析、资源配置等能力 [1] - 鼓励工业互联网平台企业加快基于人工智能的低代码、无代码技术创新,以提升工业APP开发效率和系统集成能力 [1] - 探索依托工业互联网平台打造“模型池”的路径,培育上线一批工业模型产品 [1] - 推动平台底层架构、数据协议与人工智能适配兼容,深化国产智能体标准协议创新应用 [1] 发展创新应用模式 - 发展“工业互联网平台+智能体”等创新模式 [1] - 打造一批面向典型场景的工业智能体应用,包括生产网络优化、人机交互、智能设备健康管理、产业链优化等 [1]
为四足放牧机器人装上“慧眼”
新浪财经· 2026-01-07 08:40
核心观点 - 中国农业科学院农业信息研究所成功研制出肉牛行为识别轻量化模型MASM—YOLO,该模型能快速精准识别肉牛六类典型行为,有效提升牛群饲养管理效率,并为四足放牧机器人的创制提供了关键技术支撑 [1] 技术研发与突破 - 研究团队面向天然草原野外自由放牧场景,在研发四足放牧机器人过程中,针对光照变化剧烈、背景环境复杂、牛只群体遮挡以及运动模糊等关键问题,研制了深度学习模型MASM-YOLO [1] - 该模型融合了多尺度特征提取、自适应检测与轻量化骨干网络等技术 [1] - 模型在识别精度与计算效率之间取得了最优协同 [1] 功能与应用 - MASM-YOLO模型实现了对肉牛站立、躺卧、吃草、饮水、回舔和吮吸等六类典型行为的快速识别 [1] - 该技术有效提升了疫病诊断、发情监测、产犊预警和健康评估等牛群饲养管理效率 [1] - 该技术的突破为四足机器人安装了“慧眼”,为全面创制放牧机器人提供了关键技术支撑 [1] 成果发布 - 相关研究成果近日发表在《农业计算机与电子》期刊上 [1]
开年收到了很多同学关于自驾方向选择的咨询......
自动驾驶之心· 2026-01-06 17:17
自动驾驶领域学术研究趋势与方向 - 行业观察到自动驾驶领域的研究方向呈现前沿与差异化并存的格局 前沿方向包括视觉语言模型、端到端自动驾驶、强化学习、3D高斯泼溅和世界模型[2] 相对竞争较少的赛道包括开集目标检测、占据网络以及小样本/零样本学习[2] - 针对不同专业背景的研究者 行业建议采用差异化的学习路径 计算机和自动化背景的研究者更适合深度学习相关的前沿方向 如视觉语言模型、端到端和世界模型 因其在职业和学术发展上空间广阔[2] 机械和车辆背景的研究者则建议从传统规划与控制、3D高斯泼溅等方向入手 这些方向对算力要求较低且更易入门[2] - 行业普遍认为 研究能力的提升依赖于持续的方法论训练 包括大量阅读论文、积极交流并逐步形成独立的思考和创意[2] 论文辅导服务覆盖的研究方向 - 公司提供的论文辅导服务覆盖了自动驾驶领域广泛的研究与技术方向[3] 核心感知方向包括端到端模型、视觉语言模型、3D目标检测、BEV感知、占据网络、语义分割、轨迹预测、单目感知以及车道线与在线高精地图构建[3] - 服务同时涵盖规划控制与前沿模型技术 具体包括运动规划、强化学习、扩散模型、流匹配[3] 在多模态融合与特定传感器领域 服务涉及多传感器融合、点云感知和毫米波雷达感知[3] - 其他支持的研究方向还包括3D高斯泼溅和多任务学习[3] 论文辅导服务内容与成果 - 公司提供的核心服务包括论文选题、论文全流程指导以及实验指导[6] - 服务延伸至博士申请指导领域[7] - 公司宣称其中稿率很高 并有大量论文被顶级会议和期刊收录 包括CVPR、AAAI、ECCV、CoRL、ICLR、IROS、ICRA、ACL等[7] 论文辅导服务的目标发表渠道 - 公司辅导的论文目标发表渠道涵盖自动驾驶领域的顶级会议 包括CCF-A、CCF-B、CCF-C等级别的会议[10] - 目标期刊包括SCI一区至四区 以及中科院分区的一区至四区期刊[10] - 服务也支持EI检索期刊、中文核心期刊的发表 并覆盖毕业设计论文、博士申请以及竞赛相关的论文需求[10]
英伟达想用AI接管游戏画面,还要让NPC“活”起来
21世纪经济报道· 2026-01-06 14:49
英伟达在CES上通过软件更新重塑游戏体验 - 公司未推出新款显卡,而是将游戏业务更新重点放在软件上,发布了DLSS 4.5技术并展示了生成式AI NPC技术ACE的最新进展 [1] AI主导游戏画质渲染 - 公司推出DLSS 4.5版本,引入了“动态多帧生成”技术和全新的6倍多帧生成模式 [2] - 该技术利用第二代Transformer模型,在每渲染一帧传统画面的基础上,最多可生成五帧额外画面,使得AI生成的像素量远超传统渲染,实质性地“接管”了最终游戏画面的呈现 [2] - DLSS 4.5预计于今年春季上线,支持所有RTX系列显卡,在最新的RTX 40和50系列上运行速度最快 [4] - 结合GeForce RTX 50系列显卡,该技术可在开启全景光线追踪的高负载场景下,实现超过240帧/秒的4K游戏画面体验 [4] - 目前已有超过250款游戏和应用支持DLSS 4技术,包括《007:初露锋芒》等新作将在发售时即支持 [4] 生成式AI改变游戏交互逻辑 - 公司扩展了ACE技术套件,旨在将脚本化NPC转变为具备感知、规划和行动能力的自主角色 [5] - 在与KRAFTON的合作演示中,展示了搭载“长期记忆”功能的《绝地求生》AI队友“PUBG Ally”,该AI能记住玩家过往战绩和互动,并在对话中提及此前事件 [5] - 该AI队友功能计划于今年上半年在《绝地求生》街机模式中进行限时测试 [5] - 在《全面战争:法老》中,AI顾问展示了根据即时战况和游戏数据库提供实时战术指导的能力 [5] - 针对算力成本与延迟担忧,公司采用基于RAG的技术架构,在玩家本地PC端建立向量数据库存储行为逻辑与对话历史,实现“本地检索+按需生成”,以降低云端成本并解决隐私和延迟问题 [5][6] 云游戏与创作者工具更新 - 旗下云游戏服务GeForce NOW将提供RTX 5080显卡级别的性能表现,并新增对Linux系统和亚马逊Fire TV Stick的原生支持 [8] - 针对内容创作者,公司发布了一系列基于RTX GPU的AI加速方案,包括通过PyTorch-CUDA优化和原生NVFP4/FP8精度支持,使图形界面工具ComfyUI中的视频和图像生成性能最高提升3倍,显存占用减少60% [8] - 公司宣布加速Llama.cpp等小语言模型的推理速度,提升幅度达35% [8] - 在AI生产力工具方面,公司特别提及对国产开源模型DeepSeek-R1的优化支持,称其推理表现优异,并已针对RTX显卡进行特定优化以实现极高的推理吞吐量 [8]
杨立昆谈从Meta离职的两大原因 透露全新模型架构
新浪财经· 2026-01-04 13:56
杨立昆离职Meta与创立新公司 - 杨立昆宣布离开Meta,日程因此变得极其紧凑 [1] - 法国总统马克龙通过WhatsApp联系杨立昆,对其新公司与法国保持紧密联系表示高兴 [1] - 杨立昆的新公司名为先进机器智能实验室,由法国医疗AI初创公司Nabla的联合创始人兼首席执行官亚历克斯·勒布伦领导,杨立昆本人将担任执行董事长而非CEO [2] 杨立昆的AI技术理念与研究方向 - 杨立昆对当前硅谷痴迷的大型语言模型持根本性质疑态度,认为其受限于语言载体,无法实现真正的超级智能 [2] - 为实现媲美人类的智能,杨立昆认为机器必须理解现实物理世界的运行规律 [2] - 他提出的解决方案是基于V-JEPA架构的“世界模型”,该模型不依赖语言文本,而是通过学习视频和空间数据来理解物理世界,并具备规划、推理和长效记忆能力,他将此智能形态命名为高级机器智能 [3] - 新模型架构利用视频数据帮助AI理解物理规律,以更精准预测事件,并依托“类情绪机制”指导预测过程 [12][24] - 杨立昆表示,该技术的“雏形版本”将在未来12个月内面世,更大规模应用将在几年内实现 [12] 杨立昆的职业生涯与成就 - 杨立昆与杰弗里・辛顿、约书亚·本吉奥共同为深度学习和现代AI奠定了基础,并于2018年获得图灵奖 [5][16] - 上世纪80年代末至90年代,他在AT&T贝尔实验室研发了卷积神经网络架构,该技术被广泛应用于图像识别,其基于该架构搭建的系统后被各大银行普遍用于支票读取 [5][17] - 2013年,马克・扎克伯格邀请杨立昆加入Facebook组建AI部门,杨立昆提出三个条件:保留纽约大学教职、无需迁居加州、研究成果必须公开,扎克伯格同意后,杨立昆牵头成立了Facebook人工智能研究院 [7][18] Meta内部AI战略变动与分歧 - ChatGPT的发布让Meta内部阵脚大乱,公司决定全力押注大型语言模型Llama的研发,并成立生成式AI部门以加快产品化 [8] - 杨立昆坚持Llama模型必须以开源形式发布,Llama 2的发布成为行业里程碑,使Meta被视为AI研究领域的“良心企业” [8] - 去年Meta进行AI战略调整,扎克伯格向生成式AI部门施压要求加快研发,导致沟通失灵,后续推出的Llama系列模型失败,2025年4月发布的Llama 4惨淡收场,团队被指控操控测试基准以粉饰性能 [9][20] - 扎克伯格对此大怒,生成式AI部门被彻底边缘化,许多人已离职或即将离职 [9][21] - 去年6月,Meta向数据标注初创企业Scale AI投资150亿美元,并聘请其28岁的CEO亚历山大・王执掌AI新投资项目及TBDLab研究机构 [10][21] - 杨立昆认为亚历山大・王“年纪尚轻”且“经验不足”,缺乏科研经验,并成为杨立昆的直属上司 [10][22] - 杨立昆离职主因是与Meta在技术路线上存在难以调和的立场困境,公司新招募的人员“满脑子都是大语言模型”,而他认为大语言模型是实现超级智能的“死胡同” [10][11][23] 新公司的发展前景与行业趋势 - 杨立昆在世界模型与自主智能体领域的研究已展现出在航空发动机和重工业等非Meta关注领域的应用潜力,并已找到愿意投资新一代AI技术的投资方 [11] - 他认为创办兼顾基础研究的初创企业是当下最具发展潜力的新赛道,并以OpenAI前CTO米拉・穆拉蒂创办的思维机器公司,以及OpenAI联合创始人伊利亚・萨茨凯弗创立的安全超级智能公司为例 [11][23]
MediaGo携手hipto连获两项国际大奖,深度学习赋能保险行业精准获客
搜狐财经· 2026-01-04 10:23
公司与产品成就 - 百度国际旗下全球智能广告平台MediaGo与法国销售线索生成专家hipto的合作案例,在法国权威数字营销奖项Les Cas d'Or中连续获奖,包括原生广告类别金奖和银行与保险领域获客类别铜奖[1][3] - 奖项的获得验证了MediaGo深度学习技术在复杂效果获客场景中的实际商业价值及其在欧洲数字营销市场的专业能力[3] 行业挑战与解决方案 - 保险行业面临线上行为信号分散、消费者决策路径复杂等挑战,对高价值细分人群的精细化投放和技术平台预测能力要求极高[3] - 为应对挑战,hipto引入了MediaGo全新升级的SmartBid 3.0智能出价产品,该产品依托五大深度学习模型,能在合规前提下对用户注意力、兴趣及转化意图进行实时全漏斗预测,提升投放效率与广告相关性[4] - 解决方案结合了全球优质媒体资源、hipto团队每周3–5次的高频创意迭代以及动态创意优化技术,以持续测试和个性化呈现广告内容,有效触达高潜力目标受众[4] 合作成果与数据表现 - 根据2025年3月至8月内部监测数据,启用SmartBid 3.0 MaxCV模式后,项目月度转化量同比提升32%,获客成本保持稳定[4] - 在移动端投放预算提升48%的情况下,获客成本不升反降2.6%,打破了“规模增长伴随成本上升”的行业瓶颈[4] - 原生广告渠道转化率提升2-3个百分点,整体转化规模实现3倍增长,展现出极具竞争力的投资回报率[4] 合作评价与未来展望 - hipto首席执行官Leo Hauet高度认可合作,认为MediaGo的海量媒体资源能显著提升流量规模,此项合作是持续创造高价值且具有高度战略意义的[5] - MediaGo合作拓展负责人Leo Ye将成功归因于MediaGo强大的AI技术能力与hipto团队在广告创意、文案及投放策略方面的深厚经验,双方建立了高度互信的合作关系[5] - hipto合作伙伴团队Tima Alsafi补充道,结合hipto的专业知识与MediaGo的资源、AI技术及数据分析能力,协同实现了高意向线索的规模化交付[6] - 此次获奖标志着MediaGo的技术实力与欧洲市场落地能力获得权威背书,公司将持续依托深度学习技术,携手行业领军者,通过智能出价产品与优质流量整合,提供更高效合规的数字营销解决方案,助力全球客户突破增长瓶颈[6]
2026,从这条Flag开始 | 红杉汇读者Flag大赏
红杉汇· 2026-01-04 08:06
个人发展 - 计划系统学习六大前沿科技领域,包括商业航天、脑机接口、人工智能、具身智能、量子技术、可控核聚变,每个领域至少完成1-2门专业课程并精读2-3本专业书籍,目标是建立对硬科技行业的底层逻辑理解及投资分析架构 [3] - 计划主动链接行业内优秀人才以拓展行业人脉,并通过交流获取一手行业洞见 [3] - 计划开通新的社交媒体账号,专门用于整理和输出在风险投资过程中的思考、体会与心得,实现“输入-输出”的闭环 [3] - 计划每月精读两本专业书籍并参加线上研讨会,以拓宽知识边界、提升竞争力并为职业晋升筑牢根基 [4] - 计划在事业上主动争取重要项目,发挥创新思维并带领团队攻克难题,争取实现业绩增长30% [4] - 希望锚定个人发展核心目标,深耕专业技能以提升职场竞争力,并主动拓展行业人脉以把握发展机遇 [5] - 希望多学习关于资本和创业的知识 [6] - 计划在2026年竞聘主管成功 [7] - 作为传统报业出身的媒体人,正在尝试开启短视频新闻事业,同时还在做纪录片并坚持长文字输出,希望新方向能有起色 [8] - 作为文创行业从业者,观察到2025年情绪价值成为珍稀资源,希望在2026年打造出类似Labubu的IP形象,以满足当代年轻人对精神消费的渴望 [9] 家庭规划 - 计划每周进行3次家庭运动日,例如带娃晨跑、跳绳或踢球,并挑战一次5公里的亲子马拉松 [12] - 计划戒掉“沙发土豆”模式,每天至少运动30分钟,并解锁如游泳或教孩子骑自行车等新技能 [12] - 计划用运动代替屏幕时间,在周末多进行家庭户外探险 [12] - 计划坚持早睡早起,每周抽三次时间运动,并多花时间陪伴家人 [12] - 希望每天至少有半小时完全属于家人的时间,并认真对待每一个家庭成员的生日和重要纪念日 [13] - 计划每周至少三天陪孩子睡前阅读,和伴侣每月有一次不带孩子的“咖啡时间”,并在年底整理一份“家庭年度小事记” [15] - 计划在结婚前专注经营原生家庭,包括每周至少两次和父母视频通话、每月策划一次家庭日,以及为父母建立健康档案并每年带他们体检 [16] 生活宣言 - 计划每周坚持三次晨跑并搭配健康饮食,目标是年底体检各项指标达标 [19] - 计划在运动健康方面实现半程马拉松跑进1小时50,全马跑进4小时 [19] - 计划实现卧推80kg做组 [20] - 计划学会潜水,到马来西亚仙本那·诗巴丹岛探索海底世界并用防水相机记录 [20] - 计划在内卷环境中尽可能活得超然洒脱,具体包括多花时间陪伴家人、读几本好书对抗碎片化阅读、少看手机多运动 [20] - 计划保证饮食清淡、每日睡满7小时,把时间用在个人身体健康和知识升级上 [21] - 计划每天花一小时读书 [22] - 计划每天有氧运动半小时,和三五朋友偶尔小聚,并读几本教育类、心理学书籍以做好宝宝的教育规划 [22] - 计划每天让AI帮忙完成一件工作上的事,并每周陪家人一起出行、做饭或散步一次 [24]
机器学习因子选股月报(2026年1月)-20251231
西南证券· 2025-12-31 10:04
量化模型与构建方式 1. **模型名称**:GAN_GRU模型[4][13] **模型构建思路**:利用生成式对抗网络(GAN)模型对量价时序特征进行增强处理,再利用门控循环单元(GRU)模型对处理后的时序特征进行编码,最终输出股票的未来收益预测值作为选股因子[4][13] **模型具体构建过程**: * **数据准备**:使用18个量价特征,包括日频特征(如前收盘价、开盘价、收盘价、最高价、最低价、成交量、成交金额、涨跌幅、振幅、换手率、均价)和月频特征(如月成交金额、月涨跌幅、月振幅、月换手率、月收盘最高价、月收盘最低价、月日均换手率)[17][19] * **特征采样**:对每只个股,取过去400天内的18个量价特征,每5个交易日进行一次采样,采样形状为40(天)* 18(特征),用以预测未来20个交易日的累计收益[18] * **数据处理**:每次采样的40天内,每个特征在时序上进行去极值和标准化处理;同时,每个特征在个股层面上进行截面标准化[18] * **GAN特征生成**: * **生成器(G)**:采用LSTM模型,输入原始量价时序特征(形状为(40, 18)),输出增强后的时序特征(形状仍为(40, 18))[33][37] * **判别器(D)**:采用CNN模型,用于区分真实量价特征与生成器生成的特征[33] * **对抗训练**:生成器与判别器交替训练。生成器的目标是让判别器无法区分其生成的特征与真实特征,其损失函数为: $$L_{G}\,=\,-\mathbb{E}_{z\sim P_{z}(z)}[\log(D(G(z)))]$$ 其中,\(z\) 表示随机噪声,\(G(z)\) 表示生成器生成的数据,\(D(G(z))\) 表示判别器判断生成数据为真实数据的概率[24][25] 判别器的目标是准确区分真实数据与生成数据,其损失函数为: $$L_{D}=-\mathbb{E}_{x\sim P_{d a t a}(x)}[\log\!D(x)]-\mathbb{E}_{z\sim P_{z}(z)}[\log(1-D(G(z)))]$$ 其中,\(x\) 表示真实数据,\(D(x)\) 表示判别器对真实数据的输出概率[27] * **GRU收益预测**:将GAN生成器输出的增强特征,输入到一个两层GRU网络(GRU(128, 128))中,后面再接一个多层感知机(MLP(256, 64, 64)),模型最终输出的预测收益(pRet)即为GAN_GRU因子[22] * **模型训练**:采用半年滚动训练方式,训练时间点为每年的6月30日及12月31日,使用过去数据训练模型并用于未来半年的预测[18] * **股票筛选**:选取全市场股票,剔除ST及上市不足半年的股票[18] **模型评价**:该模型结合了GAN的数据增强能力和GRU的时序建模能力,旨在挖掘更深层次的量价时序规律以预测股票收益[4][13] 量化因子与构建方式 1. **因子名称**:GAN_GRU因子[4][13] **因子构建思路**:GAN_GRU模型最终输出的股票未来收益预测值,直接作为选股因子使用[4][13][22] **因子具体构建过程**:如上述模型构建过程所述,经过GAN特征生成和GRU模型预测后,得到每只股票的未来收益预测值(pRet),即为因子值[22]。在因子测试前,会对该因子值进行行业和市值中性化处理,并进行标准化[22] 模型的回测效果 1. GAN_GRU模型(因子)[41][42] * IC均值:0.1119***[41][42] * ICIR(未年化):0.89[42] * 年化收益率:37.40%[42] * 年化波动率:23.39%[42] * 信息比率(IR):1.60[42] * 最大回撤率:27.29%[42] * 年化超额收益率:22.42%[41][42] * 换手率:0.83X[42] * 最新一期IC(截至2025年12月29日):0.0331***[41][42] * 近一年IC均值(截至2025年12月29日):0.0669***[41][42] 因子的回测效果 1. GAN_GRU因子[41][42] * IC均值:0.1119***[41][42] * ICIR(未年化):0.89[42] * 年化收益率:37.40%[42] * 年化波动率:23.39%[42] * 信息比率(IR):1.60[42] * 最大回撤率:27.29%[42] * 年化超额收益率:22.42%[41][42] * 换手率:0.83X[42] * 最新一期IC(截至2025年12月29日):0.0331***[41][42] * 近一年IC均值(截至2025年12月29日):0.0669***[41][42]
顶刊重磅!失明患者新希望!机器人自主视网膜静脉插管系统来了
机器人大讲堂· 2025-12-30 22:00
文章核心观点 - 约翰斯·霍普金斯大学团队在《Science Robotics》上发布了一项突破性成果,开发出基于深度学习的自主视网膜静脉插管系统,为治疗全球第二大致盲性视网膜血管疾病——视网膜静脉阻塞开辟了精准高效的新路径[1] - 该系统通过三个卷积神经网络协同工作,使机器人能自主完成超越人类生理极限的微米级手术操作,在离体猪眼实验中成功率高达90%,在模拟眼部运动下成功率仍达83%[1] - 该技术有望突破人类手部震颤等生理极限,简化手术流程,建立人机协同新范式,将高难度超精度手术转变为安全普惠的治疗方案,为数千万患者带来新希望[9][10] 技术突破与系统性能 - **操作精度与效率**:系统在平均直径仅151微米的血管上操作(比头发丝更细),而人类手部震颤幅度可达182微米[1]。在固定猪眼实验中,将针体导航时间从57.45秒缩短至30.56秒,穿刺及回撤时间从43.55秒压缩至9.08秒,整个手术流程耗时显著减少[2] - **动态补偿能力**:系统能够实时补偿因心跳、呼吸带来的眼部微小运动,在模拟呼吸运动的动态实验中通过光学流法计算位移并动态调整,保持了高成功率[2] - **核心深度学习网络**:系统依靠三个专门训练的卷积神经网络实现自主决策[5] - **方向预测网络**:基于ResNet18架构,引导机器人导航至目标血管,误差控制在11.33微米以内[5] - **接触检测网络**:采用YOLOv8分类模型,通过分析iOCT图像判断针尖是否接触血管外壁,检测准确率高达98.7%[5] - **穿刺确认网络**:同样基于YOLOv8进行目标检测,判断成功穿刺进入血管的平均精度达到97.6%[5] - **硬件协同设计**:采用双机器人协同作业,主机器人操控直径仅100微米的倾斜弯曲金属针,辅助机器人握持医用刮匙协助血管扩张,集成iOCT手术显微镜提供实时二维及高分辨率三维图像[5] - **环境适应性与操作细节**:深度学习网络在存在气泡、视网膜脱离等干扰下仍能准确识别目标血管[6]。操作中,当确认针尖触碰血管后,机器人会将穿刺速度从0.2毫米/秒瞬间提升至5.4毫米/秒以确保一次性穿透[7] 行业影响与未来展望 - **突破人类生理极限**:机器人系统完全消除了手部震颤影响,将操作误差控制在微米级别,解决了手动手术“差之毫厘,谬以千里”的痛点,大幅降低手术风险[9] - **简化手术流程与推广潜力**:自主化操作减少了对医生经验的依赖,标准化流程便于推广,即使缺乏相关临床经验的操作者也能借助系统完成高精度手术,有望让更多医院具备开展此类手术的能力[9] - **建立人机协同新范式**:系统并非完全取代医生,而是让医生从繁琐的精准操作中解放,专注于目标选择、手术监控等关键决策,实现“机器干精细活,人类做决策”的分工[9] - **未来研发方向**:下一步将提升系统的动态补偿能力,通过实时分割网络追踪血管位置实现更精准调整,同时优化穿刺策略以降低对视网膜的潜在损伤[10]。团队计划在活体动物模型中测试安全性和有效性,以推进临床转化[10] - **技术开源与更广阔应用**:研究团队已将手术系统开源共享,相关数据和代码可通过公开渠道获取,以加速全球科研合作[10]。在AI与机器人技术驱动下,未来的机器人将具备个性化适应与超快动态响应能力,不仅有望攻克视网膜静脉阻塞,也可能为青光眼等更多眼疾带来革命性疗法[10]
吴晓波:“AI闪耀中国”2025(年度演讲全文)
AI前线· 2025-12-29 17:41
文章核心观点 - 人工智能革命是一场事关国运的世纪大竞赛,中美两国是主要的决赛选手,正走上不同的发展道路 [8][60] - 2025年是“智能体(Agent)元年”,AI正从辅助工具演变为具备任务执行能力的“数字分身”,将迎来生产关系重构和“超级个体”的崛起 [6] - 中国正凭借其独特的场景优势、供应链能力和庞大的应用市场,试图定义属于自己的“工业5.0” [5][155] AI发展历程与现状 - 人工智能概念于1956年达特茅斯会议上提出,历经70年发展,在2022年11月30日GPT-3.5上线后迎来爆发,其月活用户在两个月后超过一亿 [17][23] - 2025年1月15日,由幻方量化开发的DeepSeek产品出现,其一个月下载量突破一亿,标志着AI真正开始改变生活 [30][32] - 2025年AI发展的两个关键词是“涌现”(能力指数级跳跃)和“泛化”(技术向多学科、多产业、从企业到个人广泛渗透) [34][35] 中美AI竞赛格局 - **算力对比**:2025年美国AI基建投资超过3500亿美元,预测到2030年累计投资达3-4万亿美元;中国2025年AI基建投资为6300亿人民币,预测到2030年累计投资超10万亿人民币 [47] - **算力分布**:全球算力美国占74.5%,中国占14%,美国是中国的5.3倍;超大规模数据中心数量美国是中国的4倍 [49] - **大模型生态**:中美两国大模型数量合计占全球80%以上;在图像生成、编辑、文生视频、文本能力等领域,中国模型已进入全球前列 [52][55][56][57][58] - **发展路径**:美国聚焦AI芯片、大规模基建和闭源大模型的从0到1创新;中国则利用其制造能力、应用市场和开源大模型,进行从1到N的应用拓展 [61] 多模态内容生产革命 - AI工具如阿里的“千问APP”极大降低了内容创作门槛,使非专业人士也能轻松生成电商图、宣传视频等 [69][70] - **AI漫剧行业**:2025年中国AI漫剧产量同比增长超600%,流水规模增长12倍,制作周期从90天缩短至10-15天,成本下降60-90% [73] - 动作捕捉等技术(如“动见万物”团队)可实现实时数字人模仿,为文化娱乐产业带来变革 [76] - 多模态技术进化可能使硅基人类的内容生产能力达到碳基人类的100倍以上,促使个人“能力”需要被重新定义 [78] 行业大模型的应用实践 - **金融业**:上海银行通过AI改造,成为全球第一家AI原生手机银行,服务其500多万老年客户 [80] - **大宗商品贸易**:厦门国贸构建“铁矿石智慧决策链”,对铁矿石未来价格走势的预测准确率达到65% [86] - **家装行业**:“飞流AI”小程序可智能匹配全国90%以上的存量户型,通过对话生成效果图与报价,并在43个城市提供服务 [95][96] - **基础设施支持**:百度智能云作为重要基础设施商,其AI公有云市场份额连续六年第一,服务65%的央企及大量行业客户,支持企业建立行业大模型 [90] 智能体(Agent)的崛起 - 2025年智能体已深入应用,例如在飞书平台上有超过5万名“效率先锋”使用智能体提升组织效率 [100] - **硬件集成**:联想推出了全球第一款AI PC和“天禧个人超级智能体”,通过“端-边-云-网-智”架构整合分散的智能体,管理个人知识库并保护隐私 [102][103][104] - **前沿探索**:上海一家10人创业公司尝试打造了全球第一个真人仿生“类脑智能体”(吴晓波Agent),具备200多种表情和内容回应能力,尽管现场演示失败,但代表了技术进步 [107][109] - **风险思考**:AI先驱杰弗里·辛顿警告,数字智能的知识共享效率远超人类,若AI拥有独立子目标且缺乏有效管控,可能威胁人类生存 [111] 具身智能机器人产业 - 这是一个极其年轻的产业,调研的30家重要企业中,三分之二(20家)成立于最近三年内;创始人以80后、90后为主,多有博士(20人)或教授背景 [115][116] - **应用落地**:机器人已在多个场景应用,如优必选搬运机器人(效率相当于工人的40%)、云深处巡检机器人、银河通用前置仓机器人、千寻智能拧螺丝机器人、跨维咖啡机器人等 [121] - **供应链优势**:中国占据了具身智能机器人全球供应链的63% [122] - **市场预测**:具身智能机器人被预言将成为中国未来十年四个十万亿级市场之一(另外三个是汽车、房地产、养老产业) [124] - **产品创新**:荣耀发布了全球第一款“手机机器人”ROBOT PHONE,具备可自动调整的云台摄像头 [128][130] 智能工厂与工业5.0 - **工厂智能化案例**: - 海信黄岛空调“灯塔工厂”应用了70多项人工智能,在焊接等环节使用数字孪生和技能大模型进行培训,将培训出师时间大幅缩短 [136] - 双鹿电池建成了全球第一条碱性电池黑灯生产线和AI质检系统,其电池AI配方工艺大模型将研发新SKU的时间从一个月缩短至30分钟 [139] - 东鹏瓷砖工厂通过大模型控制生产各环节,其永川工厂2026年生产的瓷砖符合新5A国标的比例将高达65% [141][142][145] - 海天酱油“灯塔工厂”应用AI进行黄豆筛选(年筛选2.5万亿颗)、智能发酵、光谱全检和“电子鼻”风味识别(识别170多种香型) [148][149] - **打破“不可能三角”**:人工智能帮助中国制造业同时实现了规模化、定制化和低成本,打破了工业革命两百多年的定律 [153] - **定义工业5.0**:中国凭借全球最多的“灯塔工厂”(203座中占85座,占比42%),正在定义以机器视觉、深度学习、大模型、智能体、具身智能和全流程AI管理为特征的工业5.0 [155][157] - **产业机会**:人工智能为600万家中国工厂提供了提高效率、降低成本、锻炼员工的机会 [160] AI电商与服务业变革 - **电商痛点与变革**:当前电商存在高额外卖成本(如一份30元干炒牛河成本达17元)、平台抽成高、女装退货率高达70%等问题,AI有望推动“流量平权” [168] - **创业新工具**: - 1688的“遨虾Agent”可帮助创业小白进行跨境电商市场分析、找供应商、生成宣传素材 [169][171] - “1688AI版”APP和分销工作台可帮助用户一键开店,兼职运营每月或可赚3000元 [172] - **服务体验升级**: - 阿里“千问APP”上线23天月活突破3000万,接入高德地图后可实现从需求咨询到路线规划的一站式服务 [177][178] - 传统服务业如美容院通过AI摄像采集仪提供专业皮肤分析;餐厅使用AI巡检系统;儿童照相馆通过3D打印玩偶提高客单价和毛利 [189][190] - **专业服务AI化**:如“海纳”AI筛选简历、“特赞”做市场调查、“凌迪”提供AI服装设计、“全诊通”服务1.5万家诊所,紫荆AI医院中AI医生接诊1万病例即可相当于十年经验医生 [192][193]