Workflow
深度学习
icon
搜索文档
远洋鱿钓渔情预报系统“苍鹭”发布
中国自然资源报· 2025-11-10 11:43
系统上线与合作模式 - "苍鹭"AI鱿鱼渔情预报系统于11月5日正式上线,由上海海洋大学、中水集团远洋股份有限公司、中水集团舟山远洋渔业有限公司共同研发 [1] - 合作模式为企业提出需求,大学进行针对性科研攻关,使科研成果直接应用于生产实践 [2] 系统功能与技术特点 - 系统可为全球大洋性鱿鱼作业海域提供未来5天精准渔场预测及下一年度资源丰度预报,填补国内远洋鱿钓渔业智能预报领域空白 [1] - 系统融合人工智能、大数据挖掘、深度学习技术,结合生物学、生态学、渔场学知识,实现鱿鱼中心渔场精准预报与中长期资源量预测 [1] - 系统具备多端覆盖能力,网页端、船载端、手机端适配全场景,可随时获取近20个与安全高效生产相关的海洋要素 [1] - 系统自带船位监控、越界预警功能,能避免海域纠纷,并以"一张图"形式每日定时自动发布作业海域环境、船位、渔情预报信息 [1] 应用成效与产量提升 - 系统已在中水集团舟山远洋渔业有限公司北太平洋鱿钓渔船应用 [2] - 截至2025年10月底,2025年单船产量可达500吨左右,与历史产量每年330多吨相比,提高了48% [2] - 通过渔情预报系统应用,首次将北太平洋西经海域鱿钓作业渔汛延长到11月 [2]
研判2025!中国文本转语音技术行业发展历程、产业链、发展现状、竞争格局及趋势分析:作为人机交互的重要组成部分,行业应用需求不断扩大[图]
产业信息网· 2025-11-10 08:59
文章核心观点 - 文本转语音技术作为人机交互的关键基础设施,正随着人工智能和深度学习技术的发展而快速演进,其应用从传统领域扩展至虚拟主播、个性化语音定制等新兴场景,行业市场规模在2024年达到187.6亿元人民币,同比增长22.77% [1][4][11] - 行业呈现“国际技术引领,国内场景深耕”的竞争格局,未来发展趋势将聚焦于拟人化与长场景适配、多模态融合以及行业规范化发展 [11][14][15][16] 文本转语音技术行业相关概述 - 文本转语音技术是一种将文字内容转换为语音输出的技术,其核心价值在于打破信息传递的媒介限制,已成为人机交互领域的基础设施,广泛应用于智能客服、有声读物、车载导航及无障碍设备等场景 [4] - 技术工作原理主要包括文本预处理、语音合成和语音输出三个部分,通过算法和大量语音数据训练生成自然流畅的语音信号 [5] - 技术发展经历了从18世纪机械式合成到20世纪80年代后的拼接合成,再到2016年至今深度学习驱动的端到端系统的革命性演进 [6][7] 文本转语音技术行业产业链 - 产业链上游为核心硬件、算法框架与基础设施支持,中游是技术核心环节,下游应用领域涵盖教育、金融、医疗、媒体等 [8] - 在教育领域,技术应用于在线课程语音播报、辅助阅读工具等,属于智慧教育范畴,其市场规模从2015年的1864亿元增长至2024年的4176亿元 [8] - 在网络视听领域,技术用于内容制作的语音解说生成,2024年中国网络视听用户规模达10.91亿人,同比增长1.58% [9] 文本转语音技术行业发展现状 - 2024年中国文本转语音技术行业市场规模为187.6亿元人民币,同比增长22.77% [1][11] - 现代技术已从机械模拟演进为能生成接近人类水平自然度的智能系统,在传统及新兴应用场景中展现出巨大潜力 [1][11] 文本转语音技术行业竞争格局 - 行业格局为“国际技术引领,国内场景深耕”,国际企业如Google、微软占据高端市场,国内企业如科大讯飞、百度、云知声等在中文及垂直应用场景具备优势 [11] - 未来竞争将围绕边缘计算部署、多模态交互及伦理安全技术展开 [11] 重点企业分析 - 科大讯飞股份有限公司是智能语音和人工智能上市企业,以语音合成技术为起点,2025年1-9月营业收入为169.89亿元,同比增长14.41%,归母净利润亏损0.67亿元,亏损幅度同比收窄80.60% [12] - 云知声智能科技股份有限公司是专注于物联网人工智能服务的企业,2025年上半年营业收入为4.05亿元,同比增长20.2%,归母净利润亏损2.97亿元 [12] 文本转语音技术行业发展趋势 - 技术将向拟人化与长场景适配发展,聚焦情感化表达和长时音频合成能力,例如实现90分钟连续音频生成与多角色自然对话 [14] - 多模态融合成为核心发展路径,与文本、图像、视频生成等技术协同,构建全链路内容生产生态 [15] - 行业将向规范化发展,政策监管加强,核心关注数据隐私与声音版权保护,通过区块链等技术实现声音资产确权与追溯 [16]
“我不想一辈子只做PyTorch!”PyTorch之父闪电离职,AI 圈进入接班时刻
AI前线· 2025-11-08 13:33
PyTorch创始人离职事件 - PyTorch创始人Soumith Chintala宣布将于11月17日卸任框架负责人并离开就职11年的Meta[2] - 他在Meta的11年职业生涯中仅用8年就从软件工程师晋升至副总裁[4][5] - 离职原因为不希望像Guido或Linus那样被单一项目绑定数十年[2] PyTorch的市场地位与影响力 - PyTorch在人工智能领域有90%以上的应用率[2][7] - 该框架支撑百亿亿级算力的AI训练任务并为几乎所有主流AI公司所采用[2][9] - 从MIT课堂到印度乡村教室都被广泛学习使用[9][16] PyTorch发展历程 - PyTorch初始版本于2016年9月创建2017年在GitHub开源起源于基于Lua的Torch项目[12][13] - 关键发展节点包括与贾扬清主导的Caffe2合并以换取更稳定资金支持[14] - 通过每天手动阅读500多条用户反馈形成用户共创的开发模式[16] Meta AI部门组织变动 - Meta AI进行大裁员在"超级智能实验室"内裁减约600个岗位涉及FAIR研究部门和AI基础设施团队[4] - 首席AI官Alexandr Wang上任后FAIR部门自由度受限Yann LeCun也可能考虑辞职[4] - 裁员目的是减少决策沟通让员工承担更多责任[4] 行业评价与个人规划 - Andrej Karpathy评价PyTorch在20维设计空间中踩中时代最佳组合[19] - Yann LeCun对Chintala表示祝福肯定其早期FAIR建设的贡献[20] - Chintala计划从头开始做小事探索Meta之外的可能性[20][21] 技术架构特点 - PyTorch以更开放治理更迅捷社区响应和易用动态图模型获得研究者青睐[15] - 如果重写会选择更多Python和Triton替代C++内核进行更激进设计[16] - 当前许多用户通过Hugging Face等打包功能使用PyTorch而不自知[16]
AI六巨头同台:AGI,不再是“未来”的事了
36氪· 2025-11-08 09:43
文章核心观点 - 六位AI领域先驱一致认为通用人工智能(AGI)的发展范式正在转变,AGI不再是遥远概念,而是已开始在实际中发挥作用 [1] - 尽管对AGI实现路径和时间线存在分歧,但共识是AI正从语言能力向行动能力演进,从被动响应转向主动执行 [44][45] - AGI是四十年技术积累的结果,而非突变,其发展涉及算法、数据、计算架构和工程化的共同演进 [20] AI发展历史与关键驱动因素 - 今天的AGI是四十年逐步演化的结果,关键驱动因素包括算法突破、数据积累和计算架构创新 [2][20] - Geoffrey Hinton在1984年通过微型语言模型(100个训练样本)预测下一个词,奠定了大型语言模型的原型 [4][5] - Bill Dally在90年代末提出流处理架构解决内存墙问题,后演变为GPU计算;2010年与吴恩达的早餐会谈促使NVIDIA转向深度学习专用GPU设计 [7][8][9] - 李飞飞在2006-2007年创建ImageNet(1500万张图片、2.2万个类别),证明大数据是机器学习的核心基础 [11][12][13] - Yann LeCun自1983年起主张自组织学习,认为智能核心是自我组织而非指令,当前大语言模型训练方式已回归自监督学习 [14][15][16] - 黄仁勋将芯片设计逻辑与深度学习系统开发类比,推动AI从理论走向工程化,实现多GPU、多数据中心的规模化运行 [17][18][19] 对AGI实现时间与路径的分歧 - Yann LeCun认为AGI是渐进过程,未来5-10年或有重大进展,但不会出现奇点时刻 [22][23][24] - 李飞飞指出机器已在特定领域超越人类(如识别2.2万个物体、翻译100种语言),但进化方向未必是人类化 [25][26] - 黄仁勋强调AGI级智能已投入实际应用(如写代码、看病、财务),未来几年将转化为大量社会有用工具 [27][28] - Geoffrey Hinton预测20年内机器能在辩论中战胜人类 [29] - Bill Dally质疑"超越人类"的命题,主张AI应增强人类而非替代,聚焦互补性能力 [30] - Yoshua Bengio认为若规划能力保持指数增长,5年内AI可达工程师水平,且AI自研AI可能催生突破 [31] 智能演进的下阶段方向 - 李飞飞指出当前AI缺乏空间智能(三维感知、推理、行动能力),下一阶段需从语言转向物理世界交互 [36][37][38] - Yann LeCun批评大语言模型范式局限,主张通过环境自学习(如婴儿观察试错)实现突破 [39][40][41] - 黄仁勋提出AI正从"工具"变为"工厂",能实时生成智能并接管工作流程,需数千亿美元投资支撑数万亿美元行业 [42][43] - 行业焦点从参数规模转向AI与人类协作方式、能力边界及集成位置 [45]
一文读懂人工智能在供应链领域的典型应用
36氪· 2025-11-07 14:31
人工智能术语框架 - 人工智能是一个广泛领域,专注于创造能执行需要类似人类智能任务的机器,如学习、推理或决策[4] - 机器学习是人工智能的一个分支,使计算机无需显式编程即可从数据中学习,能够识别模式并基于历史信息做出预测[4] - 深度学习是更高级的机器学习形式,使用多层人工神经网络,擅长处理复杂的高维数据,如图像、视频和自然语言[4] - 生成式人工智能旨在根据从大型数据集中学习到的模式创建新内容,包括文本、图像、音频甚至代码[4] 人工智能的商业重要性 - 人工智能正以前所未有的速度被广泛应用,因其直接关联企业的效率、盈利能力和竞争力,公司正积极将其融入日常运营以实现大规模快速决策[6] - 人工智能的真正影响力在于能够将预测转化为自动行动,如触发警报、推荐补货数量、优先选择配送路线或在供应风险演变成中断之前发出预警[6] - 人工智能在数据量庞大、决策可重复、信号嘈杂或快速变化的环境中尤其强大,非常适合市场营销和供应链运营[6] - 最有效的人工智能系统是在人工监督下运行的决策系统,旨在增强而非取代判断,需使用MAPE、MAE等传统统计精度指标进行持续评估[6] 人工智能在市场营销中的应用 - 个性化功能利用机器学习技术根据用户过去的行为定制内容,分析点击、购买记录、滚动模式和会话行为等信号以确定最可能促成转化的信息或产品[12] - 视觉推荐无需用户明确要求即可优化显示内容,利用余弦相似度等方法将用户与相似内容进行匹配,应用于亚马逊的产品轮播和Netflix的推荐板块[12] - 由生成式人工智能驱动的聊天机器人已成为标准客户触点,可回答问题、推荐后续步骤并全天候完成交易,必要时转接人工客服[12] - 预测分析利用机器学习模型在客户流失或营销活动效果等结果发生之前进行预测,通过比较线性回归和XGBoost等模型确定预测销售结果的最佳模型[12] 市场营销与供应链的协同 - 营销活动会引发需求冲击,成功的广告宣传、促销或产品发布可立即刺激需求,人工智能应帮助预测需求并自动标记其对供应链的影响[15] - 将市场营销和供应链联系起来的是共享数据,双方必须在SKU标识符、地理区域、销售渠道、日历和促销元数据方面保持一致[15] - 市场营销关注点击率和订单量,供应链关注订单满足率和准时足量交付率,当两者对绩效的看法不一致时会导致客户不满和运营效率低下[15] - 供应链漏斗是销售漏斗的运作镜像,始于市场营销活动产生的需求信号,经供应计划、生产或采购、物流配送,最终到达客户服务和交付绩效[16] 现代供应链挑战及人工智能应用场景 - 现代供应链面临复杂性、不确定性、速度和可持续发展四项普遍挑战,复杂性源于管理多层级网络、漫长交付周期及日益增多的限制因素[19] - 不确定性由促销需求激增、天气干扰、季节性变化及牛鞭效应等因素造成,需求的微小变化会在上游被放大[19] - 企业越来越依赖人工智能来更准确地预测需求并在问题发生之前采取积极主动措施,人工智能在预测和需求规划中发挥关键作用[19] 人工智能在预测和需求规划中的应用 - 现代人工智能预测模型通常将ARIMA或ETS等时间序列方法与XGBoost或神经网络等机器学习技术相结合,时间序列模型分析历史需求数据检测季节性和周期性模式[22] - 为评估模型可靠性,需使用平均绝对百分比误差以百分比形式衡量预测值与实际值的偏差,平均绝对误差以数据本身相同单位表示平均预测误差[22] - 偏差衡量预测是否持续高估或低估需求,长期高估导致库存过剩,低估导致缺货,F1分数在预测客户流失等事件时平衡精确率和召回率[22] - 企业通常先进行更高层次预测如全国总需求,再细化到特定地区、渠道或SKU,人工智能能够随新数据流入实时更新预测结果[23] 人工智能在库存优化中的应用 - 人工智能可根据产品重要性、周转率或利润贡献对其进行分类,自动确定合适的服务水平目标,并根据预测误差和交货周期波动计算安全库存[26] - 通过多级优化降低系统总库存,人工智能评估整个网络找出存放库存最佳位置,这种系统级视角可降低整体库存成本同时提高服务一致性[26] - 人工智能可根据最新需求数据、供应状况和绩效结果每周甚至每天自动更新补货点和订货量,消除人工库存盘点的滞后性和猜测性[26] - 人工智能模型可模拟不同场景,确定库存持有成本与缺货风险之间的理想平衡点,使领导者能够充分了解财务影响后再做决策[26] 人工智能在物流和运输领域的应用 - 具有时间窗口和实时重新规划功能的路径规划意味着人工智能可根据交付时间承诺不断解决车辆路径问题,并在途中出现交通、天气或新订单时立即重新优化路线[29] - 预计到达时间预测利用人工智能结合实时交通状况和历史驾驶员表现,比依赖通用估计更准确地预测到达时间[29] - 预测性维护可监控车队和物料搬运设备,在故障发生之前检测到故障,减少停机时间并防止意外故障[29] - 码头动态调度功能使人工智能能够根据当前拥堵情况、货运量和紧急程度,自动将卡车分配到最有效的装卸位置以保持作业顺利进行[29] 人工智能在供应商和风险管理中的应用 - 供应商评分卡使人工智能能够追踪多个供应商的准时交付率、百万分之质量缺陷率和交货周期差异,持续评估数据并自动标记问题[33] - 预警系统利用人工智能技术监测新闻、天气预报、港口活动和地缘政治数据,在潜在干扰影响运营之前发现并应对,使企业能够提前制定备选方案[33] - 自然语言处理可以读取供应商合同,提取重要条款如交货周期、违约金条款或排他性限制,并提醒决策者当前绩效是否偏离约定范围[33] 人工智能在仓储和自动化领域的应用 - 计算机视觉利用摄像头和人工智能技术实时检测错拣商品、损坏商品或库存数量错误,在商品到达顾客手中之前减少错误,比人工盘点有显著进步[37] - 任务编排通过根据当前需求和可用产能自动协调人类工人和自主机器人,来确定谁应该做什么以及何时做[37] - 任务优化通过分配优先级、管理队列以及优化任务在设施内的执行地点来改善工作流程,仿真软件可利用机器学习模拟不同优化方案[37] - 货位优化根据ABC周转率对库存进行排序,人工智能将周转率最高的商品放置在靠近包装或装货区的位置,以减少运输时间并提高吞吐量[37] 人工智能在可持续发展和ESG中的应用 - 按发货或SKU进行碳核算可以让人工智能计算每次产品运输对环境的影响,并在做出决策之前评估减少燃料排放的替代路线[40] - 减少浪费利用人工智能对退货进行分类,优先考虑哪些产品可以重新入库、回收或翻新,还可根据保质期预测重新订购易腐烂商品[40] - 循环流程使人工智能能够推荐维修、翻新或再利用方案,而不是默认丢弃,有助于向循环供应链转型使产品重新循环利用[40] 机器学习技术分类 - 监督学习在预期结果已知时使用,人工智能通过对已标记示例进行训练并学习预测未来值,常用于需求预测、预计到达时间预测和质量评分[44] - 无监督学习不需要预先标记结果,人工智能自行寻找数据中的结构,如将相似门店或SKU聚类在一起或检测设备传感器数据中的异常情况[44] - 强化学习通过反复试错做出决策,并随时间从行动结果中学习,在不确定性较高环境中如动态定价或调整库存策略时尤其有用[44] 机器学习模型演进 - 线性回归是应用最广泛、最基础的机器学习模型之一,根据过去行为预测未来结果,速度快、易于解释,广泛应用于高管仪表盘和财务建模[47] - 决策树根据简单决策规则将数据划分为多个分支,具有很强的可解释性,适用于预测和表格形式的业务数据[50] - XGBoost是一种先进集成方法,构建多个小型决策树并将它们组合提高准确率,擅长处理结构化供应链和营销数据中多种输入因素的交互作用[50] - 神经网络在识别复杂模式方面非常强大,适用于非结构化数据或基于传感器的数据,如图像、音频或实时物联网数据流[50] 大型语言模型与迁移学习 - 大型语言模型利用海量公共文本数据进行训练,学习人类语言结构和含义,能够理解并回应从未见过的句子,具有泛化能力[56] - 迁移学习利用规模较小、特定于业务的数据集对预训练的语言学习模型进行微调,使人工智能在保留广泛语言理解能力的同时针对特定领域进行专门化训练[56] - 检索增强生成技术使人工智能不仅依赖于训练期间学到的知识,还会主动从可信来源实时检索外部知识后再生成响应[59] 人工智能统一视角与新兴趋势 - 分层模型中,营销需求信号如点击率、营销活动效果、网站流量和预购意向被实时捕捉为意向信号,输入到人工智能需求预测层[63] - 数字孪生是真实供应链的虚拟副本,可模拟港口关闭、供应商延迟或需求激增等中断情况,在实际发生任何事件之前测试应对措施[66] - 生成式人工智能智能体能够更主动地进行规划工作,如总结风险、制定采购建议,并根据运营数据创建标准操作流程,自主运行监控实时数据[66] - 大型语言模型副驾驶允许规划人员以对话方式与供应链系统进行交互,获得清晰易懂且基于公司内部数据的答案[67]
ICML 2026新规「避坑」指南:参会非必须、原稿将公开、互审设上限
机器之心· 2025-11-06 13:28
ICML 2026 会议基本信息 - 会议将于2026年7月7日至12日在韩国首尔举办 [4] - 所有论文将采用双盲审稿机制 [4] - 最终被录用的论文将在大会上进行展示 [4] 论文提交格式与页数要求 - 投稿须以单个文件形式提交 [4] - 正文部分最多8页 [5] - 参考文献、影响声明和附录部分页数不限 [5] - 论文被录用后,作者可在最终版本中为正文部分额外增加1页 [6] - 补充材料不再设单独提交截止日期 [6] 重要政策变更 - 论文被接收后,作者可选择是否亲自到会现场进行报告,或仅将论文收录至会议论文集 [7] - 无论作者选择哪种方式,所有被录用的论文在论文集中的待遇完全相同,均有资格参与奖项评选 [8] - 对于仅选择论文收录的论文,应至少有一位作者完成线上注册 [9] - 除定稿版本外,大会还将公开论文的原始投稿版本 [10] - 被拒稿的论文作者也可选择是否公开其原始投稿版本、评审意见等相关记录 [10] 投稿重要日期 - 提交网站开放日期:2026年1月8日 [14] - 摘要提交截止日期:2026年1月23日 [14] - 全文提交截止日期:2026年1月28日 [14] - 摘要和论文提交截止日期为严格截止,不会有任何形式的延期 [15] 作者与互审要求 - 所有提交必须至少有一位作者同意担任审稿人 [17] - 一位作者最多只能在其本人的2篇提交中被指定为互审审稿人 [17] - 若某作者有4篇或以上投稿,则必须担任评审员 [17] - 若评审员短缺,此门槛可降低为3篇 [17] - 未满足互评要求或草率完成评审的投稿可能会被直接拒稿 [17] 评审与伦理规范 - 禁止双重或并行投稿 [18] - 允许使用生成式AI辅助写作或研究,但作者须对内容负全部责任,且LLM不能署名为作者 [21] - 禁止任何形式的提示注入,违者直接拒稿 [21] - 禁止抄袭、禁止在评审期间宣传正在投稿至ICML、禁止与评审员等串通 [21][22] 论文内容附加要求 - 每篇论文须附带潜在社会影响说明,置于论文末尾独立部分 [23] - 被接收论文作者需提交简明易懂的通俗摘要 [24] - 多篇投稿的作者可自愿对其论文进行质量排序 [25] 征稿主题范围 - 征稿主题涵盖通用机器学习、深度学习、机器学习理论、优化、强化学习、可信机器学习及应用驱动型机器学习等多个领域 [14]
奥特曼和纳德拉,艰难重组后首次对谈:「我们是天作之合」
36氪· 2025-11-03 08:23
微软与OpenAI合作关系 - 双方庆祝达成一项里程碑式的深度合作协议,旨在重塑AI未来 [3] - 合作关系始于2019年微软对OpenAI的10亿美元投资和Azure云计算资源支持 [5] - 微软首席执行官纳德拉慧眼识珠,看到了自然语言处理技术的新曙光 [7] OpenAI公司重组与治理结构 - OpenAI完成重组,在非营利基金会下设立OpenAI集团公共利益公司作为营利实体 [8] - 非营利的OpenAI基金会持有价值高达1300亿美元的OpenAI股份,成为全球最大慈善基金之一 [10] - 基金会将首批动用250亿美元资金投向医疗健康和AI安全韧性两个领域 [10] 微软的投资与战略回报 - 微软目前持有OpenAI约32.5%的股份,价值约1350亿美元 [15] - 双方关系已成长为业界最成功的合作伙伴关系之一 [17] - OpenAI创始人希望微软能从这笔投资中赚到一万亿美元 [18] 产品与市场独家安排 - OpenAI最强大的通用人工智能模型API将在未来七年内独家部署在微软Azure云平台上 [19] - 此项独家安排将持续到2032年,除非OpenAI率先实现AGI [19] - 该策略使Azure成为AI开发者的“圣地”,直接推动微软云服务业务腾飞 [20] 财务业绩与增长前景 - 微软2025财年第一季度智能云部门收入同比大涨27%,Azure增速远超主要竞争对手 [20] - 微软商用云业务手握3920亿美元的未完成订单,同比增长51% [20] - 其中包括OpenAI与微软签下的2500亿美元Azure预购合同 [20] 算力供应与需求瓶颈 - 双方均表示面临严重的算力短缺问题,限制了业务增长 [24][25] - 微软上季度资本开支高达349亿美元,较前一季度猛增40%,主要用于数据中心和AI芯片 [26] - 未来两三年内AI算力仍将严重紧俏,出现“算力过剩”的概率几乎为零 [28][29] AI对软件行业的范式影响 - AI正在重塑软件形态,从App转向Agent,能理解自然语言指令并执行任务 [34] - 传统商业软件可能被多才多艺的AI助手重构,微软主动为Office注入AI推出Copilot [36] - 在消费互联网领域,AI对话式交互对传统搜索的流量和广告曝光构成分流风险 [37] AI驱动的生产力提升 - AI将开启生产力爆发,微软过去一年几乎零净增员工数,却实现营收两位数增长 [44][46] - 员工借助内部Copilot大幅提高效率,公司通过网络运维自动化替代了大量人力需求 [47][48] - 经过适应期,企业将迎来既增收又节支的局面,推动宏观经济劳动生产率和GDP增速提升 [51][52] AI对美国制造业的影响 - AI需求正吸引资本重新投入制造业和基建领域,为传统工业中心注入新活力 [55][57] - 微软在威斯康星州豪掷73亿美元兴建全球最大数据中心园区,带动本地就业和投资 [56] - 美国的云计算龙头公司在全球输出技术,帮助各国建设数字基础设施,占据产业制高点 [59] 合作关系的战略意义 - 合作结合了OpenAI的创新激情与微软的产业落地能力,迸发出惊人能量 [60] - 双方共同开发ChatGPT引爆全球AI热潮,并将深度学习技术带入寻常百姓家 [62] - 合作关系证明了理想主义与实用主义结合的可能性,既关乎利润更关乎人类福祉 [64]
端到端和VLA,这些方向还适合搞研究
自动驾驶之心· 2025-11-03 08:04
自动驾驶技术发展路线 - 技术路线从基于规则时期转变为以理想、小鹏等新势力为代表的端到端到VLA范式时期,现阶段进入以蔚来为代表的世界模型时期[1] - 深度学习始终是技术路线的核心组成部分,行业建议学习前沿理论、底层基础理论和代码能力以应对技术快速迭代[1] 课程内容与目标 - 课程涵盖从模块化量产算法到端到端、VLA的技术演进,核心算法包括BEV感知、视觉语言模型VLM、扩散模型、强化学习、世界模型等[5] - 学习目标为掌握端到端技术框架,复现扩散模型、VLA等主流算法,学完后可达1年左右端到端自动驾驶算法工程师水平[5] 导师资质与行业资源 - 主讲导师为C9本科+QS前50 PhD背景,发表CCF-A论文2篇,现任国内TOP主机厂算法专家,主持过多项自动驾驶感知和端到端算法的量产交付[6] - 公司拥有300+专职于自动驾驶/具身智能方向的导师,来自全球QS前100高校,近3年辅导学员超400名,中稿率达96%[8][15] - 优秀学员可获得清北/MIT等名校推荐信或内推至阿里达摩院、华为诺亚方舟等企业研发岗[19] 科研辅导服务 - 辅导覆盖选题、调研、idea验证、代码实现、实验、润色、投稿全流程,目标包括CCF-A/B/C、SCI1-4区、EI会议等[15] - 服务包含班主任全程督学,针对零基础学员提供基础课程,承诺6个月可完成一篇小论文[18] - 通过精准匹配系统从300+导师中筛选3-5位方向契合者,支持试听和退款机制[18][19]
Meta裁员、OpenAI重组:万字复盘谷歌起笔的AI史诗,如何被「群雄」改写剧本?
机器之心· 2025-11-02 09:37
AI行业格局转变 - AI行业正从“无限淘金热”转向残酷的“阵地战”,资本开始重新评估价值,巨头们审视成本与效率 [1] - Meta FAIR部门遭裁员、OpenAI进行资本重组、AWS大裁员等一系列动荡表明行业进入新阶段 [1] 谷歌的AI基因与早期探索 - 人工智能是谷歌从诞生之初的核心理念,受创始人Larry Page父亲(早期机器学习教授)的影响 [5][9] - 2000年Larry Page断言人工智能将是谷歌的终极版本,终极搜索引擎就是人工智能 [9] - 谷歌起家的PageRank算法运用统计方法排序网页,带有早期AI思想印记 [10] - 2000年末工程师提出“压缩即理解”理论,探索语言模型和机器理解,这是现代LLM思想的早期体现 [12] - 研究成果直接应用于谷歌搜索的拼写纠错功能,并开发了消耗数据中心整体资源15%的语言模型PHIL [14][16] - PHIL在2003年被用于快速实现AdSense系统,为谷歌带来数十亿美元新收入 [15] 深度学习革命与谷歌的拥抱 - 2007年Geoff Hinton将深度学习火种带入谷歌,当时神经网络正被学术界边缘化 [20] - 谷歌的统计方法本身是对僵化专家系统的反叛,为结合深度学习奠定基础 [21] - 2011年吴恩达、Jeff Dean等发起Google Brain项目,目标构建大规模深度学习模型 [27] - Jeff Dean主导开发DistBelief分布式计算系统,采用有争议的异步更新参数方式但被证明高效 [28][29] - Google Brain的“猫论文”实验使用16000个CPU核心训练,神经网络自主学会识别猫脸 [30] - “猫论文”证明无监督学习能力,催生YouTube算法推荐时代,驱动数百亿乃至数千亿美元产业价值 [32][33][34] 关键突破与硬件变革 - 2012年AlexNet在ImageNet竞赛中将错误率从25%以上降至15.3%,提升超过40% [35][37] - AlexNet创造性使用NVIDIA GPU进行并行训练,确立GPU作为AI计算核心硬件的地位 [39] - 谷歌因应算力瓶颈,自研专门用于神经网络计算的TPU芯片,15个月内完成设计到部署 [62][63] - TPU针对矩阵运算优化并采用低精度计算,为谷歌提供成本优势和战略自主权 [63] 人才争夺与实验室建立 - 谷歌以约4400万美元收购AlexNet核心团队DNN Research,被认为是史上最划算交易之一 [41][42] - 2013年扎克伯格力邀Yann LeCun建立FAIR实验室,采用开放研究模式 [43][45][47] - FAIR为Meta提供核心技术、开源工具PyTorch以及Llama系列开源模型 [48] - 2014年谷歌以约5.5亿至6.5亿美元收购DeepMind,但其后与Google Brain存在内耗 [56][57] - DeepMind在AlphaGo项目中击败李世石,并将谷歌数据中心冷却能耗降低40% [58] OpenAI的崛起与转型 - 2015年因马斯克对谷歌垄断的担忧,联合Sam Altman创立OpenAI,获10亿美元初始承诺 [64][65][68] - Ilya Sutskever被使命吸引离开谷歌加入OpenAI,尽管Jeff Dean提供双倍薪酬反聘 [66] - 2018年OpenAI因资金压力重组,设立利润上限子公司并获得微软10亿美元投资 [86][87] - OpenAI转型开发GPT系列模型,GPT-3展现出惊人能力,GitHub Copilot成为首个大规模落地产品 [90][91] - 2021年Dario Amodei因安全与商业化分歧带领核心成员出走,创立Anthropic [92][95] Transformer架构与新时代 - 2017年谷歌发表《Attention Is All You Need》论文,提出Transformer架构 [74][76] - Transformer解决RNN/LSTM序列处理难题,具备高度并行化优势 [76] - 架构展现出“更多数据+更大模型+更多算力≈更好智能”的可扩展性 [80][81] - 谷歌允许论文公开发表,将“钥匙”交给全世界,包括潜在竞争对手 [84] - 论文八位作者后来相继离开谷歌 [84] ChatGPT冲击与谷歌反击 - 2022年11月ChatGPT发布,一周用户破百万,两个月破亿,成为史上增长最快消费应用 [97] - ChatGPT成功震醒谷歌,Sundar Pichai拉响“Code Red”红色警报 [99] - 微软迅速追加100亿美元投资OpenAI,并发布新版Bing搜索引擎直指谷歌核心业务 [99] - 谷歌仓促推出Bard但出现事实错误,促使公司进行大刀阔斧改革 [102][103] - 2023年谷歌合并Google Brain和DeepMind,组建统一Google DeepMind部门由Demis Hassabis领导 [105][106] - 谷歌All in Gemini项目,集中精英力量开发统一多模态旗舰模型系列 [105][106] - Gemini系列快速迭代,Gemini 2.5 Pro成为顶尖模型,并整合进搜索等产品 [107] - Google DeepMind在AI for science领域突破,AlphaFold 2解决蛋白质折叠问题,团队获2024年诺贝尔化学奖 [107][108] 当前竞争格局 - 谷歌一度受大公司体制束缚将王牌拱手让人,OpenAI成为最具实力玩家之一 [109] - Meta曾稳坐开源王座,如今在军备竞赛与成本效益平衡中艰难变革 [109] - 中国AI力量异军突起,DeepSeek、Qwen、Kimi等奋力追赶 [109] - 行业没有永远王者,巨头霸权可能被自身问题拖垮,后起之秀威胁迫近 [110]
一名科学家试着成为更好的CEO |WAVES
36氪· 2025-10-31 01:42
公司发展历程 - OneFlow公司成立6年,创始人袁进辉经历技术变革与商业世界洗礼后开始尝试成为更好的CEO [4] - 公司成立前4年没有任何收入,运作风格如同实验室,大部分工作是写代码,员工特性为只热爱写代码和技术讨论 [6] - 2022年底公司接近求生状态,最多只能接触到几百张GPU,最困难时选择降薪和减员 [7][8] - ChatGPT爆发后公司被光年之外并购,但仅两个月后因王慧文病休离岗,美团接手光年之外,团队决定重新创业 [1][11] 技术路线与产品演变 - 公司最初目标是颠覆巨头重金投入的深度学习系统框架,致力于找到更有"美感"的架构,一劳永逸解决所有深度学习模型运行问题 [1][6] - 新公司硅基流动将重心从训练框架转向推理部署,选择技术上不像OneFlow那么令人兴奋但市场前景更大的大模型推理框架 [13] - 推理框架市场前景巨大,训练框架扫描数据量如一座泳池,而推理框架扫描数据量如源源不断的大河 [13] - OpenAI在推理上的进展验证了推理框架判断,推理算力需求又提高了一个数量级 [14] 融资与并购事件 - 公司最初为"朋友圈创业",投资人包括袁进辉亲朋好友,后续获得九合、拓尔思、快手、校友基金、高瓴、海淀区支持 [6] - 2023年公司被光年之外并购,光年之外估值突破10亿美元,成为资源最好的团队 [11] - 并购后离职员工兑现约2000多万元股票,但从未离职又一起创业的同事尚未获得经济回报 [14] 团队管理与商业化转型 - 新公司规模从35人扩张到超过60人,增加了产品经理和商业化同事,现有三位商业化出身的联创 [14] - 公司认识到CEO写代码是对公司不负责任的做法,转向更加现实和务实的经营理念 [14] - 大模型催生Model as a service产品形态,底层技术可通过标准API服务迅速变现 [14] - 创始人从只爱解难题不愿做平凡事情,转变为追求典型意义上的创业成功 [15]