Workflow
深度学习
icon
搜索文档
吴恩达:如何在人工智能领域打造你的职业生涯?
腾讯研究院· 2025-05-22 17:35
人工智能职业发展路径 - 编码人工智能被视为新时代的基础读写能力,类似于历史上语言读写能力的普及过程 [7][8] - 人工智能技术为编码提供了新范式,使计算机能从数据中提取知识,相比传统软件工程更具普适性 [8] - 线性回归等基础AI模型可应用于披萨店需求预测等实际场景,展示AI在各行业的广泛应用潜力 [9] 职业发展三阶段框架 - 学习基础技能:包括机器学习、深度学习、数学和软件开发等核心领域 [12][16] - 从事项目工作:与缺乏AI专业知识的利益相关者合作,面临项目管理和迭代挑战 [13] - 找到合适工作:需适应公司对AI角色认知不一致的情况,建立支持性社区 [14] 核心技术技能体系 - 基础机器学习:线性回归、逻辑回归、神经网络等模型及核心概念如偏差/方差 [17] - 深度学习:神经网络基础知识、超参数调整、卷积网络和序列模型 [17] - 相关数学:线性代数、概率统计、微积分,用于算法调试和优化 [18][23] - 软件开发:Python编程、数据结构算法、TensorFlow/PyTorch等库的使用 [18] AI项目管理方法论 - 五步项目确定法:从业务问题识别到资源预算的系统化流程 [26][32] - 项目选择策略:技术挑战性、团队合作、影响力及作为垫脚石的潜力 [36] - 执行方法论:根据成本选择"准备-瞄准-开火"或"准备-开火-瞄准"策略 [38][39] 求职策略与职业转换 - 角色转换优先于行业转换:建议先在同一行业转换AI角色,再考虑跨行业 [48] - 信息面试价值:了解目标公司AI岗位实际工作内容和所需技能的有效方式 [53][54] - 求职流程优化:研究角色和公司、准备面试、选择团队和谈判薪资的系统方法 [58] 职业长期发展要素 - 团队合作能力:处理大型项目时影响他人和被影响的关键技能 [65] - 社区建设:比单纯社交更有效的职业网络发展方式 [65] - 习惯养成:在学习、工作等方面保持长期纪律性的重要性 [67]
高频选股因子周报(20250512- 20250516):深度学习因子空头端失效,多头端强势,AI增强组合继续维持正收益-20250520
国泰海通证券· 2025-05-20 19:07
量化因子与构建方式 1. **因子名称**:日内高频偏度因子 - **构建思路**:通过捕捉股票日内收益分布的偏度特征来选股[4][10] - **具体构建过程**:计算日内收益率的三阶矩,公式为: $$Skew = \frac{E[(r-\mu)^3]}{\sigma^3}$$ 其中,\( r \)为日内收益率,\( \mu \)为均值,\( \sigma \)为标准差[10] - **评价**:历史IC为0.027,2025年IC提升至0.057,多头端稳定性较好[6] 2. **因子名称**:日内下行波动占比因子 - **构建思路**:衡量下行波动在总波动中的占比,反映风险不对称性[4][13] - **具体构建过程**:计算下行波动与总波动的比值: $$DownVolRatio = \frac{\sum_{r_t<0}(r_t-\mu)^2}{\sum(r_t-\mu)^2}$$[13] - **评价**:2025年多空收益达11.63%,但近期表现较弱[6] 3. **因子名称**:开盘后买入意愿占比因子 - **构建思路**:统计开盘后买方主动成交占比,捕捉资金流向[4][19] - **具体构建过程**:计算开盘30分钟内买方成交额占比: $$BuyRatio = \frac{V_{buy}}{V_{total}}$$[19] - **评价**:2025年周胜率达15/20,多头超额收益显著[7] 4. **因子名称**:改进GRU(50,2)+NN(10)因子 - **构建思路**:结合门控循环单元(GRU)和神经网络(NN)的深度学习模型[4][59] - **具体构建过程**:使用50天历史数据输入GRU层,2层隐藏层后接10层全连接NN[59] - **评价**:2025年多空收益17.68%,但多头超额收益为负[9] 5. **因子名称**:多颗粒度模型-5日标签因子 - **构建思路**:基于双向AGRU训练的多时间颗粒度预测模型[61][64] - **具体构建过程**:融合5日收益率标签数据训练,输出股票排序[64] - **评价**:2025年多空收益28.3%,表现最优[9] 因子回测效果 | 因子名称 | IC(2025) | 多空收益(2025YTD) | 多头超额收益(2025YTD) | 周胜率(2025) | |------------------------------|----------|-------------------|-----------------------|--------------| | 日内高频偏度因子 | 0.057 | 14.17% | 3.26% | 13/20 | | 开盘后大单净买入占比因子 | 0.034 | 12.01% | 6.26% | 16/20 | | 改进GRU(50,2)+NN(10)因子 | 0.039 | 17.68% | -2.08% | 18/20 | | 多颗粒度模型-10日标签因子 | 0.067 | 26.67% | 9.41% | 16/20 | 量化模型与构建方式 1. **模型名称**:中证500 AI增强宽约束组合 - **构建思路**:基于多颗粒度模型因子,叠加宽泛风险约束[67][68] - **具体构建过程**:目标函数为: $$max\sum\mu_{i}w_{i}$$ 约束条件包括个股权重≤1%、行业偏离≤1%、换手率约束等[68] - **评价**:严约束组合2025年超额收益3.53%,回撤控制更优[74][79] 模型回测效果 | 模型名称 | 上周收益 | 5月收益 | 2025YTD收益 | 周胜率 | |------------------------------|----------|---------|-------------|--------| | 中证1000 AI增强严约束组合 | 1.16% | 2.33% | 10.89% | 14/20 | | 中证500 AI增强宽约束组合 | 1.17% | 2.29% | 6.18% | 13/20 |
国泰海通|金工:深度学习如何提升手工量价因子表现
深度学习因子与手工收益因子的结合 - 通过将收益因子加入深度学习模型的正交层,可以生成与现有收益因子低相关但选股效果良好的深度学习因子,便于后续人工调整因子权重 [1] - 深度学习模型的黑盒特性在市场剧烈风格转换时难以人工干预,正交层的设计可降低深度因子与手工收益因子的多重共线性问题 [1] 正交层设计的效果验证 - 无论使用Rank MAE还是IC作为损失函数,加入高频/低频量价收益因子的正交层后,深度因子仍保持0.02以上的IC和6以上的IC IR,全市场选股效果显著 [2] - 深度因子与手工收益因子结合构建的多因子组合在全市场多头组合中表现明显改善,但指数增强组合的提升效果存在波动 [2] 多粒度因子与深度因子的协同作用 - 正交层加入收益因子后,深度因子与多粒度因子的相关性低于0.01(高频数据输入),两者结合可显著提升全市场纯多头组合表现 [2] - 深度学习因子对中、大市值股票收益预测能力有限,导致其在指数增强组合中的改善效果不明显 [2]
杭州ai图像识别的重点技术
搜狐财经· 2025-05-13 20:54
核心技术优势 - 深度学习和神经网络构成AI图像识别技术核心 通过多层网络实现图像逐层抽象和特征提取 [3] - 卷积神经网络(CNN)通过卷积层 池化层和全连接层组合有效提取图像空间特征和层次结构信息 [4] - 生成对抗网络(GAN)通过生成器与判别器对抗训练生成逼真图像数据 应用于数据增强和图像修复领域 [5] 技术应用成效 - CNN技术广泛应用于人脸识别和物体检测领域并取得优异表现 [4] - GAN技术显著提升模型泛化能力和鲁棒性 [5] - 迁移学习利用已有知识迁移至新任务 弱监督学习通过少量标签数据训练模型 共同解决数据不足和标签稀缺问题 [6] 产学研协同创新 - 浙江大学与阿里安全联合研发基于深度学习的AI细粒度图像识别技术 [3] - 研究机构与企业在深度学习领域取得显著成果 [3] - 技术创新应用为杭州AI图像识别领域未来发展奠定坚实基础 [7]
抓住阿尔茨海默病干预黄金窗口期:中国专家成功构建MCI预测模型
环球网资讯· 2025-05-07 21:13
阿尔茨海默病早期预测模型研究 - 中国医学专家成功构建轻度认知损害(MCI)预测模型,为认知障碍早期识别提供新方法 [1] - 该模型基于结构磁共振图像(MRI)数据,建立深度学习训练框架,筛选整合10个高区分度脑区特征 [2] - 研究团队开发进展指数(PI),通过分析脑部MRI生成[0,1]区间风险评分,动态反映神经退行性病变进展状态 [2] 模型技术细节 - 模型整合海马体、杏仁核、小脑等关键脑区特征,突破传统二元诊断局限 [2] - 将人口统计学信息、神经心理量表和MRI扫描PI评分结合,建立MCI预测模型 [2] - 模型可有效预测相关队列中7年后向MCI的转化 [2] 研究意义与未来发展 - 研究成果在《阿尔茨海默病预防杂志》发表,获得科技创新2030-"脑科学与类脑研究"重大项目资助 [2] - 研究有助于识别潜在患者,为及时实施有效治疗提供可能,延缓疾病进展 [1] - 未来将探索更多前沿深度学习范式在阿尔茨海默病临床诊疗领域的应用 [2]
一文讲透AI历史上的10个关键时刻!
机器人圈· 2025-05-06 20:30
人工智能发展历程 核心观点 - 人工智能从1956年达特茅斯会议的理论探索阶段,逐步发展为2025年渗透千行百业的实用技术,经历了10个关键里程碑事件 [1] 关键历史时刻 1 达特茅斯会议(1956年) - 首次确立人工智能作为独立学科,由麦卡锡、明斯基等先驱提出机器智能研究框架,定义问题求解、符号推理等核心方向 [2][3] 2 感知机(1957年) - 弗兰克·罗森布拉特开发首个神经网络模型,开创"训练-预测"的机器学习范式,奠定现代深度学习技术基础 [4][6] 3 ELIZA(1966年) - MIT开发的第一个聊天机器人,通过罗杰式对话法模拟心理治疗师,首次验证自然语言交互的可行性 [7][8] 4 专家系统(1970年代) - Dendral和MYCIN系统实现专业领域推理,化学分子结构分析与医疗诊断应用标志AI从理论转向垂直领域落地 [9][11] 5 深蓝胜利(1997年) - IBM超级计算机击败国际象棋世界冠军,证明机器在复杂策略游戏中可超越人类 [12] 6 机器学习范式(1990-2000年代) - 汤姆·米切尔提出数据驱动算法定义,推动自适应系统的研究转向 [14][15] 7 深度学习革命(2012年) - Geoffrey Hinton的反向传播算法突破多层网络训练瓶颈,AlexNet在ImageNet竞赛中准确率提升10.8个百分点引爆行业热潮 [17][18] 8 生成对抗网络(2014年) - 伊恩·古德费洛提出GAN框架,生成器与判别器对抗机制实现逼真图像/文本合成 [20] 9 AlphaGo(2016年) - DeepMind攻克围棋复杂性,战胜李世石展现直觉与战略决策能力 [22] 10 Transformer与大模型(2017-2025) - 2017年Transformer架构解决长文本依赖问题,GPT-3(1750亿参数)展现零样本学习等涌现能力,2023年GPT-4实现多模态融合,国内百度、阿里等企业快速跟进大模型研发 [24][26] 行业现状 - 2025年AI技术渗透至图像生成、自动驾驶、医疗诊断等全领域,形成以GPT-4、Claude、文心一言等为代表的全球化竞争格局 [26]
被拒稿11年后翻盘获时间检验奖,DSN作者谢赛宁:拒稿≠学术死刑
量子位· 2025-05-06 12:24
论文获奖与学术影响 - 谢赛宁十年前被NeurIPS拒收的论文《Deeply-Supervised Nets》(DSN)获得AISTATS 2025年度时间检验奖 [1][2] - DSN提出的中间层监督思想被后续研究REPA和U-REPA继承发展,展示出从单一模型优化到跨模型知识迁移的演进 [3][4] - DSN已成为计算机视觉领域的经典方法,是首个在生成式AI领域产生跨代影响的监督学习框架 [17] 论文核心贡献与技术细节 - DSN旨在解决深度学习中隐藏层特征学习问题,提升分类性能 [12] - DSN通过中间层监督机制解决CNN三大痛点:梯度消失(通过辅助分类器增强梯度信号)、特征鲁棒性(中间层直接参与分类任务,AlexNet第3层特征分类准确率提升18%)、训练效率(CIFAR-10数据集上ResNet-50训练收敛速度加快30%,Top-1准确率提升2.1%) [15] - 截至文章推送,DSN谷歌学术被引量超过3000次 [18] 学术评价与行业反响 - AISTATS官宣获奖后,业界大佬齐聚祝贺 [5] - 计算机会议时间检验奖要求论文在获奖10年前发表,需被同行评价为开创性工作或成为后续研究基础范式 [22] - 类似案例包括被ICLR拒稿后转投NeurIPS的Word2vec(2023年获时间检验奖)和被ICLR 2024拒稿的Mamba [30] 作者经历与学术启示 - DSN是谢赛宁攻读博士学位期间提交的第一篇论文,共同一作为谷歌研究科学家Chen-Yu Lee,通讯作者为UCSD教授屠卓文 [7][8][9] - 谢赛宁分享经验:坚持不懈需要强大支持系统和具体实践指导,导师屠卓文的指导与合作者Chen-Yu Lee的帮助至关重要 [25][26] - Chen-Yu Lee表示对DSN的持续影响力和相关性感到自豪 [28]
中石化申请基于深度学习的微地震事件强度评价方法及系统专利,可判别出误拾事件
搜狐财经· 2025-05-05 21:16
专利技术 - 中国石油化工股份有限公司与中石化石油物探技术研究院有限公司联合申请了一项名为"一种基于深度学习的微地震事件强度评价方法及系统"的专利,公开号CN119916443A,申请日期为2023年10月 [1] - 该专利属于水力压裂微地震监测资料解释领域,利用深度学习自动提取多道微地震事件特征并进行强度分类,在数据集中加入噪声数据以模拟误拾现象,提高事件识别准确性 [1] - 专利方法包括建立正演模型、构建训练数据集、设计网络模型、训练模型及最终评价五个步骤 [1] 公司背景 - 中国石油化工股份有限公司成立于2000年,注册资本1217.3969亿元人民币,主营业务为石油、煤炭及其他燃料加工业,总部位于北京市 [2] - 该公司对外投资257家企业,参与招投标5000次,拥有5000条专利信息及45条商标信息,持有39个行政许可 [2] - 中石化石油物探技术研究院有限公司成立于2022年,注册资本13.3612亿元人民币,位于南京市,主营开采专业及辅助性活动 [2] - 该研究院对外投资1家企业,参与招投标179次,拥有524条专利信息及13个行政许可 [2]
8/8/7分被NeurIPS拒稿,谢赛宁读博投的首篇论文,10年后获AISTATS 2025时间检验奖
机器之心· 2025-05-05 11:40
会议与奖项 - 第28届国际人工智能与统计学会议(AISTATS)在泰国举办,该会议是人工智能、机器学习与统计学交叉领域的重要国际会议,致力于促进计算机科学、人工智能、机器学习和统计学等领域研究者之间的交流与合作 [1] - 会议主办方公布了本年度时间检验奖,授予UCSD与微软研究院合著的论文《Deeply-Supervised Nets》(深度监督网络),共同一作分别为Chen-Yu Lee(现为谷歌研究科学家)和谢赛宁(现为纽约大学助理教授) [1] - 该论文被引数已经超过了3000,具有较高的学术影响力 [3] 论文背景与作者分享 - 《Deeply-Supervised Nets》是谢赛宁读博期间提交的第一篇论文,最初被NeurIPS拒稿(分数为8/8/7),但最终获得AISTATS 2025时间检验奖 [5] - 谢赛宁寄语同学们,如果对论文评审结果感到沮丧,可以将他的经历当作提醒,坚持不懈会带来收获 [5] - 共同一作Chen-Yu Lee也对论文获奖感到自豪,并表示这项研究成果至今仍具有重要意义和影响力 [6] 论文摘要与核心问题 - 深度学习在图像分类和语音识别等任务中表现优异,但仍存在隐藏层特征透明度低、梯度爆炸和消失导致训练困难、缺乏透彻的数学理解等问题 [11] - 深度学习框架的改进包括微调特征尺度、步长和收敛速度的方法,以及dropout、dropconnect、预训练和数据增强等技术 [11] - 梯度消失问题使得深度学习训练缓慢且低效 [11] 论文方法与创新 - 提出深度监督网络(DSN),对隐藏层和输出层都强制进行直接和早期监督,并为各个隐藏层引入伴随目标,显著提高了现有监督深度学习方法的性能 [12] - DSN框架支持SVM、softmax等多种分类器选择,独特价值在于实现对每个中间层的直接监督控制 [12] - 实验证明DSN方法的收敛速度优于标准方法,前提是假设优化函数具有局部强凸性 [12] 实验结果与性能提升 - DSN-SVM和DSN-Softmax在MNIST、CIFAR-10、CIFAR-100及SVHN数据集上刷新当前最优纪录 [13] - 在500个样本时,DSN-SVM比CNN-Softmax提高了26% [13] - 在CIFAR-10上,DSN方法的错误率为0.39%,优于CNN(0.53%)、Stochastic Pooling(0.47%)、Network in Network(0.47%)和Maxout Networks(0.45%) [15] 特征学习与工程优化 - DSN学习到的特征图比CNN学习到的特征图更直观,展示了从第一个卷积层学习到的特征图,仅显示前30%的激活值 [16] - DSN框架可兼容模型平均、dropconnect和Maxout等先进技术,通过精细化工程优化可进一步降低分类误差 [16]
纪念王湘浩院士诞辰110周年:人工智能领域专家共探行业发展路径
新华社· 2025-04-29 17:52
河北大学科学与技术创新研究院院长杨晓晖认为,早期的人工智能研究主要集中在理论探索和基础算法 研究上,随着计算机技术的飞速发展,人工智能正逐渐从实验室走向实际应用。如今,人工智能已广泛 应用于图像识别、语音识别、自然语言处理等多个领域。 对于人工智能发展趋势,吉林大学计算机学院院长杨博表示,当前人工智能已迈入深度学习时代,以神 经网络为核心技术,通过构建更深更复杂的网络解决现实难题,未来发展趋势将围绕算力、数据、算法 三要素的深度融合展开,以开发更智能的程序,更加注重与人类的协作和交互,实现人机共生。 "人工智能大模型确实对生产生活产生了深远影响。然而,大模型也存在'高阶幻觉'问题,即模型生成 的内容逻辑严密但可能包含虚假信息,需引起警惕。"杨晓晖说,人工智能是提升效率的工具,而非人 类的替代品。人类应敬畏技术,了解其局限,避免过度依赖。同时,需加强数据治理,确保数据质量与 安全。在产业应用中,应聚焦数据整合与价值挖掘,推动人工智能与实体经济深度融合,促进经济社会 可持续发展。 多位人工智能领域专家参加当天活动,并围绕人工智能行业发展、趋势等方面进行了探讨。与会专家认 为,如今全球人工智能发展进入新阶段,人工智 ...