Workflow
深度学习
icon
搜索文档
四位图灵奖掌舵:2025智源大会揭示AI进化新路径
机器之心· 2025-05-23 12:17
智源大会概况 - 2025年第七届北京智源大会将于6月6-7日在中关村国家自主创新示范区展示中心举行,汇聚全球顶尖AI研究者与产业领袖 [3][4] - 大会自2019年创办以来已吸引12位图灵奖得主参与,每年有200+专家参会,覆盖全球30+国家/地区的50万从业者 [3] - 2025年大会将迎来四位图灵奖得主,以及来自MIT、斯坦福、清华、北大等20+顶尖科研院所的科学家 [4][5] AI技术发展趋势 - 深度学习和强化学习的技术交叉成为下一代通用人工智能基石,如2013年DeepMind的DQN和2016年AlphaGo的突破 [2] - 2025年AI发展关键词包括推理大模型兴起、开源生态加速(如DeepSeek和VLA模型推动具身智能演进)、创新企业涌现 [3] - 基础理论领域聚焦深度推理模型、多模态模型、类脑大模型、NeuroAl等方向 [7][10] 产业应用与创新 - 应用探索涵盖具身智能与人形机器人、自主智能体、AI for Science(AI4S)、AI+理工/医学等方向 [8][10] - 产业创新板块设置大模型产业CEO论坛,邀请智谱AI、面壁智能、生数科技、爱诗科技等企业探讨演进路径 [5][10] - 智能驾驶、具身技术产业应用、从AI for Science到AI for Industry成为重点议题 [10] 特色活动与生态建设 - 首次推出"InnoVibe共创场",邀请热门论文作者分享成果,为Z世代AI青年提供展示平台 [5] - 设置AI互动展区展示前沿科技,同期举办PyTorch Day China、AI开源项目Tech Tutorial等系列活动 [5][12] - 可持续发展议题关注AI安全、青年科学家发展、开源生态建设等方向 [11][12]
吴恩达:如何在人工智能领域打造你的职业生涯?
36氪· 2025-05-22 19:00
人工智能编码能力 - 编码人工智能将成为未来社会的基础技能,类似于现在的读写能力 [1] - 人工智能和数据科学的应用范围远超传统软件工程,可在任何产生数据的场景中使用 [2] - 线性回归等AI模型可帮助小型企业优化运营,如披萨店的人员配备和供应链管理 [2] 人工智能职业发展路径 - 职业发展三步骤:学习基础技能、从事项目工作、找到工作 [3] - 人工智能领域需要持续学习,技术更新速度比成熟领域更快 [3] - AI项目具有高度迭代性,项目管理面临特殊挑战 [4][5] 人工智能技术技能 - 机器学习基础技能包括理解各类模型和核心概念 [7] - 深度学习是机器学习的重要组成部分,需要掌握神经网络等知识 [7] - 关键数学领域包括线性代数、概率统计和微积分 [8] - 软件开发技能可显著增加就业机会 [8] 人工智能项目执行 - 识别业务问题而非AI问题是项目成功的第一步 [14] - 评估AI解决方案需考虑技术可行性和业务价值 [16] - 项目里程碑应包括机器学习指标和业务指标 [17] - 资源预算需涵盖数据、人员和集成支持等要素 [18] 人工智能求职策略 - 角色转换或行业转换可采取分步策略降低难度 [27] - 创业公司比大公司更易于实现角色转换 [28] - 信息面试是了解目标公司和角色的有效方式 [31][33] - 简历和项目组合是求职过程中的关键要素 [36] 人工智能职业成功要素 - 团队合作和沟通技巧对大型项目至关重要 [43] - 建立职业网络和社区比单纯社交更有价值 [43] - 良好习惯和纪律性是长期成功的保障 [45] - 利他主义态度有助于个人职业发展 [46]
吴恩达:如何在人工智能领域打造你的职业生涯?
腾讯研究院· 2025-05-22 17:35
人工智能职业发展路径 - 编码人工智能被视为新时代的基础读写能力,类似于历史上语言读写能力的普及过程 [7][8] - 人工智能技术为编码提供了新范式,使计算机能从数据中提取知识,相比传统软件工程更具普适性 [8] - 线性回归等基础AI模型可应用于披萨店需求预测等实际场景,展示AI在各行业的广泛应用潜力 [9] 职业发展三阶段框架 - 学习基础技能:包括机器学习、深度学习、数学和软件开发等核心领域 [12][16] - 从事项目工作:与缺乏AI专业知识的利益相关者合作,面临项目管理和迭代挑战 [13] - 找到合适工作:需适应公司对AI角色认知不一致的情况,建立支持性社区 [14] 核心技术技能体系 - 基础机器学习:线性回归、逻辑回归、神经网络等模型及核心概念如偏差/方差 [17] - 深度学习:神经网络基础知识、超参数调整、卷积网络和序列模型 [17] - 相关数学:线性代数、概率统计、微积分,用于算法调试和优化 [18][23] - 软件开发:Python编程、数据结构算法、TensorFlow/PyTorch等库的使用 [18] AI项目管理方法论 - 五步项目确定法:从业务问题识别到资源预算的系统化流程 [26][32] - 项目选择策略:技术挑战性、团队合作、影响力及作为垫脚石的潜力 [36] - 执行方法论:根据成本选择"准备-瞄准-开火"或"准备-开火-瞄准"策略 [38][39] 求职策略与职业转换 - 角色转换优先于行业转换:建议先在同一行业转换AI角色,再考虑跨行业 [48] - 信息面试价值:了解目标公司AI岗位实际工作内容和所需技能的有效方式 [53][54] - 求职流程优化:研究角色和公司、准备面试、选择团队和谈判薪资的系统方法 [58] 职业长期发展要素 - 团队合作能力:处理大型项目时影响他人和被影响的关键技能 [65] - 社区建设:比单纯社交更有效的职业网络发展方式 [65] - 习惯养成:在学习、工作等方面保持长期纪律性的重要性 [67]
高频选股因子周报(20250512- 20250516):深度学习因子空头端失效,多头端强势,AI增强组合继续维持正收益-20250520
国泰海通证券· 2025-05-20 19:07
量化因子与构建方式 1. **因子名称**:日内高频偏度因子 - **构建思路**:通过捕捉股票日内收益分布的偏度特征来选股[4][10] - **具体构建过程**:计算日内收益率的三阶矩,公式为: $$Skew = \frac{E[(r-\mu)^3]}{\sigma^3}$$ 其中,\( r \)为日内收益率,\( \mu \)为均值,\( \sigma \)为标准差[10] - **评价**:历史IC为0.027,2025年IC提升至0.057,多头端稳定性较好[6] 2. **因子名称**:日内下行波动占比因子 - **构建思路**:衡量下行波动在总波动中的占比,反映风险不对称性[4][13] - **具体构建过程**:计算下行波动与总波动的比值: $$DownVolRatio = \frac{\sum_{r_t<0}(r_t-\mu)^2}{\sum(r_t-\mu)^2}$$[13] - **评价**:2025年多空收益达11.63%,但近期表现较弱[6] 3. **因子名称**:开盘后买入意愿占比因子 - **构建思路**:统计开盘后买方主动成交占比,捕捉资金流向[4][19] - **具体构建过程**:计算开盘30分钟内买方成交额占比: $$BuyRatio = \frac{V_{buy}}{V_{total}}$$[19] - **评价**:2025年周胜率达15/20,多头超额收益显著[7] 4. **因子名称**:改进GRU(50,2)+NN(10)因子 - **构建思路**:结合门控循环单元(GRU)和神经网络(NN)的深度学习模型[4][59] - **具体构建过程**:使用50天历史数据输入GRU层,2层隐藏层后接10层全连接NN[59] - **评价**:2025年多空收益17.68%,但多头超额收益为负[9] 5. **因子名称**:多颗粒度模型-5日标签因子 - **构建思路**:基于双向AGRU训练的多时间颗粒度预测模型[61][64] - **具体构建过程**:融合5日收益率标签数据训练,输出股票排序[64] - **评价**:2025年多空收益28.3%,表现最优[9] 因子回测效果 | 因子名称 | IC(2025) | 多空收益(2025YTD) | 多头超额收益(2025YTD) | 周胜率(2025) | |------------------------------|----------|-------------------|-----------------------|--------------| | 日内高频偏度因子 | 0.057 | 14.17% | 3.26% | 13/20 | | 开盘后大单净买入占比因子 | 0.034 | 12.01% | 6.26% | 16/20 | | 改进GRU(50,2)+NN(10)因子 | 0.039 | 17.68% | -2.08% | 18/20 | | 多颗粒度模型-10日标签因子 | 0.067 | 26.67% | 9.41% | 16/20 | 量化模型与构建方式 1. **模型名称**:中证500 AI增强宽约束组合 - **构建思路**:基于多颗粒度模型因子,叠加宽泛风险约束[67][68] - **具体构建过程**:目标函数为: $$max\sum\mu_{i}w_{i}$$ 约束条件包括个股权重≤1%、行业偏离≤1%、换手率约束等[68] - **评价**:严约束组合2025年超额收益3.53%,回撤控制更优[74][79] 模型回测效果 | 模型名称 | 上周收益 | 5月收益 | 2025YTD收益 | 周胜率 | |------------------------------|----------|---------|-------------|--------| | 中证1000 AI增强严约束组合 | 1.16% | 2.33% | 10.89% | 14/20 | | 中证500 AI增强宽约束组合 | 1.17% | 2.29% | 6.18% | 13/20 |
国泰海通|金工:深度学习如何提升手工量价因子表现
深度学习因子与手工收益因子的结合 - 通过将收益因子加入深度学习模型的正交层,可以生成与现有收益因子低相关但选股效果良好的深度学习因子,便于后续人工调整因子权重 [1] - 深度学习模型的黑盒特性在市场剧烈风格转换时难以人工干预,正交层的设计可降低深度因子与手工收益因子的多重共线性问题 [1] 正交层设计的效果验证 - 无论使用Rank MAE还是IC作为损失函数,加入高频/低频量价收益因子的正交层后,深度因子仍保持0.02以上的IC和6以上的IC IR,全市场选股效果显著 [2] - 深度因子与手工收益因子结合构建的多因子组合在全市场多头组合中表现明显改善,但指数增强组合的提升效果存在波动 [2] 多粒度因子与深度因子的协同作用 - 正交层加入收益因子后,深度因子与多粒度因子的相关性低于0.01(高频数据输入),两者结合可显著提升全市场纯多头组合表现 [2] - 深度学习因子对中、大市值股票收益预测能力有限,导致其在指数增强组合中的改善效果不明显 [2]
杭州ai图像识别的重点技术
搜狐财经· 2025-05-13 20:54
核心技术优势 - 深度学习和神经网络构成AI图像识别技术核心 通过多层网络实现图像逐层抽象和特征提取 [3] - 卷积神经网络(CNN)通过卷积层 池化层和全连接层组合有效提取图像空间特征和层次结构信息 [4] - 生成对抗网络(GAN)通过生成器与判别器对抗训练生成逼真图像数据 应用于数据增强和图像修复领域 [5] 技术应用成效 - CNN技术广泛应用于人脸识别和物体检测领域并取得优异表现 [4] - GAN技术显著提升模型泛化能力和鲁棒性 [5] - 迁移学习利用已有知识迁移至新任务 弱监督学习通过少量标签数据训练模型 共同解决数据不足和标签稀缺问题 [6] 产学研协同创新 - 浙江大学与阿里安全联合研发基于深度学习的AI细粒度图像识别技术 [3] - 研究机构与企业在深度学习领域取得显著成果 [3] - 技术创新应用为杭州AI图像识别领域未来发展奠定坚实基础 [7]
抓住阿尔茨海默病干预黄金窗口期:中国专家成功构建MCI预测模型
环球网资讯· 2025-05-07 21:13
阿尔茨海默病早期预测模型研究 - 中国医学专家成功构建轻度认知损害(MCI)预测模型,为认知障碍早期识别提供新方法 [1] - 该模型基于结构磁共振图像(MRI)数据,建立深度学习训练框架,筛选整合10个高区分度脑区特征 [2] - 研究团队开发进展指数(PI),通过分析脑部MRI生成[0,1]区间风险评分,动态反映神经退行性病变进展状态 [2] 模型技术细节 - 模型整合海马体、杏仁核、小脑等关键脑区特征,突破传统二元诊断局限 [2] - 将人口统计学信息、神经心理量表和MRI扫描PI评分结合,建立MCI预测模型 [2] - 模型可有效预测相关队列中7年后向MCI的转化 [2] 研究意义与未来发展 - 研究成果在《阿尔茨海默病预防杂志》发表,获得科技创新2030-"脑科学与类脑研究"重大项目资助 [2] - 研究有助于识别潜在患者,为及时实施有效治疗提供可能,延缓疾病进展 [1] - 未来将探索更多前沿深度学习范式在阿尔茨海默病临床诊疗领域的应用 [2]
一文讲透AI历史上的10个关键时刻!
机器人圈· 2025-05-06 20:30
人工智能发展历程 核心观点 - 人工智能从1956年达特茅斯会议的理论探索阶段,逐步发展为2025年渗透千行百业的实用技术,经历了10个关键里程碑事件 [1] 关键历史时刻 1 达特茅斯会议(1956年) - 首次确立人工智能作为独立学科,由麦卡锡、明斯基等先驱提出机器智能研究框架,定义问题求解、符号推理等核心方向 [2][3] 2 感知机(1957年) - 弗兰克·罗森布拉特开发首个神经网络模型,开创"训练-预测"的机器学习范式,奠定现代深度学习技术基础 [4][6] 3 ELIZA(1966年) - MIT开发的第一个聊天机器人,通过罗杰式对话法模拟心理治疗师,首次验证自然语言交互的可行性 [7][8] 4 专家系统(1970年代) - Dendral和MYCIN系统实现专业领域推理,化学分子结构分析与医疗诊断应用标志AI从理论转向垂直领域落地 [9][11] 5 深蓝胜利(1997年) - IBM超级计算机击败国际象棋世界冠军,证明机器在复杂策略游戏中可超越人类 [12] 6 机器学习范式(1990-2000年代) - 汤姆·米切尔提出数据驱动算法定义,推动自适应系统的研究转向 [14][15] 7 深度学习革命(2012年) - Geoffrey Hinton的反向传播算法突破多层网络训练瓶颈,AlexNet在ImageNet竞赛中准确率提升10.8个百分点引爆行业热潮 [17][18] 8 生成对抗网络(2014年) - 伊恩·古德费洛提出GAN框架,生成器与判别器对抗机制实现逼真图像/文本合成 [20] 9 AlphaGo(2016年) - DeepMind攻克围棋复杂性,战胜李世石展现直觉与战略决策能力 [22] 10 Transformer与大模型(2017-2025) - 2017年Transformer架构解决长文本依赖问题,GPT-3(1750亿参数)展现零样本学习等涌现能力,2023年GPT-4实现多模态融合,国内百度、阿里等企业快速跟进大模型研发 [24][26] 行业现状 - 2025年AI技术渗透至图像生成、自动驾驶、医疗诊断等全领域,形成以GPT-4、Claude、文心一言等为代表的全球化竞争格局 [26]
被拒稿11年后翻盘获时间检验奖,DSN作者谢赛宁:拒稿≠学术死刑
量子位· 2025-05-06 12:24
论文获奖与学术影响 - 谢赛宁十年前被NeurIPS拒收的论文《Deeply-Supervised Nets》(DSN)获得AISTATS 2025年度时间检验奖 [1][2] - DSN提出的中间层监督思想被后续研究REPA和U-REPA继承发展,展示出从单一模型优化到跨模型知识迁移的演进 [3][4] - DSN已成为计算机视觉领域的经典方法,是首个在生成式AI领域产生跨代影响的监督学习框架 [17] 论文核心贡献与技术细节 - DSN旨在解决深度学习中隐藏层特征学习问题,提升分类性能 [12] - DSN通过中间层监督机制解决CNN三大痛点:梯度消失(通过辅助分类器增强梯度信号)、特征鲁棒性(中间层直接参与分类任务,AlexNet第3层特征分类准确率提升18%)、训练效率(CIFAR-10数据集上ResNet-50训练收敛速度加快30%,Top-1准确率提升2.1%) [15] - 截至文章推送,DSN谷歌学术被引量超过3000次 [18] 学术评价与行业反响 - AISTATS官宣获奖后,业界大佬齐聚祝贺 [5] - 计算机会议时间检验奖要求论文在获奖10年前发表,需被同行评价为开创性工作或成为后续研究基础范式 [22] - 类似案例包括被ICLR拒稿后转投NeurIPS的Word2vec(2023年获时间检验奖)和被ICLR 2024拒稿的Mamba [30] 作者经历与学术启示 - DSN是谢赛宁攻读博士学位期间提交的第一篇论文,共同一作为谷歌研究科学家Chen-Yu Lee,通讯作者为UCSD教授屠卓文 [7][8][9] - 谢赛宁分享经验:坚持不懈需要强大支持系统和具体实践指导,导师屠卓文的指导与合作者Chen-Yu Lee的帮助至关重要 [25][26] - Chen-Yu Lee表示对DSN的持续影响力和相关性感到自豪 [28]
中石化申请基于深度学习的微地震事件强度评价方法及系统专利,可判别出误拾事件
搜狐财经· 2025-05-05 21:16
专利技术 - 中国石油化工股份有限公司与中石化石油物探技术研究院有限公司联合申请了一项名为"一种基于深度学习的微地震事件强度评价方法及系统"的专利,公开号CN119916443A,申请日期为2023年10月 [1] - 该专利属于水力压裂微地震监测资料解释领域,利用深度学习自动提取多道微地震事件特征并进行强度分类,在数据集中加入噪声数据以模拟误拾现象,提高事件识别准确性 [1] - 专利方法包括建立正演模型、构建训练数据集、设计网络模型、训练模型及最终评价五个步骤 [1] 公司背景 - 中国石油化工股份有限公司成立于2000年,注册资本1217.3969亿元人民币,主营业务为石油、煤炭及其他燃料加工业,总部位于北京市 [2] - 该公司对外投资257家企业,参与招投标5000次,拥有5000条专利信息及45条商标信息,持有39个行政许可 [2] - 中石化石油物探技术研究院有限公司成立于2022年,注册资本13.3612亿元人民币,位于南京市,主营开采专业及辅助性活动 [2] - 该研究院对外投资1家企业,参与招投标179次,拥有524条专利信息及13个行政许可 [2]