深度学习

搜索文档
CVPR 2025中稿新高的背后,录用率却仅22.1%。。。
自动驾驶之心· 2025-08-04 11:23
点击咨询匹配大牛导师 为什么选我们? 自动驾驶之心作为国内最大的AI类技术自媒体平台,IP包含自动驾驶之心/具身智能之心/3D视觉之心等平台, 拥有国内最顶尖的学术资源。 深耕自动驾驶、具身智能、机器人 方向多年。我们深刻理解这些交叉学科的挑 战与机遇,更明白一篇高质量论文对于学生(尤其是硕博生)学业和未来发展的重要性。 痛点 1 :期刊匹配 "盲人摸象",60% Desk Reject 源于方向错位 痛点 2 :创新性不足成 "致命伤",审稿人吐槽 "拿着锤子找钉子" 痛点 3 :实验设计 "漏洞百出",65% 拒稿因方法不可复现 痛点 4 :写作结构 "逻辑混乱",78% 论文因 "不会讲故事" 被拒 当顶会审稿人问 "Adam 是谁",你的论文还有救吗? 2025 年 AI 学术界的 "年度笑话",或许要属 NeurIPS 审稿意见中那句离谱的 " Who's Adam "—— 要知 道,Adam 优化器作为深度学习领域被引超 22 万次的基础算法,竟被审稿人当成了 "陌生人名"。这桩 乌龙背后,是 AI 顶会投稿量爆炸(CVPR 2025 投稿 1.3 万篇,录用率仅 22.1%)与审稿质量滑坡的尖 ...
秋招面经!大疆卓驭感知算法工程师面试~
自动驾驶之心· 2025-08-04 07:32
作者 | Neob0dy 来源 | https://zhuanlan.zhihu.com/p/19295746738 点击下方 卡片 ,关注" 自动驾驶之心 "公众号 戳我-> 领取 自动驾驶近30个 方向 学习 路线 自动驾驶感知算法工程师-动态目标感知预测方向 JD - 感知算法工程师 动态目标感知 我们是卓驭算法团队,在这里,你将会处理海量的自动驾驶数据,搭建自动化的真值标注系统,设计并落地最前 沿的AI和视觉技术。你的算法和代码将部署在百万台量产车上运行。你将参与到以下工作中: JD写得很模糊,面试之后才知道是做障碍物和语义目标识别追踪(运动状态估计)、意图预测的。目前和DJI藕 断丝连,面试前要做一模一样的性格测评还有找规律题目。一开始投的是SLAM,面试官说看到有深度学习的经 验,被转到这个岗。 一面 自我介绍,讲项目。面试官应该不是做slam是做BEV的,所以听我一席话如听一席话,转而问参加机器人比赛的 时候设计的目标检测网络和关键点检测相关的内容,问是否了解现在自动驾驶用的视觉模型,occupancy network,讲讲大概的原理。能不能说下transformer为什么有效,多头自注意力模型 ...
RoboMaster 2025机甲大师超级对抗赛全国赛收官
环球网资讯· 2025-08-03 21:44
赛事结果 - 上海交通大学交龙战队获得全国总冠军 [1] - 中国科学技术大学RoboWalker战队获得亚军 [1] - 华南理工大学华南虎战队获得季军 [1] - 东北大学TDT战队获得殿军 [1] 技术亮点 - 赛事通过升级赛场地形(增设二级台阶、狭窄隧道等)引导参赛队研发轮腿平衡底盘及运动控制算法 [3] - 平衡反关节轮腿技术在赛场上广泛应用,各队聚焦结构与算法优化提升机器人负载、机动及地形适应能力 [3] - 相关技术突破契合安防巡检、灾害救援等需求,推动技术向实用化延伸 [3] 冠军技术 - 上海交通大学交龙战队的步兵机器人搭载边缘计算模块,通过神经网络实现敌方装甲板、能量机关扇叶识别 [5] - 支持远距离精准打击动态目标,推动深度学习等前沿视觉算法在复杂动态环境中的应用探索 [5] 亚军技术 - 中国科学技术大学RoboWalker战队基于激光雷达与先进算法实现规划导航、避障及多机通讯 [5] - 在赛场复杂环境下灵活应对"攻防"需求,引导学生关注前沿AI决策算法 [5] - 相关技术对接自动化工业生产、辅助驾驶、安防巡检等智能产业需求 [5] 备赛过程 - 参赛队员经历从"课堂理论"到"产品落地"的完整工程实践 [5] - 需要协调机械、电控、算法、视觉等多学科团队解决跨领域技术协同难题 [5] - 需要平衡性能、成本与可靠性,在有限资源下实现最优解 [5] 实践意义 - "全流程实战"模式让学生提前体验真实科研与产业开发的全周期挑战 [7] - 为学生未来投身智能安防、灾害救援、低空经济等领域奠定实践基础 [7]
AI教父Hinton,重新能坐下了
虎嗅· 2025-08-03 12:53
行业与公司发展 - 2012年Hinton团队在ImageNet竞赛中以15.3%错误率夺冠,标志深度学习在图像分类领域的重大突破 [30][31] - 深度学习复兴的两大前提:2010年前后计算能力与大数据成熟 [34] - Hinton团队开发的神经网络技术使机器识别常见物体的准确度达到前所未有的水平 [33] 关键技术突破 - Hinton与搭档提出玻尔兹曼机和反向传播算法,解决机器"从数据中自动提炼内部表征"的核心难题 [20] - ChatGPT底层架构采用Transformer,属于神经网络的一种特殊形式 [13] - 2012年深度学习从纯学术研究转向产业应用,成为科技巨头战略核心 [42][43] 重大商业事件 - 2013年谷歌以4400万美元收购Hinton创立的DNNResearch公司 [40][41] - 谷歌随后以6.5亿美元收购DeepMind,该交易被视为谷歌最值得的投资之一 [54] - DeepMind被收购后开发出AlphaGo、AlphaFold、Gemini等里程碑式AI产品 [55][57] 行业影响与趋势 - 2019年Hinton与LeCun、Bengio共获图灵奖,表彰其推动神经网络成为科技产业核心 [59][60] - 2023年Hinton预警AI风险,提出"AI30年内导致人类灭绝概率10%-20%"的观点 [76] - AI发展速度超预期,Hinton修正预测认为"AI5年内可能比人类更聪明" [76] 行业应用前景 - Hinton认为AI将颠覆所有行业,仅水管工等需要高度创造力的职业暂时安全 [76] - 谷歌通过整合DeepMind与谷歌大脑部门,持续产出尖端AI产品 [57] - 全球科技巨头围绕深度学习重构业务,涵盖搜索、语音、图像识别、自动驾驶等领域 [43]
DeepTiming:日内信息与相似度学习驱动择时
民生证券· 2025-07-31 17:02
量化模型与构建方式 1. **模型名称:民生金工深度学习股票收益预测模型** - **模型构建思路**:基于民生金工历史研究框架,结合日频和分钟频输入数据,通过深度学习预测股票收益,并利用滚动阈值生成交易信号[1][10]。 - **模型具体构建过程**: 1. **输入端**: - 日频特征:51个技术面/情绪面日频特征 + 7个日频基础量价指标 + 10个强化风格因子(通过PPO强化学习生成)[12][22]。 - 分钟频特征:52个分钟频特征(合成至日频)[22]。 2. **基分类器**: - 使用2个GRU分别对日频和分钟频特征解码[22]。 3. **市场信息嵌入**: - 指数量价数据 + 强化风格偏好生成权重嵌入[22]。 4. **损失函数**: - 多期股票收益作为预测目标,多期MSE均值作为损失函数: $$ \text{MSE} = \frac{1}{n} \sum_{i=1}^{n} (y_i - \hat{y}_i)^2 $$ 其中,\( y_i \)为实际收益,\( \hat{y}_i \)为预测收益[22][26]。 5. **信号生成**: - 预测值滚动阈值:过去一年预测值的70%分位数作为买入信号,30%分位数作为卖出信号,至少持有10个交易日[30]。 - **模型评价**:模型信号分布集中于0轴附近,右偏且尾部极窄,适合波段择时[27][29]。 2. **模型名称:SimStock股票相似度模型** - **模型构建思路**:通过自监督学习预测股票相似度,结合静态(行业/风格)和动态(量价规律)相关性,生成股票属性向量[47][52]。 - **模型具体构建过程**: 1. **输入数据**: - 个股过去40日量价数据 + Barra风格因子 + 资金流指标(形状为\( N \times 40 \times 20 \))[52]。 2. **样本构建**: - 正样本:\( X_{\text{正}} = 0.75X + 0.25X_{\text{随机}} \) - 负样本:随机抽取不相关特征[52]。 3. **训练目标**: - 最大化正样本相似度,最小化负样本相似度,使用余弦相似度衡量: $$ \text{相似度} = \frac{\mathbf{v}_i \cdot \mathbf{v}_j}{\|\mathbf{v}_i\| \|\mathbf{v}_j\|} $$ 其中,\( \mathbf{v}_i \)为股票属性向量[52][53]。 4. **输出**:个股属性向量用于初始化GRU隐状态,提升收益预测稳定性[57][59]。 - **模型评价**:相似度预测更关注行业而非市值,动态性更强[56]。 3. **复合模型:改进后的收益预测模型** - **构建思路**:将SimStock输出的股票属性向量初始化GRU隐状态,结合原有日频和分钟频输入[57][59]。 - **评价**:改进后模型显著提升预测稳定性,尤其在高波行业中效果突出[60][64]。 --- 模型的回测效果 1. **民生金工深度学习模型**: - 全A股平均年化收益:27%,累积超额收益77%(2019-2025)[33]。 - 沪深300成分股:年化收益17.2%,夏普比率1.24,最大回撤8%[38][41]。 - 中证500成分股:年化收益18.8%,夏普比率1.58,最大回撤10.3%[41][43]。 - 中证1000成分股:年化收益18.1%,夏普比率1.24,最大回撤21.3%[43][46]。 2. **改进后模型(加入SimStock)**: - 全A股平均年化收益:30%,累积超额收益109%[60]。 - 沪深300成分股:年化收益20.7%,夏普比率1.88,最大回撤8.5%[64][67]。 - 中证500成分股:年化收益23.4%,夏普比率1.97,最大回撤10.8%[68][71]。 - 中证1000成分股:年化收益22.5%,夏普比率1.56,最大回撤20.5%[71][73]。 3. **指数择时效果**: - 沪深300:年化收益5.1%,超额收益5.6%[79]。 - 中证500:年化收益12.4%,超额收益12.2%[82]。 - 中证1000:年化收益15.1%,超额收益14.9%[84]。 - 电力设备及新能源行业:年化收益36%,超额收益31.1%[101][103]。 --- 量化因子与构建方式 1. **因子名称:分钟频因子** - **构建思路**:从日内分钟级数据中提取量价相关性、波动率、动量等特征[109]。 - **具体因子示例**: - 分钟收益率与成交量相关系数 - 尾盘半小时动量 - 下行波动率占比 - 开盘成交占比[109]。 --- 因子的回测效果 1. **择时因子RankIC**:周度平均RankIC 4.5%,双周调仓多头年化收益23.2%(费后)[36]。 2. **改进后因子RankIC**:周度平均RankIC 4.2%,年化收益21.7%[74][75]。
机器学习因子选股月报(2025年8月)-20250730
西南证券· 2025-07-30 13:43
量化模型与构建方式 1. **模型名称:GAN_GRU模型** - **模型构建思路**:结合生成式对抗网络(GAN)和门控循环单元(GRU)的深度学习模型,用于挖掘量价时序特征并生成选股因子[4][13] - **模型具体构建过程**: 1. **数据输入**:使用18个量价特征(如收盘价、成交量、换手率等),采样形状为40*18(过去40天的特征)[17][18] 2. **GAN部分**: - 生成器(G):采用LSTM结构,输入原始量价时序特征(40×18),输出生成的特征(40×18)[33][37] - 判别器(D):采用CNN结构,通过卷积层处理二维量价时序特征,输出真假概率[33][35] - 损失函数: - 生成器损失:$$L_{G}\,=\,-\mathbb{E}_{z\sim P_{z}(z)}[\log(D(G(z)))]$$[24] - 判别器损失:$$L_{D}=-\mathbb{E}_{x\sim P_{d a t a}(x)}[\log\!D(x)]-\mathbb{E}_{z\sim P_{z}(z)}[\log(1-D(G(z)))]$$[27] 3. **GRU部分**:两层GRU(128,128)提取时序特征,后接MLP(256,64,64)输出预测收益pRet作为因子[22] 4. **训练方式**:半年滚动训练,每半年更新模型参数,训练集与验证集比例80%:20%[18] - **模型评价**:通过对抗训练提升特征生成能力,保留时序特性,适配金融数据的高噪声和非线性特点[33][37] 2. **因子名称:GAN_GRU因子** - **因子构建思路**:利用GAN_GRU模型输出的预测收益pRet作为选股因子,经行业市值中性化+标准化处理[22][41] - **因子具体构建过程**: 1. 模型输出的pRet截面排序,取前10%股票构成多头组合[46] 2. 因子值计算:$$Factor_{GAN\_GRU} = pRet_{标准化} + 行业市值中性化残差$$[22] --- 模型的回测效果 1. **GAN_GRU模型** - IC均值:11.43% | ICIR:0.89 | 年化超额收益率:24.86%[41][42] - 年化收益率:38.52% | 最大回撤率:27.29% | 信息比率(IR):1.62[42] 2. **GAN_GRU因子(行业表现)** - 当期IC最高行业:家用电器(27.00%)、非银金融(23.08%)[42] - 近一年IC均值最高行业:公用事业(14.43%)、商贸零售(13.33%)[42] - 多头组合超额收益:纺织服饰(5.19%)、公用事业(3.62%)[2][43] --- 量化因子与构建方式 1. **因子名称:GAN_GRU衍生行业因子** - **构建思路**:在申万一级行业内部分层测试GAN_GRU因子表现,生成行业特异性选股信号[42][43] - **具体构建过程**: 1. 按行业分组计算因子IC和多头组合超额收益[42] 2. 行业中性化处理:$$Factor_{行业} = Factor_{原始} - \beta_{行业} \times Industry_{哑变量}$$[22] --- 因子的回测效果 1. **GAN_GRU衍生行业因子** - 全A股多头组合年化超额收益:24.86% | 换手率:0.82[42] - 近一年IC均值:10.97% | 最新一期IC:9.27%[41][42] 2. **行业多头组合** - 近一年月均超额收益:家用电器(5.44%)、建筑材料(4.70%)[2][43] - 全行业跑赢基准比例:30个行业中21个跑赢(70%)[43] --- 其他关键点 - **数据预处理**:量价特征在时序上去极值+标准化,个股截面标准化[18] - **超参数**:batch_size=截面股票数,优化器Adam,学习率1e-4,损失函数IC[18] - **最新多头组合**:裕同科技、青山纸业等(2025年8月前十个股)[5][48]
大模型发展情况及展望:海内外大模型梳理
2025-07-30 10:32
【大模型发展情况及展望】:海内外大模型梳理 20250729 摘要 人工智能投资经历了三轮浪潮,当前这轮与前两轮相比,持续时间更长, 上涨力度更强劲,且资本开支投入力度和商业化回报潜力更高,市场对 未来行情持乐观态度。 深度学习通过构建深度神经网络,广泛应用于大语言模型,如 Transformer,通过思维树增强逻辑思维能力,显著提升了模型在问答 速度和问题解决方面的表现。 强化学习的引入,使得大语言模型不再依赖大量外部语料,通过少量反 馈数据即可反复训练,显著提升逻辑推理能力,标志着行业进入 post- training scaling law 阶段。 OpenAI 的 GPT-4.5 发布延迟,GPT-5 预计将在逻辑思维、动态处理和 图形界面操作等方面实现跨代提升,同时 O3 在文本和视觉推理方面表 现突出,并引入 agent 制作能力。 GROX 系列模型通过逐步增加算力和强化学习时间,表现惊人,为未来 大模型训练范式提供了重要参考,即大幅延长强化学习时间并投入更多 算力。 强的持续性,还显示出更高的资本开支投入力度和商业化回报潜力。 人工智能的发展历史及其当前阶段是什么? Q&A 人工智能在资本市场 ...
ChatGPT大更新推出学习模式!“一夜之间1000个套壳应用又死了”
量子位· 2025-07-30 08:24
梦晨 发自 凹非寺 量子位 | 公众号 QbitAI ChatGPT大更新,正式推出了 学习模式 (Study Mode): 不再只是给你答案,而是要像老师一样引导你一步步思考问题。 这项功能已经对免费版、Plus、Pro和Team用户开放,ChatGPT Edu用户也将在未来几周内用上。 除了简单的辅导一个问题之外,还可以用来准备一场考试。 OpenAI教育副总裁 Leah Belsky 指出:当ChatGPT被用于教学或辅导时,它能显著提升学生的学习效果。但如果仅仅把它当成一个"答案 机器",那反而会阻碍学习。 这话说得没错,数据显示约有三分之一的大学生正在使用ChatGPT来辅助学业,但学校和家长一直担心学生会用它直接抄答案,损害批判性 思维能力。 比如此前MIT一项研究发现,与使用谷歌搜索或完全不使用ChatGPT的人相比, 使用ChatGPT写作文的人在写作过程中的大脑活动较低 。 有网友提出学生可以随时切换到正常模式,继续抄答案。 不过OpenAI透露,目前不会推出让家长或老师把学生锁定在学生模式的工具,但未来可能会探索这个功能。 也有人感慨,一天之内又有1000个GPT套壳项目完蛋了。 Chat ...
“AI大神”李沐终于开源新模型,爆肝6个月,上线迅速斩获3.6k stars!
AI前线· 2025-07-25 13:36
整理 | 褚杏娟 7 月 23 日,"AI 大神"李沐宣布开源了 Higgs Audio v2,这是一个音频基础模型,构建在 Llama-3.2- 3B 基础之上,预训练数据包括超过 1000 万小时的音频以及丰富的文本数据。该模型目前在 Github 上已获得 3.6k stars。 "去年我们一直关注的是文本语言模型,让它智商足够高、能听从人的指示,一方面可以陪人玩游 戏,另一方面也能帮忙处理一些文案工作,简单来说就是能读能写。今年我们在想,能不能让模型能 听也能说。"李沐在 B 站发布的视频中说道。 随后,他表示,"语音是 AI 中一个相对比较悠久的领域,我其实并不是语音方面的专家。作为一个新 手,我的想法很简单,就是我不要去训练单独的语音模型,而是在文本大语言模型训练时加入大量的 语音数据,大力出奇迹,就想让文本语言模型智商不要下降,但同时掌握了用语音沟通的能力。" 李沐是全球知名 AI 深度学习科学家、深度学习框架 MXNet 作者之一,2008 年毕业于上海交通大学 计算机系,曾于微软亚洲研究院实习。毕业后任香港科技大学研究助理,2011 年加入百度任高级研 发;2012 年赴卡耐基梅隆大学攻读博 ...
Nature:Meta公司开发非侵入式神经运动接口,实现丝滑人机交互
生物世界· 2025-07-24 15:31
人机交互技术革新 - Meta公司现实实验室研发了一款手腕佩戴装置,可通过手写动作实现人机交互,无需个性化校准或侵入性手术[3] - 该装置将手腕肌肉电信号转换为计算机指令,显著提升交互流畅度和可及性规模[3] 技术原理与性能 - 研究团队基于数千名受试者数据开发高灵敏度手环,结合深度学习构建泛型解码模型,性能遵循尺度定律(随模型规模和数据量提升)[5] - 装置通过蓝牙实时识别手势,支持虚拟导航和文本输入(每分钟20.9个单词,手机键盘平均36词/分钟)[6] - 个性化数据可进一步优化解码精度,为生物信号解码器广泛应用提供方向[5] 应用场景与数据共享 - 神经运动手环特别适用于行动受限群体(如肌无力、瘫痪患者),改善其计算机交互能力[8] - 团队公开了包含300名受试者、超100小时表面肌电信号记录的数据库,推动sEMG领域研究[9] 学术成果发布 - 研究成果发表于Nature期刊,标题为《A generic non-invasive neuromotor interface for human-computer interaction》[2][10]