BOCIASI情绪周期择时A股情绪指标体系之一
中银证券· 2025-02-12 21:44
报告核心观点 - 将 A 股情绪指标按灵敏度分为慢线和快线指标,为判断 A 股市场位置提供新参考,投资者可单独或结合观察指标进行择时 [1][2][7] A 股情绪指标介绍 构建方法 - 拟合 A 股情绪指标时纳入若干子指标,但不同子指标信息异质性明显,不适合统一拟合 [7] - 快线和慢线子指标选取区别在于归一化后的摆动频率,慢线子指标走势与全 A 指数有趋同性,快线子指标高频反馈全 A 指数短期情绪状态 [7] 指标构成 - 慢线(性价比)指标:用股权风险溢价 ERP、股债位置差、股债收益差、融资余额四个趋势性慢变量子指标基于历史数据归一后等权拟合 [7] - 快线(动量)指标:用 MA20 强势股占比、换手率、涨跌停比、RSI 四个高频快变量子指标基于历史数据归一后等权拟合 [7] 子指标处理方式 - 慢线指标 1(ERP):选万得全 A 股权风险溢价 ERP 数据,以三年滚动均值及标准差的±2 倍值为区间上下沿百分化,再取历史滚动 5%-95%区间数据归一 [10] - 慢线指标 2(股债位置差):从历史规律线性外推,用万得混合型基金指数净值固定倍数框定万得全 A 指数历史走势上下沿,选股债位置差数据,以万得混合基金指数净值固定倍数为区间上下沿归一,剔除区间外异常值 [10] - 慢线指标 3(股债收益差):选万得全 A 股债收益差数据,以三年滚动均值及标准差的±2 倍值为区间上下沿百分化,再取(5%-95%)区间数据归一 [10] - 慢线指标 4(融资余额):选三市融资余额数据,以 1 年滚动均值及标准差的±2 倍值为区间上下沿百分化,保留历史滚动(5%-95%)区间数据后归一,2014 年 9 月前融资数据指标用其他三项慢线指标平均值替代 [11] - 快线指标 1(MA20 强势股占比):用万得全 A 历史成分股中当日股价超 20 日均价的成分股数量占比原数据归一 [12] - 快线指标 2(换手率):用万得全 A 基于自由流通股本的换手率数据,以 1 年滚动均值及标准差的±2 倍值为区间上下沿百分化,再取历史滚动(5%-95%)区间数据归一 [12] - 快线指标 3(涨跌停比):用三市日涨跌停家数占总成分股的比例原数据,将对数处理后的差值归一 [12] - 快线指标 4(RSI):用万得全 A 指数 20 日超买超卖指标的历史滚动数据归一 [12] A 股情绪指标的实战效果 适用投资者 - 慢线指标提示频率低,适合投资久期长、资金规模大、换手率偏低的投资者;快线指标适合换手率偏高的投资者 [2][18] 慢线指标提示效果 - 归一化呈现助投资者理解市场性价比绝对水平,仅依据静态指标高低值判断买卖信号效果弱,因慢线指标只体现静态性价比,无前瞻效果且有周期性往复特征 [19] - 用三年滚动区间数据高低值作买卖信号截断值有风险,如上涨中继卖出信号过早提示、超跌反弹买入信号过早提示 [19] - 引入市场趋势前置判断条件,以万得全 A 指数 20 日均线除以 60 日均线 -1 作趋势判断指标,结果大于 2%为上行趋势,小于 -2%为下行趋势,中间为震荡市;原卖出提示信号进入上行趋势区间,提高筛选截断值上限;原买入提示信号进入下行趋势区间,降低筛选截断值下限 [20] - 慢线情绪指标提示频率偏低,但对全 A 指数中周期底部和顶部提示效果较好 [20] 快线指标提示效果 - 归一化呈现助投资者理解短周期市场情绪高低水平,进行高频仓位调整 [22] - 引入市场趋势前置判断指标,依据静态指标高低和 20 日滚动数据区间最大分位数和最小分位数作上下限提示门槛,上行市不提示买入信号,下行市不提示卖出信号 [22] - 快线指标提示频率上升,但在上行、下行市初期易走高,导致上行市卖出信号过早、下行市买入信号过早,投资者需增加主观判断逻辑 [22] - 将快线指标使用范围缩窄到震荡市区间提示,在震荡市中使用效果更好 [22] 快、慢线指标结合提示效果 - 结合观察慢线和快线(震荡区间)指标信号,BOCIASI 对市场大级别顶底及阶段顶底判断有较好提示效果,为 A 股市场短周期买卖点提供新参考 [27] - 慢、快线指标结合观察本质是观察全 A 指数在高/低性价比位置上的动量/拥挤度,产生四象限指示组合:慢线低位 + 快线低位为市场情绪底部类型,有买入价值;慢线低位 + 快线高位为底部反弹/反转类型,需增量逻辑判断;慢线高位 + 快线低位为高位震荡/回调类型,指数后续震荡或回调概率大;慢线高位 + 快线高位为上涨行情尾声类型,需警惕并果断调整仓位 [33][34] 误差统计及回测 误差统计 - 慢线信号时间误差(提前)平均 26 个交易日,提前涨跌幅平均值为 6.8% [38] - 如 2018 年 8 月 6 日首次发出买入信号至 10 月 19 日指数见底,提前 48 个交易日,提前幅度 9.5%;2022 年 3 月 15 日发出第一次买入信号至 4 月 27 日见底,提前 29 个交易日,提前幅度 7.3%等 [38] 回测结果 - 因快线情绪仅适用于 A 股短周期择时,长时间周期择时效果回测基于慢线情绪指标 [42] - 按慢线买卖信号触发次日开盘前调整股票仓位 5%/10%/15%/20%,剩余仓位由债券资产补足思路回测,买卖信号触发后仓位进行 15%/20%级别调整效果更优秀 [42] 当前指示(指南针) - 2025 年 2 月 10 日,BOCIASI - Slow 慢线指标从 26.6%升至 33.1%为中,BOCIASI - Express 快线指标从 26.8%升至 64.7%为中高 [50][52]
比亚迪智能化战略发布会:开启全民智驾时代
浦银国际证券· 2025-02-12 20:06
报告核心观点 比亚迪举办智能化战略发布会,发布天神之眼 C 高阶智驾及 21 款首批搭载车型,将推动智驾向大众市场普及,支撑并推动新能源车及智驾行业基本面保持强劲增长动能,多个相关领域企业有望受益 [1][2] 各部分总结 比亚迪智驾发布情况 - 2 月 10 日晚间,比亚迪举办智能化战略发布会,发布天神之眼 C 高阶智驾及 21 款首批搭载车型,将全系搭载高阶智驾,重点是天神之眼 C,用于推动智驾向大众市场快速普及,涵盖刚需场景 [1] - 天神之眼 C 在架构、传感器、算法、数据四个方面具备优势,璇玑架构全面接入 DeepSeek,赋能车端 AI、云端 AI 双循环 [1] - 搭载天神之眼 C 的首批 21 款车型涵盖 7 万元级到 20 万元级价格段,官方指导价与老款持平,智驾车型入门价格下探至 7 万元 [2] 行业销量预测及标的推荐 - 预计 2025 年中国新能源乘用车销量达 1578 万辆,同比增长 28%,对应渗透率 53.7%,比亚迪今年有望接近并冲击 550 万辆销量,零跑、小鹏分别有望达 50 万辆、40 万辆年度销量,蔚来、理想等头部智驾车企也有望同步受益 [3] 受益领域及企业 - 智驾及智能座舱 Tier 1 将受益于智驾在大众市场的普及,入门基础智驾域控价格低至 400 - 500 元,比亚迪电子将充分受益,建议关注知行汽车科技、佑驾创新等 [3] - 智驾芯片以及智能座舱芯片有望大规模起量和应用,中高阶智驾渗透率目前不到 20%,相关芯片解决方案潜在增长空间大,预计英伟达、Mobileye 的智驾 SoC 以及高通的智能座舱 SoC 将保持增长,建议关注地平线机器人、黑芝麻智能等中低阶方案芯片厂商 [6] - 智驾增量传感器零部件将迎来降本后的大规模普及,比亚迪天神之眼 C 搭载 12 颗摄像头,舜宇光学、丘钛科技、韦尔股份会受益;车载激光雷达性价比产品进入 2000 元以下价格带,比亚迪天神之眼 A 和 B 搭载激光雷达带来行业增量,预计禾赛科技和速腾聚创今年乘用车激光雷达出货量大幅增长 [7] - 智驾在大众市场的普及有利于无人驾驶行业发展,今年有望在更广区域看到更多无人驾驶出租车投放市场,建议关注小马智行和文远知行 [7]
市场分析:电源半导体行业领涨 A股稳步上行
中原证券· 2025-02-12 20:06
报告核心观点 - A股市场周三低开高走、小幅震荡上行,未来股指总体预计将保持震荡上行格局,当前部分优质公司已具备较高投资价值,建议短线关注半导体、软件开发、电源设备以及汽车等行业投资机会 [2][3][16] A股市场走势综述 - 周三A股市场低开高走、小幅震荡上行,沪指全天小幅上扬,创业板指表现强于主板,上证综指收市报3346.39点,涨0.85%,深证成指收市报10708.88点,涨1.43%,科创50指数上涨1.63%,创业板指上涨1.81%,两市全日成交17123亿元,较前一交易日增加 [2][7][8] - 盘中电源设备、半导体等行业表现较好,贵金属、珠宝首饰等行业表现较弱,超七成个股上涨,电源设备、半导体等行业涨幅居前,贵金属、珠宝首饰等行业跌幅居前,半导体、电源设备等行业资金净流入居前,文化传媒、通信设备等行业资金净流出居前 [2][7] - A股主要指数多数上涨,上证50涨0.98%,沪深300涨0.95%,中证500涨1.40%,中证1000涨1.53%,中小100涨1.49%,万得全A涨1.19%,万得全A(除金融、石油石化)涨1.20%,万得蓝筹280指数涨0.90% [8] - 港股主要指数上涨,恒生指数涨2.6%,恒生国企指数涨2.8%,恒生红筹指数涨2.4% [9] - 中信一级行业中综合金融、房地产、计算机等行业涨幅居前,纺织服装、煤炭、有色金属等行业跌幅居前 [10] 后市研判及投资建议 - 当前上证综指与创业板指数平均市盈率分别为14.08倍、37.87倍,处于近三年中位数平均水平,适合中长期布局,两市周三成交金额处于近三年日均成交量中位数区域上方 [3][16] - 2024年底政治局会议释放积极政策信号,2025年中国经济预计保持复苏态势,GDP增速有望达5%左右,主要经济指标将持续改善,监管层将继续实施积极财政政策和稳健货币政策,为资本市场营造良好环境 [3][16] - 经过前期调整,A股市场整体估值回归合理区域,部分优质公司具备较高投资价值,未来股指总体预计震荡上行,但需关注政策面、资金面及外部因素变化 [3][16] - 建议短线关注半导体、软件开发、电源设备以及汽车等行业投资机会 [3][16]
特朗普2.0新政初剖:特朗普变革
天风证券· 2025-02-12 18:31
报告核心观点 - 上任20日以来特朗普新政中政府改革侧重最多,经贸次之,移民相对较少,经贸中以放松AI监管为主,关税政策或成特朗普与其他贸易伙伴谈判核心筹码,人工智能竞赛和政府行政改革或为重点工作 [5][38][40] 特朗普2.0行政令分析 推翻多个拜登政府政令 - 1月20日特朗普就职当天签署超40个总统行政令,落实多方面政策主张,废除拜登政府近80项政策,截至2月11日共签署93项行政文件 [1][8] - 行政令涉及退出《巴黎协定》、退出世卫组织、给予TikTok宽限期等,关税上宣布对加墨和中国商品征关税后延期,恢复中国小包裹免税门槛 [9] - 美国行政令由总统签署管理联邦运作,总统可撤销修改,国会可立法推翻,最高法院可中止或推翻越权行政令 [10] 目前新政主要聚焦于联邦政府层面 - 截至2月11日,93项行政文件中29项联邦政府命令、14项经贸命令、9项涉及移民等,新政聚焦联邦政策改革,经贸第二,移民第三 [12] 加密货币与人工智能落地较快 - 特朗普上任经济政策分布于贸易保护、加征关税和人工智能,支持加密货币和放开人工智能监管落地积极 [15] - 上任首日废除拜登人工智能行政令,1月23日成立总统科技委员会,强调支持数字行业,家人发行数字货币,宣布“星际之门”AI项目 [16] 践行美国优先贸易政策 - 竞选时特朗普经贸主张降低利率、减税、加征关税,1月20日签署《美国优先贸易政策》备忘录,为美经济与国家安全服务,检视中美贸易 [19] 关税依旧是核心工具 - 特朗普宣布对加墨和中国商品征关税后延期,恢复中国小包裹免税门槛,将宣布对等关税措施,贸易代表承诺推行强硬政策 [20] - 加征关税目的有三种可能,目前政策反复是为平衡国内政治和国际关系,关税是博弈核心工具 [21] DOGE大力度改革超预期 目前DOGE做了什么 - 特朗普就职后,马斯克宣布对联邦政府机构改革,涵盖人事、盘活资产、削减部门、审查支出和改革对外援助五方面 [27] - 人事改革要求员工线下工作、削减人数等,提供“延迟辞职”选项;削减多元化部门删除网站、取消合同;盘活资产暂停政府租赁合同;审查支出对多部门开展审查;改革对外援助暂停援助、关闭国际开发署 [27][28][30] DOGE核心成员介绍 - 2月4日曝光“政府效率部”6名成员身份,年龄19 - 25岁,无行政任职经验,多有科技创业背景,获马斯克认可 [32] DOGE改革并非一帆风顺 - 维韦克·拉马斯瓦米退出DOGE,国会众议院民主党成员呼吁调查,19个州总检察长起诉,法官阻止其访问财政部支付系统,改革或遭党内部分议员反对 [33][35] 总结 - 就职近20天,特朗普行政令聚焦联邦政府,经贸第二,移民第三 [38] - 贸易关税方面,签署《美国优先贸易政策》备忘录,关税是博弈核心工具 [38] - 人工智能放松监管落地积极,成立总统科技委员会,强调支持数字行业 [39] - 政府效率部推动改革涵盖五方面,但核心成员无行政经验,部分改革受抵制,新政或面临更多阻力 [39]
黄金周报:市场政策避险情绪上升,金价继续上行
东方金诚· 2025-02-12 18:31
核心观点 - 市场对政策避险情绪上升带动金价继续上行,上周五沪金主力期货价格较前周五上涨1.28%至648.90元/克,COMEX黄金主力期货价格上涨1.36%至2777.40美元/盎司,黄金T+D现货价格上涨1.26%至645.67元/克,伦敦金现货价格上涨2.55%至2770.00美元/盎司;本周黄金价格走势料将维持高位,因特朗普关税等计划不明及政策或加剧通胀预期[1][2] 上周市场回顾 黄金现货期货价格走势 - 上周五沪金主力期货价格收于648.90元/克,较前周五上涨8.22元/克;COMEX黄金主力期货价格收于2777.40美元/盎司,较前周五上涨37.40美元/盎司;黄金T+D现货价格收于645.67元/克,较前周五上涨8.01元/克;伦敦金现货价格收于2770.00美元/盎司,较前周五大幅上涨68.88美元/盎司[4] 黄金基差 - 上周五国际黄金基差为 -4.80美元/盎司,较前周五大幅回升31.60美元/盎司;上海黄金基差为 -0.95元/克,较前周五回升0.27元/克[6] 黄金内外盘价差 - 上周五黄金内外盘价差为 -1.06元/克,较前周五的 -1.81元/克小幅回升,因临近春节国内黄金消费上涨,外盘金价涨幅小于内盘;上周原油价格回落带动金油比回升,白银下跌致金银比上升,金铜比回升因临近春节市场需求季节性下降使铜价回落[8] 持仓分析 - 现货持仓方面,上周黄金ETF持仓较前周小幅回落,截至上周五全球最大SPRD黄金ETF基金持仓量为860.17吨,较前周减少18.95吨,国内黄金T+D累计成交量小幅回落,全周累计成交量为178628千克,较前周减少1.81%;期货持仓方面,截至1月21日黄金CFTC资管机构多头持仓量增加,空头持仓量基本持平,多头净持仓量上升;库存方面,上周COMEX黄金期货库存大幅增加,上周五上期所黄金仓单持平于15141千克[12] 宏观基本面 重要经济数据 - 特朗普1月20日就职,承诺“美国优先”,聚焦打击非法移民、高通胀、开采石油等;美国参议院财政委员会1月21日通过贝特森出任美国财长提名并将提交全体表决;1月23日特朗普称不在美生产企业面临巨额关税,呼吁OPEC降油价,敦促美联储降息;1月24日数据显示美国12月成屋销售超预期连续三月上升,但2024年全年成屋销售为1995年以来最差且连续三年下滑[18][20][21][23] 美联储政策跟踪 - 上周为1月议息会议静默期,美联储官员未释放增量政策信息,但特朗普1月24日强调要求“美联储立即降低利率”,还质疑鲍威尔利率决策,打算适时与鲍威尔对话[33] 美元指数走势 - 上周美元指数大幅波动下降,因特朗普就职行政命令不及预期,贸易政策不明,且其表示可能征关税、要求降息,截至上周五较前一周五大幅下跌1.74%至107.48[34] 美国TIPS收益率走势 - 上周美国10年期TIPS收益率窄幅震荡与前一周持平,因市场对特朗普关税等政策及通胀预期充满不确定性,上周五持平于2.20%[37] 国际重要事件跟踪 - 加沙停火协议继续生效,1月25日哈马斯释放四名以色列女兵人质换200名巴勒斯坦囚犯;俄乌双方仍激烈交战,特朗普就任后乌高层要求坚守阵地,乌军大规模调动兵力[38]
策略专题报告:中国制造业“登顶”的路径
华福证券· 2025-02-12 18:31
核心观点 - 中国打破美国主导的“垄断分工模式”,美国模式难以遏制中国崛起 [4] - 金融资本逐利抑制科技和经济发展 [4] - 各地区制造业发展战略存在短板,中国崛起或带动全球重返效率优先 [4] - 中国崛起核心路径是制造业复杂度提升与自主可控,模式特征是规模优势与“以量换利” [4] - 中国制造系统迭代赋能产品力,制造业龙头具长期配置价值,看好AI相关软硬件 [4] 全球制造业格局的演进脉络 战后重建与三足鼎立(战后至80年代中期) - 美国通过马歇尔计划和《旧金山合约》推动欧日经济复苏,形成以美为中心的全球贸易网络 [14] - 日德通过技术积累与出口导向战略提升制造业竞争力,80年代中期形成“美欧日三足鼎立”格局 [14] 全球化分工深化与美国的控制(80年代中后至2008年) - 美国通过资本、技术、市场控制全球制造业链,鼓励各国细分领域垄断,抑制跨领域竞争 [14] - 日本带动亚洲四小龙与东南亚国家提升制造业复杂度,但未撼动全球格局 [14] - 日本90年代后制造业“空心化”,德国通过“自主可控”维持竞争力 [14] - 2000年前中国承接低端制造,未形成系统性威胁 [14] 金融危机后的转折(2008至今) - 美国“加杠杆”刺激内需,需求外溢反哺中国,后靠科技垄断提高GDP占比 [17] - 欧洲欧债危机后资本开支停滞,制造业竞争力被中国取代 [17] - 日本产业链完整度衰退,仅保留少数高端领域 [17] - 中国通过大规模资本投入、提升产业链完整性与复杂度,抢占全球份额 [17] 美国资本化潜在的影响 资本化推动全球分工的“垄断均衡” - 美国通过资本鼓励各国细分领域垄断,抑制跨领域竞争 [77] 资本化与垄断的共生关系 - 资本强化头部企业垄断地位,抑制中小企业创新,导致行业技术进步放缓 [80] - 美国资本干预使日本半导体企业转向细分材料领域,德国企业未突破新兴领域 [80] 美国资本控制的底层逻辑 - 美国通过美元霸权和金融市场维系全球垄断格局,优先支持本土科技企业,使利润回流 [83] - 美国金融资本在日本制造业核心龙头公司持股比例高 [87] 垄断格局的局限性 - 资本化垄断模式导致技术停滞、需求依赖美国“加杠杆” [90] - 金融资本驱动行业垄断,行业集中度提升,效率下降 [91][95] 中国制造业崛起的核心逻辑 路径选择:打破全球分工的“垄断均衡” - 中国制造业向高复杂度领域延伸,打破美国“各环节垄断”模式 [100] - 中国通过政策构建完整产业链,降低对外部技术依赖 [100] - 中国凭借庞大市场和高效体系,“低价高质”输出挤压欧美日利润空间 [100] 中国制造业现状 - 中国制造业产业链完整度和复杂性不断提升,远超美国和日本 [101][103] - 中国制造业ROE低于欧美日,通过“以量换利”抢占份额 [110] 中国制造当前优势与未来挑战 - 中国制造系统迭代赋能产品力,扩大竞争优势产业,制造业龙头具长期配置价值,看好AI相关软硬件 [112] - 中国未来面临债务驱动转型、技术突破瓶颈、全球需求波动挑战 [112]
Coder:当大型语言模型遇到编程时-代码智能的兴起
杭州深度求索人工智能基础技术研究· 2025-02-12 17:00
报告的核心观点 - 推出DeepSeek - Coder系列开源代码模型,规模从13亿到330亿不等,在多个基准测试中表现出色,超越现有开源模型,缩小与闭源模型性能差距,且处于宽松许可下可用于研究和商业 [2][8] - 通过精心筛选数据、采用特定训练策略和架构优化等方式提升模型性能,并通过额外预训练增强自然语言理解和数学推理能力 [7][21][59] 各部分总结 1. Introduction - 大型语言模型推动代码智能发展,但开源与闭源模型存在性能差距,许多研究人员和开发者难以访问闭源模型 [6] - 推出DeepSeek - Coder系列开源代码模型,涵盖不同规模和版本,从2万亿个标记重新训练,采用仓库级数据和FIM方法,扩展上下文长度以提升性能 [7] 2. 数据收集 - 训练数据集由87%源代码、10%英语代码相关自然语言语料库和3%代码无关中文自然语言语料库组成 [11] - GitHub数据抓取和过滤:收集截至2023年2月前创建的公共仓库,应用过滤规则将数据总量减至原始大小的32.8% [12] - Dependency Parsing:解析文件间依赖关系,按依赖顺序排列文件,采用拓扑排序算法处理文件列表 [14] - Repo级重复数据删除:在代码仓库级别进行近似去重,确保仓库结构完整性 [17] - 质量筛选和去污:使用编译器、质量模型和启发式规则过滤低质量数据,实施n - 克gram过滤过程防止数据污染,总数据量798GB,共6亿个文件 [18] 3. 培训政策 3.1. 培训策略 - Next Token预测:连接文件形成固定长度条目,训练模型根据上下文预测后续标记 [21] - Fill - in - the - middle:采用FIM预训练方法,有PSM和SPM两种模式,实验表明FIM和代码完成能力存在权衡,最终选择50%的PSM率为首选训练策略 [22][25] 3.2. Tokenizer - 使用HuggingFace Tokenizer库训练字 - piece编码(BPE)分词器,词汇量大小为32,000 [27] 3.3. 模型体系结构 - 开发参数量为1.3B、6.7B和33B的模型,基于DeepSeek大型语言模型(LLM)框架构建,采用旋转位置嵌入(RoPE),33B模型集成分组查询注意力(GQA),使用FlashAttention v2加速计算 [28] 3.4. 优化 - 使用AdamW作为优化器,调整批量大小和相关参数 [29] 3.5. Environments - 使用HAI - LLM框架进行实验,采用张量并行、ZeRO数据并行和PipeDream管道并行策略,利用配备NVIDIA A100和H800 GPU的集群,采用InfiniBand互连技术 [29][30] 3.6. Long Context - 重新配置RoPE参数扩展上下文窗口,将缩放因子从1增加到4,基本频率从10000调整到100000,模型在16K令牌范围内表现最佳 [31] 3.7. Instruction Tuning - 通过基于指令的微调方法,使用高质量数据开发DeepSeek - Coder - Instruct,使用余弦调度策略,包含100步预热阶段,初始学习率为1e - 5,使用4000万个令牌的批量大小和总共20亿个令牌 [32] 4. 实验结果 4.1. 代码生成 - HumanEval和MBPP基准:DeepSeek - Coder - Base在这两个基准上取得先进性能,超越同样规模的开源模型CodeLlama - Base 34B,指令微调后超越闭源的GPT - 3.5 - Turbo模型,缩小与GPT - 4差距 [38][40] - DS - 1000基准:DeepSeek - Coder模型在所有库中实现较高准确性,能在实际数据科学工作流程中准确使用库 [41][42] - LeetCode竞赛基准:DeepSeek - Coder模型在开源编码模型中表现出色,DeepSeek - Coder - Instruct 33B是唯一优于GPT - 3.5 - Turbo的开源模型,采用Chain - of - Thought(CoT)提示可提升模型能力 [44][46] 4.2. 填写中间代码完成 - DeepSeek - Coder模型使用0.5的FIM率训练,在单行填充基准测试中表现优于StarCoder和CodeLlama,建议在代码补全工具中部署DeepSeek - Coder - Base 6.7B模型 [50][53] 4.3. 跨文件代码完成 - 使用CrossCodeEval评估模型跨文件完成能力,DeepSeek - Coder在多种语言的跨文件完成任务中始终优于其他模型,仓库级别预训练有效 [54][56] 4.4. 基于程序的数学推理 - 采用程序辅助数学推理(PAL)方法,在七个基准测试中,DeepSeek - Coder模型表现出色,33B变体潜力巨大 [57] 5. 继续从一般LLM的预培训 - 从通用语言模型DeepSeek - LLM - 7B Base进行额外预训练,生成DeepSeek - Coder - v1.5 7B,该模型在数学推理和自然语言处理能力上显著提升 [59][62] 6. Conclusion - 介绍DeepSeek - Coder系列模型,基于精心筛选的项目级代码语料库训练,扩展上下文窗口,在多种标准测试中超越现有开源代码模型 [64] - 微调后的DeepSeek - Coder - Instruct 33B在编程相关任务中优于GPT - 3.5 Turbo,额外预训练后的DeepSeek - Coder - v1.5增强了自然语言理解能力 [65][66]
动态、高分辨率贫困数据稀缺环境中的测量
世界银行· 2025-02-12 16:57
核心观点 报告评估四种非洲国家详细家庭普查提取数据的替代基于卫星的深度学习方法,以加速大规模、细粒度和动态贫困测量的进步,结果表明变压器架构解决多个开放问题,结合卫星图像、公开可获取的地理特征以及新的深度学习架构,可在数据稀缺环境中实现高度局部化和动态的贫困测量 [4]。 研究背景 - 准确、最新且高度细化的经济福祉测量对监测和实现国际减贫目标至关重要,但官方对低收入和中等收入国家的贫困测量长期依赖家庭调查,存在耗时、难以获得全面及时数据、无法生成村庄或小区层面可靠估计等问题,因此需要成本效益高且可扩展的替代方案 [8][9] - 近年来公开可用的遥感数据日益丰富,机器学习的最新进展改变了生计测量格局,早期研究利用卫星图像和机器学习估算财富,后续研究引入改进提高了测量精度 [10][11] 研究方法 数据集构建 - 汇集大规模、多分辨率和多时间尺度的贫困数据集,涵盖四个非洲国家(马拉维、莫桑比克、布基纳法索和马达加斯加)超过120万户家庭的数据,包含两个马拉维城市内精确地理参考的测量数据及同一地点随时间的重复测量数据 [11] - 使用国家普查问卷的数据构建资产财富指数,将七种住房特征按1到5的等级排序,六项资产用二元分类评估,数据标准化后构建主成分分析模型,提取第一个主成分作为资产财富指数,并汇总到行政区域级别标注 [34] - 国家层面的贫困及其变化预测收集白天Landsat卫星影像,马拉维和莫桑比克有双时间点影像对;城市级别的贫困情况预测收集PlanetScope和SkySat多光谱卫星图像 [36] 模型构建 - 比较基于树的模型XGBoost和两种先进的深度学习模型(基于卷积神经网络的模型和基于编码器 - 线性架构的变换器模型) [37] - XGBoost回归模型,仅使用卫星影像时用三个矩(均值、标准差和偏度),结合卫星影像和地理空间特征时用一个矩(均值);财富变化预测将两个年份的所有通道矩输入模型预测AWI的变化 [38] - 基于ResNet - 18的CNN模型进行财富水平预测和变化预测,财富水平预测先提取深层特征,通过全局平均池化层计算嵌入向量,附加两个多层感知器层预测AWI;贫困变化预测将两个时间点的图像沿通道轴连接提取深层特征 [38] - 变压器架构采用SwinV2 - T作为骨干网络提取深层层次特征,附加两层MLP层预测AWI;通过条件机制将地理空间特征融入深层特征;贫困变化预测采用Siamese网络架构,共享SwinV2 - T骨干网络,连接两个深层特征集合输入两层MLP层预测贫困变化 [39] 模型训练与评估 - 所有深度模型使用相同配置训练,通过最小化均方误差损失并使用AdamW优化器从头到尾进行端到端训练,训练100个周期,总批次大小为32,学习率为常数1e - 4,权重衰减为1e - 2,训练数据增强采用D4旋面群变换 [40] - 采用五折交叉验证的方法评估模型性能,为每个国家或城市训练五个不同的模型,在四折数据上训练,剩余一折上测试,用R²作为级别和更改预测的度量 [40] - 模拟两种数据可用性受限的场景:限制图像数量,使用完整训练集样本的1%、5%、10%、25%、50%和100%进行实验;限制图像中的户数,引入替代的“10户资产财富”标签 [41] 研究结果 国家一级财富预测 - 变压器模型在马拉维、莫桑比克和马达加斯加表现更佳,使用整个普查提取数据训练时,R²值分别为0.83、0.70和0.62;在布基纳法索,基于卫星影像和地理空间特征的XGBoost模型表现最佳,解释了62.9%的变异,简单变压器模型也保持竞争力,解释了57.4%的变异 [14] - 实证识别出训练样本数量为原始训练数据集的10%是关键转折点,在此之下估计精度会迅速下降 [14] - 地理空间特征能显著改善国家一级财富预测的绩效,特别是在布基纳法索,训练样本量较小时地理空间特征尤为有益 [17][18] 国家一级财富变化预测 - 基于完整样本训练的深度学习模型能够捕获马拉维52%的变化和莫桑比克42%的变化,给定相同输入数据时,深度模型表现优于XGBoost [19] - 变压器模型在估计莫桑比克十年财富变化方面略微优于常用的CNN,在马拉维达到相当性能;减少采样地点的数量比减少每批次样本的家庭数量对准确性的下降影响更大 [21] 城市级财富预测 - CNN和Transformer模型在两个城市中始终优于XGBoost,Transformer模型在Blantyre表现明显优于CNN,在Lilongwe实现与CNN相当的性能;所有模型随着训练数据比例增加表现显著改进,达到约25% - 50%后性能提升开始停滞 [26] - SkySat在各种训练数据比例下均一致地优于PlanetScope,SkySat适用于高精度要求的当地区域财富测量,PlanetScope更适合进行大规模财富mapping [27] - 城市级别的财富预测中,地理空间特征通常会降低模型性能;实现了精确的大规模、城市级财富地图绘制,0.3公里分辨率城市级财富图能解释利隆沃大约76%的变化情况,解释布兰太尔大约67%的变化情况 [27][28] 研究结论与展望 - 变压器模型在横截面财富预测、城市内财富预测和财富变化预测中表现出色,优于CNN和XGBoost模型,强调了开发相关工具、文档和培训材料以及不确定性估计方法的重要性 [29][30] - 获得大量训练数据对估计预测模型很重要,未来研究可探讨在小样本量训练变压器模型时提高性能的方法,以及变化模型中参数在时间和/或空间上的稳定性 [32]
技术趋势:交通运输的未来
世界知识产权组织· 2025-02-12 16:56
报告核心观点 - 报告探讨新兴技术和创新方法对交通运输方式的变革,强调可持续性重要性,旨在为相关人士提供见解,推动构建可持续、高效且互联的全球交通运输系统 [3][5] - 交通运输业面临可持续发展与数字化转型挑战,需平衡环境因素与新技术机遇,用技术解决方案应对交通系统复杂性 [6] - 报告通过分析专利等数据识别技术趋势,强调知识产权对创新的支持作用,展望交通运输变革性未来,推动符合联合国2030议程的交通系统发展 [21][22] 报告结构 - 采用数据驱动方法编制,结合传统专利搜索与AI驱动的主题提取,围绕陆地、海洋、空中和太空四大交通运输方式以及可持续性和数字化两大宏观趋势组织内容 [7] 技术趋势集群 - 识别出可持续推进、自动化和循环利用、通信与安全、人机界面(HMI)四大技术趋势集群,是未来交通重要创新领域 [9] - 可持续推进技术用电动推进、氢燃料电池等替代能源减少环境足迹,推动能源转变,实现更低排放和可持续未来 [10] - 自动化与循环利用通过工业机器人等技术简化生产流程,强调资源可持续使用,减少环境影响 [10] - 通信与安全技术如激光雷达传感器等实现实时数据交换,对自动驾驶等发展重要,确保交通系统互联安全 [10] - HMI技术通过触摸显示屏等进步改变用户与交通系统交互方式,提升体验、安全和可达性 [11] 专利数据分析关键发现 - 2000 - 2023年间,与未来交通相关发明(专利家族)超110万项,年均复合增长率11%,远超传统交通技术4% [12] - 可持续推进技术专利申请推动可持续发展趋势,通信和安全技术专利主导数字化趋势 [12] - 地面运输领域专利数量最多,几乎是海运、空运和太空运输领域专利总数的三倍多 [12] - 前五大发明地为中国、日本、美国、韩国和德国,占所有发明90%以上,近年中国、瑞典、意大利和印度专利增长率达两位数 [12] - 德国专注地面运输,挪威专注海运,法国专注空运和太空运输 [12] 知识产权作用 - 知识产权鼓励研发投资,促进新技术创造,WIPO通过计划和服务帮助发明者保护和商业化创新成果,推动交通运输领域增长发展 [17] 报告愿景 - 设想未来交通多种潜在情景,激励创新者解决监管和标准障碍,开发颠覆性技术,推动向可持续、高效且无缝连接交通网络进步 [18]
超越狗和猫:探索其他后院动物和野生动物的生长
艾意凯咨询· 2025-02-12 16:33
报告核心观点 - 其他伴侣动物、家养动物及野生动物爱好构成的宠物和动物市场正不断增长,零售商和品牌可通过扩展产品线等方式抓住这一市场机会 [1][32][33] 后院动物市场现状 - 除狗和猫外的其他动物及其相关活动受关注,数百万家庭参与其中,带来宠物拥有趋势转变 [1] - 2022 - 2023年,后院动物类别年增长率约13%,高于整体宠物和动物类别近9%的增长率 [4] - 2018 - 2020年,养后院鸡的比例从8%升至13%,且在千禧一代和Z世代中较流行 [6][7] 市场关键驱动因素 人口迁移 - 2020 - 2023年超200万人迁至人口密度低的地区,城市中心居民净流失,预计迁移将持续,更多人有后院,增加养后院动物可能性 [9][11] 消费者态度变化 - 2018 - 2023年,园艺和草坪护理支出年均增长率8%,2023年畜禽供应支出增长8%,消费者对户外活动兴趣增加 [12][13] 搜索和社交媒体趋势 - “如何照顾鸡”的Google搜索兴趣五年内增长87.5%,Instagram和TikTok上相关教育内容增多,粉丝群体庞大 [14] 潜在市场规模 - 2024年4月调查显示,约10%非后院动物主人和业余爱好者未来五年考虑加入市场,短期内可能有1300 - 1400万户家庭加入 [16][17] 后院动物主人特征 当前主人 - 更可能是女性且年龄较小,52%年龄在45岁以下,95%拥有后院,对动物热情,推动用品和护理高支出 [19][20][21] 潜在主人 - 更年轻且富裕,66%年龄在45岁以下,42%家庭收入超10万美元,预示市场将继续增长 [22] 人类化趋势影响 - 人类化趋势推动宠物狗和猫高端产品创新和消费增长,小型宠物也有类似趋势,相关高品质产品需求增加 [23] 零售和品牌机会 零售商 - 主要宠物零售商自2022年起增加后院动物产品线15% - 40%,Petco鸡和家禽产品系列两年增长超300% [24] - 特拉斯科公司“鸡日”活动后销售增长,2023年售出超1100万只小鸡,较2019年增长约46.7% [26] 品牌 - Compana、Kalmbach饲料、生产者的骄傲等品牌提供多种后院动物产品 [27][28] - Kaytee、雀巢、Nutrena等公司通过扩展或收购进入家用宠物市场 [30] - 小品牌在细分市场推动创新,展现市场动态性和增长潜力 [31]