量化模型与构建方式 1. 模型名称:物理增强型样本熵择时模型 (Phys-Enhanced SampEn) * 模型构建思路:将非线性动力学的样本熵理论与物理学的推重比概念深度融合,构建一个一体化择时模型。其核心创新在于将“流动性调整推重比序列”作为样本熵的输入,使得计算出的熵值能够同时量化“价格波动的随机性”与“驱动力-风险平衡的规律性”,从而输出择时信号[4][78]。 * 模型具体构建过程: 1. 构建输入序列:首先计算流动性调整推重比序列 Zt=[TWRt],该序列融合了价格、成交量、波动率和流动性信息,作为后续样本熵计算的输入[79][80]。 2. 设定模型参数:嵌入维度 m=2,延迟时间 τ=1,相似性阈值 r=ETFstd×σstd,其中 σstd 为序列的标准差[82]。 3. 重构嵌入向量:在序列 Zt 上构建延迟坐标嵌入,形成 m 维嵌入向量序列:Vi(m)=[Zi,Zi+τ,⋯,Zi+(m−1)τ],i=1,2,⋯,N,其中 N=T−τ+1 为有效样本数[83][84]。 4. 计算向量间相似性:采用最大范数(Chebyshev距离)计算两个嵌入向量间的距离:d(Vi(m),Vj(m))=max0≤k≤m−1,1≤s≤2Zi+kτ(s),Zj+kτ(s)[86]。 5. 计算条件概率:对每个嵌入向量 Vi(m),统计其与其他向量(排除自身)的相似性比例:C_{i}^{m}(r)=\frac{1}{N-1}\times\\left\{j\!:\!d\left(V_{i}^{(m)},V_{j}^{(m)}\right)<r,j\neq i\right\}[87]。进而计算全局平均相似概率:Bm(r)=N1∑i=1NCim(r)[88]。 6. 计算物理增强型样本熵:类似地构建 Bm+1(r),最终定义物理增强型样本熵为:Phys−SampEn(m,r,τ)=−ln(Bm(r)Bm+1(r))。当 Bm(r)=0 或 Bm+1(r)=0 时,加正则化常数 10−6 避免对数发散[91][92]。 7. 生成择时信号: * 基于滚动窗口 W 个交易日的融合熵序列,定义经验分位数阈值:低熵阈值 Slow=Q0.4(Phys−SampEnt),高熵阈值 Shigh=Q0.6(Phys−SampEnt)[94][95]。 * 结合当前熵值 Phys−SampEnt 和推重比 TWRt 的方向,应用一套规则判断输出上涨、下跌或平盘信号。核心逻辑是:低熵态下系统规律性强,推重比数值指示趋势方向;高熵态下系统失序,规避方向性暴露或抓住反转趋势[95][97]。 2. 因子名称:流动性调整推重比 (TWR) * 因子构建思路:在传统推重比(累计收益率/波动率)的基础上进行优化,将驱动力项从“累计收益”升级为“量价共振收益”,并将风险项从“单一波动率”扩展为“波动率×流动性阻力”,从而构建一个同时评估趋势有效性和交易可操作性的综合指标[54][72]。 * 因子具体构建过程: 1. 计算驱动力 (Thrust):驱动力项定义为量价共振动量:Thrustvolp,t=(∑k=t−L+1trk)×(Volavg,tVolt)。其中,∑rk 为过去 L 日累计收益率,Volt 为当日成交量,Volavg,t 为过去 L 日平均成交量[56][58]。 2. 计算风险项 (Weight):风险项综合了价格波动风险和流动性阻力:Weightliq ,t=σt×(VoltVolavg,t)+10−6[64]。 * 价格波动风险 σt 为过去 L 日的年化波动率:σt=L−1252∑k=t−L+1t(rk−rˉt,L)2,其中 rˉt,L 为过去 L 日的平均收益率[65][66]。 * 流动性阻力通过比较当日成交量与近期平均成交量的比值来构建,比值大于1表示流动性差、阻力放大[68]。 3. 计算原始推重比:原始推重比为驱动力与风险项的比值:RawTWRliq,t=Weightliq,tThrustvolp,t[69]。 4. 标准化:为消除跨ETF的量纲差异,对原始推重比进行Z-Score标准化:TWRliq,t=σRawTWR,w+10−6RawTWRiiq,t−μRawTWR,W。其中,μRawTWR,W 和 σRawTWR,W 分别为过去 W 个交易日原始推重比的均值与标准差,10−6 为平滑项[70][71][72]。 3. 因子名称:样本熵 (SampEn) * 因子构建思路:样本熵是用于量化时间序列复杂性和规律性的指标。它通过计算“数据片段延长后,还能保持相似”的概率,来衡量序列的“混乱度”或不确定性。相比近似熵,样本熵通过排除自匹配,提高了在短序列下的无偏性和统计一致性[20][21][44]。 * 因子具体构建过程: 1. 重构嵌入向量:对长度为 N 的序列 x,设定嵌入维度 m 和延迟时间 τ,为每个时间点 i 构造 m 维嵌入向量:Xim=[x(i),x(i+τ),x(i+2τ),⋯,x(i+(m−1)τ)],i=1,2,⋯,Nm[25][26]。 2. 定义相似性度量:采用Chebyshev距离(最大范数)计算两个嵌入向量间的距离:d(Xim,Xjm)=maxk=0,1,⋯,m−1∣x(i+kτ)−x(j+kτ)∣。若距离小于阈值 r,则判定两个向量相似[28][29]。 3. 计算相似概率: * 对于每个嵌入向量 Xim,计算其与其他向量(j=i)相似的比例:Bim(r)=Nm−11∑j=1,j=iNmI(d(Xim,Xjm)<r).,其中 I(⋅) 为指示函数[31][33]。 * 对所有向量求平均,得到 m 维整体相似概率:Bm(r)= Nm1∑i=1NmBim(r)[32]。 4. 计算样本熵:将嵌入维度增加到 m+1,重复上述步骤得到 Bm+1(r)。样本熵最终定义为:SampEn(m,r,N)=−ln(Bm(r)Bm+1(r))[36]。概率衰减越慢(序列越规律),熵值越低;概率衰减越快(序列越随机),熵值越高[37]。 模型的回测效果 * 物理增强型样本熵择时模型 (单标的):回测期2017年1月至2025年11月,覆盖38只不同板块的ETF[7][101]。 * 宽基指数 (8只):策略年化收益率16.19%-41.67%,夏普比率1.04-1.69,最大回撤-14.32%至-25.48%,显著优于买入持有策略[106][108]。 * 周期资源型ETF (示例4只):策略年化收益率15.85%-44.81%,夏普比率0.77-1.89,最大回撤-13.25%至-29.61%,较买入持有大幅改善[116][118]。 * 新能源与科技型ETF (示例4只):策略年化收益率27.52%-33.45%,夏普比率1.27-1.51,最大回撤-21.14%至-31.31%,表现卓越[124][125]。 * 消费、医疗与金融型ETF (示例4只):策略年化收益率18.83%-30.28%,夏普比率0.98-1.37,最大回撤-14.43%至-29.45%,实现显著超额收益[130][132]。 * 物理增强型样本熵择时模型 (等权组合):基于38只ETF的择时信号动态构建等权组合。回测期内年化收益率37.20%,夏普比率1.76,索提诺比率251.62%,最大回撤-20.72%[137][140]。