高维时空嵌入的视角:物理增强型样本熵择时模型

量化模型与构建方式 1. 模型名称:物理增强型样本熵择时模型 (Phys-Enhanced SampEn) * 模型构建思路:将非线性动力学的样本熵理论与物理学的推重比概念深度融合,构建一个一体化择时模型。其核心创新在于将“流动性调整推重比序列”作为样本熵的输入,使得计算出的熵值能够同时量化“价格波动的随机性”与“驱动力-风险平衡的规律性”,从而输出择时信号[4][78]。 * 模型具体构建过程: 1. 构建输入序列:首先计算流动性调整推重比序列 Zt=[TWRt]Z_{t}=[T W R_{t}],该序列融合了价格、成交量、波动率和流动性信息,作为后续样本熵计算的输入[79][80]。 2. 设定模型参数:嵌入维度 m=2m = 2,延迟时间 τ=1\tau = 1,相似性阈值 r=ETFstd×σstdr = ETF_{std} \times \sigma_{std},其中 σstd\sigma_{std} 为序列的标准差[82]。 3. 重构嵌入向量:在序列 ZtZ_t 上构建延迟坐标嵌入,形成 mm 维嵌入向量序列:Vi(m)=[Zi,Zi+τ,,Zi+(m1)τ],i=1,2,,NV_{i}^{(m)}=\left[Z_{i},Z_{i+\tau},\cdots,Z_{i+(m-1)\tau}\right],i=1,2,\cdots,N,其中 N=Tτ+1N = T - \tau + 1 为有效样本数[83][84]。 4. 计算向量间相似性:采用最大范数(Chebyshev距离)计算两个嵌入向量间的距离:d(Vi(m),Vj(m))=max0km1,1s2Zi+kτ(s),Zj+kτ(s)d\left(V_{i}^{(m)},V_{j}^{(m)}\right)=\operatorname*{max}_{0\leq k\leq m-1,1\leq s\leq2}\left|Z_{i+k\tau(s)},Z_{j+k\tau(s)}\right|[86]。 5. 计算条件概率:对每个嵌入向量 Vi(m)V_i^{(m)},统计其与其他向量(排除自身)的相似性比例:C_{i}^{m}(r)=\frac{1}{N-1}\times\\left\{j\!:\!d\left(V_{i}^{(m)},V_{j}^{(m)}\right)<r,j\neq i\right\}[87]。进而计算全局平均相似概率:Bm(r)=1Ni=1NCim(r)B^{m}(r)=\frac{1}{N}\sum_{i=1}^{N}C_{i}^{m}(r)[88]。 6. 计算物理增强型样本熵:类似地构建 Bm+1(r)B^{m+1}(r),最终定义物理增强型样本熵为:PhysSampEn(m,r,τ)=ln(Bm+1(r)Bm(r))P h y s-S a m p E n(m,r,\tau)=-l n\left(\frac{B^{m+1}(r)}{B^{m}(r)}\right)。当 Bm(r)=0B^m(r)=0Bm+1(r)=0B^{m+1}(r)=0 时,加正则化常数 10610^{-6} 避免对数发散[91][92]。 7. 生成择时信号: * 基于滚动窗口 WW 个交易日的融合熵序列,定义经验分位数阈值:低熵阈值 Slow=Q0.4(PhysSampEnt)S_{low}=Q_{0.4}(Phys-SampEn_t),高熵阈值 Shigh=Q0.6(PhysSampEnt)S_{high}=Q_{0.6}(Phys-SampEn_t)[94][95]。 * 结合当前熵值 PhysSampEntPhys-SampEn_t 和推重比 TWRtTWR_t 的方向,应用一套规则判断输出上涨、下跌或平盘信号。核心逻辑是:低熵态下系统规律性强,推重比数值指示趋势方向;高熵态下系统失序,规避方向性暴露或抓住反转趋势[95][97]。 2. 因子名称:流动性调整推重比 (TWR) * 因子构建思路:在传统推重比(累计收益率/波动率)的基础上进行优化,将驱动力项从“累计收益”升级为“量价共振收益”,并将风险项从“单一波动率”扩展为“波动率×流动性阻力”,从而构建一个同时评估趋势有效性和交易可操作性的综合指标[54][72]。 * 因子具体构建过程: 1. 计算驱动力 (Thrust):驱动力项定义为量价共振动量:Thrustvolp,t=(k=tL+1trk)×(VoltVolavg,t)T h r u s t_{v o l p,t}=\left(\sum_{k=t-L+1}^{t}r_{k}\right)\times\left(\frac{V o l_{t}}{V o l_{a v g,t}}\right)。其中,rk\sum r_k 为过去 LL 日累计收益率,VoltVol_t 为当日成交量,Volavg,tVol_{avg,t} 为过去 LL 日平均成交量[56][58]。 2. 计算风险项 (Weight):风险项综合了价格波动风险和流动性阻力:Weightliq ,t=σt×(Volavg,tVolt)+106W e i g h t_{l i q\ ,t}=\sigma_{t}\times\left(\frac{V o l_{a v g,t}}{V o l_{t}}\right)+10^{-6}[64]。 * 价格波动风险 σt\sigma_t 为过去 LL 日的年化波动率:σt=252L1k=tL+1t(rkrˉt,L)2\sigma_{t}=\sqrt{\frac{252}{L-1}\sum_{k=t-L+1}^{t}\left(r_{k}-\bar{r}_{t,L}\right)^{2}},其中 rˉt,L\bar{r}_{t,L} 为过去 LL 日的平均收益率[65][66]。 * 流动性阻力通过比较当日成交量与近期平均成交量的比值来构建,比值大于1表示流动性差、阻力放大[68]。 3. 计算原始推重比:原始推重比为驱动力与风险项的比值:RawTWRliq,t=Thrustvolp,tWeightliq,tR a w T W R_{l i q,t}=\frac{T h r u s t_{v o l p,t}}{W e i g h t_{l i q,t}}[69]。 4. 标准化:为消除跨ETF的量纲差异,对原始推重比进行Z-Score标准化:TWRliq,t=RawTWRiiq,tμRawTWR,    WσRawTWR,    w+106T W R_{l i q,t}=\frac{R a w T W R_{i i q,t}-\mu_{R a w T W R},\;\;W}{\sigma_{R a w T W R},\;\;w+10^{-6}}。其中,μRawTWR,W\mu_{RawTWR,W}σRawTWR,W\sigma_{RawTWR,W} 分别为过去 WW 个交易日原始推重比的均值与标准差,10610^{-6} 为平滑项[70][71][72]。 3. 因子名称:样本熵 (SampEn) * 因子构建思路:样本熵是用于量化时间序列复杂性和规律性的指标。它通过计算“数据片段延长后,还能保持相似”的概率,来衡量序列的“混乱度”或不确定性。相比近似熵,样本熵通过排除自匹配,提高了在短序列下的无偏性和统计一致性[20][21][44]。 * 因子具体构建过程: 1. 重构嵌入向量:对长度为 NN 的序列 xx,设定嵌入维度 mm 和延迟时间 τ\tau,为每个时间点 ii 构造 mm 维嵌入向量:Xim=[x(i),x(i+τ),x(i+2τ),,x(i+(m1)τ)],i=1,2,,NmX_{i}^{m}=[x(i),x(i+\tau),x(i+2\tau),\cdots,x(i+(m-1)\tau)],\mathrm{i=1,2,\cdots,N_{m}}[25][26]。 2. 定义相似性度量:采用Chebyshev距离(最大范数)计算两个嵌入向量间的距离:d(Xim,Xjm)=maxk=0,1,,m1x(i+kτ)x(j+kτ)d\left(X_{i}^{m},X_{j}^{m}\right)=m a x_{k=0,1,\cdots,m-1}|x(i+k\tau)-x(j+k\tau)|。若距离小于阈值 rr,则判定两个向量相似[28][29]。 3. 计算相似概率: * 对于每个嵌入向量 XimX_i^m,计算其与其他向量(jij \neq i)相似的比例:Bim(r)=  1Nm1j=1,jiNmI(d(Xim,Xjm)<r)  .B_{i}^{m}(r)=\;\frac{1}{N_{m}-1}\sum_{j=1,j\neq i}^{N_{m}}I\big(d\big(X_{i}^{m},X_{j}^{m}\big)<r\big)\;.,其中 I()I(\cdot) 为指示函数[31][33]。 * 对所有向量求平均,得到 mm 维整体相似概率:Bm(r)= 1Nmi=1NmBim(r)B^{m}(r)=\ \frac{1}{N_{m}}\sum_{i=1}^{N_{m}}B_{i}^{m}(r)[32]。 4. 计算样本熵:将嵌入维度增加到 m+1m+1,重复上述步骤得到 Bm+1(r)B^{m+1}(r)。样本熵最终定义为:SampEn(m,r,N)=ln(Bm+1(r)Bm(r))S a m p E n(m,r,N)=-l n\left(\frac{B^{m+1}(r)}{B^{m}(r)}\right)[36]。概率衰减越慢(序列越规律),熵值越低;概率衰减越快(序列越随机),熵值越高[37]。 模型的回测效果 * 物理增强型样本熵择时模型 (单标的):回测期2017年1月至2025年11月,覆盖38只不同板块的ETF[7][101]。 * 宽基指数 (8只):策略年化收益率16.19%-41.67%,夏普比率1.04-1.69,最大回撤-14.32%至-25.48%,显著优于买入持有策略[106][108]。 * 周期资源型ETF (示例4只):策略年化收益率15.85%-44.81%,夏普比率0.77-1.89,最大回撤-13.25%至-29.61%,较买入持有大幅改善[116][118]。 * 新能源与科技型ETF (示例4只):策略年化收益率27.52%-33.45%,夏普比率1.27-1.51,最大回撤-21.14%至-31.31%,表现卓越[124][125]。 * 消费、医疗与金融型ETF (示例4只):策略年化收益率18.83%-30.28%,夏普比率0.98-1.37,最大回撤-14.43%至-29.45%,实现显著超额收益[130][132]。 * 物理增强型样本熵择时模型 (等权组合):基于38只ETF的择时信号动态构建等权组合。回测期内年化收益率37.20%,夏普比率1.76,索提诺比率251.62%,最大回撤-20.72%[137][140]。