把一段口述的想法结构化:从单日序列里挑 K 个关键点 → 拟合成线 → 与原始线比较 corr / 偏差 → 不同参数组合 × 不同 K = 一个 m×n 因子矩阵。
原始序列 → 选点 → 拟合 → 与原线对比得到一个 corr。换个 K 再算,就得到一行 corr。
三种选点规则,挑出来的 K 个时刻不同 → 拟合线不同 → corr 不同 → 矩阵的不同行。
「补全到原长度」= 把拟合线重采样回原始 x 网格(蓝点),这样两条线点对点对齐,才好逐点算 corr / 偏差。
把"买卖订单号差最大"等按方向拆分,分别拟合 → 一条代表多头共识、一条代表空头共识,可对比两者强弱。
| 参数组合(行)\ K(列) |
|---|
单元格颜色越绿 = corr 越高(用越少的点就能还原原始序列)。每只股票每天 = 一个这样的矩阵。
观察:通常 K 越大 corr 越高(点越密越还原原线);不同拟合变量 / 选点规则之间的 corr 曲线形状差异,才是真正有区分度的信号。
| 步骤 | 动作 |
|---|---|
| 1. 取数 | 取出该股票全天逐笔成交:时间、价、量、买卖方向 |
| 2. 选点 | 对 K = 5:找出成交量最大的 5 笔成交,记录它们发生的时刻 t₁…t₅ |
| 3. 取值 | 取这 5 个时刻的价格(旋钮④)→ 得到 5 个 (t, price) 点 |
| 4. 拟合 | 用分段直线(旋钮⑤)把这 5 点连成拟合线 |
| 5. 补全 | 把拟合线插值到原始时间网格,与原始价格线点对点对齐 |
| 6. 打分 | 算两条线的 corr(旋钮⑦)→ 得到 c₅ |
| 7. 遍历 K | K = 5,6,7,8,10,15,20 各算一次 → 得到一行 [c₅,c₆,c₇,c₈,c₁₀,c₁₅,c₂₀] |
| 8. 遍历旋钮 | 换"拟合变量=挂单失衡"再算一行;换"仅买方向"再算一行…… |
| 9. 堆叠 | 所有行堆起来 = 当天该股票的 m×n 因子矩阵 |
把矩阵的某个单元格(或某行的均值/斜率)当作单值因子,就能跨股票跨日期做横截面排序 → 进入因子回测。