Matlab 数据补全方法
F = fillmissing(A,method) % 插值填充
案例如下:
x = [-4*pi:0.1:0, 0.1:0.2:4*pi]; % 定义非均匀采样点向量,并计算这些点上的正弦函数。 A = sin(x); A(A < 0.75 & A > 0.5) = NaN; % 将 NaN 值插入 A 中。 % 使用线性插值填充缺失数据,并返回填充的向量 F 和逻辑向量 TF。TF 项中的值 1 (true) 对应于 F 中的填充值。 [F,TF] = fillmissing(A,\'linear\',\'SamplePoints\',x); plot(x,A,\'.\', x(TF),F(TF),\'o\') % 绘制原始数据和填充的数据。 xlabel(\'x\'); ylabel(\'sin(x)\') legend(\'Original Data\',\'Filled Missing Data\')
填充方法还包括:
方法 | 说明 |
---|---|
\'previous\' |
上一个非缺失值 |
\'next\' |
下一个非缺失值 |
\'nearest\' |
距离最近的非缺失值 |
\'linear\' |
相邻非缺失值的线性插值(仅限数值、duration 和 datetime 数据类型) |
\'spline\' |
分段三次样条插值(仅限数值、duration 和 datetime 数据类型) |
\'pchip\' |
保形分段三次样条插值(仅限数值、duration 和 datetime 数据类型) |
\'makima\' |
修正 Akima 三次 Hermite 插值(仅限数值、duration 和 datetime 数据类型) |
F = fillmissing(A,movmethod,window) % 滑动填充
案例如下:
% 创建样本点向量 x 和包含缺失值的数据向量 A。 x = linspace(0,10,200); A = sin(x) + 0.5*(rand(size(x))-0.5); A([1:10 randi([1 length(x)],1,50)]) = NaN; % 使用窗口长度为 10 的移动中位数替换 A 中的 NaN 值,并绘制原始数据和填充的数据。 F = fillmissing(A,\'movmedian\',10); plot(x,F,\'r.-\',x,A,\'b.-\') legend(\'Filled Missing Data\',\'Original Data\')
注意:当使用\’movmedian\’方法填充数据时,窗口长度为2并不能有效填充数据,原始数据中的NaN将被保留
填充方法还包括:
方法 | 说明 |
---|---|
\'movmean\' |
窗口长度为 window 的移动均值(仅限数值数据类型) |
\'movmedian\' |
窗口长度为 window 的移动中位数(仅限数值数据类型) |
特别感谢:
李果(大凉茶)
参考文献: