高光谱遥感数据在进行实际应用前,需要进行波段选择并提取光谱特征,降低数据维数。虽然波段选择明显地减小了高光谱图像数据处理量,在后续应用任务中基本能够取得较好的效果,但仍然面临一些问题与挑战。本文进行了简单总结高光谱图像波段选择的三大挑战,亟待提出有效的解决方案。
泛化能力衡量的是波段选择算法在提取高光谱图像光谱特征时适应变化的能力。根据变化对象的不同,泛化能力可分为针对样本的泛化和针对任务的泛化。前者对于不同的输入样本,算法选择的波段在当前任务上都能取得较好的结果。样本在监督学习中占有非常重要的地位,训练样本所包含的信息及其在数据中的分布直接影响着模型的性能和泛化能力。但高光谱图像大规模标记样本库的建立十分困难,对于小样本应用任务问题,由于可供算法学习的训练样本相对较少,算法容易出现过拟合的现象,使模型泛化能力下降,对未知样本的波段选择结果将会受到影响。针对任务的泛化是指对于同种类的不同应用任务,如分类里边的农作物分类、树木分类、矿物分类等不同任务,参数反演里的植物叶绿素反演、土壤重金属物定量反演、水质参数反演等不同任务,目标探测里边的特殊植物探测、建筑物探测、飞机探测等不同任务,算法选择的波段均有较好的效果,即波段选择算法模型对于同类型的多任务是泛化的。
现有波段选择算法都是针对单一的、特定的高光谱图像解译任务设定的,对于具有相同规律的不同应用任务或当数据类型和处理对象发生变化时,原有的波段选择算法模型不能继续给出合适的选择结果。针对不同的应用任务,如何将原有的波段选择算法很好地移植;针对数据类型和对象的多样化,如何使波段选择算法具有良好的适应性,成为波段选择算法面临的一项重要挑战。可通过深度学习生成对抗网络生成的虚拟图像以增加训练数据,并根据样本可能的变化做出相应的调整,解决样本泛化的问题。采用迁移学习将已取得良好性能的网络模型结构应用到相近的应用任务中,通过参数微调等方法提高算法对不同任务的泛化能力。
高光谱图像波段选择数量的确定,目前还没有统一的标准。较普遍的一种方法是在进行波段选择之前,人为确定一个波段数量N,在执行波段选择模型过程中选择满足判断标准的前N个波段S10]。这种波段个数确定的方法,通常没有理论依据支撑,多数靠研究者的经验。另一种观点认为,高光谱图像总体特征维数随图像中地物类别数线性增加,因此以类别的数量作为光谱波段的选择数量1。也有研究者提出了渐进式波段数量确定法4.1],即通过扩展或减少波段数量来渐进地选择波段,这种渐进式波段确定过程是通过各种应用确定的条件来停止的。
总的来说,当选择较少数量的波段时,波段之间的区别较大,相关性小,但部分特征信息可能被遗漏。当选择较大数量的波段时,波段之间高度相关,部分波段提供的是冗余重复信息。如何确定使应用任务性能优良、计算时间短、复杂性低的波段数量仍然是一个具有挑战性的问题。可重点研究嵌入式特征选择方法,将波段个数的确定与任务的性能结合起来,通过网络模型迭代训练、反向传播等算法使二者在性能上达到平衡。
当前以光谱来区分地物时,是通过其完整波形进行判断的。但地物光谱中真正具有识别意义的是光谱完整波形曲线中的一系列光谱吸收特征,这些吸收特征的位置、深浅和形状信息与物质的属性、成分、形状及所处环境因素密切相关0叫。因此,波段选择的每个波段都对应一定的光谱诊断特征,选定的波段组合能区分特定的地物类别。但对这种波段和光谱诊断特征对应关系、波段组合和地物特征对应关系的研究并不深入,甚至是不清楚的。当前的研究更侧重于将波段选择作为复杂的数学问题建模求解,未来的研究应更注重波段组合所代表的物理含义,将所选波段与其在实际应用中的贡献联系起来。深入探索地物光学特性、地物电磁反射与波段之间的关系,了解波段电磁反射值代表的物理意义将是可行的解决方案。
随着高光谱遥感图像光谱、空间分辨率的不断提高和应用领域的日益广泛,继续引入智能搜索、优化算法和深度学习等领域的新理论、新模型,发展更先进、更有效、智能化的波段选择方法也是未来高光谱图像波段选择技术的主流发展方向。