橡胶树对于天然橡胶至关重要,需要精确的养分管理。评估营养水平的传统方法既昂贵又具有破坏性,但近透视 (NIR) 高光谱技术提供了一种有前途的非破坏性替代方法。高维数据会带来挑战,导致小型且不平衡的数据集产生有偏差的结果。当前的研究重点是使用机器学习和辐射传输模型克服这些限制。一种潜在的解决方案是通过半监督学习和重采样技术将未标记的高光谱数据与标记的样本相结合,旨在准确有效地监测橡胶叶中的氮和钾含量,而无需传统方法所需的密集劳动力。
2024年1月,Plant Phenomics 发表了题为“ Handling the Challenges of Small-scale Labeled Data and Class1imbalances in Classing the N and K statuses ofrubber leaves using hyperspectroscopy Technologies ”的研究文章。
该研究利用各种重采样技术来平衡模型学习期间的数据类别。结果表明,具有数据平衡约束的模型明显优于没有数据平衡约束的模型。可视化展示了 MES 和 SMOTE 等技术如何在类别之间均匀分布样本,而 RES 方法如何有效减少类别分布偏度。MES 和 SMOTE 技术成为最有效的技术,显着提高了半监督学习 (SSL) 环境中的分类性能,特别是橡胶叶中氮 (N) 和钾 (K) 水平的分类性能。SSL 方法利用未标记的高光谱成像 (HSI) 数据,在加权平均精度 (WAP)、平均平均精度 (MAP) 和加权召回 (WR) 分数方面显着提高,超越了传统的监督学习。研究表明,某些近透视 波长可以识别 N 和 K 水平,强调了所用光谱分类器的精度和可靠性。
进一步的分析表明,标记和未标记数据的平衡组合可显着提高分类准确性,标记与未标记数据的最佳比率可增强性能指标。总体而言,该研究重新平衡数据并将 SSL 与 HSI 数据结合使用的方法不仅解决了小样本量和数据不平衡的挑战,而且被证明对于橡胶叶的营养水平检测是高效且有效的。该方法为近透视 高光谱成像在农业中的应用开辟了新途径,特别是在光谱数据样本有限和不平衡的条件下监测作物营养水平。