收藏 分享(赏)

多光谱遥感数据与多类型机器学习算法的浅海水深反演方法评价.pdf

上传人:爱文献爱资料 文档编号:21751474 上传时间:2024-04-21 格式:PDF 页数:12 大小:27.95MB
下载 相关 举报
多光谱遥感数据与多类型机器学习算法的浅海水深反演方法评价.pdf_第1页
第1页 / 共12页
多光谱遥感数据与多类型机器学习算法的浅海水深反演方法评价.pdf_第2页
第2页 / 共12页
多光谱遥感数据与多类型机器学习算法的浅海水深反演方法评价.pdf_第3页
第3页 / 共12页
亲,该文档总共12页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

1、第 43 卷 第 9 期2023 年 9 月Vol.43,No.9Sept.,2023热带地理TROPICAL GEOGRAPHY多光谱遥感数据与多类型机器学习算法的浅海水深反演方法评价王照翻1,马梓程2,3,4,熊忠招2,孙天成2,黄赞慧1,3,符钉辉1,陈靓1,谢 菲2,谢翠容2,陈思2,4 1.中国地质调查局海口海洋地质调查中心,海口 571127;2.湖北省国土测绘院,武汉 430014;3.中国地质大学(武汉),武汉 430074;4.资源与生态环境地质湖北省重点实验室(湖北省地质局),武汉 430034 摘要:以万宁海域为例,选取不同水环境条件的3景Landsat-8(201907

2、16、20210628)与Sentinel-2数据,利用随机森林(Random Forest,RF)回归、支持向量机(Support Vector Machine,SVM)、偏最小二乘(Partial Least Squares Regression,PLSR)3种机器学习方法分别开展水深反演试验,并评价其精度。结果显示,水体透明度最好、海浪效应最弱的一景Landsat-8(20190716)数据获得最高的水深反演精度,在040 m水深区间,R2为0.814,MAE、RMSE和MAPE分别为3.39 m、4.31 m和0.366,在020 m水深区间,R2为0.874,MAE、RMSE和MAP

3、E分别为2.24 m、3.24 m和0.449。RF算法在整个水深区间获得相对高的水深反演精度,SVM和PLSR算法在部分水深区间的水深反演中显示出优势。关键词:Landsat-8;Sentinel-2;随机森林;支持向量机;偏最小二乘;水深反演;海南岛中图分类号:P714.1 文献标志码:A 文章编号:1001-5221(2023)09-1689-12DOI:10.13284/ki.rddl.003742 开放科学(资源服务)标识码(OSID):在人类活动干扰频繁、海运航道集中、自然生态系统敏感脆弱的沿海区域开展水深测量工作对制定海岸带生态保护策略、实现海岸带可持续发展具有重要意义(Klem

4、as,2009;Benveniste et al.,2019;Melet et al.,2020)。高时空分辨率和高精度的水深与水下地形数据对海岸带系统演化研究(Benveniste et al.,2019)和海岸带环境调查与监测等应用至关重要,如水下地形重建(刘小菊 等,2020)、滨海地貌制图(薛振山 等,2012)、海岸形态(陈黎 等,2019)变化监测、航海和渔业(Porskamp et al.,2018)。传统的水深测量方法包括船载的单波束回声(Single Beam Echo Sound,SBES)和多波束回声(Multi-Beam Echo Sound,MBES),以及安装在空中

5、平台、遥控船和水下航行器上的激光雷达设备。尽管这些方法可以获得高精度的水深测量数据,但也存在测量时间长,经济成本高的局限性(Wei et al.,2021)。此外,由于测量条带角度和测量船与海岸之间的距离,SBES和MBES测量系统会在测量条带覆盖范围之外的海岸地形上形成测量盲区,导致无法适用于水下地形复杂的浅水区(Yan et al.,2018)。相比之下,卫星遥感技术以其高时效性、客观性和低成本,为大范围浅海地区水深测量提供一种有效数据源。同时随着卫星周期性回访,能为收稿日期:2022-10-26;修回日期:2023-05-18基金项目:中国地质调查局地调项目“海南岛东南海域自然资源调查试

6、点”(DD20220993);中国地质调查局地调项目“重要海峡通道遥感地质调查”(DD20191011);湖北省国土测绘院科技项目(CHYKJ2022-04)作者简介:王照翻(1991),男,海南澄迈人,工程师,硕士,主要研究方向为遥感地质调查、自然资源调查及生态调查,(E-mail);通信作者:马梓程(1993),男,湖北宜昌人,工程师,硕士,主要研究方向为地质遥感、自然资源遥感、遥感图像分类,(E-mail)。王照翻,马梓程,熊忠招,孙天成,黄赞慧,符钉辉,陈靓,谢 菲,谢翠容,陈思.2023.多光谱遥感数据与多类型机器学习算法的浅海水深反演方法评价.热带地理,43(9):1689-170

7、0.Wang Zhaofan,Ma Zicheng,Xiong Zhongzhao,Sun Tiancheng,Huang Zanhui,Fu Dinghui,Chen Liang,Xie Fei,Xie Cuirong,and Chen Si.2023.Assessment of Multi-Spectral Imagery and Machine Learning Algorithms for Shallow Water Bathymetry Inversion.Tropical Geography,43(9):1689-1700.43 卷热带地理海岸带监测提供连续的影像数据集(Jawak

8、 et al.,2015)。随着卫星遥感器的发展,已形成新的空间式水深测量方法,即卫星水深测量(Satellite-Derived Bathymetry,SDB)(Wu et al.,2021;Evagorou et al.,2022)。SDB方法可以分为基于主动式雷达遥感图像的方法和基于被动式多光谱图像的方法。其中,雷达遥感水深测量方法是利用雷达后向散射捕获海面速度的变化,并通过潮汐流和海底地形的相互作用估计水深(Calkoen et al.,2001)。1984年,Alpers等(1984)首次提出基于合成孔径雷达图像反演浅水地形的简易模型。随后研究人员针对雷达遥感的水深反演物理模型展开大

9、量探讨。基于ALpers 等提出的浅海水下的成像原理,李泽军等(2012)改进了水深反演过程,并利用实测数据对台湾浅海水域进行水深反演,取得良好效果。赵现斌等(2014)等在分析后向散射系数、辐射分辨率等与海洋监测之间的物理联系,提出一种全极化的合成孔径雷达关键技术的参数设计方法,很好地满足海洋环境的应用。然而,基于雷达遥感图像的水深反演方法测量精度易受到海面风速和雷达图像斑点噪声的影响(Calkoen et al.,2015)。与雷达遥感不同的是,多光谱图像的水深测量方法的理论依据是基于太阳光经过大气、大气水体界面和水体等介质的传播,到达水底或水下目标物,被反射后又经逆向传播被卫星传感器接收

10、的传播模型,根据光波对不同水体所表现出的透射性差异建立物理模型,再利用多光谱数据(包括紫外、可见光、近红外和中红外波段等)获取水深,或通过模型运算并结合实测水深数据获得大范围的水深信息(闫峰 等,2008)。早在20世纪30年代末,已有研究显示蓝波段的水体穿透深度可达25 m,绿波段可达 15 m,红波段可达 5 m(Evagorou et al.,2022)。多光谱图像的水深测量方法能获取比雷达遥感方法在空间上更精细的水深信息,而雷达遥感方法的水深探测深度更深(Lyzenga et al.,2006)。基于多光谱图像的水深测量精度受到数据类型、反演算法和海水环境要素等多因素影响。基于光学遥感

11、的水深测量精度主要受到数据的空间分辨率、光谱分辨率和辐射分辨率的影响(Lyzenga et al.,2006)。TM、OLI等中等空间分辨率遥感数据和SPOT、RapidEye等高空间分辨率遥感数据均应用于水深反演研究,并取得不同的反演精度(Stumpf et al.,2003;Traganos et al.,2018;Cahalane et al.,2019)。研究发现并不是数据空间分辨率越高,反演结果精度越高,数据空间分辨率、辐射分辨率和水体透明度对于水深反演精度同等重要(Bramante et al.,2013)。另外,潮汐、波浪、海底底质和海水透明度等海水环境要素均会对水深反演的精度造

12、成较大影响。因此,探索不同数据类型在不同水环境条件下对水深反演的影响十分必要。SDB在反演方法上可以分为理论解释模型、统计模型和机器学习模型。如Polcyn等(1969)最早提出海底反射水深遥感模型,将传感器获得的离水辐亮度分为水体部分产生和由底质反射获取2部分,通过计算底质反射的光谱离水辐亮度(与海底反射率、水体衰减系数和水深有关)提取水深。Lyzenga等(1981)建立多波段线性模型实现清洁水环境测深和底质物质类型识别。Zhang等(2015)基于多角度图像几何模型和太阳耀光辐射传输模型,利用ASTER的多角度太阳耀光图像,开发水下沙波测深的新方法。近年来,随着遥感数据源的丰富和机器学习

13、算法的发展,随机森林(Liaw et al.,2002)、支持向量机(Mateo-Prez et al.,2020)、偏最小二乘(Mateo-Prez et al.,2021)、人工神经网络(Ceyhun et al.,2010)等机器学习算法被成功应用于卫星遥感水深反演领域。其中,人工神经网络算法作为一种常用算法广泛应用于遥感图像分类和反演研究中(Pahlevan et al.,2020),一些学者使用支持向量机算法替代神经网络算法,以提升水深反演的精度,该算法对于解决非线性分类和回归问题有较好的效果(Wang et al.,2008)。随机森林算法作为一种非线性回归算法,也适用于构建基于多

14、光谱遥感图像的水深数据的回归模型(Sagawa et al.,2019)。这些数据驱动的机器学习模型,在基于多光谱遥感图像的水深反演研究中表现更灵活、更准确(温开祥 等,2020)。Landsat-8数据和Sentinel-2数据以其在数据稳定性、空间覆盖范围和重访周期等方面的优势,已单独被应用于水深反演研究(Giardino et al.,2019)。然而,这些研究大多利用单一数据源和单一机器学习算法进行水深反演,而2种数据的空间分辨率、光谱分辨率差异,不同机器学习算法的选择以及图像水体的水环境特征对水深反演精度的影响还未明确评价。鉴于此,本研究以海南岛东部万宁市沿海区域为例,收集不同海面风

15、浪状况的Landsat-8数据和 Sentinel-2 数据,利用随机森林、支持向量机、偏最小二乘3种机器学习算法开展近岸水深反演研究,以评估不同数据源、不同机器学习算法的水深1690王照翻等:多光谱遥感数据与多类型机器学习算法的浅海水深反演方法评价9 期反演精度差异,深入探讨Landsat-8数据和Sentinel-2数据在水深反演中的优缺点,以及不同机器学习算法应用于不同环境条件下的遥感水深测量时的性能差异。以期为结合使用2种数据集以实现高精度、高分辨率、高时效性遥感水深测量提供参考。1 研究区与数据源 1.1研究区研究区位于万宁市东澳镇新群村至万城镇春园村海岸线以外近海水域,地理位置为1

16、841 15 1847 30 N、11024 55 11031 40 E。研究区属于热带海洋性季风气候,该区域年平均气温为25.0;月平均气温变化为 19.5(1 月)28.8(6、7月),年降雨量2 1002 200 mm。近岸海域平均潮差约1 m,大潮差2.5 m。研究区岸线以砂质岸线和基岩岸线为主,岸滩类型主要为泥沙质。研究区地理位置如图1所示。1.2水深数据水深数据是由中国人民共和国海事局发布的1 25 000坡头港及大洲岛附近(C1516171)区域海图数据获取,共获取研究区内588处实测水深数据,用于水深反演模型的构建和反演精度的评价。研究区实测水深点分布如图1。1.3遥感数据为对

17、比Sentinel-2和Landsat-8数据在水深反演中性能差异,本研究选取2种数据开展水深反演试验,Sentinel-2和Landsat-8数据指标参数对比如表1所示。可见Sentinel-2数据在可见光到近红外区间(4001 000 nm)波段设置多于Landsat-8数据,光谱分辨率更高;空间分辨率上,Landsat-8数据深蓝波段(B1)空间分辨率(30 m)优于Sentinel-2数据(60 m),但可见光到近红外区间其他波段空间分辨率(30 m)低于Sentinel-2数据(10或20 m)。同时,为了分析海水透明度、波浪条件等水体环境特征光学遥感水深反演的精度的影响,收集覆盖研

18、究区不同海水透明度、不同波浪条件的 Sentinel-2 和 Landsat-8等多类型遥感数据,进行水深反演研究。选择3景数据进行水深反演试验,3景数据图像特征如图2所示,其中,Sentinel-2数据采集于2022-02-11,近岸水体有一定悬浮物,水体透明度较差,同时水体图像表现出风浪引起的规则的条带状反射率异常特征。选取的Landsat-8数据包括2景,分别采集于2021-06-28和2019-07-16,2景Landsat-8数据近岸水体透明度均优于Sentinel-2数据,从图像判断,近岸水体中悬浮物相对少,2景数据相比,2021-06-28采集的Landsat-8数据图像水体风浪

19、特征比2019-07-16采集的数据更强。利用ENVI 5.3平台对采集的各景遥图1水深反演研究区水深点训练样本与验证样本分布Fig.1Distribution of bathymetric training samples and validation samples in the bathymetric inversion study area表1 各卫星指标参数对比Table 1Comparison of satellite parameters卫星Sentinel-2ALandsat-8 OLI光谱范围/mBand1:0.430.45Band2:0.450.53Band3:0.540.

20、58Band4:0.650.68Band5:0.700.71Band6:0.730.75Band7:0.770.79Band8:0.780.89Band8A:0.850.88Band9:0.940.96Band10:1.361.39Band11:1.571.66Band12:2.112.29Band1:0.430.45Band2:0.450.52Band3:0.530.60Band4:0.630.68Band5:0.850.89Band6:1.561.67Band7:2.102.30空间分辨率/m6010101020202010106060202030303030303030采集时间2022-

21、02-112021-06-282019-07-16169143 卷热带地理感数据进行辐射定标、大气校正获取地表反射率数据,再按照工作区范围进行裁剪。Sentinel-2数据各波段空间分辨率统一为10 m,Landsat-8数据各波段空间分辨率为30 m。其中,大气校正是水体定量遥感的基础与前提,对于不同数据源,大气校正模型、大气校正模型参数的选择对水深反演精度有一定影响。FAASH 模型是基于机器学习和多光谱、高光谱遥感数据水深反演研究中常用的大气校正方法(张勇勇,2022),为了便于比较不同数据源和不同机器学习算法的水深反演精度,统一采用ENVI 5.3平台FAASH模型的海洋气溶胶模式对3

22、景数据进行大气校正。2 方法 光学遥感水深测量的主要原理是利用水柱反射的总辐射能量来拟合、测定水深(Eugenio et al.,2015)。光学遥感图像的蓝、绿波段具有较强的穿透清水的能力,随着水体中悬浮泥沙浓度的升高,水体的反射峰向长波方向移动(Lyons et al.,2011)在可见光范围内,波长在0.40.58 m之间的光信号对清澈水体的穿透深度最大,大气条件较好时,能探测水深在 30 m 以内的水体(Evagorou et al.,2022)。在收集不同类型和水环境条件的多光谱数据以及实测水深数据等资料基础上,本研究基于实测水深数据进行训练样本和验证样本选择与制作,分析单波段反射率

23、与实测水深的相关性,利用随机森林(Random Forest Regression,RFR)、支持 向 量 机(Support Vector Machine,SVM)、偏 最 小 二 乘(Partial Least Squares Regression,PLSR)等算法对不同遥感数据构建水深反演模型进行水深反演实验,并评价水深预测精度,技术路线如图3所示。2.1训练样本选取将由125 000坡头港及大洲岛附近(C1516171)区域海图数据中获取的588处实测水深数据,随机选取其中295处作为遥感水深反演的训练样本,训练样本点水深取值区间为0.279 m,水深均值为20.35 m。其余293处

24、水深数据作为精度检验样本,检验样本点水深取值区间为0.380 m,水深均值为20.50 m。2.2水深反演算法主要使用随机森林回归(Random Forest Regression,RFR)、支持向量机(Support Vector Machine,SVM)、偏最小二乘(Partial Least Squares Regression,PLSR)3种机器学习算法对不同遥感数据进行水深反演实验,及测试不同机器学习算法对水深反演的适用性。图3遥感水深反演技术路线Fig.3Technical flow of remote sensing bathymetry inversion图2研究区Sentin

25、el-2和Landsat-8数据影像特征Fig.2Different Sentinel-2 and Landsat-8 images of the study area1692王照翻等:多光谱遥感数据与多类型机器学习算法的浅海水深反演方法评价9 期2.2.1随机森林回归随机森林回归算法是由Breiman(2001)基于集成思想提出,通过随机参数在分 类 回 归 树(Classification And Regression Tree,CART)上构建。CART树是根据对待测结果数据类型的预测,而实现数据的分类或回归的一种二叉决策树。随机森林算法中的每棵树在运算中都保持互相独立,其结果最后由所有

26、决策树结果组合而得。本研究通过绘制决策树数目与模型预测误差之间的曲线图确定最优决策树数目。经过不断调参,最终确定决策树数量为100,分割节点数量为1。2.2.2支持向量机支持向量机是Corinna Cortes和Vapnik等于1995年首先提出的,它在解决小样本、非线性及高维模式识别中表现出许多特有的优势,并能够推广应用到函数拟合等其他机器学习问题中。支持向量机方法是建立在统计学习理论的VC维(Vapnik-Chervonenkis Dimension)理论和结构风险最小原理基础上的,根据有限的样本信息在模型的复杂性(即对特定训练样本的学习精度)和学习能力(即无错误地识别任意样本的能力)之间

27、寻求最佳折衷,以获得最好的推广能力。SVM从功能上分为分类和回归2类,区别在于,SVM回归的样本点只有1类,所寻求的最优超平面不是使2类样本点分得“最开”,而是使所有样本点离超平面的“总偏差”最小,本文水深预测模型以其回归功能为基础,选择径向基函数作为核函数建立支持向量回归模型,将遥感数据以及水深之间的非线性问题转化为高维特征空间的线性问题。2.2.3偏最小二乘回归PLSR是一种多对多线性回归模型,可同时实现回归建模(多元线性回归分析)、数据结构简化(主成分分析)和2组变量之间相关性分析(典型相关性分析)(Wold et al.,2001)。PLSR基于高维投影思想,通过提取主成分的方法对系统

28、中的数据信息进行分解和筛选,实现对系统解释性最强的综合变量的有效抽取;常用于样本量小、变量间存在多重相关性的数据处理,适用于光谱遥感数据反演模型的建立。其建模的基本步骤为:1)标准化处理水体光谱反射率数据矩阵与水深数据矩阵,得到的标准化矩阵分别记为E0和F0;2)分别提取E0和F0第一对成分T1和U1,T1和U1分别为E0和F0的线性组合并使之相关性最大;3)分别求E0和F0在T1上的回归,并得到回归残差矩阵E1和F1;4)用残差矩阵E1和F1代替E0和F0重复上述步骤;5)检查收敛性以确定提取的主成分数(黄华 等,2021)。2.3精度评价方法模型评价指标采用决定系数 R2、均方根误差(RM

29、SE)、平均绝对误差(MAE)和平均绝对百分比误差(MAPE)。其中R2越接近1,模型拟合能力越强;RMSE、RE和MAE越小,模型预测值和实测值离散程度越低,模型预测能力越高。RMSE=1ni=1n()yi-yi2(1)MAE=1ni=1n|yi-yi(2)MAPE=1ni=1n|yi-yiyi(3)式中:yi和yi分别表示估算值和实测值;n表示样本数。3 结果分析 3.1反射率与实测水深相关性本研究中,结合处理的3景遥感数据与295处水深训练样本,分析了3景Sentinel-2和Landsat-8数据B1波段(海岸波段)反射率与训练样本水深实测值的相关性。结果显示,研究区水深与 3 景 S

30、entinel-2 和Landsat-8数据海岸波段的反射率相关性均不强,R2分别为0.145、0.415和0.324。这与研究区近岸海水悬浮物浓度较高同时水体风浪较大有关。其中,2019-07-16采集的Landsat-8数据与实测水深相关性最强(R2为0.415),2021-06-28采集的Landsat-8数据与实测水深相关性次之(R2为0.324),Sentinel-2数据与实测水深相关性最差(R2为0.145)。这与数据采集时,研究区水体的水文特征差异有关,2022-02-11 Sentinel-2数据图像水体透明度低于2景Landsat-8图像,同时Sentinel-2数据海岸波段

31、空间分辨率(60 m)低于 Landsat-8数据海岸波段(30 m),这些造成Sentinel-2数据海岸波段与实测水深相关性低于两景Landsat-8数据。2景Landsat-8数据图像中,2019-07-16采集的Landsat-8数据图像水体风浪特征弱于2021-06-28采集的数据,造成其海岸波段与实测水深相关性优于2021-06-28采集的数据。以上结果反映近岸水体透明度和水面风浪影响,3景多光谱数据单波段(蓝波段)反射率与实测水深数据的线性相关性都较差,表明基于单波段的线性回归方法难以胜任研究区的水深反演,因此,采用更善于处理非线性回归问题的RF和SVM169343 卷热带地理方

32、法,及适用于多元线性回归分析的PLSR方法开展研究区水深反演。3.2水深反演结果与整体反演精度3 景 Sentinel-2 数 据 和 Landsat-8 数 据 的 RF、SVM、PLSR水深反演模型040 m水深精度评价如表 2 所示。对于所有数据类型和所有反演模型,Landsat-8数据(20190716)的RF模型获得最高的反演精度,R2为0.814,MAE为3.39 m,RMSE为4.31 m,MAPE 为 0.366。对 于 Sentinel-2 数 据(20220211)、Landsat-8 数据(20190716)和 Landsat-8数据(20210628),RF模型均获得最

33、高的反演精度。各类型数据源中,2 景 Landsat-8 数据 RF、SVM、PLSR模型的R2、MAE和RMSE均优于Sentinel-2数据。Sentinel-2(20220211)数据RF模型水深反演结果与实测水深值相关性最高,R2为0.764,SVM模型次之,R2为 0.720,PLSR 模型最差,R2仅为0.477。RF 模型水深反演结果的 MAE、RMSE 和MAPE也优于SVM和PLSR模型,分别为3.96 m、4.81 m 和 0.673。从水深反演效果(图 4)上看,SVM和PLSR模型均有部分近岸浅水区像元被预测为深水深值或负值。RF反演结果05 m水深范围水域与实际比较接

34、近。3种模型反演结果均存在条带状噪声,这是海浪引起的水体反射特征。Landsat-8(20190716)数据 RF模型水深反演结果与实测水深值相关性最高,R2为0.814,10 m以浅水深点的预测结果与实测水深相关性最强,图中点收敛于回归线附近;SVM 模型次之,R2为0.764,PLSR模型最差,R2仅为0.536。RF模型水深反演结果的MAE、RMSE和MAPE也优于SVM和PLSR模型,分别为3.39 m、4.31 m和0.366。从水深反演效果(见图4)上看,SVM和PLSR模型均有部分近岸浅水区像元被预测为深水深值或负值。RF反演结果中05和510 m水深范围水域与实际比较接近,其中

35、510 m水深的反演效果优于Sentinel数据(20220211)的RF反演结果。3种模型反演结果均没有海浪反射特征引起的条带状噪声。PLSR模型反演结果不同水深范围间的界线最明确,但各水深区间的像元的反演水深较实测水深均偏深,而SVM反演结果中各水深区域混淆比较明显,反演效果较差。Landsat-8(20210628)RF 模型水深反演结果与实测水深值相关性最高,R2为0.796,10 m以浅水深点的预测结果与实测水深相关性较强,图中点收敛于回归线附近,但收敛程度次于 Landsat-8(20190716)的反演结果;SVM 模型次之,R2为0.754,PLSR模型最差,R2为0.699。

36、RF模型水深反演结果的MAE、RMSE和MAPE也优于SVM和PLSR模型,分别为3.65 m、4.88 m和0.510。水深反演效果(见图4)上看,SVM模型和PLSR模型均有较多近岸浅水区像元水深预测值异常偏大或为负值。RF反演结果中05和510 m水深范围水域与实际比较接近,其中510 m水深的反演效果优于Sentinel数据(20220211)的RF反演结果,但05和 510 m 水 深 范 围 水 域 混 淆 情 况 较 Landsat-8(20190716)的RF反演结果更严重,另外1520 m水深范围水域与20 m以深水域混淆严重,反演效果较差。3种模型反演结果均没有海浪引起的条

37、带状噪声。SVM模型反演结果不同水深范围间的界线较其他2种算法反演结果最明确,但05 m水深范围内像元预测异常现象很多,PLSR反演结果中各水深区间的像元的反演水深较实测水深均偏深。3.3分段水深反演精度综合考虑 海道测量规范(GB12327-2022)(中国人民解放军海军参谋部,2022)中规定的水深测量误差的分段表示,和同类研究中水深反演精度评价的水深分段划分区间,为对比不同数据源和不同计算学习算法对不同水深区间的水深预测精度差异,分10 m以浅、1020 m、20 m以浅和2030 m等4个水深段分别评价各卫星数据各反演算法精度(表3)。对 于 10 m 以 浅 水 深 区 域,Land

38、sat-8(20190716)的RF模型和Landsat-8(20210628)的RF 模型获得较高的反演精度,R2分别为 0.711 和0.679,MAE分别为 1.96和 2.40 m,RMSE分别为3.04和3.17 m,MAPE分别为0.605和1.007。其中表2 水深反演精度分析Table 2Analysis of bathymetric inversion accuracy数据源Sentinel-2(20220211)Landsat-8(20190716)Landsat-8(20210628)反演算法RFSVMPLSRRFSVMPLSRRFSVMPLSRR20.7640.7200

39、.4770.8140.7640.5360.7960.7540.699MAE/m3.964.646.363.394.406.403.654.404.73RMSE/m4.816.027.864.315.537.454.885.626.92MAPE0.6730.6961.6530.3661.2141.8110.5101.0411.1201694王照翻等:多光谱遥感数据与多类型机器学习算法的浅海水深反演方法评价9 期Landsat-8(20190716)的 RF 模 型 反 演 结 果 的MAE、RMSE和MAPE为各数据源各算法反演结果中最低,反演精度最高。Landsat-8(20190716)的P

40、LSR 模 型 取 得 最 高 的 R2(0.779),但 MAE、RMSE 和 MAPE 较高,分别为 7.86 m、9.21 m 和4.501。对 于 1020 m 水 深 区 间,Landsat-8(20190716)的 PLSR模型取得最高的 R2(0.627),但 MAE、RMSE 和 MAPE 较高,分别为 7.64 m、7.86 m和0.551,Landsat-8(20190716)的RF模型的R2(0.553)次之;Sentinel-2(20220211)的RF模型的 MAE、RMSE 和 MAPE 最低,分别为 3.28 m、4.10 m和0.289,但其R2仅为0.379。

41、Landsat-8(20190716)RF 模型的 MAE、RMSE 和 MAPE 稍高,分别为4.01 m、4.87 m和0.295。综合而言,在1020 m水深区间,Landsat-8(20190716)的RF模型反演结果取得较好的精度。对 于 20 m 以 浅 水 深 区 间,Landsat-8(20190716)的RF模型获得最高的反演精度,反演结果的R2达0.874,高于各数据源各算法的反演结果;Landsat-8(20190716)的 RF 模 型 的 MAE、RMSE和MAPE在各反演结果中最低,分别为2.34 m、3.24 m和0.449。对 于 2030 m 水 深 区 间,

42、Landsat-8(20190716)的SVM模型的R2(0.429)最高,但其他精度评价因子偏高。Landsat-8(20190716)的PLSR 模型的 R2为 0.336,但其 MAE(2.65 m)、RMSE(3.11 m)和MAPE(0.102)均优于各数据0 1.5 3 km图4各数据源各机器学习算法的水深反演结果Fig.4Bathymetric inversion results of various data sources and machine learning algorithms169543 卷热带地理源各算法的反演结果。另外,对于Sentinel-2数据,RF模型在2

43、030 m水深区间的反演精度优于SVM和PLSR模型,而对于2景Landsat-8数据,PLSR模型在2030 m水深区间的反演精度优于SVM和RF模型。4 讨论 从水深反演的遥感数据源看,2景Landsat-8数据的水深反演整体(040 m水深)精度优于Sentinel-2数据,最高精度反演结果(RF模型)的 R2、MAE、RMSE和MAPE均优于Sentinel-2数据最高精度反演结果(RF模型),而Sentinel-2数据的空间分辨率(10 m)优于Landsat-8数据(30 m)。反演精度差异的原因可能是,数据获取时水环境特征的差异,本研究获取的Sentinel-2图像水体透明度相较

44、2景Landsat-8数据差,同时水体图像表现出风浪引起的规则的条带状反射率异常特征,这些都对水深反演结果和精度造成影响。这表明,对于光学遥感水深反演,更高的图像空间分辨率并不能保证更高的水深反演精度(Traganos et al.,2018;Cahalane et al.,2019;Wei et al.,2021),说明水体透明度、海浪情况等水环境特征对光学遥感数据反演的重要影响(Purkis et al.,2019)。同时,Sentinel-2数据海岸波段较低的空间分辨率(60 m)也是限制其水深反演精度的原因之一,其海岸波段与实测水深的R2比Landsat-8数据海岸波段低 0.090.

45、27。另外,空间分辨率的提高对图像上海浪特征有一定增强,2021-06-28采集的Landsat-8数据与Sentinel-2数据图像上均表现出海浪形成的异常反射特征,且Sentinel-2图像上海浪的条带特征更明显,并显示在水深反演结果中。另外,多光谱数据的获取时间和当时的潮汐状况也对水深反演有重要影响,但受限于卫星数据获取的周期性和天气原因,往往难以获得相同时刻拍摄、潮汐状况相同的影像。未来将加强收集潮汐状况、水质条件和风浪条件相似的影像,进一步对比算法、分辨率等对水深结果反演的差异。从水深反演的机器学习方法上看,本研究是建立在单一区域的有限实测数据和有限的数据样本条件下的,对不同算法的比

46、较有一定不确定性,随机森林模型(RF)对于各个数据源在整个水深区间均获得相对好的水深反演整体(040 m水深)精度,这与已有利用其他光学遥感数据源比对不同机器学习算法的水深反演精度结果(Wu et al.,2021;Liaw et al.,2002)一致,显示出随机森林算法应用于光学遥感水深反演时的稳定性。但对于某些水深区间,PLSR和SVM算法的反演结果也显示出一定优势,对 于 1020 m 水 深 区 间,Landsat-8 数 据(20190716)的 SVM 模型的 MAPE 为 0.294,优于RF模型和PLSR模型,对于2030 m水深区间,2景Landsat-8数据的PLSR模型

47、反演精度最优、SVM模型次之,RF模型最差。受限于数据驱动的机器学习算法的样本依赖性和不同类型遥感数据的异质性,基于遥感数据的机器学习水深反演模型应用于不同水环境和不同遥感数据源的性能可能受限,在类似区域研究中,可通过补充训练样本或利用迁移学习方式提升模型的泛化能力。本研究对比了不同表3 不同水深各卫星数据各反演算法精度分析Table 3Accuracy analysis of different satellite data and inversion algorithms for various water depths水深10 m以浅1020 m20 m以浅2030 m数据源Sentin

48、el-2(20220211)Landsat-8(20190716)Landsat-8(20210628)Sentinel-2(20220211)Landsat-8(20190716)Landsat-8(20210628)Sentinel-2(20220211)Landsat-8(20190716)Landsat-8(20210628)Sentinel-2(20220211)Landsat-8(20190716)Landsat-8(20210628)反演算法RFSVMPLSRRFSVMPLSRRFSVMPLSRRFSVMPLSRRFSVMPLSRRFSVMPLSRRFSVMPLSRRFSVMPL

49、SRRFSVMPLSRRFSVMPLSRRFSVMPLSRRFSVMPLSRR20.4520.1150.5410.7110.1210.7790.6790.3850.4390.3790.4710.3640.5530.4760.6270.4170.4590.3170.7310.5760.6240.8740.5860.7210.7780.7500.6710.2820.1440.2060.3460.4290.3360.2740.2820.373MAE/m4.274.577.581.965.217.862.404.505.193.284.677.274.014.317.643.645.275.693.1

50、64.627.422.344.787.812.774.905.453.484.193.653.783.392.653.863.102.85RMSE/m5.356.409.843.046.639.213.176.148.814.105.887.854.875.397.864.936.186.774.086.148.853.245.838.543.816.167.824.025.724.284.514.653.115.053.813.62MAPE1.5242.3894.1020.6053.0464.5011.0072.4952.6920.2890.3080.5130.2950.2940.5510.

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 学术论文 > 综合论文

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:文库网官方知乎号:文库网

经营许可证编号: 粤ICP备2021046453号世界地图

文库网官网©版权所有2025营业执照举报