收藏 分销(赏)

基于机器学习的鄂尔多斯盆地陇东地区长7段岩相测井识别方法.pdf

上传人:自信****多点 文档编号:637836 上传时间:2024-01-22 格式:PDF 页数:12 大小:20.83MB
下载 相关 举报
基于机器学习的鄂尔多斯盆地陇东地区长7段岩相测井识别方法.pdf_第1页
第1页 / 共12页
基于机器学习的鄂尔多斯盆地陇东地区长7段岩相测井识别方法.pdf_第2页
第2页 / 共12页
亲,该文档总共12页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

1、2023年第13卷 第4期油气藏评价与开发PETROLEUM RESERVOIR EVALUATION AND DEVELOPMENT基于机器学习的鄂尔多斯盆地陇东地区长7段岩相测井识别方法谌 丽,王才志,宁从前,刘英明,王 浩(中国石油勘探开发研究院,北京 100083)摘要:岩相分析是储层评价的基础,受取心数量和成本的影响,针对未取心井利用测井资料开展岩相识别工作至关重要。根据岩心薄片鉴定结果,并结合成像测井资料将鄂尔多斯盆地陇东地区长7段岩相划分为6类。在岩心标定的基础上,对各类岩相的测井响应特征进行总结,建立该研究区基于常规测井曲线的岩相识别模式,结合机器学习算法开展岩相的自动识别。由

2、于传统的分类算法受岩相样本不均衡的影响较大,对比多种不均衡数据分类算法在该地区的应用效果发现,集成学习Bagging算法通过组合多个基分类器,极大地改善了各类岩相的分类性能,并将该地区岩相的整体识别精度提升了20%。据地区应用效果显示,单井识别精度可达84.33%,具有较好的适用性。关键词:岩相;测井响应特征;非均衡数据集;分类;陇东地区长7段中图分类号:TE122文献标识码:AWell-log lithofacies classification based on machine learning for Chang-7 member inLongdong area of Ordos Bas

3、inSHEN Li,WANG Caizhi,NING Congqian,LIU Yingming,WANG Hao(Research Institute of Petroleum Exploration and Development,CNPC,Beijing 100083,China)Abstract:Lithofacies analysis serves as the foundation for reservoir evaluation.However,due to the limited coring quantity andcost constraints,identifying l

4、ithofacies using logging data for uncored wells becomes crucial.In the Longdong area of the OrdosBasin,the lithofacies of the Chang-7 member have been classified into six types dependent on core identification results andimaging logging data.Based on core calibration,the logging response characteris

5、tics of different lithofacies were summarized,leading to the establishment of the lithofacies recognition mode using conventional logging curve.To achieve automatic lithofaciesrecognition in the study area,machine learning algorithms were employed.The traditional classification algorithms were affec

6、tedsignificantly by the unbalanced sample.After comparing the application effects of different unbalanced data classification algorithmin the region,it s found that bagging algorithm of ensemble learning notably improved the classification performance of alllithofacies by combining multiple classifi

7、ers.As a result,the overall lithofacies identification precision of this region has beenimproved by 20%.According to the regional application results,the identification accuracy of single well can reach 84.33%,demonstrating its practical applicability and effectiveness.Keywords:logging response char

8、acteristics;lithofacies;unbalanced data;classification;Chang-7 member in Longdong area岩相识别是储层评价的关键,准确地识别和划分岩相,可为后期压裂改造、油藏描述和盆地预估提供重要依据。鄂尔多斯盆地陇东地区延长组7段(下文简称长7段)整体为一套细粒沉积,岩石类型包括黑色页岩、暗色泥岩、粉细砂岩和凝灰岩,纵向上岩性变化快,储层类型复杂,非均质性强1。利用岩引用格式:谌丽,王才志,宁从前,等.基于机器学习的鄂尔多斯盆地陇东地区长7段岩相测井识别方法J.油气藏评价与开发,2023,13(4):525-536.SHEN

9、 Li,WANG Caizhi,NING Congqian,et al.Well-log lithofacies classification based on machine learning for Chang-7 member inLongdong area of Ordos BasinJ.Petroleum Reservoir Evaluation and Development,2023,13(4):525-536.DOI:10.13809/32-1825/te.2023.04.015收稿日期:2022-06-20。第一作者简介:谌丽(1998),女,硕士研究生,主要从事地球物理测井

10、方面的工作。地址:北京市海淀区学院路20号中国石油勘探开发研究院,邮政编码:100083。E-mail:。基金项目:中国石油天然气集团有限公司科学研究与技术开发项目“测井核心装备与软件平台研制”(2021DJ3903)。5252023年第13卷 第4期谌 丽,等.基于机器学习的鄂尔多斯盆地陇东地区长7段岩相测井识别方法心和测井资料人为地进行岩相划分耗时长、效率低,且受取心数量、地质条件、经验认识等多方面因素的影响,难以得到准确的岩相结果2-4。近年来,人工智能技术的快速发展为解决测井岩相识别困难提供了新的研究思路,越来越多的人尝试利用机器学习解决该地区复杂储层的岩相识别问题5-7。基于常规测井

11、资料,油田学者通过多参数交会法进行岩相敏感参数分析,并结合聚类分析算法开展岩相识别;成都理工大学学者通过分析测井曲线交会图特征,建立岩相类型判别函数实现岩相分类。基于特殊测井资料,油田学者利用地层元素测井构建矿物含量计算模型,定量识别岩相类型;利用成像测井资料,建立成像测井相岩相的识别模式,提取图像典型特征,开展全井段岩相识别。以上方法多采用单一类型的测井资料和传统的分类算法,虽对部分岩相区分效果较好,但整体识别精度低,油田推广应用效果较差。针对以上研究问题,在综合考虑岩心、地化、测井曲线、有利区优选等特征后,将长7段测井岩相划分为6类,即均质砂岩、非均质砂岩、粉砂质泥岩、暗色泥岩、黑色页岩、

12、凝灰岩;总结各类岩相在测井曲线上的变化特征,并结合机器学习算法实现岩相自动分类,提升各类岩相的识别精度,为后期开展页岩油甜点评价,优选勘探目标等提供技术支撑。1地质背景鄂尔多斯盆地大地构造处于中国东部构造域与西部构造域接合部位,古生代时属大华北盆地的一部分,晚三叠世发生的印支运动使扬子板块北缘与华北板块发生挤压碰撞,在盆山耦合作用下,形成了鄂尔多斯大型内陆坳陷湖盆8。陇东地区位于鄂尔多斯盆地西南部,长7段沉积期为湖盆最大扩张期,发育典型的陆相页岩油9,纵向上可划分为上甜点段(长71)、中甜点段(长72)和下甜点段(长73)。其中,上、中甜点段为泥页岩夹多期薄层粉细砂岩的岩性组合,是页岩油勘探开

13、发的主要对象;下甜点段以泥页岩为主,是风险勘探、原位转化攻关试验的主要目标。长7段整体砂质含量较低,多套薄层砂岩、粉砂质泥岩、泥质粉砂岩及暗色泥岩叠合发育,主要以泥质沉积为主,纵向上相变快、岩性复杂、非均质性强10。2岩相类型及其测井响应特征根据岩心观察、薄片鉴定、地化及录井分析的结果,将长7段岩相划分为6类,并利用岩心标定测井曲线,建立岩相精细划分模式,通过对不同岩相测井信息的对比分析,总结出该地区6类岩相的测井响应特征(图1)。2.1均质砂岩均质砂岩的常规测井曲线响应特征归结为“三低两高”,即自然伽马低值,一般小于150 API,低中子测井值,平均为15%,低声波时差,为210220 s/

14、m,平均216 s/m;中高电阻率值,平均为75 m,中高密度值,平均为2.5 g/cm3(图2)。PE值(光电截面吸收指数)为23 b/e,孔隙度相对较高,在2%12%,储层品质整体较好。2.2非均质砂岩非均质砂岩的测井响应特征与均质砂岩十分相似,都表现为“三低两高”,即低自然伽马、低中子、较低声波时差,中高电阻率值和中高密度。PE值23 b/e,GR曲线呈“锯齿状”,曲线变化较为剧烈,成像测井图显示黄色,夹暗色泥质条带,显示棕色纹层。2.3粉砂质泥岩粉砂质泥岩主要是由于滑塌沉积而形成的混合岩相,砂泥高度混杂,整体呈块状。此类岩相在常规测井曲线上表现为中高自然伽马(150200 API),P

15、E值平均为 3.5 b/e,中低电阻率(2050 m);中图1鄂尔多斯盆地陇东地区长7段各类岩相岩心照片Fig.1Core photos of various lithofacies in Chang-7 memberin Longdong area of Ordos Basina.环317,油迹细砂岩,2 443.68 mb.庄233,非均质砂岩,1 745.8 mc.板67,粉砂质泥岩,1 756.8 md.城页1,暗色泥岩,2 096.98 me.城页1,黑色页岩,2 025.3 mf.环317,凝灰岩,2 455.97 m526谌 丽,等.基于机器学习的鄂尔多斯盆地陇东地区长7段岩相测

16、井识别方法2023年第13卷 第4期高声波时差(220250 s/m),中高密度值,平均2.65 g/cm3,中子值较大(15%25%);泥质含量较高(20%60%),孔隙度低值(小于5%),且自然伽马曲线呈锯齿状变化;成像测井图呈暗黄色,中间有黑色纹层薄层显示,储层品质较差。2.4暗色泥岩暗色泥岩相呈黑色或灰黑色,厚层块状,发育广泛且连续厚度较大。在常规测井曲线上表现为“三高两低”(图3),即高自然伽马值(180270 API),高声波时差(240300 s/m),高中子值(20%40%,平均为35%),低密度(2.22.6 g/cm3,平均为2.40 g/cm3),低电阻率(1050 m)

17、,PE值为34 b/e;电成像测井图显示局部发育暗色水平纹理,夹杂少量黄铁矿。2.5黑色页岩黑色页岩主要分布在长 7段的中下部,厚度相对较大,品质好,成熟度高。在测井曲线上显示自然伽马异常高值,一般高于 300 API,大部分高于450 API,PE值为45 b/e;中高电阻率(50100 m),高中子,在 20%68%,平均 40%,高声波时差,300400 s/m,平均 320 s/m,低密度,一般小于2.45 g/cm3,平均2.29 g/cm3;电成像测井图呈亮白色,有纹层薄层状显示,局部夹黑色层理(图4)。2.6凝灰岩凝灰岩一般发育在长7段底部,是比较明显的标志层,其余层段也可见该类

18、岩相,但均以薄层出现。常规测井显示该类岩相自然伽马在 150240 API,PE值34 b/e,电阻率低,一般低于20 m;密度值在2.32.6 g/cm3,平均2.45 g/cm3,中子值在15%35%,平均25%,声波在230300 s/m,平均250 s/m;电成像测井呈暗色中薄层,有黄铁矿显示;孔隙不发育,储层品质较差。3曲线特征分析及提取3.1特征分析根据以上岩相识别模式,对研究区长7段其余单井的岩相进行识别,并利用识别结果建立机器学习样本库。分析各类岩相测井响应规律发现,黑色页岩自然伽马值异常偏高,孔隙度测井曲线变化明显,与其余岩相差异较大,在常规测井曲线上可明显区分开;粉砂质泥岩

19、与暗色泥岩的区别在于泥砂含量图2鄂尔多斯盆地陇东地区长7段B36井典型均质砂岩测井响应特征Fig.2Logging response characteristics of typical homogeneous sandstone in Well-B36 of Chang-7 member in Longdong area ofOrdos Basin深度深度/m岩性指示阵列感应孔隙度道静态图像动态图像录井剖面录井符号05.050350API3501000256025002560250(s/m)40-102.32.8(g/cm3)1.01 000.01.01 000.01.01 000.01.0

20、1 000.01.01 000.01 956.251 957.501 958.751 960.00PE/GR/AC/CNL/%DEN/AT90/(m)AT60/(m)AT30/(m)AT20/(m)AT10/(m)(b/e)注:PE为光电吸收截面指数;GR为自然伽马;AT为阵列感应电阻率曲线;AC为声波时差;CNL为补偿中子;DEN为补偿密度。5272023年第13卷 第4期谌 丽,等.基于机器学习的鄂尔多斯盆地陇东地区长7段岩相测井识别方法图 3鄂尔多斯盆地陇东地区长7段CY1井典型暗色泥岩测井响应特征Fig.3Logging response characteristics of typi

21、cal dark mudstone in Well-CY1 of Chang-7 member in Longdong areaof Ordos Basin图4鄂尔多斯盆地陇东地区长7段C96井典型黑色页岩测井响应特征Fig.4Logging response characteristics of typical black shale in Well-C96 of Chang-7 member in Longdong area of Ordos Basin深度深度/m岩性指示阵列感应孔隙度道静态图像动态图像05.0(b/e)503503501000256025002560250(s/m)40

22、-102.32.8(g/cm3)1.01 000.01.01 000.01.01 000.02.02 000.01.01 000.02 018.752 020.002 021.252 022.50PE/GR/APIAC/CNL/%DEN/AT90/(m)AT60/(m)AT30/(m)AT20/(m)AT10/(m)深度深度/m岩性指示阵列感应孔隙度道静态图像动态图像录井剖面05.0(b/e)503503501000256025002560250(s/m)40-102.32.8(g/cm3)1.01 000.01.01 000.01.01 000.01.01 000.01.01 000.02

23、062.52 065.02 067.52 070.0PE/GR/APIAT90/(m)AT60/(m)AT30/(m)AT20/(m)AT10/(m)AC/CNL/%DEN/的不同。统计不同岩相的砂泥含量发现,粉砂质泥岩相泥质含量为40%60%,暗色泥岩相泥质含量大于60%;凝灰岩主要发育在长7段底部,且多为薄层,电阻率值较暗色泥岩低,粉砂质泥岩与非均质砂岩根据自然伽马值和光电截面吸收指数的不同可明显区分;均质砂岩与非均质砂岩在三孔隙度测井曲528谌 丽,等.基于机器学习的鄂尔多斯盆地陇东地区长7段岩相测井识别方法2023年第13卷 第4期线上差异不明显,较难区分。总结以上分析得出,中子、密度

24、和声波曲线对长7段岩相反映最敏感;自然伽马曲线受泥页岩层富含机质的影响,对暗色泥岩和黑色页岩相有较好的指示作用,引入泥岩指数Ish定量反映储层内部泥质含量的高低;光电截面吸收指数(PE值)的不同,对区分砂泥岩相具有较好的效果;电阻率测井对各类岩相反映较敏感,但其受孔隙流体性质的影响较大,当储层为水层时,电阻率往往较低,此时不同岩相的电阻率差异难以准确反映具体岩相,需结合其余测井曲线进行判别。3.2特征衍生及提取以上特征分析单从测井曲线本身出发,直观定性地识别岩相类型,但同一沉积时期形成的岩相有时在常规测井曲线上的差异并不明显,导致直接利用常规测井曲线特征进行岩相识别较为困难。需进一步对测井曲线

25、特征进行分析,通过特征变换的方式,对岩相敏感的响应特征进行放大,进而显著地区分开各类岩相。由各类岩相测井响应特征分析得知,中子、密度和声波曲线对各类岩相的区分度较高,分别利用以上曲线计算得出孔隙度。分析各类岩相的三孔隙度曲线发现,对于泥页岩相,中子、密度、声波孔隙度之间的差异较大,泥质含量越高,孔隙度结果之间差异越大;对于砂岩相,三孔隙度曲线之间的差异较小,且利用密度曲线计算出的孔隙度与实际孔隙度结果相近。因此,三孔隙度曲线之间的差异对区分各类岩相具有重要的指示意义。为定量表征孔隙度曲线之间的差异,选取孔隙度差距最大的2条曲线声波和中子孔隙度曲线,计算其差值,将计算结果作为一个衍生参数,即孔隙

26、度岩相指数r,并结合泥岩指数Ish辅助常规测井曲线识别岩相。孔隙度岩相指数r和泥岩指数Ish的计算公式如下:r=cnl ac(1)Ish=GR GRminGRmax GRmin(2)其中cnl=Vshsh(3)ac=t tmatf tma1cp Vshtsh tmatf tma(4)式(1)式(4)中:cnl、ac分别为补偿中子孔隙度、声波时差孔隙度,单位%;Dt、Dtma、Dtf分别为目的层的声波测井值、岩石骨架声波时差值、流体声波时差值,单位s/m;、sh分别为目的层的补偿中子测井值和泥岩中子值,单位%;Vsh、cp分别为泥质含量和地层压缩系数;GR、GRmax、GRmin分别为目的层的自

27、然伽马测井值、纯泥岩的自然伽马测井值、纯砂岩的自然伽马测井值,单位API。通过以上分析,对岩相识别的常规测井曲线特征进行提取,选择自然伽马(GR)、自然电位(SP)、光电截面吸收指数(PE)、电阻率(AT10AT90)、中子(CNL)、密度(DEN)、声波时差(AC)、孔隙度岩相指数 r、泥岩指数 Ish共 13个特征,利用极度随机树算法11对各个特征的基尼重要性进行计算(图5),结果证实了参数r和Ish在岩相识别中的重要作用。4测井岩相智能识别方法4.1数据分析所用数据采集于该地区20余口井长7段的单井岩相识别结果,剔除异常数据点,共收集不同岩相类型的测井数据样本21 254个,其中非均质砂

28、岩和粉砂质泥岩占主导,凝灰岩数量最少,各类岩相样本分布不均(表1)。受地质因素、沉积时期的影响,在一定范围内,总是发育着某一类或多类岩相。采用机器学习进行岩相识别时,训练集的各类岩相样本数量通常出现不均衡现象,使用传统的分类算法在训练时,分类器往往会更关注多数类的样本特征而忽视少数类样本12,这时虽然整体的岩相符合率较高,但是实际上的岩相识别效果较差,从而导致识别精度降低。0 0.02 0.04 0.06 0.08 0.10 0.12 0.14 rDEN IshGRPE CNL ACSP AT10 AT20 AT30 AT60 AT90重要性占比测井响应特征图 5特征重要性分析Fig.5Fea

29、ture importance analysis5292023年第13卷 第4期谌 丽,等.基于机器学习的鄂尔多斯盆地陇东地区长7段岩相测井识别方法为解决样本不均衡的影响,提高非均衡数据集的分类性能,基于陇东地区长 7段的不均衡测井数据,取样本库的70%作为机器学习的训练样本,30%用于验证,对比分析了采用多种机器学习分类算法进行岩相识别的效果,总结各类算法对岩相分类器性能的变化,最后选择适用于该地区的岩相分类方法。由于在非均衡样本中,整体识别的准确率不能有效说明岩相识别的结果,因此采用准确率、精度、召回率(recall,即少数类样本中被正确分类的样本比例)、F1指数(precision 和

30、recall调和平均数)等来综合评判岩相分类的效果13。除以上的评价指标以外,常用的评价指标还有ROC曲线和AUC值。ROC曲线是以FPR(多数类中被错误分类的比率)为横坐标,TPR(召回率)为纵坐标绘制的二维曲线。AUC值表示ROC曲线覆盖区域面积,当ROC曲线结果越好,覆盖的面积越大,AUC值越大,则算法分类性能越好。4.2分类器性能对比4.2.1经典分类算法常用的机器学习分类算法包括K近邻、决策树、朴素贝叶斯、逻辑回归、支持向量机和随机森林算法等14-22。利用以上典型的分类算法对该地区开展岩相识别,统计不同算法的岩相分类性能。据图6对比结果发现,经典的分类算法在该地区的岩相分类较差,随

31、机森林算法虽相比于其他算法的AUC更优,但整体识别准确率仅68.97%。4.2.2基于重采样的随机森林算法受样本不均衡的影响,分类器往往对少数类岩相的识别效果较差,为降低样本不均衡导致的识别偏差,对以上随机森林算法23进行完善。首先通过重采样的方式对训练样本进行均衡化处理,再结合随机森林算法进行模型训练,从而改善岩相分类器的性能。重采样是解决数据不均衡的一个有效途径,采样方式包括欠采样和过采样。以上2种采样方式分别是通过减少多数类和增加少数类数据样本,从而降低不均衡程度来提高对少数类的分类性能24。常用的欠采样算法有随机欠采样、最近邻规则(ENN)、领域清理规则(NCR)、单边选择方法(OSS

32、);过采样算法有随机过采样、SMOTE 算法、ADASYN 算法、Borderline-SMOTE25。基于以上测井数据,通过欠采样、过采样实现数据均衡,再结合随机森林分类算法进行岩相识别。经重采样后的数据,各类岩相样本不均衡程度降低(表2)。但据图7显示,通过重采样的方式实现数据均衡对该地区岩相分类器性能的提升并不显著。欠采样虽在一定程度上提高了岩相分类准确率,但在减少多数类样本的同时,也删除了一些具有代表性意义的样本信息,造成关键信息丢失,从而影响分类效果;而过采样通过简单地复制或添加少数类样本到原始数据集中,导致出现许多“重复”样本,进而出现“过拟合”现象,即分类器训练效果较好,测试效果

33、较差。4.2.3不均衡样本分类算法仅靠对数据单纯地减少或增加并不能有效地改善该地区岩相识别的分类器性能。因此,从算法层面继续对陇东地区测井岩相分类问题展开研究。非均衡数据处理算法的核心思想是对不同类别的样本设置不同的权重,或者改变算法本身的数据结构,从而提高对少数类样本的分类精度和判别能力,常用的分类方法有集成学习 Bagging、Boosting、Stacking、代价敏感算法等26-32。通过比较不同的集成学习和代价敏感算法在陇东地区长7段测井岩相分类中的岩相类型均质砂岩非均质砂岩暗色泥岩样本数/个1 8486 3313 369岩相类型粉砂质泥岩黑色页岩凝灰岩样本数/个6 6342 585

34、487表 1各类岩相数量分布Table 1Quantity distribution of various lithofacies图 6经典算法分类器性能对比Fig.6Performance comparison of classicalalgorithm classifiers00.10.20.30.40.50.60.70.80.91.0随机森林逻辑回归SVCLinear SVCK近邻决策树 Gaussian NB Bernoulli NB分类器性能分类算法训练AUC值测试AUC值准确率注:SVC为支持向量机;Linea SVC为线性支持向量机;GaussianNB为高斯朴素贝叶斯;Bern

35、oulliNB为伯努利朴素贝叶斯。530谌 丽,等.基于机器学习的鄂尔多斯盆地陇东地区长7段岩相测井识别方法2023年第13卷 第4期应用,对比结果发现,集成学习方法中Bagging算法、Balanced-Bagging 算法明显地提升了岩相的分类能力,在该地区不均衡样本岩相分类中均有着较好的效果(图8)。4.3Bagging算法岩相识别综合分析以上研究,决定在该地区采用集成学习Bagging算法进行不均衡数据岩相分类。Bagging算法是并行式集成学习方法的典型代表,虽然结构简单,但是性能优异。它基于自助采样法获得多个样本子集,并对这些子集进行训练,得到对应的基分类器,再采用均等投票的方式组

36、合多个基分类器的分类结果,最终构建成一个强分类器,获得分类结果。由于Bagging训练子集的不同,各个基分类器对某些样本的学习程度就不同,所以保证了基分类器间的差异性,从而提高了算法的泛化能力33-34。通过以上分类器性能对比发现,随机森林算法、基 于 ENN 采 样 后 的 随 机 森 林 算 法 和 集 成 学 习Bagging算法在该地区的岩相分类性能较优。分别利用这3种算法在该地区开展岩相识别,结合热力图直观地观察这3类算法岩相分类器性能指标的变化,图像颜色越深,分类器性能越好(图9)。随机森林算法受均质砂岩、凝灰岩相样本数量的影响,对这两类岩相的召回率较低;而基于ENN采样后的随机森

37、林算法虽提升了少数类岩相的召回率,却降低了其识别精度。Bagging算法则不仅较好地提升了对少数类岩相的识别精度和召回率,同时也改善了对多数类岩相的识别性能。据ROC曲线显示(图10),Bagging算法各类岩相的ROC曲线均靠近图像左上角,AUC值较大,相比其余2种算法,该算法对陇东地区岩相分类器的改善效果十分显著。图11为各类算法的分类混淆矩阵,横纵坐标分别代表预测岩相与真实岩相的个数,图像对角线上的数字则为正确识别的岩相样本数,对角线上数字越大,识别效果越好。分析混淆矩阵结果发现,在各类岩相样本不均衡的情况下,随机森林算法对该地00.10.20.30.40.50.60.70.80.91.

38、0不采样随机欠采样OSSENNNCR随机过采样SMOTEADASYN分类器性能重采样方法训练AUC值测试AUC值准确率Borderline SMOTE图 7重采样后分类器性能对比Fig.7Performance comparison of classifier after resampling表 2基于重采样后的岩相样本分布Table 2Distribution of lithofacies samplesbased on resampling欠采样方法不采样随机欠采样OSSENNNCR随机过采样SMOTEADASYNBorderline-SMOTE岩相样本数/个均质砂岩1 2903361 1

39、577861 0214 6574 6571 2904 657非均质砂岩4 4293363 6402 9713 7954 6574 6574 4294 657暗色泥岩2 3223362 1001 2191 8284 6574 6572 3224 657粉砂质泥岩4 6573364 3933 1344 1444 6574 6574 6574 657黑色页岩1 8433368601 5641 7234 6574 6571 8434 657凝灰岩3363363363363364 6574 6574 6834 65700.10.20.30.40.50.60.70.80.91.0Bagging AdaBo

40、ost Balanced Bagging RUSBoost Stacking MetaCost(low)MetaCost(high)EasyEnsemble 分类器性能分类算法训练AUC值测试AUC值准确率Balanced Random Forest 图 8集成学习和代价敏感各算法分类器性能对比Fig.8Performance comparison of ensemble learning andcost sensitive algorithms注:OSS为单边选择方法;ENN为最近邻规则;NCR为领域清理规则;SMOTE为合成少数类过采样技术;ADASYN为自适应合成抽样;Borderlin

41、eSMOTE为边界样本合成过采样。注:Balanced Random Forest为平衡随机森林;Bagging为引导聚集算法;AdaBoost为自适应增强算法;Balanced Bagging为平衡袋装算法;RUSBoost为自适应提升随机欠采样算法;Stacking为模型堆叠;MetaCost(low)为低分代价敏感学习;MetaCost(high)为高分代价敏感学习;EasyEnsemble为简单集成学习。5312023年第13卷 第4期谌 丽,等.基于机器学习的鄂尔多斯盆地陇东地区长7段岩相测井识别方法区岩相识别效果较差,整体识别准确率为68.97%,其中粉砂质泥岩、暗色泥岩、均质砂岩

42、、非均质砂岩、黑色页岩和凝灰岩的准确率分别为 78.86%、59.17%、8.6%、80.44%、83.42%、17.22%;基于ENN重采样后的随机森林算法降低了样本不均衡程度对结果的影响,略微提升了对均质砂岩和凝灰岩的识别准确率,分别为20.61%、66.22%,但整体识别准确率仍较低,为71.24%;而集成学习Bagging算法对该地区不均衡数据集具有更好的适用性,能较大程度地改善对各类岩相的分类性能,整体识别准确率为81.93%,对粉砂质泥岩、暗色泥岩、均质砂岩、非均质砂岩、黑色页岩和凝灰岩的准确率分别为81.33%、76.85%、79.75%、81.7%,91.51%、85.43%,

43、岩相识别效果较好(图12)。4.4应用效果分析利用以上机器学习岩相识别模型对陇东地区10余口井长7段进行岩相精细识别,取得了较好的应用图 9分类性能热力图Fig.9Thermal map of classification performance图 10各类岩相ROC曲线Fig.10ROC curves of various lithofaciesa.随机森林算法b.基于ENN采样的随机森林算法c.Bagging算法1.01.00.80.80.60.6TPRFPR粉砂质泥岩暗色泥岩均质砂岩非均质砂岩黑色页岩凝灰岩0.40.40.20.201.01.00.80.80.60.6TPRFPR0.40

44、.40.20.201.01.00.80.80.60.6TPRFPR0.40.40.20.20粉砂质泥岩暗色泥岩均质砂岩非均质砂岩黑色页岩凝灰岩粉砂质泥岩暗色泥岩均质砂岩非均质砂岩黑色页岩凝灰岩注:FPR为多数类中被错误分类的比率;TPR为召回率。图 11各类岩相分类混淆矩阵Fig.11Classification confusion matrix of various lithofacies黑色页岩识别性能识别性能识别性能0.8660.8340.8500.6520.8040.7200.6970.7890.7400.6200.5880.6041.00.80.60.40.200.8570.0860

45、.1560.8970.1720.289Precision RecallF10.8490.8570.8530.6680.4220.5170.7040.6350.6680.5710.6850.6231.00.80.60.40.200.4000.7900.5310.4750.8940.621Precision RecallF1非均质砂岩均质砂岩凝灰岩粉砂质泥岩暗色泥岩黑色页岩非均质砂岩均质砂岩凝灰岩粉砂质泥岩暗色泥岩0.9100.9140.9120.8170.8580.8370.8250.8420.8330.7850.7560.7701.00.80.60.40.200.8360.7130.7700.

46、9020.7950.845Precision RecallF1黑色页岩非均质砂岩均质砂岩凝灰岩粉砂质泥岩暗色泥岩a.随机森林算法b.基于ENN采样的随机森林算法c.Bagging算法黑色页岩黑色页岩1559 1242791500330 6163960021664871480298451530 2081111093619000084932262004006008001 0001 2001 4001 6000非均质砂岩非均质砂岩均质砂岩均质砂岩真实岩相凝灰岩凝灰岩粉砂质泥岩粉砂质泥岩暗色泥岩暗色泥岩a.随机森林算法 预测岩相岩相数量/个岩相数量/个岩相数量/个黑色页岩黑色页岩1555 128264

47、19011323 607336501921641211153432881317 21331179406330800562021002004006008001 0001 2001 4001 6000非均质砂岩非均质砂岩均质砂岩均质砂岩真实岩相凝灰岩凝灰岩粉砂质泥岩粉砂质泥岩暗色泥岩暗色泥岩预测岩相黑色页岩黑色页岩1616 148163172581198005444111920108124450160491554 161185545667934135671292004006008001 0001 2001 4000非均质砂岩非均质砂岩均质砂岩均质砂岩真实岩相凝灰岩凝灰岩粉砂质泥岩粉砂质泥岩暗色泥岩

48、暗色泥岩预测岩相b.基于ENN采样的随机森林算法 c.Bagging算法1 600532谌 丽,等.基于机器学习的鄂尔多斯盆地陇东地区长7段岩相测井识别方法2023年第13卷 第4期效果(表 3)。单井识别精度可达 84.33%。图 13为L97井基于常规测井曲线的岩相识别结果,可以看出,机器学习 Bagging 算法识别结果与岩心标定岩相符合率较高,能较好地识别出各类薄层岩相。在1 6131 648 m井段,该段主要发育砂岩岩相,局部夹杂暗色泥岩条带,与录井显示一致,经测试,该段累计产油量为10.6 t/d,为良好的含油储层,与解释评价结论相符。5结论1)基于机器学习分类算法开展鄂尔多斯盆地

49、图 12各类算法岩相识别结果Fig.12Lithofacies identification results of various algorithms序号12345678910井名L34L43L49L55L97T38N196M139M160L303岩心标定/个8778281 0298361 294957855861935880模型识别/个7236698326691 071767721708749725准确率/%82.4481.7480.8681.0482.7980.1984.3382.2283.1582.44表3岩相单井识别结果Table 3Lithofacies single well i

50、dentification results深度深度/m岩性指示阵列感应孔隙度道结果对比测井解释岩心描述岩相随机森林识别重采样后识别解释结论Bagging识别非均质砂岩均质砂岩黑色页岩暗色泥岩凝灰岩差油层干层粉砂质泥岩05.0(b/e)50350350100(s/m)40-102.32.8(g/cm3)1.01 000.01.01 000.01.01 000.01.01 000.01.01 000.01 6651 6701 6751 68059606162631 6851 6901 6951 7001 705AT90/AC/(m)AT60/DEN/(m)AT30/(m)AT20/(m)AT10/

展开阅读全文
相似文档                                   自信AI助手自信AI助手
猜你喜欢                                   自信AI导航自信AI导航
搜索标签

当前位置:首页 > 学术论文 > 论文指导/设计

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        获赠5币

©2010-2024 宁波自信网络信息技术有限公司  版权所有

客服电话:4008-655-100  投诉/维权电话:4009-655-100

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :gzh.png    weibo.png    LOFTER.png 

客服