1、 模式识别在微观岩石图像自动分类中的应用 翻译:程志远 自动化123班 129064428 摘要 对岩石的分类是现代地质学的一项内在组成部分。对岩石样本 的手工分类是一项花费时间的过程,而且,由于人类的主观判断,使得这一过程有风险性。在前文
2、所提到的研究课程中,笔者讨论了使这个过程自动化的可能性。 研究过程中,将会用到九种岩石样本。它们的数字图像由使用偏光显微镜观察岩石薄切面获得。这些图像就会在四种模式识别方式下,通过自动模式依次分类:最近邻算法,K邻近算法,最近模式算法和最佳球面邻近方法。这些方法的有效性就会在四种不同的色彩空间中得到检验:RGB,CIELab,YIQ和HSV。 研究结果显示对以上讨论的岩石类型进行自动识别是可能的。研究同时显示如果使用CIELab色彩空间和最邻近分类方法,岩石样本将会被准确分类,识别水平在99.8%。 关键词:自动分类 模式识别 色彩空间 岩石样本 1. 引言
3、 人工智能的发展使自动操作越来越多的任务成为可能,目前,这种自动操作有人类判断的因素。这归因于信息技术提供的方法。 因此,涉及到模式识别和人工智能的技术直到众多科学学科被关注为止都是研究的热门范围,同时也被运用到许多领域,比如天文学(望远镜分辨率的改进和大气遥感),生命和行为科学(人类学,考古学,昆虫学等等),工业应用(图像控制机器,语音分析,自动配 对细胞学等等),社会和环境应用(天气预测,交通分析,城市增长判断(Friedman and Kande,1999)),医疗(手腕骨病变病理的计算机辅助分析和识别(Ogielaetal.,2006)),手写医疗表格的识别(Milewsk
4、i et al., 2009)),农业应用(水果成熟的自动识别(Jimenezetal.,1999)),地球物理学(地球物理数据的持续分析(Turlapatyetal.,2010)),或者是火山地震的持续监测(Messina and Langer,2011))。 到目前为止,在地质研究中运用这些方法的努力被认为是受到了限制。一项由Marschallinger(1997)主持的研究披露了被图像扫描器扫描过的岩石样本。借助于多种光谱图像加工方法对这些图像进行了评估。该分类算法是对粗粒结晶岩媒介的测验。受监督的最大似然算法是最成熟的算法,接近90%的识别水平。在Baykan
5、and Yilmaz(2010)的实验中,笔者研究了火成岩,变质岩和沉积岩薄切面的数字图像。在研究中,用到了五种普通矿物质。采用最低平方法纠错的三层前馈网络被证实是最成功的。用以前没有看过的岩石样本测试神经网络取得了成功的识别结果——高达81%-98%。另一项由Marmo et al(2005)主持的研究涉及了古代碳酸盐薄切面的1000张图像的分析。结果是发展了另一种方法。这种方法采用了256张Gy-岩石的数字图像作为输入;由图像处理而产生的一组23个数值特征值作为输出。这种技术在碳酸盐岩石纹理的分类中展现了93.3%和93.5%的准确率-这些岩石数字图像是由268和215测试仪提供的。一种新
6、的基于对不同岩石样本薄切面进行图像处理来分辨纹理的方法是由Singh et al(2010)在一项实验中提出来的。针对300个中每一个不同的薄切面,将会用到27个数值测量参数,用来训练多层感知神经网络。为了测试这种方法,将会用到从不同地区采集的90张薄切面图像。这种方法在碳酸盐岩石纹理自动分类中显示出了92.22%的正确率。Mlynarczuk(2005)使用图像处理和数学形态学方法来分类岩石表面。他使用激光轮廓获得数据,而且提出来基于分析6维特征空间的分类方法。这种方法展示出了对5种岩石的分类准确度提高到了95%。Bodziony et al(2003)将构建一个专家系统岩石学和岩石力学分析
7、的模式识别方法表达在了书面上。作者讨论了三种模式识别自动化和有效化的方法,也同时指出了这种方法的极高准确性。在Peternell和Kruhl(2009)的工作中,分析了火成岩自动数字化分布格局的准确定量分析的可能性。Ghiasi-Freez et al(2012)介绍了一种薄款图像中的半自动识别孔隙类型,这种类型最后应用了一种模式识别算法。Ishikawa和Gulick(2013)提出了一种健全、自主分析火成岩矿物分类方法。这项研究表明,机器学习方法,特别是人工神经网络,可以被训练使用光谱原位拉曼光谱获得的数据,以准确区分关键矿物质描述了火成岩的成分。这些矿物质包括橄榄石、石英、斜长石、钾长石
8、云母、和几个辉石。平均而言,该分类器的准确率是83%。Dunlop(2006)在研究中提出了一个非常有趣的的自动检测和分类的研究 岩石的自然场景。这样的研究可能会发现自动分析法无法在一些人类环境中得到应用,比如说另一个星球的表面或海底工作重点更多的岩石而不是分类的检测过程,但作者已经达到一个令人满意的结果在86.3%水平的正确分类。 呈现在报告中的研究的目的是去检测基于模式识别标准方法发展演算法的可能性,这种模式识别允许大量的微观图像岩石的自动分类。这样的分类,基于必不可少的数字图像的参量,就微观图像数据分析这个观点而言是重要的。
9、 2. 材料和方法 2.1岩石 九个岩石被用于这项研究。选中的岩石显示不同的光谱特性,以及不同的物理 机械性能。薄片的岩石被使用。装有显微镜的照相机记录了保存于TIFF格式的数码照片。照明被最佳安排(为了避免过度和曝光不足),并且在被给的薄片部分的图像获得期间决不会被改变。对于每个岩石类型,这些照片照出至少三个薄片部分。对于每块岩石类型我们照了300张照片。结果,九块岩石被记录了总共2700张彩色图像。图像的分辨率是128 *960像素。以下岩石被记录成图像: 1.来自Laskowa Gora的白云石(Swietokrzyskie山脉,波兰的中南部)— 一个泥盆系, 完全由
10、0.2-0.6mm大小的白云石晶体组成的单矿物质岩石,沿直线连接,,或在极少数情况下,沿牙形线连接。 2.来自Redziny的白云石((Sudety 山脉,波兰的西南部)低碳变质,相当于结晶的monomineral岩石 完全由大小0.1-0.3毫米的白云石晶体组成。晶粒边界线大多是平等的,有时呈牙形,无粘合剂。 3.来自Strzelin的花岗岩(西里西亚低地,波兰的西南)一个由长石,石英和云母组成的全晶体结构的火成岩,长石由各种碱性岩和斜长石呈现。石英产生0.4-2.0毫米尺寸的谷粒级煤。当肉眼可见范围的观察被应用,黑云母的连胜板揭示了平行的纹理。 4.来自Wisniowka的青石板(
11、Swietokrzyskie 山脉,波兰的中南部)一个几乎完全由0.08-0.2mm大小的石英晶体单矿物构成的细粒岩石。个别石英谷粒级煤将再生,并与石英边境密切链接。 5.比亚瓦玛丽安娜大理石(Sudety山脉,波兰的西南部)由再结晶的方解石和白云石组成的岩石。它揭示了一个混乱的,质地致密可见贴合。肉眼可见的裂纹都覆盖着方解石刷。 6.从图姆林砂岩(圣十字山脉,波兰的中南部)0.04-0.4毫米大小 的砂屑岩与石英颗粒。锋利的石英颗粒以ca.15%的程度被绑定了二氧化硅 - 铁或二氧化硅 - 粘土粘合剂。 7. 来自Miekinia斑岩(克拉科夫 - 琴斯托霍瓦高地,波兰的南部)一个喷
12、出的,酸性的,低渗质地结晶的火成岩。长石,石英和黑云母的大量晶体嵌在岩石地壳里。 8. 来自Buszewo的石灰石(西部波美拉尼亚省,波兰的西部)Zechstein石灰石起源的沉积岩,特点是非常高的孔隙度和渗透率。 9. 来自Zatkowice的石灰石(克拉科夫 - 琴斯托霍瓦高地,波兰的南部)由0.03-0.05毫米的颗粒大小的多细粒结构泥质的方解石制成的岩石。该再结晶泥质岩的主要部分形成隐晶岩的结晶粘合剂。无数的、保存不好的有机残留生存。 2.2 特征空间 模式识别在调查中使用的方法基于特征空间的概念。这是一个抽象 其中每个样本被表示为一个点的空间n维空间。参数的数量决定空间的维
13、数。因此特征空间的判定是在识别过程的一个关键的第一步。有 各种对象类别的方法;该理论并不提供一种算法,由于它有可能 自动定义的功能。为了获得是一个相对简单和快速的演技分类 算法,不管测试岩石,它是有必要从大范围的图像分析工具选择。测试材料的种类显著限于常在使用的资源图像分析,如分割方法(比如二化值)这排除了使用对象的测量方法,大多是基于二值图像的分析。作为一个替代方案中,作者决定使用形态学变换结合标准算术值和 色彩通道的统计值。13个功能空间是定义如下: 1. 平均灰度级上的第一颜色通道(依赖于颜色空间模型) 2. 平均灰度电平在所述第二颜色通道 3. 平均灰度水平上的第三颜色信
14、道 4. 第一颜色通道的标准偏差 5. 第二颜色信道的标准偏差 6. 第三颜色信道的标准偏差 7. 意味着为得到的形态梯度的灰度级第一颜色通道 8. 意味着为得到的形态梯度的灰度级第二颜色通道 9. 意味着为得到的形态梯度的灰度级第三颜色通道 10. 对于所获得的形态梯度的标准偏差第一颜色通道 11. 对于所获得的形态梯度的标准偏差第二颜色通道 12. 对于所获得的形态梯度的标准偏差第三颜色通道 13. 为灰色调图像获得的窗台变差函数。 虽然它在研究报道却没有这样做,它应该是注意,虽然该特征空间的参数是由选择人类,但这种选择的充足可以自动验证。一个优化的特征空间的方法是P
15、CA方法,其将相关的变量数成更小的数目不相关的数据,提供了一个最佳的描述给定的套索功能。 所有图像都登记在RG色彩空间。然而,一个图像在RGB颜色模型可以转化为另一种颜色空间。对于实施例,许多作者提出,CIE实验室给出 最好的结果,只要岩石的分析显微镜图像结构而言(小原,2007年)。最终,RGB,CIE实验室YIQ,和HSV颜色空间被用于本研究的目的。 其结果,四个独立的13个参数集为每个颜色空间得到。为了防止一些特点的统治,数据进行标准化的范围从0到1。 2.3模式识别 模式识别的目的是确定不同类型的属于某些类的对象。阿斯达分类被执行时,它是必要的,以提供具有一定的算法研究有关类
16、的信息。不像人类,算法不具有该对象分类中的任何先验知识,因此,这些信 息已被预先输入到它存储器由手段训练集,国际环境协定为对象的实例正确的分类给出。正确选择中样品是用于识别的最终结果是至关重要的。在实验过程50的照片图象,选定随机地从该组的300张照片给定岩石样品的构成的训练集的元素。这些照片是没有考虑到在测试组,所以它永远不会发生的训练集的元素分别被识别。为了获得 可靠的结果,将不会是一个单一的随机样本中,所有的读数进行20次。每次训练集为绘制,并且平均通过。有许多不同的模式识别方法。该选择合适的方法对于给定的问题是不容易的事,和最优算法经常通过试验和错误来实现。因此,似乎合理的应用,并随
17、后比较的若干识别算法的性能。小心分析的结果不仅可以产生更好的分类,但也导致在优化特征空间和降低训练集。作为后果,算法变得更快, 和用于计算能力的需求减少。 模式识别四种方法是在岩石样本的分类中: 1. 最近邻法(NN), 2. K最近邻法(KNN),为k¼3 3. 最近的方式方法(NM) 4. 最佳球邻里法(OSN)。 最简单的方法是使用最近算法,这也是最古老的和最简单的模式分类算法之一。其操作的原则是基于分类的对象到最近的训练集的对象元素类(根据所选的指标)。K最近邻算法曾经是一个基准分类,即使在比较最先进的机器学习方法,它仍然可以产生有竞争力的结果(Fri
18、edman,1994)。该k近邻算法试图找到一个未知的k近邻 对象(或,实际上,它的特征矢量),并应用多数表决来确定它属于的类标签。(Song et al,2007).对于这些研究的目的中,k¼3获得通过。 NM方法类似于NN法-然而,在这种方法中,训练集的某些元件被它们的模式所替换。通常,类的“重心”作为一种模式。在距离最近的未知元素模式的基础上做出分类决定。可替代地,一个单其结果是,一的模式可以通过几种模式来代替,作为特定子集,或集群的集群中心。该方法变得类似于NN法虽然训练集得到减少。。该实验是,以测试培训的聚类的作用来对图像识别设置性能。采用减法聚类方法 找到给定类的聚类中
19、心(该方法是一个延山群集clustering-Rickard et al .,2005)。 算法的主要优点之一是,集群的数量可以因为不同的岩石类型而不同。集群选择这样作为给给定类的最好的表示。(KIM et al2005). OSN方法基于一个简单的规则。训练集合的每个点由半径不同的球体所包围和选择最适用于在特征空间中的每个点。 3. 结果 3.1识别方法有效性的分析 分类的概述结果归因于使用的模式识别方法和通过颜色空间分析,示于图 2.它总结了所分析的岩石的所有图像的分类。该图显示了这种描述的方法产生非常高的正确分类率,往往超过99%。 可以注意到,相对来说神经
20、网络和k近邻方法在分类的正确性方面执行的最好。他们不显示有关所使用的颜色空间的显著差异。在略差的表现可以的情况下,可以观察到NM和OSN法增强了所使用的颜色空间的影响。然而,在OSN方法的情况下,考虑到它返回有关信息,它应该不可能识别。在所报道的研究中,它介于5.32%和13.52%。一个不正确的诊断的方法OSN仅发生在RGB和达0.09%。这意味着该OSN的方法和确定只有正确的RGB色彩空间2250张照片只出2张,而对于其他颜色空间这种方法没有返回错误识别(只有有关信息不可能做出决定)。因此,可以说,这种方法是非常安全可靠。当讨论结果中,NM方法的多模态,必须考虑到。经典NM方法(CIELA
21、B色空间)提供96.7%的识别准确率。一个更好的结果,训练集进行聚类由减法聚类方法(涉及45簇),接近98.55%。当簇的数目增加至261之后实现的准确度等级接近99.31%。此方法允许达到99.6%,这是类似于由该方法所提供的精度水平。然而,在这种情况下,训练聚类后设置的长度比在NN法(以450相416的元素)中使用的训练集的长度仅略短。在分析了颜色空间对研究的影响结果,人们可以大胆地说,尽管显示了一些小的不同,最好的结果是几乎总是通过处理在图像中的CIELab获得-虽然两者的YIQ空间和HSV取得了类似成果的过程。毫无疑问,最差(但仍令人满意)结果与所获得的使用RGB色彩空间。作者处理彩色
22、图像突出的RGB颜色空间是适合于显示的颜色,但不是最好的一个用于正确分割和分析彩色图像。这是由于个别的R,G,B分量的高关联。Obara,2007).有几篇比较使用不同的色彩空间中获得的分割结果的论文表明CIELab导致非常令人满意的结果(Cheng-Jin和Da-Wen,2005;Visscarra Rossel等2006). 3.2 根据岩石类型对识别准确性的分析 结果下面的介绍仅仅着眼于CIELAB色空间。图3列出了各岩石类型的正确分类,这取决于所选择的方法。值得注意的是,对于神经网络和k近邻方法,结果是接近100%。这表明,当被明确规定其数量,所提出的方法似乎是普遍的,适并用
23、于选定的岩石类型的群分类。NM方法生成了最不正确的分类的。这是特别明显的图姆林砂岩,花岗岩和比亚瓦玛丽安娜大理石。在这种情况下,确定所述模式中,通过算术平均值的装置训练集的元素,得到相对最不利的结果。由k近邻法产生更多的错误。这可能是由于某些类的特征空间的不足。 图2 最频繁的误分类是以上提到的Strzelin花岗岩,Tumlin砂岩和White Marianna大理石(见表1)。在所用到的方法中,没有分类的是仅在OSN的方法,其中,如上述可见,是该方法的一个特性(见表2). 3.4 对个别岩石无法分类
24、的分析。 分析以确定哪些岩石是最常误判的。这种知识可以在核实特征间的精度是特别有用的。它也可以得出结论,这些类没有充分彼此分开,并且,添加了新的特征可效地把这些层次分开。NN法不会产生大量的错误决定-然而,Strzelin花岗岩被证明是最会被误判的。平均来说,Wisniowka砂岩有0.66%的误分类率。三种岩石-Laskowa白云石,Wisniowka石英岩和Czatkowice石灰石没有误判(见表4)。 当涉及到的k近邻法,误判率还是比较低的。再一次的,最常见的错误分类发生在Strzelin花岗岩(0.98%),它被认为是Wisniowka石英岩。还应当注意到,Wisn
25、iowka石英岩被认定为Strzelin花岗岩的错误分类几乎是微不足道的数量(0.06%)。如在先前描述的情况中,NM方法产生最频繁的采样错误识别是Strzelin花岗岩和Tumlin砂岩(分别是7.18%和11.60%),这些岩石被分类为Wisniowka石英岩。另外,一个显著的误分类率(4.38%)出现在Biala Marianna大理石中——这次,这些岩石样本被认为是Laskowa Gora白云石。观察到的误分类相对比例最小的是Laskowa白云石,Wisniowka石英岩Buszewo石灰石(分别为0.20%,0.22%,和0.22%)。 OSN方法没有产生误分类。
26、 表4仅提供了NN方法的样本分类总结。 3.5 岩石数量的增加对分类准确性的影响。 到目前为止提出的结果表明,明确规定岩石类型的范围之后,图像识别方法可以很好地应用于岩石样本图像分类。本章总结确定的岩石样本的数量对分类结果的影响的测试结果。 将十二种新的岩石样品,加入到迄今为止测试的9种岩石样品,共计21种。这是值得一提的是一些这些岩石类型没有透露(视觉)的差异。该组选择的岩石样本包括:硬石膏,斑岩,sienite,大理石,白云石(4岩石类型),花岗岩(2),页岩(2),砂岩(3),石灰石(6)。30 0个拍摄图像和21种岩石样
27、品,每一个都按照以上概述的过程。 对于非专门的方法和CIELab彩色系统,分类过程的充分性进行了验证。每当可能时,岩石的识别过程重复50次,每个被识别的岩石样品的时间在被选定随机的。结果总结在图4。 很显然,进行识别过程岩石样本的数目的增加导致分类精度的劣化,尽管(在此工作)此减少并不明显。在该组的21种岩石样品的情况下,准确度接近98%。人们必须牢记,在以前的测试中,在本研究报告的分类程序的精度是99.8%,而在目前的测试中,它下降到99.2%。这是由于这样的事实——分析岩石过的样品显示了类似的结构(例如6种石灰岩)。然而,这样的结果依然是令人满意的。 4. 总结
28、 在本文所讨论的调查过程中,使用了九种不同的岩石的薄切面。从这些薄切面中获得了2700幅显微图像。50幅岩石类型图像中的每一幅的作为训练集,而250幅图象是识别过程的实验对象。样品用数值参数来描述,同时伴随着图像处理的使用。这些参数被用来产生一个13的维特征空间。 2250幅岩石图像用四种模式识别算法进行自动分类。这些算法的有效性进行了测试。作者用了4色彩空间(RGB,CIELab,YIQ,HSV)和4种方法模式识别识别方法(NN,KNN,NM,OSN). 该研究表明,这些被选择的岩石结构的自动分类是可能的。在此研究的基础上,可以得出结论,对于分类这些岩石,CIELab是最好的
29、色彩空间,最近邻算法(NN)是最好的方法。如果使用CIELab颜色空间和NN近邻分类方法,该岩石样品中的识别准确度为99.8%。 也可以说,NN和k近邻方法对训练集的变化没有表现出极强的敏感性。 还应当指出的是,OSN方法是非常安全可靠的。应当考虑到的是,尽管当它涉及到返回错误识别时,性能表现的相对较差,但是它本身就可以被视为一个结果的信息。OSN方法的错误分类只发生在RGB,其比例为0.09%。涉及测试器的聚类方法,NM似乎比传统的方法NM更有效,只要尽力小心,以确保适当的聚类程序,并选择测试器的最佳长度。我们还表明,增加经受识别程序的样本数导致分类精度的劣化,尽管这种下降在21种分析岩石是不明显的。 由此可以得出结论,模式识别对选定的岩石的自动分类的应用提供了满意的结果,并且可用于完成本文的范围内的任务。所提出的结论在科学和工业的许多领域的应用中可能有重要的作用。然而,研究应继续下去。在这一领域正在进行的研究可能会导致其未来会成功地在地质学,岩石学,矿物学中了指导一些实用工具的建设。






