收藏 分销(赏)

基于 XLNet 的农业命名实体识别方法.pdf

上传人:自信****多点 文档编号:632783 上传时间:2024-01-19 格式:PDF 页数:7 大小:1.16MB
下载 相关 举报
基于 XLNet 的农业命名实体识别方法.pdf_第1页
第1页 / 共7页
基于 XLNet 的农业命名实体识别方法.pdf_第2页
第2页 / 共7页
基于 XLNet 的农业命名实体识别方法.pdf_第3页
第3页 / 共7页
亲,该文档总共7页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

1、第 46 卷第 4 期2023 年 7 月河 北 农 业 大 学 学 报JOURNAL OF HEBEI AGRICULTURAL UNIVERSITYVol.46 No.4Jul.2 0 2 3基于 XLNet 的农业命名实体识别方法陈 明1,2,顾 凡1,2(1.上海海洋大学 信息学院,上海 201306;2.农业部渔业信息重点实验室,上海 201306)摘 要:随着农业领域人工智能的研究不断深入,农业文本中命名实体识别是其他任务开展的基础之一。鉴于农业领域缺乏公开语料库,本文构建了自己的农业文本的注释语料库。针对目前存在的文本语义表达不足、缺乏语境特征、词向量多样性表达困难等问题,本文提

2、出了基于 XLNet(Generalized Autoregressive Pretraining for Language Understanding,XLNet)的农业命名实体识别模型 XLNet-IDCNN-CRF。嵌入层 XLNet 对于输入文本进行向量化表示,丰富文本的语义信息,缓解一词多义问题,通过编码层迭代膨胀卷积神经网络(Iterated Dilated Convolutional Neural Network,IDCNN)并行计算减少训练时间,获取文本特征信息,结合起来输入到输出层条件随机场模型(Conditional Random Field,CRF)识别标签信息,输出最优

3、序列。本文在自建语料库上准确率达到 95.58%,召回率 92.36%,F1值 93.91%,对比优于其他模型。实验结果表明,XLNet-IDCNN-CRF 模型能够较好地完成农业命名实体识别任务。关 键 词:农业文本;命名实体识别;XLNet 模型;预训练语言模型;迭代膨胀卷积中图分类号:TP391 开放科学(资源服务)标识码(OSID):文献标志码:AAgricultural named entity recognition method based on XLNetCHENMing1,2,GUFan1,2(1.School of information,Shanghai Ocean Un

4、iversity,Shanghai 201306,China;2.Key Laboratory of fishery information,Ministry of agriculture,Shanghai 201306,China)Abstract:With the deepening of artificial intelligence research in agriculture,named entity recognition in agricultural texts is one of the foundations for other tasks.This study cons

5、tructed an annotated corpus of agricultural texts that fulfilled the lack of public corpora in the field of agriculture.Aiming at the current problems of insufficient text semantic expression,lack of contextual features,and expression difficulty of word vector diversity,this paper proposed an agricu

6、ltural named entity recognition model XLNet-IDCNN-CRF based on XLNet(Generalized Autoregressive Pretraining for Language Understanding,XLNet).The embedding layer XLNet performed vectorized representation of the input texts enriching the semantic information of the text and alleviating the problem of

7、 polysemy.The parallel computing then ran on the Iterated Dilated Convolutional Neural Network(IDCNN)in the encoding layer to obtain text within reduced training time.The feature information was combined and inputted into the output layer using the conditional random field model(Conditional Random F

8、ield,CRF)to identify the label information and output the optimal sequence.This model performed better on the self-built corpus than other models,whose accuracy rate reached 95.58%,recall rate was 92.36%and F1 value was 93.91%.The experimental results showed that the XLNet-IDCNN-CRF model was compet

9、ent to the agricultural named entity recognition task.Keywords:agricultural text;named entity recognition;XLNet model;pretrained language model;iterative dilated convolution文章编号:1000-1573(2023)04-0111-07DOI:10.13320/ki.jauh.2023.0066收稿日期:2022-07-07基金项目:江苏现代农业产业关键技术创新项目(CX(20)2028).第一作者:陈 明(1966),男,博

10、士、教授,主要从事数据仓库与数据挖掘研究.E-mail:本刊网址:http:/112第 46 卷河 北 农 业 大 学 学 报随着我国农业经济的持续发展,农业信息化近年来发展迅速,农技咨询服务成为农户与领域专家的重要交流渠道,农户通过线上描述农作物情况及问题,及时获得专业解答。面对海量的非结构化农业文本数据,如何快速定位关键词,挖掘深层语义关系,及时解决基层农户的问题,成为了农业信息化的关键问题。命名实体识别(Named Entity Recognition,NER)是自然语言处理(Nature Language Processing,NLP)中的 1 项基本技术,农业命名实体识别的准确性对于

11、快速智能识别信息中的专有名词有重要作用,它决定了下游任务的效果,是下游任务的基础,例如农业关系提取1,知识图谱构建2,问题意图识别3等。但是,在农业命名实体识别领域仍存在许多挑战。主要体现在农业领域实体构词复杂多样,缺乏标准化的农业词典,也没有公开的数据语料库,在使用分词工具对农业语料库进行分词时会存在分词错误的问题,影响模型性能4。在非结构化农业文本中,存在许多由专有名词和混合名词组成的混合复杂实体,例如“戊唑吡虫啉”“苯醚咯噻虫”,将多个实体嵌套在 1 个实体中,增加了对模型捕捉 长距离特征的依赖性;“藏青 3000”“C 两优农 39”实体由字母、数字、汉字混合组成,汉语词语的无边界性,

12、以及实体的复杂性和长度上的差异5,这给农业命名实体识别增加了挑战。农业领域命名实体识别的研究发展过程中,李想等6将 CRF 应用在中文农业领域,对于农作物、病虫害以及农药进行了识别,王春雨等7基于 CRF对于农业实体进行了识别,选取标注特征模板并比较了 BIO 和 BMES 2 种实体标注方式的效果。随着深度学习的发展,应用深度学习神经网络模型充分识别各个领域的命名实体已成为1种趋势。出现了越来越多的预训练模型,进一步提高了命名实体识别整体的性能。其中较为重要的是Devlin等8提出的 BERT 模型,在农业领域,赵鹏飞9等提出了基于 BERT 多特征融合的农业命名实体识别,证明了 BERT

13、模型在农业领域的有效性和适用性。但是农业命名实体识别领域对于预训练模型的应用研究较少,可以在此基础上进行研究发展。为解决以上问题,本文提出 1 种基于预训练语言模型 XLNet 的农业命名实体识别模型 XLNet-IDCNN-CRF,并构建针对农业领域的数据语料库,利用该模型对语料数据集中预定义的农作物、病虫害、农药和肥料 4 类实体进行识别,通过使用预训练语言模型构建词嵌入,利用文本的多维度语义信息快速准确地识别实体,有效提高了农业命名实体识别的效果。1 数据材料与方法1.1 XLNet-IDCNN-CRF 命名实体识别模型该模型由嵌入层 XLNet、编码层 IDCNN 和输出层 CRF 构

14、成。首先在嵌入层 XLNet 中输入文本,通过预训练模型,获得低维的字向量特征,并得到序列化的文本输入,将其拼接后作为IDCNN层输入,用于抽取句子的特征,接收语义信息后输入 CRF 层,由转移概率矩阵输出概率最大的序列标签,XLNet-IDCNN-CRF 模型如图 1 所示。OOO嵌入层CRF层水稻种植在南方OOIDCNNB-GropI-GropXLNet图 1 XLNet-IDCNN-CRF 命名实体识别模型Fig.1 XLNet-IDCNN-CRF named entity recognition model113第 4 期陈 明,等:基于 XLNet 的农业命名实体识别方法1.2 XL

15、NetXLNet 是由 Yang 等10提出的 1 种广义自回归预训练方法,在以往预训练模型的基础上做了改进,主要采用了 3 种机制:排列语言模型(Permutation Language Model,PLM)、双流自注意力机制以及Transformer-XL 结构。PLM 是 XLNet 为了实现获取双向语义信息提出的重要方法,XLNet 为平衡自回归(AR)和自编码(AE)语言方法,在 Transformer 内部通过 Attention mask 矩阵来对语句进行重排列,并同时保持自回归模型的单向模式。这个过程中每一个嵌入向量和相对位置编码是保持不变的,序列不会发生变化,因此不会像掩码机

16、制一样造成信息缺失。因目标位置信息缺失造成的问题通过双流自注意力机制来解决。当模型没有目标位置信息时,对于有部分排列下的模型组合,预测不同目标词的概率是相同的。例如输入是种植小麦,当有 2 种排列为 z=1,2,3,4和 z=1,2,4,3时 P(小|种植)=P(麦|种植),显然这 2 个字出现在种植后面的概率是不同的,为此引入了双流自注意力机制。公式(1)、(2)如下:gZt(m)Attention(Q=gZt(m-1),KV=hzt;)(1)hZt(m)Attention(Q=hZt(m-1),KV=hzt;)(2)其中 m=1,M 为自注意力层,hZt为内容表达式 h(xzt)的简写,代

17、表内容流主要为查询流提供其他词的内容向量,包括位置向量和内容信息;gZt为查询表达式 g(xzt)的简写,代表不包含预测目标的上下文语境;Q,K,V 分别代表 Query,Key 和 Value。XLNet 还使用 Transformer-XL11来解决超长句子的问题。现有的大多数预训练语言模型使用的Transformer 架构对长文本编码没有很好的效果,因为无法对超过固定长度的依赖关系完成建模12。在 Transformer 结构基础上,Transformer-XL 引入了相对位置编码以及循环机制。通过循环机制将每一个片段单独投入计算自我注意力,每一层输出作为隐藏状态存储在片段之间的 Mem

18、ory 存储单元中,作为预测下一个片段的额外输入,使模型可以捕获更长距离的依赖关系。具体运作方式如图 2 所示,虚线区域代表前一片段的注意力层的信息,前面片段的语义信息可用于预测下一片段,通过这种方式实现了长距离依赖关系的捕捉。Memoryx1x2x3x4Segment1x5x6x7x8Segment2图 2 Transformer-XL 循环机制Fig.2 Transformer-XL loop mechanismXLNet 能够充分获得上下文语义信息,并且能够更灵活地捕捉长距离依赖关系,克服了 AR 和 AE语言模型的不足,得到更精确的词向量表示。1.3 迭代膨胀卷积网络(IDCNN)层卷

19、积神经网络(CNN)在标注序列方面有一些缺陷,对于 CNN 来说要获取整个句子中的全部输入信息需要加入大量的卷积层,导致参数越来越多的同时计算及其复杂,整个模型复杂度上升导致难以训练。为了解决这个问题,Yu 等13提出了膨胀卷积神经网络(DCNN),使一次卷积能够获得更大感受野,获得更多的上下文信息,并且不改变卷积核窗口大小。在普通的 CNN 卷积核中,增加了 1 个膨胀距离,卷积操作作用在输入矩阵的时候,会跳过膨胀距离中间的输入数据,而卷积核的大小保持不变,这样能获取到更广阔输入矩阵上的数据。具体示意图如图 3 所示,膨胀距离会随着层数的增加而指数增加,图 3(a)是正常卷积操作,大小为33

20、;图 3(b)经过步长为 2 的膨胀距离,33 的感受野扩大成 77;图 3(c)膨胀距离为 4,感受野扩大成 1515。114第 46 卷河 北 农 业 大 学 学 报y*=arg max s(X,y)(5)2 实验及结果分析2.1 实验数据2.1.1 语料采集与处理 由于农业领域的命名实体识别研究较少,并且缺乏公开的语料库,本文通过数据收集、清洗、注释,建立了农业领域的实体识别语料库。本文主要运用爬虫框架来进行实验数据的采集,抓取中国农业信息网(http:/ E 网(http:/ Python 正则表达式、人工删除噪声文本等初步清洗的处理方式,保证数据可靠性,将文本数据处理成规范化的农业语

21、料库。2.1.2 数据标注 由于农业领域缺乏公开的数据语料库,也没有广泛使用的标注规范,对于通过清洗的标准化语料库,结合农业领域特点,通过人工标注方法进行标记语料库,其中,农作物实体包括植物名称及品种名称,如水稻和汕优 63,农药实体也包括产品名称和化学品名称,如敌敌畏和甲基异柳磷。不同类型的实体标注符号与示例如表 1 所示。表 1 语料库实体标注符号与示例Table 1 Corpus entity labeling symbols and examples实体类型Entity type实体符号Entity symbol示例Example农作物Crop小麦、两优培九病虫害Disease玉米粘虫

22、、小麦赤霉病农药Pesticide乐果、甲胺磷肥料Fertilizer尿素、尿素甲醛本文采用 YEDDA 标注工具对整个语料库进行标注。标注过程使用 BIO 编码标注方式。在该编码方式中,实体的开端用 B 表示,实体的中间和结尾部分用 I 表示,与实体无关的标签用 O 表示。语料库共包含实体 20 835 个,其中包括 7 267 个农作物名称,6 645 个病虫害名称,3 420 个农药名称,3 503 yYXabc图 3 膨胀卷积示意图Fig.3 Schematic diagram of dilated convolution迭代膨胀卷积(IDCNN)14则是在膨胀卷积的基础上,将 4 个

23、大小相同的膨胀卷积模型叠加在一起,每个膨胀卷积块内膨胀距离为 1,1,2。反复利用单位膨胀卷积,使每一次输出的结果作为下一次膨胀卷积的输入。参数线性增加的同时感受野呈指数增加,随着层数增加很快覆盖到全部输入序列。IDCNN 与 BiLSTM 模型在计算词的标签概率上非常相似,但是 IDCNN 在处理速度上可以充分利用 GPU 并行计算的优势,快于 BiLSTM,减少训练时间。对于 XLNet 层输入的向量,经过 IDCNN 层提取特征,输出到下一层标签解码。1.4 条件随机场(CRF)层理论上 IDCNN 层输出的结果包含了每个标签的分数值,可以直接输出概率最大的标签,但是标签之间有很强的依赖

24、性,这种依赖关系可以理解成需要 1 种约束条件,以确保输出序列的标签是合法的。Lafferty 等15提出了 CRF 模型可以对输出标签进行联合建模。对于输入句子 X=(X1,X2,Xn),设定 P 为 IDCNN 网络输出的分数矩阵。P 的大小为 nk,其中 n 表示输入句子包含字的数量,k 为不同标签的数量,Pi,j对应于句子中第 i 个单词的第 j 个标签的分数。对于输出的标签序列预测 y=(y1,y2,yn),它的得分定义为s(X,y)=ni=0Ayi,yi+1+ni=1Pi,yi(3)其中 A 是转移分数的矩阵,Ai,j表示从标签 i 到标签j的转移分数。y0和yn是句子开始和结束的

25、标记。在所有可能的标签序列上,通过 Softmax 函数得到标签序列 y 的条件概率为P(y|X)=es(X,y)yYX es(X,y)(4)YX代表句子 X 的所有可能的标记序列。最后通过 Viterbi 算法确定最优标签序列y*作为模型的最终标记结果。如式(5)所示115第 4 期个肥料名称,语料库统计信息如表 2 所示。表 2 语料库统计信息Table 2 Corpus Statistics实体类别Entity category开始标签Start label中间标签Middle label训练集Training set测试集Test set预测集Prediction set农作物 B-C

26、ropI-Crop5 0601 453754病虫害B-DiseaseI-Disease4 4421 329874农药 B-PesticideI-Pesticide2 400684336肥料 B-FertilizerI-Fertilizer2 452700351为验证 XLNet-IDCNN-CRF 模型有效性,基于构建的自标注数据集来验证模型的识别性能,将语料库按 721 的比例划分为训练集、测试集、验证集。验证集用于验证模型的训练情况,测试集的实验结果可作为模型实体识别性能的评价指标。2.2 实验环境与参数设置本文实验的命名实体识别模型基于 Pytorch 框架,具体实验环境设置见表 3 所

27、示。表 3 实验环境设置Table 3 Experimental environment settings名称Name配置Configuration操作系统Windows10CPUi7-9300H2.60 GHzGPU(显存)RTX2060(8G)Python 版本3.7.4Pytorch 版本1.4.0实验参数具体设置:选取 Adam 优化算法,学习率设置为 1e-5,IDCNN 层卷积核个数为 100 个,大小为 33,膨胀距离为 1,1,2,卷积层数为 4 层。选取 Relu 作为激活函数,Dropout 率设置为 0.1,模型序列最大长度为 128,批次大小为 32,最大迭代次数为 5

28、0。2.3 评价指标命名实体识别实验通常采用准确率(P),召回率(R),F1值来评价模型的性能优劣,其计算公式为P=TPTP+FP100%R=TPTP+FN100%F1=2PRP+R100%(6)其中 TP表示模型正确识别的标签总数,FP表示模型将错误的识别成正确的标签总数,FN表示模型将正确的识别成错误的标签总数。2.4 实验结果与分析2.4.1编码层性能对比为了验证编码层 IDCNN模 型 和 BiLSTM 模 型 的 性 能,将 数 据 集 在 2 种编码层模型中进行实验。模型初始的参数为由Word2vec16训练得到的 100 维预训练字符向量。识别结果如表 4 所示。表 4 不同编码

29、层识别结果Table 4 Identification results of different coding layers模型Model准确率 P/%Prediction召回率 R/%RecallF1/%训练时间/sTraining TimeBiLSTM-CRF92.1688.6490.36690IDCNN-CRF94.0087.2690.45315IDCNN-CRF 与 BiLSTM-CRF 模型在精度差距极小的情况下,由于 IDCNN 继承了 CNN 的特点,充分利用GPU并行计算与BiLSTM-CRF模型相比,训练时间减少了 375 s。在没有明显精度损失的情况下,应充分发挥 IDCN

30、N 的速度优势,提高模型响应速度。2.4.2不同预训练模型性能对比为验证 XLNet-IDCNN-CRF 的性能,本文在自构建的语料数据集上进行了 XLNet 与其他不同的预训练语言模型的对比,包括 BERT 模型、ELMo17模型以及作为基线的使用 Word2vec 根据原始文件的设置生成字符级嵌入的 IDCNN-CRF 模型。编码层与输出层统一使用 IDCNN 和 CRF 模型,对比结果如图 4 所示。94.00%87.26%90.45%94.46%89.57%91.92%94.28%91.17%92.69%95.58%92.36%93.91%82.00%84.00%86.00%88.00

31、%90.00%92.00%94.00%96.00%P(准确率)R(召回率)F1值IDCNN-CRFELMo-IDCNN-CRFBERT-IDCNN-CRFXLNet-IDCNN-CRF图 4 预训练语言模型实验结果对比图Fig.4 Comparison of experimental results of pre-trained language modelsXLNet 在预训练模型中取得了最好的效果,在准确率、召回率以及 F1值上都超过了其他预训练模型。农业领域中通常存在一词多义现象,例如“李”即可以代表水果“李”,也在很多情况下是某人的陈 明,等:基于 XLNet 的农业命名实体识别方法1

32、16第 46 卷河 北 农 业 大 学 学 报姓氏,无法消除歧义会对实体识别的结果带来一定误差。IDCNN-CRF 模型使用传统的 Word2Vec 获取的词向量,该模型生成的字向量是静态的,表征单一,无法获取同一词汇的多种含义,只在句子的表面提取特征,无法融入内部特征,因此在对比中效果最差;ELMo 能够实现动态获取词向量,将词向量由静态更改为随语境改变的上下文学习函数,因此能部分解决一词多义问题,但是模型无法从上下文不同方向进行预测,因而无法获取进一步丰富的语义信息,在 F1值上略高于基线 1.67%;BERT 在之前预训练模型功能的基础上,运用了 Mask 掩码机制以及自编码语言模型,更

33、好地获取上下文信息,得到更准确的语义表示,F1值进一步提升了 0.77%;而 XLNet 则在 BERT 的基础上,弥补了 BERT 在微调和预训练出现的差异,增强了捕捉长距离依赖关系的能力,模型的语义表征能力更强,因此在准确率、召回率和 F1 值上都分别超过了 BERT 1.30、1.19、1.22 个百分点,实现了识别效果的提升。2.4.3不同实体结果分析在效果最好的 XLNet-IDCNN-CRF 模型上,各不同种类的实体具体数值如图 5 所示。96.40%92.71%94.52%94.00%93.05%93.51%92.80%91.61%92.21%97.32%88.50%92.70%

34、84.00%86.00%88.00%90.00%92.00%94.00%96.00%98.00%P(准确率)R(召回率)F1农作物病虫害农药肥料图 5 XLNet-IDCNN-CRF 模型不同实体对比图Fig.5 Comparison of different entities in the XLNet-IDCNN-CRF model从图 5 可见,农作物、病虫害的 F1值普遍比农药和肥料要高。通过分析,农药和肥料的实体名称大多是“过磷酸钙”、“马拉硫磷”等化学物质,词语构成复杂,混合嵌套实体较多,易造成实体判定混淆,并且命名规律性较差,而很多农作物和病虫害实体构成结构简单,有着明确的边界特征

35、,例如“菜”“虫”“病”等,增加了模型对于该类实体的识别准确性。造成召回率和 F1 值差异的主要原因还有数据集中农药和肥料的数据量相比农作物和病虫害要小很多,由于数据有限,识别准确的难度比起实体丰富的另外 2 类要大。进一步改进应该从丰富农业领域数据语料库入手,获取更多数据支撑农业领域的实体识别研究。3 结论本文提出了 XLNet-IDCNN-CRF 的农业命名实体识别模型。通过 XLNet 预训练生成含有上下文信息的动态字向量,更好地传递语义之间的上下文信息,更准确地捕获长距离依赖关系,通过 IDCNN网络提升了训练速度。在自构建的农业领域标注语料库上实验结果可以达到 93.91%的 F1值

36、,相较于其他主流模型有了进一步的提升,能较好地完成农业命名实体识别,对农业领域的下游任务应用具有一定的参考价值。参考文献:1 Qiao B,Zou Z Y,Huang Y,et al.A joint model for entity and relation extraction based on BERTJ.Neural Computing and Applications,2022,34(5):3471-3481.2 Das P,Das A K,Nayak J,et al.A framework for crime data analysis using relationship amon

37、g named entitiesJ.Neural Computing and Applications,2020,32(12):7671-7689.3 Wu C C,Luo G,Guo C,et al.An attention-based multi-task model for named entity recognition and intent analysis of chinese online medical questionsJ.Journal of Biomedical Informatics,2020,108(17):103511.4 赵鹏飞,赵春江,吴华瑞,等.基于注意力机制

38、的农业文本命名实体识别J.农业机械学报,2021,52(1):185-192.5 Wu G H,Tang G G,Wang Z R,et al.An attention-based BiLSTM-CRF model for Chinese clinic named entity recognitionJ.IEEE Access,2019,7:113942-113949.6 李想,魏小红,贾璐,等.基于条件随机场的农作物病虫害及农药命名实体识别J.农业机械学报,2017,48(S1):178-185.7 王春雨,王芳.基于条件随机场的农业命名实体识别研究J.河北农业大学学报,2014,37(1)

39、:132-135.8 Devlin J,Chang M W,Lee K,et al.Bert:Pre-training of deep bidirectional transformers for language understandingEB.arXiv preprint arXiv:1810.04805,2018.9 赵鹏飞,赵春江,吴华瑞,等.基于 BERT 的多特征融合农业命名实体识别J.Transactions of the Chinese Society of Agricultural Engineering,2022,38(3).10 Yang Z,Dai Z,Yang Y,e

40、t al.Xlnet:Generalized 117第 4 期autoregressive pretraining for language understandingEB/OL.2019:arxiv preprint arxiv:1906.08237.https:/arxiv.org/abs/1906.08237.11 Dai Z,Yang Z,Yang Y,et al.Transformer-xl:Attentive language models beyond a fixed-length contextEB/OL.2019:arxiv preprint arxiv:1901.02860

41、.https/arxiv.org/abs/1901.02860.12 郭晓然,罗平,王维兰.基于 Transformer 编码器的中文命名实体识别J.吉林大学学报:工学版,2021,51(3):989-995.13 Yu F,Koltun V.Multi-scale context aggregation by dilated convolutionsC/Eighteenth International Conference on Machine Learning.Morgan:Kaufrnann Publishers Inc,2001:282-289.14 Strubell E,Verga

42、P,Belanger D,et al.Fast and accurate entity recognition with iterated dilated convolutionsEB/OL.2017;arxiv preprint arxiv:1702.02098.https:/arxiv.org/abs/1702.02098.15 Lafferty J,McCallum A,Pereira F C N.Conditional random fields:Probabilistic models for segmenting and labeling sequence dataEB/OL.20

43、15:arxiv preprint arxiv:1511.07122.https:/arxiv.org/abs/1151.07122.16 Mikolov T,Sutskever I,Chen K,et al.Distributed representations of words and phrases and their compositionalityEB/OL.2013:arxiv preprint arxiv:1310.4546.https:/arxiv.org/abs/1310.4546.17Peters M E,Neumann M,Iyyer M,et al.Deep conte

44、xtualized word representations EB/OL.2018:arxiv preprint arxiv:1802.05365.https/arxiv.org/abs/1802.05365.(责任编辑:张月清)15 霍静倩.黄顶菊中除草活性物质分离鉴定及作用机理研究D.保定:河北农业大学,2014.16 Huo J Q,Zhao B,Zhang Z,et al.Structure-based discovery and synthesis of potential transketolase inhibitorsJ.Molecules,2018,23(9):2116.17

45、高卫.基于除草剂作用靶标转酮醇酶的除草活性分子的合理设计与筛选研究D.保定:河北农业大学,2020.18 任达,王佳颖,李晓天,等.吡唑芳酰基硫脲类衍生物的合成及除草活性评价J.河北农业大学学报,2021,44(5):79-84.19 Wang Y E,Yang D C,Huo J Q,et al.Design,synthesis,and herbicidal activity of thioether containing 1,2,4-triazole schiff bases as transketolase inhibitors J.Journal of Agricultural and

46、 Food Chemistry,2021,69(40):11773-11780.20 赵斌,霍静倩,张哲,等.拟南芥转酮醇酶 Transket 结构域家族基因的鉴定和生物信息学分析J.河北农业大学学报,2015,38(4):71-75.21 Zhao B,Huo J Q,Liu N,et al.Transketolase is identified as a target of herbicidal substance-terthienyl by(上接第 103 页)proteomics J.Toxins,2018,10(1):41.22 Yi D,Devamani T,Abdoul-Zaba

47、r J,et al.A pH-based high-throughput assay for transketolase:fingerprinting of substrate tolerance and quantitative kineticsJ.Chem Bio Chem,2012,13(15):2290-2300.23 Yun C H,Yim S K,Kim D H,et al.Functional expression of human cytochrome P450 enzymes in Escherichia coliJ.Current Drug Metabolism,2006,

48、7(4):411-429.24 Mogk A,Mayer M P,Deuerling E.Mechanisms of protein folding:molecular chaperones and their application in biotechnologyJ.Chem Bio Chem,2002,3(9):807-814.25 杨冬臣,霍静倩,张哲,等.反枝苋乙酰乳酸合成酶与烟嘧磺隆分子结合模式分析及抗性位点预测J.农药学学报,2019,21(1):26-34.26 姬文婷,张永奎,杨宁,等.浅析农药喷雾助剂科学使用技术J.中国农业文摘-农业工程,2022,34(3):69-72.(责任编辑:李 川)陈 明,等:基于 XLNet 的农业命名实体识别方法

展开阅读全文
相似文档                                   自信AI助手自信AI助手
猜你喜欢                                   自信AI导航自信AI导航
搜索标签

当前位置:首页 > 学术论文 > 论文指导/设计

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        获赠5币

©2010-2024 宁波自信网络信息技术有限公司  版权所有

客服电话:4008-655-100  投诉/维权电话:4009-655-100

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :gzh.png    weibo.png    LOFTER.png 

客服