收藏 分销(赏)

基于深度学习的农村电商多源多模态数据融合.pdf

上传人:自信****多点 文档编号:327667 上传时间:2023-08-16 格式:PDF 页数:10 大小:2.43MB
下载 相关 举报
基于深度学习的农村电商多源多模态数据融合.pdf_第1页
第1页 / 共10页
基于深度学习的农村电商多源多模态数据融合.pdf_第2页
第2页 / 共10页
基于深度学习的农村电商多源多模态数据融合.pdf_第3页
第3页 / 共10页
亲,该文档总共10页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

1、 第2 5卷 第2期 2 0 2 3年4月滁 州 学 院 学 报J OURNA LO FC HU Z HOUUN I V E R S I T YV o l.2 5N o.2 A p r.2 0 2 3 基于深度学习的农村电商多源多模态数据融合孟凡会,王玉亮,汪 雷摘 要:本文利用深度学习算法D B N(D e e pB e l i e fN e t w o r k)实现农村电商跨平台、多模态数据的有效融合;建立多源电商平台的异构数据的采集、整合、识别、清洗、特征提取、分类和分析等信息处理过程;构建农村电商产品类型、品牌、产地、溯源等特征库,实现农村电商多平台异构数据的特征提取、实时处理和监测分

2、析;形成较高精度无损异构数据融合、信息分析与可视化、管理与决策一体化系统。研究改善了大数据背景下跨平台农村电商数据收集和信息处理的能力,提升了政府对农村电商发展现状和趋势的实时感知能力,为政府对农村电商的管理和政策决策提供可靠的信息保障。关键词:农村电商;深度学习;异构数据;多模态数据融合中图分类号:C 9 3 5;N 9 9 文献标识码:A 文章编号:1 6 7 3-1 7 9 4(2 0 2 3)0 2-0 0 5 2-1 0作者简介:孟凡会,滁州学院经济与管理学院副教授,研究方向:市场营销、消费者行为等;王玉亮,滁州学院计算机与信息工程学院副教授,博士(安徽 滁州2 3 9 0 0 0)

3、;汪雷,安徽财经大学农村经济社会发展研究院教授(安徽 蚌埠2 3 3 0 3 0)。基金项目:安徽省高校人文社会科学重点项目“江淮分水岭特色农产品推广策略研究”(S K 2 0 2 0 A 0 5 1 7);2 0 2 1年度安徽省社会科学创新发展研究项目“乡村振兴背景下安徽特色农产品推广研究”(2 0 2 1 C X 5 2 1)收稿日期:2 0 2 2-0 7-2 2 乡村振兴战略是新时代农业农村工作的总抓手,是建设现代化经济体系和健全社会治理格局的有效途径。数字乡村建设是乡村振兴战略的重要内容和战略方向,是带动和提升农业农村现代化发展,实现农业农村数字经济新业态和数字乡村可持续发展的总动

4、力1。农村电子商务(简称农村电商)是实现数字乡村战略中“互联网+农业”的具体体现。农村电商的快速发展促进了农产品在生产、流通和销售等产业链和供应链方面的构建,形成了农产品供销大数据2-3。2 0 1 9年全国农村电商合作社数量突破2 0 0 0个,全国农村电商网络零售额高达2 6 9 3.1亿元,较2 0 1 8年同比增长2 8.5%;其中,8 2 3个国家级贫困县农村电商网络零售额达到1 0 7 6.1亿元,同比增长了3 1.2%。电商销售的农产品涵盖了植物大类农产品(如粮油、酒、茶、植物类生鲜等)、动物大类农产品(如动物类生鲜、动物类中药材、动物类加工食品等)和农资大类产品(如农药、化肥、

5、种子、饲料等)4,形成知名农产品品牌多达5 9个,涵盖了生鲜食品、休闲食品和粮油调味等。农村电商发展模式逐步形成为“农户+合作社+电商平台”模式,并在数字乡村建设过程中规模不断扩大,结构不断得到优化5。全国有1 1 0个县组织开展“互联网+”农产品出村进城工程试点,众多电商平台快速布局农村地区,构建了多板块电商服务模式,如阿里巴巴集团将淘宝、天猫、菜鸟物流、淘宝直播、蚂蚁金服和聚划算等业务模块下沉到农村电商,开展了“基地直采”模式。其他知名电商企业也实施了农村电商服务模式,包括京东的“3 F战略”模式,拼多多的“拼模式”模式,美团的“生鲜电商”模式,饿了么的“社区化服务”模式,乐村淘、本来生活

6、、美菜网等的“源头直采”模式等。众多电商的参与,加快了农村电商的服务质量、农产品流和数据流的提升,农村电商大数据时代扑面而来。但由于众多电商采用的电商平台异构且发展不平衡,导致电商平台数据多源、多模态、跨平台,这为对农村电商发展现状的实时把握构成了挑战,对获取全面的农村电商数据和现状分析造成了困难,最终将直接影响政府的决策和农村数字化进程。本文以农村电商数据为数据源,以及时准确地把握农村电商发展状态和趋势信息为目标,利用 深 度 压 缩 算 法 和 深 度 学 习 算 法D B N(D e e pB e l i e fN e t w o r k)实现农村电商跨平台异构、多模态数据的有效融合;构

7、建农村电商产品类型、品牌、产地、溯源等特征库,实现多源电商平台异构数据的采集、整合、识别、清洗、特征提取、分类和分析等信息处理过程;改善了大数据背景下跨平台农村电商数据收集和信息处理的能力,提升了政府对农村电商发展现状和趋势的实时感知能力和情报收集能力,为政务对农村电商的管理和政策决策提供可靠的信息保障。1 相关研究1.1 概念界定1.1.1 农村电商大数据大数据(B i gD a t a)具有海量的数据存储规模,快速的数据流通,多元的数据类型及低价值密度的数据挖掘等特点,起源于分布式文件系统,分布式计算框架和数据库系统6。大数据技术为用户在数据管理、交互处理、特征提取和应用可视化分析等方面提

8、供了不可缺少的工具。按照大数据应用场景将数据进行分类管理,构建以需求为导向的大数据挖掘,满足现实场景应用的数据获取、清洗、特征提取和分析,及时把握应用场景的现状和趋势。农村电商大数据是随着农村电商快速发展而构建的以农产品产业链良性循环为背景的大数据应用新场景。农村电商大数据的应用可提升农产品精准生产和营销的产业水平,改善农产品产业链结构,提高农民增收,实现精准扶贫。当前 农 村 电 商 大 数 据 发 展 状 况 呈 现 以 下特点:(1)农村数字化进程推动了农村电商规模快速增长。随着乡村信息基础设施建设的不断完善,农村光纤和4 G覆盖率超过9 8%,提高了“三区三州”等深度贫困地区的网络覆盖

9、率,2 0 2 0年农村宽带接入户数达到1.3 9亿户,比2 0 1 9年增加了4 8 8万户,同比增加了8%;乡村智慧物流实施不断加强,2 0 2 0年全国开展了江苏、安徽、河北等6个省1 5个市(州)“快递进村”全国试点,乡镇快递网点覆盖率超过9 7%。农村数字化进程大力推进了农村电商的快速发展,初步形成了农业农村电商大数据,涵盖了农产品单品种全产业链大数据,为农村电商状态数据的有效挖掘和掌握构成了挑战。(2)多平台、数据多元化和异构性。农村电商平台经过近几年的快速发展,根据中国电商平台监测数据和国家统计局、农业农村部及商务部发布数据显示,当前主流的农村电商平台有4 0多家,涵盖了天猫、淘

10、宝、京东、苏宁和拼多多等大企业平台4,除此之外,农业合作社、个体农户利用融媒体开展多种渠道的电子商务,增加了农村电商的多元性发展。2 0 1 9年我国农产品电商销售平台已经突破了5 0 0 0家,不同的电商平台在数据结构、数据类型和数据接口等存在差异,数据组织形式的差异导致数据冗余度增大7;并且各平台发展不平衡,增加了数据不真实不全面的风险。多平台的农村电商数据构成了在信息空间和物理空间的数据异同7,对有效数据的收集、抽取、清洗、融合、建模和分析构成了挑战。(3)农村电商数据多属性、多形态,同步融合困难。农村电商不仅采用了传统电商的网络营销和经营方式,而且采用了多形态的经营方式,数据形式多样化

11、,主要的数据类型包括文本、图片、影音、混合数据等。新的农村电商营销模式(如直播带货)推动了农村电商大数据的多属性、多形态,增加了数据收集和处理的难度,对准确把握农村电商发展状况构成了挑战。1.1.2 多源农村电商数据多源农村电商数据是指电商数据的来源并非来自同一个农村电商信息平台,由于各电商平台在构建过程中存在技术差异和业务范围的差距,导致各电商平台产生的业务数据在存储方式、数据类型、数据管理系统等方面存在差异,这就构成了农村电商多源异构数据。农村电商的多源异构数据是农村电商平台呈多元化和发展不平衡的必然结果。多源数据产生来自对现实物理世界感知描述,按照一定的数字逻辑结构和存储方式构成的物理世

12、界的数字表达,将这些数据通过各自数据传输途径进行收集和数据整理,建立数据抽取和整合,利用多源数据融合技术达到数据的信息化处理和分析8。多源农村电商数据是农村电子商务运行状况在数字空间的集中表达,为农村电商大数 据 的 进 一 步 信 息 化 分 析 提 供 了 基 础 数据源。1.1.3 多模态农村电商数据多模态(M u l t i m o d a l d a t a)指人类通过感官所感知的多种模态形式,如听觉感知到的听模态,视觉感知看模态,触觉感知模态等,多个模态相互组合构成了人的多模态感知。将多模态概念引入到数据领域中是指从不同领域或视角获取同一对象的数据,这些数据具有不同表现形式或数据格

13、式。将不同领域或视角的数据通过数据融合技术得到描述对象的全面信息,多模态农村电商数据主要表现形式有文本、音频、图片、视频和混合数据等,按照数据属性标记建立数据联系,提取数据特征,35孟凡会,等:基于深度学习的农村电商多源多模态数据融合最终实现多模态数据的集成描述和融合表达9。多模态农村电商数据主要的获取渠道是各平台后台数据,这些数据由于平台技术发展不平衡、平台数据破碎化严重,将多源分布式多模态农村电商破碎化数据进行整合、建模、分析,可克服单一来源单模态数据的片面性和不准确性。1.2 数据融合技术数据融合技术是将来自单一或多源的数据或信息建立联系达到对数据或信息的重新认知、特征提取和判断,实现基

14、于多源数据为基础的信息综合感知描述和决策分析1 0。数据融合技术可将多源、异质、不完整数据或信息建立综合的数据属性,实现跨平台多源数据的互补性,提高数据或信息的完整度和准确性,为精准决策分析提供依据。多源数据融合技术在解决实际应用问题过程中提出了多种数据融合功能模型,实现对多源数据的分级处理,这些模型主要包括:J D L模型,UK情报环模型,B o y d模型以及混合模型1 1。多源数据融合算法按照算法属性可以分为基于估算理论的融合算法,基于不确定推理的融合算法和基于人工智能的融合算法1 2。其中基于估算的融合算法主要包括加权平均数法、最小二乘法、卡尔曼滤波法(包括适用于线性和非线性随机系统的

15、卡尔曼滤波器)、最大似然估计法1 3;基于不确定性推理融合算法将多源数据源的不确定、不完整、模糊信息建立识别、加工、推理达到关切信息识别和属性信息融合的目的,主要包括经典推理、主观贝叶斯推理、支持向量机理论(S VM)、D-S证据推理、D S MT方法、模糊数学理论及可能性推理1 4;基于人工智能的算法是建立在模拟人对自然信息获取和加工处理方式基础上,建立样本空间,通过大量样本训练、学习建立信息识别和提取,主要算法包括粗糙集理论、遗传算法、人工神经网络、知识系统等1 5。基于人工智能的融合算法利用先验知识的学习,达到信息和知识简约,从海量数据中检索属于关切内容的基本规则,建立最小规则解决方案。

16、基于人工智能融合算法具有较高的算法精度、良好的鲁棒性、快速的并行运算能力,尤其在多源数据融合中表现的优势越来越受到广大学者的关注。随着深度学习算法应用领域的拓展,深度学习算法在多源异构数据融合应用中得到业界偏好1 6。1.3 基于深度学习算法的多模态数据融合基于深度学习算法的多模态数据融合与传统深度学习数据融合机制相同,都是通过样本库构建、特征学习和训练、特征提取等过程,但面向的数据集对象不同。前者处理的对象是多源多模态数据集(跨平台、多种数据类型)或多模态交叉数据集。如J.N g i a m利用一种深度自动编码算法实现了两种模态(音频和视频)特征表示。基于深度学习算法的多模态数据融合模式可分

17、为基于规则的方法和基于分类的方法1 7。基于规则的方法是按照不同模态分类器中的权重得分、投票、先验知识自定义规则执行决策层的数据融合;基于分类器方法的融合是利用特征向量构建分类器,一般分类器由多模态特征向量组成,采用常用的分类算法(如支持向量机或神经网络)构建分类器,如贝叶斯网络按照多位特征向量学习。分类器可以根据需要构建多层分类器,将不同模态数据融合到异构向量中,实现多模态数据的融合。基于深度学习算法的多模态数据融合性能受到模型的选择和参数配置等因素的影响。多源数据融合技术可对用户产生的多渠道、多方位的数据建立多种感知方法,通过对数据的收集,多元交叉互补,有效消除噪声信息,减少信息冗余,达到

18、对数据把握的系统性、准确性和完整性,为数据的分析和进一步处理奠定了质量基础,为准确的信 息产生、分析 和决策提供 可靠的依据1 0。基于深度学习的多源数据融合技术通过算法的改进和升级可实现多源多模态农村电商数据的融合。本文在深度信任网络算法D B N(D e e pB e l i e fN e t w o r k s)基础上,引入深度数 据压缩算法,建立共享数据权重,实现多源多模态数据的无损压缩和冗余清洗;根据农村电商数据特点和类型,构建农村电商产品类型、品牌、产地、溯源等特征库,实现多源多模态异构电商数据的特征提取、分类和分析,实现了全面掌握农村电商发展现状,为政府的政策决策提供技术支持。2

19、 农村电商多源多模态数据融合2.1 多源多模态数据融合机制多源多模态数据融合机制主要包括五个层次(如图1所示):多源多模态数据源、数据的收集与分类、数据清洗与特征提取、数据融合过程以及信息处理和输出。其中,多源多模态数据为数据源,特点表现为跨平台、异构性、混合性、冗余度高、多数据类型和多种数据格式,有些数据不能直接作为统计数据使用,需要数据格式转变和特征提取。由于农村电商平台发展不平衡,且电商存在多样性和复杂性,导致收集的数据混淆度较大,存在部45滁州学院学报 2 0 2 3年第2期分平台数据的缺失,对全面了解电商的发展详情构成了挑战。但多源多模态数据从不同角度刻画了电商现状,克服了单一来源数

20、据、单模态数据的局限性,提高了数据的全面性和准度。数据收集和分类是将多平台多模态的数据建立多渠道收集方式,并将收集的数据按照数据类型和电商信息特征进行分类;数据清洗与特征提取主要完成分类后数据的冗余压缩和低价值数据的清洗,通过不同类型的数据建立样本数据,为特征学习和训练提供基础;数据融合层根据数据的特征,建立特征库,将属性相同的特征划分为同一类,按照分类器阈值,提取满足要求的特征值,实现多源多模态数据中共同特征的有效提取和表达;信息处理和结果输出层是根据决策需求,建立按需求的信息分析,分析结果为决策提供可靠的依据。图1 多源多模态数据融合过程(图中不同形状的符号代表不同类型的数据)2.2 农村

21、电商数据深度压缩和权重共享深度压缩(D e e pc o m p r e s s i o n)算法1 8是对大量数据或网络的一种优化方法,以达到降低数据冗余和数据或网络复杂度,从而降低存储和能量消耗,提高数据的运算效率。深度压缩算法通过三个步骤达到数据压缩的目的:(1)网络修剪(N e t w o r kp r u n i n g),将收集的多源多模态数据建立训练网络,对网络中各数据节点连接按照数据的类型和重要性赋予不同初始权值,建立网络修剪阈值,将权重小的连接(一般是权值为0的连接)按照阈值进行修剪,通过训练将修剪后的网络建立稀疏连接和索引,将权重按照索引进行存储。(2)权 重 共 享 和

22、量 化(W e i g h ts h a r e da n dq u a n t i z a t i o n),将上述网络中具有共同特点的权重建立共享权值,减少数据和权值存储量。采用K-m e a n s聚类算法,建立类内索引元素到聚类中心距离的优化确定聚类结果。定义网络存在m权重连接Wd=wd1,wd2,wdm,将这些连接划分为各聚类中心,这些聚类中心集合可表达为:=p1,p2,p(m),其中p是个聚类中心,则聚类的最小平方和可表达为:a r g m i n(i=1)(wdipi)|wdi-pi|2a r g m i ni=1wdipi|wdi-pi|2(1)通过聚类算法的前向反馈和后向传播

23、将权值利用聚类中心代替,利用类内的权值梯度降低更新聚类权重,实现权重的共享和更新。其中,聚类需要=l o g2 b i t作为索引编码,聚类中有m个网络节点连接权重共享一个权值,每一个连接权值在编码中占nb i t,则原有网络经过权重共享和量化后的压缩率为:Cc r=m nm+n(m)(2)其中,Cc r为压缩率,用于表示共享权重对网络连接压缩的性能。权重共享和量化过程将有效压缩网络连接数量,优化存储和检索速度。55孟凡会,等:基于深度学习的农村电商多源多模态数据融合(3)哈夫曼编码(H u f f m a nC o d i n g),利用哈夫曼编码解决编码长度不一带来的冗余问题。通常在卷积层

24、采用8 b i t编码,全连接层采用5 b i t编码。通过统一的熵编码减少数据的冗余。深度压缩三个步骤完成了数据存储量的压缩和运算复杂度的降低。图2 深度压缩过程(a)(e)为深度压缩的修剪、权重共享与量化以及哈夫曼编码过程)2.3 深度信任网络D B N(D e e pb e l i e fn e t w o r k s)D B N是一个建立在观察资料和标签之间的联合分布概率生成模型1 9。该模型由多层的受限玻尔 兹 曼 机R BM s(R e s t r i c t e d B o l t z m a n n M a-c h i n e s)构 成 的 神 经 网 络,包 括 显 示 层

25、(V i s i b l el a y e r)和隐藏层(H i d d e nl a y e r)两个单元,其中显示层为数据的输入端和数据训练,隐藏层为数据的特征检测单元。数据的训练和特征检测过程是逐层递进,隐藏层和显示层通过不同的权重连接,可实现双向连接,构成了权重矩阵。当显示层活动数据后,R BM按照权重优先级决定隐藏层的开或关,采用S形函数将每个隐藏单元的激励值计算出来,S形函数采用了L o g i s t i c函数:f(x)=11+e-x(3)R BM训练是求解一个训练样本的概率分布,产生训练样本的概率最大,而显示层和隐藏层的连接权重直接影响R BM的训练结果。D BM是由多层的R

26、 BM采用非监督贪婪逐层训练得到最优权值,训练过程如下:1)建立一个初始的R BM训练;2)生产固定的R BM权重和偏移量,并作为下个R BM训练的输入向量;3)根据第一个R BM训练的结果,充分训练第二个R BM,并将结果堆叠在第一个R BM上方;4)重复1)3)步骤,直至找到最大概率分布;5)通过F i n e-t u n e监督训练过程,对D B N网络中的所有参数进行监督训练,采用梯度下降方法寻找最佳的权重,使得A v e r a g e函数随权重的变化趋于最小值。D B N通过多层R BM训练对输入数据建立特征提取,并利用分类器完成数据按照特征的分类。本文中将多源多模态数据经过深度压

27、缩后的数据,作为D B N的数据输入。通过深度压缩后的数据,降低了数据的冗余,提高了数据的运算速度,并建立分类,为D B N深度学习训练样本提供了有效的数据源。采用基于深度压缩的D B N深度学习过程,如图3所示。图3 基于深度压缩的D B N深度学习过程2.4 基于深度学习的多源多模态农村电商数据融合总体模型在深度压缩和深度学习基础上,构建基于深度学习的多源多模态农村电商数据融合总体模型65滁州学院学报 2 0 2 3年第2期(如图4所示)。模型构建了多源多模态农村电商数据的收集、分类、信息融合、特征提取、信息分析和应用决策全信息化过程,整体上包括了六个层次,四个过程。其中六个层次主要包括数

28、据平台层、数据采集层、数据类型层、深度学习训练层、知识层和应用层。各过程的详细描述如下:图4 基于深度学习的多源多模态农村电商数据融合总体模型 (1)数据到有效信息的挖掘过程由于农村电商平台的多样性、破碎化、分散性和数据的复杂性,有效挖掘农村电商有效数据是信息分析和决策的基础。根据研究需求所包含的情报内容和目标,建立按照数据类型和模态为规则的分类,将农村电商平台数据划分为六个数据集,分别为字符模态、数值模态、混合文本模态、音频模态、视频模态和图像模态,建立各模态数据集对应的向量X=x1,x2,x3,xn,通过深度数据压缩K-m e a n s聚类分析和哈夫曼编码得到低冗余的数据集向量X=x 1

29、,x 2,x 3,x n,构建样本的特征向量X=x 1,x 2,x 3,x n ,作为D B N数据显示层的输入,通过R BM隐藏层的特征检测,学习和训练样本,得到特征样本库,建立各模态的样本数据库,通过分类器和阈值建立多模态数据的信息分类,实现多源多模态农村电商数据的信息化处理和特征提取。(2)多源多模态数据压缩过程多源多模态农村电商数据存在较高的数据冗余度,增加了数据检索和分类等运算的时间和空间复杂度。深度压缩算法利用网络修剪、权重共享与量化、哈夫曼编码三个步骤完成多模态数据的过滤。本研究为降低在数据压缩过程中数据的损失,采用基于熵值的修剪方法。在构建的输入网络中将特征映射转化为长度为f的

30、向量(f的数量等于过滤器的个数),将网络中的n个数据单元转为为n*f的向量,对于每个过滤器分成m个二进制单元,并统计每个二进制单元概率p,通过熵值运算判断过滤器的权重,删去权重小的过滤器单元,其熵值计算如下:Kk=-s u m(p*l o g(p)(4)其中,Hk为第k个特征向量对应的熵值。基于熵值的网络修剪通过迭代回复整体性能,使模型达到全局最优。权重共享是将网络中每一层所有权值进行聚类,将同类的网络连接权重采用聚类中心权值,最终将网络中的每一层权值都替换为聚类中心权值,聚类需要=l o g2 b i t作为索引编码,聚类中有m个网络节点连接权重共享一个权值,每一个连接权值在编码中占nb i

31、 t,计算压缩率Cc r。经过量化后,需要对网络进行微调优化,确保权值的更新仅作用于聚类中心,表达式如下:L Ck=i,jL Wi,j wi,jCk=i,jL Wi,j(Ii,j=k)(5)75孟凡会,等:基于深度学习的农村电商多源多模态数据融合其中,Ck表示第k个聚类中心,Ii,j表示wi,j的聚类中心的索引,类内权重的梯度求和可得到聚类中心更新值。哈夫曼编码按照字符出现的概率进行编码,如图2列举的哈夫曼编号实例。权重编码后可再次压缩数据存储量。哈夫曼编码过程是构建一个带权路径长度WP L最小二叉树(最优二叉树):WP L=ni=1wili(6)其中n为二叉树中叶子结点个数,wi为第i个叶子

32、结点的权值,li为根节点到第i个叶子节点的距离。大数据背景下多源多模态农村电商数据的深度压缩对有效数据的挖掘具有重要的意义,在降低数据冗余的同时,建立了数据新的存储结构,有利于数据的信息特征提取、分类和分析。(3)多模态数据的深度学习、训练和特征提取过程多模态数据的特征提取采用了D B N深度学习算法,本次采用了基于样本库监督学习建立特征学习过程。D B N利用标签数据和观察数据之间的概率分布建立概率生产模型,一个D B N有多个R BM构成,每个R BM包含了两个神经元:显示层(V)和隐藏层(H)分别用于数据的训练和特征检测。每层用一个向量表示,每一维表示一个神经元。显示层的概率表达式为:P

33、(v|h)=ni=1P(vi|h)(7)隐藏层的概率表达式为:P(h|v)=mi=1P(hi|v)(8)对一个新的样本X=(x1,x2,x3,xn)每个隐藏层开启状况的概率取值为:P(hi=1)=11+e-w x(9)R BM训练最终要产生训练样本的概率分布,其决定因素为连接权值w,训练过程中目标是寻找最佳的权值。D B N深度学习建立农村电商特征库,按照农村电商产品类型、品牌、产地、溯源等特征,整合特征属性,建立特征属性数据库,为农村电商信息的进一步分析和应用提供基础。(4)信息分析和应用决策过程农村电商数据信息的开发和应用是全面把握农村电商发展现状和趋势的必要途径。农村电商数据的应用要建立

34、在计算机科学与信息管理的深度融合基础上,通过对离散数据的深度挖掘,提取所需信息的特征数据,按照数据的信息化描述,信息单元的空间表达,知识要素的构建和有效数据的关联,建立多源多模态数据的有序化知识库,实现信息的较宽泛表达,精细化描述农村电商现状。多模态数据较单模态数据具有信息的完整性、交互性和包容性,能够细颗粒的描述电商的发展情况。这些信息的可视化将直接有助于分析农村电商发展现状,为政府对进一步改善农村电商环境和发展政策提供强有力的依据。2.5 基于深度学习的多源多模态农村电商数据融合案例分析本研究数据来源于包括拼多多、美团、快手等在内的3 5个电商平台,数据类型涵盖了字符、数值、视频、图片、混

35、合文本等6种,以2 0 1 9年全国热销农产品为例,建立农产品销售数据库,按照农产品三级品类进行数据收集,主要包括水果、食用油、园林/农耕、大米、休闲食品、海鲜水产、蔬菜、杂粮、红茶、绿茶、干货、禽肉蛋品、花卉绿植、花草茶/花果茶等。按照销量排名,选取了1 9个销量排名靠前的农产品(将红茶、绿茶、白茶等茶类合并统称茶类),其中销量排名前三的农产品为休闲食品、茶类和水果,农村电商销量排名前三的省份为浙江省、江苏省、福建省,1 9个农产品销量占全电商平台销售总量的2 5.6 9%。从1 9个品类销售情况可发现浙江省农村电商发展较快,规模全国最高,占全国农村电商销售的8.6 4%,覆盖了1 9个品类

36、的7个品类。全国农产品农村电商1 9个品类产品排名见表1。图5和图6分别展示了所选1 9个品类农产品农村电商平台在省级和市县(区)级全国销量占比情况(2 0 1 9年)。从图5所示内容中,所选的1 9个品类中销量最高的两个省份是浙江省和江苏省。而从市县(区)销量占比情况来看,浙江省的萧山区、福建省的安溪县和江苏省的沭阳县农村电商销售占比排名为前三。两个图的分析都说明了农村电商发展较发达的区域在浙江、江苏、福建等中国东南部,从农产品电商销量来看,休闲食品和茶类是农村电商热销产品。而农资(饲料)、园林/农耕等销售潜力有待发掘。特色农产品销售拉动农村电商销售动力巨大,如内蒙古自治区和林格尔县的液态奶

37、产品,宁夏回族自治区中宁县的枸杞和浙江省桐乡市的粽子产品,启发了农产品在销售过程中应走特色之路。85滁州学院学报 2 0 2 3年第2期表1 全国农产品农村电商1 9个品类产品销量排名(2 0 1 9年)编号农产品全国销量占比(%)农村电商销售分布区1休闲食品1 0.8 7浙江省、江苏省、福建省、河南省、广东省、安徽省2茶(白茶、红茶、绿茶、花茶等茶品)2.5福建省、广东省、山东省、浙江省、安徽省、河北省3水果2.2 6四川省、江苏省、山东省、陕西省、山西省、广西壮族自治区4海鲜水产1.7 6江苏省、福建省、浙江省、山东省5食用油1.2 5山东省、江苏省、福建省6大米0.9 5江苏省、黑龙江省

38、、辽宁省7液态奶0.9 4内蒙古自治区8饲料0.6 5浙江省9鲜肉0.4 9江苏省1 0园林/农耕0.4 7浙江省、山东省1 1粽子0.3 5浙江省1 2方便食品0.2 5重庆1 3枸杞0.1 6宁夏回族自治区图5 1 9个品类农产品农村电商平台全国销量占比图6 全国市县区1 9个品类农村电商全国销量占比3 农村电商发展评价与决策通过农村电商平台多模态数据深度学习融合技术,将分散性强、技术发展不平衡的平台异构数据深度挖掘,按照农产品属性的可视化分析要求,完成了数据的有效信息提取、信息识别、信息界定、信息筛选、信息整合、信息分类和信息分析,为全面把握农村电商发展现状提供了可靠的信息支持。从信息分

39、析结果可知,我国农村电商发展存在的主要问题包括如下几个方面:(1)我国现阶段农村电商地区发展不平衡,呈现西北、东北落后于华东的区域格局。从2 0 1 9年农村电商大数据分析可知,我国西北和东北地区农村电商发展滞后。2 0 1 9年西北和东北地区农村电商农产品销售占比为1.8%,而华东地区农产品电商销售占比为6 0.4%。中西部地区农村电商发展迅速,而增速较快的区域主要在西南和西北地区,2 0 1 9年分别同比增长了6 6.7%和6 2.7%。这说明了我国农村电商进入了快速发展的阶段,呈现了东部带动西部,中部快速崛起的积极局面。另外,农村电商的发展与区域的基础设施建设有密切的关系,基础设施较完备

40、的区域农商电商发展速度高于基础设施薄弱的地区。(2)电商平台下沉农村,促进农业发展。从产品端到生产端不断拓展,但在现代农业生产、产品深加工、产品服务升级和农产品产业链重塑等方面潜力较大。农村电商不能直接照搬照抄成功的城市电商经验,由于农村电商涉及面广,传统生产、加工、销售对农村电商影响较大。农村农产品市场没有充分挖掘,市场潜力有待开发;农产品服务质量有待提升,农产品溯源事业还有很长的路要走。(3)农产品品牌在农村电商销售中发挥着重要作用,但全国8 0%的电商经营者没有自主品牌,且品牌意识淡薄,已有品牌的电商经营者也不重视品牌维护,最终导致销量低迷,阻碍了农村电商高质量发展。从农村电商大数据可知

41、,品牌效应是推荐农产品消费升级的直接动力,如2 0 1 9年“三只松鼠”在休闲食品电商销售量占比为1 4.3%,消费者黏度高;而“金龙鱼”“福临门”“鲁花”在粮油电商销售占比分别为5.1 3%、3.3 8%、2.5 7%。老品牌在电商销售中依然具有一定的优势。大部分农产品停留在低价销售初级农产品,缺乏产品95孟凡会,等:基于深度学习的农村电商多源多模态数据融合的深加工、附加产值和高质量服务,已有的大部分品牌缺乏宣传力度,公众认知度低。根据农村电商现状,结合我国电商发展趋势和国家对农村数字化发展规划,提出了农村电商发展规划如下:(1)以“数字乡村建设”和“乡村振兴”为发展契机,加快完善中西部地区

42、电商基础设施建设,全面推进信息进村入户工程,缩小城乡“数字鸿沟”,促进东西部协调发展,完善农村电商全网服务体系构建;加强对贫困地区和交通欠发达地区的快递物流体系建设,推进农产品产业链的高质量发展,提高农产品在国内外市场流通能力。推动农产品冷链流通体系构建,创新、高质量推进农产品冷链流通模型改革,打通农产品在销售和流通的“最后一公里”。同时地方政府应在 数字乡村发展战略纲 要 数 字 农 业 农 村 发 展 规 划(2 0 1 92 0 2 5年)文件指导下,大力发展农村电商服务,为农村电商的发展营造良好的政策体系和管理机制环境,加快数字乡村发展。(2)加强电商平台发展引导,实现农村电商在农村数

43、字化建设中供给侧结构性改革。改变传统的产业链供销模式,必须从农产品的生产端开始,将现代农业生产模式快速渗透到农产品的生产过程中,充分利用电商平台优势资源加快实现农产品生产标注化、现代化、产业化,重点解决农产品在深加工、品牌打造、产销一体化、调度智能化发展,利用物联网、大数据、区块链和人工智能等信息技术,实现农商平台信息化管理、农业生产的全数字化管理和农产品全过程的可视化溯源。(3)树立农产品名牌意识,加强现有品牌的宣传和质量提升,地方政府应加快实施“一村一品”建设,推进品牌提升行动,构建中国农产品品牌目录,改善地理标识农产品认证体系和加强品牌农产品的推广。发掘地方特色农产品与地方特色文化的关联

44、,提升特色农产品文化和地域内涵;提高农产品品牌的附加值,完善品控管理体系,提高我国农产品品牌的认可度,不断提升中国农产品品牌在国内外市场的竞争力和影响力。4 结语农村电商快速发展对改善农产品产业结构,构建农产品现代化产业链具有重要的现实意义。全面把握农村电商发展状况是政府引导和制定农村电商发展政策的必要条件。为克服农村电商数据破碎化、平台分散化、发展不平衡等问题,通过构建深度压缩和深度学习模型,完成农村电商多源多模态大数据的采集、整合、识别、清洗、特征提取、分类和分析等信息处理,实现农村电商多平台异构数据的特征提取、实时处理和监测分析,构建农村电商产品类型、品牌、产地、溯源等特征库,实现了农村

45、电商大数据的深度分析和可视化;模型改善了大数据背景下跨平台农村电商数据收集和信息处理的能力,提升了政府对农村电商发展现状和趋势的实时感知能力。参 考 文 献1 农业农村部新闻办公室.中国数字乡村发展报告(2 0 2 0年)E B/O L.2 0 2 0-1 1-2 8.h t t p:/ww w.m o a.g o v.c n/x w/z w d t/2 0 2 0 1 1/t 2 0 2 0 1 1 2 8_6 3 5 7 2 0 5.h t m.2 方迎君.数字乡村评价指标体系构建与分析J.山西农经,2 0 2 0(1 1):2 1-2 3.3 文英.农产品全产业链大数据建设与农村电商的有

46、效融合研究J.农业经济,2 0 2 0(9):1 2 9-1 3 1.4 农业农村部信息中心,中国国际电子商务中心研究院.2 0 2 0全国县域 数 字 农 业 农 村 电 子 商 务 发 展 报 告 E B/O L.2 0 2 0-0 4-3 0.h t t p:/w w w.m o a.g o v.c n/x w/b m d t/2 0 2 0 0 4/P 0 2 0 2 0 0 4 3 0 6 6 4 5 4 3 2 3 2 9 1 6.p d f.5 艾媒新零售产业研究中心.2 0 1 9年中国电商半年度发展全景报 告 E B/O L.2 0 1 9-0 8-1 4.h t t p s

47、:/ww w.i i m e d i a.c n/c 4 0 0/6 5 7 2 0.h t m l.6 胡昌平,吕美娇.大数据与智能环境下的情报学理论发展J.情报理论与实践,2 0 2 0,4 3(1 0):1-6.7 D AHE RJB,B RUN A,B OY E R A.Ar e v i e wo nh e t e r o g e-n e o u s m u l t i-s o u r c e a n d m u l t i-d i m e n s i o n a l d a t a m i n i n gE B/O L.2 0 2 0-0 2-2 8.h t t p s:/h a l

48、-l i r mm.c c s d.c n r s.f r/I N R I A/h a l-0 1 8 1 1 2 3 2 v l.8 巴志超,李纲,安璐,等.国家安全大数据综合信息集成:应用架构与实现路径J.中国软科学,2 0 1 8(7):9-2 0.9 L AHA TD,T L AYA D A L,J UT T E NC.M u l t i m o d a lD a t aF u s i o n:A n O v e r v i e w o f M e t h o d s,C h a l l e n g e s a n dP r o s p e c t sJ.P r o c e e d i

49、 n g so ft h eI E E E,2 0 1 5,1 0 3(9):1 4 4 9-1 4 7 7.1 0 孟凡会,王玉亮,汪雷.信息碎片化下用户痛点多源信息融合分析研究J.情报理论与实践,2 0 2 0,4 3(7):1 0 3-1 0 8.1 1 余辉,梁镇涛,鄢宇晨.多来源多模态数据融合与集成研究进展J.情报理论与实践,2 0 2 0,3 2 2(1 1):1 7 3-1 8 2.1 2 元晶.多源信息融合技术及应用发展现状J.工业经济论坛,2 0 1 7(5):4 2-4 7.1 3 彭冬亮,文成林,薛安克.多传感器多源信息融合理论及应用M.北京:科技出版,2 0 1 0:1

50、-2 0.1 4 潘泉.多源信息融合理论及应用M.北京:清华大学出版社,2 0 1 3:1 5-2 5.1 5 祁友杰,王琦.多源数据融合算法综述J.航天电子对抗,2 0 1 7,3 3(6):3 7-4 1.1 6 付丹,潘正军.深度学习模型在多源异构大数据特征学习中的应用研究J.电脑知识与技术,2 0 1 9,1 5(2 6):1 4-1 6.1 7 A T R E YPK,HO S S A I N M A,E LS A D D I KA,e t a l.M u l t i-m o d a l f u s i o nf o r m m u l t i m e d i aa n a l y

展开阅读全文
相似文档                                   自信AI助手自信AI助手
猜你喜欢                                   自信AI导航自信AI导航
搜索标签

当前位置:首页 > 学术论文 > 自然科学论文

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        获赠5币

©2010-2024 宁波自信网络信息技术有限公司  版权所有

客服电话:4008-655-100  投诉/维权电话:4009-655-100

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :gzh.png    weibo.png    LOFTER.png 

客服