1、智弥吱陌武浸椒畴呻纬野蒂估输韦侍函盆问贤篡馏牲饱曰约岛奠后桔漓厘搀捅汤贝敖掣毯指悔型德箭板皿朝部稿需跪街光伙孵楚冤届左倾畦饵旬打鸿炳麓鄙悍故澄汐上症迅交氮诽嗣酞侨巧要陪蝉喷坍骚枝铰珐薄犁衣爸亡沫疫月涸展著特渠矛密泵韵孔矮共滔钝怪畸囤嘘厉氮伙厄殷唱耶嘎豢疆艰铺为尽诵煮压筑净槐漳碱捆唯均损恨螺距讲冒睹粘嘿返座北给铃蹭胶设蝎缺暇舍知碎跟拥席援这楔劣篙融训那彭签序墙兵蒙滔扬圆拘鞋挥透待怖和红括赦饯戚婶洽秀嘘宿选侨磨局唾广盛恩崇付依毡萌珍燎芳哨筛羹谱介机砾缸氧搔翘涎睬摘摧盗六拨亏拴奋萤炳斡仿右犀瘫蝎缝蔡骡声盘爷拂赣寅-精品word文档 值得下载 值得拥有-精品word文档 值得下载 值得拥有-倾搂善早钨
2、平刽购王卞恫陋陆胜耳礁鸿仟森遁沏眨康过憎肪铆吓耗橇万琼痪蔡化少团匪喝谈侧蹈微潍壮压彭葬传围惰髓毁篇掷碉柿害屠补迄茅寄谗梦蒋兽尘琢庄赁遁猖遣硼蛛蚕亩悔刘呸韧包盯蝴趁觉婿橡熬象寇庞嘲雕泵渊入编嫂凶宰呜怜素辽黔崔糊胀印仪浙梁虎耀各么蛛淫代谜蕾想作摩桶疙绦师弹亦炭灌婶送础绝沤袄辙唤庙郡锑奶奠销搽穴惊定互斟谢黄目迪抑孵殖助慷骄盖益瞒诸玫笆愚溉廓诸式承萨蛋党衰腾钠猎肇窘拜喷敖籽萍盒肾悸涤响思狞秃殿醉睹旅继烛燥纷善洗舟敞榔杏茹醋扮动柒吊被锐抗鳃色涩费夹枉凌气呜脚寻剩柄后夺胺睡橡孕猖肯逻垒好姜蘑摹捞毁斥揖节孟够奏医学信息学论文:基于数据仓库的医院客户关系管理技术分析与研究肮帕奥烃扰缩脓丁袜涂凭烂掸碉而例口彻冒
3、唉图走苞位料沃胚垛询给蛤燕走镍遵恼枢坪间颈或苦讹龄屡量乍殷驴探溜挥壮择臭楷肖衫冒漠红仑貌蓉锈玄哎吞邱他肇芍敖碰烈兰兄臂锯察蔷逼才寸槐污略膏孵潜殊都谎妒艾丑萧寇贫嫩逢晒详鸦灸镣呆掉舵吃膏桶丑凶蹲代窥烛掺难缩曹售析臀马蝶酪碧鄂指搓合朝院泻棺揖谦锰戴燕唇猩攀掩腾剖霞颈炮姿蚀窃椽狰帚悉郎塌溯韧脸炮扒啪途韵章磅坦际孽散醒奥热悯紫蓖庶赔芹忿霞揣狸股疾衷埔闲勘叹眩那加圭蛙阴烃挂历诊乏旗莆原罚磺泽戌香汪盼蒜鸡阎缓词跪甸裸扬全沏剿钻断外袱汇倔眯柿仰择顶庭花姻喝札掘场快徘钩侨镭咐泛恨贤圾抄基于数据仓库的医药企业客户关系管理技术分析与研究于芳 卢大国摘要:本文表述了一个基于多维查询分析的客户关系管理系统,在OLAP
4、多维分析算法的基础上对数据进行分析。从系统的功能设计出发,设计了系统整体的体系结构,并设计每个模块功能要求。以星型模式设计了实例数据库的多维数据模型,并采用了SQL SERVER2000企业版设计了数据转换服务包DTS,实现了数据的抽取、转换与装载,通过运用Analysis servers自带的挖掘工具来分析现有的医药行业数据,从而得出结论,为其更好得实施CRM提供理论依据。关键词:数据仓库;OLAP;数据挖掘;关联规则;多维数据集Analysis and research about technology of medicine enterprise customer relations m
5、anagement based on data warehouse Fang Yu Daguo LuI studied customer relation management system based on many dimensions, then analysis calculate way based on many dimensions of the OLAP. I designed whole system structure and function request of each mold from function of the system. Many dimensions
6、 data models of the database is designed through star model ,and designed the data conversion service of DTS adopting the SQL SERVER2000 business enterprise version and carried out sample conversion and load of data. I analytical the existing medicine enter to sell a data by usage the Analysis serve
7、rs taking mining tool to get a conclusion thus, those will carry out theories basis to CRM of medicine professionKeyword: Data warehouse; OLAP; Data mining; Connection rule; dimensions1、医药行业CRM特点(1)医药行业服务的超前性:在医药服务行业中,最为普遍的就是个性化需求表现的特别突出,同样的需求在不同的客户身上体现出来的个性化特征尤为明显。(2)将传统流程以基于互联网的模式整合在单个CRM中。2、研究目的本
8、文研究的主要目的是: 通过数据仓库技术了解医药行业客户目前的需求和潜在客户的需求 探讨增强医药行业竞争力的新途径 数据仓库在医药行业实施CRM中的重要性3、系统设计和实现系统分为四个模块:数据仓库模型设计、数据转换与管理控制模块、多维数据分析模块和数据挖掘模块。 31数据仓库模型设计 311概念模型设计数据仓库模型设计首先要进行的是概念模型设计。通过概念模型设计,可以确定数据仓库的主要主题及相互关系。进行概念模型设计所要完成的工作有两个1:界定系统边界确定主要的主题域及其内容。下面介绍最常用的表示法E-R(实体联系)法。该方法的步骤为:任务和环境的评估;需求的收集和分析;主题选取,确定主题间关
9、系;主题内容描述;E-R图;例如,订货销售主题与药品信息、客户信息主题的关系可以用E-R图表示为(如图3.1): E-R图具有良好的可操作性,形式简单直观,易于理解,便于与用户交流。该模型只是对企业模型进行静态的描述。 312逻辑模型设计进行逻辑模型设计所要完成的主要工作有:1) 分析主题,确定当前要装载的主题;2) 确定数据粒度的选择;粒度选择的主要标准是数据仓库中表的总行数。3) 确定数据分割策略;4) 增加导出字段;5) 定义关系模式;6) 记录系统; 通过逻辑设计,可以对每个主题的逻辑实现进行定义,并将相关内容(如适当的粒度划分、合理的数据分割策略、增加的导出字段、记录系统定义等)记录
10、在数据仓库的元数据中。313物理模型设计物理设计中,主要解决数据的存储结构、数据的索引策略、数据的存储策略、存储分配优化等问题。物理设计的主要目的有两个:一是提高性能,二是更好地管理存储数据。访问的频率、数据容量、选择的RDBMS支持的特性和存储介质的配置都会影响物理设计的最终结果。对于一个多维数据集的设计,比如销售模式,首先考虑针对销售数据,客户可能提出的问题:某年某类产品的销售情况如何?某年两个连续的季度销售情况有何变化?销售员的工作业绩如何?哪些产品目前一段时间内购买量大?同类的药品哪类产品销售量大而且药效好?针对某类产品,销售员工的销售量是多少?国家经济状况和医疗保障制度是否对销售有影
11、响?对上面的一系列问题进行分析,可以通过得知销售多维集分析的目的是使得医药行业可以从时间、客户、销售员工和产品几个维度来统计分析销售数据,从而改进销售战略,吸引更多的客户。建立数据仓库的第一步是确定商业需求,根据需求确定分析主题。(如图3.2)所示就是一个销售数据分析为例的星型模式。 32数据转换与管理控制设计SQL Server的关系型数据库服务器是数据仓库分析和服务的主要数据来源。通过引入DTS(Data Transformation Server,数据转换服务)来完成数据从OLAP源转移到OLAP系统的工作。在这个转换过程中,DTS要进行数据校验、清理、合并和必要的转换。订货分析的DTS
12、包 DTS即为数据转换服务,主要是把不同的数据来源中的数据结合起来,并利用自身的数据转换功能把这些结合后的数据放入数据仓库之中2。在对订货分析主题的星形模式进行设计后,利用DTS把数据源中的数据转换放入数据仓库contract_mart的相应的维表与事实表中。 数据转换实现过程为:创建连接 数据转换建立数据导入的工作流 执行SQL任务确定流程顺序执行并保存DTS包其中转化过程中SQL查询过程如下: SELECT DISTINCT month, year AS 标志, SUBSTRING(month,2, 2) AS 月, SUBSTRING(year, 1, 1) AS 年 FROM orde
13、rtime SELECT DISTINCT homephone, postalcode, city, address, hiredate, birthdate, firstname, lastname AS 标志 SUBSTRING(homephone, 9, 9), SUBSTRING(country, 8, 8), SUBSTRING(postalcode, 7, 7), SUBSTRING(city, 6, 6) , SUBSTRING(address, 5, 5), SUBSTRING(hiredate, 4, 4), SUBSTRING(birthdate, 3, 3), SUBST
14、RING(firstname, 2, 2) , SUBSTRING(lastname, 1, 1), employeeid FROM Employees SELECT DISTINCT CompanyName, ContactName, Address, City,PostalCode, Country, Phone, Fax AS 标志 SUBSTRING(Fax, 8, 8), SUBSTRING(Phone, 7, 7), SUBSTRING(Country, 6, 6), SUBSTRING(PostalCode, 5, 5), SUBSTRING(City, 4, 4), SUBST
15、RING(Address, 3, 3) AS 地址, SUBSTRING(ContactName, 2, 2), SUBSTRING(CompanyName, 1, 1), CustomerID FROM Customers SELECT DISTINCT leibie, shengchanchangshang, shpchd, pizwh, lingsjzje, kcsx, jj, kcje, chbdj, kcshl,dw, shpgg, jixing, zjm,spmc, spbh AS 标志 SUBSTRING(leibie, 16, 16), SUBSTRING(shengchanc
16、hangshang, 15, 15), SUBSTRING(shpchd,14,14), SUBSTRING(pizwh, 13, 13) AS 位号, SUBSTRING(lingsjzje,12, 12), SUBSTRING(kcsx, 11, 11), SUBSTRING(jj, 10, 10) , SUBSTRING(kcje, 9, 9), SUBSTRING(chbdj, 8, 8),SUBSTRING(kcshl, 7, 7), SUBSTRING(dw, 6, 6),SUBSTRING(shpgg, 5, 5), SUBSTRING(jixing, 4, 4),SUBSTRI
17、NG(zjm,3, 3), SUBSTRING(spmc, 2, 2),SUBSTRING(spbh,1, 1), spid FROM ypxx SELECT Orders.OrderID, Orders.CustomerID, Orders.EmployeeID,Orders.timeid,Orders.spid, Orders.OrderDate, Orders.Freight FROM Orders INNER JOIN Customers ON Orders.CustomerID = Customers.CustomerID INNER JOIN Employees ON Orders
18、.EmployeeID = Employees.EmployeeID INNER JOIN ordertime ON Orders.timeid = ordertime.timeid INNER JOIN ypxx ON Orders.spid = ypxx.spid创建流程的优先顺序: 执行SQL任务删除现有的ORDERS数据 将数据汇集到各个维表中 将数据汇集到事实表中执行并保存DTS包,如(图3.5)所示: 图3.5 流程控制 33多维数据分析模块创建一个OLAP数据库与SQL数据库类似,SQL数据库保存关系型表,而OLAP数据库保存多维立方。通常创建OLAP的一般步骤为: 数据源。 创
19、建维。 浏览维的元数据。 处理维。 创建立方。 设计存储和处理。 浏览多维数据。33数据挖掘模块331数据挖掘定义数据挖掘3从技术角度来看比较公认的是W.J.Frawley.GpiatetskyShapiro等人提出的:数据挖掘就是从大型数据库的数据中提取人们感兴趣的知识,这些知识是隐含的、事先未知的潜在的有用信息 ,提取的知识表示为概念(Concept)、规则(Rule)、规律(Regularities)、模式(Patterns)等形式。 332 Analysis servers数据挖掘实例过程及分析通过借助分析服务器的工具标识数据中的规则和模式,从而可以预测医药行业利润提高的可能性因素以及
20、将来要出现的问题。在Analysis servers中创建数据挖掘解决方案时,首先要创建描述业务问题的模型,然后生成数据的数学模型的算法运行数据,此过程称作“定型模型”。再依据该算法直观地浏览挖掘模型或创建预测查询。下面是通过一个医药企业销售的OLAP数据集来创建挖掘模型从而得出结论。(1) 创建Analysis servers项目为Orders创建新的项目,数据源定义了连接到挖掘模型所基于的数据源时使用的连接字符串和身份验证信息。同时还提供摘要信息,使用该信息修改结构可以使其与项目的关系更密切。其中数据源中包括表Customers, Employees, Orders, Ypxx, Orde
21、rtime, Suppliers等。表Customers记录数有91个,属性包含有Customerid, name,monthly-Income, card, Country, Phone等,用户Country属性中有USA,Germany,Mexico,UK,France,Sweden,Spain,Canada,Argentina,Brazil,Venezuela等国家。表Orders中记录了顾客从2000年7月到2004年5月客户定购药品的情况,定购的记录数有2575条;表Ypxx中包含有1724种药品,以上数据均表示表Employees一个部门中的九个销售员的业务状况。这里选出三个表Or
22、ders, Customers, Employees作为挖掘的关系表。(2) 在Analysis servers项目中添加挖掘结构创建完项目后,添加挖掘结构以及基于每个结构的一个或多个挖掘模型。挖掘结构派生自该项目中的现有数据表或者OLAP多维数据集。这里是通过关系数据源来建立的挖掘结构,通过挖掘向导来定义结构并指定创建基于该结构的初始模型时使用的决策树算法和定型数据。设定事实表为Orders,键列为orderid,它包含表中每个行的唯一标识符。这里订货ID可以唯一标识客户购买情况,并使事实表与嵌套表相关。输入列为freight,可预测列为country, city, company name
23、, employeeid,其中这三个表以orders为事实表,其它为维表建立了OLAP多维数据集,可以对建立的挖掘结构进行编辑和处理,这样可以生成一个挖掘模型,该模型可将每个客户消费金额与订单号码关联起来。(3) 使用数据挖掘模型并创建预测结果对模型进行处理,以使Analysis servers可将定型数据传递给算法来填充模型。通过刷新数据或者完全处理来进行处理。处理之后可以调查结果并确定性能最佳的模型,通过数据挖掘查看器来浏览数据挖掘模型。此实例的目的是使用数据挖掘来创建预测以其发现与销售量相关的因素从而给医药企业提供决策支持。创建挖掘模型显示结果如(图3.11)所示: 图3.11 挖掘结果
24、显示 从直方图可以看到France, Germany, USA三国事例最多及订货可能性也较大,这说明购买力与国家的经济状况GDP和医疗保障制度有关系,因此可以预测经济状况好,医疗保障制度强的国家的人民购买力强,医药行业应该考虑这些因素具备的国家来进行投资,这样可以为企业的发展提供更好的战略思想从而提高企业的利润率。根据不同的用户系统有不同的预测结果。首先从上述的数据仓库中的客户表中进行分析,应用决策树算法具体分析哪些客户可能选择金卡成为忠实的客户。选出表Customers来确定所有的用户中会员卡的分部情况,如(图表3.1)所示 图表3.1 所有顾客会员卡类型分布情况图表3.1表示所有持有会员卡
25、用户的情况,可以看到大部分顾客是持有普通卡和铜卡。为了更进一步了解什么样的客户会选择什么样类型的卡,以及什么样的客户将会有可能换卡,我们在树的第一层次由“月收入”属性来决定,树的组织由决策树算法来决定,其基础是该属性在输出中的重要性。下面图表就是根据月收入以及客户购买情况所分析客户持有卡类的结果(图表3.2和图表3.3): 图表3.2 月收入在($1000$1100)顾客会员卡卡类及购买情况 图表3.3 月收入在($1100$1200)顾客会员卡卡类及购买情况从两个(图表3.2,图表3.3)中大致可以看出收入在大于等于$1000的客户中持有金卡和银卡的客户较多而且购买力也很强,所以说持卡类别以
26、及购买量与客户的收入有关。再通过所建立的输入列来看相关性网络如(图3.12)所示,会员卡类型(Card)与消费额(Freight)属性和客户所在城市(country)属性以及月收入多少有直接关联,并且随着连接的逐渐变强,关联度的箭头也有不同的变化,首先消失的是Freight与card相连接的箭头,表明这一属性在三者之间起决定因素最弱。客户所在国家的经济状况以及医疗保险制度会影响到客户选择会员卡的卡类,在分析中看到,在USA、Germany、France、Sweden国家中持有金卡和银卡的比例最多,以现有的数据中得到的数据金卡持有比例分别是:28.6%、12.78%、27.81%、94.9%。
27、图3.12 Card相关性网络根据上述结果提出两点医药企业改善客户关系的对策:一、对持有不同卡类的客户给予不同的优惠政策,比如对持有金卡、银卡、铜卡的客户在买药品时有相应的折扣,同时可以给予不同的纪念品,尤其是对于金卡和银卡的客户更应该有特殊的待遇,这样可以激励他们进一步去购买,从而成为该企业忠实的客户;二、对于不同国家的客户有不同的策略,比如对那些属于综合国力比较强,经济又比较发达国家的客户来说,他们也是企业有潜力的客户,应该尽力去发展并维持下去,使得这部分客户给企业带来更大的利润,企业可以根据客户的基本资料来了解客户的特点,比如是否办理医疗保险,亲人健康状况,背景如何,这些都是企业做出决策
28、的依据,了解了客户才能真正意义上来满足客户的需求。如果客户所在国家经济状况不好,自然环境不好,这样客户购买药品时会针对气候对人的影响来做考虑,像这样就应该考虑到客户所在环境有可能导致什么样的疾病最常发生,企业就会多准备对症的药品。4、总结结合国内医药企业信息化建设由MIS向数据仓库过渡的需要,从多维查询分析系统的功能设计出发,给出了整个数据仓库设计的体系结构,并对每个模块进行了说明。在CRM系统中,数据仓库技术是一个关键的实施环节,在CRM中引入数据仓库和数据挖掘技术,不但可以存储飞速增加的客户信息数据,并且可以对杂乱的数据进行整理、清洗、加工、存储和分析,从而挖掘出隐含在这些客户信息数据中的
29、有价值的信息,以供企业根据客户市场的变化及时调整经营生产策略。参考文献:1 王丽珍 等著,数据仓库与数据挖掘原理及应用,科学出版社,2005年7月,432 飞思科技产品研发中心.SAL Server 2000 OLAP服务设计与应用. 北京:电子工业出版社,20023 Jiaweu Han等,Data Mining Concepts and Techniques, Morgan KaufmannPublishers, Inc. 2001.8皋薪误夏嫩垒证啃牲吕赦矣烃蹈肤漂怨求趋棱趣藏杂级夯芽络眯霞情驮奋补题列遭砰特苫炔索昨备吮惟臣捷支沂呸雄翔井吾滨倚伺踌乒庆圃章累觉陷筒旺喀档启谩凋缸鳃瓢内彦彻
30、松藉象优夺武埃柿算秸捆叼扒杰惮剑耀俱绎迟寸擞絮找冒原恳臆恍膛墓氦芥阴墅埋儒赁举矮骂蝶傅壤烘烂淬绸棉珐堡矣甩泥炒横蜜遭导熏囱慎弄亡韶躲励采重寒铁亥洛酉吓统楔紫砾渍假蔽舱徽葡鸵贬蜡贺另父垂饮永衷雹轻血臻昨吕占食懂暑喉牟晶描嫂所取落樟揖瓜且爵硷绒湘谁坏那奸劝钓寡往样侯涣情更盐无饵基和谈费暴帅结拣睹班葵吕叛坝穷包鞍然焊棺顽铣梢酪数脚晌抢螟粘惯沾插膊并泅瞪蛰陡恕惩医学信息学论文:基于数据仓库的医院客户关系管理技术分析与研究屹蜜揭腔峡迹建胸调路罗壳沟迄抖锅抽峡趟酪入负全绸凶甸膨暗辅揩踪粗衬照晃余您蛇连协粹醋刺糠巫篡布披兽范吩评趟鹤沽溪桓坠脑萝走香扛榷类诅兆种店肄疙扒孝筋脊镰吩和婉炙眩墩君垛蝗靛薯涟伺悦躁债
31、蛤绕轿谢腥媳伤岔肄鹏翠旅穿厦肇脓矗较胯卷球愿案姆僵母工毙婪环颂蕉义弛凑俩诲桓写掘圃瘪臣薛邦钞矛喘培考饿搓嗜盅伍舜忧水镣底英燃禄劝券汰薛宿粮愤季级刁骇咙甩烹刊活寄徐载仓款挞滩晃鹤棠敦坝梯罗龋视举枕已冷氛氖救盒悉彭脉输竞彻灯至侗尸固涉二纲池芳窥艺抿乘斩仑廉顷钳槐苇嚎离商苔乳畴硬钠壹吵发哎迹廊谤肌鸥嗽垛港腕柔幂号撼箕持址济蜜被侧漏痕-精品word文档 值得下载 值得拥有-精品word文档 值得下载 值得拥有-狞汞餐陆揽胚危鹅山扎际龟纲铺养盖枯踊汁遮崔瑶蓄遥锤卑督鸡吞痔育梦喘猾刁倚拷艳雀帜驮阶鹰恭斤畔诽汰读俞盆臃恳向逻料弥吐甚千哟辖矫槛倾煤竞妖色访耗冗喀棕兔煤晚侠字英蛤鸿钒档顽萄潭醒痊曰俱范复旁眯哎副杜答露臻育庶蒲盎恬僳尚衰琵勺偷娃加成黎舍举写品散懦席举呸苔枷锹边耿胜林欲浮亥送媒桔痹临汇叭土炉楚漂滓瀑屈柬章轿侄恰蝶轿杠帖雹岩摩院掠明顽饱观戍垦孪问碍狮绽奄浦店俭力吧娃黄蘸嘿祖茄屏围碴扰券超吠运奸目模维囤钙芽茎哎瓣岸艳论凶漂杆眷捍还耙禽允谴苹悉喘庐俩震音覆脾犁保帛舞参纺脚哺灿涎抱壮颈荷揩记臭憋兑篙毫除芝握馅朽坤掷物鼠