ImageVerifierCode 换一换
格式:DOC , 页数:21 ,大小:669.50KB ,
资源ID:5718076      下载积分:10 金币
快捷注册下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

开通VIP
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.zixin.com.cn/docdown/5718076.html】到电脑端继续下载(重复下载【60天内】不扣币)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  

开通VIP折扣优惠下载文档

            查看会员权益                  [ 下载后找不到文档?]

填表反馈(24小时):  下载求助     关注领币    退款申请

开具发票请登录PC端进行申请

   平台协调中心        【在线客服】        免费申请共赢上传

权利声明

1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前可先查看【教您几个在下载文档中可以更好的避免被坑】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时联系平台进行协调解决,联系【微信客服】、【QQ客服】,若有其他问题请点击或扫码反馈【服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【版权申诉】”,意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:0574-28810668;投诉电话:18658249818。

注意事项

本文(乳腺癌数据的处理.doc)为本站上传会员【pc****0】主动上传,咨信网仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知咨信网(发送邮件至1219186828@qq.com、拔打电话4009-655-100或【 微信客服】、【 QQ客服】),核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载【60天内】不扣币。 服务填表

乳腺癌数据的处理.doc

1、科技学院第十一组:刘晶晶 向雄峰 余 涛 乳腺癌的判别数学模型 摘要 本文解决的问题是利用9项指标,综合来判别乳腺肿瘤是良性还是恶性。我们通过初步数据分析,得出各个指标与肿瘤良恶性存在一定的线性关系,于是我们建立了多元线性回归模型。 对于问题一,我们先将附录表一中1-60组数据运用MATLAB中回归分析命令regress作初步的回归分析。根据所得的残差及其置信区间图,我们将其中6组离群点予以剔除。然后将余下的54组数据运用Excel作回归分析,由回归统计表中可以得出回归方程中常量和各个系数,由此可以得到判别乳腺癌是良性还是恶性的多元线性回归方程: 同时依据得到的回归统计、方差分

2、析、残差分析等数据作出检验,检验,来衡量线性回归的拟合度,以及线性方程中各参数的显著性,发现其回归程度较好,均一致认为所建立的多元线性回归模型的回归效果显著,于是我们认可所得的多元线性回归方程可以依据9项指标来判别乳腺肿瘤是良性还是恶性。最后我们再将表一中61-78组数据回代入上述多元线性回归方程,经由计算分析得出所得的回归方程判别乳腺肿瘤是良性还是恶性的正确率高达100%,预测能力显著,明显可以看出所得到回归方程判别乳腺肿瘤是良性还是恶性方法是合理正确的。至此我们得到了依据9项指标综合判别乳腺肿瘤是良性还是恶性的方法:将待判别病例的9项指标的数据代入回归方程,计算出的估计值,并对其值作四舍五

3、入取整,,肿瘤是良性; ,肿瘤是恶性。 对于问题二,将附录表二中20组需要判别的病例的数据代入模型一中所得回归方程中计算出的估计值,依据问题一的判别方法判别得出20个病例中第1,4,5,7,10,11,15,19组共8个病例是恶性肿瘤,余下12个病例是良性肿瘤。 对于问题三,回归参数表中回归系数的统计量的线性系数显著性值,表征了该系数的显著性水平,也表征了该项因素对于因变量判定的影响程度,我们通过对模型一进行逐步回归分析,剔除模型中那些对因变量作用不显著的自变量,得到最优化的线性回归模型,那些保留下来的自变量,即是区分乳腺肿瘤是“良性”还是“恶性”的主要指标。作逐步回归分析后,最终所得结果

4、为:乳腺肿瘤肿块的厚度、细胞大小的均匀性、细胞形状的均匀性、裸核、正常的核仁、有丝分裂是区分乳腺肿瘤是“良性”还是“恶性”的主要指标,得到最优化的回归模型为: 关键词:多元线性回归模型 逐步回归 显著性水平检验 21 1. 问题重述 全世界每年约有120万妇女患乳腺癌,50万人死于乳腺癌,乳腺癌已经成为全球女性发病率最高的恶性肿瘤。 下面是某医院乳腺肿瘤患者的一组数据见附录一表一,其中前面9个指标分别表示乳腺肿瘤肿块的厚度、细胞大小的均匀性、细胞形状的均匀性、边缘的粘连、单层上皮细胞的大小、裸核、温和的染色质、正常的核仁、有丝分裂,尾数0表示确诊为“良性”,1表示

5、确诊为“恶性”,数据已经归一化为0到10之间的自然数。 问题一、根据以上数据,请提出一种或多种判别乳腺肿瘤属于“良性” 还是 “恶性”的方法,并检验你提出的方法的正确性。 问题二、现有一组乳腺肿瘤患者的九个指标数据见附录一表二,请你按照你在问题一中提出的方法分别判别属于“良性”还是“恶性”。 问题三、试确定哪些指标是区分乳腺肿瘤是“良性”还是“恶性”的主要指标,请采用主要指标建立区分“良性”和“恶性” 乳腺肿瘤的模型,以便用于乳腺肿瘤的辅助诊断时可以减少化验的指标。 2. 模型的假设与符号说明 2.1模型的假设 假设1:题目所给数据是合理、正确的。 假设2:假设表中给出化验数据科

6、学可信。确诊病例确诊情况(患病、健康)准确无误。 假设3:假设各位被测患者无其他疾病,不会干扰被测数值。 假设4:假设医生不会仅仅依靠化验结果对患病情况作出最终判断,化验仅仅作为医生诊断的一种辅助手段,所以化验结果单方面的现实结果可以跟实际有一定程度的偏差。 假设5:题目中给出的原始数据有两组无效,将其舍去认为对解题无影响。 2.2符号说明 乳腺肿瘤肿块的厚度指标; 细胞大小的均匀性指标; 细胞形状的均匀性指标; 边缘的粘连指标; 单层上皮细胞的大小指标; 裸核指标; 温和的染色质指标; 正常的核仁指标; 有丝分裂指标;

7、诊断结果; 诊断结果估计值; 回归常数; 回归系数; 回归常数估计值; 回归系数估计值; 随机误差项; 显著性水平; 总变差平方和; 残差平方和; 回归平方和; 被分析数据的组数; 第个指标作显著性水平检验; 偏回归平方和; 3. 问题分析 此题研究的是医学上常用几个指标来综合判别乳腺肿瘤是良性还是恶性的数学模型。 针对问题一,题目要求我们提出判别方法,依据9项指标的数据,判别肿瘤病例是良性还是恶性。我们根据所提供的已确诊的病例中分析得知,肿瘤病例是良性还是恶性与各项指标呈相应的线性关系,我们初步提出否能通过病

8、例样本中肿瘤病例是良性或恶性与各项指标来建立回归模型,再验证模型正确性后由模型来判别病例。因此,我们先选取其中一部分数据进行研究,待建立模型后,将剩余的数据代入模型检验。 针对问题二,题目要求我们利用问题一中提出的方法,对表二中的20个待判别的病例进行判别。我们分别将各元素的含量输入到在问题一建立的模型中,求出对应的值,然后和0、1进行比较,判别出哪些患者的肿瘤是良性,哪些患者的肿瘤是恶性。 针对问题三,题目要求我们根据已知数据确定哪些指标是区分乳腺肿瘤是“良性”还是“恶性”的主要指标,并采用主要指标建立区分“良性”和“恶性” 乳腺肿瘤的模型,以便用于乳腺肿瘤的辅助诊断时可以减少化验的指标

9、我们通过对模型一进行逐步回归分析,剔除模型中那些对因变量作用不显著的自变量,得到最优化模型,那些保留下来的自变量,即是区分乳腺肿瘤是“良性”还是“恶性”的主要指标。 4. 数据分析 在初步的数据分析下,肿瘤的良恶性与各指标间的关系还无法得到确定,这无疑给以后数学模型的建立和求解带来了不便。对于题目给出的化验结果,在一般情况下,都希望能对它们进行数据的规范化处理。 以下9张图是肿瘤良性患者和肿瘤恶性患者各个指标的坐标图,以及存有相关数据的表格,通过这些图我们可以发现,各个指标对应数与乳腺肿瘤是良性还是恶性诊断具有一定的线性对应关系,我们设想,可以用构建线性回归模型的方法来解决此问题。因此

10、我们选择多元统计分析中利用 excel中的回归工具建立回归模型,计算出该线性方程的常量和系数,从而完成模型的初步建立。 同时,我们也看到,在图中的一些点的规律性并不明显,因此我们猜测,可以在构建的方程中忽略一些因素的影响,这就为我们提出简化模型提供了思路。回归参数表中回归系数的统计量的值,表征了该系数的显著性水平,也表征了该项因素对于因变量判定的影响程度,以此为衡量的标准来筛选9项相关指标,保留其中的主因项,去除非主因素的干扰,重新构建模型,以达到简化模型和提高精度的目的。 5. 问题一的解答 针对问题一我们建立了模型一。 5.1模型一的建立 考虑多元

11、一次线性回归模型,我们从总体中选取1-60号病例作为研究样本,以各项指标为自变量;肿瘤的良恶性为因变量。设多元线性回归模型的一般形式为: (1) 其中:因变量,为9个对有显著影响的自变量,是10个待估参数,是随机误差项。 5.2模型一的求解 对于组实际观察数据,由(1)式得: (2) 根据(2)式多元线性回归模型可表示为: (3) 令 模型的相应矩阵方程表示为: (4) 由(4)式解得: (5) 且 (6) 其中:当时,表示肿瘤为良性;当时,表示肿瘤为恶性。 我们将样

12、本数据代入(5)式,利用MATLAB(求解源程序见附录)软件,用matlab对数据进行初步运算,从残差及其置信区间图找出应6组离群点予以剔除,再用Excel中‘回归’命令对剩下的54组数据组进行分析,得到回归统计表,从而得出较为精确的结论,建立起模型。 残差及其置信区间图 回归统计 Multiple R 0.952533 R Square 0.90732 Adjusted R Square 0.888363 标准误差 0.168514 观测值 54 方差分析 df SS MS F Significance F 回归分析

13、 9 12.23202 1.359113 47.86135 8.17E-20 残差 44 1.249463 0.028397 总计 53 13.48148 Coefficients 标准误差 t Stat P-value Lower 95% Upper 95% 下限 95.0% 上限 95.0% Intercept -0.32858 0.057305 -5.73377 8.3E-07 -0.44407 -0.21308 -0.44407 -0.21308 X Variable 1 0.060725 0.0

14、11789 5.151136 5.84E-06 0.036966 0.084483 0.036966 0.084483 X Variable 2 -0.08212 0.027772 -2.95689 0.004982 -0.13809 -0.02615 -0.13809 -0.02615 X Variable 3 0.10584 0.028061 3.771817 0.00048 0.049287 0.162392 0.049287 0.162392 X Variable 4 0.015509 0.012992 1.193681 0.2

15、38999 -0.01068 0.041693 -0.01068 0.041693 X Variable 5 0.010307 0.017921 0.575154 0.568117 -0.02581 0.046424 -0.02581 0.046424 X Variable 6 0.042092 0.009007 4.673476 2.81E-05 0.02394 0.060244 0.02394 0.060244 X Variable 7 0.001685 0.019818 0.085004 0.932644 -0.03826 0.0

16、41626 -0.03826 0.041626 X Variable 8 0.031964 0.011292 2.830663 0.006976 0.009206 0.054721 0.009206 0.054721 X Variable 9 0.034681 0.020673 1.677629 0.10051 -0.00698 0.076345 -0.00698 0.076345 求得各参数的线性回归系数分别为: 则多元线性回归方程为: (7) 5.3模型一的检验 5.3.1对回归方程进行显著性的检验 R检验法

17、 (8) 则 (9) R接近于1,说明线性回归拟合效果显著; 检验法 提出假设: 线性关系不显著 线性关系显著 计算检验统计量: , (11) 代入数据得: 查分布表表知 因为非常接近1,同时远大于,故拒绝,认为在显著性水平下,与之间存在显著的线性相关关系。 5.3.2模型的准确性检验 将表一验证样本的值代入(7)式判别出18个样本的病例情况: 病历号 61 62 63 64 65 66 67

18、68 69 结果 恶性 良性 恶性 良性 恶性 恶性 良性 良性 恶性 病历号 70 71 72 73 74 75 76 77 78 结果 良性 恶性 恶性 良性 良性 良性 良性 良性 良性 根据题目中所给的已知信息,可以看出,我们运用所求的判别函数所检验的结果与实际情况几乎不存在的误差,也就是说运用一次线性模型判定的结果可信度很高。 6. 问题二的解答 运用问题一中所求得的的最优判别函数,我们对附录一中表二中20组病例各项指标对应数据代入模型一中进行判别(用MATLAB求解源程序见附录二),我们将结果整理可制成以下表:

19、表:对20组病例各项指标对应数据的判定结果 病例号 1 2 3 4 5 6 7 8 9 10 结果 恶性 良性 良性 恶性 恶性 良性 恶性 良性 良性 恶性 病历号 11 12 13 14 15 16 17 18 19 20 结果 恶性 良性 良性 良性 恶性 良性 良性 良性 恶性 良性 从上表结果中我们可以得知,运用模型一中的判别方法可以判定附录一中表二中20组病例中第1,4,5,7,10,11,15,19组共8个病例是恶性肿瘤,余下12个病例是良性肿瘤。 7. 问题三的解答 我们应用剔除法

20、对模型中的不显著元素逐个进行剔除,最终保留下来的元素就是区分乳腺肿瘤是“良性”还是“恶性”的主要指标。 我们知道回归平方和描述了全体自变量对的总影响。为了研究某个的作用,先把从个自变量中扣除下来,只考虑个自变量的影响,作这个自变量的回归平方和,记作,并记 其中,为在中的偏回归平方和,用它来衡量在对的线性回归中的作用大小。 由于的自由度为1,且,选统计量 算出的值,对给出的显著水平,查出。 代入数据得,其中最小为对置信水平,查表得:。 所以考虑去掉。 同理,将保留下来的项,再代入数据,求得,其中最小为对置信水平,查表得:。 所以我们考

21、虑去掉。 同理,将保留下来的项,再代入数据,求得,其中最小为对置信水平,查表得:。 所以我们考虑去掉。 由于保留下来的,对有显著的线性回归作用,因此,它们所对应的指标即为区分乳腺肿瘤是“良性”还是“恶性”的主要指标,它们分别是乳腺肿瘤肿块的厚度、细胞大小的均匀性、细胞形状的均匀性、裸核、正常的核仁、有丝分裂。 我们将对应的样本数据代入上式,利用Excel软件,求得各参数项的线性回归系数分别为: 最终优化后的模型为: 8. 模型的评价、改进及推广 8.1模型评价 优点:我们选取部分样本进行研究,通过回归分析建立数学判别模型,并不断进行优化,最终得到拟

22、合优度较高的模型,在判别病例的化验结果来确定就诊人员乳腺肿瘤的良恶性,其准确率达到100%,即该模型的误判率为0。可见,该模型的可操作性很强,效率很高。 缺点:由于所给数据太少以致在统计数据时不是很准确,又由于计算机模拟带有一定的随机性,以致得到模型的指标不是很让人满意。 8.2模型改进 对于第一问和第三问可以运用MATLAB软件中的回归分析命令和逐步回归命令进行解答更为方便简单。 8.3模型推广 该模型还可以推广到通过对若干指标的分析判别来与之相关的个体这类实际问题中去,因此我们可以把这个模型应用病虫害的预报,疾病的预测预报,以及红细胞检测,辅助诊断等领域。 参考文献

23、[1]姜启源,谢金星,叶俊,数学模型(第三版) 北京:高等教育出版社,2003.8 [2]盛骤,谢世千,潘承毅,概率论与数理统计(第三版)北京:高等教育出版社,2001.12 [3]赵静 但琦,数学建模与实验,北京:高等教育出版社,2003.6 [4]白厚义,回归设计与多元统计分析,广西:广西科学技术出版社,2003.1 [5]宋来忠,王志明,数学建模与实验,北京:科学出版社,2005 [6]赵颖,应用数理统计,北京:北京理工大学,2008.5 附录 附录一 表一:80组已确诊乳腺肿瘤患者的数据 肿瘤肿块的厚度 细胞大小的均匀性 细胞形状的均匀性 边缘的粘连 单层上皮

24、细胞大小 裸核 温和的染色质 正常的核仁 有丝分裂 良/恶性 5 1 1 1 2 1 3 1 1 0 5 4 4 5 7 10 3 2 1 0 3 1 1 1 2 2 3 1 1 0 6 8 8 1 3 4 3 7 1 0 4 1 1 3 2 1 3 1 1 0 8 10 10 8 7 10 9 7 1 1 1 1 1 1 2 10 3 1 1 0 2 1 2 1 2 1 3 1 1 0 2 1 1 1 2 1

25、1 1 5 0 4 2 1 1 2 1 2 1 1 0 1 1 1 1 1 1 3 1 1 0 2 1 1 1 2 1 2 1 1 0 5 3 3 3 2 3 4 4 1 1 1 1 1 1 2 3 3 1 1 0 8 7 5 10 7 9 5 5 4 1 7 4 6 4 6 1 4 3 1 1 4 1 1 1 2 1 2 1 1 0 4 1 1 1 2 1 3 1 1 0 10 7 7 6 4 1

26、0 4 1 2 1 6 1 1 1 2 1 3 1 1 0 7 3 2 10 5 10 5 4 4 1 10 5 5 3 6 7 7 10 1 1 5 1 1 1 2 1 3 1 1 0 3 1 1 1 2 1 2 1 1 0 8 4 5 1 2 ? 7 3 1 1 1 1 1 1 2 1 3 1 1 0 5 2 3 4 2 7 3 6 1 1 3 2 1 1 1 1 2 1 1 0 5 1 1 1

27、 2 1 2 1 1 0 2 1 1 1 2 1 2 1 1 0 1 1 3 1 2 1 1 1 1 0 3 1 1 1 1 1 2 1 1 0 10 7 7 3 8 5 7 4 3 1 2 1 1 2 2 1 3 1 1 0 3 1 2 1 2 1 2 1 1 0 2 1 1 1 2 1 2 1 1 0 10 10 10 8 6 1 8 9 1 1 6 2 1 1 1 1 7 1 1 0 5 4 4

28、 9 2 10 5 6 1 1 2 5 3 3 6 7 7 5 1 1 6 6 6 9 6 ? 7 8 1 0 10 4 3 1 3 3 6 5 2 1 6 10 10 2 8 10 7 3 3 1 5 6 5 6 10 1 3 1 1 1 10 10 10 4 8 1 8 10 1 1 1 1 1 1 2 1 2 1 2 0 3 7 7 4 4 9 4 8 1 1 1 1 1 1 2 1 2 1 1

29、0 4 1 1 3 2 1 3 1 1 0 7 8 7 2 4 8 3 8 2 1 9 5 8 1 2 3 2 1 5 1 5 3 3 4 2 4 3 4 1 1 10 3 6 2 3 5 4 10 2 1 5 5 5 8 10 8 7 3 7 1 10 5 5 6 8 8 7 1 1 1 10 6 6 3 4 5 3 6 1 1 8 10 10 1 3 6 3 9 1 1 8 2 4 1 5 1 5

30、 4 4 1 5 2 3 1 6 10 5 1 1 1 9 5 5 2 2 2 5 1 1 1 5 3 5 5 3 3 4 10 1 1 1 1 1 1 2 2 2 1 1 0 9 10 10 1 10 8 3 3 1 1 6 3 4 1 5 2 3 9 1 1 1 1 1 1 2 1 2 1 1 0 10 4 2 1 3 2 4 3 10 1 4 1 1 1 2 1 3 1 1 0 5 3 4 1 8

31、 10 4 9 1 1 8 3 8 3 4 9 8 9 8 1 1 1 1 1 2 1 3 2 1 0 5 1 3 1 2 1 2 1 1 0 6 10 2 8 10 2 7 8 10 1 1 3 3 2 2 1 7 2 1 0 9 4 5 10 6 10 4 8 1 1 10 6 4 1 3 4 3 2 3 1 1 1 2 1 2 2 4 2 1 0 1 1 4 1 2 1 2 1 1 0 5 3

32、1 2 2 1 2 1 1 0 3 1 1 1 2 3 3 1 1 0 2 1 1 1 3 1 2 1 1 0 2 2 2 1 1 1 7 1 1 0 表二:20组乳腺肿瘤患者九个指标的数据 10 4 7 2 2 8 6 1 1 5 1 1 1 2 1 3 1 2 5 2 2 2 2 1 2 2 1 5 4 6 6 4 10 4 3 1 8 6 7 3 3 10 3 4 2 1 1 1 1 2

33、1 1 1 1 6 5 5 8 4 10 3 4 1 1 1 1 1 2 1 3 1 1 1 1 1 1 1 1 2 1 1 8 5 5 5 2 10 4 3 1 10 3 3 1 2 10 7 6 1 1 1 1 1 2 1 3 1 1 2 1 1 1 2 1 1 1 1 1 1 1 1 2 1 1 1 1 7 6 4 8 10 10 9 5 3 1 1 1 1 2 1 1

34、 1 1 1 1 1 1 1 1 1 3 1 3 4 4 10 5 1 3 3 1 4 2 3 5 3 8 7 6 1 5 1 1 3 2 1 1 1 1 附录二 第一问源程序: 求各个回归参数值我们首先应用matlab软件进行多元线性函数的回归分析,根据其中rcoplot(r,rint)的命令找出60组数据中异常点并剔除掉。再用excel中‘回归’命令对剩下的数据组进行分析,从而的出较为精确的结论,初步建立起模型。最后对18组未参加建立模型的原始数据进行回代检验,由此而判断起正确性,以下

35、是我们的具体操作: 1。用matlab对数据进行初步运算,找出应剔除的应剔除异常组数 y=[0 0 0 0 0 1 0 0 0 0 0 0 1 0 1 1 0 0 1 0 1 1 0 0 1 0 0 0 0 0 1 0 0 0 1 0 1 1 1 1 1 1 0 1 0 0 1 1 1 1 1 1 1 1 1 1 1 1 0 1]; x1=[5 5 3 6 4 8 1 2 2 4 1 2 5 1 8 7 4 4 10 6 7 10 3 1 5 3 5 2 1 3 10 2 3 2 10 6 5 2 10 6 5 10 1 3 1 4 7 9 5 10 5 10 10 8 8 5 9 5

36、 1 9]; x2=[1 4 1 8 1 10 1 1 1 2 1 1 3 1 7 4 1 1 7 1 3 5 1 1 2 2 1 1 1 1 7 1 1 1 10 2 4 5 4 10 6 10 1 7 1 1 8 5 3 3 5 5 6 10 2 2 5 3 1 10]; x3=[1 4 1 8 1 10 1 2 1 1 1 1 3 1 5 6 1 1 7 1 2 5 1 1 3 1 1 1 3 1 7 1 2 1 10 1 4 3 3 10 5 10 1 7 1 1 7 8 3 6 5 5 6 10 4 3 5 5 1 10]; x4=[1 5 1 1 3 8 1 1 1 1 1

37、1 3 1 10 4 1 1 6 1 10 3 1 1 4 1 1 1 1 1 3 2 1 1 8 1 9 3 1 2 6 4 1 4 1 3 2 1 4 2 8 6 3 1 1 1 2 5 1 1]; x5=[2 7 2 3 2 7 2 2 2 2 1 2 2 2 7 6 2 2 4 2 5 6 2 2 2 1 2 2 2 1 8 2 2 2 6 1 2 6 3 8 10 8 2 4 2 2 4 2 2 3 10 8 4 3 5 6 2 3 2 10]; x6=[1 10 2 4 1 10 10 1 1 1 1 1 3 3 9 1 1 1 10 1 10 7 1 1 7 1 1 1 1

38、 1 5 1 1 1 1 1 10 7 3 10 1 1 1 9 1 1 8 3 4 5 8 8 5 6 1 10 2 3 2 8]; x7=[3 3 3 3 3 9 3 3 1 2 3 2 4 3 5 4 2 3 4 3 5 7 2 3 3 2 2 2 1 2 7 3 2 2 8 7 5 7 6 7 3 8 2 4 2 3 3 2 3 4 7 7 3 3 5 5 5 4 2 3]; x8=[1 2 1 7 1 7 1 1 1 1 1 1 4 1 5 3 1 1 1 1 4 10 1 1 6 1 1 1 1 1 4 1 1 1 9 1 6 5 5 3 1 10 1 8 1 1 8 1 4

39、10 3 1 6 9 4 1 1 10 1 3]; x9=[1 1 1 1 1 1 1 1 5 1 1 1 1 1 4 1 1 1 2 1 4 1 1 1 1 1 1 1 1 1 3 1 1 1 1 1 1 1 2 3 1 1 2 1 1 1 2 5 1 2 7 1 1 1 4 1 1 1 1 1]; n=60; m=9; X=[ones(n,1),x1',x2',x3',x4',x5',x6',x7',x8',x9']; [b,bint,r,rint,s]=regress(y',X); b,bint,s, rcoplot(r,rint) 第二问源程序: 对

40、第二问中20组数据进行检验而编写的验证程序 x=[1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1; 10 5 5 5 8 1 6 1 1 8 10 1 2 1 7 1 1 3 4 5; 4 1 2 4 6 1 5 1 1 5 3 1 1 1 6 1 1 4 2 1; 7 1 2 6 7 1

41、 5 1 1 5 3 1 1 1 4 1 1 4 3 1; 2 1 2 6 3 1 8 1 1 5 1 1 1 1 8 1 1 10 5 3; 2 2 2 4 3 2 4 2 1 2 2 2 2 2 10 2 1 5 3 2; 8 1 1 10 10 1 10 1 1 10 10 1 1 1 10 1 1 1

42、 8 1; 6 3 2 4 3 1 3 3 2 4 7 3 1 1 9 1 1 3 7 1; 1 1 2 3 4 1 4 1 1 3 6 1 1 1 5 1 3 3 6 1; 1 2 1 1 2 1 1 1 1 1 1 1 1 1 3 1 1 1 1 1;] b=[-0.32858 0.060725 -0.08212 0.1058

43、4 0.01551 0.01031 0.04209 0.00168 0.03196 0.03468]; for i=1:20 y=b*x(:,i); fprintf('i=%d y=%.4f\n',i,round(y)); end 第三问源程序: 在第三问中我们是根据单个指标变量对回归方程的显著性而剔出次要指标因素,从而本程序是根据多元线性回归而编写的: clear;clc; y1=[0 0 0 1 0 0 0 0 0; 0 0 1 1 0 0 1 0 1; 1 0

44、 0 1 0 0 0 0 0; 1 0 0 0 1 0 1 1 1; 1 0 1 0 0 1 1 1 1; 1 1 1 1 1 1 1 0 1]; S1=0;ev=0.48148; for i=1:6 for j=1:9 m=(y1(i,j)-ev)^2; S1=S1+m; end end fprintf('SST=%.4d\n',S1); y2=[0.148681983 0

45、069324661 0.118974492 1.285159521 0.284611376 0.072347794 0.101864472 0.004154119 -0.104523738; -0.035176632 -0.01003266 1.024620112 0.706340335 0.086272695 0.087957319 1.107983827 0.209406646 0.96436467; 1.166398093 0.025548031 -0.094216671 0.737138534 -0.066877611 0.146997358 -0.03517

46、6632 0.114093683 0.015240964; 1.027852254 -0.017983421 0.131387833 -0.035176632 1.079716202 0.123719502 0.885929381 0.679709746 1.019105172; 1.070259537 -0.061219863 0.798865398 -0.095901296 0.118974492 0.919533106 1.025210061 1.335488806 1.007981748; 0.987958073 0.95072849 1.02082

47、2474 0.800482188 0.701668574 0.547435382 0.853686004 -0.05380929 1.046099336]; S2=0;eve=0.48148; for i=1:6 for j=1:9 n=(y2(i,j)-ev)^2; S2=S2+n; end end fprintf('SSR=%.4f\n',S2); fprintf('SSE=%.4f\n',S1-S2); S=[11.4785 11.9837 11.8280; 12.1916 12.2226

48、11.6118; 12.2318 12.0045 12.1521]; F0=4.0617; for i=1:3 for j=1:3 u=S2-S(i,j); F=44*u/1.2495; if F

49、 end end fprintf('7Ϊ×îСһÏîËù¶ÔÓ¦µÄ±äÁ¿Ö¸±ê±»ÌÞ³ý\n'); s1=12.23181332; S3=[11.47852968 11.98373906 11.82802738; 12.19155653 12.22262476 11.61179146; 11 12.00448406 12.15209715]; for i=1:3 for j=1:3 u=s1-S3(i,j);

50、 F=44*u/1.2495; if F

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        抽奖活动

©2010-2026 宁波自信网络信息技术有限公司  版权所有

客服电话:0574-28810668  投诉电话:18658249818

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :微信公众号    抖音    微博    LOFTER 

客服