1、药物分析信息学及基药物分析信息学及基于大数据技术的药物于大数据技术的药物分析分析大数据时代:背景随着计算、存储资源的容量、速度、智能化程度的迅速提高和价格的大幅下降,以及物联网、移动互联网、云计算等技术的迅速发展和大规模应用,数据量出现了爆发式增长。特点数据容量(Volume)大、数据产生速度(Velocity)快和数据多样性(Variety)高制制药行行业数据的不断数据的不断积累和生命科学及健康累和生命科学及健康领域数据的蓬勃域数据的蓬勃发展!展!2药物分析信息学及基于大数据技术的药物分析大数据技术:定义一代全新的数据科学领域的技术架构或模式,对数据量大、类型复杂、需要即时处理和提纯的各类数
2、据,综合运用新的数据感知、采集、存储、处理、分析和可视化等技术,提取数据价值,从数据中获得对自然界和人类社会规律深刻全面的知识和洞察力。大数据技术涉及到数据的感知、采集、存储、处理(管理)、分析、可视化呈现等诸多环节,各环节采用的技术手段也层出不穷。3药物分析信息学及基于大数据技术的药物分析药物分析信息学研究对象:药物复杂体系方法:化学计量学和统计学,对分析仪器提供的 信息进行变换、解析、挖掘、分类目的:对复杂体系定性定量分析4药物分析信息学及基于大数据技术的药物分析化学计量学:chemometrics产生:1974年,由美国的BRKowalski和瑞典的SWold等发起,在美国华盛顿大学成立
3、了国际化学计量学学会 背景:数据处理与信息提取和计算机科学的发展概念:应用数学、统计学与计算机科学的方法,来设计或选择最优的化学实验方法,并从测量数据中最大限度地获取化学及相关信息。5药物分析信息学及基于大数据技术的药物分析化学计量学:chemometrics基本内容统计学统计学与统计方法与统计方法试验设计试验设计与优化与优化分析信号处理分析信号处理化学模式识别化学模式识别人工智能人工智能经典统计分析经典统计分析回归和相关回归和相关多元统计分析多元统计分析方差分析方差分析响应面理论响应面理论析因试验析因试验序贯优化方法序贯优化方法并行优化方法并行优化方法计算分光光度法计算分光光度法分析检测理论
4、分析检测理论滤波、平滑与求导滤波、平滑与求导因子分析法因子分析法聚类分析聚类分析线性学习机法线性学习机法K-最近邻法最近邻法定量构效关系定量构效关系人工神经网络人工神经网络化学专家系统化学专家系统数据库和谱图检索数据库和谱图检索6药物分析信息学及基于大数据技术的药物分析目录最新应用智能型分析仪器信息解析与挖掘7药物分析信息学及基于大数据技术的药物分析快速、简便、经济光谱分析法(一维数据)在每个在每个检测波波长(或波数或波数)处可得到一个响可得到一个响应值,这样的数据又称矢量型数据。的数据又称矢量型数据。8药物分析信息学及基于大数据技术的药物分析光谱分析法(一维数据)数学修数学修饰方法方法数学探
5、数学探针法法数学探针法通过对复杂混合物体系的光谱进行“原位”数学修饰,“创造”背景干扰的最大吸收点,从而可以“创造”背景干扰被消除的条件。具体原理为:在合适的波长位置,向待测混合体系的光谱中添加“数学探针”(如高斯函数等),可随意改变和调动可能的背景干扰,从而使干扰在指定位置成峰,产生极大值;然后通过求导消除干扰,并求出待测组分的含量。本课题组曾采用数学探针法测定了安钠咖注射液中苯甲酸钠和咖啡因的含量,通过考查数学探针的峰高、峰位和半峰宽与结果的关系,确定数学探针的参数值,并将由此探针产生的“新化合物”仿真添加在待测液中,从而使待测组分的紫外光谱图出现了“吸收峰”,即得到了“数学修饰”,然后在
6、修饰得到的“吸收峰”处求导就可将干扰组分的影响去除,从而可对待测组分进行含量测定。数学探针法通过“仿真”地向待测体系中添加“新化合物”(数学探针),以“创造”干扰被消除的条件,从而可以对复杂体系中感兴趣的组分直接定量。“数学探针法”及化学信息修饰思想的提出,为复杂体系的快速分析提供了一种全新途径。10药物分析信息学及基于大数据技术的药物分析兼具色谱良好的分离特性和光谱灵敏的定性功能,从色谱、光谱两个角度提供与物质性质密切相关的大量信息色谱分析法(二维数据)在每一个保留时间点上都对应着一条光谱,而在每个检测波长处都得到一条色谱,这样的数据又称“二维”数据或矩阵型数据。11药物分析信息学及基于大数
7、据技术的药物分析兼具色谱良好的分离特性和光谱灵敏的定性功能,从色谱、光谱两个角度提供与物质性质密切相关的大量信息色谱分析法(二维数据)在每一个保留时间点上都对应着一条光谱,而在每个检测波长处都得到一条色谱,这样的数据又称“二维”数据或矩阵型数据。12药物分析信息学及基于大数据技术的药物分析1.小波变换近红外光谱仪肺癌患者危重症病人慢性呼吸疾病慢性呼吸疾病导致生活不能自理的病人无人照料无人照料老人0101020202020303:主要针对中老年患者13药物分析信息学及基于大数据技术的药物分析1.小波变换近红外光谱仪肺癌患者危重症病人慢性呼吸疾病慢性呼吸疾病导致生活不能自理的病人无人照料无人照料老
8、人010102020303:主要针对中老年患者14药物分析信息学及基于大数据技术的药物分析1.小波变换近红外光谱仪肺癌患者危重症病人慢性呼吸疾病慢性呼吸疾病导致生活不能自理的病人无人照料无人照料老人0101010102020303:主要针对中老年患者15药物分析信息学及基于大数据技术的药物分析主要应用于复方制复方制剂、中药成分分析、中药成分分析、代谢组学、代谢组学、中药打假中药打假01010101在代谢组学中的应用代谢组学:代谢组学是对某一生物或细胞,在一特定生理时期内所有低所有低分子量代谢产物分子量代谢产物,同时进行定性和定量分析的一门新学科。它是以组群组群指标分析指标分析为基础,以高通量检
9、测高通量检测和数据处理数据处理为手段,以信息建模与系信息建模与系统整合统整合为目标的系统生物学系统生物学的一个分支。16药物分析信息学及基于大数据技术的药物分析01010101在代谢组学中的应用NMR、LC-MS、GC-MS获得的数据非常复杂数据处理原始数据前处理信息挖掘降维揭示出反映样品内在机理的、整体性差异的关键性生物标记物目的目的17药物分析信息学及基于大数据技术的药物分析01010101在代谢组学中的应用李晶:代谢组学研究中数据处理新方法的应用用稳健主成分分析(PCA)进行离群样品点的诊断三种数据预处理方法的应用,会明显改善代谢组学生物信息学分析中聚类分析的结果和生物标志物识别的准确性
10、及全面性用变量的类内差异和类间差异的比较,来判断非保守性代谢组分用尺度同一化的方法进行数据预处理来消除数据的尺度差异18药物分析信息学及基于大数据技术的药物分析01010101在代谢组学中的应用冒海蕾:正交信号校正在正常成人血清,H NMR谱的代谢组分析中的滤噪作用评价采用OSC滤噪后,PLSDA能够完全区分不同性别的血清氢谱,其判别能力优于PCA和SIMCA。研究了研究了正交信号校正正交信号校正(OSC)OSC)在在7878例正常成人血清例正常成人血清1 1 HNMRHNMR谱的的代代谢组分析中的分析中的滤噪作用,分噪作用,分别采用采用主成分分析、偏最小二主成分分析、偏最小二乘法判乘法判别分
11、析分析(PLS-DA)PLS-DA)及簇及簇类的的独立独立软模式法模式法(SIMCA)SIMCA)对氢谱进行模式行模式识别分析分析19药物分析信息学及基于大数据技术的药物分析01010101在代谢组学中的应用沈朋:乳腺癌代谢物组模式特征发现方法及HPLCMSMS分析留一法交叉验证和独立验证结果均表明,该模型预测准确率达到90以上。提出一种基提出一种基于于单独最独最优特征特征组合和合和BPBP神神经网网络的代的代谢物物组模式特征模式特征发现方法,并方法,并用其用其寻找到尿找到尿样中与乳腺癌最中与乳腺癌最为相关的相关的4 4种核苷,将种核苷,将这4 4种核种核苷作苷作为输入入变量,用量,用BPBP
12、神神经网网络建立了乳腺癌建立了乳腺癌诊断模型。断模型。20药物分析信息学及基于大数据技术的药物分析在中药掺伪鉴别中的应用基于待检中药与怀疑掺化学药物的一维红外光谱,不经提取分离,无需建立模型的两种分析方法02020202局部直线筛选法基于对原始光谱特征的认知,即原始光谱上任意连续3点组成的形状可能为凸曲线、近直线和凹曲线,它们的直线回归系数的绝对值分别为o99或0991。化学药物的掺入显然会改变这些局部谱段原有的形状。沿着这个思路,对局部直线谱段进行差减,从而预测其中化学药物的掺杂量。由大量样品验证,该法的检测限可达到01。采用该法对15个不同种类的中药样品进行了分析,结果只漏判了一个样品。2
13、1药物分析信息学及基于大数据技术的药物分析在中药掺伪鉴别中的应用02020202褶合差谱分析法基于对原始光谱的褶合变换,提取3点窗口下的二次正交多项式系数作为解析对象。通过对纯中药光谱以及化学药物光谱的考察,发现两者在3点窗口下经褶合变换得到的二次项系数,存在至少一个甚至几个数量级的差别,因此当掺伪中药光谱的二次项系数抽提至最小时,对应的含量因子即代表真实掺杂量。采用褶合差谱分析法对18个不同种类的中药样品进行了测定,获得了理想的定量准确性。22药物分析信息学及基于大数据技术的药物分析总结药物分析信息学已成为现代药物分析学科的重要内容,有助于解决生命科学等学科目前面临的复杂混合物体系定性、定量分析的共同任务。开展药物分析信息学研究必将有力地促进药物分析学科的发展。23药物分析信息学及基于大数据技术的药物分析感谢各位老师感谢各位老师同学批评指正同学批评指正THANKS24药物分析信息学及基于大数据技术的药物分析