多元统计分析方法在中药质量评价中的应用(1) |
| http://www.lunwenda.com 论文下载网 2008-04-16 于鹤丹 浏览: 次 【打印论文】【收藏论文】 |
【关键词】 多元
摘要:介绍了各种多元统计分析方法的基本原理及其在中药质量评价中的应用进展。
关键词:中药;质量评价;多元统计分析
我国中药材资源丰富,种类繁多,来源复杂,品种混乱,同物异名,同名异物现象多见。商品市场上除正品外,尚有代用品、伪品和混淆品,来源不同的药材,质量差异很大,势必影响临床的疗效,所以对中药质量的评价尤为重要。过去基本上是以传统的性状鉴定和显微鉴定确定真伪,以理化鉴定评价优劣。近年来发展起来一种新的技术――模式识别,它是根据物质所含的化学成分,利用TLC、UV、IR、HPLC、GC、MS等方法获得其化学数据,然后利用数学思想和方法对该类数据进行特征提取,对药材进行分析、决策和判断。此种方法迅速发展,逐渐取代了传统的中药材鉴定法。模式识别所用的方法较多,但最常用的为统计学方法,它是以数学上决策理论为基础,建立统计学识别模型,找出规律性认识。
1 多元统计分析方法在中药质量评价中的应用
11 聚类分析(Clustering analysis,简称CA)在中药质量评价中的应用
聚类分析法是数值分类学的新的分支,它是对一组尚无明确分类的样本,根据它们所表现的变量特征,按相似程度的大小加以归类,其目标是在模式空间中找到客观存在的类别。按聚类目的不同,可将聚类分析法分为R型聚类法和Q型聚类法。
其原理为:对任一含m个指标的样本,可定义为m维空间的点,在m维空间中的任意两点其相似性可用“距离”度量,定义为“dij”,若将任一样本看作一类,其类间相似性可用欧氏距离DE表示: DE=dij=[∑m i=1(xil-xjl)2]1/2,式中:l=1,2,… m,表示样本的指标数;i,j表示样本序号;xil,xjl表示样本各指标。系统聚类法即对n个样本计算出两两间的距离dij,并从中找出距离最小的两类Gp与Gq,合并成一个新类Gr,重新计算新类与其他各类间的距离,再将距离最小的两类合并,重复以上过程至所有样本聚为一类为止。定义类Gk与Gr的距离Drk有以下递推公式:D2rk =αpD2pk αqD2qk βD2pq γ|D2pk-D2qk|,式中参数αp,αq,β,γ取值不同对应不同的系统聚类方法。
该法除常用于中药系列品种的分类外,还可以广泛的引用于真伪鉴别、成分浅析、质量评价、新旧工艺或不同炮制方法比较、寻找代用品及扩大药用新资源等方面[1~7],使中药研究跨进现代电脑量化分析的新阶段。
马英丽等[8]用甲醇回流提取黄芪中的皂苷类成分,以氯仿甲醇水(65:30:10)为展开剂,采用双波长薄层扫描法,在λs=390nm,λr=590nm下,对18个产地的黄芪样品进行了定量分析,以黄芪甲苷为指标成分,选用中位数法进行聚类,用余弦法计算样品间的相似性程度。结果系统聚类分析将样品分为3类,大多数产地的黄芪被聚为1类或2类,即质量较好或一般。表明,蒙古黄芪和膜荚黄芪被列为优质品,该结果与《中华人民共和国药典》2000年版将蒙古黄芪和膜荚黄芪列入正品相一致。王继国等[9]建立了10种中药血竭样品的HPLC指纹图谱,并把HPLC指纹图谱信息进行数据化及数据标准化处理,用重叠率与相关系数两个参数,从两个方面定量的对这10种样品的HPLC指纹图谱进行了相似性评价;在此基础上用系统聚类分析法定性的对这10种样品进行了分类和鉴别,从而建立了一种相对完善的中药血竭的化学模式识别技术,为中药血竭的质量评价和分类鉴别提供了一个很好的方法和思路。田兰等[10]采用HPLC对32个白术样品进行测定,将样品分析中所获得的32个样品的45个特征,采用系统聚类分析和逐步判别分析,进行白术的化学模式识别的研究。将32个样品分为优等品、一般品和伪品3个等级,优质品集中于浙江、湖南、四川一带,而北方的白术质量一般。这样就建立了评价白术真伪优劣的新方法。徐永群等[11]以赤芍的红外指纹图谱为依据,采用主成分分析法对来自18个产地的赤芍进行了聚类分析。可将18个产地大致分为6类,这一分类与地理位置有较明显的对应关系,同一区域内赤芍的性能较为相似,可作为传统中医界对赤芍药材质量评价的依据。刘谦光等[12] 运用模糊动态聚类分析法对来源于美国、加拿大及我国的共14种不同产地的西洋参样品质量进行了模糊识别研究。结果与权威部门认定的具有法定地位的西洋参产地进行验证、核对,取得了较为一致的结果。
12 判别分析(Discriminant analysis,简称DA)在中药质量评价中的应用
判别分析是在已知研究对象分成若干类型(或组别)并已取得各种类型的一批已知样品的观测数据,在此基础上根据某些准则建立判别式,然后对未知类型的样品进行判别分类,而聚类分析是在一批给定样品要划分的类型事先并不知道,正需要通过聚类分析来给以确定类型。正因为如此,判别分折和聚类分析往往联合起来使用,所以判别分析是要求先知道各类总体情况才能判断新样品的归类,当总体分类不清楚时,可先用聚类分析对原来的一批样品进行分类,然后再用判别分析建立判别式以对新样品进行判别。
于承浩等[13]对六味地黄丸及其模拟样品在290nm下进行薄层扫描分析,将所得特征数据利用聚类分析方法进行分类,用逐步判别分析方法优选特征数据、建立判别函数,并对分类结果进行检验。结果表明,样品及模拟品被分为4类,分类合理,判别函数回判准确率为100%。从而说明了聚类判别分析方法可较好地评价六味地黄丸的质量。张亮等[14]采用反相HPLC法对六味地黄丸缺味药模拟方的浸出物进行分析,选取9个色谱峰的峰面积与内标峰面积之比值作为样本特征变量,通过169个训练集样本建立了其中3种缺味药的Bayes法和PRIMA法判别分析数学模型。结果3种缺味药4种模式的平均正确识别率Bayes法和PRIMA法均为100%,对169个预示集样本的平均预示率Bayes法为100%,PRIMA法为99.6%。表明Bayes法和PRIMA法能对六味地黄丸3种缺味药进行准确识别。
13 主成分分析法(Principal components analysis,简称PCA)在中药质量评价中的应用
根据在初选的特征量间可能存在的相关性,找到一种空间变换方式,通过对原始特征(经标准化后的)变量进行线性组合,形成若干个新的特征矢量,要求它们之间相互正交,它既保留了原始指标的主要信息,且又互不相关。这样一种从众多原始指标之间相互关系入手,寻找少数综合指标以概括原始指标信息的多元统计方法成为主成分分析。其数学模型为:设有m个指标X1,X2,…,Xm,欲寻找可以概括这m个指标主要信息的综合指标Z1,Z2,…,Zm。从数学上讲,就是寻找一组常数ai1,ai2,…,aim(i=1,2,…,m),使这m个指标的线性组合:Z1=a11 X1+a12 X2+…+a1m XmZ2=a21 X1+a22 X2+…+a2m Xm Zm=am1 X1+am2 X2+…+amm Xm能够概括m个原始指标X1,X2,…,Xm的主要信息(其中,各Zi(i=1,2,…,m)互不相关)。这些矢量即称为主成分。该方法就是根据样本特点,选取与问题最相关的特征来参与分类的。近年来主成分分析法在中药质量鉴别分析中应用比较广泛[15-17]。
| 【设为主页】 【收藏论文】 【保存论文】 【推荐好友】 【打印论文】 【回到顶部】 【关闭此页】 |