当前位置: 观测器 >> 观测器介绍 >> 怎样做好医学论文数据的统计分析
医学论文是对疾病或者临床科研的探究,但不管是某种疾病的影响因素,还是某种药物的临床效果都需要借助统计学的一些方法进行数据统计分析。正确使用医学统计学方法,能确切反映科研成果的价值,使所发表的论文更具有科学性和代表性。反之,不仅影响研究质量,甚至形成错误的结论,误导读者。因此,正确掌握和使用统计学方法,是对一个医学科技工作者的起码要求。
那么怎么才能进行正确的统计分析呢?
首先是确定统计样本设计的合理性。
1.分组要严格遵循随机化原则,研究对象的分组与抽样离不开随机化原则,在足够样本的前提下,随机抽样,随机分组,明确交代随机方法,各组样本量、基本特征等。随机不等于随便,有的作者滥用随机,只要抽样或分组,一概冠以随机,不描述随机方法,把随意、随便当做随机,使研究结果不可信。
2.抽取恰当的样本量,结果才有可靠性。有些文章例数太少,这样抽样误差大,导致结果不可靠。研究对象变量标准差小的,样本可以小一些。观察计数指标的样本一般不少于20~30例,计量指标的样本不少于5~10例。有的作者仅仅观察了数例患者,就得出百分之多少的有效率,显然是不恰当的。
其次对临床数据的种类要弄清楚,医学统计资料一般分为计数资料和计量资料资料两类。
(1)计数资料又称为定性资料或者无序分类变量资料,是将观察单位按其性质或者类别分组,然后清点各组观察单位个数所得的资料,例如某种检查结果为阴性或阳性,则分别清点阳性和阴性结果的例数,属于非连续性数据;
(2)计量资料是用仪器、工具或其它定量方法对每个观察单位的某项标志进行测量,并把测量结果用数值大小表示出来的资料,一般带有度量衡或其它单位,例如身高(cm)、血压(mmHg)等等,属于连续性数据。
当然计数资料与计量资料之间可以按照论文写作的目的要求进行转换,例如将年龄的计量资料按照30、31-40、41-50、51-60、60(岁)进行分组,分别清点各组人数则可以转换为计数资料。
而在进行统计分析前,要先对统计数据进行统计描述。计数资料采用率或者构成比,计量资料则要先进行正态分布检验,符合正态分布则用均数及标准差,不符合正态分布则可以采用中位数及四分位数间距等。
最后要对这些所统计的数据进行适当的分析。回归分析是医学论文中常见的数据分析法。
回归分析是一种预测性的建模技术,它研究的是因变量(目标)和自变量(预测器)之间的关系。运用十分广泛,回归分析按照涉及的自变量的多少,可分为一元回归分析和多元回归分析;按照自变量和因变量之间的关系类型,可分为线性回归分析和非线性回归分析。
使用回归分析的好处良多。具体包括两个方面:一是它表明自变量和因变量之间的显著关系;二是它表明多个自变量对一个因变量的影响强度。
1、一元线性回归分析
只有一个自变量X与因变量Y有关,X与Y都必须是连续型变量,因变量y或其残差必须服从正态分布。
2、多元线性回归分析
多元线性回归分析的使用条件:分析多个自变量与因变量Y的关系,X与Y都必须是连续型变量,因变量y或其残差必须服从正态分布。
1)变呈筛选方式:选择最优回归方程的变里筛选法包括全横型法(CP法)、逐步回归法,向前引入法和向后剔除法。
2)横型诊断方法:
A残差检验:观测值与估计值的差值要艰从正态分布
B强影响点判断:寻找方式一般分为标准误差法、Mahalanobis距离法
C共线性诊断:
诊断方式:容忍度、方差扩大因子法(又称膨胀系数VIF)、特征根判定法、条件指针CI、方差比例
处理方法:增加样本容量或选取另外的回归如主成分回归、岭回归等
3、Logistic回归分析
线性回归模型要求因变量是连续的正态分布变里,且自变量和因变量呈线性关系,而Logistic回归模型对因变量的分布没有要求,一般用于因变量是离散时的情况。
分类:Logistic回归模型有条件与非条件之分,条件Logistic回归模型和非条件Logistic回归模型的区别在于参数的估计是否用到了条件概率。
4、其他回归方法
非线性回归、有序回归、Probit回归、加权回归等
由于回归分析的类型较多,医学工作者在选择回归方法时,要根据数据的维数以及数据的其它基本特征来选择具体的回归类型,这对于接下来的数据分析是非常重要的。
还在为统计分析而烦恼吗?医学期刊导航网帮您一键解决统计分析难题!
本平台所转载文章均为传递更多知识供交流分享,版权归原作者所有如若侵权请及时与我们联系,我们将立即删除。
预览时标签不可点收录于合集#个上一篇下一篇