医咖会曾发过一篇文章:《》,详尽介绍了结合多项指标进行癌症确诊的统计方式及其SPSS操作。
然而文中给出的事例,并没有包含任何确诊试验结果,而是仅借助病人特点(性别、年龄、BMI、COPD病程和是否抽烟),来预测病人是否患胃癌。从严格意义上讲,这并不是一篇标准的联合确诊试验研究,而是一篇构建预测模型的研究。
本文将以在体外人工受精(IVF)中,三种子宫储备功能检查(ovarianreservetests)用于预测子宫低反应(poorovarianresponse)作为反例,讲解怎样评价多个确诊试验联合的确诊确切性。
研究问题与数据
基础窦卵子数(AFC),抗缪勒管激素(AMH),促卵子激素(FSH)是最常用的预测试管小孩取卵数和子宫反应的三种子宫储备功能检查。研究者搜集了1023例接受体外人工受精的病人,拿来研究这三种指标拿来预测子宫低反应的确切性。
数据剖析前的打算
在开始剖析之前,我们须要对数据进行描述,来了解我们须要剖析的数据是哪些样子的,也让读者对研究所用的数据有一个直观的印象,这就是表1:病人通常特点的描述统计。
从表中我们可以看出,相比于非子宫低反应组有roc指标的软件,子宫低反应组中AFC和AMH指标较低,而FSH指标较高,同时,子宫低反应组年纪较高。
如今我们对数据早已有了大约的了解,也晓得了各个测试指标与是否出现子宫低反应的关系(即我们一般所说的,这个指标是越高越好还是越低越好)。我们甚至可以通过统计检验,对测试指标进行组间比较,然而这种并不是确诊试验类研究关注的指标。
勾画单个指标的ROC曲线
对于连续型确诊指标,一般会使用ROC曲线来表现确诊确切度。首先,我们来勾画每一个单独测试指标的ROC曲线,并估算AUC(结果见图1)。单个指标的剖析,不是本文的重点,具体操作可以参考医咖会之前的文章:《》
图1各类确诊试验的ROC曲线
多个确诊指标的联合
完成了前面一波常规操作,我们总算来到了本文的重点:怎么联合多个确诊指标。
对于联合确诊,二分类确诊结果多采用串联和并联策略;但是,对于连续型的确诊指标,我们一般会借助多个确诊指标的线性组合作为一个新的指标,再用这个新的指标作为确诊根据。
这么,怎么得到这个线性组合呢?由于我们想要确诊的结局变量是二分类变量,所以这儿要借助Logistic回归。
当我们谈到Logistic回归的时侯,首先会想到OR值,这是通常情况下我们须要关注的结果。并且当借助Logistic回归来联合多种确诊方式时,我们要用到的是Beta系数(Beta系数进行指数变换之后,就是我们熟悉的OR了。OR=exp(Beta),Beta=log(OR))。
表2中给出了AFC+AMH+FSH联合确诊多项式的系数(具体操作可以参考本文开头提及的《》一文),我们可以按照这种系数,来估算联合确诊指标得分:
新构建的联合确诊得分=-0.171-0.136*AFC-0.319*AMH+0.124*FSH
联合确诊得分估算完成后,我们就可以把它当作是一个单独的指标,像其他确诊指标一样,重复上面对于单个确诊试验的剖析了,结果见表3和图1。
图1各类确诊试验和联合确诊的ROC曲线
我们还可以考虑加入病人特点,作为测量指标的补充。我们晓得年纪也是影响子宫反应的重要诱因,甚至仅凭年纪,才能作出比较确切的预测。加入年纪的模型的ROC和AUC,也可以和其他结果一起装入图表中(见上表2,表3,图1)。
从图1和表3中,可以看出,相比于单个确诊指标,联合多个指标组成的确诊评分有更高的确诊确切度。
见到这张表3,阅读量比较大的男子伴可能会有这样的疑惑:“我看见好多确诊试验的ROC剖析,在给出AUC值的同时,也会报告OR值,我们也要如此做吗?”
这时侯,我们上面制做的表1的作用就彰显下来了:我们可以看见不同的测量,单位差异很大,假如此处汇报非标准化的OR值,不同的测量之间没有可比性,假如比较OR值的大小会对读者形成欺骗,所以这儿不建议报告OR值。
假如男子伴们认为以上的剖析太少了,文章变得不够充实,想要把这三种测量进行两两组合(A+B,B+C,A+C),求出对应的ROC曲线和AUC。并且这样的剖析并不会为文章降低价值,并且加入了这种组合后,在同一张图中多了3条额外的ROC曲线,会让图变得零乱且无法辨别。
所以,作者不建议为了多做剖析而做剖析,我们只做有意义的剖析,例如比较三种指标的联合确诊与单一指标的确切度(AUC)的差别。具体操作可以参考医咖会的文章:《》。
结语
一般来说,做到这儿有roc指标的软件,一篇完整的多个确诊试验联合的研究的统计剖析部份就做好了。我们也可以把这个联合了多个确诊试验的确诊评分,觉得是一个简单的预测模型。关于更为复杂的预测模型,我们会在前面关于预测模型的文章中再详尽讲解。
然而,假若只做这么普通的统计剖析,那和咸鱼有哪些区别?怎么能够让编辑眼前一亮,让评审自叹弗如呢?请听下回分解:协变量调整后的ROC曲线及协变量调整AUC。