疑难癌症精准溯源分析平台


        原发灶不明癌症(Carcinoma of Unknown Primary,CUP)是一种极难诊断的癌症。患有CUP的患者体内存在转移性的恶性肿瘤细胞,但是无法确定其原发灶的位置。CUP在所有诊断为癌症的病例中占5%以上,其中70-80%CUP患者无法通过影像学、组织学等检查确定原发灶,从而无法对症下药。因此,确定CUP患者的原发灶对于该患者的后续治疗起到至关重要的作用。
        随着全基因组基因表达数据(例如RNA-Seq和基因芯片数据)的广泛应用,基于基因表达谱的生物标志物,对CUP的组织起源诊断提供了重要帮助。然而,由于RNA-Seq和芯片数据间的差异性,以及癌症患者的肿瘤异质性,基于基因表达谱的生物标志物对于CUP原发灶的预测性能往往不尽如人意。为了解决这一问题,本研究提出了一种基于基因表达秩的算法用于诊断CUP的组织起源,即TOD-CUP(Tissue Origin Diagnosis for Cancer of Unknown Primary)。
        TOD-CUP在线分析平台(测试版):http://10.75.119.202/todcup/(仅限校内网)。




                 算法介绍
 


RNA-seq训练数据集和TOP-CUP算法流程

image
TCGA数据库中24种癌症的类型和用于本研究的训练数据量
image
TOD-CUP算法具体流程


                 输出结果介绍
 


image

TOD-CUP输出结果包含4部分:A.  显示TOD-CUP方法在所有538个标记基因中识别到的标记基因数量;B. 给出测试样本的癌症起源诊断结果;C. 给出该癌症样本判定为所有癌症类型可能性从高到低的得分排名;D. 癌症类型得分的柱状图结果。