TCGA肝癌临床数据资源全面介绍---肝癌研究领域的全谱!
2021-12-13 12:00 来源:阜新妇科医院
2006年,胃癌DNA平面图谱(The Cancer Genome Atlas, TCGA)计划书以多形持续性胶质母细胞核肉瘤(GBM)、呼吸系统鳞状细胞核癌(LUSC)和卵巢粒状持续性囊卵巢癌(OV)开始为期3年的重点项目计划,2009年~2015年全面展开。到计划年末,TCGA网络数据处理过程实习者已刻划了33种胃癌并不一定10,000余同上染病征的小分子相似持续性,并概念了很多小分子变异。TCGA包含的流行染病学极为最重要相似持续性都是泛化的数据集收集。为确保合理主要用途这些具DNA相似持续性的海量流行染病学数据集,最近TCGA开展一批重大成果,刊载在CellPress旗下的出版物。本文对4年末5日刊载Cell上的一文开展编译。文章阐述以OS(总肉食动物期)、PFI(无困难重重数有规律)、DFI(已得数有规律)和DSS(结核染病相关能活)为四个主要流行染病学结果西端的TCGA泛胃癌流行染病学数据集森林资源(TCGA-CDR)简化化数据集库,并给出了每种胃癌并不一定的西端主要用途所列示同意。TCGA流行染病学数据集可从DNA数据集总计享空数间(GDC)门户网站串流,所有的小分子数据集在串流。流行染病学数据集和小分子数据集主要用途除此以外的贴纸结构,便于染病征的流行染病学资讯和抽取小分子数据集拆分。TCGA泛癌数据集库所列头相似持续性平面图1A为流行染病学数据集拆分和比对分析方法及4个主要流行染病学西端引申和指标的流程平面图,对33份初始登记和97份更有利于数据集文件,总计33种胃癌并不一定111,60同上胃癌染病征的资讯开展了处理过程。所列1为每个TCGA所列头的基本相似持续性。按原发抽取根据小分子相似持续性选为每个所列头,皮肤上呼吸系统癌(SKCM)的原发和转到炊两种并不一定都有,其它极少数的原发与转到并不一定也有数据处理过程。平面图1. 流行染病学数据集拆分和比对分析方法及4个主要流行染病学西端引申和指标流程平面图所列1. TCGA 泛癌所列头相似持续性流行染病学结果西端OS、PFI、DFI和DSS总肉食动物期(OS)很最重要,好处是概念OS事件真相时模糊持续性最高于。但主要用途OS不作西端或许削弱流行染病学数据处理过程,因为非癌死因不一定能再现出脊椎动物学、侵入持续性或对染病人加重。主要用途OS或才可更长的随访整整;很多流行染病学试验中所,并不一定换用相对随访整整不长的DFI或PFI。针对现有TCGA流行染病学数据集,要认识到有规律流行染病学随访数有规律在侵入持续性胃癌并不一定结果的最重要持续性,因为或许几年内就捕捉到到流行染病学事件真相,在丧生在此之前已出现染病情罹患或困难重重。对侵入持续性较强的胃癌并不一定,染病征在数十乃至几十年后罹患,随访期数间或许无法捕捉到所才可事件真相以默许有用结果供辨别。该比对的目的是检查和TCGA泛癌流行染病学检测的相对压倒持续性和缺乏,导师现阶段的比对和避开随访数有规律整整缺乏等毛染病。比对全部TCGA流行染病学数据集后,结论如下:在数据集可授予时,OS、PFI及DFI相对精确,但大多意味着根本无法估计值DSS。平面图1B为33种各不相同胃癌并不一定的OS K-M曲线。尽管肉食动物比对不是TCGA主要前提,大多胃癌并不一定肉食动物曲线与过去指标大致相同肉食动物西端的独立国家数据处理过程基本大致相同,GBM、OV(2008, 2011)和高于级别胶质肉瘤(LGG)(2015)的TCGA结果就是比较好同上证。PFI、DFI和DSS的K-M曲线见平面图1C–1E。平面图1 B-E流行染病学数据集比对基于每种胃癌并不一定4个西端的捕捉到整整计算超过随访整整及事件真相或检查和的中所位整整(所列2)。所有的中所位随访整整为22.1个年末,但各不相同并不一定胃癌该整整各不相同大大;GBM和急持续性髓系白血染病(LAML)最短约12个年末,而肾脏嫌色细胞核癌(KICH)最长约48个年末。所列2 总体中所位随访整整及4个西端的事件真相与捕捉到中所位整整自荐主要用途的流行染病学结果西端流行染病学结果西端同样取决于数据处理过程前提、事件真相才可求量、所列头大小不一和结果数据集总质量。将这些分析方法和总计同开发的其它分析方法不作为对单个结核染病数据集库的飞行测试和补充检查和,给出在每种结核染病并不一定中所主要用途每个结果西端的所列示同意及原因(所列3)。每种胃癌并不一定的肉食动物西端才可至少通过一个主要飞行测试和补充检查和才被接受。33种癌中所的13种主要用途全部4个西端:膀胱尿路上皮癌(BLCA)、子宫颈鳞状细胞核癌(CESC)、结肠癌(COAD)、食管癌(ESCA)、皮脂腺鳞状细胞核癌(HNSC)、肾脏状细胞核癌(KIRP)、呼吸系统卵巢癌(LUAD)、LUSC、OV、胰卵巢癌(PAAD)、肉肉瘤(SARC)、胃卵巢癌(STAD)和子宫内膜癌(UCEC)。无论如何,无法一个西端的有嗜铬细胞核肉瘤和副神经节肉瘤(PCPG)。淋巴弥漫大B细胞核淋巴肉瘤(DLBC)、LAML和颈腺肉瘤(THYM)根本无法一个西端;剩余胃癌并不一定2或3个西端,但其中所一些持保留见解。最有用的是PFI,可无保留地自荐给除LAML(无数据集)、DLBC和KICH(谨慎主要用途)和PCPG(不自荐)内外的4种。所列3 西端OS,PFI,DFI及DSS的指标与自荐主要用途可验证TCGA-CDR及案同上分析分析方法在乳卵巢癌数据处理过程中所,睾酮ER阴持续性染病征流行染病学肉食动物期病状比ER+染病征差。分别用OS、PFI、DFI和DSS比较这两类染病征的肉食动物期(平面图3A–3D;曲线年末于10年随访整整,但主要用途整个数据集库开展比对)。单心理因素比对显示,主要用途PFI(p= 0.005)和DFI(p = 0.001)不作为流行染病学西端,TCGA中所ER+乳卵巢癌染病征比ER-染病征有好处的肉食动物期,但主要用途OS时两类染病征数间不依赖于各不相同(p = 0.097) 。此内外,两类染病征的DSS(p = 0.009)有很大各不相同,得出结论DSS的潜在实用性。以上断定得出结论了PFI和DFI是特定并不一定乳卵巢癌小分子数据处理过程的恰当西端。平面图3 可验证和分析分析方法实同上此内外还可验证了侵入持续性GBM肉食动物结果西端。TCGA中所GBM中所位OS为12.6个年末,介于此在此之前另据的简化染病人的12.1个年末和简化染病人总计同替莫唑胺的14.6个年末之数间。中所位PFI是6.1个年末,介于此在此之前另据的简化染病人5个年末和简化染病人总计同替莫唑胺的6.9个年末之数间。显然,TCGA数据集库OS和PFI事件真相整整与文献资讯赞同。最后印证OS和PFI不作为GBM小分子数据处理过程的流行染病学西端效度。用Cox%或许会重归数学模型明确高期(III、IV期)相对高于期(I、II期)胃癌染病征的或许会比(HR),可验证4个西端的TCGA-CDR数据集。由于DFI概念与其它结果的概念不赞同,对自荐主要用途OS、PFI和DSS的14种并不一定胃癌比较logHR(所列3)。随后根本无法对满足Cox%或许会理论上的结核染病开展统计(平面图3E–3G)。得出结论,14种并不一定胃癌中所,除数间皮肉瘤(MESO)、PAAD和葡萄膜呼吸系统癌(UVM)内外,高期对比高于期HR在3个自荐西端OS、PFI及DSS上明显偏高。换用一对一抽取的Wilcoxon秩和核查,当主要用途PFI与DSS(p = 0.0008)或PFI与OS(p = 0.039)测量时,logHR有很大各不相同,显示结核染病困难重重和肉食动物西端在HR上依赖于系统偏离;OS与DSS之数间无法很大各不相同(p = 0.106)。对2个logHR值的简化说是开展逆加权超过明确Pearson相关系数, 由logHR估计值的3种结果有极很大正相关:PFI和OS相关系数0.96(95%置信区数间[CI]:0.77–0.99),PFI和DSS为 0.95(95%置信区数间:0.76–0.99),OS和DSS为0.90(95%置信区数间:0.61–0.98)。这些相关持续性潜在默许流行染病学早期用PFI,晚期用OS和DSS花钱西端。除了拆分小分子数据集,还先前比对首次染病人后已得染病征与非已得染病征是否出现各不相同的新的事件真相。TCGA-CDR中所29类胃癌接收者主要用途妥善解决该疑问,设为染病征从诊断到开展首治并达到已得状态至少能活3个年末。以LUSC为同上,有289同上已得染病征和41同上长期非已得染病征,NTE率共五21.8%和68.2%。用Cox%或许会重归数学模型,断定在非已得染病征中所NTE或许会很大高于已得染病征(HR = 6.68,95% CI = 4.25–10.51,FDR调整q值<0.05)。在另内外21种胃癌并不一定中所也有十分相似结果(所列4)。只剩7种中所无法捕捉到到这些各不相同。我们也在指标是否每个数学模型都满足%或许会理论上,其中所有两个不适用,才可数据处理过程整整依赖及多参数数学模型来寻找原因。所列4 非已得与已得染病征NTE发展对比TCGA从全球数百个接入收集传染染病,为妥善解决流行染病学数据集各不相同接入数间的可比持续性,才可重新考虑数据集完整持续性、和染病征相似持续性等。对每种结核染病而言,我们对比了在此之前两名透过传染染病数最多的有组织来源接入(TSS)与所有其它TSS的同种结核染病及4个结果西端(所列5)。所列5 对来自在此之前两位TSS的每个胃癌并不一定数据处理过程结果开展比较对于GBM等极具侵入持续性的,在此之前两位TSS(#1和#2)的发染病青年人与其它TSS相比较十分相似的有OS、PFI和DSS,因事件真相太少难以比对不自荐DFI花钱西端。BRCA等较高于侵入持续性,强力自荐主要用途PFI和DFI,但所列示同意谨慎用OS或DSS指标。TSS #1的流行染病学数据集造成不太好的OS和DSS,但无法捕捉到到PFI各不相同;另内外,所列面上TSS#1有好处的DFI结果,根本无法出现3同上 DFI事件真相。这种所列里不一的现象得出结论该接入的结果数据集才可有利于指标。另一层面,TSS #2的4个西端结果与其它地方赞同。这个简单的结果比较得出结论,当从特定结果比对整体TCGA的流行染病学数据集时,才可重新考虑TSS的具体接收者。由于年龄、再行/分级及染病人等心理因素影响各不相同TSS患染病青年人的西端结果,TSS可以不作为这些和不完全流行染病学脚注等其它仍未测量各不相同的替代。潜在的参杂心理因素、竞争对手结果的或许会及数学模型理论上对流行染病学肉食动物西端比对来说,所列示同意主要用途所处理过程的全部流行染病学数据集。但相比较小分子/DNA数据集的拆分比对,要同样两个层面。首先,自荐见解基于孔径肉食动物数学模型,以小分子变异不作计算因子分成抽取集,有或许破坏结果统计的很大持续性各不相同。因此,从相互间联系的TCGA小分子数据集或变异TCGA-CDR结果数据集中所得出的结论才可在独立国家的数据集库中所有利于得出结论。第二,我们所列示同意根本无法主要用途原发的小分子数据集,因为染病征初诊时,最重要整整接收者等也就是说的流行染病学数据集已收集相对完整。皮肤上呼吸系统癌(SKCM)在TCGA并不一定中所相当一般来说,470同上中所根本无法103同上原发,其余296同上为原发局部淋巴结转到,68同上远端转到。这与相当多收集到转到肉瘤的其它TCGA胃癌并不一定形成自然而然。SKCM转到肉瘤相当多带有也就是说的原发,而其它TCGA胃癌并不一定尽管相当多有转到肉瘤,但都带有也就是说的原发抽取。因此,对于SKCM结果的相关持续性,所列示同意只主要用途有限才可求量的原发传染染病,尽管SCKM淋巴结转到的III期传染染病可不作为独立国家组群开展数据处理过程。在主要用途新的拆分的TCGA-CDR数据集库时,还才可同样:潜在混淆心理因素、竞争对手结果的或许会及数学模型理论上。参杂心理因素参杂心理因素依赖于但被排除在数学模型之内外时,偏离或许忽视或高于估确实。如在乳卵巢癌的有色人种各不相同数据处理过程中所,白人与奴隶主染病征之数间依赖于最重要的基因所列达各不相同,然而根据小分子变异开展调整后,这种各不相同很大减少甚至消失。治果也是潜在的参杂心理因素,当接收者可利用时应适当重新考虑调整。染病人仍未知时,年龄、诊治所医院及诊断年份等简化染病人不作为替代接收者能减少部分说是差。对这层面的决策三维,努力主要用途一个大病状数据处理过程所列示同意报告(REMARK)。竞争对手结果的或许会测定DSS、DFI和PFI西端时,要对无法亲身经历最重要事件真相且已得的丧生染病征开展审查。在这种意味着,如果理论上染病征无法其它死因,那她/他最终仍或许死于胃癌指征。然而,在估计值染病人等计算因子对继发持续性胃癌或心血管结核染病等非基准胃癌丧生或许会的计算战斗能力时,该理论上并不可取。数学模型理论上分析分析方法Cox%或许会(PH)数学模型必才可检查和PH理论上。除少数案同上内外,大大多数学模型都满足Cox PH理论上,但才可有利于探索这些个案以追踪违背理论上的原因,从而对HR花钱出更准确的估计值。尽管已经为清理数据集和妥善解决疑问付出代价了巨大坚持不懈,但仍依赖于最重要的主要用途受到限制,访问TCGA流行染病学数据集都必才可了解这些受到限制。首先,TCGA主要是为小分子数据处理过程设计,原先传染染病同样来自多个私人机构带有恰当库存有组织的仍未染病人原发传染染病,因此这些传染染病不密切相关连续持续性。此内外,对于每种各不相同并不一定/数据处理过程,随访数据集无法独立收集。同时,流行染病学数据集收集的一些规则在过去不得不随着整整的很长而改变。TCGA - CDR不包含胃癌染病人史,并非所有传染染病都被脚注。因此,比对特定并不一定或变异的染病人背景比不上简介持续性泛癌比对。当染病征开展具体染病人时,得益能用DFI和PFI西端有效比对。其次,TCGA抽取流行染病学随访根据当地门诊的整整所列,或许为结核染病或特定部位的罹患和染病人最重要精神上状态的记录,因此无法TCGA所选的流行染病学随访计划书,根本无法给出计划主要强调的小分子相似持续性。最后,仅仅所有TCGA授予的抽取和DNA及小分子数据集来自新的诊染病征原发的单个切片,由此造成的DNA和小分子数据集不用在空数间或整整任何层面明确逃逸都是另一染病征结果参数的关联持续性。该疑问不是TCGA独有的,任何连续持续性原发持续性数据处理过程都依赖于。展望这项实习是有史以来第一次全面系统化处理过程TCGA泛癌流行染病学资讯。由此造成的TCGA-CDR的结果西端与独立国家非TCGA数据处理过程结果赞同,解释该森林资源在空在此之前才可求量的流行染病学尺度上透过了脊椎动物观测新的视角。也要认识到TCGA-CDR的内在主要用途局限持续性及极其最重要导师和自荐见解。已经相当一般来说性,有机体结核染病期望大才可求量的小分子数据处理过程必才可系统化收集流行染病学染病理、染病人和原于事件真相数据集,以坚持最高简化的流行染病学数据处理过程。尽管有其局限持续性,TCGA-CDR透过了简化化数据集库,以及模糊的4个流行染病学结果西端导出,并妥善解决了总质量疑问,从而在泛癌和个体水平上开展转化数据处理过程。期望数据集数据处理过程的融合将提高结果之数间的可比持续性,好处地解释和默许重复。参考文献An Integrated TCGA Pan-Cancer Clinical Data Resource to Drive High-Quality Survival Outcome Analytics
TAG:
延伸阅读
-
让产后女性继续当女王,中美产科做到的这些你学不会
都说女人怀孕时是女王是熊猫是全家人的里面心合着一生完孩子待遇就掉落谷底这差距至极就问你大不大?“装载”后,当大多数人们,把心事都倾注在...[详细]2022-05-04
-
更年期噩梦吗?K19康复网:更年期综合症才噩梦!
青春期与青春期综合症显然是两个概念,我们往往不会混为一谈!青春期是未婚在时光里必经的一个阶段,这意味著一个人毫无疑问西起成熟。而青春期...[详细]2022-05-03
-
子宫内膜药的病因是什么?
作为我们男性最为瞩目的自身肥胖关键问题应该是卵巢肥胖关键问题了。因为男性的卵巢是共存下一代一个人的场所,对于男性的共存肥胖和身体肥胖都...[详细]2022-05-02
-
慢性子宫内膜炎的症状 比较十分相似的症状表现
慢性内膜内膜药的造成了可能有很多,如内膜内膜连续性若长期受到瘙痒的刺激,则有的输卵管卵巢药或严重的内膜颈药,放置进宫节育装置,新生儿或...[详细]2022-05-02
-
俩人注意了,爱生气,小心卵巢囊肿找上身
李女士基本单位做了体检,今年还好好的啥事并未,今年却检出了:“甲状腺突起、上皮细胞突起、生殖细胞肾脏……”因此感伤很不美丽。“平时不就...[详细]2022-05-01
-
月经不调的症状 8个展现帮你认清大姨妈
男人你是否元月生命期不渐进?元月顺延或提前结束了呢?那就可能会是元月不调了哦。男人每月一次的元月无论如何以28天大概为一个生命期,如果这个生...[详细]2022-04-27
-
卵巢囊肿恶性的病征有哪些
**息肉如果不必须第一时间疗法的话,那么是很有可能引发更加相当严重的癌症,反之亦然的威胁到我们的身体健康的。所以我们对于**息...[详细]2022-04-26
-
中医学怎么治疗附件炎比较好
附件炎对很多熟人来感叹毕竟不再险恶,作为女性内阴部包括子宫、输精管、卵巢及其周围的内层、粘液、腹膜等处发生病毒感染引致的炎症,女性附件...[详细]2022-04-25
-
北京:不到7%, 疾病检出率翻倍
根据市卫生计生委的最新数据,自2003年以来,本市率大幅下降,去年本市率仅为6.76%,随着率的下降,人群疾病检出率逐渐上升,从1996年的5%上升到2014年...[详细]2022-04-25