GEO、TCGA多数据库联合挖掘胰腺导管腺癌预后关键基因

胰腺导管腺癌的五年生存率低于5%,是目前主要致死的癌症之一。如何结合多个公开数据库数据分析和挖掘此类癌症临床诊断和预后的关键基因呢?这里就给大家介绍一篇文献:基于共表达分析鉴定胰腺导管腺癌进展与预后的10个关键基因。

数据来源

基于GEO数据库获取GSE62452数据(69癌症样本/61癌旁样本)进行共表达分析,借助TCGA数据库下载的146个样本数据、GEO数据库下载的GSE62165涉及的131个样本数据等进行验证。

数据分析

1.GSE62452数据处理及差异分析

从GEO数据库下载GSE62452原始数据,并基于RMA算法进行背景校正及其他标准化处理,再进一步基于R包limma完成差异分析,以FDR<0.05  & |log2FC| ≥0.585为差异筛选阈值,共获得了1008个差异基因(699 up-regulated / 309 down-reguated),差异基因的表达谱和火山图分布情况见下图。

2.加权基因共表达网络分析

基于上一步分析筛选获取的差异基因进行WGCNA分析,power值选定8(R2>0.89),共获得4个有效模块(见下图A),同时结合性状数据分析各模块和基因之间的相关性(见下图C),计算基因与性状之间的GS(gene significance),并统计各模块内平均的GS作为MS(module significance)从而多方面衡量和选择重要模块进一步分析(见下图B)。

结合性状关联分析最终选定和胰腺导管腺癌最相关黄色模块进一步分析。并基于模块内GS与MM分析筛选出了43个基因进行后期分析(见下图A)。

3.蛋白互作分析

为探索基因之间的蛋白互作关系,利用string数据库进行分析,最终基于yellow模块所有基因获取了一个蛋白质互作网络(80 nodes and 930 edges,见上图B),从中选择出连接点数超过23的所有基因,一共涉及了42个基因,其中和基于模块和性状分析筛选的42个基因的重合有36个,该部分基因将作为候选进一步验证。

4.筛选与验证

36个候选基因,利用GSE62452以及TCGA数据库数据进行生存分析,最终筛选出10个关键基因 (p value<0.05,见下图)。

文章进一步开展ROC曲线分析,结果显示筛选到的10个基因AUC值大于0.5(见下图)。

此外,为探究关键模块中的差异基因是否涉及癌症相关功能,利用DAVID对yellow模块中的所有基因进行了富集分析,结果如下图所示,GO分析结果显示有丝分裂、细胞分裂显著富集,KEGG分析结果显示细胞周期最为显著(见下图)。

基于GSE62165数据库数据进行GSEA分析,同样发现细胞周期、DNA复制、错配修复等显著富集(见下图)。

结论

作者利用和GEO数据库、TCGA数据库等多项项数据进行数据挖掘分析,并多方面的验证和分析结果,成功筛选到10个可能对胰腺导管腺癌临床预后具有重要作用的关键基因。

参考文献

Zhou Z , Yian C , Yinan J , et al. Ten hub genes associated with progression and prognosis of pancreatic carcinoma identified by co-expression analysis[J]. International Journal of Biological Sciences, 2018, 14(2):124-136.

如果你对TCGA数据挖掘有兴趣的话,可以学习我们的TCGA相关课程。

《TCGA-生存分析》

https://study.163.com/course/introduction/1005645022.htm?share=1&shareId=1031484705

 《TCGA-ceRNA调控网络分析》

https://study.163.com/course/introduction/1006360042.htm?share=1&shareId=1031484705

《TCGA-转录因子调控》

https://study.163.com/course/introduction/1005807030.htm?share=1&shareId=1031484705

更多技能学习链接:

http://m.study.163.com/provider/400000000234009/index.htm?share=1&shareId=1031484705

更多生物信息课程:

1. 文章越来越难发?是你没发现新思路,基因家族分析发2-4分文章简单快速,学习链接:基因家族分析实操课程基因家族文献思路解读

2. 转录组数据理解不深入?图表看不懂?点击链接学习深入解读数据结果文件,学习链接:转录组(有参)结果解读转录组(无参)结果解读

3. 转录组数据深入挖掘技能-WGCNA,提升你的文章档次,学习链接:WGCNA-加权基因共表达网络分析

4. 转录组数据怎么挖掘?学习链接:转录组标准分析后的数据挖掘转录组文献解读

5.微生物16S/ITS/18S分析原理及结果解读OTU网络图绘制cytoscape与网络图绘制课程

6. 生物信息入门到精通必修基础课,学习链接:linux系统使用perl入门到精通perl语言高级R语言画图

7. 医学相关数据挖掘课程,不用做实验也能发文章,学习链接:TCGA-差异基因分析GEO芯片数据挖掘GSEA富集分析课程TCGA临床数据生存分析TCGA-转录因子分析TCGA-ceRNA调控网络分析

8.其他课程链接:二代测序转录组数据自主分析NCBI数据上传二代测序数据解读

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 158,847评论 4 362
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 67,208评论 1 292
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 108,587评论 0 243
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 43,942评论 0 205
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 52,332评论 3 287
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 40,587评论 1 218
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 31,853评论 2 312
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 30,568评论 0 198
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 34,273评论 1 242
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 30,542评论 2 246
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 32,033评论 1 260
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 28,373评论 2 253
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 33,031评论 3 236
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 26,073评论 0 8
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 26,830评论 0 195
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 35,628评论 2 274
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 35,537评论 2 269

推荐阅读更多精彩内容