人类肿瘤数据库

肿瘤是四大非传染性疾病之一,造成人类死亡率的14.6%左右。目前有100多种不同的肿瘤类型,500多个基因参与肿瘤的发展。大量的研究致力于探索肿瘤的发生和治疗,随之也产生并积累了丰富的数据。如相关的科学研究、GWAS研究、基因表达、基因-基因或蛋白-蛋白相互作用的数据,以及表观、免疫、细胞遗传学等数据。然而这些数据复杂度和异质性都较高,包括没有处理和结构化的原始测序数据和经过注释和结构化的遗传多态性数据,造成了生物医学研究者对这些数据的储存、挖掘、重复使用和分析面临着巨大的挑战。

下文将对目前公共的肿瘤数据库以及相关的分析工具进行介绍。

肿瘤数据库概览

全面的肿瘤项目工程

(1)ICGC(International Cancer Genome Consortium)

(2)TCGA (The Cancer Genome Atlas)

TCGA是由国际癌症研究所和国际人类基因组研究所共同创建的,旨在提供主要的肿瘤类型和其亚型的基因组变化图谱。它同时包含临床信息、基因组特征数据和基因组的数据分析。TCGA储存的数据类型包括:基因表达、拷贝数、体细胞突变、SNPs、microRNA、临床结果、组织切片。

TCGA Data Portal 可以使用户对TCGA的数据进行探索、下载和分析。

(3)CPTAC (clinical proteomic tumor Analysis consortium )

临床蛋白质肿瘤分析中心, 利用蛋白质组学的技术——质谱解析肿瘤的基本分子特征。所有的数据可以通过提交申请免费下载。

(4) CGP (The Cancer Genome Project)

由Sanger 研究所发起,旨在探究体细胞突变和肿瘤发生有关的基因,同时这里的数据也会在COSMIC数据库更新。

与癌症相关的体细胞突变数据库及其相关出版物。数据包括在良性增生、原发性和转移性肿瘤、复发和癌细胞系中发现的突变。数据库可以根据基因、组织或组织学进行查询,并定期更新。

资源

工具

(1) CGAP (cancer genome Anatomy project)
  • http://cgap.nci.nih.gov/
    CGAP 包括许多生物信息分析工具和相互连接的模块,使用户能够访问CGAP数据。这些数据包括癌症相关基因和单核苷酸多态性,癌症患者的恶性组织和染色体畸变。同时 CGAP 基于基因表达序列分析(SAGE)以及以癌症相关基因为靶点的RNA干扰(RNAi)构建,以及生化通路和蛋白质复合物,提供有关特定基因在正常、癌前和癌组织中的差异表达的信息。

(不过该网站将于2019年10月1号之后下线)

(2) CGWB (the cancer genome Workbench)

包含来自不同肿瘤项目(如TCGA、COSMIC、约翰霍普斯金大学、TARGET)的拷贝数、突变、表达、甲基化数据.

肿瘤驱动基因

(1) TCGBs (tumor gene Family Databases)

肿瘤基因家族数据库,包含肿瘤发生相关基因信息,基因信息主要有基因的便名、细胞定位、生化功能、不同肿瘤中的突变频率、染色体位置、致癌性、肿瘤基因类型、信号转导通路。
此外还包含口腔癌基因数据库 ( oral cancer gene Database ,ORCGDB) 和乳腺癌基因数据库 ( Breast cancer gene Database , BCGDB)

(2) DriverDB database

包含6000多例外显子测序数据、注释库(如dbSNP、1000 genome、COSMIC) 和不同的鉴定驱动基因的生物信息学算法。

提供了两种视觉对数据进行探索,分别是基因肿瘤。在肿瘤模块对每种类型的癌症利用8种计算方法总结了驱动基因的结果,并且对驱动基因间的关联提供了3种层次的生物学解释。在基因模块,设计了可视化驱动基因的突变信息。
在meta分析模块中为研究者提供了在已定义的samle中鉴定驱动基因的功能。

(3) RAS Oncogene Database (RASOnD)

整合了大量的公共数据库中的基因组和蛋白质数据,目前包括101个物种的199,046个词条。

(网页打不开)

肿瘤变异

(1)COSMIC: 最大的突变信息的数据库
  • https://cancer.sanger.ac.uk/cosmic/
    COSMIC是最大的储存着肿瘤突变信息和相关临床和表型数据的公共数据库。目前包括1,029,547个样本的28,735个基因的信息,其中有2,002,811个编码突变和10,435个融合基因突变信息。
(2)Cancer Gene Census (CGC)
  • https://cancer.sanger.ac.uk/census/
    基于COSMIC数据库,旨在对那些含有与癌症有因果关系的突变的基因进行分类,并解释这些基因的功能障碍是如何导致癌症的。

参考:https://www.nature.com/articles/s41568-018-0060-1

(3)BioMuta

人类单核苷酸变异数据库,

(4)CaSNP

有关CNA的数据库,原始数据是从GEO的11,485个SNP芯片中收集的。网页打不开,貌似是刘小乐实验室搭建的。

(5)CanProVar--肿瘤蛋白质变异数据库
  • http://canprovar2.zhang-lab.org/
    根据已发表的文献整理的用于储存和预防与人类肿瘤发生有关的人类蛋白质组的种系和体细胞氨基酸变异。
(6) CanGEM

该数据库存储了肿瘤样本的临床信息和阵列比较基因组杂交芯片(aCGH)数据,用于检测癌症中的CNA基因。用户可以为特定的临床样本特征或单个基因的CNA创建自定义数据集。

(7)ICP

http://server.bioicps.org/

(网页打不开)

表观修饰

(1)MethyCancer
(2) PubMeth

从pubmed发表的文献通过文本挖掘收集的有关肿瘤突变与甲基化信息的数据库

microRNA

(1) OncomiRDB: 与肿瘤相关的microRNA
(2) miRCancer

转录组

(1) Oncomine: 肿瘤芯片数据库

包含基因表达和临床信息的数据,目前有715个基因表达数据和86,733个样本,至少有5年数据没有更新

蛋白质

(1) dbDEPC: 肿瘤蛋白质数据库
image.png
(2)MoKCa:Mutations, Oncogenes, Knowledge & Cancer

突变-致癌基因-肿瘤知识库

抗癌因子

(1) CanSAR

整合了多个学科的知识,包括生物学、化学、药学、结构生物学、细胞网络和临床注释等

(2)CancerResource

肿瘤药物和靶标的关系的数据库,同时含有基因组数据

(3)PharmGKB
(4)DrugBank

药物抗性

(1) CancerDR

CancerDR是一个包含148种抗癌药物及其对大约1000种癌细胞株的疗效的数据库。抗癌药物的药理学特征de 数据信息主要从CCLE和COSMIC数据库中收集。


整合资源

(1) IntOGen

目前的版本是2014年发布的,关注于癌症驱动基因、突变和通路

参考文献:DOI:10.3892/or.2014.3579

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 158,736评论 4 362
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 67,167评论 1 291
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 108,442评论 0 243
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 43,902评论 0 204
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 52,302评论 3 287
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 40,573评论 1 216
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 31,847评论 2 312
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 30,562评论 0 197
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 34,260评论 1 241
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 30,531评论 2 245
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 32,021评论 1 258
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 28,367评论 2 253
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 33,016评论 3 235
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 26,068评论 0 8
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 26,827评论 0 194
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 35,610评论 2 274
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 35,514评论 2 269

推荐阅读更多精彩内容