水稻(Oryza Sativa L.)Gene mention(symbol)-- ID转换

任务:

文本中Gene Tagging抽取出大量的Gene Mention(e.g. GS1, groEL, OsSUT1, fructose-6-p
hosphate 1-phosphotransferase),其中可能存在非水稻基因。需要将这些Gene mention进行标准化到 The Rice Annotation Project (RAP)
或者 Rice Genome Annotation Project (RGAP7,MSU)

RAP格式为“Os-Chr-g-number”,MSU格式为“LOC_Os-Chr-g-number”。

待尝试方法:

  1. PlantGSEA 提供了非常方便的在线ID转换工具

  2. Mapping file 对应。
    2.1 RAP-2018.
    2.2 Oryzabase Download - Rice ID.

  3. HZAU - RIGW ID Mapping.

  4. Github 上脚本。

水稻相关数据库记录

  1. Rice Genome Annotation Project.

  2. funRiceGene.

  3. TAC.

  4. GRamene.

相关文献记录

  1. Gene mention normalization in full texts using GNAT and LINNAEUS, 2010, Computer Science.

  2. Gene mention normalization and interaction extraction with context models and sentence motifs, 2008, Genome Biology.

推荐阅读更多精彩内容