如何自学生物信息工具?

6字数 1722阅读 723

作为一个生信工作者,又或者作为一个研究者,在进行各种各样的生信分析时,你都会接触并使用到不同种类的生物信息学工具。又或者当算法,或者新技术的提升,新一代的工具的出现也会逼着你去学习使用新的工具。对于生信工作者来说,如何自学掌握并使用好生物信息学工具是一项最基本的本领。

在开始一种新的分析时,通常会听到几种工具/脚本/软件以不同的方式做同样的事情而产生不同的结果。哪一个是最好的?我应该使用哪个?哪一个会告诉我答案(研究的问题)?不幸的是,答案可能是它们都是合理的,有些比其他更准确,而且还取决于你的数据。最后,无论你选择哪一个,都有可能会某个人批评你的选择。本次内容,我将和大家分享我的选择工具还有学习工具的经验。

在此,请记住大多数生物信息学工具在UNIX系统上运行或有时作为R包运行;熟练运用命令行和或者R,将使学习新工具的过程变得更加容易。

  1. 明白你要做什么?
    你可能听说过那个人用了那个工具来分析微生物组数据或做转录组的分析。但它实际上做了什么?它会对你有用吗?首先,了解你的研究问题是什么,您拥有什么样的数据,以及你需要对数据做些什么来解决怎样的生物学问题。然后,可以开始调查哪些工具可以为你提供你所需的内容。
  2. 寻找能用的工具
    在Google上搜索你所需要进行的分析。在文献中搜索已完成你想要做的分析(该文献可能是应用该分析在不同的背景或物种中),了解他们用了什么工具?一般以好的高引用的论文为例。你不需要(也可能不应该)在这里花费大量时间,但是必须掌握文章中常用的分析工具,或者思考是否需要在管道中串联起来的几个工具实现你所需要的分析
  3. 查看工具,看看他们是否顺利运行
    检查他们的论文摘要或软件手册的介绍。该工具听起来会像你想要它做的那样吗?此时你可能会对某些内容进行排除,因为你发现它们是针对不同类型的数据集而设计的,或者不会产生能够回答你问题的结果。最好趁早发现这个,并减少浪费不必要的时间!
  4. 选择属于你的那个工具
    你可能从文献中发现,每个人都使用一种常用工具,或者可能有几种可供选择的工具看起来同样好。在这种情况下,基于测试的工具论文就很有用,其他人已经完成了艰苦的工作并尝试了相关的工具,并报告了每个工具的表现。同时这样论文也会突出一些你不常注意,不明显的缺点。如果还有很多其它选择,请选择一个好的工具并测试一下。
  5. 学习该工具
    如何自学一个工具可能存在一系列方法。从只运行它,看看会发生什么深入理解并阅读其算法。以我的经验,前者更容易做,通过输入输出你可以快速了解该工具的特性。对于后者呢除非你是程序员或统计学家,才能快速理解(学霸就跳过吧),否则任何人都会为后者烦恼。下面是我通常采用的学习新工具的方法:

  • 快速浏览该工具的文献如果该工具发表了,通过阅读它对应的文献你可以了解到它的应用量,对工具的功能及其工作原理有一个很好初步的认识。这也是一个机会,可以找出由于某种原因,该工具是否实际上不适合你需要做的分析,文章中会有所提及。
  • 跟着安装的流程
    安装好它,如果这从一开始安装就造成太多困难,你可能需要考虑一种替代工具,如果你有一些可供选择的话。
  • 跟着手册还有教程学习
    对于手册或者教程中的每个命令,我首先想要在markdown中写出来,记录我正在做的一切。接着检查命令的可用选项,看看是否有任何我应该更改的内容或者参数,但我的经验法则是,如果它没有意义,或者你不确定是否需要更改它,请将其保留为默认值。因为写这个工具的程序员可能选择了适合大多数情况的默认选项。同时我会在Markdown文档中记录下每一步的作用/为什么我要运行这一步。只有通过你的笔记理解每一步,你才能真正熟练运用一个工具。
  • 处理好报错的信息
    当你运行新的命令或者工具时,或多或少你都会遇到一些报错的信息。当你遇到错误时,最好当然是通过报错的提示,去解决该问题。如果解决不了,可以通过Google,看看其他人也遇到过该问题,或者还没能解决可以联系该工具的作者商讨解决办法。理解和解决错误消息本身就是一项有益于工具开发还提高你对该工具工作原理的理解的过程。
  • 检查结果
    查看文件生成的结果,看看是不是你所期望的。如果出现任何问题,请尝试并解决,输出文件是否有误?仅仅因为它在没有报出错误消息的情况下运行,并不意味着一切都正常工作。如果结果看起来不正确,请尝试另一个工具进行比较。

推荐阅读更多精彩内容

  • 文/向上 你走得那么匆匆, 你走得那么从容, 你走得那么伟大, 你走得那么高尚。 汩罗河的万顷烟波, 并不是送走你...
  • 1 看到这张照片的你,不知会作何感想,或许会不屑的说,“切,不就是个普通的不能再普通的中年妇...
  • 算一算,要還妳多少⋯ 你要還的是錢債?或是情債? 我從來也不記得我們的金錢往來,就你說了算 情債怎麼算???
  • 这个游戏跳出了很多感悟: 1、人就像弹簧被压的越低,跳的越远; 2、人生没有回头路,每一步都要深思熟虑; 3、步子...
  • 爱有很多种,每个人对爱有不同的定义……有的人爱自己胜过爱父母……有的人爱父母……有的人爱家庭……有的人爱工作……对...