biotar 学习笔记(2-2)--- 环境配置、数据的重复性

biotar 学习笔记(2-2)--- 环境配置、数据的重复性

系统安装完毕了,就存在进行软件的安装。

对于linux来说,主要包括三种软件安装方式:

  1. 绿色软件,解压可用。
  2. 源代码的文件,需要编译。
  3. 使用系统软件商店或者叫镜像也行。

当然前两种方式对于大多数人来说,都是比较麻烦的,有没有像第三种方式一样能把大部分软件通过一句命令就能安装呢?答案是有的,那就conda。这个的总结洲更班长总结的已经很完善。

洲更conda笔记三部曲

  1. 世上没有白走的路,每一步都算数

  2. 生信软件的好帮手-bioconda

  3. 什么,你嫌bioconda下载速度太慢?

配置可重复性。

这个是最近才有的体会,比如说你有好几个电脑都想有相同分析环境,这个不免会把有的软件可能会重新装一遍.

  1. 那么这个时候,最好是不要去乱去重新一个新的文件夹。比如说在电脑1上使用biosoft文件夹来装软件,那么在电脑2上也请用biosoft文件夹,因为的记录一次的安装代码可以随意的重复使用。
  2. 请善待路径中的~,你会喜欢上它的。
  3. 如果是联网的电脑,一个软件安装脚本就可以帮你搞定一台新的电脑的配置。
  4. 当然环境的移植,conda也可以,或者还有其他的方式,有待发掘。

数据的重复性

我的理解有以下几点:

  1. 生信的学习必经之路,这个就跟我们做完题,会去对一对标准答案一样的。
  2. 数据的重复,必须基于的是软件及其版本一致,基因版本,注释文件版本和数据库版本一致。
  3. 测序的数据不应该一次用完就抛在一边,那样太可惜了,因为数据库在更新,以及联合分析多篇文章的数据都可能有新的科学发现。

推荐阅读更多精彩内容