240 发简信
  • 120
    模型评估与选择

    泛化误差:学习器在新样本上的误差为泛化误差。显然,我们希望得到泛化误差小的学习器。 过拟合:学习器把训练样本学得‘太好’了的时候,很可能把训练样...

  • 对数据进行操作(增、删、改、查)

    1.FASTA/Q 利用seqkit对FASTA/Q格式的序列文件进行操作,使用说明和安装可以查看:seqkit #对文件进行简单的统计:seq...

  • 获取数据的来源

    获取序列信息的数据库有很多,首先介绍从NCBI获取数据: 想从NCBI上获取数据,学会使用Entrez是必不可少的!什么是Entrez? Ent...

  • 120
    本体论

    下面介绍一下基因功能富集分析的研究进展: 基因功能富集分析中的基因功能指的是众多代表一定的基因功能特征和生物过程的基因功能集,由这些基因功能集构...

  • grep基础命令选项

    grep命令选项: -v:过滤非匹配的字符集 -E:支持扩展的re -i:忽视大小写 -o:仅输出匹配的内容 -n:显示行号 -q:不输出任何信...

  • 文档查看与处理工具

    wc:word count,查看文件字数,行数与字节数(默认显示三项) -l:统计行数(含空行) -w:统计单词数 -c:统计bytes数(字节...

  • 基础正则表达式

    1.字符匹配: 1).:代表且只能代表任意一个字符。可以匹配空格,但不能匹配空行(当前目录,加载文件) 2)[abc]:匹配字符集合内任意一个字...

  • linux基础命令和相关帮助文档说明

    入门linux首先要学会查看帮助文档,了解帮助文档的结构,学会搜索,学会命令行的使用规范。 echo > .bash_history 清空终端历...

  • 对书中重复数据的相关笔记

    在数据重复章节中看到相关的讲解,特意用中文根据自己的理解翻译过来。 分析数据的作者为了重复数据而需要提供以下材料: 1.简要叙述如何进行分析 2...