240 发简信
  • 机器学习_TF-IDF逆文本频率指数

    1. 原理  TF-IDF(term frequency–inverse document frequency)是信息处理和数据挖掘的重要算法,...

  • 120
    自动机器学习框架之三_Auto-Keras

     对于训练深度学习,设计神经网络结构是其中技术含高最高的任务,优秀的网络架构往往依赖建构模型的经验,专业领域知识,以及大量的算力试错。实际应用中...

  • 自动机器学习框架之二_AutoML

     Auto ML(Auto Machine Learning)自动机器学习是个宽泛的概念,有不只一个软件以此命名,本篇介绍的Auto-ML并非谷...

  • 自动机器学习框架之一_Auto-Sklearn

     当我们做完了特征工程之后,就可以代入模型训练和预测,对于模型的选择及调参,主要根据分析者的经验。在具体使用时,经常遇到同一批数据,同一种模型,...

  • 120
    TableOne数据分析工具

     前面学习了统计描述和统计假设的Python方法,分析数据表时,需要先确定因变量Y,然后对自变量X逐一分析,最后将结果组织成数据表作为输出,还是...

  • Stata中常用的数据分析命令

    1. 常用的数据分析工具  Stata、SPSS、SAS、R、Python,甚至Excel都可以做数据分析工作。R和Python是程序员的首选,...

  • Python写日志文件

     日志文件是记录程序操作及事件的记录文件或记录文件的集合。一般由程序开发人员编写,开发、运维人员共同使用,开发人员可以通过日志调试程序,运维人员...

    0.1 24 0 1
  • 120
    Seaborn多图组合

    1. jointplot 两变量图  数据分析中常用做图的方式实现相关性分析,即X轴设置为变量A,Y轴设置为变量B,做散点图,由于散点图中点的叠...

  • 半小时搞定Hadoop+Mysql+Hive+Python

    1. 说明  搭建过Hadoop集群的小伙伴一定知道,如果不用docker,半小时配好Hadoop+Mysql+Hive(后简称Hive)肯定是...