240 投稿
收录了76篇文章 · 8人关注
  • Pandas实现Hive中的窗口函数

    1、Hive窗口函数 我们先来介绍一下Hive中几个常见的窗口函数,row_number(),lag()和lead()。 row_number(...

  • Resize,w 360,h 240
    利用Python进行数据分析(6)- 时间序列基础

    Python-for-data-时间序列、频率和移位 本文中主要介绍的是pandas中时间序列基础、日期生成及选择、频率和移位等。 时间序列基础...

  • Resize,w 360,h 240
    利用Python进行数据分析(7)-时区处理

    contents 时区处理 很多时间用户选择世界协调时间或者UTC,它是格林治时间的后继者,目前的国家标准。时区通常表示为UTC的偏置。 Pyt...

  • Resize,w 360,h 240
    可视化D3.js库(3)-深入理解update、enter、exit

    重要性 Update、Enter、Exit是D3.js中十分重要且关键的3个概念。它们三主要处理的是数据集个数和选择集个数之间的匹配问题。 图解...

  • Resize,w 360,h 240
    可视化系列(1)-我的半年Flag💪

    从今天开始我准备写一个系列的博客,题目取为《最流行的14款数据可视化库/工具》。下面的可视化库主要是用来作图展示。一图胜千言,让我们用图说话 计...

  • Resize,w 360,h 240
    kaggle案例2-songs of top50

    kaggle-top50 top50的数据是kaggle官网上关于一个音乐的数据集。 There are 50 songs and 13 var...

  • 使用sklearn来实现决策树建模

    本文中讲解的是使用sklearn实现决策树及其建模过程,包含 数据的清洗和数据分离train_test_split 采用不同的指标,基尼系数或者...

  • Resize,w 360,h 240
    机器学习数据神器-UCI

    很多人现在开始选择人工智能或者机器学习,但是让初学者发愁的是:我们怎么去获得大量的数据来进行学习了?下面介绍一个机器学习领域的数据神器 UCI机...

    3.1 皮皮大 0 12
  • Resize,w 360,h 240
    西瓜书第4章-决策树详解

    从西瓜书和统计学习方法中学习了决策树的相关知识,同时在网上查找了树的知识点,最重要的是二叉树和树3种的遍历方式 树的知识 决策树 剪枝问题 im...

  • Resize,w 360,h 240
    Titanic泰坦尼克——kaggle赛题

    本文中最重要的是学习到了如何进行特征工程的处理,其他内容还有 中位数填充缺失值 将数据中的字符串改成数值型 建模过程 导入相关库 查看数据信息及...

专题公告

Python实现各种算法