• 120
    流畅的Python_字典和集合

    • Python 里的 dict 和 set 的效率有多高? 在一个有 1000 万个键的字典里查找 1000 个数,花在每个数上的时间不过是 ...

  • 120
    流畅的Python_数据结构_序列构成的数组

    容器序列 list、tuple 和 collections.deque 这些序列能存放不同类型的数据。 扁平序列 str、bytes、bytea...

  • 120
  • 120
    高维数据的异常检测

    5、练习 1.使用PyOD库生成toy example并调用feature bagging 2.使用PyOD库生成toy example并调用I...

  • 120
    论⽂种类分类

    4.1 任务说明 学习主题:论⽂分类(数据建模任务),利⽤已有数据建模,对新论⽂进⾏类别分类; 学习内容:使⽤论⽂标题完成类别分类; 学习成果:...

  • 120
    基于相似度的⽅法

    1、概述 异常”通常是⼀个主观的判断,什么样的数据被认为是“异常”的,需要结合业务背景和环境来具体分析确定。实际上,数据通常嵌⼊在⼤量的噪声中,...

  • 120
    论⽂代码统计

    正则表达式 正则表达式(regular expression)描述了⼀种字符串匹配的模式(pattern),可以⽤来检查⼀个串是否含有某种⼦串、...

  • 120
    线性模型

    真实数据集中不同维度的数据通常具有⾼度的相关性,这是因为不同的属性往往是由相同的基础过程以密切相关的⽅式产⽣的。在古典统计学中,这被称为——回归...

  • 120
    论⽂作者统计

    任务主题:论⽂作者统计,统计所有论⽂作者出现评率Top10的姓名; 任务内容:论⽂作者的统计、使⽤ Pandas 读取数据并使⽤字符串操作; 任...