240 发简信
  • 独处与自律

    前两天博士毕业了,看着自己17年写的一些学习笔记,感觉自己甚至没能完成“持续记录”这样简单的事,更谈何keep learning and gro...

  • 120
    NLTK中的条件概率分布

    产生一个文本,一般要基于一个已有的训练集,或者说是种子,来告诉程序词汇的分布以及用词习惯,下面是一个最为基础的文本产生函数,基于nltk的条件频...

  • 120
    自然语言处理的全景图

    最近一直在搞论文的理论背景,没有时间复习Python的的基础,不过这个月也加深了自己对于自然语言处理的一些理解,构建了一个比较全面的理论框架,在...

  • 说说Python中的pandas模块(2)

    上次说到了pandas中常用的一些选择以及切片的方法,总结一下,主要有以下几种: 有一点要注意:In pandas version 0.20.0...

  • 说说Python中的pandas模块(1)

    Pandas是Python中最常用的数据分析模块,其强大的数据读写性能,丰富的可视化工具,便捷的数据切片及索引功能让Pandas成为了一个Pyt...

  • 说说Python中的格式化操作符(%)

    今天去深圳浪了一圈,累到不行,本来想直接摸了,但是还是决定再睡前复习一下。那今天想说说Python中跟print一起出现的格式化操作符 什么是格...

  • 说说Python中最常见的数据类型list (2)

    昨天说完了list的几种切片方法,今天复习一下list的几种遍历方法。话不多说,直接上代码: 上面这种方法是我们比较常用的方法,但是有个问题,有...

  • 说说Python中最常见的数据类型list (1)

    Python中最为常见的数据类型就是列表list了,今天想说说list的一些基本操作以及遍历list的几种方法,也算顺带复习一下了。还是举栗说明...

  • 说说itertools模块里的combinations

    itertools基本是我用过的python内置模块里的top one,超级无敌好用,各种迭代器简直不要太六,仿佛nltk一般神奇。今天来温习一...