240 发简信
IP属地:上海
  • 图像数据处理

    Opencv是处理计算机视觉任务中最常用的工具包,它的底层是采用C++语言编写的,同时提供python接口。这样既实现了运算效率高的特性,也实现...

  • 词向量构造 - Tf-idf模型

    前面我们总结过词袋模型,词袋模型将文本中所有不重复的词看作一个集合,然后对文本中的每句话进行编码。在句子中对于出现的词标记为1,未出现的词标记为...

  • 词向量构造 - 词袋模型

    对于机器学习任务而言,不管是什么类型的数据(语言,声音,图像,视频),都必须转化为数值型数据,一般均为向量或者矩阵。自然语言处理,经过了一个长期...

  • 汉语词频统计

    该案例以党的十九大报告为例,统计报告中各个词语出现的频率。总体步骤为读入文本,分词,词频统计。通过观察词语频率最高的几个词,我们就可以大致了解这...

  • 英文词频统计

    该案例以莎士比亚的四大悲剧之一《哈姆雷特》为例,来统计该文章中的词语出现的频率。总体的步骤为读入文本,大小写转换,特殊字符转换,分词,词频统计,...

  • 第一节:Jieba分词

    在我们的日常工作与学习当中,最常用的两种语言就是汉语和英语了。在做文本分析的时候,第一步都是分词。在英语文章中,每个词都是天然的用空格分开的,所...

  • 员工离职预测

    1.项目目标 在任何一家企业里,员工队伍的稳定性对于企业的发展都非常的重要。所以通过模型预测员工离职的价值就日益凸显出来了,该模型可以大大地提高...

  • Resize,w 360,h 240
    自然语言处理概述(Natural Language Process)

    近年来,人工智能逐渐成为了当前社会最热门的行业之一,也逐渐的进入了寻常百姓家。比如我们熟知的AlphaGo击败韩国围棋冠军李世石,小米的语音助手...

  • Resize,w 360,h 240
    科比职业生涯数据集分析

    1.项目目标 通过分析科比职业生涯比赛的相关数据,掌握Numpy, Pandas, Matplotlib, Seaborn等常用数据分析库的用法...