240 发简信
IP属地:广东
  • Resize,w 360,h 240
    基于Gensim的文本相似度计算

    Gensim是一个Python的自然语言处理库,所用到的算法,如TF-IDF(Term Frequency–Inverse Document F...

  • Resize,w 360,h 240
    AlexNet在猫狗识别中的应用

    最近倒腾了许多CNN的实验,有人问这些实验大把大把啊,做完就算了,为什么要写总结。其实在我看来,我们做实验也只是不断复现大牛的网络,我们会花更长...

  • 上市公司历史新闻数据分析(二)

    今天小编打算补充一下上一篇上市公司历史新闻数据分析(一)的部分内容,以及进一步阐述如何利用SVM和RandomForest做文本分类及效果对比。...

  • VGGNet19在猫狗识别中的应用

    我们先来对比一下AlexNet和VGGNet。AlexNet整个网络结构包括五层卷积层和三层全连接层。而VGGNet的结构上来看,有更多的输出c...

  • Resize,w 360,h 240
    上市公司历史新闻数据分析(一)

    上一篇讲到如何爬取新浪财经和每经网新闻数据,今天分享一下小编如何分析数据。在分词上,小编用了jieba分词类库,但只是利用jieba的词库来分,...

  • Resize,w 360,h 240
    抓取上市公司历史新闻数据

    最近一周在钻研如何利用新闻数据进行量化投资,在正式进行文本挖掘以及开发策略前,首当其冲的当然要准备好数据。“网络爬虫”、“数据抓取”这样字...

  • Consumer Persona based on Clustering Algorithms

    Hello everyone, it's been a while not updating my papers, cause I have c...

  • Resize,w 360,h 240
    BPTT推导以及基于LSTM的MNIST手写数字识别实验

    BPTT(Back PropagationThough Time)公式推导 由于RNN被广泛应用于序列标注问题(SequenceLabelin...

  • Mean-Shift和K-Means结合的实践

    我们谈及数据挖掘,无非是“分类”,“关联”,“聚类”,“异常值检验”等。今天我想聊聊对聚类的认识,以及基于密度聚类下生成的初始化簇心与K-Mea...