240 发简信
IP属地:云南
  • Resize,w 360,h 240
    词向量生成模型---word2vec

    在各种大举深度学习大旗的公司中,Google公司无疑是旗举得最高的,口号喊得最响亮的那一个。2013年末,Google发布的word2vec工具...

  • Resize,w 360,h 240
    XGBoost参数调优完全指南(附Python代码)

    xgboost入门非常经典的材料,虽然读起来比较吃力,但是会有很大的帮助: 英文原文链接:https://www.analyticsvidhya...

    0.4 4143 2 26
  • Resize,w 360,h 240
    使用gensim和sklearn搭建一个文本分类器

    总的来讲,一个完整的文本分类器主要由两个阶段,或者说两个部分组成:一是将文本向量化,将一个字符串转化成向量形式;二是传统的分类器,包括线性分类器...

  • Resize,w 360,h 240
    通俗、有逻辑的写一篇说下Xgboost的原理,供讨论参考

    初看Xgboost,翻了多篇博客发现关于xgboost原理的描述实在难以忍受,缺乏逻辑性,写一篇供讨论。 ——以下是抛砖引玉。 观其大略,而后深...

  • Resize,w 360,h 240
    从LSA/LSI潜在语义索引到LDA狄利克雷分布

    一、LSA概论 1)LSA的引入 LSA(latent semanticanalysis)潜在语义分析,也被称为LSI(latentsemant...

  • Resize,w 360,h 240
    11款开放中文分词引擎大比拼

    在逐渐步入DT(DataTechnology)时代的今天,自然语义分析技术越发不可或缺。对于我们每天打交道的中文来说,并没有类似英文空格的边界标...

  • 基于 Gensim 的 Word2Vec 实践

    模型创建 Gensim中 Word2Vec 模型的期望输入是进过分词的句子列表,即是某个二维数组。这里我们暂时使用 Python 内置的数组,不...

  • LDA小改进(附源码)

    首先通俗的解释下Topic模型LDA:假如我们需要写一篇关于新上市汽车的文章,首先需要确定文章大概的主题,比如要写这辆汽车的动力、外观、内饰。确...

  • lightGBM原理、改进简述 如何看待lightGBM

    1. foreword TSA比赛中,开始整的LR,把原始特征one-hot处理后输入LR训练。过了段时间开始搞RF和XGB,再后面搞Light...