chaaffff - 简书

IP属地：云南

词向量生成模型---word2vec
在各种大举深度学习大旗的公司中，Google公司无疑是旗举得最高的，口号喊得最响亮的那一个。2013年末，Google发布的word2vec工具...

0.5 16414 0 29
XGBoost参数调优完全指南（附Python代码）
xgboost入门非常经典的材料，虽然读起来比较吃力，但是会有很大的帮助：英文原文链接:https://www.analyticsvidhya...

0.4 4143 2 26

使用gensim和sklearn搭建一个文本分类器
总的来讲，一个完整的文本分类器主要由两个阶段，或者说两个部分组成：一是将文本向量化，将一个字符串转化成向量形式；二是传统的分类器，包括线性分类器...

5259 2 16
通俗、有逻辑的写一篇说下Xgboost的原理，供讨论参考
初看Xgboost，翻了多篇博客发现关于xgboost原理的描述实在难以忍受，缺乏逻辑性，写一篇供讨论。 ——以下是抛砖引玉。观其大略，而后深...

0.1 1740 0 8
从LSA/LSI潜在语义索引到LDA狄利克雷分布
一、LSA概论 1）LSA的引入 LSA(latent semanticanalysis)潜在语义分析，也被称为LSI(latentsemant...

0.2 3426 1 8
11款开放中文分词引擎大比拼
在逐渐步入DT（DataTechnology）时代的今天，自然语义分析技术越发不可或缺。对于我们每天打交道的中文来说，并没有类似英文空格的边界标...

0.1 809 0 7
基于 Gensim 的 Word2Vec 实践
模型创建 Gensim中 Word2Vec 模型的期望输入是进过分词的句子列表，即是某个二维数组。这里我们暂时使用 Python 内置的数组，不...

0.3 2087 0 5

LDA小改进（附源码）
首先通俗的解释下Topic模型LDA：假如我们需要写一篇关于新上市汽车的文章，首先需要确定文章大概的主题，比如要写这辆汽车的动力、外观、内饰。确...

1850 0 3
lightGBM原理、改进简述如何看待lightGBM
1. foreword TSA比赛中，开始整的LR，把原始特征one-hot处理后输入LR训练。过了段时间开始搞RF和XGB，再后面搞Light...

0.1 2709 0 2