xlvector - 简书

IP属地：海南

从图片相似度学习图片的表示
很多时候带分类标注的图片样本是很难获得的，但是图片之间的相似度却不难获得。最简单的方式有几个：视频里相邻的帧是相似的。见论文Unsupervi...

0.1 8668 9 30 2
端到端的OCR：LSTM＋CTC的实现
前面提到了用CNN来做OCR。这篇文章介绍另一种做OCR的方法，就是通过LSTM＋CTC。这种方法的好处是他可以事先不用知道一共有几个字符需要识...

0.2 41619 50 23

Tensorflow 的NCE-Loss的实现和word2vec
这两天因为实现mxnet的nce-loss，因此研究了一下tensorflow的nce-loss的实现。所以总结一下。先看看tensorflo...

0.6 39016 9 18 1
端到端的OCR：基于CNN的实现
OCR是一个古老的问题。这里我们考虑一类特殊的OCR问题，就是验证码的识别。传统做验证码的识别，需要经过如下步骤：这里最难的就是分割。如果字符...

10283 5 13
word2vec/lstm on mxnet with NCE loss
Softmax是用来实现多类分类问题常见的损失函数。但如果类别特别多，softmax的效率就是个问题了。比如在word2vec里，每个词都是一个...

5828 2 7 2
基于DC/OS建立分布式机器学习系统
之前基于ps-lite实现了word2vec。下一步就是让这个算法能够分布式的跑起来。最简单的分布式方案大概是如下几步：把二进制文件copy到你...

1256 1 7
用Mxnet实现矩阵分解
在《关于LDA, pLSA, SVD, Word2Vec的一些看法》一文中我们提到了SVD的算法。之前TensorFlow刚出来时，就听说可以很...

4636 1 5

用CUDA实现一个稀疏的Logistic Regression
最近在研究Mxnet，准备从底层先尝试一遍GPU的编程，这样更容易熟悉mshadow的那部分逻辑。于是用CUDA尝试了一下写一个稀疏的Logis...

0.1 1878 2 5
离散特征和连续特征同时存在，同时解决回归和分类的问题
有些同学对于mxnet的自定义Iter不是很熟悉，对多输出也不熟悉，因此我用一个比较复杂的例子来说明这个问题：本着End-to-End的精神，...

7875 0 4