240 发简信
IP属地:上海
  • Resize,w 360,h 240
    用新词发现做关键词抽取

    新词发现是一个老生常谈的任务了,对怎么算“词”,有一个很好的比喻:怎样判断两个人是情侣?首先,我们得经常看到他们在一起,而不是今天看到A和B在一...

  • Resize,w 360,h 240
    pycorrector源码解读

    纠错广泛应用于诸如搜索的query分析等领域。 纠错思路如图。这里主要解读一下pycorrector源码。 先对文本预处理,切分句子,对句子de...

  • leetcode hot100

    1. Two Sum[https://leetcode-cn.com/problems/two-sum/] 字典(哈希表)解决法,开始犯了2个问...

  • Resize,w 360,h 240
    知识图谱泛谈

    最近做项目,接触到知识图谱,开始觉得很高大上,其实更多是一个概念和很多细枝末节的实践。引用书上的一种定义: 知识图谱包含了一堆互相关联的实体和属...

  • bert多标签分类实验

    好久没来更新,好惭愧,现在也没了当初做这个的心情,就大概记录一下吧。首先BERT模型是一个像word2vec这种的预训练模型,word2vec结...

  • 2019-03-22

    最近对“有多少人工就有多少智能”有了一些理解。虽然以前很鄙视这个话,觉得是说很多工程用人工的方法来包装成智能。现在对这句话有了更深的理解。最近做...

  • 电影推荐

    看过很多很多电影,个人风格偏向悬疑惊悚,故事性强的。将我看过且推荐的电影来分享一下,想到一个加一个,非常相似的会放一起,持续更新,排名不分先后。...

  • 利用pyspark实现基于用户的协同过滤的推荐

    假如有一些用户对物品的评分数据,怎么预测用户的喜好并给他推送感兴趣的物品呢?我们常常能想到的一种成熟方法就是协同过滤,这里只谈谈基于用户相似度的...

  • Resize,w 360,h 240
    深度学习情感分析

    用词向量加深度学习的方法做情感分析的基本思路是:1.训练词向量 2.句子预处理、分词,句子变成一个个词的序列,指定序列最大长度,多砍少补,词分配...