240 发简信
  • Elasticsearch搜索中文分词优化

    Elasticsearch 中文搜索时遇到几个问题: 当搜索关键词如:“人民币”时,如果分词将“人民币”分成“人”,“民”,“币”三个单字,那么...

  • 120
    Xgboost原理及推导

    Xgboost无论是工业界还是kaggle比赛效果都很好,学习过程中看了很多博客依然理解的不是很好,自己比较菜,看了陈天奇大神PPT清晰了很多,...

    4.2 2253 0 16
  • 风控系统资料

    最近开始做风控系统,搜集了一些风控和web安全方面的资料,一来分享给大家,也方便自己查看。大家有好的资料也可以分享给我,整理完善,欢迎大神交流指...

    1.7 2627 1 15
  • 120
    Elasticsearch搜索Suggest功能优化

    搜索Suggest需要优化问题: 怎么优化Suggest词库,提升Suggest词准确率 怎么提高响应速度 suggest词库获取 冷启动可以从...

  • 120
    快速理解RNN(LSTM,GRU)结构原理

    1.RNN解决了什么问题? RNN主要用来解决序列问题,强调的是先后顺序,在NLP中引申出上下文的概念,一个翻译问题,这个词的含义可能和前后的单...

  • 120
    过拟合与欠拟合及方差偏差

    在模型的评估与调整的过程中,经常会遇到过拟合与欠拟合的情况,如何有效的识别过拟合和欠拟合现象,并了解其中原因,有效的对模型进行调整。 什么是过拟...

  • 120
    BM25和TFIDF原理及区别

    1,TF−IDF算法 TF是指归一化后的词频,IDF是指逆文档频率。给定一个文档集合D,有d1,d2,d3,......,dn∈D。文档集合总共...

  • linux常用命令集合(持续整理中)

    在 LINUX 命令平台输入 1-2 个字符后按 Tab 键会自动补全后面的部分(前提是要有这个东西,例如在装了 tomcat 的前提下, 输入...

  • 120
    神经网络中常见激活函数及特点

    从最开始的逻辑回归到后来的CNN,RNN,我们经常会听到激活函数这个词,也经常会听到sigmod函数会造成神经网络梯度消失,BN为什么能缓解梯度...