240 发简信
IP属地:上海
  • 技术积累

    数学基础 MCMC 采样 MCMC 采样 一、机器学习 1、无监督学习 聚类 Kmeans 聚类 降维 PCA 理论 PCA、LDA 算法 二、...

  • Resize,w 360,h 240
    DBSCAN 算法

    1、DBSCAN 算法由来 基于距离的聚类算法的聚类结果是球状的簇,当数据集中的聚类结果是非球状结构时,基于距离的聚类算法的聚类效果并不好。 与...

  • 基于情感词典的文本情感分析

    一、什么是情感分析 文本情感分析:是对带有情感色彩的主观性文本进行分析、处理、归纳和推理的过程。按照处理文本的类别不同,可分为: 基于新闻评论的...

  • NMF 算法

    带单词计数信息的文章矩阵,我们的目标是对这个矩阵进行因式分解,即:找到两个更小的矩阵,使得二者乘以得到原来的矩阵。这两个矩阵分别是特征矩阵和权重...

  • Resize,w 360,h 240
    处理英文文本数据

    1、词袋模型 分词 构建此表 编码 2、去除停用词 3、TF-IDF 缩放数据 4、逻辑回归模型系数 负系数属于负面评论的单词,正系数属于正面评...

  • 卷积神经网络

    一维卷积 门激活机制 残差机制:信息在双通道中的选择性流动 位置向量 膨胀 CNN,空洞 CNN。 https://spaces.ac.cn/a...

  • 训练技巧

    训练技巧 focal loss:解决类别不平衡、分类难度差异的问题,效果更好。 学习率下降 数据扩增找更多的标签数据一个句子重复拼接、随机去掉若...

  • 数据集收集

    1、英文情感分析数据 https://www.kaggle.com/rgupta09/world-cup-2018-tweets