240 发简信
  • 120
    命名实体识别中的CRF层

    Bert+CRF 层 Bert把中文文本进行了embedding,得到每个字的表征向量 dense操作得到了每个文本文本对应的未归一化的tag概...

  • 120
    机器学习-特征工程基础

    一、特征处理 1.1 类别型特征类别型特征(Categorical Feature)主要是指性别(男、女)、血型(A、B、 AB、O)等只在有限...

    0.1 25 0 1
  • 120
    NLP中常用的集成学习方法

    1、Bagging方法 bagging方法采用的是一种个体学习器之间不存在强依赖关系、可同时生成的并行式结果的集成学习方法。 bagging方法...

    0.1 23 0 1
  • 120
    交叉熵损失函数和focal loss

    交叉熵 交叉熵是信息论中的一个重要概念,主要用于度量两个概率分布间的差异性。是分类问题中经常使用的一种损失函数。 一般使用交叉熵作为损失函数时,...

    0.3 55 0 3
  • NLP中简单的数据增强方法

    1、为什么要进行数据增强? 训练机器学习或深度学习模型时,良好的数据往往是影响模型的效果最重要的因素之一。而数据不足时数据增强是一个常用的方法。...

    0.1 46 0 1
  • 120
    Attention机制及代码实现

    什么是Attention机制? 本质上是目标语单词和源语单词之间的一种单词对齐机制。在NLP中最先出现的文章为:《Neural Machine ...

    0.1 33 0 1
  • Mac连接服务器及linux使用

    1、Mac电脑连接服务器 2、从Mac上传文件到服务器 3、从服务器下载文件到Mac中 4、查看服务器进程 5、杀死进程 6、复制文件 7、剪切...

  • 120
    逻辑回归(Logistic Regression)

    一、逻辑回归简介: 逻辑回归(LR)是一个广义的线性回归分析模型。常用于数据挖掘、疾病自动诊断及经济预测等领域。是机器学习的入门级算法。 优点:...

  • 120
    字节跳动算法实习面试

    两面字节跳动+openday面试经 达达 二面题目(部门技术面): 1、你知道这边是什么情况?之前面试官有跟你提起? 我们这边是做整个字节跳动的...

    0.9 322 0 6 1
个人介绍
哈工大计算机硕士研二在读。主研自然语言处理、机器学习和数据挖掘。兼做开发。找实习ing,求大佬内推