概述 本课程作业主要借助python工具,实现了N-gram分词中的Unigram和Bigram分词器,并将前向最大切词FMM和后向最大切词的结...
1. BP神经网络 神经网络 又称多层感知机,主要包括前馈和反向传播算法,对不同的任务,构建包含不同单元数的隐含层,融合合适的激活函数(Sigm...
1. 前言 本文翻译自《Attention?Attention!》博客 最近几年,注意力——在深度学习社区中,已然成为最广为流行的概念和实用工具...
1. FastText FastText是facebook开源的一款集word2vec、文本分类等一体的机器学习训练工具。在之前的论文中,作者用...
1. 如何理解kNN中的k的取值? Ans :①选取较小的k值时,相当于用较小的领域中的训练实例进行预测,“学习”近似误差会减小,只有与输入实例...
1. LR为什么可以用来做CTR预估? Ans:若把点击的样本作为正例,未点击的样本作为负例,则样本的CTR就是样本为正例的概率,LR可以输出样...
1. 前言 准备中期答辩,补充了一个实验,需要对网络结构中的attention层进行可视化,观察序列输入的哪些词或者词组合是网络比较care的...
1. L1范数和L2范数的区别是什么? Ans:①L1范数——指向量中各个元素的绝对值之和,又叫“稀疏规则算子”(Lasso regulariz...
循环列表 约瑟夫环问题 核心步骤: 建立一个具有n个链节点、无头节点的循环链表 确定第一个报数人的位置 不断地从链表中删除链节点,直到链表为空 ...