240 发简信
  • Python自用工具包PyTls

    我们搞了个python的工具包PyTls。 做这件事的初衷是发生了一个星期要用python同时开发3个项目的情况,我发现了两个现象:1.有很多定...

  • 语音转译文本后的意图识别(YMMNlpUtils)

    上个月由于业务需要定制化了一个中文语境下的手机号码识别库YMMNlpUtils DEMO解析 Github地址 现在由于业务需求,又新增了一个语...

  • Python踩坑指南(第二季)

    本期围绕jieba讲一个我遇到的实际问题,在同一个服务里,存在两个不同接口A和B,都用到了jieba分词,区别在于两者需要调用不同的词库,巧合中...

  • 数据结构

    我一直觉得算法工程师,两把刷子,过硬的算法基础知识,可靠的代码工程能力即可; 最近和一些老朋友交流了一下,发现理想很丰满,现实很残酷,在自己觉得...

  • Python踩坑指南(第一季)

    最近在python开发的过程中,发现了一些比较有意思的问题,确实让自己在开发过程中被恶心了一把,所以开了这个连续的更新博文,之后会持续的按第一第...

  • 中文语境下的手机号识别

    最近在做一个关于中文大段文本中的手机号码识别,由于属于对抗性的一个文本,发现传统的手机号码识别方法,比如正则匹配并不是很适用。 理论情况下文本中...

  • 120
    PKUseg在货运领域的评测

    先说结论,再和大家闲聊,对比jieba与PKUseg在公路货运切词能力上: 默认模型下,jieba效果优于PKUseg PKUseg提供场景精细...

  • pandas数据读取的问题记录

    最近发现pandas的一个问题,记录一下:有一组数据(test.txt)如下: 剖析出来看,数据是按照\t进行分隔的:'20181016\t14...

  • YoutubeNet的数据答疑

    实在是太忙了,抽空给大家解析一下之前写的YoutubeNet的数据是怎么构造的,协助大家可以自行构造一下。 这边和大家说一下,我没有上传数据的原...