• 编辑距离

    https://leetcode-cn.com/problems/edit-distance/description/ 思路如下: 计算编辑距离...

  • 120
    spark-Streaming

    总结一下,避免后面再重复踩坑。 Spark Streaming是近实时(near real time)的小批处理系统, 可以对接各类消息中间或者...

  • Hive 分区/分桶

    分区/桶 Hive 分区 Hive的分区方式:由于Hive实际上是数据文件在HDFS存在的目录区分分区字段是虚拟列 一个表可以拥有一个或者多个分...

  • neo4j - 交互

    python-api https://neo4j.com/developer/language-guides/#bolt-python Java...

  • ZooKeeper命令

    http://blog.csdn.net/woshiwanxin102213/article/details/18305805 ZooKeepe...

  • kafka命令行

    参考:https://www.cnblogs.com/honeybee/p/5258906.html 创建: step1 启动zookeeper...

  • 字典树

    需求: 判断文本中是否包含某个词, 以及词频问题:中文分词实际使用的词典往往在几十万个词以上,逐个匹配成本太大。方案:Hash散列表 + 链表解...

  • neo4j - 基本操作

    图形数据库: 存储 查询/遍历 多个连接数据 Neo4j是一个嵌入式的、基于磁盘的、具备完全的事务特性的Java持久化引擎,但是它将结构化数据存...