240 发简信
IP属地:北京
  • Resize,w 360,h 240
    社区发现算法-Louvain

    简介 Louvain算法[1]是一种基于多层次优化Modularity[2]的算法,它的优点是快速、准确,被[3]认为是性能最好的社区发现算法之...

  • Resize,w 360,h 240
    社区发现算法-局部拓展

    简介 局部拓展的方法是社区发现中的一大类方法,并且现在也比较活跃。这些方法的一个基本的假设就是社区是围绕着一些中心结点形成的,它们一般都是向当前...

  • Resize,w 360,h 240
    社区发现算法-GN

    社区发现 GN算法 参考文献 Community structure in social and biological networks Fin...

  • 社区发现算法-标签传播

    简介 基本的标签传播算法(LPA)[1]的思想非常简单,就是让每个结点与它的大多数邻居在同一个社区中。具体算法流程为:初始化,每个结点携带一个唯...

  • 社区发现算法-团渗透

    简介 k-团渗透算法(CPM)[1]是第一个能够发现重叠社区的算法,重叠社区指的是结点可以同时属于多个社区。重叠社区在社交网络中是十分常见的,因...

  • Resize,w 360,h 240
    频繁模式挖掘

    简介 关于频繁模式挖掘的一个经典例子应该就是"啤酒和尿布"了,虽然看到很多人都说这个是编造的,但是也不妨碍用它来说明频繁模式挖掘到底是干什么的。...

  • 聚类算法-DBSCAN

    简介 相关定义 Eps近邻:数据p的Eps近邻指的是那些与其距离小于Eps的数据 核心数据点:那些Eps近邻数量大于MinPts的数据点 直接密...

  • Spark Sql中的window函数

    ** 简介 **  在使用spark sql的时候经常会计算一些汇聚特征,比如一个卖家在一段时间的销售总额,对于这种汇聚后返回单值的需求通过gr...

  • Graphx中处理字符串类型的ID

      Graphx中的结点ID只能是Long型的,但是在实际的业务中有时会遇到字符串类型的ID,这时需要建立一个结点ID的映射。 使用python...