科技赋能创作星辰,简书分析工具集 JRT 发布

我们一直在想,当简书的一切都可以数据化,晦涩难懂的术语变为一张张图表,展现着创作背后的法则......

当复杂的数据获取过程简化成一个函数调用,一行代码,一百毫秒......

那会是一个怎样的简书?

当所有创作者都懂钻贝,都知道最佳的发文时间,都会使用 Markdown......

当大家对简书的印象,从一个引入区块链的创作社区,到一个数据驱动、面向未来的文字内容分发平台......

那一天,何时到来?

也许是下一秒,也可能是十年后。

但在无限长的时间维度上,这一梦想终将实现。

而这一切,需要一套基础设施体系。

这套体系需要足够简单,但也要足够强大:简单到任何人都可以使用,强大到作为平台建设的地基。

现在,这套工具来了。

基于 Python,核心代码 800 行,近一个月时间开发,100 次代码提交,7 个测试版本。

这就是 Jianshu-Research-Tools,一个简书数据第三方库。

能干什么

最简单的,获取用户昵称,一行代码。

jrt.GetUserName("https://www.jianshu.com/u/ea36c8d8aa30")

进阶一点的,获取用户徽章列表,一行代码。

jrt.GetUserBadgesList("https://www.jianshu.com/u/ea36c8d8aa30")

再复杂一点,获取资产排行榜信息,一行代码。

jrt.GetAssetsRankList(start = 1)

很复杂的,获取文章内容,一行代码。

jrt.GetArticleHtml("https://www.jianshu.com/p/af3e575db7af")

结合数据分析库 Pandas,获取资产排行榜中前十万名用户的信息:

资产排行榜数据

结合图表库 Mathplotlib,生成前 300 名用户的资产量条形图:

资产条形图

结合可视化库 Dash,构建交互式图表:

交互式图表

怎么实现的

JRT 基于 Python 生态中优秀的网络请求库 Requests 和 HTML 解析库 BeautifulSoup 开发。

数据全部来源于网页内容解析和简书的公开接口。

其实,简书网页中的很多内容都是通过接口请求的,再通过脚本渲染出来。

例如,这是当你下滑一个用户的文章列表时,获取新文章信息的请求:

加载新文章请求

看到红圈的内容了吗?这就是数据的来源。

简书网页所做的,只是去请求这个接口,拿到返回数据,再稍加处理呈现给用户。

而 JRT 也是这样做的,只不过它处理数据是为了便于分析,而不是显示到网页上。

怎么用

我有 Python 开发基础

执行命令,安装 JRT:

pip install JianshuResearchTools

导入库:

import JianshuResearchTools as jrt

之后,你就可以使用 JRT 的所有功能了。

除了上面演示的接口,JRT 还支持获取用户基础信息、用户资产信息、文章基础信息、贝壳小岛信息等。

我没有 Python 开发基础

这是一个面向进阶用户的库,如果您没有编程基础,使用将会比较困难。

但这并不意味着您无法使用这个工具。我们会在近期推出基于这个库的服务,供普通用户使用。

例如:

  • 每天向您推送贝价信息
  • 在文章上榜时收到提醒
  • 一键生成用户分析报告

敬请关注。

遇到问题怎么办

面向开发者的反馈渠道

访问 JRT 的 GitHub 项目主页,新建一个 Issues,等待我们处理。

当然,如果您有充足的经验,也可以直接修改源代码。如果修复了问题,希望您向我们提交 Pull Request,帮助我们完善这个工具。

面向普通用户的反馈渠道

请简信初心不变_叶子,说明您遇到的问题。反馈时请尽量附上程序源代码和报错信息,方便我们定位问题。

这个工具只是一个开始,未来,必将是星光闪亮。

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 158,736评论 4 362
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 67,167评论 1 291
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 108,442评论 0 243
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 43,902评论 0 204
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 52,302评论 3 287
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 40,573评论 1 216
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 31,847评论 2 312
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 30,562评论 0 197
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 34,260评论 1 241
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 30,531评论 2 245
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 32,021评论 1 258
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 28,367评论 2 253
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 33,016评论 3 235
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 26,068评论 0 8
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 26,827评论 0 194
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 35,610评论 2 274
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 35,514评论 2 269

推荐阅读更多精彩内容