岗位要求词云制作

获取岗位要求数据

在任一招聘网站上搜索相关职位,比如“技术支持”,会得到一个职位列表。进入每一个职位,均会有相应的“岗位要求”,有的名称不一样,但含义一样,可能叫做“任职要求”、“任职资格”等。

新建一个文本文档,叫做 技术支持岗位要求.txt,将整段“岗位要求”的内容拷贝到该文档中。更换职位,重复同样的操作,将新职位的“岗位要求”添加到文档下方。获取越多的“岗位要求”数据越好。

最后,在 技术支持岗位要求.txt 中保存了我们搜集的原始素材。

制作词云

网上词云工具非常多,随便选择一个即可,操作都比较相似。我选择了一个词云叫做 图悦。将 技术支持岗位要求.txt 中的内容拷贝到左侧文本框中,点击“分析出图”,则自动生成词云:

图悦词云.jpg

词云原理

词云的输入是一段文字,输出是各种关键字,不同权重的关键字以不同的大小、颜色进行区分。

词云内部做了两件事,第一件是“分词”,目前市面上用得比较多的叫 结巴分词,将一大段文字变成多个词组。第二件事是统计每个词组出现的频率,频率高的用较大的字号显示,频率低的用较小的字号显示,词云中只显示排名前 N 位的关键词组。

通过词云,我们实际上完成了一次大数据统计。当样本足够多的时候,我们得到的关键词组越可靠,这些词组实际上代表了我们应当注重的技能。

推荐阅读更多精彩内容