python+itchat 爬取微信好友信息

项目环境

语言:Python3
编辑器:Pycharm
导包:matplotlib、numpy、wordCloud、PIL、jieba、itchat

前言

近朱者赤,近墨者黑。微信已成为我们生活中必不可少的通讯社交工具,朋友圈一个分享我们生活的平台,接下来先拿我的微信好友开刀,一起看看我们的圈子里都有哪些有趣的事。

爬取性别

itchat.get_friends() 返回完整的好友列表,每个好友为一个字典, 其中第一项为本人的账号信息;传入 update=True, 将更新好友列表并返回。sex=1为男性,sex=2为女性。其他的就是没填性别的。

def draw_sex():
    itchat.login()
    text = dict()
    friends = itchat.get_friends(update=True)[0:]
    male = "male"
    female = "female"
    other = "other"
    for i in friends[1:]:
        sex = i['Sex']
        if sex == 1:
            text[male] = text.get(male, 0) + 1
        elif sex == 2:
            text[female] = text.get(female, 0) + 1
        else:
            text[other] = text.get(other, 0) + 1
    for key in text.keys():
        plt.bar(key, text[key])
    plt.xlabel('sex')
    plt.ylabel('rate')
    plt.title("Gender histogram")
    plt.savefig("sex.png")  # 保存图片
    plt.ion()
    plt.pause(5)
    plt.close()  # 图片显示5s,之后关闭

在代码里通过一个 for 循环,把获取到的数据通过 for 循环保存到 text 字典里。然后再通过 plt 库函数画出性别柱状图。

生成签名的词云图

1.获取好友签名信息

Signature字段是好友的签名,在这里使用的是结巴分词,将签名尽可能的分成更多的词,将其保存到sign.txt文件中,由于有些签名包含一些表情,抓取会变成 emoji、span、class 等等这些无关的词,将这些含有特殊符号的替换掉。

def get_signature():
    itchat.login()
    siglist = []
    friends = itchat.get_friends(update=True)[1:]
    for i in friends:
        signature = i["Signature"].strip().replace("span", "").replace("class", "").replace("emoji", "")
        rep = re.compile("1f\d+\w*|[<>/=]")
        signature = rep.sub("", signature)
        siglist.append(signature)
    text = "".join(siglist)
    with io.open('sign.txt', 'a', encoding='utf-8') as f:
        signature_list = jieba.cut(text, cut_all=True)# 全模式,把文本分成尽可能多的词
        signature_space_split = " ".join(signature_list)
        f.write(signature_space_split)
        f.close()

2.绘制词云图

使用wordcloud生成词云图,读取sign.txt中的签名词,选择一张背景图china.jpg,代码如下:

def draw_word_cloud():
    text = open(u'sign.txt', encoding='utf-8').read()
    coloring = np.array(Image.open('china.jpg'))
    wordcloud = WordCloud(
        # 设置背景颜色
        background_color="white",
        # 设置最大显示的词云数
        max_words=2000,
        mask=coloring,
        # 设置字体最大值
        max_font_size=60,
        # 设置有多少种随机生成状态,即有多少种配色方案
        random_state=42,
        scale=2,
        # 这种字体都在电脑字体中,window在C:\Windows\Fonts\下,
        font_path='C:/Windows/Fonts/simkai.ttf').generate(text)
    image_colors = ImageColorGenerator(coloring)
    plt.imshow(wordcloud.recolor(color_func=image_colors))
    plt.imshow(wordcloud)
    plt.axis("off")
    plt.show()
    wordcloud.to_file('signature.png')  # 把词云保存下

微信好友头像拼接图

1.获取好友图像

获取好友信息,get_head_img拿到每个好友的头像,在同目录下新建了文件夹img用于保存好友图像,根据下标i命名头像。

def get_head_img():
    itchat.login()
    friends = itchat.get_friends(update=True)
    for i, f in enumerate(friends):
        # 根据userName获取头像
        img = itchat.get_head_img(userName=f["UserName"])
        imgFile = open("img/" + str(i) + ".jpg", "wb")
        imgFile.write(img)
        imgFile.close()

2.好友图像拼接

遍历img文件夹的图片,用640*640的大图来平均分每一张头像,计算出每张正方形小图的长宽,压缩头像,拼接图片,一行排满,换行拼接,具体代码如下:

# 头像拼接图
def create_img():
    x = 0
    y = 0
    imgs = os.listdir("img")
    # random.shuffle(imgs)将图片顺序打乱,
    random.shuffle(imgs)
    # 创建640*640的图片用于填充各小图片
    total_img = Image.new('RGBA', (640, 640))
    # math.sqrt()开平方根计算每张小图片的宽高,
    width = int(np.math.sqrt(640 * 640 / len(imgs)))
    # 每行图片数
    row_num = int(640 / width)

    for i in imgs:
        try:
            img = Image.open("img/" + i)
            # 缩小图片
            img = img.resize((width, width), Image.ANTIALIAS)
            # 拼接图片,一行排满,换行拼接
            total_img.paste(img, (x * width, y * width))
            x += 1
            if x >= row_num:
                x = 0
                y += 1
        except IOError:
            print("img/ %s can not open" % (i))
    total_img.save("result.png")

效果图

sex.png

signature.png

result.png

更多内容欢迎大家关注
二维码.jpg

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 157,298评论 4 360
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 66,701评论 1 290
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 107,078评论 0 237
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 43,687评论 0 202
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 52,018评论 3 286
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 40,410评论 1 211
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 31,729评论 2 310
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 30,412评论 0 194
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 34,124评论 1 239
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 30,379评论 2 242
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 31,903评论 1 257
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 28,268评论 2 251
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 32,894评论 3 233
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 26,014评论 0 8
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 26,770评论 0 192
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 35,435评论 2 269
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 35,312评论 2 260

推荐阅读更多精彩内容