我们来解决一下 matplotlib 的中文显示问题

0.24字数 973阅读 12690

用 matplotlib 绘制图表,默认设置下,是无法在图中正确显示中文的。原因无非两种,一种是字符编码不正确,一种是字体不支持中文。前一种情况总是发生在 Python 2 用户身上,解决方法是把字符转成 UTF-8。而 Python 3 统一使用 Unicode,不存在这个问题。

本文主要解决的是第二种问题:字体不支持中文。

背景知识

想快速解决问题可直接跳到步骤一,有不明白的地方再来阅读背景知识。

matplotlib 从配置文件 matplotlibrc 中读取配置,字体相关内容也在其中。matplotlib 依次在以下四个位置寻找配置文件:

  1. 当前工作目录下的 matplotlibrc
  2. $MATPLOTLIBRC/matplotlibrc
  3. 用户家目录下的 matplotlibrc。 如 Linux 一般在 ~/.config/matplotlib/matplotlibrc, macOS 在 ~/.matplotlib/matplotlibrc
  4. INSTALL/matplotlib/mpl-data/matplotlibrc,其中 INSTALL 指具体的安装目录。

详见官方文档。查询当前使用的 matplotlibrc 所在目录,可以用 get_configdir() 函数:

import matplotlib
matplotlib.get_configdir()

这里有一份配置文件示例可供下载。

阅读配置文件可以发现,matplotlib 默认使用的 font.familysans-serif,即无衬线字体,而无衬线字体又是从这几种字体中依次选用:

font.sans-serif : Bitstream Vera Sans, Lucida Grande, Verdana, Geneva, Lucid, Arial, Helvetica, Avant Garde, sans-serif

全是西文字体,没一个支持中文的。而且 matplotlib 对字体文件的格式也很挑剔,除了 .ttf 其他一概不认。比如 macOS Sierra 中的 Lucida Grande 是 .ttc 格式,即便按照顺位轮到它了,仍然会被跳过。

查询当前的 font.family

matplotlib.font_manager.FontProperties().get_family()

查询当前使用字体:

from matplotlib.font_manager import findfont, FontProperties
findfont(FontProperties(family=FontProperties().get_family()))

铺垫结束,我们利用上面的知识解决问题。


步骤一

Python 2 用户请先确认字符编码为 UTF-8。Python 3 用户直接跳过此步骤。

步骤二

寻找支持中文并且安装为 .ttf 格式的字体。

Windows 用户应该总能找到 SimHei.ttf。*nix 用户可以通过 fc-list 命令或者图形工具在当前系统内查询。如果不幸真没找到符合条件的,你就得自己去下载一个或者进行格式转换了。SimHei.ttf 应该很容易找到,然而其实是未获授权的。文泉驿微米黑是一种自由字体,推荐使用。

.ttc 转换为 .ttf,网上有不少在线或线下工具,可以自行搜索。

友情提示一句,请选择各种黑体作为图表中的字体,宋体放在图表中,丑死了。

步骤三

新安装的字体 matplotlib 一时不能找到,需要更新字体列表缓存。

如果你建立了 ~/.matplotlib/ 目录的话,应该会在其中找到 fontList.py3k.cache。在其中找到 Vera.ttf 的安装目录,把新安装的字体复制到该目录下。

删除 fontList.py3k.cache。matplotlib 下次启动时会重建缓存,新字体随之被添加。

步骤四

现在就要在程序中使用中文字体了。

首先,你得知道字体的英文名称,比如 SimHei.ttf 就叫 SimHei,文泉驿微米黑叫 WenQuanYi Micro Hei。

然后,你有两种方法告诉 matplotlib 使用这些字体:

  1. matplotlibrc 中,添加像这样的一行:
font.sans-serif : WenQuanYi Micro Hei, Bitstream Vera Sans, Lucida Grande, Verdana, Geneva, Lucid, Arial, Helvetica, Avant Garde, sans-serif

把中文字体作为第一顺序选用的字体。

  1. 在程序文件开头,指定字体:
import matplotlib
matplotlib.rcParams['font.sans-serif'] = 'WenQuanYi Micro Hei'

第2种方法很灵活,可以针对每个文件单独设置。如果使用第1种方法,建议把 matplotlibrc 放在当前工作目录下,不要作为全局配置。


好了,配置完成,效果如图:

推荐阅读更多精彩内容