jupyter-notebook解决中文乱码

进入jupyter-notebook的安装环境

cd /opt/Jupyter-Notebook/notebook-6.4.0

打开python虚拟环境(这里有autoenv自动打开,但是本质上依然要打开python的env环境)

source /opt/Jupyter-Notebook/env/bin/activate

检查有没有指定的包

pip list|grep matplotlib

如果有的话继续下一步

打开ipython

root@jupyter-notebook-1 notebook-6.4.0 # ipython
Python 3.7.9 (default, Jun 20 2021, 18:28:19) 
Type 'copyright', 'credits' or 'license' for more information
IPython 7.24.1 -- An enhanced Interactive Python. Type '?' for help.

In [1]: import matplotlib
(1号位解释说明)
Duplicate key in file PosixPath('/opt/Jupyter-Notebook/env/lib/python3.7/site-packages/matplotlib/mpl-data/matplotlibrc'), line 258 ('font.family:  sans-serif')
Duplicate key in file PosixPath('/opt/Jupyter-Notebook/env/lib/python3.7/site-packages/matplotlib/mpl-data/matplotlibrc'), line 266 ('font.serif:      DejaVu Serif, Bitstream Vera Serif, Computer Modern Roman, New Century Schoolbook, Century Schoolbook L, Utopia, ITC Bookman, Bookman, Nimbus Roman No9 L, Times New Roman, Times, Palatino, Charter, serif')
Duplicate key in file PosixPath('/opt/Jupyter-Notebook/env/lib/python3.7/site-packages/matplotlib/mpl-data/matplotlibrc'), line 411 ('axes.unicode_minus: False  # use Unicode for the minus symbol rather than hyphen.  See')

In [2]: print(matplotlib.matplotlib_fname())
(2号位解释说明)
/opt/Jupyter-Notebook/env/lib/python3.7/site-packages/matplotlib/mpl-data/matplotlibrc

In [3]:

1号位说明:

这是一个python的常规报错,因为我在下文中修改指定文件的时候,选择的是复制一行而不是直接在原文上修改。因此这里报错:Duplicate key in file PosixPath
报错意思是:文件PosixPath中存在重复密钥

2号位说明:

这个位置就是matplotlib模块的安装位置,要记得env环境里的包安装位置与全局环境中的包安装位置是不同的,注意区分。

我们找到上文中的这个包安装位置之后,就可以开始进行下一步的操作了:

cd /opt/Jupyter-Notebook/env/lib/python3.7/site-packages/matplotlib/mpl-data/
ls 

drwxr-xr-x 5 root root  4096 Jun 20 18:52 fonts
drwxr-xr-x 2 root root  4096 Jun 20 18:52 images
-rw-r--r-- 1 root root 41012 Jul  1 12:15 matplotlibrc
drwxr-xr-x 2 root root  4096 Jun 20 18:52 plot_directive
drwxr-xr-x 3 root root  4096 Jun 20 18:52 sample_data
drwxr-xr-x 2 root root  4096 Jun 20 18:52 stylelib

进入指定的目录并下载中文字体文件:

cd /opt/Jupyter-Notebook/env/lib/python3.7/site-packages/matplotlib/mpl-data/fonts/ttf/

wget https://xxxxxxxxxxxxxxxxxxxx/bao/zabbix/simkai.ttf  (这个字体文件是以前处理zabbix上的图表中文化时用的中文字体文件,可以联系作者获取该字体)

字体加载好之后,然后修改matplotlib模块的全局配置文件

vim /opt/Jupyter-Notebook/env/lib/python3.7/site-packages/matplotlib/mpl-data/matplotlibrc

第一处修改:
找到 font.family ,然后去掉注释,不用做任何修改

第二处修改:
找到 font.sans-serif ,去掉注释之后,然后再他的值中添加simkai字体的名称。添加之后的内容如下:
font.sans-serif: simkai, DejaVu Sans, Bitstream Vera Sans, Computer Modern Sans Serif, Lucida Grande, Verdana, Geneva, Lucid, Arial, Helvetica, Avant Garde, sans-serif
(其中:simkai就是我们放在指定目录里的字体文件的名称)

第三处修改:
找到:axes.unicode_minus,去掉注释后,把他的值从True修改为False

最后保存这个文件

matplotlib模块的全局配置文件修改好之后,去查看:/usr/lib/systemd/system/jupyter_notebook.service 文件,这个文件中规定了该服务器的启动用户是谁,从下文中可以看到该服务的启动用户是root用户

[Unit]
Description=jupyter_notebook
After=network.target


[Service]
Type=simple
User=root
Group=root
LimitNOFILE=100000
LimitNPROC=100000
WorkingDirectory=/opt/demo/
ExecStart=/opt/Jupyter-Notebook/env/bin/python3 /opt/Jupyter-Notebook/env/bin/jupyter notebook --allow-root --ip=0.0.0.0 --port=8888
Restart=no


[Install]
WantedBy=multi-user.target

上文中,找到启动用户之后,去启动用户的根目录下找到matplotlib模块的缓存目录,直接删除这个缓存目录

cd /root/.cache/

rm -rf ./matplotlib

重启matplotlib的服务器

systemctl restart jupyter_notebook.service
systemctl status jupyter_notebook.service

此时再次运行一下上文中【打开iptyhon这个步骤,引用一下matplotlib模块】然后就可以看到用户的缓存目录中,又出现了新的matplotlib的缓存文件。然后打开这个缓存文件
(经过实际测试,重复上面的ipython这个步骤,好像不会生成缓存,只有必须在jupyter-notebook中调用这个函数才会生成缓存)

vim /root/.cache/matplotlib/fontlist-v330.json

搜索关键字:simkai,可以看到这个字体的所有被解析出来的属性:
    {
      "fname": "fonts/ttf/simkai.ttf",
      "name": "KaiTi",
      "style": "normal",
      "variant": "normal",
      "weight": 400,
      "stretch": "normal",
      "size": "scalable",
      "__class__": "FontEntry"
    },

此时注意一下name这个属性,这就是后面python代码执行时,需要引用的字体名称。

到此为止全局配置文件算是搞完了。

测试内容如下:

打开jupyter-notebook,粘贴输入以下代码:

import matplotlib as plt
import seaborn as sns
import pandas as pd

tongji = pd.read_csv('tongji.csv')
sns.set_context({"figure.figsize": (16, 9)})
sns.set_style({'font.sans-serif': 'KaiTi'})
plt.rcParams['font.sans-serif'] = ['KaiTi']
sns.barplot(data=tongji, x=douyin.category, y=douyin.fans)

最后就会得到一张包含中文字体的图片,如下图所示:


image.jpeg

推荐阅读更多精彩内容