Python利用openpyxl来操作Excel(一)

转载自公众号:python_shequ

最近一直在做项目里的自动化的工作,为了是从繁琐重复的劳动中挣脱出来,把精力用在数据分析上。自动化方面python是在好不过了,不过既然要提交报表,
就不免要美观什么的。pandas虽然很强大,但是无法对Excel完全操作,现学vba有点来不及。于是就找到这个openpyxl包,用python来修改Excel,碍于水平有限,琢磨了两天,踩了不少坑,好在完成了自动化工作(以后起码多出来几个小时,美滋滋)。

在这里写下这两天的笔记和踩得坑,方面新手躲坑,也供自己日后查阅。如有问题,还请见谅并指出,多谢。

from openpyxl import load_workbook
from openpyxl.styles import colors, Font, Fill, NamedStyle
from openpyxl.styles import PatternFill, Border, Side, Alignment

# 加载文件
wb = load_workbook('./5a.xlsx')
  • workbook: 工作簿,一个excel文件包含多个sheet。

  • worksheet:工作表,一个workbook有多个,表名识别,如“sheet1”,“sheet2”等。

  • cell: 单元格,存储数据对象

文章所用表格为:

image

操作sheet

1# 读取sheetname
2print('输出文件所有工作表名:
', wb.sheetnames)
3ws = wb['5a']
4
5# 或者不知道名字时
6sheet_names = wb.sheetnames
7ws2 = wb[sheet_names[0]]    # index为0为第一张表
8print(ws is ws2)

输出文件所有工作表名:
['5a']
True

1# 修改sheetname
2
3ws.title = '5a_'
4print('修改sheetname:
', wb.sheetnames)

修改sheetname:
['5a_']

1# 创建新的sheet
2# 创建的新表必须要赋值给一个对象,不然只有名字但是没有实际的新表
3
4ws4 = wb.create_sheet(index=0, title='newsheet')
5# 什么参数都不写的话,默认插入到最后一个位置且名字为sheet,sheet1...按照顺序排列
6
7ws5 = wb.create_sheet()
8print('创建新的sheet:
', wb.sheetnames)

创建新的sheet:
['newsheet', '5a_', 'Sheet']

1# 删除sheet
2wb.remove(ws4)  # 这里只能写worksheet对象,不能写sheetname
3print('删除sheet:
', wb.sheetnames)

删除sheet:
['5a_', 'Sheet']

1# 修改sheet选项卡背景色,默认为白色,设置为RRGGBB模式
2ws.sheet_properties.tabColor = "FFA500"
3
4# 读取有效区域
5
6print('最大列数为:', ws.max_column)
7print('最大行数为:', ws.max_row)

最大列数为: 5
最大行数为: 17

1# 插入行和列
2ws.insert_rows(1)  # 在第一行插入一行
3ws.insert_cols(2, 4)  # 从第二列开始插入四列
4
5# 删除行和列
6ws.delete_cols(6, 3)  # 从第六列(F列)开始,删除3列即(F:H)
7ws.delete_rows(3)   # 删除第三行

单元格操作

1# 读取
2c = ws['A1']
3c1 = ws.cell(row=1, column=2)
4print(c, c1)
5print(c.value, c1.value)

<Cell '5a_'.A1> <Cell '5a_'.B1>
dth_title Province

1# 修改
2ws['A1'] = '景区名称'
3ws.cell(1, 2).value = '省份'
4print(c.value, c1.value)

景区名称 省份

 1# 读取多个单元格
 2
 3cell_range = ws['A1:B2']
 4colC = ws['C']
 5col_range = ws['C:D']
 6row10 = ws[10]
 7row_range = ws[5:10]
 8# 其返回的结果都是一个包含单元格的元组
 9cell_range
10# 注意!! 这里是两层元组嵌套,每一行的单元格位于同一个元组里。

((<Cell '5a_'.A1>, <Cell '5a_'.B1>), (<Cell '5a_'.A2>, <Cell '5a_'.B2>))

1# 按照行列操作
2for row in ws.iter_rows(min_row=1, max_row=3,
3                        min_col=1, max_col=2):
4    for cell in row:
5        print(cell)
6# 也可以用worksheet.iter_col(),用法都一样

<Cell '5a_'.A1>
<Cell '5a_'.B1>
<Cell '5a_'.A2>
<Cell '5a_'.B2>
<Cell '5a_'.A3>
<Cell '5a_'.B3>

1# 合并单元格
 2ws.merge_cells('F1:G1')
 3ws['F1'] = '合并两个单元格'
 4# 或者
 5ws.merge_cells(start_row=2, start_column=6, end_row=3, end_column=8)
 6ws.cell(2, 6).value = '合并三个单元格'
 7
 8# 取消合并单元格
 9ws.unmerge_cells('F1:G1')
10# 或者
11ws.unmerge_cells(start_row=2, start_column=6, end_row=3, end_column=8)
12
13wb.save('./5a.xlsx')
14# 保存之前的操作,保存文件时,文件必须是关闭的!!!

注意!!!,openpyxl对Excel的修改并不像是xlwings一样是实时的,他的修改是暂时保存在内存中的,所以当后面的修改例如我接下来要在第一行插入新的一行做标题,那么当我对新的A1单元格操作的时候,还在内存中的原A1(现在是A2)的单元格
原有的修改就会被覆盖。所以要先保存,或者从一开始就计划好更改操作避免这样的事情发生。(别问我怎么知道的,都是泪o(╥﹏╥)o)

样式修改

单个单元格样式

1wb = load_workbook('./5a.xlsx')    # 读取修改后的文件
 2ws = wb['5a_']
 3# 我们来设置一个表头
 4ws.insert_rows(1)    # 在第一行插入新的一行
 5ws.merge_cells('A1:E1')  # 合并单元格
 6a1 = ws['A1']
 7ws['A1'] = '5A级风景区名单'
 8
 9# 设置字体
10ft = Font(name='微软雅黑', color='000000', size=15, b=True)
11"""
12name:字体名称
13color:颜色通常是RGB或aRGB十六进制值
14b(bold):加粗(bool)
15i(italic):倾斜(bool)
16shadow:阴影(bool)
17underline:下划线(‘doubleAccounting’, ‘single’, ‘double’, ‘singleAccounting’)
18charset:字符集(int)
19strike:删除线(bool)
20"""
21a1.font = ft
22
23# 设置文本对齐
24
25ali = Alignment(horizontal='center', vertical='center')
26"""
27horizontal:水平对齐('centerContinuous', 'general', 'distributed',
28                    'left', 'fill', 'center', 'justify', 'right')
29vertical:垂直对齐('distributed', 'top', 'center', 'justify', 'bottom')
30
31"""
32a1.alignment = ali
33
34# 设置图案填充
35
36fill = PatternFill('solid', fgColor='FFA500')
37# 颜色一般使用十六进制RGB
38# 'solid'是图案填充类型,详细可查阅文档
39
40a1.fill = fill

openpyxl.styles.fills模块参数文档(链接阅读原文)

 1# 设置边框
 2bian = Side(style='medium', color='000000')    # 设置边框样式
 3"""
 4style:边框线的风格{'dotted','slantDashDot','dashDot','hair','mediumDashDot',
 5        'dashed','mediumDashed','thick','dashDotDot','medium',
 6        'double','thin','mediumDashDotDot'}
 7"""
 8
 9border = Border(top=bian, bottom=bian, left=bian, right=bian)
10"""
11top(上),bottom(下),left(左),right(右):必须是 Side类型
12diagonal: 斜线 side类型 
13diagonalDownd: 右斜线 bool
14diagonalDown: 左斜线 bool
15"""
16
17# a1.border = border
18for item in ws['A1:E1'][0]:   # 去元组中的每一个cell更改样式
19    item.border = border
20
21wb.save('./5a.xlsx')  # 保存更改

再次注意!!!:

  • 不能使用 a1.border = border,否则只会如下图情况,B1:E1单元格没有线。我个人认为是因为线框涉及到相邻单元格边框的改动所以需要单独对每个单元格修改才行。

  • 不能使用ws['A1:E1'].border = border,由前面的内容可知,openpyxl的多个单元格其实是一个元组,而元组是没有style的方法的,所以必须一个一个改!!其实官方有其他办法,后面讲。

image

只有A1边框有加粗

按列或行设置样式

 1# 现在我们对整个表进行设置
 2
 3# 读取
 4wb = load_workbook('./5a.xlsx')
 5ws = wb['5a_']
 6
 7# 读取数据表格范围
 8rows = ws.max_row
 9cols = ws.max_column
10
11# 字体
12font1 = Font(name='微软雅黑', size=11, b=True)
13font2 = Font(name='微软雅黑', size=11)
14
15# 边框
16line_t = Side(style='thin', color='000000')  # 细边框
17line_m = Side(style='medium', color='000000')  # 粗边框
18border1 = Border(top=line_m, bottom=line_t, left=line_t, right=line_t)
19# 与标题相邻的边设置与标题一样
20border2 = Border(top=line_t, bottom=line_t, left=line_t, right=line_t)
21
22# 填充
23fill = PatternFill('solid', fgColor='CFCFCF')
24
25# 对齐
26alignment = Alignment(horizontal='center', vertical='center')
27
28# 将样式打包命名
29sty1 = NamedStyle(name='sty1', font=font1, fill=fill,
30                  border=border1, alignment=alignment)
31sty2 = NamedStyle(name='sty2', font=font2, border=border2, alignment=alignment)
32
33for r in range(2, rows+1):
34    for c in range(1, cols):
35        if r == 2:
36            ws.cell(r, c).style = sty1
37        else:
38            ws.cell(r, c).style = sty2
39
40wb.save('./5a.xlsx')
image

对于,设置标题样式,其实官方也给出了一个自定义函数(链接阅读原文),设定范围后,范围内的单元格都会合并,并且应用样式,就像是单个cell一样。在这里就不多赘述了,有兴趣的可以看看。很实用。

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 159,458评论 4 363
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 67,454评论 1 294
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 109,171评论 0 243
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 44,062评论 0 207
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 52,440评论 3 287
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 40,661评论 1 219
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 31,906评论 2 313
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 30,609评论 0 200
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 34,379评论 1 246
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 30,600评论 2 246
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 32,085评论 1 261
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 28,409评论 2 254
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 33,072评论 3 237
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 26,088评论 0 8
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 26,860评论 0 195
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 35,704评论 2 276
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 35,608评论 2 270

推荐阅读更多精彩内容

  • 使用首先需要了解他的工作原理 1.POI结构与常用类 (1)创建Workbook和Sheet (2)创建单元格 (...
    长城ol阅读 8,258评论 2 25
  • 最近在网上爬取奥运项目资料,并写入Excel中。在写到Excel中是用到了OpenPyXL,翻译了一部分自己用到的...
    LeeLom阅读 190,401评论 7 78
  • 我叫Carrie,在广东出生,祖籍在北方,可以算上南北混血吗? 我在17岁那年花了一个礼拜做了一个足以改变我人生轨...
    czzzzzzz阅读 582评论 1 3
  • 要不是大雾 才会上不了高速 上不了高速 才走到了毛集渡口 想不到 近二十几年 又到了此渡口 幼时姥姥家 记忆有 却...
    一度一阅读 79评论 0 0
  • 第二章 桃林始祖 白弦与元茵来到桃林,把闪着蓝光的两界钥匙封印在桃林的最深处,淡青色的结界逐渐生气,元茵施法将结界...
    橘子xm阅读 354评论 0 0