还在做重复的劳动,不如用Python自动生成Excel以邮件发送

0.729字数 935阅读 1706

作者:王向君
文章来源:https://zhuanlan.zhihu.com/p/41670796

数据分析师小王每天都要被各种各样的数据数据报表搞得焦头烂额,比如老板的,运营的、产品的等等。而且大部分报表都是重复性的工作。这篇文章就是帮助大家如何用Python来实现报表的自动发送,解放你的劳动力,可以让你有时间去做更有意思的事情。

要点:

·pymysql 一个可以连接MySQL实例并且实现增删改查功能的库

·datetime Python标准库中自带的关于时间的库

·openpyxl 一个可以读写07版以后的Excel文档的库

·smtplib SMTP即简单邮件传输协议

·email 一个用来处理邮件消息的库

一.准备工作,导入相应的库

数据分析师日常大部分工作需要熟练掌握SQL和excel打交道,而且很多数据都带日期。所以我们需要导入下面这些模块:

pymysql,openxl,datatime,当然还有自动发邮件的email和smtplib模块。

# encoding=utf-8
import pymysql as pms
import openpyxl
import datetime
from email.mime.text import MIMEText
from email.mime.multipart import MIMEMultipart
from email.header import Header
import smtplib

二.连接SQL
现在主流的数据库有两大类,SQL和NoSQL,虽然Mongodb非常灵活和简单,但是大部分公司的数据库还是用Mysql比较多的!所以我们需要掌握一些基本的python操作数据库的知识!

1).执行一条sql,获取数据

def get_datas(sql):
   # 一个传入sql导出数据的函数
   # 跟数据库建立连接
   conn = pms.connect(host='实例地址', user='用户',passwd='密码', 
                           database='库名', port=3306,
                            charset="utf8")
   # 使用 cursor() 方法创建一个游标对象 cursor
   cur = conn.cursor()
   # 使用 execute() 方法执行 SQL
   cur.execute(sql)
   # 获取所需要的数据
   datas = cur.fetchall()
   #关闭连接
   cur.close()
   #返回所需的数据
   return datas

2).执行sql,获取字段数据

def get_fields(sql):
   # 一个传入sql导出字段的函数
   conn = pms.connect(host='rm-rj91p2yhl9dm2xmbixo.mysql.rds.xx.com', user='bi-analyzer',
                      passwd='xxx', database='xxx', port=3306, charset="utf8")
   cur = conn.cursor()
   cur.execute(sql)
   # 获取所需要的字段名称
   fields = cur.description
   cur.close()
   return fields

三.数据写入Excel

用Python操作excel其实非常简单,前面我们的入门教程里有详细的讲解(关于Excel表格如何处理|这篇最用心)。用openpyxl建一个excel对象,然后建一个sheet,接着一个循环把一个一个单元格写数据即可!

def get_excel(data, field, file):
   # 将数据和字段名写入excel的函数
   #新建一个工作薄对象
   new = openpyxl.Workbook()
   #激活一个新的sheet
   sheet = new.active
   #给sheet命名
   sheet.title = '数据展示'
   #将字段名称循环写入excel第一行,因为字段格式列表里包含列表,每个列表的第一元素才是字段名称
   for col in range(len(field)):
       #row代表行数,column代表列数,value代表单元格输入的值,行数和列数都是从1开始,这点于python不同要注意
       _ = sheet.cell(row=1, column=col+1, value=u'%s' % field[col][0])
    #将数据循环写入excel的每个单元格中   
   for row in range(len(data)):
       for col in range(len(field)):
           #因为第一行写了字段名称,所以要从第二行开始写入
           _ = sheet.cell(row=row+2, column=col + 1, value=u'%s' % data[row][col])
           #将生成的excel保存,这步是必不可少的
   newworkbook = new.save(file)
   #返回生成的excel
   return newworkbook

四。处理日期数据

大部分的数据都是需要时间戳的,用Python操作时间可以用time,datatime这样的模块。里面有大量非常方便的函数。详见我的历史文章(都说Python时间处理很好玩还简单,真的吗)

def getYesterday():
   # 获取昨天日期的字符串格式的函数
   #获取今天的日期
   today = datetime.date.today()
   #获取一天的日期格式数据
   oneday = datetime.timedelta(days=1)
   #昨天等于今天减去一天
   yesterday = today - oneday
   #获取昨天日期的格式化字符串
   yesterdaystr = yesterday.strftime('%Y-%m-%d')
   #返回昨天的字符串
   return yesterdaystr

五.生成邮件

经过前面的几个步骤,我们的准备工作差不多了!该重头戏自动发送邮件出场了,编写一个发送邮件,无非这么几步:

1).编写邮件内容

def create_email(email_from, email_to, email_Subject, email_text, annex_path, annex_name):
   # 输入发件人昵称、收件人昵称、主题,正文,附件地址,附件名称生成一封邮件
   #生成一个空的带附件的邮件实例
   message = MIMEMultipart()
   #将正文以text的形式插入邮件中
   message.attach(MIMEText(email_text, 'plain', 'utf-8'))
   #生成发件人名称(这个跟发送的邮件没有关系)
   message['From'] = Header(email_from, 'utf-8')
   #生成收件人名称(这个跟接收的邮件也没有关系)
   message['To'] = Header(email_to, 'utf-8')
   #生成邮件主题
   message['Subject'] = Header(email_Subject, 'utf-8')
   #读取附件的内容
   att1 = MIMEText(open(annex_path, 'rb').read(), 'base64', 'utf-8')
   att1["Content-Type"] = 'application/octet-stream'
   #生成附件的名称
   att1["Content-Disposition"] = 'attachment; filename=' + annex_name
   #将附件内容插入邮件中
   message.attach(att1)
   #返回邮件
   return message

用email模块生成邮件的标题,内容,发件人和收件人。如果有附件的话,我们插入附件的文件。

2).发送邮件
准备好邮件的内容之后,我们用smtp模块链接上服务器,填入用户名和密码。当然一定要有异常处理,所以涉及到服务器的处理,都需要有异常处理!

def send_email(sender, password, receiver, msg):
   # 一个输入邮箱、密码、收件人、邮件内容发送邮件的函数
   try:
       #找到你的发送邮箱的服务器地址,已加密的形式发送
       server = smtplib.SMTP_SSL("smtp.mxhichina.com", 465)  # 发件人邮箱中的SMTP服务器
       server.ehlo()
       #登录你的账号
       server.login(sender, password)  # 括号中对应的是发件人邮箱账号、邮箱密码
       #发送邮件
       server.sendmail(sender, receiver, msg.as_string())  # 括号中对应的是发件人邮箱账号、收件人邮箱账号(是一个列表)、邮件内容
       print("邮件发送成功")
       server.quit()  # 关闭连接
   except Exception:
       print(traceback.print_exc())
       print("邮件发送失败")

六.大功告成,看一下效果
忙活了半天,总于可以看一下运行的效果了!输入一条sql查询语句,然后初始化一些邮件的标题,然后填入一堆运营部门,产品部门的邮件地址。然后倒杯咖啡,漂亮的按一下回车,欣赏自己的劳动成果!

def main():
   my_sql = sql = "SELECT a.id '用户ID',\
          a.gmtCreate '用户注册时间',\
          af.lastLoginTime '最后登录时间',\
          af.totalBuyCount '历史付款子单数',\
          af.paidmountUSD '历史付款金额',\
          af.lastPayTime '用户最后支付时间'\
         FROM table a\
     LEFT JOIN tableb af ON a.id= af.accountId ;"
   # 生成数据
   my_data = get_datas(my_sql)
   # 生成字段名称
   my_field = get_fields(my_sql)
   # 得到昨天的日期
   yesterdaystr = getYesterday()
   # 文件名称
   my_file_name = 'user attribute' + yesterdaystr + '.xlsx'
   # 文件路径
   file_path = 'D:/work/report/' + my_file_name
   # 生成excel
   get_excel(my_data, my_field, file_path)

   my_email_from = 'BI部门自动报表机器人'
   my_email_to = '运营部'
   # 邮件标题
   my_email_Subject = 'user' + yesterdaystr
   # 邮件正文
   my_email_text = "Dear all,\n\t附件为每周数据,请查收!\n\nBI团队 "
   #附件地址
   my_annex_path = file_path
   #附件名称
   my_annex_name = my_file_name
   # 生成邮件
   my_msg = create_email(my_email_from, my_email_to, my_email_Subject,
                         my_email_text, my_annex_path, my_annex_name)
   my_sender = '阿里云邮箱'
   my_password = '我的密码'
   my_receiver = [10001@qq.com']#接收人邮箱列表
   # 发送邮件
   send_email(my_sender, my_password, my_receiver, my_msg)

if __name__ == "__main__":
   main();

看一下效果:


image
image

用Python写自动化的小脚本小工具其实非常方便,快捷!比如今天的自动发邮件脚本,还有前面的量化交易提醒工具(熬了一晚上,小白用Python写了一个股票提醒系统),都是通过邮件来发送的,对菜鸟来说可以练习,增强功力!

推荐阅读更多精彩内容