聚沙成塔--爬虫系列(十一)(如何正确的使用数据库一)

版权声明:本文为作者原创文章,可以随意转载,但必须在明确位置标明出处!!!

上一章讲了如何将数据存储到Excel表格中并做了简单的统计,对于少量的数据我们使用Excel统计就已经足够了,如果数据变成了百万量级甚至千万量级的时候,Excel就没有这么好的表现了,这个时候我们就需要用到数据库技术了,为什么数据库也能持久化呢,那是因为我们存储在数据库的数据同样是以文件的形式存储在磁盘上的,所以对数据库的访问瓶颈也就是I/O瓶颈。

对于那些初入职场的同学,你的前辈经常会告诉了不要频繁的去读写数据库,那样会使你的程序变得很慢,原因就是I/O频繁操作造成的。学过计算机原理的同学应该知道磁盘是由柱面和扇区组成的,当要去磁盘取出一个数据时,磁头左右摆动的时候需要去定位柱面、磁道、扇区。想想这个速度是不是很慢了,所以为了解决I/O瓶颈就出现了内存数据库,像Oracle公司的coherence,开源的Redis、MongoDB等等,对这些感兴趣的同学可以去学习学习,后面的章节我们也会用到这些内存数据库。

python DB-API

为了解决Python 数据库连接问题的特殊兴趣小组成立了,它为不同的关系数据库提供了一致性的接口,在还没有这个协议之前,有很多的数据库,并且很多人实现了自己的数据库适配器,这意味着使用这些接口的应用代码需要与他们选择使用的数据库模块进行定制化处理。所以Python的DP-API规范出现了,让我们不管使用何种数据库都可以使用一致的接口。

模块属性

DB-API 标准要求必须提供下文列出的功能和属性

属性 描述
apilevel 需要适配器兼容的DB-API 版本
threadsafety 本模块的线程安全级别
paramstyle 本模块的SQL 语句参数风格
connect() Connect()函数
多种异 异常说明
  • apilevel: 该字符串(注意,不是浮点型)指明了模块需要兼容的DBAPI 最高版本,比如,1.0、2.0 等。该属性的默认值是1.0。
  • threadsafety: 这是一个整型值,可选值如下。
    • 0:不支持线程安全。线程间不能共享模块。
    • 1:最小化线程安全支持:线程间可以共享模块,但是不能共享连接。
    • 2:适度的线程安全支持:线程间可以共享模块和连接,但是不能共享游标。
    • 3:完整的线程安全支持:线程间可以共享模块、连接和游标。

参数风格

参数风格 描述 示例
umeric 数值位置风格 WHERE name=:1
named 命名风格 WHERE name=:name
pyformat Python 字典printf()格式转换 WHERE name=%(name)s
qmark 问号风格 WHERE name=?
format ANSIC 的printf()格式转换 WHERE name=%s

函数属性

参数 描述
user 用户名
password 密码
host 主机名
database 数据库名
dsn 数据源名

上面说过根据DP-API规定,所有的数据库适配器都必须实现connect函数,connect函数参数定义如下:

参数 描述
user 用户名
password 密码
host 主机名
database 数据库名
dsn 数据源名

使用DSN 还是独立参数主要基于所连接的系统。比如,如果你使用的是像ODBC(OpenDatabase Connectivity)或JDBC(Java Database Connectivity)的API,则需要使用DSN;而如果你直接使用数据库,则更倾向于使用独立的登录参数。另一个使用独立参数的原因是很多数据库适配器并没有实现对DSN 的支持。

异常定义

异常定义

Connection对象

应用与数据库之间进行通信需要建立数据库连接。它是最基本的机制,只有通过数据库连接才能把命令传递到服务器,并得到返回的结果。当一个连接(或一个连接池)建立后,可以创建一个游标,向数据库发送请求,然后从数据库中接收回应。从上面我们知道connect函数返回的是一个Connection对象,那么该对象都拥有哪些方法呢,如下:

Connection对象方法

Cursor 对象

当建立连接后,就可以和数据库进行通信了。游标可以让用户提交数据库命令,并获得查询的结果行。Python DB-API 游标对象总能提供游标的功能,即使是那些不支持游标的数据库。基本所有的数据库适配器都须要实现cursor 对象,以扮演类似游标的角色。这样,无论你将数据库系统切换到支持游标的数据库还是不支持游标的数据库,都能保持Python 代码的一致性。

当游标创建好后,就可以执行查询或命令(或多个查询和命令),并从结果集中取回一行或多行结果。游标对象最重要的属性是execute*()和fet*()方法,所有针对数据库的服务请求都是通过它们执行的。arraysize 数据属性在为fetchmany()设置默认大小时非常有用。当然,在不需要时关闭游标是个好主意, 而如果你的数据库支持存储过程,可能会用到callproc()。Cursor对象都有如下方法:

Cursor对象方法

类型对象和构造函数

通常来讲,两个不同系统间接口是最脆弱的,Python对象与数据库对象之间同样存在着这个问题,虽然你传递给数据库的参数是字符串,但数据库可能将其转换成多种不同类型,所以对数据库优化查询的时候也要特别注意数据类型,比如你要查询的一个表字段是VARCHAR类型,而你WHERE条件给出的是一个整形,那么数据库去检索的时候都会先把VARCHAR字段值先转换为整形然后在去匹配,这样就增加了查询时间,所以对于初学者来说写查询语句一定要养成一个好的习惯。下面是一些类型对象和构造函数

类型对象和构造函数

限于篇幅的原因本章就到这里结束了,若文章太长我想大部分人都没有耐心去看完,下一章我们将会使用Python自带的数据库适配器sqlite3,和第三方数据库适配器pymysql,将我们爬到的糗百数据写入进去。


欢迎关注我:「爱做饭的老谢」,老谢一直在努力...

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 159,716评论 4 364
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 67,558评论 1 294
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 109,431评论 0 244
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 44,127评论 0 209
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 52,511评论 3 287
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 40,692评论 1 222
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 31,915评论 2 313
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 30,664评论 0 202
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 34,412评论 1 246
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 30,616评论 2 245
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 32,105评论 1 260
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 28,424评论 2 254
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 33,098评论 3 238
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 26,096评论 0 8
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 26,869评论 0 197
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 35,748评论 2 276
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 35,641评论 2 271

推荐阅读更多精彩内容