SimpleDB

SImpleDB 包含:

  • Classes that represent fields, tuples, and tuple schemas;
  • A catalog that stores information about available tables and their schemas.
  • One or more access methods (e.g., heap files) that store relations on disk and provide a way to iterate through tuples of those relations;
  • A buffer pool that caches active tuples and pages in memory and handles concurrency control and transactions
  • Classes that apply predicates and conditions to tuples;
  • A collection of operator classes (e.g., select, join, insert, delete, etc.) that process tuples;

不包括

  • Views.
  • Data types except integers and fixed length strings.
  • Indices.
  • DDL

储存

Catalog 储存了所有表的信息。每个表的信息包括:name,schema,相应的 DbFile,以及 primary key。

SImpleDB 只支持两种 field,Interger 和 fixed length string。

每个表的 schema 用 TupleDesc 定义,其储存每个 filed 的 type 和 name。其除了支持用 index (offset) 获得 field 的 type 或 name,用 name 获得 field 的 index,还提供一个静态方法用于 merge 两个 TupleDesc 获得一个新的 TupleDesc (Join operator 使用)

tuple 用来储存 field,其除了提供第 i 个 field 的 getter/setter,还提供了所有 field 的 iterator。
tuple 有一个 record id 标志其在磁盘中的位置。

HeapPage 实现了 Page 接口。用一个 PageId 唯一标志,用来储存 tuples,其用一个 byte[] header 作为bitmap。
其支持在该 page 上插入/删除 tuple,标志该 page 为 dirty。还提供了迭代器用来迭代 page 中所有的tuple。
其支持将 page 实例序列化为 byte[] 和由 byte[] 构建 page 实例。

HeapFile 实现了 DbFile 的接口,其提供唯一的 ID,以及获得文件系统 File,table schema 的 API。
其支持从从磁盘获取数据(byte []), 并构建相应 page 实例。和将 page 序列化到磁盘。

buffer pool 存放了当前所有的 page 实例,如果已满,则会剔除某个page(如果 page 为 dirty,则 flush 到磁盘)。
所有对数据(都是以 page,也就是构建 HeapPage 实例)的访问都要经由 buffer pool (调用 getPage API)

这里必须要理清:
数据是储存在磁盘中的(支持序列化),当需要访问时,都会通过 bufferpool 获得。后者调用相应的 HeapFile 从磁盘中获得数据并生成 HeapPage 实例放入 bufferpool。
当 bufferpool 已满,会 kick out 一个page,如果那个 page 是 dirty 的,会先 flush 到磁盘(通过调用 HeapFile 的 writePage API)。

Operator

Operator 就是迭代器的连接,其实现 DbIterator 接口,其接受 child DbIterator。
SimpleDB 实现了 SeqScan,project, filter, join, aggregate, order_by。
除了 SeqScan,其他都由子 DbIterator 获得 tuples。
SeqScan 由 DbFileIterator (所有 DbFile 都要实现,用于获得 file 的所有数据) 获得 tuples

Transaction

Lab3 是实现 Transaction 功能
代码的变动不大,只要在 BufferPool read page 时添加获得锁的代码就行。
这是因为 SimpleDB 设计上所有对磁盘文件的获取都要经由 BufferPool。
所以 BufferPool 特别适合用来获得锁保证线程同步。
OS 中针对 IO 慢的问题也有类似的 Block Cache,其往往也是在这里实现同步。

关键是如何以正确的姿势获得锁和释放锁。
我这里添加了个 LockManager 类专门用来管理锁。
如果对性能要求不高,可以对获得锁的方法(accquireLock)专门上个锁,保证一个时间所有事务只有一个能使用该方法获得锁。
但这里我是保证要求同一个page 的多个事务只有一个能调用方法(通过 Java 中 synchronized (Object))。
这里我犯了一个错误,我误认为所有 PageId 对象都是相同的,就用 synchronized (pid) 来保证同步化,但实际上每次访问 page 时会生成一个新的 PageId 对象,他们相等但不相同 (定义了 equals 和 hashcode 保证相等,但他们是不同对象),所以使用 synchronized (pid) 并没有起到同步化的作用。正确的姿势是用一个Map,Map相等的 PageId 到同一个对象。

死锁检测没有什么好说的,就是检测 wait-lock-graph 有没有环的问题。

在 lab3 时,并没有使用 log 进行 recovery
其使用 NO-STEAL/FORCE

  • You shouldn't evict dirty (updated) pages from the buffer pool if they are locked by an uncommitted transaction (this is NO STEAL).
  • On transaction commit, you should force dirty pages to disk (e.g., write the pages out) (this is FORCE).
  • 假设数据库在执行 transactionComplete 命令时不会崩溃,
    以上三点使得不需要 log-based recovery,因为 you will never need to undo any work (you never evict dirty pages) and you will never need to redo any work (you force updates on commit and will not crash during commit processing).
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 158,736评论 4 362
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 67,167评论 1 291
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 108,442评论 0 243
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 43,902评论 0 204
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 52,302评论 3 287
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 40,573评论 1 216
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 31,847评论 2 312
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 30,562评论 0 197
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 34,260评论 1 241
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 30,531评论 2 245
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 32,021评论 1 258
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 28,367评论 2 253
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 33,016评论 3 235
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 26,068评论 0 8
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 26,827评论 0 194
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 35,610评论 2 274
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 35,514评论 2 269

推荐阅读更多精彩内容