015.用户访问session分析-数据库表设计

本节课,是进入企业级大数据项目开发流程的数据设计环节。在进行完了数据调研、需求分析、技术实现方案,进行数据设计。数据设计,往往包含两个环节,第一个呢,就是说,我们的上游数据,就是数据调研环节看到的项目基于的基础数据,是否要针对其开发一些Hive ETL,对数据进行进一步的处理和转换,从而让我们能够更加方便的和快速的去计算和执行spark作业;第二个,就是要设计spark作业要保存结果数据的业务表的结构,从而让J2EE平台可以使用业务表中的数据,来为使用者展示任务执行结果。

在本项目中,我们所有的数据设计环节,只会涉及第二个,不会涉及第一个。因为我们为了突出课程重点,也就是spark。所以主要还是集中在spark上面,就不要花时间去做Hive ETL了。设计MySQL中的业务表的结构。

第一表:session_aggr_stat表,存储第一个功能,session聚合统计的结果
CREATE TABLE session_aggr_stat (
task_id int(11) NOT NULL,
session_count int(11) DEFAULT NULL,
1s_3s double DEFAULT NULL,
4s_6s double DEFAULT NULL,
7s_9s double DEFAULT NULL,
10s_30s double DEFAULT NULL,
30s_60s double DEFAULT NULL,
1m_3m double DEFAULT NULL,
3m_10m double DEFAULT NULL,
10m_30m double DEFAULT NULL,
30m double DEFAULT NULL,
1_3 double DEFAULT NULL,
4_6 double DEFAULT NULL,
7_9 double DEFAULT NULL,
10_30 double DEFAULT NULL,
30_60 double DEFAULT NULL,
60 double DEFAULT NULL,
PRIMARY KEY (task_id)
) ENGINE=InnoDB DEFAULT CHARSET=utf8

第二个表:session_random_extract表,存储我们的按时间比例随机抽取功能抽取出来的1000个session
CREATE TABLE session_random_extract (
task_id int(11) NOT NULL,
session_id varchar(255) DEFAULT NULL,
start_time varchar(50) DEFAULT NULL,
end_time varchar(50) DEFAULT NULL,
search_keywords varchar(255) DEFAULT NULL,
PRIMARY KEY (task_id)
) ENGINE=InnoDB DEFAULT CHARSET=utf8

第三个表:top10_category表,存储按点击、下单和支付排序出来的top10品类数据
CREATE TABLE top10_category (
task_id int(11) NOT NULL,
category_id int(11) DEFAULT NULL,
click_count int(11) DEFAULT NULL,
order_count int(11) DEFAULT NULL,
pay_count int(11) DEFAULT NULL,
PRIMARY KEY (task_id)
) ENGINE=InnoDB DEFAULT CHARSET=utf8

第四个表:top10_category_session表,存储top10每个品类的点击top10的session
CREATE TABLE top10_category_session (
task_id int(11) NO NULL,
category_id int(11) DEFAULT NULL,
session_id varchar(255) DEFAULT NULL,
click_count int(11) DEFAULT NULL,
PRIMARY KEY (task_id)
) ENGINE=InnoDB DEFAULT CHARSET=utf8

最后一张表:session_detail,用来存储随机抽取出来的session的明细数据、top10品类的session的明细数据
CREATE TABLE session_detail (
task_id int(11) NOT NULL,
user_id int(11) DEFAULT NULL,
session_id varchar(255) DEFAULT NULL,
page_id int(11) DEFAULT NULL,
action_time varchar(255) DEFAULT NULL,
search_keyword varchar(255) DEFAULT NULL,
click_category_id int(11) DEFAULT NULL,
click_product_id int(11) DEFAULT NULL,
order_category_ids varchar(255) DEFAULT NULL,
order_product_ids varchar(255) DEFAULT NULL,
pay_category_ids varchar(255) DEFAULT NULL,
pay_product_ids varchar(255) DEFAULT NULL,
PRIMARY KEY (task_id)
) ENGINE=InnoDB DEFAULT CHARSET=utf8

额外的一张表:task表,用来存储J2EE平台插入其中的任务的信息
CREATE TABLE task (
task_id int(11) NOT NULL AUTO_INCREMENT,
task_name varchar(255) DEFAULT NULL,
create_time varchar(255) DEFAULT NULL,
start_time varchar(255) DEFAULT NULL,
finish_time varchar(255) DEFAULT NULL,
task_type varchar(255) DEFAULT NULL,
task_status varchar(255) DEFAULT NULL,
task_param text,
PRIMARY KEY (task_id)
) ENGINE=InnoDB AUTO_INCREMENT=0 DEFAULT CHARSET=utf8

在数据设计以后,就正式进入一个漫长的环节,就是编码实现阶段,coding阶段。在编码实现阶段,每开发完一个功能,其实都会走后续的两个环节,就是本地测试和生产环境测试。

大家需要在windows上面,自己安装MySQL数据库。然后本地测试的时候,将数据插入本地的MySQL中。

接下来,就是在完成了数据调研、需求分析、技术方案设计、数据设计以后,正式进入编码实现和功能测试阶段。最后才是性能调优阶段。

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 160,387评论 4 364
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 67,845评论 1 298
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 110,091评论 0 246
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 44,308评论 0 214
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 52,662评论 3 288
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 40,795评论 1 222
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 32,008评论 2 315
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 30,743评论 0 204
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 34,466评论 1 246
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 30,687评论 2 249
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 32,181评论 1 262
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 28,531评论 3 258
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 33,177评论 3 239
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 26,126评论 0 8
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 26,902评论 0 198
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 35,862评论 2 283
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 35,734评论 2 274

推荐阅读更多精彩内容

  • CREATE TABLE IF NOT EXISTS ecs_order_info (order_id mediu...
    cookie口阅读 15,559评论 0 16
  • 富爸爸说:“世界上到处都是有伟大创意的人,但是因此获得巨额财富的人屈指可数。究其原因,是因为在这个世界上,拥有企业...
    Fei向宇宙阅读 457评论 0 1
  • 能出来和你约会就已经很不错了 还需要加分吗?:) 约会时,女生做什么会很加分? 1随身带纸巾的女孩真的敲级贴心 2...
    她他社阅读 596评论 0 1
  • 因为工作内容的情况,特开启本篇台达A2-M伺服疑难杂症FAQ贴。不定时进行更新。 台达A2官网 A:7.5kW/3...
    TomatoTor阅读 2,382评论 0 3
  • 文/佾叶 “凭什么,皇帝的女儿,只因为心情不好,就可以随意摆布我女儿的命运,将我的女儿打落地狱?吕至元眼眶里...
    佾叶阅读 9,192评论 2 0