HDU 教务系统爬虫

前言

记得从大二的时候就很想写一个基于教务系统的辅助工具,提供一些“黑科技”的功能,例如辅助选课等等,但是受限于当时掌握的知识,还有就是正方的这套教务系统实在是有不少坑。。。

遇到的坑

下面总结一下在爬取数据过程中遇到的一些问题及解决方案。

1. 模拟登陆教务系统需要一个隐藏表单项

想要爬取教务系统中的课程、成绩等信息,首先自然是要登录系统,在抓包的过程中发现,提交的 POST 请求中需要一个名为 lt 的参数,查看源码,发现一个隐藏表单项。

隐藏表单项

没有这个参数是无法成功登录的,因此我们需要先通过一个 GET 请求,获取到该表单项的值,然后再进行 POST 登录。

2. 登录完成以及跳转到其他应用时会有很多认证跳转

这个是什么意思呢?当我们在完成 POST 请求之后,并不是直接跳转至我们想要的页面,而是会经过多次页面跳转。个人猜测是为了同步不同域之间的会话数据,由于整个教务系统,包括数字杭电、教学管理(选课系统)、银校通其实都各自是独立的应用,所属域不同,甚至使用的编程语言都不同,那么当我们从一个应用跳转至另一个应用的时候,如何保持我们的登录状态呢?首先每个应用需要提供一个接口用于同步会话信息,然后需要一个独立的认证服务。

选课系统的地址没有直接指向 jxgl.hdu.edu.cn,而是经过几层跳转最终到达目的地

当然上面都是我个人的猜测。。。

在这套系统中,这些跳转是通过 js 来完成的(location.href = ……),那我们要怎么做的,最简单的方式就是使用循环,检查源码中是否包含「认证跳转」这四个字,如果有,则解析出其中要跳转的地址,再发送一次 GET 请求,如果没有,表明已经到达目的地,则退出循环。

3. 请求页面出现 Object moved to here

Object moved to here

这个问题困扰了我很长时间,也导致这个项目荒废了很久。
这其实是 asp.net 编写的 Web 程序经常出现的问题,具体我也没有深入研究,解决方案也很简单,在请求头加入一个 Referer 参数就可以了,值的话可以用请求页面的 URL。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 159,716评论 4 364
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 67,558评论 1 294
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 109,431评论 0 244
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 44,127评论 0 209
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 52,511评论 3 287
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 40,692评论 1 222
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 31,915评论 2 313
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 30,664评论 0 202
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 34,412评论 1 246
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 30,616评论 2 245
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 32,105评论 1 260
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 28,424评论 2 254
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 33,098评论 3 238
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 26,096评论 0 8
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 26,869评论 0 197
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 35,748评论 2 276
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 35,641评论 2 271

推荐阅读更多精彩内容