IP属地:甘肃
流程: 1.Python采集网易云音乐歌手、歌词、音乐、评论等约10-20万+海量数据,存入mysql数据库; 2.使用pandas+numpy...
流程:1.DrissionPage+Selenium自动爬虫工具采集漫画视频、详情、标签等约200万条漫画数据存入mysql数据库;2.Mapr...
流程:1.DrissionPage自动化爬虫框架采集猫眼电影数据约10万条存入mysql数据库、.csv文件作为数据集(旅游数据、用户数据、评论...
1.DrissionPage自动化Python爬虫工具采集飞猪网机票航班数据约1000万条存入.csv文件作为数据集;2.使用pandas+nu...
流程:1.Python爬取去哪儿网全站旅游数据约10万+,存入mysql;2.使用pandas+numpy/hadoop+mapreduce对m...
流程 1.selenium自动化爬虫框架采集民宿数据约10万条存入.csv文件作为数据集;2.使用pandas+numpy或MapReduce对...
开发技术:selenium(Python爬虫)、spark、hadoop、scala、hive、sqoop、Flask、echarts、mysq...
流程 selenium爬取慕课网的课程、章节、评论数据集分别存两个地方:mysql数据库[便于后期选装推荐、预测算法、知识图谱、后台]、.csv...