240 发简信
  • mangodb2

    1.安装 2.mongodb 服务sudo service mongod/mongodb startsudo service mongod/mo...

  • mangodb1

    dashow dbs切换数据库:use dbname查看数据库信息:db.stats()删除:db.dropDatabase() 创建集合:cr...

  • 爬虫的步骤

    爬虫代码基本步骤 第一步: 分析网站,寻找目标URL 第二步: 分析目标URL参数(get,post) get和post请求的区别: get请求...

  • 爬虫总结

    大数库时代:数据如何产生?1. 打的公司打的企业:通过用户产生的数据2.大的数据平台:通过收集或者和其他企业或者公司合作3.国家政府/大的机构:...

  • urllib下的模块

    爬虫代码基本步骤 第一步: 分析网站,寻找目标URL 第二步: 分析目标URL参数(get,post) get和post请求的区别: get请求...

  • 正则

    正则的规则: 单字符匹配 . 除换行符之外的任意字符\d: 表示数字\D: 匹配非数字\w: 匹配单词字符[a-z,A-Z,0-9]\W: 匹配...

  • 分布式爬虫

    Scrapy_redis在scrapy的基础上实现了更多,更强大的功能,具体体现在:reqeust去重,爬虫持久化,和轻松实现分布式,安装命令如...

  • 根目录下的文件夹的作用

    /bin 二进制可执行命令/dev 设备特殊文件/etc 系统管理和配置文件/etc/rc.d 启动的配置文件和脚本/home 用户主目录的基点...