240 发简信
IP属地:山东
  • Resize,w 360,h 240
    爬虫---scrapy框架

    scrapy scrapy是一个爬虫框架,是用python语言编写的,如果想更加深入的了解,可以尝试着看他的源码,非常出名,非常强悍,多进程、多...

  • 爬虫---验证码

    自动识别验证码 (1)光学识别 OCR 其实就是一个软件 别对他期望太高,识别率80% 90%*训练它代码识别 pip install p...

  • 爬虫---bs4语法

    bs4语法 是什麽? BeautifulSoup,就是一个第三方的库,使用之前需要安装 pip install bs4 pip进行安装,默认是从...

  • 爬虫---xpath+jsonpath

    xpath语法 xml : 和json是一样的,用在数据交互和传输中,但是到现在用的基本上都是json格式为什么使用json格式?因为js原生支...

  • 爬虫---线程、进程

    多进程 多任务:生活中来看,就是多个任务同时进行,喝酒聊天,开车,手脚并用,唱歌跳舞电脑中:录屏、sublime、vnc服务端、浏览器打开等代码...

  • 爬虫---handless Chrome和selenium+phantomjs

    1、selenium+phantomjs selenium是什麽? 是一个浏览器自动化测试工具,自动化就是通过代码操作浏览器,让浏览器自动的做一...

  • 爬虫---requests

    requests 是什麽? 是一个第三方库,这个库和urllib是一样的,就是模拟浏览器发送http请求的,requests是对urllib的一...

  • Redis

    Ubuntu下安装redis 安装redis 在 Ubuntu 系统安装 Redi 可以使用以下命令: 启动 Redis 查看 redis 是否...

  • 浏览器User-Agent大全

    window.navigator.userAgent 网站推荐 http://tools.jb51.net/table/useragent 1)...