Avatar notebook default
21篇文章 · 12251字 · 2人关注
  • 正则表达式和re模块

    正则表达式常用匹配规则: 匹配某个字符串: 以上便可以在hello中,匹配出he。 点(.)匹配任意的字符: 但是点(.)不能匹配不到换行符。示...

  • 字符编码

    计算机只能处理数字01,如果要处理文本,就必须先把文本转换为数字01,这种转换方式就称为字符编码。 常见几种编码: ASCII编码:早期专门为英...

  • 动态网页数据抓取

    什么是AJAX: AJAX(Asynchronouse JavaScript And XML)异步JavaScript和XML。过在后台与服务器...

  • csv文件处理

    读取csv文件: 这样操作,以后获取数据的时候,就要通过下表来获取数据。如果想要在获取数据的时候通过标题来获取。那么可以使用DictReader...

  • json详解

    什么是json: JSON(JavaScript Object Notation, JS 对象标记) 是一种轻量级的数据交换格式。它基于 ECM...

  • css选择器

    CSS选择器: 根据标签的名字选择,示例代码如下:p{ background-color: pink;} 根据类名选择,那么要在类的前面加...

  • BeautifulSoup4库

    和 lxml 一样,Beautiful Soup 也是一个HTML/XML的解析器,主要的功能也是如何解析和提取 HTML/XML 数据。lxm...

  • Python爬取豆瓣电影网站

    将目标网站上的页面抓取下来 截图 ![U_FJ@DHMKE7G6[KP_1Z14P.png

  • 在lxml中使用XPath语法

    获取所有li标签: 获取所有li元素下的所有class属性的值: 获取li标签下href为www.baidu.com的a标签: 获取li标签下所...

文集作者