python网络编程入门

96
墨墟尘
2018.01.08 22:58 字数 1357

1. 背景介绍

1.1 TCP与IP协议

python的socket模块是网络编程的基础组件主要用于主机或者进程之间的通信。

计算机网络的TCP/IP五层模型中,传输层的TCP协议和UDP协议实现了主机间的通信。其中TCP协议需要先建立连接,然后进行数据传输,如果出现丢包情况会进行数据重传,确保数据送达目的地。而UDP协议是无连接的,不需要先建立连接,只需要知道主机地址就可以直接将数据传过去,并不保证数据一定送到目的地,但是因此传输速度比较快。

因此在常规的模型中,如果进行大量数据的即时传输(比如视频电话等)通常是先使用TCP建立连接,然后使用UDP进行数据传输。(事实上随着技术进步,有些视频类通信是根据网络状况选择通信协议,在网络状况良好时会使用完全TCP的通信。)

1.2 客户端与服务器端

在网络编程时,主机间通信时通常是C/S架构,即一方做客户端,一方做服务器端。一般来说服务器端需要能够同时处理多个客户端的请求,因此实现的时候需要涉及到多线程的知识。

在TCP连接中,认为主动发起通信请求的一方是客户端,被动响应请求的一方是服务器端。

1.3 环境

  1. 操作系统:CentOS
  2. 编程语言:python 2.7.5
  3. python模块:标准库中的socket,time,threading。

2. TCP连接

2.1 客户端

首先在头部需要导入socket库。

然后创建TCP连接的套接字(socket),并且指定服务器的主机地址和端口号,发起连接请求。这里指定的是新浪的服务器,端口号为80。

import socket #导入socket库
s = socket.socket(socket.AF_INET, socket.SOCK_STREAM) #创建套接字
s.connect(("www.sina.com.cn", 80)) #向新浪服务器的80端口发起连接请求

其中创建套接字的时候AF_INET指定使用IPv4,如果想要使用IPv6可以改为AF_INET6SOCK_STREAM指定面向流传输的TCP协议。

需要注意的是,发起连接请求的时候传入的(hostname, port)的一个元组,所以需要两重括号。这里的hostname可以是像上面的网址,DNS协议会自动把网址解析成对应的主机IP;也可以是IP地址,比如本地IP"127.0.0.1"。如果是自己平时做实验的话,port端口号需要大于1024,否则可能会和其他服务的端口号冲突。

服务器如果响应连接请求,就会和客户端建立连接。之后就可以向服务器发起请求进行通信。可以使用send函数发送请求。比如在廖雪峰 Python网络编程的教程中发送的请求为:

s.send('GET / HTTP/1.1\r\nHost: www.sina.com.cn\r\nConnection: close\r\n\r\n')

这个请求是按照http协议的格式发出,得到的响应是带有http首部的新浪首页html内容。之后就可以接受这些内容并查看。

buffer = []
while True:
    d = s.recv(1024)#recv()函数中的参数表示一次最多接受的字节数,这里表示一次最多接受1kb
    if d:
        buffer.append(d)
    else:
        break
data = ''.join(buffer)
header, html = data.split('\r\n\r\n',1)#分离http首部和html内容
print 'header:\n', header#打印首部

最后结束通信,调用close函数关闭连接。

s.close()

2.2 服务器端

服务器端与客户端类似,创建一个基于IPv4和TCP协议的套接字(socket)之后,需要先绑定服务器的IP地址和端口号。这是因为一台机器可能有多块网卡,具有不同的IP地址。然后使用listen()函数进行监听该端口是否有客户端发送请求过来。如果接收到请求,则创建一个新的线程处理这个连接请求。

def tcp_server(host,port):
    s = socket.socket(socket.AF_INET, socket.SOCK_STREAM)
    s.bind((host, port))#绑定IP地址和端口号
    s.listen(5)#监听端口,指定最大连接数
    print 'Waiting for connections......'
    while True:
        sock, addr = s.accept()#接受一个新连接
        t = threading.Thread(target = tcplink, args = (sock, addr))#创建新线程处理TCP连
接
        t.start()

其中target = tcplink指定的是新线程中调用的函数,args = (sock, addr)指定的是tcplink()函数的参数。

def tcplink(sock, addr):
    print 'Accept new connection from %s :%s......' % addr
    sock.send('Welcome!')
    while True:
        data = sock.recv(1024)
        time.sleep(1)
        if data == 'exit' or not data:
            break
        sock.send('Hello, %s~'%data)
    sock.close()
    print 'Connection from %s :%s closed~' % addr

与这个服务器端程序相对应的客户端程序见完整代码

3. UDP连接

3.1 客户端

创建套接字的时候,SOCK_DGRAM指定是UDP连接。

客户端不再需要connect()发起连接,而是通过sendto()直接指定服务器的(hostname, port)元组。但是依然可以用recv()接收服务器端发送的数据。

def udp_connect(host, port, msg):
    s = socket.socket(socket.AF_INET, socket.SOCK_DGRAM)
    for data in msg:
        s.sendto(data,(host,port))
        print s.recv(1024)
    s.close()

3.2 服务器端

服务器端也不再需要使用listen()进行监听,只需要通过recvfrom()获取客户端发送的数据和(hostname, port)元组。

def udp_server(host,port):
    s = socket.socket(socket.AF_INET, socket.SOCK_DGRAM)
    s.bind((host,port))
    print 'Bind UDP on %s:%s......'%(host, port)
    while True:
        data, addr = s.recvfrom(1024)
        print 'Received from %s :%s......' % addr
        s.sendto('Hello,%s~'%data, addr)

4. 遇到的问题

在编程实现的过程中遇到不少问题,排除拼写错误之外,值得一记的一个错误是端口被占用。python报错为:
Couldn't listen on any:9999: [Errno 98] Address already in use.
这是因为服务器端程序终止运行之后该进程仍在占用那个端口进行监听。这时候可以先查找占用端口的进程PID,使用kill命令强行终止进程。

$ lsof -i TCP:9999 | grep LISTEN 
$ lsof -i UDP:9999
$ kill -s 9 <PID>

5. 其他

参考资料

  1. 廖雪峰 Python网络编程
  2. 菜鸟教程 Python网络编程
  3. 计算机网络基础知识总结

完整代码
Github/zc12345

python学习