什么是Socket?
Socket的中文翻譯過(guò)來(lái)就是“套接字”。套接字是什么,我們先來(lái)看看它的英文含義:插座。
Socket就像一個(gè)電話(huà)插座,負(fù)責(zé)連通兩端的電話(huà),進(jìn)行點(diǎn)對(duì)點(diǎn)通信,讓電話(huà)可以進(jìn)行通信,端口就像插座上的孔,端口不能同時(shí)被其他進(jìn)程占用。而我們建立連接就像把插頭插在這個(gè)插座上,創(chuàng)建一個(gè)Socket實(shí)例開(kāi)始監(jiān)聽(tīng)后,這個(gè)電話(huà)插座就時(shí)刻監(jiān)聽(tīng)著消息的傳入,誰(shuí)撥通我這個(gè)“IP地址和端口”,我就接通誰(shuí)。
實(shí)際上,Socket是在應(yīng)用層和傳輸層之間的一個(gè)抽象層,它把TCP/IP層復(fù)雜的操作抽象為幾個(gè)簡(jiǎn)單的接口,供應(yīng)用層調(diào)用實(shí)現(xiàn)進(jìn)程在網(wǎng)絡(luò)中的通信。Socket起源于UNIX,在Unix一切皆文件的思想下,進(jìn)程間通信就被冠名為文件描述符(file desciptor),Socket是一種“打開(kāi)—讀/寫(xiě)—關(guān)閉”模式的實(shí)現(xiàn),服務(wù)器和客戶(hù)端各自維護(hù)一個(gè)“文件”,在建立連接打開(kāi)后,可以向文件寫(xiě)入內(nèi)容供對(duì)方讀取或者讀取對(duì)方內(nèi)容,通訊結(jié)束時(shí)關(guān)閉文件。
另外我們經(jīng)常說(shuō)到的Socket所在位置如下圖:
Socket通信過(guò)程
Socket保證了不同計(jì)算機(jī)之間的通信,也就是網(wǎng)絡(luò)通信。對(duì)于網(wǎng)站,通信模型是服務(wù)器與客戶(hù)端之間的通信。兩端都建立了一個(gè)Socket對(duì)象,然后通過(guò)Socket對(duì)象對(duì)數(shù)據(jù)進(jìn)行傳輸。通常服務(wù)器處于一個(gè)無(wú)限循環(huán),等待客戶(hù)端的連接。
一圖勝千言,下面是面向連接的TCP時(shí)序圖:
客戶(hù)端過(guò)程:
客戶(hù)端的過(guò)程比較簡(jiǎn)單,創(chuàng)建Socket,連接服務(wù)器,將Socket與遠(yuǎn)程主機(jī)連接(注意:只有TCP才有“連接”的概念,一些Socket比如UDP、ICMP和ARP沒(méi)有“連接”的概念),發(fā)送數(shù)據(jù),讀取響應(yīng)數(shù)據(jù),直到數(shù)據(jù)交換完畢,關(guān)閉連接,結(jié)束TCP對(duì)話(huà)。
import socket
import sys
if __name__ == '__main__':
sock = socket.socket(socket.AF_INET, socket.SOCK_STREAM) # 創(chuàng)建Socket連接
sock.connect(('127.0.0.1', 8001)) # 連接服務(wù)器
while True:
data = input('Please input data:')
if not data:
break
try:
sock.sendall(data)
except socket.error as e:
print('Send Failed...', e)
sys.exit(0)
print('Send Successfully')
res = sock.recv(4096) # 獲取服務(wù)器返回的數(shù)據(jù),還可以用recvfrom()、recv_into()等
print(res)
sock.close()sock.sendall(data)
這里也可用send()方法:不同在于sendall()在返回前會(huì)嘗試發(fā)送所有數(shù)據(jù),并且成功時(shí)返回None,而send()則返回發(fā)送的字節(jié)數(shù)量,失敗時(shí)都拋出異常。
服務(wù)端過(guò)程:
咱再來(lái)聊聊服務(wù)端的過(guò)程,服務(wù)端先初始化Socket,建立流式套接字,與本機(jī)地址及端口進(jìn)行綁定,然后通知TCP,準(zhǔn)備好接收連接,調(diào)用accept()阻塞,等待來(lái)自客戶(hù)端的連接。如果這時(shí)客戶(hù)端與服務(wù)器建立了連接,客戶(hù)端發(fā)送數(shù)據(jù)請(qǐng)求,服務(wù)器接收請(qǐng)求并處理請(qǐng)求,然后把響應(yīng)數(shù)據(jù)發(fā)送給客戶(hù)端,客戶(hù)端讀取數(shù)據(jù),直到數(shù)據(jù)交換完畢。最后關(guān)閉連接,交互結(jié)束。
import socket
import sys
if __name__ == '__main__':
sock = socket.socket(socket.AF_INET, socket.SOCK_STREAM) # 創(chuàng)建Socket連接(TCP)
print('Socket Created')
try:
sock.bind(('127.0.0.1', 8001)) # 配置Socket,綁定IP地址和端口號(hào)
except socket.error as e:
print('Bind Failed...', e)
sys.exit(0)
sock.listen(5) # 設(shè)置最大允許連接數(shù),各連接和Server的通信遵循FIFO原則
while True: # 循環(huán)輪詢(xún)Socket狀態(tài),等待訪問(wèn)
conn, addr = sock.accept()
try:
conn.settimeout(10) # 獲得一個(gè)連接,然后開(kāi)始循環(huán)處理這個(gè)連接發(fā)送的信息
# 如果要同時(shí)處理多個(gè)連接,則下面的語(yǔ)句塊應(yīng)該用多線程來(lái)處理
while True:
data = conn.recv(1024)
print('Get value ' + data, end='nn')
if not data:
print('Exit Server', end='nn')
break
conn.sendall('OK') # 返回?cái)?shù)據(jù)
except socket.timeout: # 建立連接后,該連接在設(shè)定的時(shí)間內(nèi)沒(méi)有數(shù)據(jù)發(fā)來(lái),就會(huì)引發(fā)超時(shí)
print('Time out')
conn.close() # 當(dāng)一個(gè)連接監(jiān)聽(tīng)循環(huán)退出后,連接可以關(guān)掉
sock.close()conn, addr = sock.accept()
調(diào)用accept()時(shí),Socket會(huì)進(jìn)入“waiting”狀態(tài)。客戶(hù)請(qǐng)求連接時(shí),方法建立連接并返回服務(wù)器。accept()返回一個(gè)含有兩個(gè)元素的元組(conn, addr)。第一個(gè)元素conn是新的Socket對(duì)象,服務(wù)器必須通過(guò)它與客戶(hù)通信;第二個(gè)元素addr是客戶(hù)的IP地址及端口。
data = conn.recv(1024)
接下來(lái)是處理階段,服務(wù)器和客戶(hù)端通過(guò)send()和recv()通信(傳輸數(shù)據(jù))。
服務(wù)器調(diào)用send(),并采用字符串形式向客戶(hù)發(fā)送信息,send()返回已發(fā)送的字符個(gè)數(shù)。
服務(wù)器調(diào)用recv()從客戶(hù)接收信息。調(diào)用recv()時(shí),服務(wù)器必須指定一個(gè)整數(shù),它對(duì)應(yīng)于可通過(guò)本次方法調(diào)用來(lái)接收的最大數(shù)據(jù)量。recv()在接收數(shù)據(jù)時(shí)會(huì)進(jìn)入“blocked”狀態(tài),最后返回一個(gè)字符串,用它表示收到的數(shù)據(jù)。如果發(fā)送的數(shù)據(jù)量超過(guò)了recv()所允許的,數(shù)據(jù)會(huì)被截短。多余的數(shù)據(jù)將緩沖于接收端,以后調(diào)用recv()時(shí),多余的數(shù)據(jù)會(huì)從緩沖區(qū)刪除(以及自上次調(diào)用recv()以來(lái),客戶(hù)可能發(fā)送的其它任何數(shù)據(jù))。傳輸結(jié)束,服務(wù)器調(diào)用Socket的close()關(guān)閉連接。
TCP三次握手的Socket過(guò)程:
- 服務(wù)器調(diào)用socket()、bind()、listen()完成初始化后,調(diào)用accept()阻塞等待;
- 客戶(hù)端Socket對(duì)象調(diào)用connect()向服務(wù)器發(fā)送了一個(gè)SYN并阻塞;
- 服務(wù)器完成了第一次握手,即發(fā)送SYN和ACK應(yīng)答;
- 客戶(hù)端收到服務(wù)端發(fā)送的應(yīng)答之后,從connect()返回,再發(fā)送一個(gè)ACK給服務(wù)器;
- 服務(wù)器Socket對(duì)象接收客戶(hù)端第三次握手ACK確認(rèn),此時(shí)服務(wù)端從accept()返回,建立連接。
接下來(lái)就是兩個(gè)端的連接對(duì)象互相收發(fā)數(shù)據(jù)。
TCP四次揮手的Socket過(guò)程:
- 某個(gè)應(yīng)用進(jìn)程調(diào)用close()主動(dòng)關(guān)閉,發(fā)送一個(gè)FIN;
- 另一端接收到FIN后被動(dòng)執(zhí)行關(guān)閉,并發(fā)送ACK確認(rèn);
- 之后被動(dòng)執(zhí)行關(guān)閉的應(yīng)用進(jìn)程調(diào)用close()關(guān)閉Socket,并也發(fā)送一個(gè)FIN;
- 接收到這個(gè)FIN的一端向另一端ACK確認(rèn)。
上面的代碼是簡(jiǎn)單的演示Socket的基本函數(shù)使用,其實(shí)不管有多復(fù)雜的網(wǎng)絡(luò)程序,這些基本函數(shù)都會(huì)用到。上面的服務(wù)端代碼只有處理完一個(gè)客戶(hù)端請(qǐng)求才會(huì)去處理下一個(gè)客戶(hù)端的請(qǐng)求,這樣的服務(wù)器處理能力很弱,而實(shí)際中服務(wù)器都需要有并發(fā)處理能力,為了達(dá)到并發(fā)處理,服務(wù)器就需要fork一個(gè)新的進(jìn)程或者線程去處理請(qǐng)求。