一 、socket介紹
socket接口是TCP/IP網絡的API,socket接口定義了許多函數或例程,程序員可以用它們來開發TCP/IP網絡上的應用程序。要學Internet上的TCP/IP網絡編程,必須理解socket接口。
socket接口設計者最先是將接口放在Unix操作系統裡面的。如果了解Unix系統的輸入和輸出的話,就很容易了解socket了。網絡的socket數據傳輸是一種特殊的I/O,socket也是一種文件描述符。socket也具有一個類似於打開文件的函數調用socket(),該函數返回一個整型的socket描述符,隨後的連接建立、數據傳輸等操作都是通過該socket實現的。常用的socket類型有兩種:流式socket (SOCK_STREAM)和數據報式socket(SOCK_DGRAM)。流式是一種面向連接的socket,針對於面向連接的TCP服務應用;數據報式socket是一種無連接的socket,對應於無連接的UDP服務應用。
二、Socket創建
socket函數原型為:
include
include
int socket(int domain, int type, int protocol);
功能:調用成功,返回socket文件描述符;失敗,返回-1,並設置errno
參數說明:
domain指明所使用的協議族,通常為PF_INET,表示互聯網協議族(TCP/IP協議 族;
type參數指定socket的類型:
SOCK_STREAM 提供有序、可靠、雙向及基於連接的字節流
SOCK_DGRAM 支持數據報
SOCK_SEQPACKET 提供有序、可靠、雙向及基於連接的數據報通信
SOCK_RAW 提供對原始網絡協議的訪問
SOCK_RDM 提供可靠的數據報層,但是不保證有序性
protocol通常賦值"0".
socket描述符是一個指向內部數據結構的指針,它指向描述符表入口。調用socket函數時,socket執行體將建立一個socket,實際上"建立一個socket"意味著為一個socket數據結構分配存儲空間。socket執行體為你管理描述符表。
兩個網絡程序之間的一個網絡連接包括五種信息:通信協議、本地協議地址、本地主機端口、遠端主機地址和遠端協議端口。socket數據結構中包含這五種信息。
三、Socket邦定
Bind函數原型為:
include
include
int bind(int sock_fd,struct sockaddr *my_addr, int addrlen);
功能說明:將套接字和指定的端口相連。成功返回0,否則,返回-1,並置errno.
參數說明:sock_fd是調用socket函數返回的socket描述符,
my_addr是一個指向包含有本機IP地址及端口號等信息的sockaddr類 型的指針;
addrlen常被設置為sizeof(struct sockaddr)。
struct sockaddr結構類型是用來保存socket信息的:
struct sockaddr {
unsigned short sa_family; /* 地址族, AF_xxx */
char sa_data[14]; /* 14 字節的協議地址 */
};
sa_family一般為AF_INET,代表Internet(TCP/IP)地址族;
sa_data則包含該socket的IP地址和端口號。
另外還有一種結構類型:
struct sockaddr_in {
short int sin_family; /* 地址族 */
unsigned short int sin_port; /* 端口號 */
struct in_addr sin_addr; /* IP地址 */
unsigned char sin_zero[8]; /* 填充0 以保持與struct sockaddr同樣大小 */
};
這個結構更方便使用。sin_zero用來將sockaddr_in結構填充到與struct sockaddr同樣的長度,可以用bzero()或memset()函數將其置為零。指向sockaddr_in 的指針和指向sockaddr的指針可以相互轉換,這意味著如果一個函數所需參數類型是sockaddr時,你可以在函數調用的時候將一個指向 sockaddr_in的指針轉換為指向sockaddr的指針;或者相反。
使用bind函數時,可以用下面的賦值實現自動獲得本機IP地址和隨機獲取一個沒有被占用的端口號:
my_addr.sin_port = 0; /* 系統隨機選擇一個未被使用的端口號 */
my_addr.sin_addr.s_addr = INADDR_ANY; /* 填入本機IP地址 */
通過將my_addr.sin_port置為0,函數會自動為你選擇一個未占用的端口來使用。同樣,通過將my_addr.sin_addr.s_addr置為INADDR_ANY,系統會自動填入本機IP地址。
注意在使用bind函數是需要將sin_port和sin_addr轉換成為網絡字節優先順序。
計算機數據存儲有兩種字節優先順序:高位字節優先和低位字節優先(大端和小端)。Internet上數據以高位字節優先順序在網絡上傳輸,所以對於在內部是以低位字節優先方式存儲數據的機器,在Internet上傳輸數據時就需要進行轉換,否則就會出現數據不一致。
下面是幾個字節順序轉換函數:
·htonl():把32位值從主機字節序轉換成網絡字節序
·htons():把16位值從主機字節序轉換成網絡字節序
·ntohl():把32位值從網絡字節序轉換成主機字節序
·ntohs():把16位值從網絡字節序轉換成主機字節序
Bind()函數在成功被調用時返回0;出現錯誤時返回"-1"並將errno置為相應的錯誤號。
需要注意的是,在調用bind函數時一般不要將端口號置為小於1024的值,因為1到1024是保留端口號,你可以選擇大於1024中的任何一個沒有被占用的端口號。
四、連接
面向連接的客戶程序使用connect函數來配置socket並與遠端服務器建立一個TCP連接,其函數原型為:
include
include
int connect(int sock_fd, struct sockaddr *serv_addr,int addrlen);
功能說明:客戶端發送服務請求。成功返回0,否則返回-1,並置errno。
參數說明:sock_fd 是socket函數返回的socket描述符;serv_addr是包含遠端主機IP地址和端口號的指針;addrlen是遠端地質結構的長度。
進行客戶端程序設計無須調用bind(),因為這種情況下只需知道目的機器的IP地址,而客戶通過哪個端口與服務器建立連接並不需要關心, socket執行體為你的程序 自動選擇一個未被占用的端口,並 通知你的程序數據什麼時候到端口。
connect函數啟動和遠端主機的直接連接。只有面向連接的客戶程序使用socket時才需要將此socket與遠端主機相連。無連接協議從不建立直接連接。面向連接的服務器也從不啟動一個連接,它只是被動的在協議端口監聽客戶的請求。
五、監聽
Listen函數使socket處於被動的監聽模式,並為該socket建立一個輸入數據隊列,將到達的服務請求保存在此隊列中,直到程序處理它們。
include
int listen(int sock_fd, int backlog);
功能說明:等待指定的端口的出現客戶端連接。調用成功返回0,否則,返回-1,並置errno.
參數說明:sock_fd 是socket系統調用返回的socket 描述符;
backlog指定在請求隊列中允許的最大請求數,進入的連接請求將在隊列中等待accept()它們(參考下文)。
Backlog對隊列中等待服務的請求的數目進行了限制,大多數系統缺省值為20。如果一個服務請求到來時,輸入隊列已滿,該socket將拒絕連接請求,客戶將收到一個出錯信息。
六、接受
accept()函數讓服務器接收客戶的連接請求。在建立好輸入隊列後,服務器就調用accept函數,然後睡眠並等待客戶的連接請求。
include
include
int accept(int sock_fd, void *addr, int *addrlen);
功能說明:用於接受客戶端的服務請求,成功返回新的套接字描述符,失敗返回-1,並置errno。
參數說明:sock_fd是被監聽的socket描述符,addr通常是一個指向sockaddr_in變量的指針,該變量用來存放提出連接請求服務的主機的信息(某台主機從某個端口發出該請求);addrten通常為一個指向值為sizeof(struct sockaddr_in)的整型指針變量。出現錯誤時accept函數返回-1並置相應的errno值。
首先,當accept函數監視的 socket收到連接請求時,socket執行體將建立一個新的socket,執行體將這個新socket和請求連接進程的地址聯系起來,收到服務請求的初始socket仍可以繼續在以前的 socket上監聽,同時可以在新的socket描述符上進行數據傳輸操作。