我曾多次閱讀http協議,但是理解依然不深,在此,再次閱讀,再次理解。加深兩點:解析頭部信息\r\n,分解頭部和主體用\r\n\r\n。之所以一次請求會看到網絡里有很多請求,是因為瀏覽器代替訪問了多次!程序只管處理一次即可!
HTTP請求
HTTP GET、步驟1:瀏覽器首先向服務器發送HTTP請求,請求包括:
方法:GET還是POST,GET僅請求資源,POST會附帶用戶數據;
HTTP請求結構有哪幾部分組成?路徑:/html/path;
域名:由Host頭指定:Host: www.sina.com.cn
以及其他相關的Header;
如果是POST,那么請求還包括一個Body,包含用戶數據。
步驟2:服務器向瀏覽器返回HTTP響應,響應包括:
響應代碼:200表示成功,3xx表示重定向,4xx表示客戶端發送的請求有錯誤,5xx表示服務器端處理時發生了錯誤;
響應類型:由Content-Type指定;
以及其他相關的Header;
通常服務器的HTTP響應會攜帶內容,也就是有一個Body,包含響應的內容,網頁的HTML源碼就在Body中。
步驟3:如果瀏覽器還需要繼續向服務器請求其他資源,比如圖片,就再次發出HTTP請求,重復步驟1、2。
Web采用的HTTP協議采用了非常簡單的請求-響應模式,從而大大簡化了開發。當我們編寫一個頁面時,我們只需要在HTTP請求中把HTML發送出去,不需要考慮如何附帶圖片、視頻等,瀏覽器如果需要請求圖片和視頻,它會發送另一個HTTP請求,因此,一個HTTP請求只處理一個資源。
HTTP協議同時具備極強的擴展性,雖然瀏覽器請求的是http://www.sina.com.cn/
的首頁,但是新浪在HTML中可以鏈入其他服務器的資源,比如<img src="http://i1.sinaimg.cn/home/2015/1008/U8455PxDT20131008135420.png">
,從而將請求壓力分散到各個服務器上,并且,一個站點可以鏈接到其他站點,無數個站點互相鏈接起來,就形成了World Wide Web,簡稱WWW。
HTTP格式
每個HTTP請求和響應都遵循相同的格式,一個HTTP包含Header和Body兩部分,其中Body是可選的。
HTTP協議是一種文本協議,所以,它的格式也非常簡單。HTTP GET請求的格式:
GET /path HTTP/1.1
Header1: Value1
Header2: Value2
每個Header一行一個,換行符是\r\n
。
HTTP POST請求的格式:
POST /path HTTP/1.1
Header1: Value1
Header2: Value2body data goes here...
當遇到連續兩個\r\n
時,Header部分結束,后面的數據全部是Body。
HTTP響應的格式:
200 OK
Header1: Value1
Header2: Value2
body data goes here...
HTTP響應如果包含body,也是通過\r\n\r\n
來分隔的。請再次注意,Body的數據類型由Content-Type
頭來確定,如果是網頁,Body就是文本,如果是圖片,Body就是圖片的二進制數據。
當存在Content-Encoding
時,Body數據是被壓縮的,最常見的壓縮方式是gzip,所以,看到Content-Encoding: gzip
時,需要將Body數據先解壓縮,才能得到真正的數據。壓縮的目的在于減少Body的大小,加快網絡傳輸。