预计阅读本页时间:-
本书的结构
探索之旅指南
从在浏览器中输入网址,到屏幕上显示出网页的内容,在这个只有几秒钟的过程中,很多硬件和软件都在各自的岗位上相互配合完成了一系列的工作。本书将以探索之旅的形式,带领大家探索这一系列工作中的每一个环节。每个单独的环节都并不复杂,只要仔细阅读就一定能够理解。不过,探索之旅中出现的硬件和软件数量庞大,如果仅从微观的视角关注每一个单独的点,可能就会因为看不到整体而迷失了方向。因此,在真正出发开始探索之前,我们先来对这次探索之旅作个简单的介绍。下面的介绍中还包含一张探索之旅的路线图,万一在旅途中迷失了方向,请大家务必回来看一看这张地图。
广告:个人专属 VPN,独立 IP,无限流量,多机房切换,还可以屏蔽广告和恶意软件,每月最低仅 5 美元
网络的全貌
让我们先来看一下浏览器访问 Web 服务器这一过程的全貌。访问 Web 服务器并显示网页这一过程包含了浏览器和 Web 服务器之间的一系列交互,主要是下面这样的交互。
(1) 浏览器:“请给我 ××× 网页的数据。”
(2) Web 服务器:“好的,这就是你要的数据。”
在这一系列交互完成后,浏览器就会将从 Web 服务器接收到的数据显示在屏幕上。虽然显示网页这个过程非常复杂,但浏览器和服务器之间通过网络进行的交互却出乎意料地简单。我们在网上商城购物时输入商品名称和收货地址并发送给 Web 服务器的操作其实也差不多,如下。
(1) 浏览器:“请处理这些订单数据。”
(2) Web 服务器:“好的,订单数据已收到。”
虽然 Web 服务器在收到订单数据之后和销售系统一起对订单进行实际处理的操作很复杂,但其实浏览器和 Web 服务器之间的交互却很简单,概括如下。
(1) 浏览器向 Web 服务器发送请求。
(2) Web 服务器根据请求向浏览器发送响应。
因此,从这个层面上,也就是浏览器和 Web 服务器等网络应用程序进行交互的层面上来看,其工作方式应该还是比较容易理解的。这个层面上的交互和人类之间的对话非常相似,从这一点来说也更加容易理解 1 。
1 尽管思路很简单,但实际编写这些应用程序并不容易,需要事无巨细地设计好所有的功能,还要编写大量的代码才能完成。
要实现应用程序之间的交互,我们需要一个能够在浏览器和 Web 服务器之间传递请求和响应的机制。网络是由很多计算机等设备相互连接组成的,因此在通信的过程中需要确定正确的通信对象,并将请求和响应发送给它们。请求和响应在传递的过程中可能会丢失或损坏 2 ,因此这些情况也必须要考虑到。所以说,我们需要一种机制,无论遇到任何情况都能够将请求和响应准确无误地发送给对方。由于请求和响应都是由 0 和 1 组成的数字信息,所以可以说,我们需要的是一种能够将数字信息搬运到指定目的地的机制。
2 请求和响应的本质都是电信号和光信号,这些信号可能会因受到杂音等的干扰而损坏。
这种机制是由操作系统中的网络控制软件,以及交换机、路由器等设备分工合作来实现的,它的基本思路是将数字信息分割成一个一个的小块,然后装入一些被称为“包”(Packet)的容器中来运送。“包”这个词大家可能在用手机的时候经常会碰到 3 ,但在这里类似于邮政和快递中的概念。大家可以这样理解:包相当于信件或者包裹,而交换机和路由器则相当于邮局或快递公司的分拣处理区。包的头部存有目的地等控制信息,通过许多交换机和路由器的接力,就可以根据控制信息对这些包进行分拣,然后将它们一步一步地搬运到目的地。无论是家庭和公司里的局域网,还是外面的互联网,它们只是在规模上有所不同,基本的机制都是相同的。
3 在日语中,Packet 一词在手机中指的是“移动数据流量”,这个词来自最早的移动数据网络 GPRS(General Packet Radio Service)中的 P。——译者注
前面介绍的这个负责搬运数字信息的机制,再加上浏览器和 Web 服务器这些网络应用程序,这两部分就组成了网络。也就是说,这两部分组合起来,就是网络的全貌。本书将通过 6 章的内容,带领大家逐一探索其中的各个环节。
第 1 章 Web浏览器
我们将首先探索浏览器的工作方式。大家可以认为我们的探索之旅是从在浏览器中输入网址(URL)开始的。例如,当我们输入下面这样的网址时,浏览器就会按照一定的规则去分析这个网址的含义,然后根据其含义生成请求消息。
http://www.lab.glasscom.com/sample1.html
在上面这个例子中,浏览器生成的请求消息表示“请给我 sample1.html 这一文件中储存的网页数据”,接着浏览器会将请求消息发送给 Web 服务器。
当然,浏览器并不会亲自负责数据的传送。传送消息是搬运数字信息的机制负责的工作,因此浏览器会委托它将数据发送出去。具体来说,就是委托操作系统中的网络控制软件将消息发送给服务器。第 1 章中,我们会探索到浏览器将数据委托出去为止。
第 2 章 协议栈、网卡
第 2 章我们将探索搬运数据的机制。其中最先出场的是协议栈(网络控制软件叫作协议栈)。这个软件会将从浏览器接收到的消息打包,然后加上目的地址等控制信息。如果拿邮局来比喻,就是把信装进信封,然后在信封上写上收信人的地址。这个软件还有其他一些功能,例如当发生通信错误时重新发送包,或者调节数据发送的速率等,或许我们可以把它当作一位帮我们寄信的小秘书。
接下来,协议栈会将包交给网卡(负责以太网或无线网络通信的硬件)。然后,网卡会将包转换为电信号并通过网线发送出去。这样一来,包就进入到网络之中了。
第 3 章 集线器、交换机、路由器
接下来出场的物品会根据接入互联网的形式不同而不同。客户端计算机可以通过家庭或公司的局域网接入互联网,也可以单独直接接入互联网。很遗憾,我们的探索之旅无法涵盖所有这些可能性,因此只能以现在最典型的场景为例,假设客户端计算机是连接到家庭或公司的局域网中,然后再通过 ADSL 和光纤到户(FTTH)等宽带线路接入互联网。
在这样的场景中,网卡发送的包会经过交换机等设备,到达用来接入互联网的路由器。路由器的后面就是互联网,网络运营商会负责将包送到目的地,就好像我们把信投到邮筒中之后,邮递员会负责把信送给收件人一样。
第 4 章 接入网、网络运营商
接下来,数据从用来接入互联网的路由器出发,进入了互联网的内部。互联网的入口线路称为接入网。一般来说,我们可以用电话线、ISDN、 ADSL、有线电视、光线、专线等多种通信线路来接入互联网,这些通信线路统称为接入网。接入网连接到签约的网络运营商,并接入被称为接入点(Point of Presence,PoP)的设备。
接入点的实体是一台专为运营商设计的路由器,我们可以把它理解为离你家最近的邮局。从各个邮筒中收集来的信件会在邮局进行分拣,然后被送往全国甚至全世界,互联网也是一样,网络包首先通过接入网被发送到接入点,然后再从这里被发送到全国甚至全世界。接入点的后面就是互联网的骨干部分了。
在骨干网中存在很多运营商和大量的路由器,这些路由器相互连接,组成一张巨大的网,而我们的网络包就在其中经过若干路由器的接力,最终被发送到目标 Web 服务器上。其中的具体细节我们会在正文中进行讲解,但其实它的基本原理和家庭、公司中的路由器是相同的。也就是说,无论是在互联网中,还是在家庭、公司的局域网中,包都是以相同的方式传输的,这也是互联网的一大特征。
不过,运营商使用的路由器可跟我们家用的小型路由器不一样,它是一种可以连接几十根网线的高速大型路由器。在互联网的骨干部分,存在着大量的这种路由器,它们之间以复杂的形式连接起来,而网络包就在这些路由器之间穿行。
此外,路由器不但在规模上存在差异,在路由器间的连接方式上也存在差异。家庭和公司局域网中一般采用以太网线进行连接,而互联网中除了以太网线连接之外,还会使用比较古老的电话技术和最新的光通信技术来传送网络包。这一部分所使用的技术是当今网络中最热门的部分,可以说是最尖端技术的结晶。
第 5 章 防火墙、缓存服务器
通过骨干网之后,网络包最终到达了 Web 服务器所在的局域网中。接着,它会遇到防火墙,防火墙会对进入的包进行检查。大家可以把防火墙想象成门口的保安,他会检查所有进入的包,看看有没有危险的包混在里面。检查完之后,网络包接下来可能还会遇到缓存服务器。网页数据中有一部分是可以重复利用的,这些可以重复利用的数据就被保存在缓存服务器中。如果要访问的网页数据正好在缓存服务器中能够找到,那么就可以不用劳烦 Web 服务器,直接从缓存服务器读出数据。此外,在大型网站中,可能还会配备将消息分布到多台 Web 服务器上的负载均衡器,还有可能会使用通过分布在整个互联网中的缓存服务器来分发内容的服务。经过这些机制之后,网络包才会到达 Web 服务器。
第 6 章 Web服务器
当网络包到达 Web 服务器后,数据会被解包并还原为原始的请求消息,然后交给 Web 服务器程序。和客户端一样,这个操作也是由操作系统中的协议栈(网络控制软件)来完成的。接下来,Web 服务器程序分析请求消息的含义,并按照其中的指示将数据装入响应消息中,然后发回给客户端。响应消息回到客户端的过程和之前我们介绍的过程正好相反。
当响应到达客户端之后,浏览器会从中读取出网页的数据并在屏幕上显示出来。到这里,访问 Web 服务器的一系列操作就全部完成了,我们的探索之旅也到达了终点。
各章的结构
各章的内容分为热身问答、探索之旅的看点、正文、小测验几个部分,还有若干个专栏。
热身问答
在各章的开头有一些简单的热身题,都是判断对错的题目,大家一定要试试看。
探索之旅的看点
探索之旅的看点总结了正文将要介绍的主题,可以以此来了解该章的梗概。
正文
熟悉了看点之后就该正式出发了。在这一部分,我们将邀请经验丰富的导游来进行讲解,相信即便是不具备任何网络知识的读者也能够想象出现实中网络的样子。请大家静下心来,慢慢欣赏。
小测验
这是一些和正文内容相关的测试题,大家可以用这些题目来确认自己的理解程度。答案位于下一页中的专栏的最后。
专栏“网络术语其实很简单”
在专栏中,探索队长和探索队员会以对话的形式介绍一些网络术语的词源。这些术语大家平时可能感觉很难,但通过了解它们的词源,就能够理解其本质含义。读完这部分会让你觉得这些术语变得亲切了。
关于插图
在画图时,一般来说箭头都是从左到右绘制的,但本书则正好相反,是从右到左绘制的,这是为了和介绍包格式的图以及介绍信号波形的图的位置关系保持一致。箭头的方向和一般的习惯相反,这一点希望大家理解。