笫3版前言
本书是《Internet技术与应用教程(第二版)》一书的修订版,被列入普通高等教育
“十一五”国家级规划教材。
近年来,我国互联网的发展无论是从用户规模上,还是在网络应用方面,都呈现快
速增长的趋势。从宽带上网、个人博客的发展、IP电话的普及、CN二级域名的快速增
长,到我国目前建成的全球最大的纯IPv6下一代互联网主干网,我国的互联网进入快
速发展的阶段。据CNNIC(中国互联网络信息中心)的最新报告(2007年1月),我国
网民数量已达到1.37亿,成为Internet世界的第二大国,我国的上网计算机总数已达
5 940万台,网站数量达843 000个,国际出口带宽的总容量为256 696 Mbps。由此产生
的远程教育、远程医疗、数字图书馆、强交互点对点视频语音综合通信、智能交通、高清
晰度电视、信息发布等各种网络应用日趋广泛。Internet技术日新月异,目前的网格研
究是继传统Internet、Web之后的第三次互联网浪潮,可以称之为第三代Internet应用。
传统Internet实现了计算机硬件的连通,Web实现了网页的连通,而网格试图实现互联
网上所有资源的全面连通与共享,其中包括计算资源、存储资源、通信资源、软件资源、
信息资源、知识资源等。
本书自第二版修订后,受到读者的欢迎,重印多次。自1996年以来,作者曾先后编
写了5个版本的Internet教材,有了较多的积累。为了能充分反映Internet技术发展和
应用现状及读者的反馈意见,此次对本书进行了全面修订。修订的内容包括:软件版本.
全面升级,删除陈旧内容,增加新技术和流行工具的介绍,此次版本更新变动较大的是
第二章~第十章,以使本教材既能保持以往的风格,又能反映当前新技术的发展状况。
为方便教师教学,本教材配有电子教案,可在高等教育出版社高等理工教学资源网
上下载,网址是:http:/Avww.hep-st.com.cn.
本版由曲大成、江瑞生、李侃、徐国平修订,陈卫星、曹朝、朱铮铮、薛虎镇助编,徐国
平、徐鹏力审阅并定稿。赵香参加了绘图和文字整理工作。原书(第一版)系由曲大成、
王小勇、许健强、徐国平等编写。
书中尚存不足,敬请广大读者批评指正。
作 者
2007年4月
WWW浏览第五章
许多人在使用“Internet”这个单词时,通常将其理解为Internet中的WWW服务;
人们常说的“在网上冲浪”,也是指使用WWW服务。目前,WWW服务已成为Internet
上最受欢迎的服务,其用户与日俱增。WWW之所以如此备受人们喜爱,主要是因其
采用了多媒体技术,使其成为Internet上最有趣、最具创意、发展最快的服务。
WWW概述及工作原理
WWW的全称是World Wide Web,简称Web,中文名称为万维网或互联网。它是
由全球各种信息(文本、图片、声音和动画)所组成的网络,用户只需在浏览器中输入所
要浏览的地址,若此地址存在,就可以浏览所需要的内容。在进行WWW浏览时,通常
会涉及WWW服务器、WWW浏览器和网页文件。下面介绍其工作原理及所采用的
技术。
5.1.1 WWW起源
Internet起源于美国,而WWW则起源于瑞士日内瓦的欧洲粒子物理研究中心
(European Laboratory for Particle Physics,CERN)。如同世界上的其他地方一样,在
CERN工作的科学家们也在各自不同的部门操纵着不同的计算机系统。由于各自使用
不同的系统,造成了信息交流困难、信息资源浪费和工作重复。1989年,在CERN工作
的英国学者Tim Berners-Lee提议:在CERN建立一个以超链接方式组成的信息链接系
统Web,使CERN的工作人员能方便地实现信息的统一阅读(universal reading)。统一
阅读是Web的宗旨,旨在使人们不必考虑相互间计算机系统的类别就能快捷、方便地
进行信息交流。
5.1.2 Web浏览器的工作原理
如同大多数Internet服务一样,WWW也采用客户一服务器工作模式。客户端的
应用程序是Web浏览器,如Microsoft Internet Explorer、FireFox、Opera等;服务器端
的应用程序是WWW服务器。WWW浏览器的作用是向WWW服务器请求信息或资源,这些
信息或资源的类型包括使用HTML(HyperText Markup Language,超文本置标语言)编写的页
面、应用程序、多媒体、动画及用Java、ActiveX或脚本语言编写的文件等。当用户需要使用某一
信息或资源时,在浏览器的“地址栏”内输入所需信息的地址并按Enter键,或单击某一个超链
接,就可以通过Web浏览器向Web服务器发送一个需要此信息或资源的请求。Web服务器将
在指定位置查找相应的信息或资源,并将所找到的信息或资源发送给Web浏览器。Web浏览器
将根据所请求的资源类型做相应的处理。若所请求的资源是用HTML编写的网页文件,WWW
浏览器根据其中的HTML标签将其真正内容显示在浏览器窗口中;若所请求的是一个后缀为
.exe的应用程序,则系统会询问是否下载此应用程序。
5.1.3 Web页面和主页
在WWW中存在各种类型的文件,但最使人着迷的还是Web页面,原因就在于Web页面可
以包括文本、图片、声音、动画和其他类型的多媒体信息。可以把每一个Web页面都看做交互式
的多媒体出版物,除了可以包含文本和图片外,还可以包含声音和视频。
Web页面并不是孤立的,它们使用“超文本”(hypertext)相互联系在一起。通过“超文本”可
以在当前页面打开任何其他页面、图片、二进制文件、多媒体文件等。在Web页面中使用HTML
来指示浏览器如何显示文本、图片和多媒体以及如何链接到其他页面或Internet资源。
通常一个WWW站点都包含很多的网页文件(Web页面),而在这一系列的网页文件中,存
在一个称为“主页”(homepage)的网页文件。主页就像一本书的封面和目录,它不但反映了整个
站点所涵盖的内容,而且是访问其他Web页面的一个人口。
5.1.4超文本置标语言
超文本置标语言HTML是Web页面的标记语言,其功能是描述文档的逻辑结构和各部分
的属性。超文本置标语言包含很多的标记(tag,或称为标签或标志),这些标记位于Web页的源
文件中。用户要查看某网页文件时,浏览器将根据此网页文件所包含的这些标记来显示和管理
整个Web文档。超文本置标语言定义了Web文件的格式,同时使超链接能够嵌入Web文档中。
网页编辑人员可以使用任何文本编辑器或字处理软件将这些HTML标签添加至Web页中。
HTML是不断发展的,现在的HTML已经发展为一种新技术DHTML(Dynamic HTML,动
态HTML)。这种技术使HTML变得更为灵活,使用户可以播放动画、制作具有交互功能的
页面。
由HTML发展而来的XML(eXtensible Markup Language,可扩展置标语言)是一种供Web
上交互的结构化文档的数据格式,由W3C制订为标准。Web页面的作者可以自己制定和设计
应用XML的文件格式,而不必使用固定的HTML格式。XML具有更丰富的语法和更多的功
能,可以较容易地实现计算机系统之间的双向沟通。
5.1.5 超文本和超链接
1960年末,计算机科学家Ted Nelson提出了超文本的概念,用它来连接两个文件或页面。
超文本现在已被广泛应用于WWW中,成为WWW的基础。
1.超文本
超文本(hypertext)的出现,改变了人们的阅读习惯。文本(text)和超文本之间的最大区别
在于文本间的链接方式不同,前者就像普通书本上的文本一样,词与词之间、句子与句子之间、段
落与段落之间等都是线性链接,不能从一个条目跳至与此相关的其他条目。而超文本的链接方
式除了线性链接之外,还可以使用非线性链接,这样的链接关系同人们的思维和工作方式是比较
接近的。
2.超链接
HTML文件中除了纯文本之外,还加入了标记(tag),这些标记定义了文字或图片的显示方
式。其中有一种标记所定义的文本或图片,当光标移至此文本或图片之上时,光标会变为“手
形”,用户在这时单击此文本或图片,就会由当前位置跳转至其他位置。这就是所谓超链接
(hyperlink)。
3.超媒体
在计算机中,超媒体(hypermedia)是一个信息存储和检索系统,它把文字、图形、动画、声音
和影视等集成为一个相关的基本信息系统。如果信息主要是以文字的形式表示的,那么这个产
品就是超文本;如果信息中还包含图形、影视、动画、声音或其他媒体,则这个产品就是超媒体。
WWW是应用超媒体技术的最好例子。多媒体是超媒体的一个子集。可以说,只要是使用两种
类型以上媒体表示信息的媒体,都可以称为多媒体。
5.1.6 URL与 HTTP
URL(Uniform Resource Locater,统一资源定位地址)对于Internet来说,就像计算机中的一
个文件及其所在的路径一样,完整地描述了Internet上超文本的地址。这种地址可以位于本机
磁盘,也可以是Internet上的站点。一个完整的URL包括主机名、路径名和文件名,还包括访问
此站点中的文件时所采用的协议。典型的URL如下所示:
http://www.cuug.com/enterpriseAessonAesson.htm
其中
http:表示用于检索文档的协议。此协议是针对WWW开发的,称作超文本传送协议
(HyperText Transfer Protocol,HTTP)。
11:表明其后是Internet站点的域名。
域名后面是具有UNIX操作系统风格的路径名和文件名。示例中的文件名以.htm为后
缀,表明此文件是用HTML语言编写的超文本文件。
示例中的URL表明,当前用户正在使用超文本传送协议来读取WWW.cuug.com服务器上
enterprise目录的lesson子目录下的lesson.htm网页文件。
URL并不仅限于描述WWW文档地址,还可以描述其他服务器的地址,如FTP、Gopher、
WAIS、Usenet news和Telnet等。以FTP为例,其URL格式如下:
ftp://ftp.cdut.edu.cn/welcome.txt