Web基础和HTTP协议

导读:本篇文章讲解 Web基础和HTTP协议,希望对大家有帮助,欢迎收藏,转发!站点地址:www.bmabk.com


前言

我们访问的网页会分为不同的类型,有的网页显示的内容比较单一,有的网页现实的内容可以是多变的,这也就是本文会介绍到的页面的问题,日常还有很多域名的问题等

一、Web基础

1、域名的概念

1.网络是基于 TCP/IP 协议进行通信和连接的,每一台主机都有一个唯一的固定的 IP 地址,以区别于网络上成千上万个用户和计算机。

2.网络中的地址方案分为两套:IP 地址系统和域名地址系统,两套地址系统是一一对应的。

3.由于 IP 地址是数字标识,使用时难以记忆和书写,因此在IP地址的基础上发展出一种符号化的地址方案,来代替数字型的IP地址。

4.每个符号化的地址都与特定的 IP 地址对应,这样网络上资源访问起来就比较容易的多,这个与网络上的数字型
IP地址相对应的字符型地址,就是域名。

2.web网页

网页是构成网站的基本元素,是承载各种网站应用的平台,网页是由HTML编写的

2.1 网页概述

网页是一个文件,主页就是用户打开网站时默认打开的网页(也可称为首页)
网页页面是由一个文件来承载的,经浏览器或其他工具翻译后,可得”页面形式“的图形化页面/ui页面

2.2 网页相关概念

网页
纯文本格式文件、编写语言为HTML、HTML5(html的加强版)
在用户的浏览器中被“翻译”成网页形式显示出来
网站
由一个一个页面构成的,是多个网页的结合体
主页
打开网站后出现的第一个网页称为网站主页(或首页)
域名
浏览网页时输入的网址
HTTP/HTTPS
用来传输网页的通信协议(是否加密),是一种通讯/交互的标准/规范
URL
是一种万维网寻址系统;在万维网中一个具体的地址
HTML
用来编写网页的超文本标记语言
超链接
超链接是将网站中不同网页链接起来的功能
发布
将制作好的网页.上传到服务器供用户访问的过程
写网页文件–》调试网页文件效果–》给用户使用(放到指定站点目录,例如:/var/www/html)

普通用户:访问web的话输入域名
①基础概念:什么是域名
描述一组服务器网卡IP映射关系的友好表达(访问服务器的网址,ip不好记)
②域名和IP周末映射:通过地址解析协议(DNS)
③如何解析:迭代,递归
④完整域名组成,根域,顶级域,二级域
,主机名
⑤其它
域名注册步骤: 准备申请资料——》寻找域名注册网站——》查询域名——》正式申请——》申请成功

二、web

1.web概述

Web(World Wide Web)即全球广域网,也称为万维网,是一种分布式图形信息系统,建立在Internet上的一种网络服务

2.Web1.0与Web2.0

Web1.0

以编辑为特征,网站提供给用户的内容是编辑处理后的,然后用户阅读网站提供的内容
这个过程是网站到用户的单向行为

Web2.0

更注重用户的交互作用,用户既是网站内容的消费者(浏览者),也是网站内容的制造者,加强了网站与用户之间的互动,网站内容基于用户提供,网站的诸多功能也由用户参与建设,实现了网站与用户双向的交流与参与
**Web2.0特征:**用户分享、以兴趣为聚合点的社群、开放的平台,活跃的用户

3.静态页面与动态页面

静态页面

定义

静态网页是标准的HTML文件
扩展名是.htm .html
例如文本、图像、声音、Flash动画、客户端脚本和Activex控件及Java小程序等
是网站建设的基础,早期网站一般都由静态网页制作,没有后台数据库、不含程序和不可交互的网页,相对更新起来比较麻烦,适用于一般更新较少的展示型网站

静态页面的特点

1.每个静态网页都有一个固定的URL,且URL以.htm、.html、.shtml等常见形式为后缀,而不含有”?”

2.网页内容一经发布到网站服务器上,无论是否有用户访问,每个静态网页都是保存在网站服务器上的

3.静态网页的内容相对稳定,容易被搜索引擎检索

4.静态网页没有数据库的支持,在网站制作和维护方面工作量较大,因此当网站信息量很大时完全依靠静态网页制作方式比较困难

5.静态网页的交互性较差,在功能方面有较大的限制

6.页面浏览速度迅速,过程无需连接数据库,开启页面速度快于动态页面

动态页面

定义

网页URL不固定,能通过后台与用户交互
在动态网页网址中有一个标志性的符号——“?”
常用的语言有PHP、JSP、Python、Ruby等

动态网页的特点

交互性
网页会根据用户的要求和选择而动态改变和响应,将浏览器作为客户端界面,这是WEB当前的使用类型

自动更新
无须手动地更新HTML文档,便会自动生成新的页面,可以大大节省工作量

因时因人而变
当不同的时间,不同的人访问同一网址时会产生不同的页面

静态,动态的区别

1.交互性
2.信息更新(静态人为,动态自动)
3.动态页面会因人因时访问同一网址产生不同页面,静态动不了
4.静态页面的打开、访问速度快,动态较慢
5.静态URL固定,动态不固定
6.URL中包不包含?,静态没有,动态有
7.访问过程中,动态可以使用数据库,静态不需要

三、HTTP协议

1.HTTP概述

HTTP ( 超文本传输协议HyperText TransferProtocol)协议是互联网上应用最为广泛的一种网络协议,它是基于TCP协议的应用层传输协议,简单来说就是客户端和服务端进行数据传输的一种规则

HTTP/HTTPS是应用层上的协议,建立在传输层TCP之上,客户端通过与服务端进行TCP连接(三次握手),之后发送HTTP请求与接收HTTP响应都是通过访问Socket接口来调用TCP协议实现

HTTP 是一种无状态 (stateless) 协议,HTTP协议本身不会对发送过的请求和相应的通信状态进行持久化处理(存储,保存)。这样做的目的是为了保持HTTP协议的简单性,从而能够快速处理大量的事务,提高效率。

然而,在许多应用场景中,我们需要保持用户登录的状态或记录用户购物车中的商品。由于HTTP是无状态协议,所以必须引入一些技术来记录管理状态,例如Cookie。

HTTP协议的版本

HTTP 0.9已过时

HTTP 1.0(完善的请求、响应模型 并且协议补充(完整) get post head方法)

HTTP 1.1(新增五种请求方式:OPTIONS PUT DELETE TRACE CONNECT)

HTTP 2.0

HTTP1.0和HTTP1.1的区别

1.缓存处理
在HTTP1.0中主要使用header里的If-Modified-Since,Expires来做为缓存判断的标准,HTTP1.1则引入了更多的缓存控制策略例如Entity tag,If-Unmodified-Since, If-Match, If-None-Match等更多可供选择的缓存头来控制缓存策略。
2.带宽优化及网络连接的使用
HTTP1.0中,存在一些浪费带宽的现象,例如客户端只是需要某个对象的一部分,而服务器却将整个对象送过来了,并且不支持断点续传功能,HTTP1.1则在请求头引入了range头域,它允许只请求资源的某个部分,即返回码是206(Partial Content),这样就方便了开发者自由的选择以便于充分利用带宽和连接
3.错误通知的管理
在HTTP1.1中新增了24个错误状态响应码,如409(Conflict)表示请求的资源与资源的当前状态发生冲突;410(Gone)表示服务器上的某个资源被永久性的删除
4.Host头处理
在HTTP1.0中认为每台服务器都绑定一个唯一的IP地址,因此,请求消息中的URL并没有传递主机名(hostname)。但随着虚拟主机技术的发展,在一台物理服务器上可以存在多个虚拟主机(Multi-homed Web Servers),并且它们共享一个IP地址。HTTP1.1的请求消息和响应消息都应支持Host头域,且请求消息中如果没有Host头域会报告一个错误(400 Bad Request)
5.长连接
HTTP 1.1支持长连接(PersistentConnection)和请求的流水线(Pipelining)处理,在一个TCP连接上可以传送多个HTTP请求和响应,减少了建立和关闭连接的消耗和延迟,在HTTP1.1中默认开启Connection: keep-alive,一定程度上弥补了HTTP1.0每次请求都要创建连接的缺点。

2.HTTP 请求格式( GET / POST 方式 )

HTTP 支持几种不同的请求命令,这些命令被称为 HTTP 方法,每条 HTTP 请求报文都包含一个方法,告诉服务器要执行什么动作,包括获取一个页面、允许一个网关程序、删除一个文件等。
其中,最常用的方法是 GET、POST

GET请求方式

请求行

请求的方式

请求的资源路径

请求的版本协议号

请求头(描述信息/标准化信息)

Accept:客户端可以接受的数据类型

Accept-Language:客户端可以接受的语言类型

User-Agent:浏览器的信息

Accpect-Encoding:客户端可以接受的编码格式

Host:表示请求的ip和端口号

Connection:告诉服务器请求连接如何处理

Keep-Alive:通知服务器回传数据不要马上关闭,保持一小段的连接

Closed:马上关闭

POST请求方式

请求行

请求的方式

请求的资源路径

请求的协议的版本号

请求头

Accept:客户端可以接受的数据类型

Accept-Language:客户端可以接受的语言类型

Referer:表示请求发起时,浏览器地址栏中的地址

User-Agent:浏览器的信息

Content-Type:发送的数据类型

Content-Length:发送的数据长度

请求体

就是发送给服务器的数据

GET 与POST 区别(*)

区别一:语义上的区别
Get向服务器请求数据,依照HTTP协议,get 是用来请求数据。

Post向服务器发数据,依照HTTP协议,Post的语义是向服务器添加数据,也就是说按照Post的语义,该操作是会修改服务器上的数据
区别二:服务器请求的区别
Get请求是可以被缓存,示例:访问百度,访问的方式就是GET,此时访问后的内容会缓被存在浏览器中,短时间再次访问,其实是拿到的浏览器中的缓存内容
另外Get请求只能接收ASCII码的回复

Post请求是不可以被缓存的。对于Post方式提交表单,刷新页面浏览器会弹出提示框“是否重新提交表单”,Post可以接收二进制等各种数据形式,所以如果要上传文件一般用Post请求
区别三:参数放请求头和请求体的差别
Get请求通常没有请求体(当然这也是可以由程序猿心情改变的),在TCP传输中只需传输一次(而不是一个包),所以Get请求效率相对高。

Post请求将数据放在请求体中,而实际传输中,会先传输完请求头,再传输请求体,是分为两次传输的(而不是两个包)。Post请求头会比Get更小(一般不带参数),请求头更容易在一个TCP包中完成传输,更何况请求头中有Content-Length的标识,可以更好地保证Http包的完整性。

简单理解:
GET方法
从指定的服务器上获得数据
GET请求能被缓存
GET请求会保存在浏览器的浏览记录里(cookie)
GET请求由长度限制
主要用于获取数据
查询的字符串会显示在URL中,不安全
POST方法
提交给数据给指定服务器处理
POST请求不能被缓存
POST请求不会保存在浏览器的记录里面
POST请求没有长度限制
查询的字符串不会显示在URL中,比较安全

3.HTTP状态码(****)

当使用浏览器访问一个URL,会根据处理情况返回相应的处理状态
通常正常的状态码为2xx,3xx
如果出现异常会返回4xx,5xx

状态码首位 已定义范围 分类
1xx 100-101 信息类提示
2xx 200-206 成功
3xx 300-305 重定向
4xx 400-415 客户端报错
5xx 500-505 服务器错误

生产环境常见的HTTP状态返回码

消息 描述
200 ok 请求成功( 其后是对GET和POST请求的应答文档)
301 Moved Permanently 请求的永久页面跳转
403 Forbidden 禁止访问该页面
404 Not Found 服务器无法找到被请求的页面
500 Internal Server Error 内部服务器错误
502 Bad Gateway 无效网关
503 Service Unavailable 当前服务不可用
504 Gateway Timeout 网关请求超时

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。

文章由半码博客整理,本文链接:https://www.bmabk.com/index.php/post/76547.html

(0)

相关推荐

半码博客——专业性很强的中文编程技术网站,欢迎收藏到浏览器,订阅我们!