标签: http

基于HTTP实现的小型web服务器

主要流程为:服务器获得请求–>响应并处理请求–>返回结果。

完整的HTTP过渡到TCP实现客户端与服务器的交互过程
1.当客户端执行网络请求的时候,从url中解析出url的主机名,并将主机地址转换成ip
2.从url解析出服务器的所用端口号
3.客户端用TCP连接服务器
4.连接成功后 获取输出流,将数据以报文的形式传递给服务器
5.当服务器接收到数据之后,进行判断和解析码,并回应一条响应报文
6.客户端从输入流中获取报文,然后进行解析
7.关闭网络连接

HTTP的特点

1、支持客户端/服务器的模式
2、简单快捷 客户向服务器发送请求服务时,只需要传送请求方法和路径,每种方法规定了客户与服务器联系的类型的不同,由于HTTP协议简单,使得HTTP服务器的规模小,因此通信速度很快.
3、灵活  允许传送各种类型的数据,数据类型用Content-Type标记
4、无连接:限制每次连接只处理一个请求,服务器处理完客户的请求,收到客户的应答后,随即断开连接,这种方式节省传输时间,请求应答机制会断开
5、无状态  HTTP协议是无状态的协议,即对事务处理没有记忆功能

关于URL

即统一资源定位符,每个网页都对应一个URL地址(俗称网址),具有全球唯一性。它包含的信息指出文件的位置以及浏览器应该怎么处理它。 一个完整的URL包括协议类型、主机类型、路径和文件名。
http协议的URL格式: http: //host[:port][abs_path] ,http表示使用http协议来进行资源定位;host是主机域名;port是端口号,一般有默认的;abs_path代表资源的路径。
这里我主要介绍项目中涉及的URL的两种格式—URL带参数和不带参数的。
%title插图%num

HTTP的请求与响应格式

%title插图%num

响应报头中的状态码和状态码描述,例如:当请求的资源不存在时,会收到“404 NotFound”的页面,404就是状态码,“NotFound”就是状态码描述,即请求的文件不存在。

1.实现支持GET和POST方法的小型http服务器
GET方法:如果GET方法只是简单的请求一份资源,而不传递参数的话则由服务器直接将资源返回即可。如果GET方法的url中带有参数的话,则就要使用CGI模式进行处理。
POST方法:POST方法要使用CGI模式进行处理,POST的参数在消息中文中出现。
使用GET方法使用的是带参数的url,传递的参数会使用?连接在资源后面POST方法使用的是不带参数的url 它的参数是通过http请求正文传递给服务器的,http的请求和响应模式

响应报头中的状态码和状态码描述,举个例子,当请求的资源不存在的时,会收到”404 NotFound”的页面,404就是状态码,

“NotFound”就是状态码描述,既请求的文件不存在

状态码表示响应类型

1×× 保留

2×× 表示请求成功地接收

3×× 为完成请求客户需进一步细化请求

4×× 客户错误

5×× 服务器错误

响应头的信息包括:服务程序名,通知客户请求的URL需要认证,请求的资源何时能使用

 

HTTP服务器实现框架

1.面向链接:http协议是基于TCP通信协议,因此实现web服务器的*步至少要能实现两个主机不同进程之间的TCP通信,并且需要解决高并发问题所以这里推荐使用多线程服务器来构建,每次创建出来一个新线程出来的时候将线程分离,然后让这个新线程去处理这个请求.
2.分析出请求行: 当服务器接收到请求后,首先知道的是HTTP服务器版本号,和请求方法。web服务器是要支持cgi模式: 请求的方法不同,cgi可能也不同,我们实现的知识比较简单单的处理GET和POST方法
3.判断cgi模式
//    1)当我们判断出来是GET请求时候,并且url中没有参数的话,就用非CGI模式,非CGI模式处理//起来比较简单,首先解析出来请求路径,判断是不是合法资源,如果是就直接返回这个资源。
//    2)当是CGI模式处理请求的时候,我们要fork一个子进程,对子进程exec替换CGI程序,这个
//过程中使用pipe进行父子进程之间的通信。所有需要的参数在exec之前,都将这些参数导出为环境变//量,就算exec的话,子进程还是能够通过环境变量获取所需的参数。
4.响应客户端:此时我们已经知道了方法以及是否为cgi模式,然后开始读取URL,这里有一个细节非cgi模式 请求参数会跟在url当中,如果cgi模式的话,参数在消息正文中,然后我们读取到路径,判断路径当中资源是否存在,如果存在判断这个资源是一个目录,普通文件还是一个可执行程序

这里分情况分析
1)如果是cgi模式,直接进入cgi内部运行;只要是POST方法就需要支持cgi,直接进入cgi函数内部运行.
2)如果是非cgi模式时一定是GET方法并且没有参数,此时进入wwwroot()函数内部即可,该函数会将所请求的资源以html的格式返回给浏览器.

 

接下来是解释运行cgi模式,首先服务器要从浏览器读取参数,然后创建出来一个子进程去执行cgi部分的可执行资源,父进程通过环境变量的方式传递给子进程,子进程运行完成之后呢,将结果交给父进程,父进程再将数据输出给浏览器. 所以父进程在这个例子当中就向是一个中介,只进行参数和结果的转交实际上并不会执行任何资源,因此将子进程的输入输出文件描述符重定向,就可以让子进程直接与浏览器”联系”.

 

%title插图%num

父进程做的事情

1.创建两个管道,并关闭相应的文件描述符
2.POST方法:继续读取数据,直到读完POST的参数部分GET方法:直接从子进程读取结果
3.将数据和方法全部交给子进程后等待子进程的结果
子进程做的事情

1.关闭管道适当的文件描述符
2.对标准输入输出进行重定向
3.通过环境变量传递参数
4.进行exec程序替换

一次完整的http请求的流程
%title插图%num

项目文件

%title插图%num

目录:
python:爬取小说和招聘信息的代码

sql_connect:存放mysql需要的lib库   连接mysql程序文件
wwwroot:web服务器工作的根目录,包含各种资源页面(例如默认的index.html页面,差错处理的404页面),以及执行cgi的可执行程序

文件:

makefile:编译整个项目
httpd.h:服务器的方法声明
httpd.c:方法实现
main.c:服务器的主逻辑

 

数据库中的操作
没有索引的时候会进行整个表的扫描
添加索引 索引会形成一颗二叉树  利用二分查找的方法。

遇到的问题:
1.运行cgi后不能显示在页面上,便尝试着写一个简单的CGI程序看自己的CGI是否真的能跑完,结果CGI没有问题,后来尝试用telnet工具模拟一次http,看看是否真的收到了网页回复,后来分析结果,对比之后发现返回的东西不能显示,之后给html加了一些p标签,便可以显示出来。
2. 经常会出现类似于:undefined reference to `sql_connecter::~sql_connecter()’的问题,文件编译的路径不对。
3.调用数据库的数据显示到html文件中出现乱码的问题,*初以为自己编码格式有问题,后来发现是数据库编码格式和浏览器的编码格式不一样,数据库使用utf8编码方式,浏览器是GB2312,后来浏览器使用utf8编码格式,能够正常显示。

4.代码中会需要int *和 void*的转换,用到C++强制转换形如  int*  data = reinterpret_cast<int*>(arg);

5.本地环回测试ok,Linux下的浏览器测试也可以,但不能接外部的浏览器访问(没有设置桥接模式) 在外部浏览器测试的话千万别忘记关闭防火墙

6.运行程序时会提醒挺行下载页面,因为在响应报头有问题中。而浏览器对于不能识别或解析的实体,都会提醒用户下载。

tomcat服务器、http

一、Tomcat服务器(会)
1、Web开发概述
javaSE:

javaEE:13种

javaME:

JavaEE规范: 13种技术的总称。Servlet/Jsp  JDBC  JNDI JTA…

Tomcat:Servlet/Jsp容器,轻量级服务器。

 

2、Tomcat的安装与配置
3.1、安装:
直接解压到指定目录即可。(注:目录不要太深;目录不要有中文或空格)

3.2、启动服务器:
F:\apache-tomcat-7.0.52\bin\startup.bat

启动服务器的前题:

配置JAVA_HOME:jdk的安装路径  path=%JAVA_HOME%\bin

进入到F:\apache-tomcat-7.0.52\bin>startup.bat才能执行命令

配置CATALINA_HOME: 没必要配置

F:\apache-tomcat-7.0.52

 

startup.bat 启动命令

shutdown.bat 停止命令

 

 

如果tomcat端口被占用,解决办法

> 修改F:\apache-tomcat-7.0.52\conf\server.xml

第70行:  <Connector port=”8081″/>

> 关闭端口号对应的进程:

cmd–>netstat-ano –>找到pid–>任务管理器–>显示pid–>关闭进程

3.3、测试服务器是否启动成功
http://localhost:8080

 

 

3.4、Tomcat的主要目录:(重要)
3、标准的JavaWeb应用的目录结构(很重要:记住)
应用:

MyApp

1.html

Css

myStyle.css

Js

My.js

WEB-INF : 注意:固定写法。此目录下的文件不能被外部直接访问。

classes:    我们编写的程序代码。.class文件

lib :  应用需要用的jar文件
web.xml  : 应用的配置信息

4、部署应用到Tomcat服务器
手动部署

> 开放目录部署方式

首先在F:\apache-tomcat-7.0.52\webapps下自己创建一个文件夹

然后把应用下webroot里面的内容直接复制到这个文件夹里面。

> 把应用打成war包。

打war包命令:jar  -cvf  MyApp.war .

把war包直接复制到F:\apache-tomcat-7.0.52\webapps下,应用自动解压

 

注:webapps目录下有几个目录就代表有几个应用;webapps就默认代表服务器的根目录。

 

自动部署

Tomcat服务器与MyEclipse集成(一定要掌握)

1、Tomcat集成

2、创建web应用

3、部署

 

修改myeclipse自带tomcat端口号方法:在myEclipse界面的左边,Servers->MyEclipseTomcat v7.0-config->server.xml   进到里面修改端口号(20,63,83行处)

 

URL: 统一资源定位符(网址)

URI: 统一资源标识符

http://localhost:8080/day08_02/1.html

协议  主机IP(端口号) URI(当前应用的资源路径)

 

5、配置默认端口、默认应用、默认主页
A、把server.xml中<Connector port=”80″protocol=”HTTP/1.1″

connectionTimeout=”20000″

redirectPort=”8443″/>

浏览器http默认端口:80

B、默认应用:

默认应用:把配置的虚拟目录的配置文件名改为ROOT.xml即可。

C、默认主页

修改当前应用web.xml,添加以下内容:

当前的应用被执行了 在服务器端部署应用的过程

1安装服务器

2.打开服务器

3.创建应用

4.应用的发布: 手动发布:将应用(webroot下)放在服务器的webapps下面

自动发布:利用myeclipse实现发布 通过在myeclipse中安装服务器实现对服务器的操作 >安装的过程有两种:

1.使用myeclipse自带的服务器 2.使用单独的服务器与myeclipse关联 5.测试

 

 

二、HTTP协议
1、HTTP协议概述
> HTTP是HyperText Transfer Protocol(超文本传输协议)的简写,传输HTML文件。

> 用于定义WEB浏览器与WEB服务器之间交换数据的过程及数据本身的格式。

 

2、请求部分
1、请求消息行

GET  /day08_02/1.html  HTTP/1.1

请求方式:Get(默认) POST  DELETE  HEAD等

GET:明文传输 不安全,数据量有限,不超过1kb

GET/day08_02/1.html?uName=tom&pwd=123 HTTP/1.1

POST: 暗文传输,安全。数据量没有限制。

 

URI:统一资源标识符。去协议和IP地址。

 

协议/版本 :

 

2、请求消息头

从第2行到空行处,都叫消息头

Accept:浏览器可接受的MIME类型

告诉服务器客户端能接收什么样类型的文件。

Accept-Charset: 浏览器通过这个头告诉服务器,它支持哪种字符集

Accept-Encoding:浏览器能够进行解码的数据编码方式,比如gzip

Accept-Language:浏览器所希望的语言种类,当服务器能够提供一种以上的语言版本时要用到。可以在浏览器中进行设置。

Host:初始URL中的主机和端口

Referrer:包含一个URL,用户从该URL代表的页面出发访问当前请求的页面

Content-Type:内容类型

 

告诉服务器浏览器传输数据的MIME类型,文件传输的类型

application/x-www-form-urlencoded

 

If-Modified-Since: Wed, 02 Feb 2011 12:04:56 GMT利用这个头与服务器的文件进行比对,如果一致,则从缓存中直接读取文件。

User-Agent:浏览器类型.

Content-Length:表示请求消息正文的长度

Connection:表示是否需要持久连接。如果服务器看到这里的值为“Keep -Alive”,或者看到请求使用的是HTTP 1.1(HTTP 1.1默认进行持久连接

Cookie:这是*重要的请求头信息之一 (在讲会话时解析)

Date:Date: Mon, 22Aug 2011 01:55:39 GMT请求时间GMT

 

3、消息正文: 当请求方式是POST方式时,才能看见消息正文

uName=tom&pwd=123

3、响应部分
1、响应消息行

*行:

HTTP/1.1   200  OK

协议/版本   响应状态码  对响应码的描述(一切正常)

响应状态码:

常用的就40多个。

200(正常)  一切正常

302/307(临时重定向)

304(未修改)

表示客户机缓存的版本是*新的,客户机可以继续使用它,无需到服务器请求。

404(找不到)  服务器上不存在客户机所请求的资源。

500(服务器内部错误)

 

2、响应消息头

Location: http://www.it315.org/index.jsp指示新的资源的位置

通常和302/307一起使用,完成请求重定向

Server:apachetomcat指示服务器的类型

Content-Encoding: gzip服务器发送的数据采用的编码类型

Content-Length:80 告诉浏览器正文的长度

Content-Language:zh-cn服务发送的文本的语言

Content-Type: text/html; charset=GB2312服务器发送的内容的MIME类型

Last-Modified:Tue, 11 Jul 2000 18:23:51 GMT文件的*后修改时间

Refresh: 1;url=http://www.it315.org指示客户端刷新频率。单位是秒

Content-Disposition: attachment; filename=aaa.zip指示客户端下载文件

Set-Cookie:SS=Q0=5Lb_nQ;path=/search服务器端发送的Cookie

Expires: -1

Cache-Control: no-cache (1.1)

Pragma: no-cache  (1.0)  表示告诉客户端不要使用缓存

Connection:close/Keep-Alive

Date:Tue, 11 Jul 2000 18:23:51 GMT
————————————————
版权声明:本文为CSDN博主「Bigoted_」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。
原文链接:https://blog.csdn.net/Bigoted_/article/details/79320809

友情链接: SITEMAP | 旋风加速器官网 | 旋风软件中心 | textarea | 黑洞加速器 | jiaohess | 老王加速器 | 烧饼哥加速器 | 小蓝鸟 | tiktok加速器 | 旋风加速度器 | 旋风加速 | quickq加速器 | 飞驰加速器 | 飞鸟加速器 | 狗急加速器 | hammer加速器 | trafficace | 原子加速器 | 葫芦加速器 | 麦旋风 | 油管加速器 | anycastly | INS加速器 | INS加速器免费版 | 免费vqn加速外网 | 旋风加速器 | 快橙加速器 | 啊哈加速器 | 迷雾通 | 优途加速器 | 海外播 | 坚果加速器 | 海外vqn加速 | 蘑菇加速器 | 毛豆加速器 | 接码平台 | 接码S | 西柚加速器 | 快柠檬加速器 | 黑洞加速 | falemon | 快橙加速器 | anycast加速器 | ibaidu | moneytreeblog | 坚果加速器 | 派币加速器 | 飞鸟加速器 | 毛豆APP | PIKPAK | 安卓vqn免费 | 一元机场加速器 | 一元机场 | 老王加速器 | 黑洞加速器 | 白石山 | 小牛加速器 | 黑洞加速 | 迷雾通官网 | 迷雾通 | 迷雾通加速器 | 十大免费加速神器 | 猎豹加速器 | 蚂蚁加速器 | 坚果加速器 | 黑洞加速 | 银河加速器 | 猎豹加速器 | 海鸥加速器 | 芒果加速器 | 小牛加速器 | 极光加速器 | 黑洞加速 | movabletype中文网 | 猎豹加速器官网 | 烧饼哥加速器官网 | 旋风加速器度器 | 哔咔漫画 | PicACG | 雷霆加速