一、Apache概述安装

1. 介绍

Apache HTTP Server(简称Apache)是Apache软件基金会的一个开源的网页服务器,是世界使用排名第一的Web服务器软件。它可以运行在几乎所有广泛使用的计算机平台上,由于其跨平台和安全性被广泛使用,是最流行的Web服务器端软件之一。

apache的服务名称是httpd

[apache官网](<https://apache.org/>)

[httpd2.4官方文档](http://httpd.apache.org/docs/2.4/)

2. 安装

[root@itcast ~]# yum -y install httpd

3. 快速入门

3.1 apache基本管理

# apache状态管理
[root@itcast ~]# systemctl start|stop|restart|reload|status httpd.service

# 设置apache开机启动
[root@itcast ~]# systemctl enable httpd.service

# 设置apache开机不启动
[root@itcast ~]# systemctl disable httpd.service

3.2 站点根目录

apache默认站点根目录:var/www/html

3.3 apache服务目录介绍

# /etc/httpd/
├── conf											  							# 主配置文件目录
│   ├── httpd.conf
│   └── magic
├── conf.d																		# 模块化配置文件目录(辅助配置文件目录)
│   ├── autoindex.conf
│   ├── README
│   ├── userdir.conf
│   └── welcome.conf
├── conf.modules.d														# 模块配置文件目录
│   ├── 00-base.conf
│   ├── 00-dav.conf
│   ├── 00-lua.conf
│   ├── 00-mpm.conf
│   ├── 00-proxy.conf
│   ├── 00-systemd.conf
│   └── 01-cgi.conf
├── logs -> ../../var/log/httpd								# 日志目录
├── modules -> ../../usr/lib64/httpd/modules	# 模块目录
└── run -> /run/httpd	     										# 运行时目录

3.4 apache用户

apache在安装后会创建一个叫做apache的用户, apache的子进程就是用这个用户运行的

[root@itcast www]# tail -1 /etc/passwd
apache:x:48:48:Apache:/usr/share/httpd:/sbin/nologin

4.apache基本概念

4.1 apache进程

  • apache默认监听TCP协议的80端口
  • apache默认会启动一个主进程(控制进程)和多个子进程

查看apache相关进程:

[root@itcast html]# ps aux | grep httpd

其中root运行的是主进程,apache身份运行的是子进程,主进程的id保存在/etc/httpd/run/httpd.pid文件内。真正用来处理web请求的是子进程,主进程用来管理子进程。

4.2 apache模块

  • apache是一个模块化设计的服务,核心只包含主要功能,扩展功能通过模块实现(可扩展性强,各功能依赖性低)。不同模块可以被静态的编译进程序,也可以动态加载。
  • 模块的动态加载通过DSO(Dynamic shared Object)实现。

查看模块

[root@itcast html]# httpd -M

二、apache配置详解及实践

1、配置文件说明

1.1 主配置文件位置

/etc/httpd/conf/httpd.conf

1.2 配置文件格式

#directive(指令)			value(值)
 ServerRoot				 "/etc/httpd"

2、配置项详解

2.1 ServerRoot

服务所在目录的路径,不需要做修改

ServerRoot "/etc/httpd"

2.2 Listen

监听端口

#Listen 12.34.56.78:80                                                                                                                 
Listen 80 

配置语法

Listen [IP-address:]portnumber [protocol]

实践

# 1. 修改端口号
Listen 8080

# 2. Listen指令可重复出现多次
Listen 8080
Listen 80

# 注意:修改后必须重启服务才可生效
[root@itcast conf]# systemctl restart httpd.service

2.3 Include

导入配置文件

Include conf.modules.d/*.conf				

2.4 IncludeOptional

和include功能相同,都是导入配置文件的。区别是IncludeOptional导入的路径有问题时会被忽略。不会报错。

IncludeOptional conf.d/*.conf		  

2.5 User和Group

httpd服务子进程启动时的账号和组,这个不用修改

User apache
Group apache

2.6 ServerAdmin

服务运行时的管理员邮箱地址

ServerAdmin root@localhost

2.7 DocumentRoot

站点根目录

DocumentRoot "/var/www/html"

语法

DocumentRoot directory-path

实践

#DocumentRoot "/var/www/html"                                                                                                          
DocumentRoot "/www"

#<Directory "/var/www/html">                                                                                 
<Directory "/www">   

2.8 Directory

确定访问目录位置,标签配置。标签内是设置针对该目录的访问权限

<Directory "/var/www/html">
    Options Indexes FollowSymLinks			# 访问时的展示形式,Indexes索引展示
    AllowOverride None									# 设置指令是否可以在.htaccess使用
    Require all granted									# 允许所有人访问
</Directory>
  • Options 访问时展示形式

    Options Indexes 当前目录下没有默认页面,就显示目录结构

        Options FollowSymLinks   默认设置,允许访问符号链接
    

    Options None 关闭

  • AllowOverride .htaccess文件中允许的指令类型

    AllowOverride All 全部指令

    AllowOverride None 默认值,不允许

    AllowOverride directive-type [directive-type] … 具体指令类型

  • Require 访问权限设置

    Require all granted 无条件允许访问

    Require all denied 无条件拒绝访问

    Require method http-method [http-method] … 仅允许给定的HTTP方法访问

    Require ip 10 172.20 192.168.2 指定ip地址范围的客户端可以访问

实践

# 1. 去掉Indexes查看效果,注意改完配置后要重启http服务
<Directory "/var/www/html">
    Options FollowSymLinks
    AllowOverride None
    Require all granted
</Directory>

# 2. 去掉FollowSymLinks
<Directory "/var/www/html">
    Options None
    AllowOverride None
    Require all granted
</Directory>

# 3. 使用Require
<Directory "/var/www/html">
    Options None
    AllowOverride None
    Require all denied					# 无条件拒绝访问
</Directory>

<Directory "/var/www/html">
    Options None
    AllowOverride None
    Require method POST            # 仅允许post请求
</Directory>

2.9 IfModule

以特定模块存在与否为条件的处理指令

# 如果dir_module存在,执行DirectoryIndex
<IfModule dir_module>                                                                                                                  
    DirectoryIndex index.html                   # 站点默认展示页                                                                                       
</IfModule>      

语法

DirectoryIndex disabled | local-url [local-url] …

默认

DirectoryIndex index.html

实践

# 在站点根目录下创建一个index.html
[root@itcast html]# echo \'myindex\' > index.html

2.10 Files

包含适用于匹配文件名的指令

<Files ".ht*">
    Require all denied			  # 以.ht开头的文件拒绝提供访问
</Files>

2.11 ErrorLog

错误日志记录位置

ErrorLog "logs/error_log"

2.12 LogLevel

错误日志记录级别

LogLevel warn

错误级别选项

水平 描述
emerg 紧急情况 – 系统无法使用。
alert 必须立即采取行动。
crit 关键条件。
error 错误条件。
warn 警告条件。
notice 正常但重要的情况。
info 基本信息
debug 调试级消息

2.13 IfModule log_config_module

访问日志配置模块

<IfModule log_config_module>
		# 访问日志3种格式: combined,common, combinedio
    LogFormat "%h %l %u %t \"%r\" %>s %b \"%{Referer}i\" \"%{User-Agent}i\"" combined
    LogFormat "%h %l %u %t \"%r\" %>s %b" common

    <IfModule logio_module>
      # You need to enable mod_logio.c to use %I and %O
      LogFormat "%h %l %u %t \"%r\" %>s %b \"%{Referer}i\" \"%{User-Agent}i\" %I %O" combinedio
    </IfModule>
    
    # 确定访问日志位置和使用哪种日志格式
    CustomLog "logs/access_log" combined
</IfModule>

日志格式说明

标识 含义
%h 客户端ip
%l Remote User, 通常为一个减号(“-”);
%u Remote user (from auth; may be bogus if return status (%s) is 401);非为登录访问时,其为一个减号;
%t 服务器收到请求时的时间;
%r First line of request,即表示请求报文的首行;记录了此次请求的“方法”,“URL”以及协议版本;
%>s 响应状态码;
%b 响应报文的大小,单位是字节;不包括响应报文的http首部;
%{Referer}i 请求报文中首部“referer”的值;即从哪个页面中的超链接跳转至当前页面的;
%{User-Agent}i 请求报文中首部“User-Agent”的值;即发出请求的应用程序;

2.14 IfModule alias_module

文档映射

<IfModule alias_module>
    #
    # Redirect: Allows you to tell clients about documents that used to 
    # Example:
    # Redirect permanent /foo http://www.example.com/bar

    # Alias: Maps web paths into filesystem paths and is used to
    # Example:
    # Alias /webpath /full/filesystem/path

    # ScriptAlias: This controls which directories contain server scripts. 
    ScriptAlias /cgi-bin/ "/var/www/cgi-bin/"   # cgi脚本映射
</IfModule>

Redirect 外部重定向

Alias 将url映射到文件系统个位置

ScriptAlias 将url映射到CGI脚本

2.15 AddDefaultCharset

响应内容的编码格式

AddDefaultCharset UTF-8

三、虚拟主机配置

虚拟主机指的是在单一机器上运行多个网站.

虚拟主机可以“基于IP”,即每个 IP 一个站点; 或者“基于域名”, 即每个 IP 多个站点。这些站点运行在同一物理服务器上。

虚拟机配置语法

<VirtualHost addr[:port] [addr[:port]] ...> 
    serverName    ...
    DocumentRoot	...
    ...
</VirtualHost>

1、基于域名

# 实践1,配置文件:/etc/httpd/conf.d/iplinux1.conf
<VirtualHost>
  DocumentRoot "/var/www/iplinux1/"
  ServerName www.iplinux1.org
  ErrorLog "iplinux1-error_log"
  TransferLog "iplinux1-access_log"
  <Directory "/var/www/html">
    Options Indexes FollowSymLinks
    AllowOverride None
    Require all granted
	</Directory>
</VirtualHost>

# 实践2,配置文件:/etc/httpd/conf.d/iplinux2.conf
<VirtualHost>
  DocumentRoot "/var/www/iplinux2/"
  ServerName www.iplinux2.org
  ErrorLog "ip2inux1-error_log"
  TransferLog "ip2inux1-access_log"
  <Directory "/var/www/html">
    Options Indexes FollowSymLinks
    AllowOverride None
    Require all granted
	</Directory>

2、基于ip

# 实践1,配置文件:/etc/httpd/conf.d/iplinux1.conf
<VirtualHost 172.16.99.251>
  DocumentRoot "/var/www/iplinux1/"
  ServerName www.iplinux1.org
  ErrorLog "iplinux1-error_log"
  TransferLog "iplinux1-access_log"
  <Directory "/var/www/html">
    Options Indexes FollowSymLinks
    AllowOverride None
    Require all granted
	</Directory>
</VirtualHost>

# 实践2,配置文件:/etc/httpd/conf.d/iplinux2.conf
<VirtualHost 172.16.99.252>
  DocumentRoot "/var/www/iplinux2/"
  ServerName www.iplinux2.org
  ErrorLog "ip2inux1-error_log"
  TransferLog "ip2inux1-access_log"
  <Directory "/var/www/html">
    Options Indexes FollowSymLinks
    AllowOverride None
    Require all granted
	</Directory>
</VirtualHost>

四、rewrite重写

mod_rewrite 提供了基于正则表达式规则动态修改传入的请求的 URL 的方法。可以定义任意的的url映射到内部的站点文件中

1演示现象,解决效果,得出rewrite概念

2-1如何实现具体讲解步骤,可以带入原理

2-2实践

3剖析实现原理,提升知识面

4小结

1、rewrite需求

我们在使用Apache做为Web服务器时,有时候出于SEO优化或者是url路径的简洁,需要将输入的url转换成更为友好的url,这时候就可以使用rewrite重写功能。

使用rewrite功能首先需要开启mod_rewrite模块。yum安装的apache默认已经开启。

2、rewrite使用详解

rewrite规则可以在Directory指令中进行配置

rewrite学习的三个核心是RewriteEngineRewriteCondRewriteRule

2.1 RewriteEngine

rewrite功能的总开关,用来开启rewrite重写功能

RewriteEngine on

2.2 RewriteCond

RewriteCond定义规则条件,当请求满足RewriteCond配置的条件时,执行RewriteCond后面的RewriteRule语句

比如:

RewriteEngine on
RewriteCond  %{HTTP_USER_AGENT}  ^Mozilla//5/.0.*
RewriteRule  index          index.html    

上面的规则表示:如果匹配到http请求中HTTP_USER_AGENT是Mozilla//5/.0.*开头的。访问index时,会自动访问到index.html

RewriteCond 和 RewriteRule 是上下对应的关系。可以有1个或者好几个RewriteCond来匹配一个RewriteRule

**RewriteCond常见的HTTP请求匹配方式

RewriteCond %{HTTP_REFERER} (www.mytest.com)
RewriteCond %{HTTP_USER_AGENT}  ^Mozilla//5/.0.*
RewriteCond %{REQUEST_FILENAME} !-f

HTTP_REFERER

判断访问者的来源

案例:

RewriteCond %{HTTP_REFERER} (www.mytest.com)
RewriteRule (.*)$ mytest.html
# 如果访问的上一个页面是www.mytest.com,无论当前访问的是哪个页面,都会跳转到mytest.html

REQUEST_FILENAME

匹配当前访问的文件

案例:

RewriteCond %{REQUEST_FILENAME} !-f
RewriteCond %{REQUEST_FILENAME} !-d
RewriteRule ^news/sports/(\d+)\.html web/index\.php?c=news&a=sports&num=$1 [QSA,NC,L]

# 访问news/sports/123.html,真实访问的是web/index.php?c=news&a=sports&num=123

-f是否是一个目录,判断是否不是一个目录:!-d

-d是否是一个文件,判断是否不是一个问价:!-f

$1表示第一个参数

2.3 RewriteRule

RewriteRule是配合RewriteCond一起使用的,RewriteRule是RewriteCond成功匹配后的具体执行过程

RewriteRule的写法:

RewriteRule Pattern Substitution [flags]

Pattern是一个正则匹配

Substitution匹配的替换内容

[flags]参数限制

[QSA]qsappend(追加查询字符串)的意思,次标记强制重写引擎在已有的替换字符串中追加一个查询字符串,而不是简单的替换。如果需要通过重写规则在请求串中增加信息,就可以使用这个标记。

NCnocase(忽略大小写)的意思,它使Pattern忽略大小写,也就是在Pattern与当前URL匹配时,”A-Z”和”a-z”没有区别。这个一般也会加上,因为我们的url本身就不区分大小写的。

Rredirect(强制重定向)的意思,适合匹配Patter后,Substitution是一个http地址url的情况,就调整出去了。

Llast(结尾规则)的意思,就是已经匹配到了,就立即停止,不再匹配下面的Rule了,类似于编程语言中的break语法,跳出去了。

五、apache日志切割

1、为什么要进行日志切割

随着网站访问越来越大,web服务产生的日志文件也会越来越大,这个时候日志文件不仅占用了大量的服务器空间,而且日志分析也很麻烦

2、日志分割两种方式

2.1 rotatelogs

rotatelogs是apache自带的日志切割工具

案例:使用rotatelogs每天记录一个日志文件

# 编辑httpd主配置文件 /etc/httpd/conf/httpd.conf
# 注释下面两行
ErrorLog "logs/error_log" 
CustomLog "logs/access_log" combined

# 添加下面两行
ErrorLog "|/usr/sbin/rotatelogs -l logs/error_%Y%m%d.log 86400"
CustomLog "|/usr/sbin/rotatelogs -l logs/access_%Y%m%d.log 86400" combined

说明:

86400为轮转的时间,单位为秒

2.2 cronolog

Cronolog是一款日志轮循(rotation)工具,可以用它来把Apache、Tomcat等Web服务器上输出的日志切分成按日或月保存的文件。

cronolog安装

[root@ ~]# tar zxf cronolog-1.6.2.tar.gz
[root@ ~]# cd cronolog-1.6.2/
[root@ cronolog-1.6.2]# ./configure && make && make install

案例:使用cronologs每天记录一个日志文件

ErrorLog "|/usr/local/sbin/cronolog logs/error-%Y%m%d.log"
CustomLog "|/usr/local/sbin/cronolog logs/access-%Y%m%d.log" combined

扩展:按小时轮询生成日志

CustomLog "|/usr/local/sbin/cronolog logs /access_%Y%m%d%H.log" combined

3 总结

推荐使用cronolog,因为cronolog稳定高配置简单。

六、apache防盗链

防盗链就是防止别人网站代码里调用我们服务器的图片、文件、视频等资源。如果别人盗用我们的资源,会增加服务器的贷款压力。

通过防盗链的方式,可以设置限制第三方的站点通过引用的方式获取服务器上的图片,如果想要获取本站点的图片数据,只能通过本站点访问获取,这样也有效的减少了服务器的资源。

1、rewrite实现防盗链

1. RewriteEngine On
2. RewriteCond %{HTTP_REFERER} !^http://www.myitcast.com/.*$ [NC]
3. RewriteCond %{HTTP_REFERER} !^http://www.myitcast.com$ [NC]
4. RewriteCond %{HTTP_REFERER} !^http://myitcast.com/.*$ [NC]
5. RewriteCond %{HTTP_REFERER} !^http://myitcast.com$ [NC]
6. RewriteRule .*\.(gif|jpg|swf)$ http://www.myitcast.com/link.png [R,NC]

说明:

第1条:开启rewrite重写

第2~5条:开启授信任的站点,能够访问站点的图片资源

第6条:访问站点的gif|jpg|swf等类型资源时,跳转到

2、SetEnvIfNoCase

通过判断浏览器头信息来阻止盗链请求

SetEnvIfNoCase Referer "^$" local_ref
SetEnvIfNoCase Referer "www.benet.com/.*$" local_ref
SetEnvIfNoCase Referer "benet.com/.*$" local_ref
<filesmatch "\.(mp3|mp4|zip|rar|jpg|gif)">
		Require all denied
		Require env local_ref
</filesmatch>

说明:

SetEnvIfNoCase 当满足某个条件时,为变量赋值,即根据客户端请求属性设置环境变量。

Referer :指明了请求当前资源原始资源的URL

版权声明:本文为moyu557原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://www.cnblogs.com/moyu557/p/14332463.html