怎么提高网站负载能力_多台服务器如何做网络负载均衡

A. 问下pageadmin cms自助建站系统如何操作简单么

1、多语言、多站点：后台可以任意增加分站，每个分站可以任意设置语种，分站之间的信息可以灵活调用，可以灵活设置管理员单独管理分站。
方便灵活的栏目管理：后台可以对栏目进行任意增加，修改和删除，并可以无限级增加子栏目。
强大的信息发布功能：支持信息的发布，删除，修改，复制，转移，可自由设置置顶，最新，热门，审核等属性，管理员可以在后台发布信息，同时支持匿名投稿及会员中心投稿，会员可以在会员中心管理自己发布的信息。
2、自定义表单+自定义字段+自定义模型：通过后台可以任意增加表单，如系统自带的文章，图片，下载，留言，招聘等板块都通过此功能来实现；字段可以任意增加和修改，支持常用文本字段，下拉字段，图片及图片组字段，附件及附件组字段；用户可以通过此功能实现任何个性化的功能及展示需求。
完善的SEO优化功能，后台可以生成静态，每个静态文件名，目录都可以自由设置，任意页面可以自定义标题，关键词，描述。
工作流：可以自定义信息发布的流程，比如前台投稿，需要A用户审核后转给b用户审核，在转给c用户审核。
3、计划任务功能：如果需要某个功能在特定时间定期执行就可以利用此功能，可以支持循环支持，可以按月，按天，按小时来设置执行时间。
信息签收功能：比如我们发布一篇文章，需要特定用户或特定用户组签收就可以用此功能，支持单用户，用户组或按部门来签收。
信息签发功能：信息审核员可以在后台或会员中心对信息进行签发和审核，支持按工作流来签发，签发后方通过审核、并显示在网站上。
4、在线支付功能：支持支付宝，财务通，网银在线等接口，马上支付，即时入账。
在线订购功能：用户可以对产品进行在线下单，支持订单删除，修改及支付等商务性功能。
信息发送：支持站内信息，邮件，手机短信三种发送方式，可以进行单用户发送，会员组和指定用户群发。
采集功能：采用ajax方式进行采集，可以远程图片保存到本地，可以过滤特定字符，特定url等。

PageAdmin建站系统特点：

1、简单易用、强大灵活：以前开发一个网站只能找网络公司，做出的网站管理后台功能简单，导致后期维护、修改和扩展困难，甚至只能付费让制作公司维护，PageAdmin强大的功能、易用性、灵活扩展性完美的解决了这些问题。因为系统经过多年发展，其间综合了大量用户的切身使用体验，大大小小经过上百次的升级更新，在操作上不断追求人性化，功能上在也日趋完善，其中的自定义表单+自定义模型功能更是让用户可以轻松开发出自己的个性化功能。
2
2、高负载功能：一个网站负载功能在网站访问量或内容量巨大时至关重要，pageadmin通过生成静态化和数据库连接优化两个方面来提高网站的负载能力。
样式和内容分离：系统主体框架div+css结构，遵循国际最新W3C网页设计标准，兼容IE系列、火狐等主流浏览器，内容和样式分离让网站风格可以轻松修改和更换，而不会导致内容和结构的破坏。
3
3、周密的安全策略和攻击防护：对SQL参数进行敏感字符过滤、对密码、cookie进行了不可逆加密处理，数据库备份功能、对管理员权限的自由分配等，在方方面面保证了系统的安全和稳定。

B. 网站性能优化怎么办

一、前端优化

网站性能优化是一个很综合的话题，涉及到服务器的配置和网站前后端程序等各个方面，我只是从实际经历出发，分享一下自己所尝试过的网站性能优化方法。之所以在标题上挂一个web2.0，是因为本文更偏重于中小网站的性能优化，我所使用的系统也是典型web2.0的LAMP架构。

首先讲讲前端的优化，用户访问网页的等待时间，有80%是发生在浏览器前端，特别是页面和页面中各种元素（图片、CSS、Javascript、 flash…）的下载之上。因此在很多情况下，相对于把大量的时间花在艰苦而繁杂的程序改进上，前端的优化往往能起到事半功倍的作用。雅虎最近将内部使用的性能测试工具yslow向第三方公开，并发布了着名的网站性能优化的十三条规则，建议你下载并安装yslow，并作为测评网站优化效果的工具。下面我挑其中特别有价值的具体说明一下优化的方法：

对于第一次访问您网站，尚未在浏览器cache中缓存您网站内容的用户，我们可以做的事情包括：

1）减少一个页面访问所产生的http连接次数
对于第一次访问你网站的用户，页面所产生的http连接次数是影响性能的一个关键瓶颈。

对策：
- 尽量简洁的页面设计，最大程度减少图片的使用，通过放弃一些不必要的页面特效来减少javascript的使用。
- 使用一些优化技巧，比如利用图片的背景位移减少图片的个数；image map技术；使用Inline images将css图片捆绑到网页中。
- 尽量合并js和css文件，减少独立文件个数。

2) 使用gzip压缩网页内容
使用gzip来压缩网页中的静态内容，能够显着减少用户访问网页时的等待时间（据说可达到60%）。主流的web服务器都支持或提供gzip压缩，如果使用apache服务器，只需要在配置文件中开启 mod_gzip（apache1.x）或mod_deflate(apache2.x)即可。凡是静态的页面，使用gzip压缩都能够显着提高服务器效率并减少带宽支出，注意图片内容本身已经是压缩格式了，务必不要再进行压缩。

3）将CSS放在页面顶端，JS文件放在页面底端
CSS的引用要放在html的头部header中，JS文件引用尽量放在页面底端标签的后面，主要的思路是让核心的页面内容尽早显示出来。不过要注意，一些大量使用js的页面，可能有一些js文件放在底端会引起一些难以预料的问题，根据实际情况适当运用即可。

4）使JS文件内容最小化
具体来说就是使用一些javascript压缩工具对js脚本进行压缩，去除其中的空白字符、注释，最小化变量名等。在使用gzip压缩的基础上，对js内容的压缩能够将性能再提高5%。

5）尽量减少外部脚本的使用，减少DNS查询时间
不要在网页中引用太多的外部脚本，首先，一次dns的解析过程会消耗20-120毫秒的时间；其次，如果在页面中引用太多的外部文件（如各种广告、联盟等代码），可能会因为外部文件的响应速度而将你的网站拖得很慢。如果不得不用，那么就尽量将这些脚本放在页脚吧。不过有一点需要提及，就是浏览器一般只能并行处理同一域名下的两个请求，而对于不同子的域名则不受此限制，因此适当将本站静态内容（css,js）放在其他的子域名下（如 static.xxx.com）会有利于提高浏览器并行下载网页内容的能力。

对于您网站的经常性访问用户，主要的优化思路就是最大限度利用用户浏览器的cache来减少服务器的开销。

1）在header中添加过期时间(Expires Header)
在header中给静态内容添加一个较长的过期时间，这样可以使用户今后访问只读取缓存中的文件，而不会与服务器产生任何的交互。不过这样做也存在一些问题，当图片、CSS和js文件更新时，用户如果不刷新浏览器，就无法获得此更新。这样，我们在对图片、css和js文件修改时，必须要进行重命名，才能保证用户访问到最新的内容。这可能会给开发造成不小的麻烦，因为这些文件可能被站点中的许多文件所引用。flickr提出的解决办法是通过url rewrite使不同版本号的URL事实上指向同一个文件，这是一个聪明的办法，因为url级别的操作效率是很高的，可以给开发过程提供不少便利。

要理解为什么这样做，必须要了解浏览器访问url时的工作机制：
a. 第一次访问url时，用户从服务器段获取页面内容，并把相关的文件（images,css,js…）放在高速缓存中，也会把文件头中的expired time,last modified, ETags等相关信息也一同保留下来。
b. 用户重复访问url时，浏览器首先看高速缓存中是否有本站同名的文件，如果有，则检查文件的过期时间；如果尚未过期，则直接从缓存中读取文件，不再访问服务器。
c. 如果缓存中文件的过期时间不存在或已超出，则浏览器会访问服务器获取文件的头信息，检查last modifed和ETags等信息，如果发现本地缓存中的文件在上次访问后没被修改，则使用本地缓存中的文件；如果修改过，则从服务器上获取最新版本。

我的经验，如果可能，尽量遵循此原则给静态文件添加过期时间，这样可以大幅度减少用户对服务器资源的重复访问。

2）将css和js文件放在独立外部文件中引用
将css和js文件放在独立文件中，这样它们会被单独缓存起来，在访问其他页面时可以从浏览器的高速缓存中直接读取。一些网站的首页可能是例外的，这些首页的自身浏览可能并不大，但却是用户访问网站的第一印象以及导向到其他页面的起点，也可能这些页面本身使用了大量的ajax局部刷新及技术，这时可以将 css和js文件直接写在页面中。

3）去掉重复的脚本
在IE中，包含重复的js脚本会导致浏览器的缓存不被使用，仔细检查一下你的程序，去掉重复引用的脚本应该不是一件很难的事情。

4）避免重定向的发生
除了在header中人为的重定向之外，网页重定向常在不经意间发生，被重定向的内容将不会使用浏览器的缓存。比如用户在访问www.xxx.com，服务器会通过301转向到www.xxx.com/，在后面加了一个“/”。如果服务器的配置不好，这也会给服务器带来额外的负担。通过配置apache的 alias或使用mod_rewrite模块等方法，可以避免不必要的重定向。

还有一些，比如使用CDN分发机制、避免CSS表达式等、避免使用ETags等，因为不太常用，这里就不再赘述了。

做完了上述的优化，可以试着用yslow测试一下网页的性能评分，一般都可以达到70分以上了。

当然，除了浏览器前端和静态内容的优化之外，还有针对程序脚本、服务器、数据库、负载的优化，这些更深层次的优化方法对技术有更高的要求。本文的后半部分将重点探讨后端的优化。

二、后端优化

上次写完web2.0网站前端优化篇之后，一直想写写后端优化的方法，今天终于有时间将思路整理了出来。

前端优化可以避免我们造成无谓的服务器和带宽资源浪费，但随着网站访问量的增加，仅靠前端优化已经不能解决所有问题了，后端软件处理并行请求的能力、程序运行的效率、硬件性能以及系统的可扩展性，将成为影响网站性能和稳定的关键瓶颈所在。优化系统和程序的性能可以从以下的方面来入手：

1）apache、mysql等软件的配置的优化
尽管apache和mysql等软件在安装后使用的默认设置足以使你的网站运行起来，但是通过调整mysql和apache的一些系统参数，还是可以追求更高的效率和稳定性。这个领域中有很多专业的文章和论坛（比如： http://www.mysqlperformanceblog.com/），要想掌握也需要进行深入的研究和实践，这里就不重点讨论了。

2）应用程序环境加速
这里仅以我最常应用的php开发环境为例，有一些工具软件可以通过优化PHP运行环境来达到提速的目的，其基本原理大致是将PHP代码预编译并缓存起来，而不需要改变任何代码，所以比较简单，可以将php的运行效率提升50%以上。比较常用的免费php加速工具有：APC( http: //pecl.php.net/package-info.php?package=APC)、Turck MMCache（ http://turck-mmcache.sourceforge.net）、php accelebrator(www.php-accelerator.co.uk)，还有收费的Zend Performance Suite

3）将静态内容和动态内容分开处理
apache是一个功能完善但比较庞大的web server，它的资源占用基本上和同时运行的进程数呈正比，对服务器内存的消耗比较大，处理并行任务的效率也一般。在一些情况下，我们可以用比较轻量级的web server来host静态的图片、样式表和javascript文件，这样可以大大提升静态文件的处理速度，还可以减少对内存占用。我使用的web server是来自俄罗斯的nginx，其他选择方案还包括lighttpd和thttpd等。

4）基于反向代理的前端访问负载均衡
当一台前端服务器不足以应付用户访问时，通过前端机实现web访问的负载均衡是最快速可行的方案。通过apache的mod_proxy可以实现基于反向代理的负载均衡，这里推荐使用nginx做代理服务器，处理速度较apache更快一些。

5）应用缓存技术提高数据库效能，文件缓存和分布式缓存
数据库访问处理并发访问的能力是很多网站应用的关键瓶颈，在想到使用主从结构和多farm的方式构建服务器集群之前，首先应该确保充分使用了数据库查询的缓存。一些数据库类型（如mysql的innoDB）自身内置对缓存的支持，此外，还可以利用程序方法将常用的查询通过文件或内存缓存起来。比如通过 php中的ob_start和文件读写函数可以很方便的实现文件形式的缓存，而如果你拥有多台服务器，可以通过memcache技术通过分布式共享内存来对数据库查询进行缓存，不仅效率高而且扩展性好，memcache技术在livejournal和Craigslist.org等知名网站应用中都得到了检验。

6）服务器运行状态的检测，找到影响性能的瓶颈所在
系统优化没有一劳永逸的方法，需要通过检测服务器的运行状态来及时发现影响性能的瓶颈，以及可能存在的潜在问题，因为网站的性能，永远取决于木桶中的短板。可以编写一些脚本来检测web服务的运行，也有一些开源的软件也提供了很好的功能

7）良好的扩展架构是稳定和性能的基础
一些技巧和窍门可以帮你度过眼前的难关，但要想使网站具备应付大规模访问的能力，则需要从系统架构上进行彻底的规划，好在很多前人无私的把他们架构
网站的经验分享给我们，使我们可以少走甚多弯路。我最近读到的两篇有启发的文章：
- 从LiveJournal后台发展看大规模网站性能优化方法
- Myspace的六次重构

最后不得不提到程序编码和数据库结构对性能的影响，一系列糟糕的循环语句，一个不合理的查询语句、一张设计不佳的数据表或索引表，都足以会使应用程序运行的速度成倍的降低。培养全局思考的能力，养成良好的编程习惯，并对数据库运行机制有所了解，是提高编程质量的基础。

C. 服务器负载量过大，怎样处理

一，确认服务器硬件是否足够支持当前的流量。

二，优化数据库访问。
服务器的负载过大，一个重要的原因是CPU负荷过大，降低服务器CPU的负荷，才能够有效打破瓶颈。而使用静态页面可以使得CPU的负荷最小化。前台实现完全的静态化当然最好，可以完全不用访问数据库，不过对于频繁更新的网站，静态化往往不能满足某些功能。
缓存技术就是另一个解决方案，就是将动态数据存储到缓存文件中，动态网页直接调用这些文件，而不必再访问数据库，WordPress和Z-Blog都大量使用这种缓存技术。
如果确实无法避免对数据库的访问，那么可以尝试优化数据库的查询SQL.避免使用Select *from这样的语句，每次查询只返回自己需要的结果，避免短时间内的大量SQL查询。

三，禁止外部的盗链。
外部网站的图片或者文件盗链往往会带来大量的负载压力，因此应该严格限制外部对于自身的图片或者文件盗链，好在目前可以简单地通过refer来控制盗链，Apache自己就可以通过配置来禁止盗链，IIS也有一些第三方的ISAPI可以实现同样的功能。当然，伪造refer也可以通过代码来实现盗链，不过目前蓄意伪造refer盗链的还不多，可以先不去考虑，或者使用非技术手段来解决，比如在图片上增加水印。

四，控制大文件的下载。
大文件的下载会占用很大的流量，并且对于非SCSI硬盘来说，大量文件下载会消耗CPU，使得网站响应能力下降。因此，尽量不要提供超过2M的大文件下载，如果需要提供，建议将大文件放在另外一台服务器上。

D. 如何配置Web服务器实现负载均衡

网络的负载均衡是一种动态均衡技术，通过一些工具实时地分析数据包，掌握网络中的数据流量状况，把任务合理均衡地分配出去。这种技术基于现有网络结构，提供了一种扩展服务器带宽和增加服务器吞吐量的廉价有效的方法，加强了网络数据处理能力，提高了网络的灵活性和可用性。

以四台服务器为例实现负载均衡：

安装配置LVS

1. 安装前准备：

(1)首先说明，LVS并不要求集群中的服务器规格划一，相反，可以根据服务器的不同配置和负载状况，调整负载分配策略，充分利用集群环境中的每一台服务器。如下表：

Srv Eth0 Eth0：0 Eth1 Eth1：0

vs1 10.0.0.1 10.0.0.2 192.168.10.1 192.168.10.254

vsbak 10.0.0.3 192.168.10.102

real1 192.168.10.100

real2 192.168.10.101

其中，10.0.0.2是允许用户访问的IP。

(2)这4台服务器中，vs1作为虚拟服务器(即负载平衡服务器)，负责将用户的访问请求转发到集群内部的real1，real2，然后由real1，real2分别处理。
Client为客户端测试机器，可以为任意操作系统。

(3)所有OS为redhat6.2，其中vs1 和vsbak 的核心是2.2.19，而且patch过ipvs的包，所有real
server的Subnet mask 都是24位， vs1和vsbak 的10.0.0. 网段是24 位。

2.理解LVS中的相关术语

(1) ipvsadm ：ipvsadm是LVS的一个用户界面。在负载均衡器上编译、安装ipvsadm。

(2) 调度算法： LVS的负载均衡器有以下几种调度规则：Round-robin，简称rr;weighted
Round-robin，简称wrr;每个新的连接被轮流指派到每个物理服务器。Least-connected，简称lc;weighted
Least-connected，简称wlc，每个新的连接被分配到负担最小的服务器。

(3) Persistent client
connection，简称pcc，(持续的客户端连接，内核2.2.10版以后才支持)。所有来自同一个IP的客户端将一直连接到同一个物理服务器。超时时间被设置为360秒。Pcc是为https和cookie服务设置的。在这处调度规则下，第一次连接后，所有以后来自相同客户端的连接(包括来自其它端口)将会发送到相同的物理服务器。但这也会带来一个问题，因为大约有25%的Internet
可能具有相同的IP地址。

(4) Persistent port
connection调度算法：在内核2.2.12版以后，pcc功能已从一个调度算法(你可以选择不同的调度算法：rr、wrr、lc、wlc、pcc)演变成为了一个开关选项(你可以让rr、
wrr、lc、wlc具备pcc的属性)。在设置时，如果你没有选择调度算法时，ipvsadm将默认为wlc算法。在Persistent port
connection(ppc)算法下，连接的指派是基于端口的，例如，来自相同终端的80端口与443端口的请求，将被分配到不同的物理服务器上。不幸的是，如果你需要在的网站上采用cookies时将出问题，因为http是使用80端口，然而cookies需要使用443端口，这种方法下，很可能会出现cookies不正常的情况。

(5)Load Node Feature of Linux Director：让Load balancer 也可以处理users 请求。

(6)IPVS connection synchronization。

(7)ARP Problem of LVS/TUN and LVS/DR：这个问题只在LVS/DR，LVS/TUN 时存在。

3. 配置实例

(1) 需要的软件包和包的安装：

I. piranha-gui-0.4.12-2*.rpm (GUI接口cluster设定工具);

II. piranha-0.4.12-2*.rpm;

III. ipchains-1.3.9-6lp*.rpm (架设NAT)。

取得套件或mount到光盘，进入RPMS目录进行安装:

# rpm -Uvh piranha*

# rpm -Uvh ipchains*

(2) real server群：

真正提供服务的server(如web
server)，在NAT形式下是以内部虚拟网域的形式，设定如同一般虚拟网域中Client端使用网域：192.168.10.0/24
架设方式同一般使用虚拟IP之局域网络。

a. 设网卡IP

real1 ：192.168.10.100/24

real2 ：192.168.10.101/24

b.每台server均将default gateway指向192.168.10.254。
192.168.10.254为该网域唯一对外之信道，设定在virtual server上，使该网域进出均需通过virtual server 。

c.每台server均开启httpd功能供web server服务，可以在各real server上放置不同内容之网页，可由浏览器观察其对各real
server读取网页的情形。

d.每台server都开启rstatd、sshd、rwalld、ruser、rsh、rsync，并且从Vserver上面拿到相同的lvs.conf文件。

(3) virtual server：

作用在导引封包的对外主机，专职负责封包的转送，不提供服务，但因为在NAT型式下必须对进出封包进行改写，所以负担亦重。

a.IP设置：

对外eth0：IP：10.0.0.1 eth0：0 ：10.0.0.2

对内eth1：192.168.10.1 eth1：0 ：192.168.10.254

NAT形式下仅virtual server有真实IP，real server群则为透过virtual server.

b.设定NAT功能

# echo 1 >; /proc/sys/net/ipv4/ip_forward

# echo 1 >; /proc/sys/net/ipv4/ip_always_defrag

# ipchains -P forward MASQ

c.设定piranha 进入X-window中 (也可以直接编辑/etc/lvs.cf )

a).执行面板系统piranha

b).设定“整体配置”(Global Settings) 主LVS服务器主机IP：10.0.0.2，选定网络地址翻译(预设) NAT路径名称：
192.168.10.254， NAT 路径装置： eth1：0

c).设定虚拟服务器(Virtual Servers) 添加编辑虚拟服务器部分：(Virtual
Server)名称：(任意取名);应用：http;协议： tcp;连接：80;地址：10.0..0.2;装置：eth0：0; 重入时间：180
(预设);服务延时：10 (预设);加载监控工具：ruptime (预设);调度策略：Weighted least-connections; 持续性：0
(预设); 持续性屏蔽： 255.255.255.255 (预设); 按下激活：实时服务器部分：(Real Servers); 添加编辑：名字：(任意取名);
地址： 192.168.10.100; 权重：1 (预设) 按下激活

另一架real server同上，地址：192.168.10.101。

d). 控制/监控(Controls/Monitoring)
控制：piranha功能的激活与停止，上述内容设定完成后即可按开始键激活piranha.监控器：显示ipvsadm设定之routing table内容
可立即更新或定时更新。

(4)备援主机的设定(HA)

单一virtual server的cluster架构virtual server 负担较大，提供另一主机担任备援，可避免virtual
server的故障而使对外服务工作终止;备份主机随时处于预备状态与virtual server相互侦测

a.备份主机：

eth0： IP 10.0.0.3

eth1： IP 192.168.10.102 同样需安装piranha，ipvsadm，ipchains等套件

b.开启NAT功能(同上面所述)。

c.在virtual server(10.0.0.2)主机上设定。

a).执行piranha冗余度 ;

b).按下“激活冗余度”;

冗余LVS服务器IP： 10.0.0.3;HEARTBEAT间隔(秒数)： 2 (预设)

假定在…秒后进入DEAD状态： 5 (预设);HEARTBEAT连接端口： 539 (预设)

c).按下“套用”;

d).至“控制/监控”页，按下“在当前执行层添加PULSE DEAMON” ，按下“开始”;

e).在监控器按下“自动更新”，这样可由窗口中看到ipvsadm所设定的routing table，并且动态显示real
server联机情形，若real server故障，该主机亦会从监视窗口中消失。

d.激活备份主机之pulse daemon (执行# /etc/rc.d/init.d/pulse start)。

至此，HA功能已经激活，备份主机及virtual server由pulse daemon定时相互探询，一但virtual
server故障，备份主机立刻激活代替;至virtual server 正常上线后随即将工作交还virtual server。

LVS测试

经过了上面的配置步骤，现在可以测试LVS了，步骤如下：

1. 分别在vs1，real1，real2上运行/etc/lvs/rc.lvs_dr。注意，real1，real2上面的/etc/lvs
目录是vs2输出的。如果您的NFS配置没有成功，也可以把vs1上/etc/lvs/rc.lvs_dr复制到real1，real2上，然后分别运行。确保real1，real2上面的apache已经启动并且允许telnet。

2. 测试Telnet：从client运行telnet 10.0.0.2，
如果登录后看到如下输出就说明集群已经开始工作了：(假设以guest用户身份登录)

[guest@real1 guest]$——说明已经登录到服务器real1上。

再开启一个telnet窗口，登录后会发现系统提示变为：

[guest@real2 guest]$——说明已经登录到服务器real2上。

3. 测试http：从client运行iexplore http://10.0.0.2

因为在real1 和real2 上面的测试页不同，所以登录几次之后，显示出的页面也会有所不同，这样说明real server 已经在正常工作了。

E. 海量高并发处理网站的负载均衡如何设计

Ｈ绻�蕴�钟猩璞溉プ鲇布��叮��斐勺试吹睦朔眩��胰绻�院竺媪僖滴窳康募ぴ觯�植坏貌辉俅瓮度敫叨畹挠布��冻杀荆�踔列阅茉僮吭降纳璞敢膊荒苈�憬�匆滴窳康男枨蟆� 在此种情况下，单纯的网络架构就显得捉襟见肘了，而负载均衡机制则应运而生。服务器负载均衡(Server Load Balancing)，其原理是将工作任务相对均衡地分摊到多个节点(服务器集群)上执行，从而提升整个业务系统的性能。诸如LVS、HA Proxy等开源软件，可以在现有的网络基础架构之上建立负载均衡机制，以满足业务增长的需要，对于网站的来说不啻为一种廉价且有效的扩展性选择。此外，针对互联网上有可能影响数据传输的各种环节，CDN(Content Delivery Network)内容交付网络的应对方案也适时出现。CDN对网站内容的处理，主要在于利用缓存技术将静态内容快速分发至边缘节点，通过让用户就近取得所需内容，解决 Internet网络拥挤的状况，提高用户访问网站的响应速度，同时也减轻了网站自身系统的性能压力。现在看来，貌似我们已经解决了网站发布所面临的所有瓶颈了，但是实际上问题远没有那么简单。一方面，对于数据交互比较频繁的动态内容而言，CDN只能在其中心节点与源数据节点(网站自身系统)之间做有限的传输优化，加速效果远不如静态内容做缓存分发那般明显。另一方面，随着线上业务、电子商务等领域的Web内容呈现日渐丰富，涌现出了愈发复杂的业务交付需求，这对网站的发布方而言也意味着将面临更多的挑战。因此，当我们抛开网络的传输质量、带宽拥塞程度等外界因素来看的话，又不得不正视一个问题--影响网站访问效果的最大瓶颈还是在于源数据节点自身的处理性能。以电子商务网站这种典型的大型高并发访问量的线上业务为例，其性能瓶颈最容易出现在联机事务处理(OLTP)的环节，例如访问用户进行条目查阅、订单确认等场景。产生这种情况的原因在于，网站的运营方出于数据安全等因素的考虑，是不可能将后台数据库等资源完全向CDN服务商开放的。由此造成，所有涉及到此类动态资源的访问就会频繁地经由CDN网络的边缘节点上溯到源数据节点(即网站自身系统)来请求实时地响应处理。在保障数据安全性的前提下，要解决网站的性能瓶颈问题，必须提高源数据节点的业务处理效率，因此我们还得从网络架构的设计着手。前文提到过，单台服务器的处理能力有限，当突发访问量骤然增加的时候，其性能就会成为整个系统的瓶颈，导致用户访问的响应缓慢甚至网站服务器瘫痪。为了满足高并发量访问的需求，可以通过软件手段实现服务器集群的多机负载均衡效果。然而，这种软件式的负载均衡有一个不可避免的缺点，那便是系统的稳定性和性能方面受限于软件所安装运行的服务器，一旦访问量过大时，该台服务器就恰恰成了整个系统的瓶颈所在。就一个发布线上业务的网站系统而言，前台的Web服务器由于有外部的CDN服务作为静态内容的分流渠道，尚不至于产生明显的系统瓶颈，而后台处理动态内容的核心业务系统就难免会感到压力巨大了。具体分析的话，当前的业务系统多采用客户端--中间件--数据库的三层结构设计，通常多是利用WebLogic中间件软件自带的服务器集群功能来满足高性能需求，其中一台WebLogic Server作为管理服务器负责任务调度，实现负载均衡效果。但是，当访问用户到达一定数目的时候，由于该服务器自身的硬件性能瓶颈，会造成整个系统的联机事务处理效率低下;而且由于WebLogic自身设计的原因，当任务量达到一定阀值的时候，即便是升级服务器硬件性能也无法提升其进行负载均衡调度的能力。针对上述情况，最好的办法莫过于采用硬件负载均衡设备，以解决数据流量过大、任务负荷过重所产生的系统瓶颈问题。在这一方面，业内知名的硬件厂商有F5、深信服等等。值得一提的是，深信服的应用交付产品除具有传统负载均衡功能外，其独有的单边加速技术，能够在跨运营商网络环境中，通过广域网传输文件及应用的访问时间减少30%以上，极大提高了用户体验。虽然部署硬件设备意味着一笔额外的开支，但是它给网站的整体业务系统所带来的性能提升，却是传统的软件方案所望其项背的。除此之外，专业的硬件设备所能提供的负载调度算法和健康检查机制也更加丰富、全面，有助于进一步提升关键业务发布的稳定性和持久性，这对于高并发量的大型网站而言是极具价值的。当然，对于不同规模、不同业务的网站而言，没有一概而论的设计标准，文中提到的技术手段都有着相应的适用场景，这就需要网站的架构师们做具体的规划了。

F. 如何进行网站性能优化

一、前端优化

网站性能优化是一个很综合的话题，涉及到服务器的配置和网站前后端程序等各个方面，我只是从实际经历出发，分享一下自己所尝试过的网站性能优化方法。之所以在标题上挂一个web2.0，是因为本文更偏重于中小网站的性能优化，我所使用的系统也是典型web2.0的LAMP架构。

首先讲讲前端的优化，用户访问网页的等待时间，有80%是发生在浏览器前端，特别是页面和页面中各种元素（图片、CSS、Javascript、 flash…）的下载之上。因此在很多情况下，相对于把大量的时间花在艰苦而繁杂的程序改进上，前端的优化往往能起到事半功倍的作用。雅虎最近将内部使用的性能测试工具yslow向第三方公开，并发布了着名的网站性能优化的十三条规则，建议你下载并安装yslow，并作为测评网站优化效果的工具。下面我挑其中特别有价值的具体说明一下优化的方法：

对于第一次访问您网站，尚未在浏览器cache中缓存您网站内容的用户，我们可以做的事情包括：

1）减少一个页面访问所产生的http连接次数
对于第一次访问你网站的用户，页面所产生的http连接次数是影响性能的一个关键瓶颈。

对策：
- 尽量简洁的页面设计，最大程度减少图片的使用，通过放弃一些不必要的页面特效来减少javascript的使用。
- 使用一些优化技巧，比如利用图片的背景位移减少图片的个数；image map技术；使用Inline images将css图片捆绑到网页中。
- 尽量合并js和css文件，减少独立文件个数。

2) 使用gzip压缩网页内容
使用gzip来压缩网页中的静态内容，能够显着减少用户访问网页时的等待时间（据说可达到60%）。主流的web服务器都支持或提供gzip压缩，如果使用apache服务器，只需要在配置文件中开启 mod_gzip（apache1.x）或mod_deflate(apache2.x)即可。凡是静态的页面，使用gzip压缩都能够显着提高服务器效率并减少带宽支出，注意图片内容本身已经是压缩格式了，务必不要再进行压缩。

3）将CSS放在页面顶端，JS文件放在页面底端
CSS的引用要放在html的头部header中，JS文件引用尽量放在页面底端标签的后面，主要的思路是让核心的页面内容尽早显示出来。不过要注意，一些大量使用js的页面，可能有一些js文件放在底端会引起一些难以预料的问题，根据实际情况适当运用即可。

4）使JS文件内容最小化
具体来说就是使用一些javascript压缩工具对js脚本进行压缩，去除其中的空白字符、注释，最小化变量名等。在使用gzip压缩的基础上，对js内容的压缩能够将性能再提高5%。

5）尽量减少外部脚本的使用，减少DNS查询时间
不要在网页中引用太多的外部脚本，首先，一次dns的解析过程会消耗20-120毫秒的时间；其次，如果在页面中引用太多的外部文件（如各种广告、联盟等代码），可能会因为外部文件的响应速度而将你的网站拖得很慢。如果不得不用，那么就尽量将这些脚本放在页脚吧。不过有一点需要提及，就是浏览器一般只能并行处理同一域名下的两个请求，而对于不同子的域名则不受此限制，因此适当将本站静态内容（css,js）放在其他的子域名下（如 static.xxx.com）会有利于提高浏览器并行下载网页内容的能力。

对于您网站的经常性访问用户，主要的优化思路就是最大限度利用用户浏览器的cache来减少服务器的开销。

1）在header中添加过期时间(Expires Header)
在header中给静态内容添加一个较长的过期时间，这样可以使用户今后访问只读取缓存中的文件，而不会与服务器产生任何的交互。不过这样做也存在一些问题，当图片、CSS和js文件更新时，用户如果不刷新浏览器，就无法获得此更新。这样，我们在对图片、css和js文件修改时，必须要进行重命名，才能保证用户访问到最新的内容。这可能会给开发造成不小的麻烦，因为这些文件可能被站点中的许多文件所引用。flickr提出的解决办法是通过url rewrite使不同版本号的URL事实上指向同一个文件，这是一个聪明的办法，因为url级别的操作效率是很高的，可以给开发过程提供不少便利。

要理解为什么这样做，必须要了解浏览器访问url时的工作机制：
a. 第一次访问url时，用户从服务器段获取页面内容，并把相关的文件（images,css,js…）放在高速缓存中，也会把文件头中的expired time,last modified, ETags等相关信息也一同保留下来。
b. 用户重复访问url时，浏览器首先看高速缓存中是否有本站同名的文件，如果有，则检查文件的过期时间；如果尚未过期，则直接从缓存中读取文件，不再访问服务器。
c. 如果缓存中文件的过期时间不存在或已超出，则浏览器会访问服务器获取文件的头信息，检查last modifed和ETags等信息，如果发现本地缓存中的文件在上次访问后没被修改，则使用本地缓存中的文件；如果修改过，则从服务器上获取最新版本。

我的经验，如果可能，尽量遵循此原则给静态文件添加过期时间，这样可以大幅度减少用户对服务器资源的重复访问。

2）将css和js文件放在独立外部文件中引用
将css和js文件放在独立文件中，这样它们会被单独缓存起来，在访问其他页面时可以从浏览器的高速缓存中直接读取。一些网站的首页可能是例外的，这些首页的自身浏览可能并不大，但却是用户访问网站的第一印象以及导向到其他页面的起点，也可能这些页面本身使用了大量的ajax局部刷新及技术，这时可以将 css和js文件直接写在页面中。

3）去掉重复的脚本
在IE中，包含重复的js脚本会导致浏览器的缓存不被使用，仔细检查一下你的程序，去掉重复引用的脚本应该不是一件很难的事情。

4）避免重定向的发生
除了在header中人为的重定向之外，网页重定向常在不经意间发生，被重定向的内容将不会使用浏览器的缓存。比如用户在访问，服务器会通过301转向到/，在后面加了一个“/”。如果服务器的配置不好，这也会给服务器带来额外的负担。通过配置apache的 alias或使用mod_rewrite模块等方法，可以避免不必要的重定向。

还有一些，比如使用CDN分发机制、避免CSS表达式等、避免使用ETags等，因为不太常用，这里就不再赘述了。

做完了上述的优化，可以试着用yslow测试一下网页的性能评分，一般都可以达到70分以上了。

当然，除了浏览器前端和静态内容的优化之外，还有针对程序脚本、服务器、数据库、负载的优化，这些更深层次的优化方法对技术有更高的要求。本文的后半部分将重点探讨后端的优化。

二、后端优化

上次写完web2.0网站前端优化篇之后，一直想写写后端优化的方法，今天终于有时间将思路整理了出来。

前端优化可以避免我们造成无谓的服务器和带宽资源浪费，但随着网站访问量的增加，仅靠前端优化已经不能解决所有问题了，后端软件处理并行请求的能力、程序运行的效率、硬件性能以及系统的可扩展性，将成为影响网站性能和稳定的关键瓶颈所在。优化系统和程序的性能可以从以下的方面来入手：

1）apache、mysql等软件的配置的优化
尽管apache和mysql等软件在安装后使用的默认设置足以使你的网站运行起来，但是通过调整mysql和apache的一些系统参数，还是可以追求更高的效率和稳定性。这个领域中有很多专业的文章和论坛（比如：），要想掌握也需要进行深入的研究和实践，这里就不重点讨论了。

2）应用程序环境加速
这里仅以我最常应用的php开发环境为例，有一些工具软件可以通过优化PHP运行环境来达到提速的目的，其基本原理大致是将PHP代码预编译并缓存起来，而不需要改变任何代码，所以比较简单，可以将php的运行效率提升50%以上。比较常用的php加速工具有：APC( http: //pecl.php.net/package-info.php?package=APC)、Turck MMCache（）、php accelebrator()，还有收费的Zend Performance Suite

3）将静态内容和动态内容分开处理
apache是一个功能完善但比较庞大的web server，它的资源占用基本上和同时运行的进程数呈正比，对服务器内存的消耗比较大，处理并行任务的效率也一般。在一些情况下，我们可以用比较轻量级的web server来host静态的图片、样式表和javascript文件，这样可以大大提升静态文件的处理速度，还可以减少对内存占用。我使用的web server是来自俄罗斯的nginx，其他选择方案还包括lighttpd和thttpd等。

4）基于反向代理的前端访问负载均衡
当一台前端服务器不足以应付用户访问时，通过前端机实现web访问的负载均衡是最快速可行的方案。通过apache的mod_proxy可以实现基于反向代理的负载均衡，这里推荐使用nginx做代理服务器，处理速度较apache更快一些。

5）应用缓存技术提高数据库效能，文件缓存和分布式缓存
数据库访问处理并发访问的能力是很多网站应用的关键瓶颈，在想到使用主从结构和多farm的方式构建服务器集群之前，首先应该确保充分使用了数据库查询的缓存。一些数据库类型（如mysql的innoDB）自身内置对缓存的支持，此外，还可以利用程序方法将常用的查询通过文件或内存缓存起来。比如通过 php中的ob_start和文件读写函数可以很方便的实现文件形式的缓存，而如果你拥有多台服务器，可以通过memcache技术通过分布式共享内存来对数据库查询进行缓存，不仅效率高而且扩展性好，memcache技术在livejournal和Craigslist.org等知名网站应用中都得到了检验。

6）服务器运行状态的检测，找到影响性能的瓶颈所在
系统优化没有一劳永逸的方法，需要通过检测服务器的运行状态来及时发现影响性能的瓶颈，以及可能存在的潜在问题，因为网站的性能，永远取决于木桶中的短板。可以编写一些脚本来检测web服务的运行，也有一些开源的软件也提供了很好的功能

7）良好的扩展架构是稳定和性能的基础
一些技巧和窍门可以帮你度过眼前的难关，但要想使网站具备应付大规模访问的能力，则需要从系统架构上进行彻底的规划，好在很多前人无私的把他们架构
网站的经验分享给我们，使我们可以少走甚多弯路。我最近读到的两篇有启发的文章：
- 从LiveJournal后台发展看大规模网站性能优化方法
- Myspace的六次重构

最后不得不提到程序编码和数据库结构对性能的影响，一系列糟糕的循环语句，一个不合理的查询语句、一张设计不佳的数据表或索引表，都足以会使应用程序运行的速度成倍的降低。培养全局思考的能力，养成良好的编程习惯，并对数据库运行机制有所了解，是提高编程质量的基础。

G. 多台服务器如何做网络负载均衡

1：找分区或目录同步软件，某台服务器改动了自动把修改应用到别的服务器，比如红旗的HA。

2：换种建服务器的思路，后台用一台独立的服务器做数据库和文件服务器，用来存放数据库和上传的文件，另外的做负载均衡运行服务器，把不需要变动的网页程序放上面。

怎么提高网站负载能力

与怎么提高网站负载能力相关的内容