公司网站制作中稳定性采取常用办法

网站稳定性建设是一项综合性的系统工程,就像人类健康一样。如果你不注意健康的饮食和锻炼,久而久之,你的身体肯定会有问题。稳定性的考虑也贯穿于整个研发周期。周期性的。网站的架构设计要考…

网站稳定性建设是一项综合性的系统工程,就像人类健康一样。如果你不注意健康的饮食和锻炼,久而久之,你的身体肯定会有问题。稳定性的考虑也贯穿于整个研发周期。周期性的。网站的架构设计要考虑稳定性:考虑到网络光纤可能被切断,如果只有一个机房,那将是一个悲剧,100%的流量都没有了,甚至还要考虑自然灾害的影响,多建一个机房。维稳建设有两个重要因素:一是思想重视,开发商重稳定(即敬畏之心)可以避免70%至80%的失败;二是建设规范和工具,确保稳定。(1)建筑施工阶段的稳定施工项目对于网站具有良好的稳定性,必须在建筑设计阶段进行长期考虑,正如房屋的地基必须先铺设,否则建筑物越高,其危险性就越高。在构建一个高度稳定的架构时,必须注意以下几点。避免单点。在高可用性架构设计中,首先要避免单点。从概率的角度来看,无论是机器还是人类,没有什么是绝对正确的。避免一个完整的环节成为一个单一的点是建筑设计的原则。但是,在某些场景中,有些功能必须放在同一个应用中,比如统一登录、网关、安全过滤等,此时一定要尽量按人群划分,逻辑上没有一个点;或者尝试将服务分解成组件并移动到不同的端部来执行。例如,安全服务可以作为一个模块集成到Nginx或应用程序计算机中,而不是使其成为远程服务接口。群体隔离。将应用细分得更细一点,将不同的功能模块划分成不同的组,每个组都占有机群的一部分,这样就可以隔离服务分组,不太重要的分组可以避免重要分组的影响。非常流行的微服务是一种非常好的群体隔离实践。异步化。在系统设计中,尽可能多地异步进行远程调用也是一个重要的原则。在许多情况下,对不太重要的函数的强烈依赖会导致整个应用程序崩溃,因此请尝试将不太重要的依赖项更改为异步调用,以避免影响主调用链接的稳定性。偏远地区的灾难恢复。考虑到许多不可抗力因素的影响,我们需要设计站点的远程容灾甚至全局部署策略。这些不可抗力事件往往会影响到整个站点的结构,并且必须做出长期的规划(2)在编码阶段的稳定性在编程阶段的性建设尤为重要。一个好的程序在编码阶段决定了整个应用系统的质量,因此在编码阶段应该注意以下规则。错误捕获。一个优雅的系统必须有一个优雅的异常处理机制。在10个处理、远程调用和多线程处理等关键位置捕获异常非常重要。防御性编程可以更好地保证系统的鲁棒性。异步线程。在一些批处理调用中使用异步线程可以确保主请求的正常返回,以及部分隔离以防止部分请求挂起整个应用程序。加班处理。在远程调用或调用外围设备时,需要设置超时时间,以确保所有请求都有一个可预测的返回结果。限流保护。每个应用程序都有一个负载限制,超过这个限制会带来很多不确定性,因此,建立一个自我保护机制可以保证程序的健壮性。(3) 测试阶段的稳定性建设测试是项目上线前的最后保证。测试也是验证程序是否达到预期功能的一种手段。现阶段,应注意以下事项。自动比较测试。比较测试是将同一个业务接口的返回值与真实的在线环境和数据以及预发布环境进行比较,以确定新发布的代码是否符合预期。β测试。在现实世界中,通过从远程计算机获取个人计算机上的数据来验证程序的正确性。(4) 泄洪阶段的稳定施工在泄洪阶段的稳定施工中应注意以下事项。分批放行。批量发布可以降低发布风险,不仅可以减少系统部署重启引起的RT抖动,而且可以在发现问题时立即终止发布。发布了多个版本。合并部署是在同一个web容器实例中同时部署多个应用程序系统,并共享同一个流程。每个应用程序彼此隔离,但是应用程序之间的RPC是通过本地调用而不是网络调用来调用的。

(5) 运行阶段的稳定建设工程在运行阶段的稳定建设中应做好以下几点工作:实时监测和报警、过载保护和自动降级、实时数据校正。其核心原则是实时发现问题并提供必要的保护措施。实时监控报警。在线监控必须包括系统监控,主要监控服务器CPU、加载盘、内存等部分系统指标的异常情况;应用监控主要监控响应时间、QPS异常错误等。;业务监控主要监控部分业务指标是否存在异常(如实时订单量、在线司机数、乘客业务指标等)。过载保护和自动降级。在线系统需要一些保护措施,如当系统的某些指标达到瓶颈时,需要进行必要的保护;当负载达到系统的最高瓶颈时,需要拒绝一些请求,以防止系统不堪重负;一些远程调用时可以设置最大并发数,一旦超过阈值,就会自动fastfail来保护系统。实时数据调节。这属于业务监控的范围。当涉及到敏感信息时,为了保证信息的正确性,需要进行实时对账。最典型的情况是在涉及跨部门数据复制时,基金数据和对账检查数据一致性。(6) 稳定施工当发生故障时一旦发生故障,最重要的是迅速停止损失,定位故障并迅速恢复。根据经验,当发生故障时,第一反应是快速回退了解故障现象,根据故障现象确定故障原因,然后找到解决方案。当故障发生时,缩短故障定位时间和快速恢复策略至关重要。快速定位故障可以缩短故障恢复时间。如何定位故障?据统计,6次故障中有90%是由更改引起的,因此快速收集在线机器的变更信息和异常数据非常重要,但困难在于这些数据往往分散在不同的地方,格式也不尽相同。快速恢复。影响故障恢复时间的一个因素是故障定位时间,另一个因素是所采用的快速恢复方法。例如,当多版本部署失败时,可以通过快速切换网站建设的版本来恢复;如果在不同的地方有多个活动,可以将流量切换到不同的单元,以阻止丢失。

作者: guangdongseo

为您推荐

发表评论

电子邮件地址不会被公开。 必填项已用*标注

关注微信
微信扫一扫关注我们

微信扫一扫关注我们

返回顶部