知行志成官方网站

通威股份:30分钟完成容灾切换 云上云下双向保护

发布时间:2018-10-09 12:52

案例名称:

通威股份混合云容灾项目

客户名称:

通威股份

项目完成日期:

2018年9月

用户背景:

  通威股份是由通威集团控股,以饲料工业为主,同时涉足水产研究、水产养殖、肉制品加工、动物保健以及新能源等相关领域的大型科技型上市公司(股票代码:600438),系农业产业化国家重点龙头企业。现拥有四川、广东、重庆、昆明、厦门、武汉、苏州、长春、沈阳、沅江、沙市、淮安、无锡、南宁、海南、粤华、大海、越南等遍布全国各地及东南亚地区的八十余家从事饲料工业生产销售的分、子公司及以新能源产品多晶硅生产为主的永祥股份、四川永祥多晶硅公司。饲料型公司生产水产、畜、禽饲料及特种饲料近五百个品种,年饲料生产能力达400万吨,是全球主要的水产饲料生产企业及我国重要的畜禽饲料生产企业,其中水产饲料全国市场占有率已达到20%左右。

通威股份拥有雄厚的科技研发实力,目前建立了国家认定企业技术中心、四川农业大学动物营养博士工作站、上海水产大学研究生培养基地等八大研发中心,每年投入基础研发的费用达到数千万元;在编科研技术人员350余人,专门从事动物营养、动物饲料、动物良种培育和鱼类基因工程的研究,每年提供上百项研究成果和200余篇科研报告。

用户面临的挑战:

作为企业运行的IT大脑,通威股份FBC的系统承载着公司上万名员工的流程与协作,传统数据中心的IT基础设施不易维护,曾多次出现系统硬件故障影响业务正常运行的状况,给公司造成了巨大损失,因此公司对IT系统的高可用性,业务连续性提出了重大挑战。

  • 现有数据中心规模大,维护和管理成本高。
  • 一些设备和硬件使用时间过长,存在很高的损坏风险。
  • 企业信息化整体水平较高,业务连续性要求较高。 如果核心业务系统出现故障,将导致超过200家子公司的业务将停滞不前。
  • 本地数据中心的资源,无法满足爆发式的业务响应(例如在每个月进行月结的时候,现有系统的处理能力无法满足业务的要求)
  • 企业网络结构复杂,交织着专线,VPN等多种接入方式。
  • 业务发展越来越快,新的业务系统对IT 基础设施敏捷性要求越来越高。
  • FBC生产系统,选需要做到异地容灾,正反向实时保护,宕机后业务切换时间不能超过20分钟。

方案介绍:

使用的服务:EC2(C4, R4, X1)/EBS/VPC/IAM/S3/TrustAdvisor/CloudWatch/CloudTrail/Config/Systemmanager/vmimport/ELB

逻辑架构图:


aws架构图:


架构图说明:

  • 本地环境通过IPSec VPN线路连接到AWS云环境。因此,本地用户可以使用私有IP地址来访问云中的基础架构环境,其也可以与其他本地服务系统交互。
  • 每个功能模块部署到同一可用区中不同子网的EC2实例。这确保了EC2之间通信的低延迟,并实现了单独的安全控制以提高系统安全性。
  • 每个AZ部署一个复制网关,通过复制网关存储卷同步对应AZ应用系统中的磁盘数据。
  • 通过统一的管理平台,管理容灾任务。
  • 在云上搭建AD域控,通过AD本身的同步机制同步域名更新信息,容灾复制平台通过keytab文件与AD域集成身份认证,并更新AD域控DNS解析信息,使容灾切换前后域名信息统一。
  • EC2实例自动重启/自动恢复可在EC2实例发生故障后快速恢复,并减少服务停机时间。
  • 使用NACL对云上云下应用系统的访问做严格控制,避免在容灾测试过程中产生脏数据。
  • 使用AWS ELB 取代云下硬件负载均衡,以满足业务切换到云上对负载均衡的需求。
  • 使用CNAME 的方式,将负载均衡url转换成通威统一使用的域名,以满足业务对域名唯一性的要求。
  • 创建演练隔离环境,满足通威股份对应容灾演练的需求。
  • Oracle数据库通过DataGuard实时复制到AWS

第三方的工具及解决方案:

Veritas VRP,业界领先的容灾软件,通过此容灾软件,作为链接AWS公有云和通威本地私有云的容灾平台。

Openswan,开源免费的VPN软件,与AWS成都总部进行VPN连接。

成果及价值:

通过本次项目,完成了通威核心系统FBC的混合云和容灾,使得通威不但可以方便的随时使用云上的各种资源,还实现对现有系统的数据保护,同时有效的提升了业务连续性,有如下价值:

业界领先,国内首例

通威FBC生产系统是国内首个落地的混合云容灾项目,对引领企业级核心系统如何利用云的优优势,提供了方向,起到了标杆作用。

敏捷响应

在Actwill的协助下,对通威核心系统进行现有业务分析,混合云架构规划,实施部署,以及调优,达到了FBC核心系统,单组件云上云下切换无感知,整体切换时间控制在20分钟以内。

同时针对月底发峰值处理要求,可以灵活的将业务在云上运行。

业务连续性受到数据中心硬件设备质量和数据中心物理环境的限制。 仅通过企业自己的数据中心很难确保高业务连续性要求。 在其他地方建立灾难恢复中心的成本极高且难以实施。采用AWS的基础设施,并结合容灾复制软件,可以保证业务对连续性的要求。

低成本实现两地三中心

通过统一的管理平台管理云上云下业务组件,正常情况下,无需启动云上实例,通过复制网关实时同步数据,只收取数据存储费用,以及少量流出流量费用,当云下环境发生灾难时,才自动从云上启动实例,此种模式经济高效。

安全

数据通信全部采用加密方式进行通信,充分保证数据传输的安全和存储的安全

扫一扫在手机上阅读本文章