知行志成官方网站

优译信息翻译系统及大数据系统迁移项目

发布时间:2018-10-09 13:08

案例名称:

优译信息翻译系统及大数据系统迁移

客户名称:

成都优译信息技术股份有限公司

项目完成日期:

2018年2月

用户背景:

成都优译信息技术股份有限公司是一家专门从事智能翻译技术研发的服务机构,公司立足于语言信息处理的理论研究和技术应用,创新地利用垂直领域大数据技术和云计算技术打造云翻译平台,通过利用数据抓取、检索、利用和存储等技术,提升翻译行业效率,重塑翻译生态系统。

目前公司系列产品已完成软件产品登记, 已获得软件著作权8项,授权及受理发明专利23项,四川省科技厅成果登记证书7项。公司为成都多语中心会员单位、ISO9001认证单位、美国翻译协会ATA成员单位,成都翻译协会会员单位,且已建成四川省唯一的翻译领域省级大学生校外实践教育基地。

公司的产品包括“Transmate单机版、Transmate企业版、Transmate翻译教学系统、译马网智慧翻译平台(www.jeemaa.com)。

Transmate单机版是一款提供给个人译员免费使用的计算机翻译辅助软件(CAT)。它集项目管理、原文预览、伪翻译、预翻译、排版、翻译记忆、拼写检查、低错检查、在线翻译等功能于一体,避免重复翻译、减少翻译工作量、提高翻译效率、确保译文的统一性。

用户面临的挑战:

作为一家互联网翻译公司,如何保证用户的体验至关重要,优译信息提供的在线智能翻译系统如何能让用户在上传操作完成后,快速的拿到翻译的成果,直接影响到公司的业务能力。在原有的架构中,优译信息采用*里云提供云计算服务,主要面临如下问题:

  • 服务器的稳定性不足,容易影响到而业务的开展。
  • 自建HBASE的性能存在严重的瓶颈,严重影响到用户的使用体验。
  • 优译信息非常高期望通过DevOps的理念,实现自身的快速开发和运维的要求,希望云上能够提供全套的DevOps的框架。
  • 以后在全球范围内开展业务,扩大业务能力,需要更强大的基础设施进行支撑。

方案介绍:

使用的AWS服务:EC2(C4) /EBS/ELB/AutoScaling/VPC/ RDS/Elasticache /IAM/S3/Glacier/CloudTrail/CloudFormation /Amazon CloudWatch/  aws codedeploy/VM import/export/AWS Trusted Advisior/AWS Config/EMR/Dynamo DB/Kinesis/SQS

架构图:


BIG Data Architecture used by Urelitetech:


架构图说明:

Urelitetech使用灵活的架构来设计前端应用程序工作负载,并使用elasticsearch执行全文搜索。将所有文档数据读入数据库以进行语义分析和处理。 Urelitetech设计了两套数据库系统。一组使用RDS Mysql来存储结构化数据库。并使用DynamoDB作为存储的语义分析数据库。翻译完成后,数据存储在S3中,EMR用于分析翻译的数据。

  • 多AZ部署
  • 使用ASG进行自动扩展
  • 使用托管的DynamoDB提高整体用户性能
  • 通过托管RDS和多可用区部署提高数据安全性
  • 使用托管的Mencahed服务来避免自建数据库缓存
  • CI / CD提供Devops的相关服务
  • 使用ELB进行负载平衡
  • 采用堡垒机增强了安全性
  • IAM实现安全控制
  • S3执行对象存储,降低成本并提高访问速度
  • 使用监控工具,如cloudwatch和API接口监控工具

第三方的工具及解决方案:

CloudBerry:对用户的部分数据从本地项云上S3进行迁移。同时采用CloudBerry的自动同步的功能,满足最少时间的RPO\RTO。

成果及价值:

通过本次项目,完成了优译信息的整套系统向AWS公有云迁移,有如下价值:

  • 提升用户体验,翻译系统的整体相应速度由10秒级变更为秒级,用户在使用翻译系统的时候,能够得到非常良好的用户体验。
  • 节省费用,采用AWS的ASG对应用服务器进行自动扩展,有效的节省了费用,同时通过SPOT、Docker、Lambda的有效应用,在改善应用程序性能的同时,答复的降低了云上的费用支出。
  • 应用系统性能提升,特别是将数据从HABSE迁移到AWS的托管的DynamoDB以后,后台监控数据的运行效率明显提升,系统压力大幅降低。同时采用的Docker、Lambda等应用架构设计,优化了系统运行效率。采用托管的EMR的使用,极大的提高了大数据的处理能力和处理效率。
  • 极高的业务连续性,全部的应用采用多可用区的部署,可以有效应对单可用区的故障。同时由于AWS的提供的各项服务运行稳定,极大的提升了业务的连续性。

扫一扫在手机上阅读本文章