案例名称:
优译信息翻译系统及大数据系统迁移
客户名称:
成都优译信息技术股份有限公司
项目完成日期:
2018年2月
用户背景:
成都优译信息技术股份有限公司是一家专门从事智能翻译技术研发的服务机构,公司立足于语言信息处理的理论研究和技术应用,创新地利用垂直领域大数据技术和云计算技术打造云翻译平台,通过利用数据抓取、检索、利用和存储等技术,提升翻译行业效率,重塑翻译生态系统。
目前公司系列产品已完成软件产品登记, 已获得软件著作权8项,授权及受理发明专利23项,四川省科技厅成果登记证书7项。公司为成都多语中心会员单位、ISO9001认证单位、美国翻译协会ATA成员单位,成都翻译协会会员单位,且已建成四川省唯一的翻译领域省级大学生校外实践教育基地。
公司的产品包括“Transmate单机版、Transmate企业版、Transmate翻译教学系统、译马网智慧翻译平台(www.jeemaa.com)。
Transmate单机版是一款提供给个人译员免费使用的计算机翻译辅助软件(CAT)。它集项目管理、原文预览、伪翻译、预翻译、排版、翻译记忆、拼写检查、低错检查、在线翻译等功能于一体,避免重复翻译、减少翻译工作量、提高翻译效率、确保译文的统一性。
用户面临的挑战:
作为一家互联网翻译公司,如何保证用户的体验至关重要,优译信息提供的在线智能翻译系统如何能让用户在上传操作完成后,快速的拿到翻译的成果,直接影响到公司的业务能力。在原有的架构中,优译信息采用*里云提供云计算服务,主要面临如下问题:
方案介绍:
使用的AWS服务:EC2(C4) /EBS/ELB/AutoScaling/VPC/ RDS/Elasticache /IAM/S3/Glacier/CloudTrail/CloudFormation /Amazon CloudWatch/ aws codedeploy/VM import/export/AWS Trusted Advisior/AWS Config/EMR/Dynamo DB/Kinesis/SQS
架构图:
BIG Data Architecture used by Urelitetech:
架构图说明:
Urelitetech使用灵活的架构来设计前端应用程序工作负载,并使用elasticsearch执行全文搜索。将所有文档数据读入数据库以进行语义分析和处理。 Urelitetech设计了两套数据库系统。一组使用RDS Mysql来存储结构化数据库。并使用DynamoDB作为存储的语义分析数据库。翻译完成后,数据存储在S3中,EMR用于分析翻译的数据。
第三方的工具及解决方案:
CloudBerry:对用户的部分数据从本地项云上S3进行迁移。同时采用CloudBerry的自动同步的功能,满足最少时间的RPO\RTO。
成果及价值:
通过本次项目,完成了优译信息的整套系统向AWS公有云迁移,有如下价值:
扫一扫在手机上阅读本文章