公司 位置瑞士苏黎世 行业电子商务

挑战

瑞士的一个在线市场,正在经历问题的速度,以及开发和操作之间的“经典缺口”,双方无法很好地协同工作。“他们想要,但他们没有共同点,”塞德里克Meury说平台工程负责人。“这是一个减缓我们的根源。”The company began breaking down the legacy monolith into microservices, and needed orchestration to support the new architecture in its own data centers—as well as bring together Dev and Ops.

解决方案

该公司采用Kubernetes集群管理,普罗米修斯监控,Fluentd为日志记录。第一个集群部署在前提在2016年12月,三个月后生产的第一个服务。迁移是成功的一半,该公司计划将完全谷歌云平台到2018年底。

影响

庞然大物分隔成microservices”允许更高的速度,和Kubernetes支持至关重要,”Meury说。部署到生产的数量已从不足10一周每天30 - 60。”当有问题在生产中,门票或投诉将被扔在墙上操作,经典的问题。现在,人们有机会先为自己考虑操作和故障诊断,因为一切都是部署在一个标准化的方式,“Meury说。他认为在日常互动的影响:“几个星期前,我看到一个产品经理做一个拉一个JSON请求文件,其中包含一些变量,而别人也接受了。它是部署在几分钟甚至几秒钟之后,这之前是不可想象的。曾经很需要发生一连串的事情,整个庞然大物是很难理解,即使是工程师。之前请求将进入大,效率低下的看板,希望有人会做更改后几周和几个月。”Before, infrastructure- and platform-related projects took months or years to complete; now developers and operators can work together to deploy infrastructure parts via Kubernetes in a matter of weeks and sometimes days. In the long run, the company also expects to notch 50% cost savings going from custom data center and virtual machines to containerized infrastructure and cloud services.

当塞德里克Meury加入了里卡多。ch在2016年,他看到一个明显的区别运营和发展。事实上,他们有文字之间的距离:工程团队工作在法国,而其他的组织是总部设在瑞士。

“这是一个典型的这些部门之间的差距,甚至一些愤怒和沮丧,“Meury说。“他们想要一起工作,但他们没有共同点。这是慢的根本原因之一。”

这一差距在里卡多伤害速度。瑞士ch在线市场。网站搜索过程260万峰的一天从网络和移动应用程序,服务320万名成员现场拍卖。技术团队的主要挑战是确保“投标项目以正确的顺序,在拍卖结束之前,这在一个公平的方式工作,“Meury说。“我们有一个实时的要求。报价我们也提供了一个自动化的系统,它需要准确和正确的。与分布式系统,确保订购的挑战是正确的。这是我们正在处理的一件事。”

为了解决速度问题,里卡多。ch首席技术官杰里米•塞茨成立了一个名为环保署的新软件工厂,由65名工程师,2 7产品经理和设计师。“我们把这三个部门一起,这样他们可以简化并相互交流更加密切,“Meury说。

公司也开始打破传统的庞然大物到超过100 microservices,和需要编排支持新的架构在自己的数据中心。“分手庞然大物允许更高的速度,和Kubernetes支持至关重要,”Meury说。“集装箱化和编制Kubernetes帮助我们大大减少开发与运维之间的冲突,也允许我们说同样的语言两边的通道。”

Meury放在一起一个平台工程团队选择工具,包括Fluentd日志和普罗米修斯监测,与Grafana可视化和集群第一Kubernetes奠定基础,这是安装在2016年12月的前提。在几周内,新平台是提供给团队,给予培训和文档。德赢是不是大平台平台工程团队然后嵌入式工程师来帮助他们在新的平台上部署应用程序。第一个服务在生产是里卡多。ch工作页面。“这是一个锻炼在前端开发中,开发人员可以尝试一个新的堆栈,“Meury说。

Meury估计,该应用程序迁移到Kubernetes的一半。和谷歌的计划是将一切云平台在2018年底。“我们仍一些服务器运行在自己的数据中心,但所有的集装箱化努力,将我们的服务描述为Kubernetes表现将使我们能够很容易做出这样的转变,“Meury说。

影响是巨大的。从自定义数据中心和虚拟机到集装箱基础设施和云服务将为公司带来50%的成本节省。部署到生产的数量已从不足10一周每天30 - 60。”当有问题在生产中,门票或投诉将被扔在墙上操作,经典的问题,“Meury说。“现在,人们有机会先为自己考虑操作和故障诊断,因为一切都是部署在一个标准化的方法。减少时间和不确定性。”

Meury也看到在日常互动的影响:“几个星期前,我看到一个产品经理做一个拉一个JSON请求文件,其中包含一些变量,和别人接受了它。它是部署在几分钟甚至几秒钟之后,这之前是不可想象的。曾经很需要发生一连串的事情,整个庞然大物是很难理解,即使是工程师。之前请求将进入大,效率低下的看板,希望有人会做更改后几周和几个月。”

开发与运维之间的鸿沟也减少。“几个月后,我收到请求的人说,“嘿,你能帮我安装Kubernetes客户吗?我想看看发生了什么,”Meury说。“人们直接查看系统的状态,使它们,更接近业务。”以前,基础设施和platform-related项目需要几个月或几年完成;现在开发商和运营商可以通过Kubernetes共同部署基础设施部分在几周内,有时天。

拥有洞察的能力系统扩展到其他地区的公司,。“我发现,我们的一个客户支持代表看着Grafana指标找出系统是否运行良好,这是奇妙的,“Meury说。《普罗米修斯》是直接连接到客户服务。

里卡多。ch原生云之旅也许最对运维团队的影响。“我们有一个业务团队,来自一个基于硬件的背景,现在他们正在重新学习如何操作更加虚拟化和云原生世界,取得了巨大的成功到目前为止,“Meury说。“所以除了仍然操作现场数据中心防火墙,他们学会代码或者做一些Python脚本在同一时间。前网络管理员正在编写代码。它只是很酷。

对Meury,旅程归结于此。“我的一个同事在KubeCon听所有的谈判,他是被所有的工具、技术,框架,目前缺乏对我们的平台,“Meury说。“但与此同时,他很高兴知道在未来有太多,我们还可以探索和提高我们可以工作。无论我们从看到过渡问题,“这是破碎的”或“这是下来,我们必须修复它”——,“我们如何能真正改善和自动化,并使其最终更好的为开发人员和最终用户吗?’”

Baidu