干货 | Yelp是如何使用Docker的?

2023-11-02 14:20
文章标签 使用 docker 干货 yelp

本文主要是介绍干货 | Yelp是如何使用Docker的?,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

本文讲的是干货 | Yelp是如何使用Docker的 【编者的话】本文主要讲述了Docker在Yelp真实生产环境下使用的一些最佳实践和一些部署经验。

每天都有成千上万的人在使用Yelp的SeatMe来完成餐厅预订服务。这篇博客将会深入地讲解Yelp是如何使用Docker来开发并部署SeatMe系统的。Docker是一个非常强大的生产环境助推器,它已经大大简化了我们的部署方式。首先,我要简单介绍一下Yelp的SeatMe系统的背景,以及它的开发部署方式。
Yelp的SeatMe是什么
餐厅会通过我们的网站或者iPad应用来接受并管理客户预定信息。我们会保证客户所有的终端信息实时同步,同时当客户在没有联网的情况下我们也支持离线更改。
seatme_devices.png

我们的技术栈:
  • 客户端的JavaScript,我们在单页应用中使用到了Backbone。
  • Python是我们后端的语言,Django是我们的Web框架。
  • 我们使用Celery和RabbitMQ来处理我们的异步任务。
  • Postgres数据库,使用触发器的数据验证和更新通知,以支持我们的同步协议和长轮询引擎。
  • 我们把整个平台都放到了AWS上,并使用Chef作为我们的主要工具来配置服务器,管理部署和组织我们的测试、灰度、线上环境。

在生产环境使用Docker
一年前,我们使用Docker容器开启了一种新的方式来让我们的测试环境、灰度环境、生产环境更加地一致,同时让我们的部署流程更加简化。

在我们使用容器之前,部署一个Web应用的逻辑是被放在Chef的配置文件里。部署流程大概像这样:
  • 设置目录权限。
  • 安装Python的依赖组件和依赖包。
  • 下载指定标签的Git分支。
  • 保留最近的几个版本来确保我们可以快速回滚。

这些Chef的配置文件对于新工程师来说简直是噩梦,因为它们使用一种完全不同的语言(Ruby)的一个非常复杂的框架。

通过使用Docker,我们能够简化Chef管理的部署部分,现在的流程如下:
  • 拉取一个指定的Docker镜像到服务器。
  • 通过健康检查来停止服务器。
  • 停止存在的容器。
  • 给新的镜像打一个易读的标签。
  • 启动这个镜像(以及所有它的文件系统的映射等等),并使用一个新的名字来命名这个容器(www)。

使用Docker的好处:
  • 通过Docker来增强开发者对环境的控制。
  • 消除服务器环境的不统一。
  • 减少了Chef的配置工作量。
  • 集中了部署镜像库而且永远可以对应到某个具体的Git提交。
  • 我们持续集成了Docker镜像,所以每一次Code Review通过后总会生成一个可部署的镜像。
  • 现在开发者可以修改系统级别的包,而不需要运维团队来做这件事了。

经过两个月的开发和测试,我们在2014年10月初期终于把Docker用到了生产环境,并且运行稳定。
向Docker迁移过程中需要注意的事情
Docker是一个相对比较新的技术,所以你使用过程中难免会遇到一些坑。我在这里总结下我们的经验。
  • 务必认真测试你的文件系统。

    这里有一些对Docker可用的文件系统,AUFS被认为是上一代的文件系统,Device Mapper被认为是目前这一代的文件系统。我们发现尽管测试是在本地文件系统,但使用Device Mapper文件系统的时候可能会出现崩溃,同时整个系统也会挂。当然这很可能是内核和发行版的不同所造成的,我们发现AUFS在我们的生产环境中非常地稳定。务必充分地测试你的文件系统尤其是通过在测试环境中不断地重复部署的方式。
  • 多次构建Docker镜像以及镜像的大小。

    由于Docker的分层文件系统,所以当你改变某些层的时候,就需要重新构建系统。而相对于你的宝贵时间来说,这样的重复等待工作简直令人郁闷。为了减少构建层以及重构时间,你可以将某些命令整合成单个命令。考虑一下缓存成功构建后的Docker镜像来减少构建的次数吧。
  • 务必使用明确的命令来构建和启动容器或者编写Dockerfile。

    我们使用模板来做这件事情。一旦有一些参数要传给docker run,你想要这些参数文档化。当你使用新的Docker版本的时候,你不必去改变这个服务器上的配置文件或者shell的alias,仅仅是代码的改变。
  • 镜像文件和容器实例不会自动地回收。

    这已经被谈论了很长时间了,我们发现当我们所有的服务器硬盘神秘变满地时候,我们部署过的每一个镜像依然保存在服务器上直到我们删除它。我们已经使用一些简单的管理脚本来减少磁盘的占用了,直到我们发现了像docker-custodian一样的工具才真正解决了这个问题。
  • 考虑把你的镜像分层到多个Dockerfile来加速构建。

    我们前面讨论过镜像缓存,我们已经完成了一个多层Docker镜像策略,这个策略是让镜像之间可以互相继承。

    一些基础镜像,他们包含了一些系统包,构建的过程非常慢,但是这样的镜像也很少改变。

    生产环境中的Web镜像继承自这些基础镜像,同时也包含了一系列的编译好的Python包和某一时刻的源代码快照。这样会快速地构建除非遇到requirements.txt文件的变动,这个变动会触发virtualenv的重新构建。

    开发者的Web镜像继承自生产环境的镜像,并且增加了一些跑selenium测试(Xvcon、google-chrome)的工具和一些开发者的工具。然后开发者利用文件系统将他们的新的代码映射到容器当中,并且在生产环境Web镜像中覆盖快照。
  • 遇到紧急情况,你依然可以进入容器内debug你的代码。

    最初当你在容器内跑你的代码的时候,它就像在你跟你的代码之间放了一个隔离层,并且这个隔离层阻止了大量的正常debugging技术。当它不被认为是最佳实践的生产环境系统的时候,当在测试环境(尤其是在开发环境)的时候,你很可能打开一个终端执行docker exec -ti <containerid> bash然后用平常的命令比如strace来检查你的代码或系统是否正常。
  • 你需要一个日志管理的策略。

    这听起来是一个再普通不过的话题,但是日志管理对于Docker来说是非常棘手的问题。你可以用一些简单的技术去映射宿主机的文件系统到容器中简单地把日志保存在宿主机上,但是当你在这个宿主机上起更多的容器实例的时候这个方法很快就会失败。

    最后,经过大量的实验,我们已经取得巨大的成功,并将应用程序的日志通过UDP直接打到宿主机的syslog上。在Docker 1.7版本之前,做这一件事情需要一个技术来找到syslog宿主机的正确IP地址,后来我们通过传递环境变量解决了这个问题。

关于未来
总的来说,容器化已经取得了巨大成功。比如说,当Shellshock漏洞被公布的时候,我们的事故响应仅仅是一次容器的构建和一次Chef的执行。尽管发展步履维艰,Docker已经是一个巨大的改变,我们非常乐意继续研究它。有了一个稳定的Web基础构件后,我们已经找到更新更有效率的方法来测试、部署和管理我们的基础构件,同时也找到了更快的开发迭代的方法。我们希望能在今后的文章中分享这些方法,敬请关注吧!

原文链接:Docker in the Real World at Yelp(翻译:吴飞群 校对:李颖杰)

=====================================================
译者介绍
吴飞群,钱方科技运维工程师,Docker爱好者。

原文发布时间为:2015-08-28 
本文作者:girlskiller
本文来自云栖社区合作伙伴DockerOne,了解相关信息可以关注DockerOne。
原文标题:干货 | Yelp是如何使用Docker的?

这篇关于干货 | Yelp是如何使用Docker的?的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/331197

相关文章

Java中的抽象类与abstract 关键字使用详解

《Java中的抽象类与abstract关键字使用详解》:本文主要介绍Java中的抽象类与abstract关键字使用详解,本文通过实例代码给大家介绍的非常详细,感兴趣的朋友跟随小编一起看看吧... 目录一、抽象类的概念二、使用 abstract2.1 修饰类 => 抽象类2.2 修饰方法 => 抽象方法,没有

MyBatis ParameterHandler的具体使用

《MyBatisParameterHandler的具体使用》本文主要介绍了MyBatisParameterHandler的具体使用,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参... 目录一、概述二、源码1 关键属性2.setParameters3.TypeHandler1.TypeHa

Spring 中的切面与事务结合使用完整示例

《Spring中的切面与事务结合使用完整示例》本文给大家介绍Spring中的切面与事务结合使用完整示例,本文通过实例代码给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友参考... 目录 一、前置知识:Spring AOP 与 事务的关系 事务本质上就是一个“切面”二、核心组件三、完

使用docker搭建嵌入式Linux开发环境

《使用docker搭建嵌入式Linux开发环境》本文主要介绍了使用docker搭建嵌入式Linux开发环境,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面... 目录1、前言2、安装docker3、编写容器管理脚本4、创建容器1、前言在日常开发全志、rk等不同

使用Python实现Word文档的自动化对比方案

《使用Python实现Word文档的自动化对比方案》我们经常需要比较两个Word文档的版本差异,无论是合同修订、论文修改还是代码文档更新,人工比对不仅效率低下,还容易遗漏关键改动,下面通过一个实际案例... 目录引言一、使用python-docx库解析文档结构二、使用difflib进行差异比对三、高级对比方

sky-take-out项目中Redis的使用示例详解

《sky-take-out项目中Redis的使用示例详解》SpringCache是Spring的缓存抽象层,通过注解简化缓存管理,支持Redis等提供者,适用于方法结果缓存、更新和删除操作,但无法实现... 目录Spring Cache主要特性核心注解1.@Cacheable2.@CachePut3.@Ca

C#下Newtonsoft.Json的具体使用

《C#下Newtonsoft.Json的具体使用》Newtonsoft.Json是一个非常流行的C#JSON序列化和反序列化库,它可以方便地将C#对象转换为JSON格式,或者将JSON数据解析为C#对... 目录安装 Newtonsoft.json基本用法1. 序列化 C# 对象为 JSON2. 反序列化

RabbitMQ 延时队列插件安装与使用示例详解(基于 Delayed Message Plugin)

《RabbitMQ延时队列插件安装与使用示例详解(基于DelayedMessagePlugin)》本文详解RabbitMQ通过安装rabbitmq_delayed_message_exchan... 目录 一、什么是 RabbitMQ 延时队列? 二、安装前准备✅ RabbitMQ 环境要求 三、安装延时队

Python ORM神器之SQLAlchemy基本使用完全指南

《PythonORM神器之SQLAlchemy基本使用完全指南》SQLAlchemy是Python主流ORM框架,通过对象化方式简化数据库操作,支持多数据库,提供引擎、会话、模型等核心组件,实现事务... 目录一、什么是SQLAlchemy?二、安装SQLAlchemy三、核心概念1. Engine(引擎)

Java Stream 并行流简介、使用与注意事项小结

《JavaStream并行流简介、使用与注意事项小结》Java8并行流基于StreamAPI,利用多核CPU提升计算密集型任务效率,但需注意线程安全、顺序不确定及线程池管理,可通过自定义线程池与C... 目录1. 并行流简介​特点:​2. 并行流的简单使用​示例:并行流的基本使用​3. 配合自定义线程池​示