Loading…
中国上海
2019 年 6 月 24–26 日
单击此处了解更多信息和注册

点击此处查看英文版日程表。
To view the English version of this schedule please go here.

我们将为所有主题演讲和分组会议提供同声传译服务。
Simultaneous translation will be provided for all keynote and breakout sessions.

场馆 + 赞助商展示区地图
Venue + Sponsor Showcase Map
Tuesday, June 25 • 14:20 - 14:55
1-5-10:如何快速恢复大规模容器故障 - XiongHuan,阿里巴巴

Sign up or log in to save this to your schedule, view media, leave feedback and see who's attending!

Feedback form is now closed.
在云时代,企业中基于容器的应用激增,由于人工操作、硬件故障等,发生容器故障的可能性大幅增加。因此,如何在不增加资源投入的情况下保证大规模容器的可靠性成为云平台面临的一个巨大挑战。

阿里巴巴运行着数百万个容器,为恢复容器相关故障提出了 1-5-10 理论:MTTD(平均检测时间)为 1 分钟,MTTI(平均识别时间)为 5 分钟,MTTR(平均解决时间)为 10 分钟。

在本次会议中,我们将讨论如何利用 1-5-10 提高大规模容器的可靠性:
1.如何在本地建立一个有效代理,在 1 分钟内检测到问题;
2.如何借助专家知识库智能诊断容器问题;
3.如何以故障驱动型方式自动恢复容器问题。

Speakers
HX

Huan Xiong

Senior Engineer, Alibaba
A senior software engineer in Alibaba, focuses on reliability of host/container/cluster.


Tuesday June 25, 2019 14:20 - 14:55 CST
515