Sched.com Conference Mobile Apps
KubeCon + CloudNativeCon | Open Source Summit 2019 中国论坛
has ended
Create Your Own Event
KubeCon + CloudNativeCon | Open Source Summit 2019 中国论坛
-
Saved To
My Schedule
中国上海
2019 年 6 月 24–26 日
单击此处了解更多信息和注册
点击
此处
查看英文版日程表。
To view the English version of this schedule please go
here
.
我们将为所有主题演讲和分组会议提供同声传译服务。
Simultaneous translation will be provided for all keynote and breakout sessions.
场馆 + 赞助商展示区地图
Venue + Sponsor Showcase Map
Schedule
Simple
Expanded
Grid
By Venue
Speakers
Sponsors
Search
menu
Menu
Schedule
Speakers
Sponsors
Search
Back To Schedule
Tuesday
, June 25 • 14:20 - 14:55
1-5-10:如何快速恢复大规模容器故障 - XiongHuan,阿里巴巴
Sign up
or
log in
to save this to your schedule, view media, leave feedback and see who's attending!
Tweet
Share
Feedback form is now closed.
Feedback Submitted
在云时代,企业中基于容器的应用激增,由于人工操作、硬件故障等,发生容器故障的可能性大幅增加。因此,如何在不增加资源投入的情况下保证大规模容器的可靠性成为云平台面临的一个巨大挑战。
阿里巴巴运行着数百万个容器,为恢复容器相关故障提出了 1-5-10 理论:MTTD(平均检测时间)为 1 分钟,MTTI(平均识别时间)为 5 分钟,MTTR(平均解决时间)为 10 分钟。
在本次会议中,我们将讨论如何利用 1-5-10 提高大规模容器的可靠性:
1.如何在本地建立一个有效代理,在 1 分钟内检测到问题;
2.如何借助专家知识库智能诊断容器问题;
3.如何以故障驱动型方式自动恢复容器问题。
Speakers
HX
Huan Xiong
Senior Engineer, Alibaba
A senior software engineer in Alibaba, focuses on reliability of host/container/cluster.
Tuesday June 25, 2019 14:20 - 14:55 CST
515
KC+CNC - 可观察性
预期观众的认知程度
初级(非常基础的信息)