博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
完善的IaaS云服务的个人理解
阅读量:5839 次
发布时间:2019-06-18

本文共 2271 字,大约阅读时间需要 7 分钟。

此文已由作者王盼授权网易云社区发布。

欢迎访问,了解更多网易技术产品运营经验。

前情提要

本文仅讨论云主机(虚拟机)、云硬盘(块存储)、云网络(普通虚拟网络或SDN)相关的IaaS服务,相关论调仅代表个人意见,如有谬误,敬请批评指正。

这篇文章在7月份就列好了大纲,但是一直拖拖拉拉到11月初,才憋出了几百字。

网易云IaaS平台自2012年上半年立项,到如今已有接近5年的发展历程,生产环境云主机数量也从个位数扩展到当前的5位数,机房数量也从1个扩展到杭州3个,北京2个,并且还在迅速扩张。有一点我特别深有体会,那就是生产环境流行“屯云主机”,线上资源长期处于秒杀状态,每个季度采购的几十台计算节点,一个月左右基本就抢光,剩下两个月就处于等待新节点上线,无法创建新云主机的尴尬境地,所以很多有经验的开发人员,会在季度采购节点上线后,迅速准确的提出扩容需求(当然可能是两三个月之后的需求),创建一批云主机备用,当然他们也是逼不得已,因为晚了就抢不到了。说了这么多,不知道大家看明白了没有,我只是想强调一点,我们的IaaS服务非常受欢迎(想吐槽的人请私下联系我即可,千万不要在评论区留言)。

接下来就谈一谈我心目中的完善的IaaS服务是长什么样的,至于我们的IaaS服务做到了没有,暂且不论,权当闲聊吧。

何为完善

  • 功能完善

  • 运维便利

  • 安全可靠

  • 性能优异

  • 体验友好

  • 服务优质

  • 成本低廉

功能完善

作为一个IaaS服务提供商,尤其是做公有云(私有云需求相对简单一些),必须要提供完善的IaaS功能,这点是最基本、最基础的要求,如果功能都不完善,缺少一些重要功能,甚至API都不对用户开放,怎么能算是完善的IaaS服务?个人认为具备如下几个方面的功能,才能算是功能完善:

普通用户功能

  • 基本的主机、网络、存储资源的生命周期管理功能(增删改查、修改规格、快照备份、VNC等)

  • 资源汇总查看

  • 操作日志查看(包含web和api操作)

  • 账户及子账户管理

  • 监控报警

  • 计费充值(消费清单、充值记录、发票申请、退款处理等)

  • 镜像丰富,规格齐全

  • 客户支持(一般为工单系统)

  • API、SDK、CLI支持

  • 移动端管理

后台管理员功能

  • 在线、离线迁移及常规生命周期管理

  • 平台容量规划预警

  • 欠费通知及处理

  • 集群状态监控

  • 异常状态报警

  • 租户配额管理

  • 用户权限控制

  • 管理员分级

  • 管理员操作审计

  • 各种资源的详细信息展示

功能完善的直观体现是用户不会因为功能不全而选用竞品。

运维便利

IaaS云平台运维主要包含如下几个方面:

  • 平台初始化部署

  • 平台扩缩容及容量估算

  • 平台升级更新

  • 平台故障恢复

  • 常见错误排查

便利的意思主要是指如下几个方面:

  • 故障自恢复,不需要人为介入

  • 人员交互少,跨部门跨项目组交互少,最好一个人能搞定

  • 耗时短,自动化程度高,极低的人工参与度

  • 操作简单,容易上手,不需要高深的知识技能和经验积累(坑少且浅)

  • 常见简单错误可以自助识别原因(无资源、无网络端口、无配额等)

运维便利的直观体现是新招员工一周内可接手全部平台运维工作。

安全可靠

  • 计算服务多层高可用保障(多数据中心,多级可用域)

  • 网络服务冗余链路保障

  • 存储多副本保障、租户数据隔离

  • 管理服务无单点

  • SLA保证

  • QoS保证

  • 租户网络隔离

  • 平台、租户防攻击(平台入口如web或API、网络、虚拟化内核等方面)

  • 机房基础设施安全(多路供电、多网络出口、防人为失误、防火防盗防高温防鼠防虫等)

  • 管理员权限管控(防止误操作和恶意操作)

  • 用户及管理员操作记录和审计

  • 物理基础设施资源冗余保障(机房、机柜、电力、服务器、交换机、硬盘、内存、网卡、网络带宽等)

  • 计算节点宕机恢复速度快(支持云主机宕机自动迁移恢复)

  • 其他节点宕机用户无感知

安全可靠的直观体现为全年用户可感知故障时间和次数(总故障时间120分钟以内或更少,总故障次数不超过3次)

性能优异

  • 计算(cpu、内存)性能达到或接近扣除虚拟化损耗的理论值

  • 网络(带宽、时延)性能达到或接近扣除虚拟化损耗的理论值

  • 存储(带宽、时延)性能达到或接近扣除虚拟化损耗的理论值

  • 性能波动较少,与租户数量、测试时间段等关系较小或无关

  • 不同租户性能相互影响较小或无相互影响

  • 相同租户不同云主机的性能相互影响较小或无相互影响

性能优异直观体现为与竞品厂商相比,对比测试结果排名靠前(前三或更好),并与测试时间段无关

体验友好

  • 完善的使用指导文档(目录清晰、内容详细、解释清楚、更新及时、FAQ全面)

  • 优秀的web交互、UI设计(人性化、提示明确、傻瓜式,很多用户是不看文档直接上手操作的)

  • 详细生动的API文档(文档更新及时、目录清晰、示例丰富、参数尽量少、内聚程度高、版本兼容性好)

体验友好的直观体现为用户使用过程中问题较少(用户极少因为使用问题找售后支持)

服务优质

  • 用户响应及时(按问题类型、用户类型分类制定响应时限,类似服务等级策略)

  • 渠道丰富(工单、QQ、微信群、公众号、电话等)

  • 售前交流深入充分(将平台的相关局限性与用户充分沟通,可防止给用户过高期望而导致满意度降低)

服务优质的直观体现为用户满意度很高(如果满分5分,则需要达到90%以上4分甚至更高)

成本低廉

成本低廉的直观体现是相同规格服务与竞品价格对比优势明显,并且可保证我们平台的盈利能力。

是网易云提供多种硬件介质的块存储设备,用户可以根据实际生产环境,灵活选择云硬盘类型和规格大小,弹性地创建、删除、挂载、卸载、扩容云硬盘。

更多网易技术、产品、运营经验分享请。

相关文章:

【推荐】
【推荐】

转载地址:http://cqjcx.baihongyu.com/

你可能感兴趣的文章
个人--工资划分5份
查看>>
有关文件下载的文件名
查看>>
史上最详细的wamp配置虚拟域名步骤
查看>>
oracle 授权
查看>>
lv扩展磁盘空间
查看>>
java8之stream流的基本操作
查看>>
二维数组计算协方差java
查看>>
SpringBoot下Redis相关配置是如何被初始化的
查看>>
为你的AliOS Things应用增加自定义cli命令
查看>>
MongoDB 创建基础索引、组合索引、唯一索引以及优化
查看>>
百度PaddlePaddle常规赛NLP赛道火热开启
查看>>
稳了!这才是cookie,session与token的真正区别
查看>>
OSChina 周二乱弹 —— 假期余额已不足!
查看>>
前端那些事之React篇--helloword
查看>>
ios的google解析XML框架GDataXML的配置及使用
查看>>
netty-当一个客户端连接到来的时候发生了什么
查看>>
PHP_5.3.20 源码编译安装PHP-FPM
查看>>
在51CTO三年年+了,你也来晒晒
查看>>
js控制图片等比例缩放
查看>>
Java高级开发工程师面试考纲
查看>>