用户工具

站点工具


service:techmag:201906_035:04

差别

这里会显示出您选择的修订版和当前版本之间的差别。

到此差别页面的链接

两侧同时换到之前的修订记录 前一修订版
后一修订版
前一修订版
service:techmag:201906_035:04 [2019/08/14 11:37]
-
service:techmag:201906_035:04 [2019/08/30 02:34] (当前版本)
-
行 10: 行 10:
  
 ===== 1 背景 ===== ===== 1 背景 =====
-  企业办公经历了PC到虚拟化的转变,且虚拟机技术在不断的发展进步,对于不同的应用场景,两者对比如表1所示[1],DaaS(桌面即服务)桌面云服务受互联网接入和带宽影响较大,同时考虑到虚拟化桌面的自主可控需要,所以DaaS不纳入本文讨论范围。\\+  企业办公经历了PC到虚拟化的转变,且虚拟机技术在不断的发展进步,对于不同的应用场景,两者对比如表1所示<sup>[1]</​sup>​,DaaS(桌面即服务)桌面云服务受互联网接入和带宽影响较大,同时考虑到虚拟化桌面的自主可控需要,所以DaaS不纳入本文讨论范围。\\
 <WRAP centeralign>​ <WRAP centeralign>​
 表1  PC和虚拟化应用场景对比 表1  PC和虚拟化应用场景对比
 </​WRAP>​ </​WRAP>​
 +{{ :​service:​techmag:​201906_035:​1.pchexunihua.png |}}
  
-|方案/​场景 |PC机|虚拟化桌面(VDI)| Desktop as a Service(DaaS)| +  通过表1可知,PC机和虚拟化可满足不同场景的应用需求。但是,随着公司规模的增加,对安全、高可用、集中管理运维的要求越来越高。随着云计算及其应用研究的日益成熟,虚拟化技术也得到了迅猛发展<sup>[2]</​sup>​,逐渐能够满足现代企业的办公需求,所以越来越多的企业选择了虚拟化作为办公桌面解决方案。\\
-|离线场景|应用广泛|无应用|无应用| +
-|生产力应用程序|应用广泛|应用广泛|应用广泛| +
-|辅助计算|应用较多|应用广泛|应用广泛| +
-|短期工作|应用较少|应用较少|应用广泛| +
-|高端图像处理|应用广泛|应用较少|应用极少| +
- +
-  通过表1可知,PC机和虚拟化可满足不同场景的应用需求。但是,随着公司规模的增加,对安全、高可用、集中管理运维的要求越来越高。随着云计算及其应用研究的日益成熟,虚拟化技术也得到了迅猛发展[2],逐渐能够满足现代企业的办公需求,所以越来越多的企业选择了虚拟化作为办公桌面解决方案。\\+
   为了适应当前办公场景需求,桌面云已在各大企业广泛使用,具有安全、灵活以及可随时随地办公、方便运维管理等优点。目前,应用较多的桌面云系统一般采用服务器集群搭配集中式存储的传统架构。传统架构一方面扩展性较差,大规模扩容困难,另一方面系统复杂度较高,涉及多种设备兼容使用等问题,运维成本较高。另外,集中式存储价格较高,性能差异较大,安全风险也相对集中,因此传统架构桌面云普遍存在部署复杂度高、系统迁移困难、维护成本高、用户体验差等问题。为了解决传统桌面云的各种问题,降低建设和维护成本,提升性能和用户体验,超融合基础架构应运而生。超融合基础架构指在一套单元设备集成了多种资源和技术,包括计算、存储、网络等技术中的部分或全部资源整合集成为融合的统一的资源池。相对于传统的计算与存储分离架构有很多优势,以下将两种架构进行了对比,如表2所示。\\   为了适应当前办公场景需求,桌面云已在各大企业广泛使用,具有安全、灵活以及可随时随地办公、方便运维管理等优点。目前,应用较多的桌面云系统一般采用服务器集群搭配集中式存储的传统架构。传统架构一方面扩展性较差,大规模扩容困难,另一方面系统复杂度较高,涉及多种设备兼容使用等问题,运维成本较高。另外,集中式存储价格较高,性能差异较大,安全风险也相对集中,因此传统架构桌面云普遍存在部署复杂度高、系统迁移困难、维护成本高、用户体验差等问题。为了解决传统桌面云的各种问题,降低建设和维护成本,提升性能和用户体验,超融合基础架构应运而生。超融合基础架构指在一套单元设备集成了多种资源和技术,包括计算、存储、网络等技术中的部分或全部资源整合集成为融合的统一的资源池。相对于传统的计算与存储分离架构有很多优势,以下将两种架构进行了对比,如表2所示。\\
 <WRAP centeralign>​ <WRAP centeralign>​
 表2 计算存储分离架构与超融合架构对比 表2 计算存储分离架构与超融合架构对比
 </​WRAP>​ </​WRAP>​
- ​|超融合架构|传统计算存储分离架构|  +{{ :​service:​techmag:​201906_035:​2.jisuancunchufenlijiagou.png ​|}} 
-|融合|计算、网络、存储等资源部分或全部融合,并搭载统一管理平台维护|计算、网络和存储分离|  +
-|存储架构|分布式存储|集中式存储|  +
-|存储网络|万兆以太网或IB网|多为光纤交换机|  +
-|可靠性|分布式存储可靠性较高|可靠性受控制器影响较大|  +
-|性价比|性能较高,同等性能投入成本较低|传统存储性能差异较大,同等性能投入成本较高|  +
-|扩展性|扩容简单快速|扩展难度大,复杂度高|  +
   从原有桌面云迁移到超融合桌面云会涉及到大量用户,而且涉及到公司安全生产等各个方面,这就需要对超融合系统进行测试,及早发现问题,为后续采购、部署、管理运维提供参考依据。\\   从原有桌面云迁移到超融合桌面云会涉及到大量用户,而且涉及到公司安全生产等各个方面,这就需要对超融合系统进行测试,及早发现问题,为后续采购、部署、管理运维提供参考依据。\\
 ===== 2 方案介绍 ===== ===== 2 方案介绍 =====
行 41: 行 29:
 表3 超融合系统测试模型 表3 超融合系统测试模型
 </​WRAP>​ </​WRAP>​
-|测试项|说明|  +{{ :​service:​techmag:​201906_035:​3.chaoronghexitongceshimoxing.png ​|}} 
-|功能性| 针对办公软件、开发软件、OA相关软件、音视频、用户终端登录、分配桌面、调节桌面内存CPU配置、桌面迁移、通过模板机批量创建桌面等进行了测试,验证各项功能是否可用。|  +
-|性能效率|一是在正常压力下测试超融合桌面的性能,并与传统集中式桌面云进行对比;二是对CPU、内存以及IO进行加压,测试不同压力下超融合桌面的性能变化。除功能性中的相关测试项,另外还增加了虚拟桌面中CPU、内存、磁盘的性能测试。|  +
-|可靠性| 主要针对两个方面对其进行了可靠性测试,一是高可用(HA)故障切换;二是启动风暴测试。|  +
-|易用性| 主要包括创建、删除、重启、迁移虚机,重新分配虚机资源,监控数据展示、获取,修改主机配置等操作是否方便,是否便于学习系统管理、运维操作。|  +
-|维护性| 维护性测试主要关注运维人员对超融合系统进行维护之后生效的时间,主要有修改用户桌面资源配置、修改主机资源配置(主要为管理域资源配置)以及测试修改主机资源配置对用户使用有何影响。| +
  
 ===== 3 方案实施 ===== ===== 3 方案实施 =====
行 56: 行 40:
 表4 主机、桌面CPU和内存配置 表4 主机、桌面CPU和内存配置
 </​WRAP>​ </​WRAP>​
-| |CPU|内存|  +{{ :​service:​techmag:​201906_035:​4.zhujizhuomiancpu.png ​|}} 
-|主机| E5-2620v4 ​ 8core  2.10GHz  *2| 192G|  +
-|桌面| 4 core| 8G|  +
 <WRAP centeralign>​ <WRAP centeralign>​
 表5 主机内存分配 表5 主机内存分配
 +</​WRAP>​
 +{{ :​service:​techmag:​201906_035:​5.zhujineicunfenpei.png |}}
 +
 +{{ :​service:​techmag:​201906_035:​6.tuoputu.png |}}
 +<WRAP centeralign> ​
 +图1 超融合系统网络拓扑图
 </​WRAP>​ </​WRAP>​
  
-|总内存| 192G*3|  
-|可用于分配桌面内存|370.7G|  
-|管理域预留|120G|  
-|管理组件占用|74G|  
-|主机损耗|11.3G|  
-  
-图1 超融合系统网络拓扑图\\ 
  
 ==== 3.2 加压方案 ==== ==== 3.2 加压方案 ====
行 77: 行 58:
   对于Windows而言,大批量机器加压有两个主要问题,一是同时操作多台Windows运行加压工具,二是能否控制加压时压力的大小。\\   对于Windows而言,大批量机器加压有两个主要问题,一是同时操作多台Windows运行加压工具,二是能否控制加压时压力的大小。\\
   对于第一个问题,经过调研实践,本文采用Jmeter5.1版本同时操作多台Windows机器,加压过程示意如图2所示。\\   对于第一个问题,经过调研实践,本文采用Jmeter5.1版本同时操作多台Windows机器,加压过程示意如图2所示。\\
-  +{{ :​service:​techmag:​201906_035:​7.jiayatu.png |}} 
-图2 加压示意图\\+<WRAP centeralign> ​ 
 +图2 加压示意图 
 +</​WRAP>​ 
  
   整个加压过程的步骤如下:\\   整个加压过程的步骤如下:\\
-1、选一台虚拟桌面作为Controller控制节点,其余作为Agent加压节点,并建立Controller与Agent的通信。\\ +  1、选一台虚拟桌面作为Controller控制节点,其余作为Agent加压节点,并建立Controller与Agent的通信。\\ 
-2、在Controller节点启动Jmeter,并远程运行所有Agent上的加压脚本,通过脚本启动加压工具对每个虚拟桌面进行加压;每台虚拟桌面压力上升之后会间接提升服务器压力,达到对服务器加压效果。\\ +  2、在Controller节点启动Jmeter,并远程运行所有Agent上的加压脚本,通过脚本启动加压工具对每个虚拟桌面进行加压;每台虚拟桌面压力上升之后会间接提升服务器压力,达到对服务器加压效果。\\ 
-3、根据不同压力大小,批量修改加压脚本,重复步骤1-2。\\+  3、根据不同压力大小,批量修改加压脚本,重复步骤1-2。\\
  
 ==== 3.3 加压工具 ==== ==== 3.3 加压工具 ====
行 97: 行 81:
 === 4.1.1 正常压力下测试结果 === === 4.1.1 正常压力下测试结果 ===
   图3表示每个测试项,超融合桌面比传统集中式桌面云性能提升的百分比。通过图3可知,超融合桌面云比传统集中式桌面云性能提升较大,有超过65%测试项性能提升超过50%。\\   图3表示每个测试项,超融合桌面比传统集中式桌面云性能提升的百分比。通过图3可知,超融合桌面云比传统集中式桌面云性能提升较大,有超过65%测试项性能提升超过50%。\\
-  +{{ :​service:​techmag:​201906_035:​8.chaoronghezhuomian.png |}} 
-图3 超融合桌面与传统集中式桌面云对比结果\\+<WRAP centeralign> ​ 
 +图3 超融合桌面与传统集中式桌面云对比结果 
 +</​WRAP>​ 
 === 4.1.2 CPU压力下测试结果 === === 4.1.2 CPU压力下测试结果 ===
   图4表示在不同CPU压力下,与正常压力相比,各项测试指标性能下降的百分比。\\   图4表示在不同CPU压力下,与正常压力相比,各项测试指标性能下降的百分比。\\
   由图4可知,CPU压力对桌面性能影响较大。CPU压力在16-65%区间内,桌面性能下降较平缓,各测试项指标性能下降10-50%;当压力超过70%时,桌面性能急剧下降,各项指标性能下降70-992%,对用户体验产生严重影响。\\   由图4可知,CPU压力对桌面性能影响较大。CPU压力在16-65%区间内,桌面性能下降较平缓,各测试项指标性能下降10-50%;当压力超过70%时,桌面性能急剧下降,各项指标性能下降70-992%,对用户体验产生严重影响。\\
-  +{{ :​service:​techmag:​201906_035:​9.butongpbu.png |}} 
-图4 不同CPU压力下超融合桌面性能变化结果\\+<WRAP centeralign> ​ 
 +图4 不同CPU压力下超融合桌面性能变化结果 
 +</​WRAP>​ 
   本次用于测试的主机CPU性能较低,与市场主流CPU相差较大,后续对CPU为E5-2680v4的主机进行了相同的测试,发现当主机CPU压力超过90%时,桌面性能才会出现一定程度的下降,且最高降幅不超过250%;而本文所用主机,在CPU压力超过70%时,性能最高降幅超过了990%。\\   本次用于测试的主机CPU性能较低,与市场主流CPU相差较大,后续对CPU为E5-2680v4的主机进行了相同的测试,发现当主机CPU压力超过90%时,桌面性能才会出现一定程度的下降,且最高降幅不超过250%;而本文所用主机,在CPU压力超过70%时,性能最高降幅超过了990%。\\
 === 4.1.3 内存压力下测试结果 === === 4.1.3 内存压力下测试结果 ===
-图5 不同内存压力下超融合桌面性能变化结果\\+{{ :​service:​techmag:​201906_035:​10.butongneicunyali.png |}} 
 +<WRAP centeralign>​  
 +图5 不同内存压力下超融合桌面性能变化结果 
 +</​WRAP>​ 
   图5表示在不同内存压力下,与正常压力相比,各项测试指标性能下降的百分比。由图5可知,内存压力对桌面性能影响较小,即使内存压力达到95%,各项指标性能下降也不超过20%。\\   图5表示在不同内存压力下,与正常压力相比,各项测试指标性能下降的百分比。由图5可知,内存压力对桌面性能影响较小,即使内存压力达到95%,各项指标性能下降也不超过20%。\\
 ==== 4.2 运维操作对桌面的影响 ==== ==== 4.2 运维操作对桌面的影响 ====
行 115: 行 109:
  
   通过以上分析,可以总结出以下几点:\\   通过以上分析,可以总结出以下几点:\\
-1、超融合桌面云性能要优于传统集中式存储桌面云性能,可以满足日常办公需求。\\ +  1、超融合桌面云性能要优于传统集中式存储桌面云性能,可以满足日常办公需求。\\ 
-2、内存压力对桌面性能影响较小,这是因为每台桌面的内存是独占的,并不是动态分配的,所以主机内存压力对桌面使用影响较小。且超融合相关专家也建议不要使用内存复用策略,会降低桌面性能。可见,与传统PC相比,超融合系统在内存复用方面并没有优势。\\ +  2、内存压力对桌面性能影响较小,这是因为每台桌面的内存是独占的,并不是动态分配的,所以主机内存压力对桌面使用影响较小。且超融合相关专家也建议不要使用内存复用策略,会降低桌面性能。可见,与传统PC相比,超融合系统在内存复用方面并没有优势。\\ 
-3、超融合主机的CPU压力对桌面性能影响较大,所以在使用时要密切关注主机CPU压力,为了保证系统的性能,CPU复用比不宜过高。因此,CPU是限制集群桌面数量的主要因素。\\ +  3、超融合主机的CPU压力对桌面性能影响较大,所以在使用时要密切关注主机CPU压力,为了保证系统的性能,CPU复用比不宜过高。因此,CPU是限制集群桌面数量的主要因素。\\ 
-4、本次主机可用于分配桌面的内存为370.7G,可分配内存占比为64%,可分配内存占比较低。如果按照满配内存购买,那么三台主机可分配内存占比将会达到82%左右,随着主机数量增加,可分配内存占比还会增加,因为管理组件消耗内存与主机数量不是线性关系。所以超融合集群主机数量越多,主机内存配置较大,内存利用率越高,性价比也就越高。\\ +  4、本次主机可用于分配桌面的内存为370.7G,可分配内存占比为64%,可分配内存占比较低。如果按照满配内存购买,那么三台主机可分配内存占比将会达到82%左右,随着主机数量增加,可分配内存占比还会增加,因为管理组件消耗内存与主机数量不是线性关系。所以超融合集群主机数量越多,主机内存配置较大,内存利用率越高,性价比也就越高。\\ 
-5、超融合虚拟桌面的单台成本较高。按照满足150台桌面估算,考虑到故障切换、单节点密度等因素,每台桌面的成本可控制在1万元左右,如果按照满足1500台桌面估算,每台桌面的成本可控制在8000元左右;随着桌面数的增加,单台桌面成本降低主要是因为一方面管理组件占用资源相对固定,另一方面单节点密度适当增加。如果要降低成本,可以考虑提高单节点密度,降低系统预留资源,但会影响系统性能。所以在选择时要均衡考虑成本、安全以及性能等因素。\\+  5、超融合虚拟桌面的单台成本较高。按照满足150台桌面估算,考虑到故障切换、单节点密度等因素,每台桌面的成本可控制在1万元左右,如果按照满足1500台桌面估算,每台桌面的成本可控制在8000元左右;随着桌面数的增加,单台桌面成本降低主要是因为一方面管理组件占用资源相对固定,另一方面单节点密度适当增加。如果要降低成本,可以考虑提高单节点密度,降低系统预留资源,但会影响系统性能。所以在选择时要均衡考虑成本、安全以及性能等因素。\\
 ==== 5.2 实践总结 ==== ==== 5.2 实践总结 ====
   经过本次测试,在进行自主可控设备的测试时,有以下几点可供读者参考:\\   经过本次测试,在进行自主可控设备的测试时,有以下几点可供读者参考:\\
-1、对设备、系统等的相关原理进行深入研究,了解哪些功能会对系统性能有影响、修改哪些参数会提高或者降低系统性能、哪些功能对业务影响较大等,在测试时应该重点关注。\\ +  1、对设备、系统等的相关原理进行深入研究,了解哪些功能会对系统性能有影响、修改哪些参数会提高或者降低系统性能、哪些功能对业务影响较大等,在测试时应该重点关注。\\ 
-2、对当前设备使用情况进行摸底,包括业务场景、使用人数、压力情况等,在测试新设备时尽量模拟当前使用场景,以测试新设备是否可以满足需求。\\+  2、对当前设备使用情况进行摸底,包括业务场景、使用人数、压力情况等,在测试新设备时尽量模拟当前使用场景,以测试新设备是否可以满足需求。\\
 ==== 5.3 后续工作 ==== ==== 5.3 后续工作 ====
   由于时间以及条件的限制,有些工作本文没有涉及,主要包括:\\   由于时间以及条件的限制,有些工作本文没有涉及,主要包括:\\
-1、本文用于测试的主机只有3台,实际情况主机集群的数量要多得多,所以对于大规模集群的情况本文没有涉及,希望以后能在正式部署之后重新进行测试,获取更加真实的测试结果,但是本文所提方案具有一定的普适性。\\ +  1、本文用于测试的主机只有3台,实际情况主机集群的数量要多得多,所以对于大规模集群的情况本文没有涉及,希望以后能在正式部署之后重新进行测试,获取更加真实的测试结果,但是本文所提方案具有一定的普适性。\\ 
-2、超融合系统不具备自动调整桌面资源的功能,为了提高资源的利用率,后续需要研究设计高效的云管平台,允许弹性基础设施根据监控阀值条件或者一些自定义事件触发自动调整资源配置等操作。\\+  2、超融合系统不具备自动调整桌面资源的功能,为了提高资源的利用率,后续需要研究设计高效的云管平台,允许弹性基础设施根据监控阀值条件或者一些自定义事件触发自动调整资源配置等操作。\\
 ===== 参考文献 ===== ===== 参考文献 =====
  
阅读
service/techmag/201906_035/04.1565782669.txt.gz · 最后更改: 2019/08/14 11:37 由 -