理顺存储的发展与演进

从存储架构的发展演进过程来说,可以分为主机存储、集中式存储、分布式存储和超融合存储。其中,主机存储是指将存储设备直接连接到主机服务器上。
集中式存储(Centralized Storage)是采用集中式存储控制器统一管理存储资源和提供存储服务,并通过光纤通道或网络连接方式进行访问,如SAN和NAS。
通常也将集中式存储称为传统存储,根据机头控制器的能力,可以管理几百~几千块硬盘。
分布式存储(Distributed Storage)则是将数据分散存放在多个独立的节点上,通过网络连接形成一个整体,节点之间相互通信和协作,实现数据的存储和管理。如GFS。
超融合存储(Hyper-Converged Storage)通常运行在 x86 服务器上,将计算和存储资源融合在一起,以虚拟化技术实现资源的动态管理和调度,提供更加高效和灵活的存储服务。
在发展演进的过程中,软件定义存储起到了关键的作用。
那么,何谓软件定义?
从本质上来说,存储硬件不开放或开放极少的接口。软件定义就是将原来固化在硬件中的软件提取出来,提供对外开放的接口。
事实上,软件定义存储 (SDS) 只是一种营销术语,类似于软件定义网络,也是一种架构或思想。在2012年,VMware首次提出软件定义存储的概念。
本文将主要介绍主机存储相关基础知识。
一、总述
从计算机体系架构上从看,除CPU和内存外,早期的芯片组有北桥和南桥之分,北桥用于连接CPU和内存之间的接口,南桥用于边接硬盘、USB和网卡等,集成PCI、PCIe和IDE和USB等接口。现在北桥已和CPU合在一起。
理顺存储的发展与演进
二、SCSI总线
磁盘通过SCSI卡挂在SCSI总线上。SCSI英文全称是Small Computer System Interface,译为小型计算机系统接口。SCSI的发展演进过程如下:
(1)1979年,提出SCSI-1,支持7台8位的外围设备,最大数据传输速度为5MB/s。
(2)1992年,提出SCSI-2,数据传输率达到20MB/s。
(3)1995年,提出SCSI-3,称为Ultra SCSI(Fast-20)。
(4)1997年,提出Ultra 2 SCSI(Fast-40),数据传输速率达到80MB/s。
(5)1998年,提出Ultra 3 SCSI(Utra 160 SCSI),数据传输率达到160MB/s。后又提出Ultra 320 SCSI协议,数据传输率达到320MB/s。
SCSI采用C/S架构,客户请求方称为Initator,服务方称为Target。具体来说,每个Target都有唯一的设备地址Target ID,并且可以连接多个LUN(Logic Unit Number,逻辑单元)。
SCSI总线挂载硬盘数量有限。一般来说,最多可以挂接15块SCSI硬盘设备。
三、HDD与SSD
硬盘一般分为HDD和SSD。详情参考:存储:HDD和SSD
作为主机内的存储,在容量和安全都问题。
安全方面,需要进行冗余备份,也就是进行RAID。
四、RAID
RAID也就是Redundant Array of Independent Disks,独立磁盘冗余阵列。
RAID可以通过软件(OS)来实现,但存在占CPU、内存、OS所在磁盘无法RAID等问题。
也可以通过硬件来实现,也就是RAID卡。
RAID的使用方法:
(1)磁盘阵列的配置:配置RAID组;在RAID组上划分LUN;将LUN映射给相应的主机使用。
(2)主机寻找磁盘的路径:SCSI控制器—>通道—>SCSI ID—>LUN。LUN是更细一级的地址号。
RAID存在问题:分好逻辑盘后,就不能再随意扩展了。
五、LVM
为解决“分好逻辑盘后,就不能再随意扩展了”,提出了卷管理软件,如LVM(Logical Volume Manager,逻辑卷管理器)、LDM(Logical Disk Manager,逻辑磁盘管理器)。
卷管理软件的基本思路为:将物理硬盘或RAID卡之后的逻辑硬盘:PVVGLV,组合再分配。
这样的LV,大小可以扩大、并且无需重启OS。
LVM之后,主机或服务器的存储仍存在问题:放不了太多的磁盘。
六、磁盘阵列
为了磁盘容量的问题,出现了磁盘柜JBOD(Just a Bound of Disks,只是一串磁盘)、磁盘阵列(JBOD+RAID)。
磁盘阵列存在问题:使用SCSI能够挂载的磁盘数量是有限的。
为此,SCSI控制器增加通道,一个通道对应一个SCSI总线。
磁盘阵列的容量扩大之后,但单个主机不需要那么大的存储容量。这就需要共享给多个主机。后形成了SAN(Storage Area Network,存储区域网络)。
七、相关术语
1.什么是分区、什么是格式化?
分区是设置硬盘的各项物理参数,并指定MBR(Master Boot Record,硬盘主引导记录)和引导记录备份的存放位置。
格式化则是建立文件系统。
2.什么是块?
《数据中心虚拟化技术权威指南》一书描述如下:
块是单纯的一系列字节,根据既定的长度(块的大小)构成数据在存储设备中的最小存放单位。
AI大模型文心一言的描述如下:块存储中的“块”是指以扇区为基础,一个或多个连续的扇区组成的一个块,也叫物理块。它存在于文件系统和块设备之间。在块存储中,数据被分解成块,然后存储为单独的部分,每个部分都具有唯一标识。这些数据块可以配置在不同的操作系统中使用。当用户或应用程序从块存储系统请求数据时,底层存储系统将重新组装数据块并将数据提供给用户或应用程序。
3.什么是LUN?
LUN的英文全称是Logical Unit Number,译为逻辑单元号,用于标识存储设备中的逻辑单元。
LUN是TargetID的下一级地址号,一个TargetID可以虚拟出多个LUN地址。
通常情况下,把从硬件(硬盘)虚拟出来的磁盘,称为LUN。而由软件生成的磁盘称为”卷“。

原文始发于微信公众号(码农与软件时代):理顺存储的发展与演进

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。

文章由极客之音整理,本文链接:https://www.bmabk.com/index.php/post/176018.html

(0)
小半的头像小半

相关推荐

发表回复

登录后才能评论
极客之音——专业性很强的中文编程技术网站,欢迎收藏到浏览器,订阅我们!