1. 개요
- Redundant Array of Inexpensive Disk
- 약어 그대로 값싼 디스크를 여러개 묶어 대용량의 저장공간을 만들고자 하는 요구로 1980년대 처음 등장(200MB의 hard disk보다는 50MB의 hard disk를 4개 묶어서 사용하는 방법이 가격적인 측면에서 보다 유리)
- 최근에는 디스크의 가격이 내려가면서 의미 무색, RAID의 의미는 자연스럽게 Redundant Array of Independent Disks로 의미가 바뀜
- RAID는 하드 디스크 드라이브가 갖는 성능이나 안정성을 더 향상시키기 위해서 사용
<Background>
RAID 기본 개념
보통 CPU나 Memory의 속도를 얘기할 때 ns(nano second) 단위를 사용한다. 이에 반해 hard disk의 속도 단위는 ms(mili second)이다. 이것은 1000배의 차이이며, 기계적인 장치가 전자장치에 비해 현격히 느림을 보여준다. 이러한 속도의 차이를 줄이기 위해서는 hard disk의 회전속도의 증가, 버퍼의 확장등 다양한 방법이 구현되고 있으나 비용과 기술적인 측면에서 한계가 있다. 따라서 다음과 같은 방법으로 저장장치의 성능을 향상시키는 방법을 고려해 볼 수 있다.
예를 들어 1 sector를 기록하는데 1초가 걸린다고 가정하면, 단일 디스크에서는 3 sector를 쓰기 위해서는 3초의 시간이 걸린다.
이러한 과정을 세개의 동일한 디스크에 기록한다면, 3 sector를 각 disk에 1 sector씩 기록하면 되고, 이때 1sector를 기록하는데 1초가 걸리므로, 3 sector를 기록하는데 드는 총 시간은 역시 1초가 된다.
이것이 RAID의 기본 개념으로서 3배의 성능을 내는 disk를 개발하는 것보다, 상대적으로 저렴한 disk를 세개 연결하여 사용하는 것이 비용적인 측면에서 더 우수하게 되는 것이다.
2. RAID에 사용되는 기술
가. Striping (스트라이핑)
- 하나의 Disk에 모두 기록할 수 없는 Data를 여러개의 Disk에 분배 기록할 수 있는 기술로 큰 용량을 만들어 사용하는데 사용
- 여러 개의 디스크를 하나의 논리적인 단위로 연결
나. Mirroring (미러링)
- 말 그대로 거울에 비치는 것처럼 같은 데이터를 복수의 장치에 동일하게 저장하는 방식으로 하나의 disk가 Fault 되어도 미러된 disk로 data를 안전하게 관리할 수 있다.
다. Parity (패리티)
- Data의 오류검출 확인에 사용되는 기술
3. RAID System의 특성
가. 장점
- 고가용성
- 데이터 보호
- 저렴한 비용과 작은 체적으로 대용량 구현
- 물리적 디스크에 데이터를 적절히 분산시킴으로써 효율성 제고
나. 단점
- 디스크의 수가 증가할수록 그 중 하나의 디스크가 장애를 일으킬 확률 증가
- 이러한 에러대처방안을 위한 특별한 시스템이 필요
- 단일의 데이터에 대한 분산된 입출력은 때로는 불필요한 많은 오버헤드를 가질 수 있음
4. RAID 종류
가. 하드웨어 RAID
http://forensic-proof.com/archives/549
- 호스트로부터 독립적으로 RAID 시스템을 관리해 이를 호스트에게는 하나의 디스크로 제공
- 호스트는 RAID를 알거나 관리할 필요가 없음
- 시스템 자원을 활용하지 않으며 운영체제에 비의존적임
- 장애에 더 쉽게 대처할 수 있음
나. 소프트웨어 RAID
http://forensic-proof.com/archives/549
- RAID 기능이 소프트웨어로 구현
- RAID 소프트웨어는 OS에 포함되어 있음
- 시스템 자원을 소모하며 운영체제에 의존적
- 그러므로 패리티 계산과 같은 많은 처리를 요하는 RAID 구성은 적절치 않음(RAID 0, RAID 1 방식만 지원)
5. RAID 레벨
- 각 레벨은 비용과 속도에 대한 상반되는 요구를 절충하여 각기 다른 방법으로 여러 드라이브 사이에 데이터를 분산시킴
- 즉 RAID의 각 레벨은 서로 다른 용도를 위해 최적화된 시스템이다.
가. RAID 0
- 장애 발생에 대비한 여분의 저장공간을 갖지 않음
- 데이터는 빠른 입출력이 가능하도록 여러 드라이브에 분산
- 여분의 정보를 기록하지 않기 때문에 성능은 매우 뛰어나지만, 어느 한 드라이브에서 장애가 발생하게 되면 데이터는 손실
나. RAID 1
- Disk Mirroring
- 두 개의 Disk에 Data를 동일하게 기록
- Data의 복구능력 탁월
다. RAID 3
- Data striping with a Dedicated Parity Check
- 별도의 드라이브에 패리티 정보 저장
- Data를 바이트 단위로 분할 기록하며 Parity disk에는 Parity만을 기록
- Hard Drive가 장애를 일으킬 경우, Data 복구는 남아있는 Drive상에 기록된Information의 Exclusive OR(XOR)연산을 통하여 이루어짐
- RAID 3는 RAID 5와 거의 흡사하나 한 디스크에 대한 Overhead가 상대적으로 적은 RAID-5의 출현으로 현재 거의 사용하지 않는 레벨
라. RAID 5
- 패리티 정보를 모든 드라이브에 나누어 기록한다
- 패리티를 담당하는 디스크가 병목현상을 일으키는 것을 피하기 위함
- 일반적으로 가장 널리 쓰이는 구성
- 디스크 수량을 효율적으로 사용하며 읽기 성능이 높음
마. RAID 0+1
- 스트라이핑 & 미러링
- RAID 0+1의 경우 안정성이 있고 높은 성능을 보여줄 수 있으나 디스크의 수가 필요한 용량의 2배이상이 필요하게 되어 낭비적 요소가 있음
6. 향후 전망 및 시사점
- RAID의 목적은 데이터 가용성과 총 저장 용량을 증가시키며 여러 물리적 디스크에 데이터를 적절히 분산시킴으로써 효율성을 제고
- 인터넷 사용의 폭발적인 증가로 통신망 인프라는 지속적으로 고도화되고 있음
- RAID는 보조기억장치부분의 성능향상을 통해 단말 컴퓨터에서 원활한 정보처리가 가능하도록 할 수 있을 것으로 판단됨
http://forensic-proof.com/archives/549
'Internet > 기타' 카테고리의 다른 글
빅데이터 (0) | 2015.09.20 |
---|---|
클라우드 컴퓨팅 (0) | 2015.09.20 |
Web 2.0의 개념, 특징 및 기술적 요소에 대하여 설명하시오 (0) | 2015.09.20 |
VoIP (0) | 2015.09.20 |
IaaS, Paas, SaaS (0) | 2015.09.10 |