본문 바로가기

백업과 RAID: 하드디스크 고장에도 데이터를 지키는 구조

📑 목차

    하드디스크는 언젠가 반드시 고장 난다

    컴퓨터를 오래 쓰다 보면 한 번쯤은 “갑자기 부팅이 안 된다”, “사진 폴더가 열리지 않는다” 같은 상황을 겪게 된다. 하드디스크나 SSD 같은 저장장치는 소모품이기 때문에, 언젠가는 반드시 고장 난다. 문제는, 그 안에 들어 있던 업무 자료, 가족 사진, 회계 파일 같은 데이터는 다시 사 올 수 없다는 점이다.

    이런 위험을 줄이기 위한 대표적인 방법이 바로 백업(Backup)과 RAID(Redundant Array of Independent Disks)이다. 두 기술 모두 데이터 보호를 위한 것이지만, 역할과 구조, 기대할 수 있는 효과가 서로 다르다.

    이 글에서는 백업, RAID, 데이터 보호, 하드디스크 고장, NAS를 핵심 키워드로 삼아

    • 백업과 RAID가 각각 무엇인지,
    • RAID가 하드디스크 고장에 어떻게 대응하는지,
    • 왜 RAID만으로는 백업을 대신할 수 없는지,
    • 일반 사용자가 실제로 어떻게 데이터를 지키면 좋은지

    를 전산학 입문서처럼 차근차근 정리한다.


    백업과 RAID의 개념, 기본 원리, 관련 용어 정리

    1. 백업(Backup)의 개념: “사본을 다른 곳에 한 벌 더 만들어 두는 것”

    백업(backup)의 핵심은 단순하다.

    • 중요한 데이터를 다른 저장장치나 다른 장소에 한 벌 더 복사해 두는 것이다.

    백업의 중요한 특징은 다음과 같다.

    1. 원본과 분리된 사본
      • 같은 컴퓨터, 같은 디스크 안에 있는 복사는 안전하지 않다.
      • 다른 디스크, 외장 하드, NAS, 클라우드처럼 물리적으로나 논리적으로 분리된 공간에 두어야 한다.
    2. 시점이 있는 복사본
      • 백업은 특정 시점의 데이터를 통째로 복사해 둔 것이다.
      • 어제 백업, 일주일 전 백업, 한 달 전 백업처럼 여러 시점의 백업본을 유지하는 경우가 많다.
    3. 실수·삭제·랜섬웨어까지 복구 가능
      • 사용자가 실수로 파일을 지웠거나,
      • 랜섬웨어로 파일이 암호화되었을 때,
      • “문제가 생기기 이전 시점의 백업본”으로 되돌릴 수 있다.

    즉, 백업은 “디스크가 고장 나든, 사람이 실수하든, 바이러스가 감염되든 상관없이, 과거 상태로 돌아갈 수 있게 하는 안전망”이라고 이해하면 된다.

    2. RAID의 개념: 여러 개의 디스크를 하나처럼 묶어 안정성·성능을 높이는 구조

    RAID(Redundant Array of Independent Disks)는 여러 개의 하드디스크(또는 SSD)를 논리적으로 묶어 하나의 저장장치처럼 사용하는 기술이다.

    RAID의 핵심 목적은 두 가지이다.

    1. 저장장치 고장에 대한 내구성 향상(일부 레벨)
      • 디스크가 한 개 정도 고장 나도 시스템이 계속 동작하게 만들어 준다.
    2. 읽기·쓰기 성능 향상(일부 레벨)
      • 여러 디스크에 데이터를 분산해 동시에 읽고 쓰면서 속도를 높인다.

    중요한 점은 다음과 같다.

    • RAID는 주로 서버, NAS, 고성능 저장장치에서 사용된다.
    • RAID는 실시간으로 장애를 견디도록 설계된 구조이지,
      • 시간대를 되돌려 주는 “과거 복사본”은 아니다.
    • 그래서 “RAID가 있으니 백업이 필요 없다”는 말은 잘못된 생각이다.

    3. 주요 RAID 레벨 개요

    RAID에는 여러 레벨이 있는데, 입문 단계에서 자주 언급되는 것은 다음과 같다.

    1. RAID 0
      • 여러 디스크에 데이터를 나눠서 쓰기만 하는 방식(스트라이핑)이다.
      • 장점: 속도가 빠르다.
      • 단점: 어느 한 디스크라도 고장 나면 전체 데이터가 깨진다. 데이터 보호가 없다.
    2. RAID 1
      • 같은 데이터를 두 개 이상의 디스크에 그대로 복사(미러링)한다.
      • 장점: 디스크 한 개가 고장 나도 다른 디스크에서 그대로 서비스를 유지할 수 있다.
      • 단점: 용량 효율이 50% 수준이다(2TB+2TB를 묶어도 실제로는 2TB만 쓸 수 있음).
    3. RAID 5
      • 최소 3개의 디스크를 사용해 데이터를 나누어 저장하면서,
      • 동시에 패리티(parity)라는 체크 정보를 함께 저장한다.
      • 디스크 한 개가 고장 나도 패리티 정보를 이용해 데이터 복원이 가능하다.
    4. RAID 10(1+0)
      • RAID 1과 RAID 0의 장점을 섞은 방식이다.
      • 먼저 디스크 짝을 미러링(RAID 1)하고,
      • 그 미러링 묶음들을 다시 스트라이핑(RAID 0)한다.
      • 성능과 안정성 모두 높은 편이지만 디스크가 많이 필요하다.

    이 글의 주제인 데이터 보호와 하드디스크 고장 관점에서 보면,

    • RAID 0은 보호 기능이 없고,
    • RAID 1, 5, 10 등이 디스크 고장을 버티는 구조를 제공한다고 이해하면 된다.

    4. NAS와 RAID의 관계

    NAS(Network Attached Storage)는 간단히 말해 네트워크로 접속하는 작은 파일 서버이다.

    • 집이나 소규모 회사에서
      • 파일 공유, 미디어 서버, 자동 백업 용도로 많이 사용한다.
    • NAS 안에는 보통 여러 개의 디스크가 들어가며,
      • 이 디스크들을 RAID로 묶어 운용하는 경우가 많다.

    즉, NAS는 하드웨어+운영체제+파일 공유 기능이 포함된 장비이고,
    RAID는 그 안에서 디스크를 묶는 기술이라고 이해하면 된다.


    실제 사례로 보는 백업과 RAID, 데이터 보호 전략

    1. 디스크 한 개가 고장 났을 때: RAID가 해 주는 일

    RAID를 사용하는 가장 눈에 띄는 이유는 하드디스크 고장에 대한 내성이다.

    예를 들어,

    • 4개의 디스크로 RAID 5를 구성한 NAS가 있다고 가정하자.
    • 어느 날 디스크 한 개가 갑자기 고장 나더라도,
      • 나머지 디스크와 패리티 정보를 이용해 데이터를 계속 읽고 쓸 수 있다.
    • 사용자는 디스크를 교체하고,
      • NAS가 자동으로 데이터를 다시 재구성(rebuild)하면서
      • RAID 상태를 복원한다.

    이 과정에서 사용자는

    • 서비스를 완전히 중단하지 않고,
    • 하드디스크 고장을 “버티면서” 운영을 이어 갈 수 있다.

    즉, RAID는 “디스크 고장이 발생해도 시스템이 바로 멈추지 않게 하는 역할”을 한다.

    그러나 여기에는 중요한 한계가 있다.

    • RAID는 디스크 고장을 버티게 해 줄 수는 있어도,
    • 사용자의 실수나 랜섬웨어, 잘못된 삭제를 되돌려 주지는 못한다.
    백업과 RAID: 하드디스크 고장에도 데이터를 지키는 구조
    RAID 5로 구성된 NAS에서 디스크 한 개 고장 시 데이터 복구 흐름

     

    2. RAID만으로는 백업이 될 수 없는 이유

    많은 사람이 “RAID를 쓰면 안전하니 백업은 안 해도 된다”라고 생각하기 쉽다.
    하지만 RAID와 백업은 목표와 보호 범위가 다르기 때문에, 서로를 대체할 수 없다.

    다음과 같은 상황을 생각해 보자.

    1. 사용자가 실수로 중요한 폴더를 삭제한 경우
      • RAID는 그 삭제를 그대로 따라간다.
      • 디스크 여러 개에 똑같이 삭제된 상태가 유지된다.
      • 예전 상태로 되돌릴 수 없다.
    2. 랜섬웨어에 감염되어 파일이 암호화된 경우
      • 암호화된 파일이 RAID 전체에 그대로 반영된다.
      • 여러 디스크가 “정상적으로 동작하는 상태의 잘못된 데이터”를 가진다.
      • RAID 입장에서는 디스크 고장이 아니므로 아무런 복원도 하지 않는다.
    3. NAS나 서버 자체가 도난·화재·침수로 사라진 경우
      • 여러 디스크를 묶어 둔 RAID 자체가 전부 사라진다.
      • RAID 구조가 아무리 좋아도 장비 자체가 없어지면 소용이 없다.

    이런 이유로, RAID는 어디까지나

    • 가용성(availability)과
    • 디스크 고장에 대한 내구성(fault tolerance)을 위한 기술이지,

    백업을 대체하는 기술이 아니다.

    3. 백업 전략의 기본: 3-2-1 원칙

    데이터 보호를 위해 많이 언급되는 것이 3-2-1 백업 원칙이다.

    1. 데이터 사본을 최소 3벌 보관한다.
      • 원본 1벌 + 백업 2벌 이상.
    2. 서로 다른 2종류 이상의 매체에 저장한다.
      • 예:
        • PC 내장 디스크,
        • 외장 하드 또는 NAS,
        • 클라우드 저장소 등.
    3. 최소 1벌은 다른 장소(오프사이트)에 둔다.
      • 집에 있는 PC와 외장 하드가 동시에 피해를 보는 상황(도난, 화재 등)을 대비하기 위해
      • 클라우드나 다른 물리적 장소에 백업본을 둔다.

    실제 예시를 하나 들어 보면 다음과 같은 구성이 가능하다.

    • 원본: PC 또는 노트북 내장 SSD
    • 1차 백업: 집이나 사무실에 있는 NAS (RAID 1 또는 RAID 5 구성)
    • 2차 백업: 클라우드 드라이브(구글 드라이브, 원드라이브, S3 등)에 중요한 폴더만 추가 백업

    이 구조에서는

    • PC 디스크가 고장 나도 NAS에서 복구 가능하고,
    • NAS 디스크 일부가 고장 나도 RAID가 데이터를 유지해 주며,
    • 최악의 경우 집 전체가 피해를 보더라도
      • 클라우드 백업에서 핵심 자료를 되살릴 수 있다.
    PC, NAS의 RAID 저장장치, 클라우드 저장소를 이용해 3-2-1 백업 원칙을 구현한 데이터 보호 구조를 단계별로 나타낸 인포그래픽
    3-2-1 백업 원칙과 RAID를 결합한 데이터 보호 구조

    4. 일반 사용자를 위한 현실적인 구성 예시

    전산학 비전공자, 개인 사용자, 소규모 사업자 입장에서 현실적으로 가능한 데이터 보호 방법을 정리하면 다음과 같다.

    1. 단일 PC 사용자
      • 외장 하드 1개 이상을 준비한다.
      • 주기적으로 중요한 폴더(문서, 사진, 작업 파일)를 외장 하드에 백업한다.
      • 추가로 클라우드에 가장 중요한 폴더만 동기화한다.
    2. 여러 대의 PC를 사용하는 가정 또는 소호(SOHO)
      • NAS 1대를 준비하고, 디스크 2~4개로 RAID 1 또는 RAID 5를 구성한다.
      • 각 PC에서 NAS로 자동 백업을 설정한다.
      • NAS에서 클라우드 백업 기능을 제공하면, 중요한 공유 폴더를 클라우드로 2차 백업한다.
    3. 파일 서버를 운영하는 작은 회사
      • 파일 서버 또는 NAS에 RAID 5 또는 RAID 10을 구성해 디스크 고장에 대비한다.
      • 별도의 백업 서버 또는 외장 스토리지로 정기 백업을 수행한다.
      • 백업본 중 일부는 사무실 외부 또는 클라우드에 보관한다.

    이때 중요하게 기억해야 할 원칙은 다음과 같다.

    • RAID는 서비스 중단을 막아 주는 것이고,
    • 백업은 시간을 거슬러 과거 상태를 되돌릴 수 있게 해 주는 것이다.

    두 가지를 함께 써야 비로소 “하드디스크 고장에도 데이터를 지키는 구조”에 가까워진다.

    5. 백업과 RAID 설계 시 주의할 점

    마지막으로, 백업과 RAID를 설계·선택할 때 알아두면 좋은 주의점들을 정리하면 다음과 같다.

    1. RAID 0은 데이터 보호용이 아니다
      • RAID 0은 속도 향상이 목적이지,
      • 디스크 고장에 대한 내성이 없다.
      • 중요한 데이터를 저장하는 장치에는 RAID 0만 사용하는 것을 피하는 것이 좋다.
    2. RAID 재구성(rebuild) 중에는 추가 고장에 취약하다
      • RAID 5, RAID 10에서 디스크 한 개를 교체하고 재구성하는 동안
        • 나머지 디스크에 부하가 커진다.
      • 오래된 디스크가 많으면,
        • 재구성 과정에서 추가 고장이 발생할 위험도 있다.
      • 그래서 정기적으로 디스크 상태를 점검하고,
        • 너무 오래된 디스크는 미리 교체하는 것이 좋다.
    3. 백업은 자동화할수록 안정적이다
      • 수동으로 백업을 하다 보면
        • 바쁠 때 빼먹고,
        • 결국 중요한 시점의 백업이 없을 수 있다.
      • 가능하다면 예약 백업, 자동 동기화를 활용해
        • 백업을 일상적인 시스템 동작의 일부로 만들어야 한다.
    4. 복구 테스트를 해 보아야 진짜 백업이다
      • 백업 파일이 있는 것만 보고 안심하기 쉽다.
      • 하지만 실제로 복구 테스트를 해 보지 않으면
        • 복구 방법을 모를 수도 있고,
        • 백업 파일이 손상된 사실을 뒤늦게 알 수도 있다.
      • 중요한 데이터라면
        • 주기적으로 “복구 연습”을 해 보는 것이 좋다.

    RAID는 방패, 백업은 시간여행 버튼이다

    이 글에서는 백업과 RAID를 중심으로, 하드디스크 고장에도 데이터를 지키는 구조를 전산학 입문 수준에서 살펴보았다. 핵심 내용을 한 번 더 정리하면 다음과 같다.

    1. 백업(backup)은
      • 데이터를 다른 장치·다른 장소에 사본으로 저장해
      • 실수, 랜섬웨어, 장치 고장, 재난 등 다양한 상황에서
      • 과거 시점으로 되돌릴 수 있게 하는 안전망이다.
    2. RAID
      • 여러 개의 디스크를 묶어
      • 디스크 고장에도 시스템이 계속 동작하도록 돕는 기술이며,
      • 일부 레벨에서는 성능 향상도 제공한다.
    3. RAID는 하드디스크 고장에 대한 방패 역할을 하지만,
      • 삭제, 덮어쓰기, 랜섬웨어, 장비 전체 손실에는 대응하지 못한다.
      • 그래서 RAID만으로는 백업을 대체할 수 없다.
    4. 3-2-1 백업 원칙
      • 3벌 이상,
      • 2종류 이상의 매체,
      • 1벌 이상은 다른 장소에 보관하는 전략이
      • 개인과 소규모 조직 모두에게 유효하다.
    5. 현실적인 구성으로는
      • PC + 외장 하드 + 클라우드,
      • 또는 NAS의 RAID와 클라우드 백업을 조합하는 방식이 많이 활용된다.

    이제 “백업과 RAID가 어떻게 다른가”,
    “하드디스크 고장에 대비한 구조를 어떻게 짜야 하는가”라는 질문에 대해

    • RAID는 서비스를 멈추지 않게 하는 구조,
    • 백업은 시간을 거슬러 과거 데이터를 되살리는 구조

    라는 관점에서 설명할 수 있을 것이다.

    다음 단계에서 이어서 살펴볼 만한 주제로는 예를 들어 다음과 같은 것들이 있다.

    • “파일 시스템과 스냅샷: 특정 시점의 상태를 순간적으로 저장하는 기술”
    • “클라우드 백업과 온프레미스 백업 비교: 비용, 속도, 보안 관점에서의 차이”

    이런 주제까지 함께 이해하면, 전산학 기초 수준에서 데이터 보호와 저장 시스템 전체 구조를 보다 입체적으로 이해하는 데 도움이 된다.