1. 개요

데이터 보존은 디지털 정보의 지속적인 안정성과 접근성을 확보하기 위해 수행되는 일련의 관리 활동을 의미한다.[1] 이는 단순히 데이터를 특정 매체에 저장하는 행위를 넘어, 필요한 기간 동안 디지털 정보를 오류 없이 장기적으로 저장하고 이를 다시 검색하거나 해석할 수 있는 수단을 제공하는 조정되고 지속적인 프로세스의 집합이다.[2] 데이터 보존의 핵심 메커니즘은 정보가 요구되는 전체 시간 범위 동안 그 가치를 유지할 수 있도록 체계적인 관리 환경을 구축하는 데 있다.

디지털 자원의 보존은 시간이 경과함에 따라 변화하는 기술적 맥락 속에서 지속적으로 이루어진다. 데이터를 안전하게 보존하기 위해서는 최소한 보안이 확보된 장소에 저장해야 하며, 데이터 손실에 대비하여 여러 위치에 복사본을 나누어 저장하는 '3의 법칙(Rule of Three)'과 같은 전략이 활용된다.[3] 또한 미래에 유용성이 높을 것으로 예상되는 개방형 파일 형식을 사용하여 데이터의 접근성을 극대화하는 과정이 포함된다. 이러한 활동은 디지털 기록물의 진본성, 정확성, 그리고 기능성을 유지하며 미래에도 자원을 사용하고 접근할 수 있도록 관리하는 것을 목표로 한다.[4]

데이터 보존은 단순한 기술적 문제를 넘어 사회적, 문화적 가치를 지닌 자원을 보호하는 중요한 과제이다. 디지털 자원을 관리하고 유지하여 미래에 활용 가능하게 만드는 과정은 도서관이나 기록관과 같은 전문 기관의 핵심적인 역할 중 하나이다. 만약 적절한 보존 프로세스가 작동하지 않는다면, 디지털로 생성된 기록물은 기술적 퇴화이나 매체의 손상으로 인해 영구적으로 소실될 위험이 있다. 이는 인류의 지식 자산과 디지털 기록의 연속성을 저해하는 심각한 문제로 직결된다.

데이터 보존 과정에서는 백업의 충분성 여부나 '장기적'이라는 기간의 정의와 같이 복잡한 요소들이 상호작용한다. 특히 태생적 디지털 기록(born-digital records)이나 디지털 대용물(digital surrogates)과 같은 자원들은 관리 방식에 따라 그 활용 가능성이 크게 달라진다.[2] 미래의 기술 환경이 예측 불가능하기 때문에, 데이터 보존은 끊임없이 변화하는 기술적 변동성에 대응하며 지속적인 관리를 수행해야 하는 동적인 과정이다. 따라서 각 지역 및 기관별로 상이한 기술 환경과 자원 특성을 고려하여 최적화된 보존 전략을 수립하는 것이 필수적이다.

2. 정의 및 목적

데이터 보존은 디지털 정보가 필요한 전체 기간 동안 오류 없이 장기적으로 저장되도록 관리하며, 이를 다시 검색하거나 해석할 수 있는 수단을 제공하기 위해 수행되는 조정된 활동의 연속체이다.[1] 이는 단순히 정보를 특정 매체에 담아두는 행위를 넘어, 데이터의 안정성과 접근성을 지속적으로 확보하기 위한 일련의 관리된 프로세스를 포함한다.[2] 핵심적인 메커니즘은 디지털 기록물과 그 대체물의 내용에 대해 사용자가 적절한 권한을 가지고 접근할 수 있도록 유지하는 것이다. 이를 위해 정보는 최소한 보안이 확보된 장소에 저장되어야 하며, 데이터 손실에 대비하여 여러 위치에 분산 저장하는 방식이 요구된다.[3]

디지털 보존 프로그램의 궁극적인 목표는 기록물의 지속적이고 ongoing한 사용 가능성을 실현하는 데 있다. 이 과정에서 디지털 자료가 생성된 목적에 부합하도록 진본성, 정확성, 그리고 기능성이라는 필수적인 특성을 유지하는 것이 중요하다.[4] 특히 미래에 활용도가 높을 것으로 예상되는 개방형 파일 형식을 사용하여 데이터를 저장함으로써 기술적 변화에 대응한다. 이러한 활동은 단순히 파일을 보관하는 것과 달리, 데이터가 시간이 지나도 의미 있는 정보로서 존재할 수 있도록 관리 체계를 구축하는 것을 지향한다.

연구 데이터의 경우 프로젝트 종료 후에도 영구적이고 지속적인 아카이빙을 목표로 한다. 장기 데이터 저장 서비스는 영구성 자체를 완벽히 보장할 수는 없으나, 명확한 비즈니스 모델과 지원 정책, 그리고 계약을 체결할 수 있는 권한을 갖추어야 한다.[5] 이를 위해 기업 수준의 네트워크 저장 환경을 구축하고, 높은 수준의 중복성(Redundancy)과 지리적 분산 저장 기능을 제공하여 데이터의 생존력을 높인다. 이러한 방식은 특정 프로젝트의 결과물이 시간이 흐름에 따라 소실되지 않도록 보호하는 핵심적인 역할을 수행한다.

데이터 보존의 실무적 측면에서는 '3중 복제 규칙(Rule of Three)'과 같은 전략을 활용하여 데이터의 안전성을 도모한다.[6] 이는 데이터를 여러 곳에 나누어 저장함으로써 물리적 손상이나 시스템 오류로부터 정보를 보호하는 방식이다. 또한, 디지털 기록물이 가진 고유한 가치를 보존하기 위해 기술적 표준과 가이드라인을 준수하며, 변화하는 기술 환경 속에서도 데이터의 해석 가능성을 유지하기 위한 전략을 수립한다. 이러한 체계적인 관리는 문화적 자산으로서의 디지털 기록물을 보호하고 미래 세대가 정보를 활용할 수 있도록 하는 토대가 된다.

3. 주요 과제와 도전 요인

디지털 보존은 단순히 정보를 저장하는 행위를 넘어 디지털 자원을 미래에 접근하고 사용할 수 있도록 관리하고 유지하는 복잡한 과정이다.[1] 이러한 과정에서 발생하는 핵심적인 과제는 디지털 정보가 필요한 전체 기간 동안 오류 없이 저장되도록 보장하며, 이를 다시 검색하거나 해석할 수 있는 수단을 지속적으로 제공하는 것이다. 단순히 데이터 백업을 수행하는 것만으로는 충분하지 않으며, 무엇이 진정한 의미의 '보존'인지에 대한 정의와 함께 디지털 객체가 요구되는 '장기적'인 기간이 구체적으로 어느 정도인지를 규정하는 문제도 중요한 도전 요인으로 작용한다.[2]

기술적 변화가 가속화됨에 따라 디지털 자원의 복잡성을 관리하는 일은 더욱 어려워지고 있다. 도서관와 같은 기관들은 디지털 자원을 보존하기 위해 다양한 전략을 수립하고 실행하며, 이 과정에서 발생하는 기술적 변동성에 대응해야 한다. 특히 개인 문서나 방대한 양의 디지털 컬렉션을 안전하게 보호하기 위해서는 단순한 저장 이상의 체계적인 관리 프로세스가 요구된다. 이러한 복잡성은 데이터가 시간이 흐름에 따라 어떻게 변화할지, 그리고 어떻게 하면 정보의 무결성을 유지하며 접근성을 확보할 수 있을지에 대한 근본적인 질문을 던진다.

또한 지식재산권디지털 권리 관리의 영향은 데이터 보존 전략을 수립하는 데 있어 중요한 변수가 된다. 법적 권리 관계가 복잡하게 얽혀 있는 디지털 콘텐츠를 보존할 때는 이러한 제도적 요인들이 보존 활동에 직접적인 영향을 미치기 때문이다. 따라서 성공적인 데이터 보존을 위해서는 기술적인 관리뿐만 아니라, 디지털 보존 전략의 수립과 더불어 법적·제도적 환경을 고려한 통합적인 접근이 필수적이다. 이는 장기적인 관점에서 디지털 정보의 지속 가능성을 확보하기 위한 핵심적인 요소로 작용한다.

4. 운영 프로세스 및 단계

데이터 보존을 위한 운영 프로세스는 디지털 콘텐츠의 디지털 패키징인제스트 단계를 포함한다. 이 과정은 수집된 디지털 정보를 체계적으로 정리하고 저장 가능한 상태로 변환하여 시스템에 통합하는 핵심적인 절차이다.[3] 효율적인 관리를 위해 미국 의회도서관 등 주요 기관에서는 디지털 콘텐츠의 패키징과 인제스트를 포함한 다양한 프로그램을 운영하며, 이를 통해 정보의 유입부터 저장까지의 과정을 관리한다.

디지털 자산의 안정성을 유지하기 위해서는 지속적인 모니터링 및 보고 체계가 필수적이다. 이는 디지털 저장소에 저장된 데이터의 상태를 점검하고, 발생 가능한 오류나 손실을 사전에 탐지하여 보고하는 활동을 의미한다.[3] 또한, 지속 가능한 디지털 파일 형식에 대한 관리가 병행되어야 한다. 이를 위해 440개 이상의 다양한 파일 형식에 대한 상세한 정보를 제공하는 웹사이트를 운영하는 등 데이터의 기술적 생존력을 확보하기 위한 노력이 이루어진다.

디지털 아카이브의 구축은 설계된 데이터 모델을 바탕으로 구체적인 로드맵에 따라 단계별로 진행된다. 예를 들어, 국립한글박물관의 사례에서는 수립된 데이터 모델을 실제 시스템으로 구현하기 위해 체계적인 후속 업무 로드맵을 설정한다.[5] 이러한 과정에는 조직의 경영 목표와 전략을 지원하기 위한 정보 전략 계획 수립이 포함된다. ISP는 기관 전체 차원의 중장기 정보화 계획을 세우는 과정으로서, 디지털 아카이브 구현을 위한 비전과 전략적 방향성을 제시하는 역할을 수행한다.[5]

5. 장기 데이터 저장 전략

장기 데이터 저장은 특정 프로젝트가 종료된 이후에도 데이터를 안전하게 보관하기 위해 수행되는 데이터 아카이빙 활동을 의미한다.[8] 이러한 과정은 단순히 정보를 물리적 공간에 두는 것을 넘어, 데이터의 영구성과 지속성을 확보하려는 노력을 포함한다. 비록 모든 데이터의 완전한 영구성을 기술적으로 완벽하게 보장할 수는 없으나, 데이터 관리의 베스트 프랙티스를 적용함으로써 정보의 가치를 최대한 유지할 수 있다.[7]

지속 가능한 데이터 스토리지를 제공하기 위해서는 명확한 비즈니스 모델과 이를 뒷받침하는 지원 정책이 필수적이다. 장기 저장을 담당하는 서비스 제공자는 계약을 체결하고 이행할 수 있는 법적 권한을 보유해야 하며, 기업 수준의 네트워크 저장 장치 환경을 구축해야 한다.[8] 이러한 환경은 높은 수준의 중복성을 갖추어야 하며, 지리적으로 분산된 위치에 데이터를 배치하여 예기치 못한 재난이나 물리적 손실에 대비하는 전략을 취한다.[8]

이를 위해 디지털 기록물이 가진 진본성, 정확성, 그리고 기능성을 유지하며 접근 권한을 관리하는 체계가 운영된다.[2] 특히 태생적 디지털 기록물이나 디지털 대용물의 경우, 원래의 목적에 부합하는 필수적인 품질을 보존함으로써 미래에도 해당 자료를 해석하고 활용할 수 있는 환경을 조성한다.[2]

6. 기관별 디지털 보존 사례

미국 국립문서기록관리청는 보유 중인 모든 디지털 기록물디지털 대용물의 콘텐츠를 보존하고 이에 대한 접근성을 유지하는 데 전념한다. 해당 기관의 디지털 보존 프로그램은 기록물의 지속적인 사용 가능성을 확보하는 것을 목표로 삼는다.[2] 이를 위해 디지털 자료의 목적에 부합하면서도 필수적이고 실행 가능한 수준의 진본성, 정확성, 그리고 기능성를 유지하려는 체계를 구축한다.

미국 의회도서관에서는 여러 단위 조직을 통해 분산형 디지털 보존 활동을 수행한다. 이러한 노력에는 디지털 콘텐츠 패키징인제스트와 관련된 프로그램뿐만 아니라, 디지털 저장소에 대한 모니터링과 보고, 지속 가능한 디지털 파일 형식, 그리고 메타데이터 관리 등이 포함된다.[3] 특히 의회도서관은 440개 이상의 파일 형식에 대한 상세한 설명을 제공하는 웹사이트를 운영하며 디지털 형식의 지속 가능성을 지원한다.

국립한글박물관은 디지털 아카이브 구현을 위해 단계별 추진 과제를 포함한 로드맵을 구상하고 있다. 이는 앞서 제시된 데이터 모델에 기초하여 실제 운영 가능한 시스템을 구축하기 위한 후속 업무를 의미한다. 이를 위해 기관 전체 차원의 중장기 정보화 계획을 수립하는 정보 전략 계획의 성격을 띠며, 조직의 경영 목표와 전략을 효과적으로 지원할 수 있는 정보 시스템의 비전을 설정하는 과정을 거친다.[5]

7. 같이 보기

[1] Ppls.sl.nsw.gov.au(새 탭에서 열림)

[2] Wwww.archives.gov(새 탭에서 열림)

[3] Wwww.loc.gov(새 탭에서 열림)

[4] Wwww.nnlm.gov(새 탭에서 열림)

[5] Ddigerati.aks.ac.kr(새 탭에서 열림)

[6] Eebooks.inflibnet.ac.in(새 탭에서 열림)

[7] Gguides.library.illinois.edu(새 탭에서 열림)

[8] Llib.msu.edu(새 탭에서 열림)