[문화2] 인류의 기억은 디지털로 전환될 수 있나
안대진/아카이브랩 대표
기록이 걷는 길, 아카이브 ④ 기록물과 WWW, 디지털 아카이브의 시대
보급화 된 개인 미디어를 통해 우리는 자신의 일상을 습관처럼 기록한다. 그리고 매체 곳곳에서 ‘아카이브(ARCHIVES)’라는 용어를 어렵지 않게 마주친다. 사실 아카이브는 ‘역사적 가치가 있는 기록 자체’ 혹은 ‘그 기록을 보존하는 기관’을 말하지만, 우리의 일상 속에서는 단순히 자료의 백업·보관 등의 의미로 사용하곤 한다. 이렇듯 용어가 문화 속으로 넓게 파고든 틈 사이로, 은연중에 인지하고 있는 기록과 아카이브의 의미 및 가치를 보다 질적으로 깊이 있게 살펴보고자 한다. <편집자 주>
[글 싣는 순서] ① 사회적 기억으로서의 아카이브 ② ‘국가’의 ‘기록’, 그 중요성을 말하다 ③ 세계기록문화유산 ‘화성성역의궤’ ④ 기록물과 WWW, 디지털 아카이브의 시대
▲ 뉴욕공공도서관의 디지털 컬렉션 시각화 사례 ,출처 : http://publicdomain.nypl.org/pd-visualization/
인류의 기억은 디지털로 전환될 수 있나
안대진 / 아카이브랩 대표
도서관과 박물관, 아카이브를 기억기관(Memory Institutions)이라 한다. 이들은 인류의 집단 기억인 기록과 문화유산을 관리하는 것을 사명으로 한다. 기억기관들은 지난 천 년 동안 발전해 온 책이나 유물, 문서의 보존방식을 넘어서, 디지털 전환이라는 역대급 과제를 해결하느라 고군분투하고 있다. 얼마 전까지만 해도 기록은 문서나 사진처럼 눈으로 확인 가능했지만 지금은 상황이 다르다. 디지털 기록은 눈에 보이지 않는 비트로 이뤄져 있고 데이터와 코드로 구성된다. 심지어 클라우드 컴퓨팅 환경에서는 데이터가 어느 스토리지에 저장돼 있는지조차 알기 어렵다. 여기서 자연스레 몇 가지 의문이 생긴다. 기록을 관리할 책임자는 아키비스트(Archivist)인가 IT 부서인가. 기록은 증거인가 정보자산인가. 과연 기억기관들은 인류의 기억을 디지털로 전환할 수 있는가.
디지털 아카이브의 출현
디지털 아카이브는 기록을 디지털 형태로 보존하고 활용하는 틀이다. 기록물은 시간이 지날수록 변질·훼손·소실의 위험이 있기 때문에 이를 디지털화해 영구적으로 안전하게 보존하는 한편, 시공간의 제약 없이 편리하게 활용하기 위함이다. 이러한 디지털 아카이브의 취지에는 누구나 공감할 것이다. 하지만 과연 디지털이 보존과 활용에 더 유리한지, 안전한지, 비용이 절감되는지에 대해서는 아직 명확한 근거가 없다. 그렇기에 문화유산 보존의 책임이 있는 기억기관들은 디지털 아카이브에 대해 신중할 수밖에 없다. 종이 기록은 적절하게 관리만 하면 수천 년 동안 보존될 수 있다고 검증됐지만, 디지털 기록은 기술 변화에 매우 취약해 한순간에 기록을 읽지 못하게 될 가능성도 있기 때문이다. 전자기록 시대를 맞이하기 위해 기억기관들은 90년대 말부터 ‘디지털 보존(Digital Preservation)’이라는 개념을 만들고 국제적 수준의 연구를 진행해 왔다. 이 분야의 대표적 표준은 ‘OAIS 참조모델(ISO 14721: 2002 Open Archival Information System)’이다. 이 표준은 전자기록을 영구적으로 보존하고 활용하기 위한 몇 가지 개념을 제시하고 있다. 정보와 정보패키지의 정의, 디지털 보존 시스템의 기능적 모델과 보존전략 등이다. 여기서 제안하는 이상적인 디지털 아카이브는 다음과 같다. 일단 전자기록이 디지털 아카이브에 입수되면 100년 후에도 이해할 수 있도록 설명정보를 추가한 뒤 공개포맷으로 변환해 원본과 함께 저장하고, 이용자가 자료를 보고자 하면 원하는 형태로 변환해 제공하는 모델이다. 이 추상적 모델은 이후 몇 개의 후속표준으로 보완됐고 이를 실제로 구현하기 위한 수십 종의 오픈소스 소프트웨어가 개발되고 있다. 최근에는 클라우드 스토리지, 웹 아카이빙 등 구독형 서비스로 진화 중이다.
▲ OAIS 기능 엔티티, 출처 : CCSDS, 2012, Figure 4-1
데이터의 폭주와 디지털 큐레이션
디지털 아카이브에 대한 관심은 정보기술의 발전에 따른 자연스러운 현상이었다. 4차 산업혁명이 일상에 파고든 지금 데이터는 더욱 폭주하고 있다. 유튜브에는 1분마다 400시간이 넘는 영상이 업로드된다. 이는 단순히 정보 과부하의 차원을 넘어선다. 인쇄혁신 이후 5백 년이 지난 지금 폭발적으로 증가한 디지털 데이터 역시 여러 질적 문제를 야기하고 있다. 너무 많은 것이 적은 것보다 해로운 형국이다. 스마트폰과 카메라 기술이 촉발한 콘텐츠 혁명은 우리를 데이터에 파묻어 정작 중요한 정보를 분간하지 못하도록 하고 있다. 기억기관들이 내놓은 데이터 폭주 시대의 디지털 보존전략은 ‘디지털 큐레이션’이다. 디지털 큐레이션은 디지털 자원을 선택적으로 수집해 보존하는 것이다. 본래 ‘큐레이션’이 미술관이나 박물관에서 큐레이터가 전시할 작품을 정하는 행위라면, 디지털 큐레이션은 정보의 홍수 속에서 가장 가치 있는 자원을 찾아내서 정리해 쉽게 사용할 수 있도록 한다. 또한 기억기관들의 아키비스트와 큐레이터들은 앞으로 등장하고 쇠퇴할 새로운 미디어의 저장 포맷을 정해야 하고, 클라우드 서버에서 데이터의 링크를 찾아내 데이터의 접근성을 유지해야 한다.
개방과 포용, 그리고 애자일 철학
지난해 영국의 공공부문 글로벌 네트워크 ‘에이폴리티컬(Apolitical)’은 세계에서 영향력 있는 디지털 정부 인물 100인을 선정했다. 박원순 서울시장은 데이터 공개를 통해 정책의 투명성을 높인 것으로 소개되며 상위 20인 안에 포함됐다. 디지털 정부는 공공서비스 제공에 있어 AI·디지털 포용·오픈데이터·시민참여·사이버보안·디지털 아이덴티티 등 다양한 기술을 이용해 개방성과 민첩성을 갖추고자 노력하는 정부로 정의된다. 디지털 정부지수는 디지털 아카이브에도 시사점을 준다. 바로 개방과 포용, 민첩성이라는 키워드에서다. 우선 ‘개방성’이라는 가치는 디지털 아카이브를 작동시키는 원리가 될 것이다. 그동안 기억기관들은 자원을 보존하고 유지하는 데 집중해왔다. 특히 우리나라의 경우 자료를 내부 직원들의 전유물로 생각하는 인식이 강하고 시민들에게 제공하기 위한 절차나 도구는 매우 미흡하다. 개방성의 가치는 얼마나 많이 공개하느냐에 그치지 않는다. 아카이브의 서비스 정책이 공개돼 있는지, 필요한 도구를 오픈소스 소프트웨어로 쉽게 조달하고 있는지, 시민들이 기록을 쉽게 이용할 수 있게 하는지를 복합적으로 고민해야 한다. ‘포용성’은 신기술의 도입이나 타 기관과의 데이터 상호운용성으로 이해할 수 있다. 방대한 아카이브의 텍스트를 지능적으로 처리하거나 자료의 형식을 가급적 공개된 표준 포맷으로 정하는 것이 필요하다. ‘민첩성’은 환경변화를 모니터링하고 그에 맞게 업무와 도구를 변화시키는 능력이다. 신기술은 업무를 변화시키거나 새로운 기록 유형을 만들어 낸다. 때문에 민첩성은 변화가 빠른 디지털 시대에 점점 더 중요시되는 가치다.
▲ 유네스코 세계기록유산 국제컨퍼런스에서 우리나라의 오픈소스와 디지털 아카이브 사례를 발표하는 안대진 아카이브랩 대표_사진제공 아카이브랩
다음의 소프트웨어 개발자들이 발표한 ‘애자일(Agile) 소프트웨어 개발 선언’은 묵직한 시사점을 준다. “…공정과 도구보다 개인과 상호작용을, 포괄적인 문서보다 작동하는 소프트웨어를, 계약 협상보다 고객과의 협력을, 계획을 따르기보다 변화에 대응하기를 가치 있게 여긴다.…” 기억기관들은 이 말을 다음과 같이 바꿔 들어야 할 것이다. “이용자의 요구에 집중하고, 보존보다는 활용에 가치를 두자.”
디지털 기술은 사람들이 기록을 향유하는 방식을 변화시키고 있다. 미국과 영국, 호주 등의 국가기록원 웹사이트에는 매달 수백만 명의 이용자가 접속한다. 이들은 기록을 쉽게 찾고 열람할 수 있는 다양한 도구를 활용하고 있다. 높아진 대중의 눈높이에 맞춰 아카이브 사이트들은 모바일에 최적화된 서비스를 제공하고 있다. 지금까지 기록이 제공해온 집단기억, 설명책임, 사회정의라는 가치는 디지털 시대에도 여전히 유효하다. 그렇기에 각 기억기관들은 디지털 포용과 오픈데이터, 오픈소스를 통해 인류의 기억을 성공적으로 디지털 전환시키고자 노력해야 할 것이다.
< 저작권자 대학원신문 무단전재 및 재배포금지 >