목차
1주. 강의안내 및 참고자료 소개
프로필 등록 -
팀 구성
2주. 오픈소스 소프트웨어 개요, 대표 OSS 프로젝트, 아카이브 OSS 현황
• 히스토리, 정의, 라이선스, 커뮤니티, 거버넌스, 개발방법론, 개발도구, 배포, 비즈니스모델
• Linux, Apache HTTP Server, MySQL
• POWRR, COPTR registry, PRONOM, DROID
히스토리
오픈 소스 소프트웨어의 역사는 1960년대 MIT 호환 시분할 시스템(CTSS)과 다중화된 정보 및 컴퓨팅 서비스(Multics)의 생성과 함께 시작되었습니다. 이러한 초기 시스템은 정부 및 학계 연구원이 개발했으며 소스 코드는 사용자 간에 자유롭게 공유되었습니다.
1970년대에 자유 소프트웨어 재단(FSF)을 설립한 Richard Stallman이 "자유 소프트웨어"라는 개념을 도입했습니다. Stallman의 목표는 자유롭게 사용할 수 있고 수정 가능한 소프트웨어의 사용을 장려하고 독점 소프트웨어의 사용을 방지하는 것이었습니다.
1980년대에 "오픈 소스 소프트웨어"라는 용어는 자유 소프트웨어에 대한 다른 접근 방식을 설명하기 위해 FSF 및 OSF(Open Software Foundation) 회원단체에 의해 만들어졌습니다. 독점 소프트웨어를 둘러싼 도덕적, 윤리적 문제에 초점을 맞추는 대신 오픈 소스 지지자들은 개선된 협업 및 혁신과 같은 자유롭게 사용할 수 있는 소스 코드의 실질적인 이점을 강조했습니다.
1990년대에는 자발적인 프로그래머 커뮤니티가 개발한 Linux 운영 체제가 부상했으며 이후 가장 널리 사용되는 오픈 소스 소프트웨어 프로젝트 중 하나가 되었습니다. 이 시대의 다른 주목할만한 오픈 소스 프로젝트로는 Apache 웹 서버와 MySQL 데이터베이스가 있습니다.
2000년대에 기업들이 무료로 사용할 수 있는 소프트웨어 사용의 비용 절감 및 기타 이점을 인식하면서 오픈 소스 소프트웨어가 비즈니스 세계에서 점차 인기를 끌었습니다. 오픈 소스 소프트웨어의 사용은 2010년대와 2020년대에 계속 증가했으며 현재 많은 회사와 조직에서 운영 체제 및 웹 서버에서 데이터 분석 및 기계 학습에 이르기까지 다양한 목적으로 오픈 소스 소프트웨어를 사용하고 있습니다. (출처: ChatGPT Jan 9 Version. Let me know a history of Open Source Software.)
Fig. 2.2 A diagramatic view of the evolution and transformation of the OSS domain. (출처: (Open Source Software: A Survey from 10,000 Feet)
정의
오픈 소스 소프트웨어는 누구나 자유롭게 사용, 수정 및 배포할 수 있는 소프트웨어입니다. 소프트웨어의 소스 코드는 공개되어 누구나 소프트웨어를 검사, 개선 및 배포할 수 있습니다. 가장 널리 사용되는 오픈 소스 라이선스에는 GPL, MIT 라이선스 및 Apache 라이선스가 포함됩니다. (출처: ChatGPT Jan 9 Version)
오픈소스로 주로 불리며, 자유소프트웨어의 ‘자유(Free)’와 공개소프트웨어의 ‘공개(Open Source)’에 대한 의미적 접근에 대한 부분이 다소 상이하던 때가 있어 나뉘어 불리기도 했으나, 최근에는 FOSS(Free&Open Source Software)로 지칭되면서 양자가 갖는 특징을 포괄하는 방향으로 안착하고 있다(출처: 공개SW포털)
Debian: 긴밀한 자유 소프트웨어 해커 그룹으로 시작해서 점점 커져서 개발자, 기여자, 사용자로 잘 구성된 커다란 커뮤니티로써 1000명 이상 활동적인 개발자가 전 세계에 퍼져서 여유 시간에 데비안 작업을 하며 주로 전자메일(메일링 리스트lists.debian.org) 및 IRC(channel #debian at irc.debian.org)로 소통한다.(출처: 데비안 프로젝트 홈페이지)
시사점: 오픈 소스에는 독점적인 권리가 없을 뿐이지, 저작권은 존재한다. 예로, 오픈 소스 프로그램은 일정 라이선스를 준수하면 유료로도 재판매가 가능하다?!(출처:위키백과)
라이선스
가장 널리 사용되는 오픈 소스 라이선스는 GNU GPL(General Public License)입니다. GPL은 "카피레프트" 라이선스이며, 이는 모든 파생 작업도 동일한 라이선스 조건에 따라 배포되어야 함을 의미합니다. 널리 사용되는 다른 오픈 소스 라이선스에는 MIT 라이선스, Apache 라이선스 및 BSD 라이선스가 포함됩니다. 각 라이선스에는 고유한 약관이 있으므로 오픈 소스 소프트웨어를 사용하거나 배포하기 전에 라이선스를 주의 깊게 읽고 이해하는 것이 중요합니다. (출처: ChatGPT Jan 9 Version)
2021년 오픈소스 라이선스 점유율 현황
•
의무사항이 많은 카피레프트(GPL) 라이선스의 적용은 지속적 감소
•
상업적 활용이 가능한 MIT와 Apache 2.0 라이선스의 적용 확대
커뮤니티
오픈 소스 소프트웨어 커뮤니티는 자유롭게 사용, 수정 및 배포할 수 있는 소프트웨어를 개발하고 유지 관리하기 위해 협력하는 개인 및 조직의 그룹입니다. 이 커뮤니티의 가치는 재정 자원에 관계없이 모든 사람이 사용할 수 있는 고품질 소프트웨어를 만드는 능력에 있습니다. 이를 통해 개인과 조직의 비용 절감은 물론 혁신과 협업이 증가할 수 있습니다. 또한 오픈 소스 소프트웨어는 많은 사람이 코드를 검토하고 잠재적인 취약점을 식별할 수 있으므로 더 안전할 수 있습니다. 전반적으로 오픈 소스 소프트웨어 커뮤니티는 기술에 대한 접근을 촉진하고 혁신을 주도하는 데 중요한 역할을 합니다. (출처: ChatGPT Jan 9 Version. Let me know about the value of the open source software community)
거버넌스
오픈 소스 소프트웨어 프로젝트의 거버넌스는 프로젝트의 개발 및 유지 관리를 관리하기 위해 마련된 프로세스 및 구조를 의미합니다. 여기에는 의사 결정 절차, 행동 강령, 커뮤니케이션 채널 등이 포함될 수 있습니다.
오픈 소스 소프트웨어 거버넌스의 핵심 측면은 커뮤니티 참여입니다. 즉, 코드를 제출하거나 버그를 보고하거나 새로운 기능을 제안하는 등 누구나 프로젝트에 기여할 수 있습니다. 또한 커뮤니티가 프로젝트의 방향을 결정하고 개발을 위한 우선 순위를 설정하는 등의 의사 결정에 핵심적인 역할을 한다는 것을 의미합니다.
일부 오픈 소스 프로젝트에는 기본 관리자 역할을 하는 단일 개인 또는 조직이 있는 반면 다른 프로젝트는 관리자 그룹이 관리합니다. 두 경우 모두 기여가 적시에 검토 및 통합되고 분쟁이 공정하게 해결되도록 하기 위해 프로젝트에 명확한 거버넌스 구조와 프로세스가 있어야 합니다.
많은 오픈 소스 프로젝트는 메일링 리스트나 포럼에 대한 토론이나 투표와 같은 합의 기반 프로세스를 통해 의사 결정이 이루어지는 분산형 거버넌스 모델을 사용합니다. 다른 프로젝트에서는 소규모 개인 그룹 또는 조직이 커뮤니티를 대신하여 결정을 내리는 보다 중앙화된 모델을 사용할 수 있습니다.
어떤 경우든 거버넌스 구조는 투명하고 잘 문서화되어야 하며 프로젝트의 미션 및 가치와 일치해야 합니다.
개발방법론
오픈 소스 소프트웨어 개발 방법론은 오픈 소스 소프트웨어 프로젝트를 개발하고 유지하는 데 사용되는 프로세스와 관행을 말합니다. 오픈 소스 소프트웨어 개발 방법론에는 다음과 같은 몇 가지 주요 특징이 있습니다.
•
협업: 오픈 소스 소프트웨어 개발은 개인과 조직이 협력하여 소프트웨어를 개발하고 유지 관리하는 협업 원칙을 기반으로 합니다.
•
투명성: 개발 프로세스와 결정이 공개되어 누구나 소프트웨어가 어떻게 개발되고 있는지 확인하고 프로젝트에 기여할 수 있습니다.
•
분산화: 오픈 소스 소프트웨어 개발은 분산화되어 있어 누구나 프로젝트에 기여할 수 있으며 단일 제어 지점이 없습니다.
•
유연성: 오픈 소스 소프트웨어 개발은 유연하여 여러 기여자가 코드의 서로 다른 부분에서 동시에 작업할 수 있습니다.
•
신속한 개발: 오픈 소스 소프트웨어 개발은 종종 빠르게 진행되고 민첩한 개발 프로세스를 사용하므로 빠른 반복과 빈번한 릴리스가 가능합니다.
•
커뮤니티 중심: 오픈 소스 소프트웨어 개발은 커뮤니티 중심입니다. 즉, 커뮤니티가 프로젝트 방향 결정, 개발 우선 순위 설정, 분쟁 해결과 같은 의사 결정에서 중심적인 역할을 합니다.
•
지속적인 통합: 오픈 소스 소프트웨어 개발은 개발자가 코드를 자주 병합하고 오류를 조기에 감지할 수 있는 지속적인 통합 접근 방식을 사용합니다.
•
개방형 커뮤니케이션: 오픈 소스 소프트웨어 개발은 메일링 리스트, 포럼, 채팅방과 같은 개방형 커뮤니케이션 채널에 의존하여 참여자 간의 협업과 조정을 용이하게 합니다.
(출처: ChatGPT Jan 9 Version. Let me know about characteristics of open source software development methodology)
오픈소스 소프트웨어 프로젝트의 생명 주기 (출처: 이민석, 2008, p. 12)
개발도구
오픈 소스 소프트웨어 프로젝트를 개발하는 데 사용할 수 있는 많은 도구가 있습니다. 가장 일반적으로 사용되는 도구는 다음과 같습니다.
•
Git: 개발자가 코드 변경 사항을 추적하고 다른 사람과 협업할 수 있는 분산 버전 제어 시스템
•
GitHub: 버전 제어를 위해 Git을 사용하고 이슈 추적 및 프로젝트 관리와 같은 추가 기능을 제공하는 웹 기반 플랫폼
•
Jenkins: 소프트웨어 빌드, 테스트 및 배포를 자동화하는 데 사용할 수 있는 오픈 소스 자동화 서입니다.
•
Travis CI: 코드 변경을 자동으로 빌드하고 테스트하기 위해 GitHub와 통합할 수 있는 지속적 통합 서비스
•
JIRA: 소프트웨어 개발 프로젝트의 작업, 버그 및 문제를 추적하는 데 사용할 수 있는 프로젝트 관리 도구
•
Docker: 개발자가 컨테이너화된 환경에서 애플리케이션을 쉽게 패키징, 배포 및 실행할 수 있는 플랫폼
•
Ansible: 소프트웨어 프로비저닝, 구성 관리 및 애플리케이션 배포를 자동화하는 도구
•
OpenSSL: 네트워크를 통한 보안 통신을 위한 라이브러리 및 명령줄 도구를 제공하는 SSL 및 TLS 프로토콜의 오픈 소스 구현
이들은 오픈 소스 소프트웨어 프로젝트에서 널리 사용되는 인기 있는 개발 도구 중 일부입니다. 도구 선택은 프로젝트 유형과 개발 팀의 요구 사항에 따라 다릅니다.
(출처: ChatGPT Jan 9 Version. Let me know about development tool of open source software project)
배포
오픈 소스 소프트웨어 프로젝트의 새 버전을 출시하려면 다음과 같은 여러 단계가 포함될 수 있습니다.
•
계획: 새 버전을 출시하기 전에 개발 팀은 릴리스에 포함될 변경 사항과 기능을 계획해야 합니다. 여기에는 완료할 로드맵 또는 작업 목록 작성이 포함될 수 있습니다.
•
개발: 계획이 수립되면 개발 팀은 새 릴리스의 변경 사항 및 기능에 대한 작업을 시작할 수 있습니다. 여기에는 새 코드 작성, 버그 수정 또는 문서 업데이트가 포함될 수 있습니다.
•
테스트: 새 버전을 출시하기 전에 개발 팀은 소프트웨어가 안정적이고 버그가 없는지 철저히 테스트해야 합니다. 여기에는 자동 테스트 실행, 수동 테스트 수행 또는 베타 테스터로부터 피드백 받기가 포함될 수 있습니다.
•
릴리스 준비: 소프트웨어 릴리스 준비가 완료되면 개발 팀은 소프트웨어의 새 버전 생성, 변경 로그 생성 및 문서 업데이트를 포함할 수 있는 릴리스 패키지를 준비해야 합니다.
•
릴리스: 릴리스 패키지를 Git과 같은 버전 관리 시스템에 업로드하거나 웹 사이트 또는 패키지 관리자에 업로드하여 새 버전의 소프트웨어를 대중에게 릴리스할 수 있습니다.
•
발표: 개발팀은 소셜 미디어, 메일링 리스트 또는 포럼에서 새 릴리스에 대해 발표해야 합니다. 이렇게 하면 사용자에게 새 버전과 해당 기능을 알리고 소프트웨어 다운로드 및 설치 방법에 대한 지침을 제공합니다.
•
유지 관리: 릴리스 후 개발 팀은 소프트웨어 버그를 계속 모니터링하고 사용자에게 지원을 제공해야 합니다. 또한 필요에 따라 버그 수정 또는 패치 릴리스를 릴리스할 수도 있습니다.
오픈 소스 소프트웨어 프로젝트의 새 버전을 릴리스하는 프로세스는 프로젝트의 규모와 복잡성, 개발 팀의 워크플로 및 도구에 따라 달라질 수 있습니다. 그러나 위에서 설명한 일반적인 단계는 프로세스에 대한 좋은 개요를 제공합니다.
비즈니스모델
오픈 소스 소프트웨어 프로젝트에 일반적으로 사용되는 몇 가지 비즈니스 모델이 있습니다.
•
이중 라이선스(Dual licensing): 이 모델에서는 기업이 오픈 소스 라이선스에 따라 무료로 오픈 소스 소프트웨어를 사용할 수 있지만 독점 제품에서 사용하려면 상용 라이선스를 구입해야 합니다.
•
지원 및 서비스(Support and services): 이 모델에서 회사는 오픈 소스 소프트웨어 사용자에게 교육, 컨설팅 및 맞춤형 개발과 같은 지원 및 서비스를 제공합니다. 이것은 회사가 자신이 만든 오픈 소스 프로젝트를 수익화할 수 있는 수익성 있는 방법이 될 수 있습니다.
•
광고(Advertising): 일부 오픈 소스 소프트웨어 프로젝트에는 수익을 창출하는 방법으로 광고가 포함될 수 있습니다. 이는 소프트웨어 자체 또는 프로젝트와 관련된 웹 사이트에 광고를 포함하여 수행할 수 있습니다.
•
기부(Donations): 일부 오픈 소스 프로젝트는 소프트웨어 개발 및 유지 관리에 자금을 지원하기 위해 사용자 및 지지자의 기부에 의존합니다.
•
클라우드 서비스(Cloud services): 오픈 소스 프로젝트는 호스팅, 스토리지, SaaS(Software as a Service)와 같은 클라우드 서비스를 사용자에게 제공하여 수익을 창출할 수도 있습니다.
•
제품 판매(Product sales): 일부 오픈 소스 프로젝트는 추가 기능, 지원 및 서비스와 함께 제공되는 소프트웨어의 유료 버전을 제공합니다.
•
후원(Sponsorship): 오픈 소스 프로젝트는 브랜딩, 판촉 또는 기타 혜택과 교환하여 프로젝트의 성공에 기득권이 있는 회사의 후원을 받을 수도 있습니다.
다음은 오픈 소스 소프트웨어 프로젝트의 일반적인 비즈니스 모델 중 일부입니다. 비즈니스 모델의 선택은 소프트웨어 유형, 대상 시장 및 개발 팀의 목표에 따라 달라집니다. 많은 오픈 소스 프로젝트는 이러한 모델의 조합을 사용하여 작업을 수익화합니다.
1. Subscription Model (구독)
•
사용자가 구독료를 내고 소프트웨어를 사용
Examples: RedHat
2. Commercial and Open Source Products (제품 판매)
•
라이선스 또는 구독으로 제공되는 상용제품 제공
Examples: CollabNet, SugarCRM, JasperSoft
3. Support and Training Model (기술지원. 교육)
•
하나 이상의 오픈소스 프로젝트에 대한 지원 서비스, 교육 및 출판
Examples: Many, including O’Reilly, SpringSource (VMWare)
4. Consulting Strategy (컨설팅)
•
고객의 오픈소스 관련 전략적 결정 및 투자 지원
Examples: IBM Global Services, Accenture, Gartner
5. Dual License Model (듀얼 라이선스)
•
동일 소프트웨어를 오픈소스와 상업적 라이선스로 동시 제공
Example: MySQL
6. Hosted Service (호스팅)
•
소프트웨어 웹 호스팅 서비스 제공
Examples: Yahoo, Google
7. Advertising Model (광고)
•
OSS 서비스 사용자에게 광고 표시
Example: Google
8. Commercial Enhancement (상용제품 개발)
•
적절한 OSS를 사용하며 상업용 제품 개발
Examples: EnterpriseDB and SRA OSS (PostgreSQL-based)
9. System Model (시스템 모델)
•
하드웨어에 OSS를 적용하여 제품 판매 수익 창출
Example: Cisco (Linksys routers), TiVo
10. Patronage Model (후원)
•
수익을 바라지 않고 커뮤니티에 OSS, 돈, 장비, 시간 제공
Example: IBM
11. Packaging Model (부가가치 패키징)
•
시스템 설치/통합, 기술지원 등 번들 서비스 제공
Examples: RedHat, OpenLogic, SugarCRM, OrangeHRM
12. Accessorising(액세서라이징)
•
책, 매뉴얼, 티셔츠, 머그컵, 스티커 등 부속 아이템 판매(스티커 문화=프로젝트 홍보 및 커뮤니티 응원)
Example: O’Reilly 출판사(OSCON) 등
Linux
Linux는 Unix 운영 체제를 기반으로 하는 무료 오픈 소스 운영 체제입니다. Linux 프로젝트는 1991년 핀란드 헬싱키 대학의 학생인 Linus Torvalds에 의해 시작되었습니다. 그는 Linux 운영 체제의 기초를 형성하는 Linux 커널을 만들었습니다.
Linux의 특징 중 하나는 모듈식 설계를 기반으로 한다는 것입니다. 즉, 운영 체제는 쉽게 교체하거나 업데이트할 수 있는 다양한 구성 요소 또는 모듈로 구성되어 있습니다. 이 디자인은 높은 수준의 유연성과 사용자 지정 가능성을 허용합니다.
Linux 운영 체제는 서버, 데스크톱 컴퓨터, 랩톱, 스마트폰 및 임베디드 시스템을 포함한 다양한 장치에서 사용됩니다. 또한 기업 및 클라우드 컴퓨팅 환경에서 널리 사용됩니다.
Linux 프로젝트는 개발자, 프로그래머 및 사용자를 포함한 글로벌 자원 봉사자 커뮤니티에 의해 개발 및 유지 관리됩니다. 커뮤니티는 함께 협력하여 소프트웨어를 개선하고 버그를 수정하며 새로운 기능을 추가합니다.
Linux 프로젝트는 Linux 개발을 위한 지원 및 리소스를 제공하는 비영리 조직인 Linux Foundation에서 관리합니다. Linux 커널은 누구나 무료로 소프트웨어를 사용, 수정 및 배포할 수 있는 오픈 소스 라이선스인 GNU GPL(General Public License)에 따라 배포됩니다.
Linux 커널 외에도 GNU 도구, 다양한 그래픽 사용자 인터페이스(GUI) 및 데스크탑 환경과 같은 추가 소프트웨어 및 도구를 포함하는 다양한 Linux 배포판 또는 "distros"가 있습니다. 가장 널리 사용되는 Linux 배포판에는 Ubuntu, Debian, Fedora, Arch Linux 및 openSUSE가 있습니다.
전반적으로 Linux는 광범위한 장치 및 사용 시나리오를 위한 강력하고 유연하며 사용자 정의 가능한 운영 체제를 제공하는 널리 사용되고 영향력 있는 오픈 소스 프로젝트입니다.
Linux Distribution (리눅스 배포판)
가장 인기 있는 Linux 서버 배포 유형을 요약할 수 있습니까? 그리고 마지막으로 각 배포판의 시장점유율을 알려주세요.
물론입니다. 2023년 2월 현재 가장 인기 있는 Linux 서버 배포판과 시장 점유율은 다음과 같습니다.
Ubuntu Server: Ubuntu Server는 널리 사용되는 서버용 Linux 배포판으로 사용 편의성과 사용자 친화적인 인터페이스로 잘 알려져 있습니다. 시장점유율은 약 33%다.
CentOS: CentOS는 RHEL(Red Hat Enterprise Linux) 소스 코드를 기반으로 하는 커뮤니티 지원 배포판입니다. 안정성과 보안성으로 유명하여 기업 환경에서 많이 사용됩니다. 시장점유율은 약 23%다.
Debian: 데비안은 Linux 초창기부터 존재해 온 안정적이고 신뢰할 수 있는 배포판입니다. 웹 서버 및 기타 서버 응용 프로그램에 자주 사용되며 보안 및 안정성으로 유명합니다. 시장점유율은 약 18%이다.
RHEL(Red Hat Enterprise Linux): RHEL은 엔터프라이즈 환경에서 널리 사용되는 상용 Linux 배포판입니다. 안정성과 보안으로 유명하며 배포에 대한 지원 및 서비스를 제공하는 회사인 Red Hat, Inc.의 지원을 받습니다. 약 15%의 시장점유율을 가지고 있습니다.
SLES(SUSE Linux Enterprise Server): SLES는 엔터프라이즈 환경에서 널리 사용되는 또 다른 상용 Linux 배포판입니다. 미션 크리티컬 워크로드에 대한 안정성과 지원으로 유명합니다. 약 3%의 시장점유율을 가지고 있습니다.
Fedora 서버: Fedora 서버는 Fedora 배포판을 기반으로 하는 커뮤니티 지원 배포판입니다. 최첨단 기술과 신흥 기술 지원으로 유명합니다. 시장점유율은 약 2%이다.
이러한 배포판은 모두 서버 응용 프로그램에 널리 사용되며 특정 사용 사례에 따라 고유한 장단점이 있습니다. 시장 점유율 데이터는 최근 조사 및 추정치를 기반으로 하며 사용된 소스 및 방법론에 따라 다를 수 있습니다.
(출처: ChatGPT Feb 13 Version. Can you summarize the types of most popular Linux server distributions? And at the end, tell us the market share of each distribution.)
Apache HTTP Server
일반적으로 Apache라고 하는 Apache HTTP Server는 인터넷에서 웹 페이지를 제공하는 데 널리 사용되는 무료 오픈 소스 웹 서버 소프트웨어입니다. 오픈 소스 소프트웨어 프로젝트의 Apache 커뮤니티를 지원하는 비영리 조직인 Apache Software Foundation에서 개발 및 유지 관리합니다.
Apache는 1995년에 처음 출시된 이후 세계에서 가장 인기 있는 웹 서버 중 하나가 되었으며 모든 활성 웹 사이트의 절반 이상을 지원합니다. Windows, macOS 및 Linux를 포함한 다양한 운영 체제에서 실행됩니다.
Apache는 안정성, 보안 및 유연성으로 유명합니다. 관리자가 특정 요구 사항에 맞게 동작을 사용자 지정할 수 있도록 고도로 구성 가능합니다. 또한 가상 호스팅, 로드 밸런싱 및 SSL/TLS 암호화와 같은 다양한 기능을 지원합니다.
Apache는 누구나 무료로 소프트웨어를 사용, 수정 및 배포할 수 있는 오픈 소스 라이선스인 Apache 라이선스에 따라 출시됩니다. Apache Software Foundation은 커뮤니티의 Apache 프로젝트에 대한 기여를 장려하며 전 세계의 많은 개발자가 Apache HTTP Server 개발에 기여했습니다.
Apache HTTP Server 외에도 Apache Software Foundation은 Apache Tomcat 서블릿 컨테이너, Apache Cassandra NoSQL 데이터베이스 및 Apache Hadoop 데이터 처리 프레임워크와 같은 여러 기타 오픈 소스 소프트웨어 프로젝트를 유지 관리합니다.
전반적으로 Apache HTTP Server는 광범위한 사용 사례에 대해 강력하고 안정적이며 유연한 웹 서버를 제공하는 널리 채택되고 확립된 오픈 소스 프로젝트입니다. 전 세계의 개인, 조직 및 회사에서 널리 사용하므로 인터넷에서 가장 널리 사용되는 웹 서버 중 하나입니다.
MySQL
MySQL은 널리 사용되는 오픈 소스 관계형 데이터베이스 관리 시스템(RDBMS)으로 Oracle Corporation에서 개발했습니다. 데이터베이스의 데이터에 액세스하고 조작하는 데 사용되는 SQL(Structured Query Language)을 기반으로 합니다. MySQL은 웹 애플리케이션 및 데이터 웨어하우징에서 일반적으로 사용되며 숫자, 텍스트 및 날짜를 포함한 다양한 형식으로 데이터를 저장하고 검색하는 데 사용할 수 있습니다. MySQL의 주요 기능 중 일부에는 다중 스토리지 엔진 지원, 고성능 및 확장성, 데이터베이스 관리를 위한 광범위한 도구가 포함됩니다. MySQL 프로젝트에서 작업하는 경우 데이터베이스 설계 및 구현, 데이터 액세스 및 조작을 위한 SQL 쿼리 작성, 데이터베이스 관리를 위한 도구 사용이 포함될 수 있습니다.
POWRR
POWRR(Preserving digit al Objects With Restricted Resources project) 프로젝트는 2012년 미국 노스일리노이대학 등이 디지털 컬렉션 관리를 위한 최신 디지털 보존 소프트웨어 6종의 기능을 분석하여 영구기록관리시스템의 표준 프로세스를 정립하고자 한 연구 프로젝트이다.
연구팀은 60개 이상의 디지털 보존 툴과 서비스를 OAIS 기반의 디지털 큐레이션 생애주기별로 매핑한 툴 그리드(Tool Grid)를 개발했다. 이 툴 그리드는 예산, 인력, IT인프라가 제한적인 중소규모 기관이 스스로 디지털 보존 프로그램을 개발하고 활용하도록 하는 확장 가능한 디지털 보존 솔루션을 제공한다.
COPTR
COPTR(Community Owned Preservation Tools Registry)은 디지털 보존 도구 및 리소스의 레지스트리입니다. 커뮤니티 주도 프로젝트이며 그 목표는 디지털 보존에 관련된 사람들이 사용할 수 있는 도구와 리소스에 대한 자세한 정보를 제공하는 것입니다. COPTR 레지스트리에는 도구의 기능, 기술 요구 사항 및 다양한 유형의 디지털 보존 작업에 대한 적합성에 대한 정보가 포함됩니다. 사용자는 도구 유형, 운영 체제 및 보존 기능과 같은 다양한 기준으로 레지스트리를 검색하고 필터링할 수 있습니다. 또한 사용자는 레지스트리에 포함할 새 도구와 리소스를 제출할 수도 있습니다. COPTR은 DPC(Digital Preservation Coalition)에서 관리하며 디지털 보존에 관련된 모든 사람에게 유용한 리소스입니다.
PRONOM
PRONOM은 영국 국립 문서 보관소에서 개발한 파일 형식 레지스트리입니다. 디지털 파일 형식을 식별하고 설명하기 위한 리소스이며 디지털 정보의 장기 보존 및 액세스를 보장하는 데 사용됩니다.
PRONOM 레지스트리에는 형식의 이름, 버전 및 관련 소프트웨어를 포함하여 900개 이상의 파일 형식에 대한 정보가 포함되어 있습니다. 또한 파일 형식의 구조, 관련 파일 서명, 형식 액세스 및 보존을 위한 권장 도구와 같은 기술적 세부 정보도 포함되어 있습니다.
PRONOM은 또한 형식 식별 및 유효성 검사를 수행하는 일련의 웹 서비스를 제공하여 조직에서 자동으로 파일 형식을 식별하고 디지털 파일의 무결성을 확인할 수 있도록 합니다.
PRONOM은 영국 및 국제적으로 조직의 디지털 보존 활동을 관리하기 위해 널리 사용되며 디지털 정보의 장기 보존 및 접근성을 보장하는 중요한 리소스로 간주됩니다.
DROID
DROID(Digital Record Object Identification)는 영국 국립 문서 보관소와 웨일스 국립 도서관에서 개발한 파일 형식 식별 도구입니다. 내부 특성에 따라 파일 형식을 자동으로 식별하고 분류하도록 설계되어 이름이 변경되었거나 파일 확장자가 없는 경우에도 특정 파일 형식을 식별할 수 있습니다. DROID는 오디오, 비디오, 이미지, 문서 및 기타 유형의 파일을 포함하여 990개 이상의 다양한 파일 형식을 식별하는 데 사용할 수 있습니다. 독립 실행형 도구로 사용할 수 있으며 다른 소프트웨어 응용 프로그램에 통합할 수도 있습니다.
아카이브 OSS 현황
3주. 카탈로깅 분야 OSS – AtoM (1)
개발배경, 아키텍처, 라이선스, 거버넌스, 기능, 특징
AtoM 데모, AWS EC2 개요, AtoM 설치
AtoM 소개
AtoM 데모
•
Users, Group
•
Theme
•
Accession records
•
Archival description (ISAD(G))
•
Archival institution (ISDIAH)
•
People and Organization (ISAAR-CPF)
4주. 카탈로깅 분야 OSS – AtoM (2)
AtoM 실습 – Admin, Manage, Add(디스크립션)
Admin(설정)
Users
Groups
Static pages
Menus
Plugins
Themes
Settings
Description updates
visible elements
Manage(관리)
Accessions
Donors
Physical storage
Rights holders
Taxonomies
Jobs
Add(디스크립션 작성)
Accession record(입수기록)
Archival description(ISAD(G))
Archival institution(ISDIAH)
Authority record(ISAAR-CPF)
Term(용어)
Function(ISDF)
5주. 카탈로깅 분야 OSS – AtoM (3)
AtoM 실습 – CSV Import
Import(목록과 파일 입수)
CSV 파일 저장하기
•
Microsoft Excel > 다른 이름으로 저장 > CSV
•
탐색기에서 csv 파일 우클릭 > 연결프로그램 > 메모장
•
파일 > 다른 이름으로 저장 > 파일형식: 모든파일 > 파일명에 .csv 확장자 써주기 > 인코딩: UTF8(BOM) >저장
XML 가져오기
6주. 웹 퍼블리싱 분야 OSS – Omeka (1)
개발배경, 아키텍처, 라이선스, 거버넌스, 기능, 특징
omeka.net 계정 생성, 데모
Omeka Classic 소개, 실습
소개
실습 (구독버전=Omeka.net)
omeka.net 계정 생성
•
회원가입 안내
•
구독 요금제 안내
omeka.net 간단 시연
•
관리자 페이지 소개 (Manage Site)
◦
Omeka 관리자 페이지의 구조 (좌측메뉴와 우측상단 관리메뉴 간단소개)
◦
아이템 1개 등록
◦
컬렉션 1개 등록
•
서비스 페이지 소개 (View Site)
◦
등록한 아이템과 컬렉션이 어떻게 서비스되는지 설명
실습 (설치버전=Omeka Classic)
URL: http://3.88.211.163/
•
로그인 ID: admin
•
로그인 패스워드: 09070907
설정메뉴(우측상단)
•
Plugins(플러그인 설치, 관리)
•
Appearance(테마, 네비게이션, 세팅)
•
Users(이용자 관리)
•
Settings(일반, 보안, 검색, 메타데이터, API)
기능메뉴(좌측)
•
Items(아이템 등록.관리)
•
Exhibits(온라인전시 등록.관리)
•
Collections(컬렉션 등록.관리)
•
Simple Pages(페이지 생성.관리)
•
Item Types(아이템 유형별 메타데이터 설정)
Omeka Classic의 사촌들
•
omeka.net (구독형)
•
Omeka Classic (설치형, 본좌)
•
Omeka S (LOD 기반 차세대 Omeka)
•
Curatescape (지도 기반 스토리텔링)
Omeka의 강점
•
전 세계 사용자 & 능력자들 많다, 사촌들, 비공식 테마, 플러그인도 많다
•
직관적이고 쉬운 인터페이스 (더블린코어 기반)
•
웹 트렌드 반영
•
WordPress와 구조가 유사하여 일반 개발업체도 쉽게? 개발 가능
7주. 웹 퍼블리싱 분야 OSS – Omeka (2)
Map, Simple Vocab, 외부툴 연계, CSV Import
Simple Vocab
실습
Map
외부툴 연계(Juxtapose, Google Map, YouTube)
CSV Import(목록, 파일 입수)
1.Current Record 관리에 AtoM, Omeka가 적합한가? No
2.Current Record 관리에 적합한 오픈소스 툴은 무엇인가? 없다. 노션 정도
3.Omeka Classic 설치.운영 과정의 오류는 어떻게 효과적으로 해결하나?
8주. 웹 퍼블리싱 분야 OSS – Omeka (3) 특강
AWS EC2 개요, AtoM & Omeka 설치
Omeka Classic 설치 (특강. 이기영)
AWS EC2
Amazon Elastic Compute Cloud(EC2)는 클라우드에서 크기 조정 가능한 컴퓨팅 용량을 제공하는 웹 서비스입니다. 이를 통해 사용자는 자신의 컴퓨터 응용 프로그램을 실행할 가상 머신(VM)을 임대할 수 있습니다. EC2 인스턴스는 CPU, 메모리, 스토리지 및 네트워킹 용량의 다양한 구성으로 시작할 수 있으며 필요에 따라 쉽게 확장 또는 축소할 수 있습니다. 사용자는 온디맨드, 예약 또는 스팟 가격 중에서 선택할 수 있는 옵션과 함께 소비하는 컴퓨팅 리소스의 양에 대해 비용을 지불합니다. 또한 EC2는 로드 밸런싱, 자동 확장, EBS(Elastic Block Store) 및 EFS(Elastic File System)와 같은 스토리지 옵션과 같은 다양한 추가 서비스를 제공합니다. (출처: ChatGPT Jan 9 Version. Let me know about AWS EC2)
Cloud 서비스 유형
IaaS (Infrastructure as a Service)
PaaS(Platform as a Service)
SaaS(Software as a Service)
Linux 명령어
AtoM 설치
9주. 디지털 보존분야 OSS – Preservica
개발배경, 기능, 특징, 클라우드서비스
Preservica 실습 – Preservica Cloud 계정 생성, 입수, 컬렉션 구성, 메타데이터 기술, Universal Access
소개
실습
Preservica Cloud 계정 생성
입수
컬렉션 구성
메타데이터 기술
Universal Access(포털)
평가(Archivematica와 비교)
평가
Q.장기보존 기능은 어떤 것인가?
•
입수(Ingest) : 파일이나 폴더를 업로드하면 입수 단계의 Preservation을 자동 수행한다.
◦
무결성 검사(checking integrity)
◦
바이러스 체크(checking viruses)
◦
파일포맷 식별(Identifying file format)
◦
구조 기술(Creating Structure)
◦
저장(Store)
◦
Outlook MS, Lotus 등 기록생산시스템 연계 자동이관
•
관리
◦
입수 지원도구 제공 (SIP Creator, 입수요청발송)
◦
보존 메타데이터 기술
◦
파일포맷 변환, 마이그레이션
•
접근(Access)
◦
Universal Access 제공 (정보자원 검색열람 채널 제공
◦
WordPress, Drupal 등 서비스시스템과 연계 제공
단점
•
한글지원 부족
•
무료버전 느림, 오류, 인증잘안됨
•
디지털 객체 보존에 최적화된 제한적 시스템
누가 쓰나?
•
디지털 객체 장기보존 의무가 있는 아카이브
•
조직 구성원의 디지털 자료 공유가 중요한 기관
•
디지털화가 안되어 있거나, 디지털화 후 정리 등록이 안된기관은 사용 어려움
효과적인 사용 팁
•
카탈로깅 툴과 세트로 사용하자
◦
ArchivesSpace + Preservica (+Omeka)
◦
AtoM + Archivematica (+Omeka)
Q. Preservica는 오류 리스크가 없는 것 같다. 시스템을 몰라도 쉽게 쓸 것 같다. 예술단체에서 폴더별로 자료 관리하면 검색 잘 될 것 같다.
10주. 디지털 보존분야 OSS – Zotero, VeraPDF
Zotero, VeraPDF 개요 및 실습
(선택) ExifTool, NARA File Analyzer and Metadata Harvester, ePADD 개요 및 실습
Zotero
Ztoero Import (Omeka 플러그인)
VeraPDF
ExifTool
NARA File Analyzer and Metadata Harvester
ePADD
설치
ePADD Appraisal
ePADD Processing
ePADD Discovery
ePADD Delivery
11주. 디지털 보존분야 OSS – Archivematica (1)
정의, 목표, 가치, 개발배경, 기술 아키텍처, 거버넌스, 라이선스, 기능
아카이브매티카란? 오픈소스 OAIS이다!
Archivematica는 디지털 컬렉션에 대한 표준 기반의 장기 보존과 접근을 제공하는 오픈소스 디지털 보존 시스템입니다. Archivematica는 디지털 개체에 액세스할 수 있도록 웹 기반 콘텐츠 관리 시스템 AtoM과 함께 제공됩니다. Archivematica는 사용자가 OAIS(Open Archival Information System) 기능 모델 및 기타 디지털 보존 표준 및 모범 사례를 준수하여 수집에서 아카이브 스토리지 및 액세스에 이르기까지 디지털 개체를 처리할 수 있도록 하는 무료 및 오픈소스 도구의 통합 제품군을 제공합니다 .
프로젝트의 목표는? 디지털 보존을 쉽게!
Archivematica 프로젝트의 목표는 기술 및 예산이 제한적인 전 세계의 기록 소장기관에게 디지털 보존을 시작할 수 있는 도구, 방법론 및 자신감을 제공하는 것입니다. 이 프로젝트는 수집에서 액세스까지 OAIS 기능 모델을 준수하기 위해 수행해야 하는 구체적이고 구체적인 단계를 통합하기 위해 철저한 OAIS 사용 사례 및 프로세스 분석을 수행했습니다. 배포 경험과 사용자 피드백을 통해 이 프로젝트는 OAIS를 넘어 SIP로 전송된 디지털 개체의 분석 및 배열을 처리하고 여러 결정 지점에서 기록 평가를 허용하도록 확장되었습니다. 가능한 경우 이러한 요구 사항은 Archivematica 시스템 내의 소프트웨어 도구에 할당됩니다. 현재 시스템 반복에서 이러한 단계를 자동화할 수 없는 경우 최종 사용자가 수행할 수동 절차에 통합되고 문서화됩니다. 요컨대, 시스템은 단순한 소프트웨어 도구 세트가 아니라 기술, 사람 및 절차의 통합된 전체로 개념화됩니다. Archivematica를 설치하고 맞춤화하기 위한 기술 지원이 필요한 기관의 경우 Artefactual Systems에서 선택적 기술 지원 서비스를 제공합니다.
가치
아카이브매티카의 가치는 디지털 보존 분야의 모범실무를 오픈소스 소프트웨어로 구현하고 확산시킨 점이다. EAD, METS, MODS, PRONOM, DROID, PREMIS, TRAC, OAIS, BagIt, Planets 등 90년대부터 축적된 디지털 보존 분야의 국제적 연구 성과와 소스코드를 재사용하여 하나의 소프트웨어에 집결시킨 것은 주목할 만한 성과이다. 실제로 아카이브매티카에는 수십 종의 오픈소스 컴포넌트들이 재사용되었으며, AtoM, DSpace, Fedora, ContentDM, ArchivesSpace 등 디지털 아카이브에서 주로 이용되는 소프트웨어들과 연계하여 디지털 객체를 처리하도록 기능이 구현되었다. 모범실무와 최신기술을 기민하게 반영하기 위한 소프트웨어 아키텍처와 개발방식 또한 적용했다. 시장에 존재하는 다양한 오픈소스 툴들을 컴포넌트로 느슨하게 연결하기 위해 파이썬 기반의 마이크로 서비스 아키텍처를 구현하였고, 반복하여 테스트하고 자주 배포하는 애자일 개발방식을 도입하였다. (출처: 안대진. (2019). 기록시스템의 오픈소스 전략 연구. 박사학위논문. 명지대학교 기록정보과학전문대학원, 기록관리전공.)
개발 배경
2007년 UNESCO는 “오픈소스 리포지터리와 보존시스템의 방향(Towards an Open Source Repository and Preservation System)"이라는 보고서에서 OAIS를 준수하는 오픈소스 기반의 디지털 보존시스템이 필요함을 제안하고 있다. 디지털 객체를 처리하는 단순한 툴들이 많으므로 약간의 작업을 통해 오픈소스 보존 시스템이 만들어질 수 있으며, 이 툴은 전 세계의 커뮤니티와 기관에 큰 혜택을 줄 것이라는 것이다(Bradley, K., Lei, J., & Blackall, C., 2007). 이 보고서에 따라 유네스코는 여러 기능을 한 시스템에서 구현할 수 있는 시스템인 아카이브매티카의 개발자금을 아티팩추얼에 지원하기로 했다. 비슷한 시점에 디지털 보존 시스템을 개발하려 했던 캐나다의 밴쿠버시아카이브와 아카이브 프로토타입을 구상하던 국제통화기금(IMF) 아카이브 역시 아카이브매티카의 개발을 위해 아티팩추얼과 파트너 계약을 체결했다. ICA-AtoM과 마찬가지로 바운티 모델로 오픈소스 프로젝트가 시작된 것이다. 파트너 기관들은 개발비용을 지원하기도 하지만 내부 개발인력이나 인프라 등의 자원을 제공하고 프로젝트의 방향을 논의하는 거버넌스의 주체로도 활동한다.
아카이브매티카 프로젝트는 유네스코의 기금과 개발사인 아티팩추얼이 체결한 두 건의 계약을 통해 초기 개발자금과 인력을 마련했다. 전체 개발자금의 액수는 파악할 수 없으나 밴쿠버시아카이브 프로젝트의 경우 2008년 11월부터 2010년 12월까지 2년간 73만 US달러가 소요되었다. 밴쿠버시는 ERDMS 개발자금이었던 15만 US달러와 올림픽기금(Olympic Legacy Fund) 58만 US달러를 조달했다. 프로젝트에 가장 먼저 참여한 밴쿠버시아카이브는 시의 전자문서시스템(ERDMS)과 기록관리시스템(VanDocs), 산하기관의 다양한 시스템에 보관되어 있는 디지털 기록, 그리고 아카이브가 통제할 수 없는 민간의 개인기록들을 영구 보존하고 접근을 제공해야 하는 과제에 직면해 있었다. 프로젝트팀은 공공기록과 개인기록 보존으로 프로젝트 개발 단계를 나누고 각 사례별로 OAIS 기능 모델을 유스케이스 시나리오로 작성한 후 프로토타입으로 구현하는 데 성공했다. 예를 들어 무결성 체크, 파일포맷 식별, 바이러스 체크, 메타데이터 추출과 처리, 포맷 변환, 접근 제공 등의 순으로 처리의 단계를 구분하고 각 단계를 구현할 수 있는 오픈소스 컴포넌트 23종을 하나의 소프트웨어로 묶는 식이었다. 밴쿠버시아카이브의 사례는 InterPARES3 프로젝트 보고서의 케이스스터디 16에 상세히 소개되어 있다(The InterPARES 3 Project. 2014).
밴쿠버시아카이브의 프로젝트 1단계가 종료된 후 2010년에는 프로젝트의 리더가 개발 성과를 논문으로 발표하고 국제 학술 세미나에 참석하여 아카이브매티카를 전 세계의 보존 커뮤니티에 소개했다. 이러한 노력을 바탕으로 더 많은 기관 파트너가 기능 구현을 위한 자금을 제공했다. 뿐만 아니라 학술 세미나는 디지털 큐레이션 커뮤니티로부터 시스템 개선을 위한 다양한 조언을 얻었다. 2011년에는 v1.0이 공식 릴리즈되었고 이후 IMF 아카이브, 뉴욕현대미술관(MoMA) 등의 수많은 개별 프로젝트가 이어지며 발전하고 있다. 2023년 전 세계 학술기관, 국제기구, 국공립아카이브에서 활용되고 있다. (출처: 안대진. (2019). 기록시스템의 오픈소스 전략 연구. 박사학위논문. 명지대학교 기록정보과학전문대학원, 기록관리전공.)
기술 아키텍처 1) Microservices, External Tools, Workflow
Archivematica는 디지털 보존에 대한 마이크로서비스 접근 방식을 구현합니다. Archivematica 마이크로서비스는 OAIS 정보 패키지(SIP(Submission Information Package), AIP(Archival Information Package), DIP(Dissemination Information Package))와 같은 개념적 엔터티를 실행하기 위해 시스템 작업을 세분화한 것입니다. 정보 패키지의 물리적 구조에는 파일, 체크섬, 로그, 제출 문서, XML 메타데이터 등이 포함됩니다.
이러한 정보 패키지는 일련의 마이크로서비스를 사용하여 처리됩니다. 마이크로서비스는 Python 스크립트와 Archivematica 시스템에 번들로 제공되는 무료 오픈소스 외부 도구 의 조합으로 제공됩니다. 각 마이크로 서비스는 성공 또는 오류 상태를 검토한 후 다음 마이크로 서비스에서 적절하게 처리됩니다.
Archivematica 마이크로서비스 개념도
디지털 개체 입수부터 접근 제공까지 다양한 마이크로서비스를 사용자 지정 워크플로우로 연결하는 데 여러 매커니즘을 사용합니다.
High-level Overview of Archivematica Technical Architecture
기술 아키텍처 2) Web Dashboard
웹 대시보드를 통해 사용자는 Archivematica 워크플로 프로세스를 처리, 모니터링 및 제어할 수 있습니다. Python 기반 Django MVC 프레임워크를 사용하여 개발되었습니다. 대시보드는 시스템 이벤트의 상태를 보고하고 특정 마이크로서비스를 더 간단하게 제어하고 트리거할 수 있는 다중 사용자 인터페이스를 제공합니다. 이 인터페이스를 통해 사용자는 메타데이터를 쉽게 추가 또는 편집하고, AIP 및 DIP 스토리지를 조정하고, 보존 계획 정보를 제공할 수 있습니다. 알림에는 오류 보고서, MCP 작업 모니터링 및 워크플로의 수동 승인이 포함됩니다.
Archivematica 웹 대시보드
기술 아키텍처 3) Format Policy
Archivematica는 마이그레이션 및 에뮬레이션 전략을 지원하기 위해 수집된 모든 파일의 원래 포맷을 유지합니다. 그러나 기본 보존 전략은 수집 시 파일을 보존 및 액세스 포맷으로 변환하는 것입니다. Archivematica는 파일 형식을 포맷 정책(예: 텍스트, 오디오, 비디오, 래스터 이미지, 벡터 이미지 등)으로 그룹화합니다. Archivematica의 보존 포맷은 모두 개방형 표준이어야 합니다. 또한 포맷 선택은 커뮤니티 모범 사례, 무료 및 오픈 소스 변환 도구의 가용성, 각 미디어 유형의 중요한 특성 분석을 기반으로 합니다. 서비스용 포맷의 선택은 주로 해당 파일 포맷에 대한 웹 뷰어를 쉽게 사용할 수 있는지를 기반으로 합니다.
v1.0 공개 이후 Archivematica 포맷 정책은 구조화된 온라인 포맷 정책 레지스트리(FPR)로 이동되었습니다. FPR은 Archivematica에 대한 기본 보존 포맷 및 서비스용 포맷 정책에 도달하기 위해 중요한 특성 분석, 위험 평가 및 변환 도구 정보와 포맷 식별 정보를 결합합니 다.
기술 아키텍처 4) SIP - AIP - DIP
Archivematica의 주요 기능은 디지털 전송(액세스된 디지털 객체)을 처리하고, 이를 SIP로 전환하고, 포맷 정책을 적용하고, METS , PREMIS 및 Bagit 을 사용하여 저장소 독립적인 고품질 보관 정보 패키지(AIP)를 생성하는 것 입니다. Archivematica는 AtoM 과 함께 번들로 제공될 수 있지만 설명 메타데이터 및 웹 지원 액세스 사본을 포함하는 DIP(Dissemination Information Packages)를 모든 액세스 시스템(예: DSpace, ContentDM 등)에 업로드하도록 설계되었습니다.
기술 아키텍처 5) Single Installation
Archivematica는 Linux, 가상 머신 또는 전용 하드웨어에 설치할 수 있습니다. 한 번의 설치로 전체 디지털 보존 도구 제품군을 사용할 수 있습니다. Archivematica의 클라이언트/서버 처리 아키텍처를 통해 다중 노드 분산 처리 구성으로 배포하여 리소스 집약적인 대규모 프로덕션 환경을 지원합니다.
거버넌스
아카이브매티카의 비즈니스모델은 AtoM과 마찬가지로 커뮤니티 기반의 코드 기부 모델이다. 파트너로 참여한 전 세계의 기관들은 개별적인 파일럿 프로젝트를 통해 아카이브매티카를 커스텀 개발하였고 그 결과물의 소스코드가 아카이브매티카로 축적되며 발전하는 형태이다. 초기 개발 이후 캐나다의 Artefactual Inc.가 개발을 주도하고 있으며 개발 파트너가 후원하는 기능과 개선사항이 우선 개발된다.
Artefactual의 Justin Simpson 명함
MOWCAP 국제컨퍼런스(2019)에서 한국의 OSS 사례를 소개하는 안대진 대표
라이선스
아카이브매티카는 강력한 카피레프트 라이선스인 AGPLv3를 적용하고 있다. AGPLv3는 배포 시 네트워크 서비스 포함 전체 소스코드를 공개하도록 하고 있다. ICA-AtoM과 마찬가지로 커뮤니티가 주도하는 개발 모델에서는 여러 기관의 개별 프로젝트 산출물이 지속적으로 공개되어 축적될 필요가 있기 때문이다. 소스코드 및 도큐멘테이션은 홈페이지(http://archivematica.org)와 깃허브 사이트(https://github.com/artefactual/archivematica) 를 통해 공개하고 있다. 현재 아카이브매티카의 최신버전은 v1.13, 스토리지 서비스는 v0.19이다.
기능
Transfer(이관)
•
전송 탭은 Archivematica 전송이 시작되는 곳입니다. 전송 위젯과 함께 이 탭에는 전송이 SIP(제출 정보 패키지)가 되도록 준비하기 위해 콘텐츠에 따라 작동하는 마이크로서비스 및 작업이 표시됩니다.
Backlog(백로그)
•
백로그 탭은 Archivematica 백로그에 추가된 콘텐츠를 표시하고 사용자가 백로그 위치에서 전송을 검색, 다운로드 및 삭제할 수 있도록 합니다.
Appraisal(평가)
•
평가 및 정리 탭은 백로그에 배치된 자료를 분석하고 정리하는 데 사용됩니다. ArchivesSpace의 리소스에 직접 자료를 정렬하는 데 사용할 수도 있습니다.
Ingest(입수)
•
입수 탭에는 SIP를 AIP 또는 DIP로 전환하기 위해 발생하는 마이크로서비스 및 작업이 표시됩니다. 이 탭에는 백로그 위젯도 포함되어 있습니다.
Archival Storage(아카이브 스토리지)
•
아카이브 스토리지 탭에는 Archivematica 파이프라인에서 처리한 AIP와 AIP 크기, UUID 및 저장된 날짜와 같은 관련 메타데이터가 표시됩니다.
Access(접근)
•
Archivematica의 액세스 통합 대부분은 Ingest 탭 내에서 이루어집니다. 액세스 탭에는 AtoM으로 전송된 DIP가 표시됩니다.
Preservation Planning(보존계획)
•
보존 계획 탭은 Archivematica가 파일 형식을 처리하는 방법을 제어하는 광범위한 형식 데이터베이스인 FPR(Format Policy Registry)에 대한 사실상의 사용자 인터페이스입니다. Preservation Planning 탭에서는 사용자가 Archivematica를 통해 보존된 콘텐츠에 작용하는 정규화, 특성화, 검증 및 기타 도구 및 워크플로우에 대한 형식 정책을 추가하거나 편집할 수 있습니다.
Administration(관리)
•
관리 탭에서는 관리 사용자가 처리 구성, 전송 및 저장 위치, DIP 업로드 구성을 설정하고 무엇보다도 사용자를 추가 및 제거할 수 있습니다.
Metadata(메타데이터)
•
Archivematica는 여러 메타데이터 표준을 사용합니다. 이 섹션에서는 Archivematica가 이를 구현하고 사용하는 방법을 설명합니다.
Translations(번역)
•
Archivematica 1.6.1부터 커뮤니티는 Archivematica 문서, 인터페이스 및 스토리지 서비스를 다른 언어로 번역하는 데 시간과 노력을 자원하여 프로젝트를 지원할 수 있었습니다.
소개자료
데모(안대진 서버)
•
◦
로그인: admin / ****#M*****
•
데모(이대서울대 서버)
•
로그인: admin / A******h**!
•
패키지 확인방법:
◦
1) 대시보드 페이지의 Archival Storage 탭에서 확인
◦
QnA
Q1.오픈소스의 보안 문제는 없나??
•
Artefactual사가 Archivematica를 사용하는 기관 정보에 접근할 수 있나?
•
Microsoft가 Office365를 사용하는 기관 정보에 접근할 수 있나?
•
Google이 Google Cloud를 사용하는 기관 정보에 접근할 수 있나?
•
Amazon이 AWS를 사용하는 기관 정보에 접근할 수 있나?
미술관 정도는 괜찮은데 국가 대표기관이 오픈소스를 사용하는 건 주저되지 않을까?
→ 보안 문제는 두 가지로 해석해 볼 수 있다. 1)OSS는 소스가 공개되어 해커가 취약점을 쉽게 발견하는 측면도 있을 것이다. 반면 잠재된 보안 이슈가 빨리 드러나 대응되는 장점도 있다. 실제로 2022년 Log4j처럼 범용 오픈소스 프로젝트에서도 심각한 보안 이슈가 발생하여 전 세계의 웹서버에 영향을 미쳤다. 상용 소프트웨어의 경우 잠재된 보안취약점이 일찍 발견하지 않고 출시되어 큰 사고로 이어지기도 한다. 소프트웨어의 보안 이슈는 오픈소스냐 상용이냐 상관없이 중요한 문제이다. 2)또 하나의 이슈는 민간 클라우드 서비스나 소프트웨어 밴더를 신뢰할 수 있느냐는 것이다. 구글 드라이브에 중요기록을 업로드하면 빅브라더 구글이나 Amazon이 중요정보에 접근할 위험이 있지 않느냐는 것이다. NARA의 연방정부기록관리시스템인 ERA는 AWS의 스토리지를 사용한다. 미국 국토부, 외교부 등 중요기관의 기록이 Amazon의 스토리지에 저장되는 것이다. 해외 기록관리기관들은 빅브라더의 접근 위험보다는 민간클라우드의 효율성을 택한 것 같다. 그리고 구글이나 아마존은 기록관리의 친구이자 영원히 함께 할 동료로 인식하는 게 좋지 않을까?
오픈소스의 보안 문제는 국내 기록관리기관들이 아카이브시스템 도입 시 가장 많이 우려하는 지점이다. 위 설명했듯이 오픈소스 도입의 가장 큰 장벽은 보안보다는 전문업체 부족이다. 보안 이슈를 포함하여 해당 오픈소스를 잘 다루고 국내 기관이 도입하여 안정적으로 사용하도록 지원할 역량을 가진 전문업체가 필요하다.
Q2.시립미술관, 나비아트센터 등은 이미 Archivematica 의 존재를 인지하고 사용하고 있지 않을까?
—> 인지하고 있을 수 있으나 수준있는 아카이브시스템을 사용하고 있진 않다. 소장자료 목록 관리도 체계적으로 못하고 있는 문화예술기관들도 많다.
12주. 디지털 보존분야 OSS – Archivematica (2) + 특강
Archivematica 설치
Archivematica 설치(특강. 이기영)
Archivematica 설정
13주. 휴강(과제대체)
14주. 디지털 보존분야 OSS – Archivematica (3)
Archivematica 실습 – Transfer, Backlog, Appraisal, Ingest, Archival Storage, Access, Prreservation Planning, Administration
Transfer(이관)
Backlog(백로그)
Appraisal(평가)
Ingest(입수)
Archival Storage(아카이브 스토리지)
Access(접근)
Preservation Planning(보존계획)
Administration(관리)
워크플로우 추가하기
AtoM 연결하기
패키지 확인하기
토론
Q. Archivematica를 왜 쓸까? Preservica와 같은 편한 툴이 있는데..
•
서비스 지역이 다름. Preservica는 유럽, Archivematica는 북미
•
아시아는 우선 장기보존에 대한 인식 부족, OAIS 등 해석, 적용 노력 부족, 소프트웨어 조달방법 후진적
Q. Archivematica 장점
•
체계적 보존, 로그정보, 워크플로우
Q. Archivematica 단점
•
잦은오류 발생, 사용이 어렵다
GPT for Google Sheets and Docs
15주. 팀별 성과발표(과제제출로 대체)
수업 만족도 조사