바로가기메뉴

본문 바로가기 주메뉴 바로가기

logo

오픈소스 도구를 이용한 기록정보 링크드 오픈 데이터 구축 절차 연구

A Study on the Procedure for Constructing Linked Open Data of Records Information by Using Open Source Tool

정보관리학회지 / Journal of the Korean Society for Information Management, (P)1013-0799; (E)2586-2073
2017, v.34 no.1, pp.341-371
https://doi.org/10.3743/KOSIM.2017.34.1.341
하승록 (명지대학교 기록정보과학전문대학원 기록관리전공)
임진희 (서울특별시청)
이해영 (명지대학교)
  • 다운로드 수
  • 조회수

초록

웹을 통해 제공되는 서비스는 현재 문서중심에서 데이터 중심으로 변화를 겪고 있으며, 그 변화의 중심에는 Linked Open Data(LOD)가 존재한다. 본 연구는 이러한 흐름에 부응하여 기록정보의 LOD 구축을 위한 구체적인 절차와 방법을 살펴보고자 하였다. 또한 소규모 아카이브의 서비스 지속가능성을 염두에 두고, 오픈소스 소프트웨어를 활용하여 LOD 구축 절차를 진행하는 범례를 제시하고자 했다. 이에 본 연구에서는 LOD 구축을 위한 5단계의 프레임워크를 제안했다. 그리고 일상아카이브인 ‘인간과 기억 아카이브’의 일기 기록물 컬렉션을 수집하여, 제안된 5단계 프레임워크에 따라 오픈소스 소프트웨어인 Protege와 Apache Jena Fuseki를 활용하여 POC(Proof of concept)를 진행하였다. 오픈소스를 활용하여 기록정보의 LOD를 구축한 뒤, 상호연결(Interlinking)과 SPARQL 검색을 통해서 외부 LOD와 연결되는 모습을 확인할 수 있었다. 또한 기록정보의 LOD 구축 절차 진행과정의 경험을 바탕으로 내용정보 기술의 품질 향상, 아키비스트의 역량 고도화, 기록정보의 접근성 향상을 위한 상호연결 고도화, LOD 서비스의 수준 결정, LOD 구축을 위한 도구 선정 등, 기록관 LOD 구축을 위한 필요요건을 제시했다.

keywords
records information, Linked Open Data, LOD, ontology, open source tool, Protege, Apache Jena, 기록정보, 링크드 오픈 데이터, 온톨로지, 오픈소스 도구, Protege, Apache Jena

Abstract

Recently, the web service environment has changed from document-centered to data-oriented focus, and the Linked Open Data(LOD) exists at the core of the new environment. Specific procedures and methods were examined to build the LOD of records information in accordance with this trend. With the service sustainability of small-scale archive in consideration, an exemplification on LOD building process by utilizing open source software was developed in this paper. To this end, a 5-step service framework for LOD construction was proposed and applied to a collection of diary records from ‘Human and Memory Archive’. Proof of Concept(POC) utilizing open source softwares, Protege and Apache Jena Fuseki, was conducted according to the proposed 5 step framework. After establishing the LOD of record information by utilizing the open source software, the connection with external LOD through interlinking and SPARQL search has been successfully performed. In addition, archives’ considerations for LOD construction, including improvement on the quality of content information, the role of the archivist, were suggested based on the understanding obtained through the LOD construction process of records information.

keywords
records information, Linked Open Data, LOD, ontology, open source tool, Protege, Apache Jena, 기록정보, 링크드 오픈 데이터, 온톨로지, 오픈소스 도구, Protege, Apache Jena

참고문헌

1.

곽건홍. (2011). 일상 아카이브(Archives of everyday life)로의 패러다임 전환을 위한 소론. 기록학연구, (29), 3-33.

2.

김성혁. (2011). 도서관 자료 공개와 활용을 위한 링크드 데이터 기술. 국회도서관보, 48(3), 24-33.

3.

김영천. (2011). 온톨로지를 이용한 시맨틱 웹 기술의 사례연구 : 지리영역 사례중심으로.

4.

김은경. (2004). 시맨틱웹을 위한 온톨로지 구축방법에 관한 비교연구.

5.

노상규. (2007). 온톨로지:가즈토이.

6.

박옥남. (2012). 기록물 전거통제 기반 Linked Data 구축에 대한 연구. 한국비블리아학회지, 23(2), 5-25.

7.

박종호. (2011). 온톨로지(Ontology) 기반 한국어 동사 의미망 구축 방법 연구.

8.

박현근. (2005). OWL 시멘틱웹 기반 온톨로지 상에서의 규칙-사실 생성에 관한 추론.

9.

안대진. (2015). AtoM 시스템의 구축과 커스터마이징 방법에 관한 연구. 기록학연구, (45), 5-50.

10.

안세열. (2011). 온톨로지 기반 지식 검색 시스템 개발 : KT 콜센터 사례.

11.

이병길. (2013). 새마을운동 기록물의 개체기반 온톨로지 검색시스템 설계 및 평가. 한국기록관리학회지, 13(3), 67-97. http://dx.doi.org/10.14404/JKSARM.2013.13.3.067.

12.

이유빈. (2017). 온톨로지 기반의 기록물 검색 시스템을 위한 인터페이스 제안. 한국기록관리학회지, 17(1), 217-244. http://dx.doi.org/10.14404/JKSARM.2017.17.1.217.

13.

이정현. (2015). Linked Open Data기반 대통령기록관 기록정보 서비스 확장에 관한 연구. 한국기록관리학회지, 15(2), 55-82. http://dx.doi.org/10.14404/JKSARM.2015.15.2.055.

14.

이현정. (2015). 링크드 데이터 활용을 위한 멀티소스 검색시스템 구축에 관한 연구.

15.

정갑주. (2015). JENA ARQ and FUSEKI Basics. https://www.youtube.com/watch?v=8F3TWJvgmBU.

16.

최효진. (2015). 개인 일기의 연구 자료로서의 가치와 전망 : “5월12일 일기컬렉션”을 중심으로. 기록학연구, (46), 95-152.

17.

하상범. (2005). Owl 기반의 sparql을 이용한 시맨틱 검색 (706-708). 한국정보과학회 학술발표논문집.

18.

한국정보화진흥원 지식자원활용부. 2014 링크드오픈데이터 국내 구축 사례집.

19.

한국정보화진흥원 지식자원활용부. 링크드 데이터 구축 공정 가이드 v1.0.

20.

한상은. (2014). 오픈데이터의 링크드데이터(Linked Data) 발행방법 간 유용성 비교평가에 관한 연구 : RDF 트리플 저장소와 RDB-to-RDF를 이용한 LD발행방법을 중심으로.

21.

Antoniou, G.. (2008). A semantic web primer:MIT Press.

22.

Bauer, F.. (2011). Linked open data: The essentials. https://www.semantic-web.at/LOD-TheEssentials.pdf.

23.

Berners-Lee, T.. (2006). Linked data. https://www.w3.org/DesignIssues/LinkedData.html.

24.

Berners-Lee, T.. (2009). The next web. https://www.ted.com/talks/tim_berners_lee_on_the_next_web.

25.

Berners-Lee, T.. (2001). The semantic web. Scientific American, 284(5), 28-37.

26.

Gracy, K. F.. (2015). Archival description and linked data: A preliminary study of opportunities and implementation challenges. Archival Science, 15(3), 239-294.

27.

Gruber, T. R.. (1993). A translation approach to portable ontology specifications. Knowledge Acquisition, 5(2), 199-220.

28.

Josef, H.. (2016). Cellfie-plugin user's guide. https://github.com/protegeproject/cellfie-plugin/wiki/User%27s-Guide.

29.

Heath, T.. (2011). Linked data: Evolving the Web into a global data space:Morgan & Claypool.

30.

Noy, N. F.. (2001). Ontology development 101: A guide to creating your first ontology. http://www.ksl.stanford.edu/people/dlm/papers/ontology-tutorial-noy-mcguinness.pdf.

31.

O’connor, M. J.. (2010). Mapping master: A flexible approach for mapping spreadsheets to OWL. In Patel-Schneider P.F. et al. (Eds.). The semantic Web – ISWC 2010. ISWC 2010. Lecture Notes in Computer Science, 6497, -.

32.

공공데이터포털 홈페이지. https://www.data.go.kr.

33.

인간과기억아카이브 홈페이지. http://hmarchives.org/.

34.

주소데이터LOD 제주도 웹페이지. http://jusodata.kr/resource/Jeju-do.

35.

한국관광공사LOD 제주도 웹페이지. http://data.visitkorea.or.kr/resource/CATEGORY:390000.

36.

한국사LOD 홈페이지. http://lod.koreanhistory.or.kr/lodIntro.do.

37.

DBPedia 제주도 웹페이지. http://ko.dbpedia.org/page/제주도.

38.

KData 제주도 웹페이지. http://data.kdata.kr/administrative_section/Jeju.

39.

Mass Observation 프로젝트 홈페이지. http://www.massobs.org.uk/write-for-us/12th-may.

40.

Omeka Homepage. http://omeka.org.

정보관리학회지