바로가기메뉴

본문 바로가기 주메뉴 바로가기

logo

  • P-ISSN1013-0799
  • E-ISSN2586-2073

디지털도서관 구축과정에서 TREC 텍스트 문서의 시각적 표현에 관한 연구

A Study on the Visual Representation of TREC Text Documents in the Construction of Digital Library

정보관리학회지, (P)1013-0799; (E)2586-2073
2004, v.21 no.3, pp.1-14
https://doi.org/10.3743/KOSIM.2004.21.3.001
정기태 (Assistant Professor University of Oklahoma School of Library and Information Studies)
박일종 (계명대학교)

  • 다운로드 수
  • 조회수

초록

이용자들은 유사문서를 검색할 때, 각 가지 문서의 시각적표현을 통하여 도움을 얻게 되며, 모든 정보검색에 관한 연구는 이용자들의 다양한 요구를 충족시키기 위한 여러 가지의 해결책을 제시하고 있다. 제안되어진 해결책은 알파벳 순서로 만들어 진 파피루스 문서로부터 카드목록, 마이크로 필름을 이용한 저장, 컴퓨터 디스크를 이용한 파일 보관 등에 이르기까지 다양한 방법들을 들 수 있을 것이다. 또한 대부분의 정보검색 시스템들은 Document Surrogate(문헌을 대체할 수 있는 것들), 즉 요약문, 목차, 초록, 리뷰한 내용, 기계가독형목록(MARC) 기록물 등과 같은 서지자료들을 전체논문을 대체하여 이용하게 된다.본 논문에서는 또 다른 형태의 Document Surrogate로서 용어 리스트의 집단화 방법을 이용해서 찾아보았다. 이 Document Surrogate들은 Multidimensional Scaling (MDS)을 이용해서 2차원 그래프 위에 좌표로써 표현되어지고 있다. 사용된 2차원의그래프 위에서 좌표간의 거리는 문헌들의 유사성을 나타낸다고 해석할 수 있으며 거리가 가까우면 가까울수록 두 문서는 더욱 유사한내용을 포함하고 있다고 해석할 수 있는 것으로 밝혀졌다.

Abstract

Visualization of documents will help users when they do search similar documents, and all research in information retrieval addresses itself to the problem of a user with an information need facing a data source containing an acceptable solution to that need. In various contexts, adequate solutions to this problem have included alphabetized cubbyholes housing papyrus rolls, microfilm registers, card catalogs and inverted files coded onto discs. Many information retrieval systems rely on the use of a document surrogate. Though they might be surprise to discover it, nearly every information seeker uses an array of document surrogates. Summaries, tables of contents, abstracts, reviews, and MARC recordsthese are all document surrogates. That is, they stand infor a document allowing a user to make some decision regarding it, whether to retrieve a book from the stacks, whether to read an entire article, etc.In this paper another type of document surrogate is investigated using a grouping method of term list. Using Multidimensional Scaling Method (MDS) those surrogates are visualized on two-dimensional graph. The distances between dots on the two-dimensional graph can be represented as the similarity of the documents. More close the distance, more similar the documents.

참고문헌

1

박일종. (2000). 디지털 도서관시대에 대비한 도서관자동화시스템의 비교효용성과 개발방향에 대한 연구. 정보관리학회지, 17(2), 207-231.

2

Bartolucci, Alfred. (1986). Multidimensio- nal Scaling and the Information it Conveys.. American Journal of Public Health, 76(7), 747-771.

3

Gazda, George. (1994). Multidimensional Scaling for the 21st Century. Journal of Group Psychotherapy, Psychodrama & Sociometry., 47(2), -.

4

Goodrum, A. (2000). An Open Source Agenda for Research Linking Text and Image Content Features.. Journal of the American Society for Information Science., , -.

5

Jones, Karen Sparck. (2000). Further reflections on TREC.. Information Processing and Management, 36, 37-85.

6

Khorfage, Robert B. (1997). Information Storage and Retrieval.:New York: John Wiley..

7

Lancaster, F.W. (1998). Indexing and Abstracting in Theory and Practice.:Champaign, IL: University of Illinois..

8

Rorvig, M. (1997). Visualization and Scaling of TREC topic document sets.. International Journal of Information Processing and Management, , -.

9

Rorvig, M. (1998). A visualization case study of feature vectorand stemmer effects on TREC topic-document Proceedings of the 1998 Annual Meeting of the American Society for Information Science..

10

Rorvig, M. (2000). Shape recovery: a visual method for evaluation of information retrieval experiments.. Journal of the American Society for Information Science,, 51(13), 1205-1210.

11

Voorhees, Ellen M. (2000). Overview of the Sixth Text Retrieval Conference (TREC-6). Information Processing and Management,, 36, 3-35.

12

Young, F.W. (1987). Multidimensional scaling: History, theory and applications. Hillsdale:NJ: Erlbaum..

정보관리학회지