바로가기메뉴

본문 바로가기 주메뉴 바로가기

logo

검색어: dataset, 검색결과: 4
초록보기
초록

이 연구에서는 토픽 모델링 결과 해석의 용이성을 위하여, 동적 인용 네트워크를 활용하여 LDA 기반 토픽 모델링의 토픽 수를 설정하고 중복 배치된 주요 키워드를 자아 중심 네트워크 분석을 통해 재배치하여 제시하는 방법을 제안하였다. ‘White LED’ 두 분야의 논문 데이터를 이용하여 분석한 결과, 동적 인용 네트워크 분석을 통해 형성된 분석대상 문헌집단에 혼잡도에 따른 토픽수를 사용하고 중복 분류된 토픽 내 주요 키워드를 자아중심 네트워크 분석 기법을 적용하여 재배치한 결과가 토픽 간의 중복도가 가장 낮은 것으로 나타났다. 따라서 동적 인용 네트워크 및 자아 중심 네트워크 분석을 적용함으로써 토픽모델링에 의한 분석 결과를 보완하는 다면적인 연구 동향 분석이 가능할 것으로 보인다.

Abstract

The combined approach of using ego-centric network analysis and dynamic citation network analysis for refining the result of LDA-based topic modeling was suggested and examined in this study. Tow datasets were constructed by collecting Web of Science bibliographic records of White LED and topic modeling was performed by setting a different number of topics on each dataset. The multi-assigned top keywords of each topic were re-assigned to one specific topic by applying an ego-centric network analysis algorithm. It was found that the topical cohesion of the result of topic modeling with the number of topic corresponding to the lowest value of perplexity to the dataset extracted by SPLC network analysis was the strongest with the best values of internal clustering evaluation indices. Furthermore, it demonstrates the possibility of developing the suggested approach as a method of multi-faceted research trend detection.

초록보기
초록

네트워크 분석이 확산되면서 매개중심성이나 연결정도중심성과 같은 다양한 중심성 지수가 개발되어 활용되고 있으나, 가중 네트워크에서 지역중심성을 측정할 수 있는 지수로는 최근접이웃중심성 이외에는 거의 알려져 있지 않다. 이 연구에서는 가중 네트워크를 위한 일반화된 지역중심성 지수인 이웃중심성 지수를 새롭게 제안한다. 이웃중심성 지수는 파라미터 α를 사용하여 이진 네트워크를 위한 연결정도중심성 지수와 가중 네트워크를 위한 최근접이웃중심성 지수를 일반화한 것이다. 6가지 실제 네트워크 데이터를 대상으로 하여 제안된 지수의 특징과 적정 파라미터 값을 살펴보는 실험을 수행하고 결과를 보고하였다.

Abstract

While there are several measures for node centralities, such as betweenness and degree, few centrality measures for local centralities in weighted networks have been suggested. This study developed a generalized centrality measure for calculating local centralities in weighted networks. Neighbor centrality, which was suggested in this study, is the generalization of the degree centrality for binary networks and the nearest neighbor centrality for weighted networks with the parameter α. The characteristics of suggested measure and the proper value of parameter α are investigated with 6 real network datasets and the results are reported.

3
김수연(연세대학교) ; 송성전(연세대학교 문헌정보학과) ; 송민(연세대학교) 2015, Vol.32, No.1, pp.135-152 https://doi.org/10.3743/KOSIM.2015.32.1.135
초록보기
초록

Abstract

The goal of this paper is to explore the field of Computer and Information Science with the aid of text mining techniques by mining Computer and Information Science related conference data available in DBLP (Digital Bibliography & Library Project). Although studies based on bibliometric analysis are most prevalent in investigating dynamics of a research field, we attempt to understand dynamics of the field by utilizing Latent Dirichlet Allocation (LDA)-based multinomial topic modeling. For this study, we collect 236,170 documents from 353 conferences related to Computer and Information Science in DBLP. We aim to include conferences in the field of Computer and Information Science as broad as possible. We analyze topic modeling results along with datasets collected over the period of 2000 to 2011 including top authors per topic and top conferences per topic. We identify the following four different patterns in topic trends in the field of computer and information science during this period: growing (network related topics), shrinking (AI and data mining related topics), continuing (web, text mining information retrieval and database related topics), and fluctuating pattern (HCI, information system and multimedia system related topics).

4
표순희(성균관대학교 정보관리연구소) ; 김윤형((주)기술과가치) ; 김혜선(한국과학기술정보연구원) ; 김완종(한국과학기술정보연구원) 2015, Vol.32, No.2, pp.63-86 https://doi.org/10.3743/KOSIM.2015.32.2.063
초록보기
초록

본 연구는 최근 많은 이슈가 되고 있는 빅데이터를 도서관 분야에 적용하여 다양한 형태의 도서관 빅데이터의 활용 가치에 대한 이해를 높이고 이에 대한 수요자의 요구 분석을 바탕으로 공공도서관 빅데이터 서비스 모형을 개발하는 것을 목적으로 하고 있다. 이를 위해 도서관 빅데이터의 개념과 내용 및 가치 등을 고찰하고, 도서관 빅데이터 서비스에 대한 수요 분석을 바탕으로 도서관 빅데이터 서비스 모형을 개발하였다. 서비스 모형 개발을 위해 도서관 빅데이터의 유형에 따라 활용 가능한 도서관 빅데이터를 분석하였으며, 수요자의 요구를 다양한 방법으로 도출하였다. 수요자의 요구 분석은 도서관계 연구자 및 현장 사서와의 심층인터뷰, 표적집단인터뷰(Focus Group Interview, 이하 FGI), 사서 및 이용자 설문조사를 통해 이루어졌다. 이를 바탕으로 총 16개의 도서관 빅데이터 서비스 모형을 정의하고, 서비스의 필요성, 시급성, 개발 가능성을 고려해 최종적으로 사서 의사결정 지원 서비스와 이용자 도서 추천 및 독서이력 관리 서비스 모형을 개발하였다.

Abstract

Big data refers to dataset whose size is beyond the ability of typical database software tools to capture, store, manage, and analyze. And now it is considered to create the new opportunity in every industry. The purpose of this study is to develop of big data services in public library for improved library services. To this end, analysed the type of library big data and needs of stockholders through the various methods such as deep interview, focus group interview, questionnaire. At first step, we defined the 16 big data service models from interview with librarians, and LIS professions. Second step, it was considered necessity, timeliness, possibility of development. We developed the final two services called on ‘Decision Support Services for Public Librarians’ and ‘Book Recommendation Services for Users.’

정보관리학회지