바로가기메뉴

본문 바로가기 주메뉴 바로가기

logo

검색어: research data, 검색결과: 169
11
박지원(전남대학교 대학원 기록관리학과) ; 장우권(전남대학교) 2021, Vol.38, No.4, pp.199-230 https://doi.org/10.3743/KOSIM.2021.38.4.199
초록보기
초록

이 연구는 연구데이터 재이용에 대한 연구자 및 재이용 데이터를 조사를 통해 연구데이터 재이용 영향에 대한 분석 및 활성화 방안을 제시하는데 있다. 이를 위해 연구데이터를 재이용하여 뉴 연구결과물을 산출한 경험이 있는 국내 사회과학분야 학술 연구자를 대상으로 설문배포와 회수를 토대로 178부를 분석하였다. 그 결과, 1) 대부분의 연구자들은 데이터 리포지터리, 데이터관리시스템, 연구데이터 DB와 같은 시스템을 통해 재이용 데이터를 획득하고, 실험 및 관찰을 통해 생산된 분석데이터를 주로 재이용하는 것으로 나타났다. 또한 성공적으로 연구데이터를 재이용한 연구자임에도 불구하고 연구데이터 공유에 대한 인식이 낮을뿐더러 다양한 문제에 직면하여 공유를 하지 않았다. 2) 문헌 검토와 요인 분석을 통해 도출한 10가지 요인(학문적 유용성, 연구의 효율성, 연구자의 우려사항, 데이터 취약성, 직접적 노력, 간접적 노력, 재이용 적합성, 데이터 완전성, 데이터 유용성, 사회적 조건)의 신뢰성과 타당성을 검증하였다. 3) 상관 분석결과 연구 효율성, 사회적 조건은 연구데이터 재이용 의도와 양적 상관관계가, 연구자의 우려사항, 데이터 취약성, 직접적 노력은 연구데이터 재이용 의도와 음적 상관관계가 나타났다. 회귀 분석 결과 이 요인들은 모두 연구데이터 재이용 의도에 유의미한 영향을 미치는 것으로 나타났으며, 연구의 효율성, 사회적 조건, 직접적 노력, 연구자의 우려사항, 데이터 취약성 순서로 연구데이터 재이용 의도에 영향을 미치는 것으로 나타났다. 이를 토대로 연구데이터 재이용 활성화 방안을 제시하였다.

Abstract

This study is to present an analysis and activation plan for the effect of reuse of research data through investigation of researchers and reuse data on reuse of research data. To this end, 178 copies were analyzed based on the distribution and collection of surveys targeting academic researchers in the field of social science in Korea who have experience in calculating new research results by reusing research data. As a result, 1) Most researchers acquire reuse data through systems such as data repositories, data management systems, and research data DBs, and mainly reuse analysis data produced through experiments and observations. In addition, despite being a researcher who successfully reused research data, the awareness of research data sharing was low and did not share it in the face of various problems. 2) The reliability and validity of 10 factors derived through literature review and factor analysis (academic usefulness, research efficiency, researcher concerns, data vulnerability, direct effort, indirect effort, suitability for reuse, data completeness, data usefulness, and social conditions) were verified. 3) As a result of correlation analysis, research efficiency, social conditions showed a quantitative correlation with research data reuse intention, researcher concerns, data vulnerability, and direct effort showed a negative correlation with research data reuse intention. As a result of regression analysis, all of these factors had a significant effect on the intention to reuse research data, and in the order of research efficiency, social conditions, direct efforts, researchers’ concerns, and data vulnerability. Based on this, a plan to revitalize the reuse of research data was proposed.

초록보기
초록

본 연구는 Figshare를 통해 공유되고 있는 문헌정보학분야 연구데이터의 유형, 주제, 공개 수준 등을 분석하고 재사용성이 상대적으로 높은 데이터의 특성을 통계적으로 해석해 보았다. 분석 결과 데이터의 유형은 dataset과 paper 유형이, 주제 분야는 open access와 research data가 가장 많은 비중을 차지하였으며, 70%에 가까운 연구데이터가 pdf와 같이 편집과 재사용이 원활하지 않은 형태로 공개되어 있는 것으로 조사되었다. 또한 연구데이터의 특성과 활용 정도간의 관계 분석 결과, 주제에 있어서는 APC(Article Processing Charge)를 비롯한 open access 영역이 가장 많이 활용되고 있는 것으로 나타났으며, 데이터 유형에 있어서는 paper의 활용도가 가장 높은 것으로 나타났다.

Abstract

This study analyzed the type, subject and open level of research data in the field of library and information science field shared by Figshare, and statistically analyzed the characteristics of data with relatively high recyclability. The results of the analysis showed that datasets and papers were most common data types, and open access and research data were the most common keywords of data, and that 70% of the data were published in a form that can not be processed mechanically such as pdf. As a result of analysis of the relationship between characteristics of research data and degree of sharing, open access areas such as APC (Article Processing Charge) were found to be most common in the subject. However in data type, gray literature such as paper found to be highly utilized rather than dataset.

13
김성훈(성균관대학교 문헌정보학과) ; 오삼균(성균관대학교 문헌정보학과) 2018, Vol.35, No.2, pp.141-165 https://doi.org/10.3743/KOSIM.2018.35.2.141
초록보기
초록

본 연구의 목적은 연구데이터 관리서비스 구현 시 성공적인 서비스를 위한 고려사항을 도출하는 것이다. 이를 위해 선행연구를 활용하여 연구데이터 관리서비스의 영역을 파악하였고, 미국, 독일, 호주에서 연구데이터 관리서비스를 시행중인 대학도서관 6곳과 1개의 기관에서 담당자 8명을 대상으로 연구데이터 서비스에 관한 질문의 답변을 이메일을 통해 수집하였다. 또 해외서비스를 대상으로 수집한 고려사항이 국내에 적용가능한지 국내 연구데이터 관리서비스 전문가와 검토하였다. 연구데이터 서비스 영역은 총 9개의 카테고리로 구분하여 분석하였는데, 연구서비스와 연구데이터 관리서비스 연계, 국가/대학/기관 차원의 협약, 메타데이터 입력주체 및 필수 요소, 직원의 전문화 방안, 이용자 요구분석을 통한 주요서비스 영역 선정, 연구데이터와 연구결과물의 효과적인 연결방안, 이용자와 유관기관과 긴밀한 공조 등의 연구데이터 관리서비스 구축 시 고려사항을 도출할 수 있었다.

Abstract

The purpose of this study is to determine crucial factors of consideration in ensuring the successful implementation of research data management services. The study begins by extracting a range of service areas from their equivalent in existing research on data management services. It then collects relevant information via e-mail survey from eight individuals respectively overseeing research data management services at six university libraries and one institution located throughout the United States, Germany, and Australia. Having originated in overseas cases, the resulting factors of consideration were reviewed by domestic experts in research data management services. The finalized areas of research data management services consist of nine categories. The crucial factors of consideration in RDM services are connection between research services and research data management services; national/university-level/institutional agreements; metadata entry personnel and required elements; strategies for the provision of specialized staff; major service area selection through user demand analysis; effective linkage between research data and research results; and close cooperation with users and related organizations.

14
배서영(이화여자대학교 일반대학원 문헌정보학과) ; 김지현(이화여자대학교 문헌정보학과 교수) 2023, Vol.40, No.3, pp.25-54 https://doi.org/10.3743/KOSIM.2023.40.3.025
초록보기
초록

오픈 데이터가 국제적인 흐름으로 주목받는 현시점에서 데이터 공유를 지원하는 한국의 국제 학술지 역할에 대한 논의가 이루어질 필요가 있다. 이에 본 연구에서는 국내 발간 국제 학술지의 편집인 설문 조사와 인터뷰를 바탕으로 데이터 공유 정책 도입에 영향을 미치는 요인을 확인하고 해당 학술지 편집인의 데이터 공유 정책 도입 및 구성요소에 대한 인식을 살펴보았다. 그 결과 정책을 도입하였거나 도입할 예정인 학술지에서는 데이터 공유가 국제적인 추세이며 연구발전에 기여할 수 있다는 점을 인식하였지만, 여전히 데이터 공유에 대한 인식 개선 노력이 필요함을 강조하였다. 이에 학술지 및 학술공동체 차원에서의 교육 활동이나 데이터 공유에 따른 보상을 통해 데이터 공유에 대한 인식을 개선할 필요가 있었다. 또한 중요도가 높으며, 필수 구성요소로 편집인의 절반 이상이 선택한 구성요소로 ‘데이터 가용성 표기’, ‘데이터 공유 수준’, ‘데이터 공유 방법’, ‘데이터 인용’이 있었다. 이들 학술지에서 데이터 공유를 반드시 의무화할 필요는 없지만 데이터 가용성 표기를 통해 데이터를 공유할 수 없는 상황에 대해 언급하는 것은 필요하다고 보았다. 국내 상황에 적합한 리포지터리 개발 및 실행을 책임질 기관의 역할 또한 강조되었다. 더불어 정책 도입에 영향을 주는 요인에 따라 정책 도입 비율의 차이를 확인한 결과, 영향력지수 사분위, 출판 유형, 주제 분야에서 유의한 차이가 나타났다. 영향력지수가 높은 학술지는 데이터 공유를 지원하는 자원을 보유할 가능성이 높고 오픈액세스 혹은 하이브리드 학술지는 오픈사이언스의 일환인 오픈 데이터에 관심을 가지는 경향이 있다고 볼 수 있었다. 의학 분야에서는 학술공동체 차원의 데이터 공유를 위한 적극적인 움직임이 데이터 공유 정책 도입을 촉진하였음을 알 수 있었다. 국내에서 학술지 데이터 공유 정책 도입 및 운영을 활성화하는 기초자료로서 본 연구가 활용될 수 있을 것이다.

Abstract

At a time when open data receives attention as an international trend, there is a need to discuss the role of international journals in Korea to support data sharing. Based on surveys and interviews of editors from the international journals, we identified factors affecting the policy adoption and examined the journal editors' perception on the adoption and components of the data sharing policy. As a result, scholarly journals that have adopted or are planning to adopt policies have recognized that data sharing is an international trend and can contribute to research development, but they stressed that efforts to improve the perception of data sharing were still necessary. Educational activities and compensation for sharing data were needed at scholarly journals’ and communities’ level. Also, components perceived important and selected by more than half of the editors as mandatory were ‘data availability statement’, ‘data sharing level’, ‘data sharing method’, and ‘data citation’. While scholarly journals do not always need to mandate data sharing, it was necessary to mention conditions where data cannot be shared through data availability statements. The role of the organization developing and operating a repository appropriate for situations in Korea was also emphasized. In addition, by identifying factors affecting the policy adoption, significant differences were found in Journal Impact Factor quartiles, publication type, and subject area. This finding indicated that journals with a high impact factor are likely to have resources to support data sharing, and open access or hybrid journals are likely to have interest in open data as a part of open science. In the medical research area, active movements for data sharing in academic communities have promoted the adoption of data sharing policies. This study would be used as basic data to facilitate the adopton and operation of scholarly journals’ data sharing policies in Korea.

초록보기
초록

본 연구에서는 북미에서 연구데이터 관리 서비스를 제공하는 121개 대학도서관 중 연구데이터 관리 교육 프로그램을 제공하는 51개 기관을 대상으로 제공되는 교육 프로그램의 내용을 12개 데이터 리터러시 세부 역량에 기반을 두어 분석하고 시사점을 제시하는 것을 목적으로 하였다. 내용 분석을 위해 집합 교육 프로그램의 제목 317개와 온라인 튜토리얼의 상위 목차 제목 42개를 수집하였으며 선행연구에서 제시된 12개 데이터 리터러시 세부 역량에 따라 코딩을 수행하였다. 집합 교육 프로그램 중에서는 데이터 처리 및 분석 역량에 대한 교육 프로그램이 가장 많은 것으로 나타났으며, 가장 많은 수의 기관에서 데이터 관리 및 조직 역량에 대한 교육을 제공하고 있었다. 데이터 시각화 및 표현은 집합 교육 프로그램 중에서 세 번째로 많이 다루어지는 역량이었다. 그러나 나머지 9개 역량에 대한 교육 프로그램은 매우 적은 것으로 나타나 교육 프로그램 내용이 특정 역량에 집중되어 있음을 알 수 있다. 집합 교육 없이 자체 개발한 온라인 튜토리얼을 제공하는 기관은 5곳이었으며 목차 제목을 분석한 결과 데이터 보존, 윤리 및 데이터 인용, 데이터 관리 및 조직 역량에 대한 교육 내용을 중점적으로 다루고 있어 집합 교육 프로그램에서 강조되는 역량과 차이를 보였다. 효과적인 연구데이터 관리 교육 프로그램 운영을 위해서는 대학도서관 사서들이 전통적으로 교육하고 강조해왔던 역량뿐만 아니라 데이터 처리와 분석, 데이터 시각화와 표현 등 연구자들의 연구 결과 도출에 필요한 데이터 리터러시 세부 역량에 대한 이해와 지원이 요청된다. 또한 연구데이터 관리 서비스와 관련된 사서들의 계속 교육을 지원하는 교육 자원의 개발도 필요할 것이다.

Abstract

This study aimed to analyze the content of Records Data Management (RDM) training programs provided by 51 out of 121 university libraries in North America that implemented RDM services, and to provide implications from the results. For the content analysis, 317 titles of classroom training programs and 42 headings at the highest level from the tables of content of online tutorials were collected and coded based on 12 data literacy competencies identified from previous studies. Among classroom training programs, those regarding data processing and analysis competency were offered the most. The highest number of the libraries provided classroom training programs in relation to data management and organization competency. The third most classroom training programs dealt with data visualization and representation competency. However, each of the remaining 9 competencies was covered by only a few classroom training programs, and this implied that classroom training programs focused on the particular data literacy competencies. There were five university libraries that developed and provided their own online tutorials. The analysis of the headings showed that the competencies of data preservation, ethics and data citation, and data management and organization were mainly covered and the difference existed in the competencies stressed by the classroom training programs. For effective RDM training program, it is necessary to understand and support the education of data literacy competencies that researchers need to draw research results, in addition to competencies that university librarians traditionally have taught and emphasized. It is also needed to develop educational resources that support continuing education for the librarians involved in RDM services.

16
박진호(주식회사 리스트 사업개발본부장) ; 고영만(성균관대학교 문과대학 문헌정보학과 교수) ; 김현수(성균관대학교 정보관리연구소 연구원) 2019, Vol.36, No.4, pp.129-159 https://doi.org/10.3743/kosim.pub.36.4.129001
초록보기
초록

본 연구의 목적은 연구데이터 서비스 자체의 유용성과 연구데이터에 대한 사용경험 기반의 유용성 측면에서 평가 모형을 개발하는 것이다. 다양한 사례에서 도출한 데이터 서비스의 유용성 평가 요소로부터 연구데이터에 내재된 평가척도인 검색성, 접근성, 상호운용성, 재활용성 4개와 각각의 측정지표 총 20개를 도출하였다. 그리고 Google Analytics, YouTube 광고료 책정 기준, 서울특별시, Altmetrics의 사례를 분석하여 연구데이터에 대한 이용자 경험 기반의 유용성 측정지표 12개를 도출하였다. 평가척도와 측정지표에 대한 타당성과 신뢰성 검정을 위해 연구데이터의 잠재적 이용자 164명을 대상으로 설문조사를 실시하였다. 평가척도의 타당성 검정을 위해 KMO Bartlett 분석을 하였으며, 측정지표의 성분분석을 위해 주성분 분석과 베리맥스 회전분석법을 사용하였다. 내재적 평가척도의 경우 4개 척도 모두 KMO Bartlett의 타당성 값을 충족시켰으며, 평가척도에 대한 측정지표의 성분분석 결과 모두 단일 성분으로 나타나 현재의 척도로 해당 지표에 대한 설명이 가능하였다. 그러나 이용자 경험 기반의 12개 측정지표의 성분분석 결과는 2개 성분으로 나누어지는 것으로 나타나 각각을 활용도와 참여도라는 개념의 2개 평가척도로 구분하였다. Cronbach’s alpha 계수에 의한 신뢰도 측정 결과 6개의 평가척도 모두 0.6 이상의 측정치를 충족시키는 것으로 나타났다.

Abstract

The Purpose of this study is to develop an evaluation model for usability of research data service from the angles of evaluating usefulness of research data service itself and research data use experience-based usability. First, the various cases of evaluating usability of data services are examined and 4 rating scales and 20 measuring indicators for research data service are derived as a result of comparative analysis. In order to verify validity and reliability of the rating scale and the measuring indicators, the study conducted a survey of 164 potential research data users. KMO Bartlett Analysis was performed for validity test, and Principle Component Analysis and Verimax Rotating Method were used for component analysis on measuring indicators. The result shows that the 4 intrinsic rating scales satisfy the validity criteria of KMO Barlett; A single component was determined from component analysis, which verifies the validity of measuring indicators of the current rating scale. However, the result of 12 user experience-based measuring indicators analysis identified 2 components that are each classified as rating scale of utilization level and that of participation level. Cronbach’s alpha of all 6 rating scales was 0.6 or more for the overall scale.

17
한나은(한국과학기술정보연구원) ; 서수정(한국과학기술정보연구원) ; 엄정호(한국과학기술정보연구원) 2023, Vol.40, No.3, pp.77-98 https://doi.org/10.3743/KOSIM.2023.40.3.077
초록보기
초록

본 연구는 지금까지 제안된 거대언어모델 가운데 LLaMA 및 LLaMA 기반 모델과 같이 연구데이터를 주요 사전학습데이터로 활용한 모델의 데이터 품질에 중점을 두어 현재의 평가 기준을 분석하고 연구데이터의 관점에서 품질 평가 기준을 제안하였다. 이를 위해 데이터 품질 평가 요인 중 유효성, 기능성, 신뢰성을 중심으로 품질 평가를 논의하였으며, 거대언어모델의 특성 및 한계점을 이해하기 위해 LLaMA, Alpaca, Vicuna, ChatGPT 모델을 비교하였다. 현재 광범위하게 활용되는 거대언어모델의 평가 기준을 분석하기 위해 Holistic Evaluation for Language Models를 중심으로 평가 기준을 살펴본 후 한계점을 논의하였다. 이를 바탕으로 본 연구는 연구데이터를 주요 사전학습데이터로 활용한 거대언어모델을 대상으로 한 품질 평가 기준을 제시하고 추후 개발 방향을 논의하였으며, 이는 거대언어모델의 발전 방향을 위한 지식 기반을 제공하는데 의의를 갖는다.

Abstract

Large Language Models (LLMs) are becoming the major trend in the natural language processing field. These models were built based on research data, but information such as types, limitations, and risks of using research data are unknown. This research would present how to analyze and evaluate the LLMs that were built with research data: LLaMA or LLaMA base models such as Alpaca of Stanford, Vicuna of the large model systems organization, and ChatGPT from OpenAI from the perspective of research data. This quality evaluation focuses on the validity, functionality, and reliability of Data Quality Management (DQM). Furthermore, we adopted the Holistic Evaluation of Language Models (HELM) to understand its evaluation criteria and then discussed its limitations. This study presents quality evaluation criteria for LLMs using research data and future development directions.

초록보기
초록

본 연구는 연구자들의 데이터 공유 행위에 대한 이해에 목적을 두고 국내 생명공학분야 연구자와 연구학생을 대상으로 데이터 공유 의도에 영향을 미치는 요인을 살펴보았다. 이메일로 수집된 411개의 유효 응답은 PLS-SEM을 이용하여 분석하였다. 연구 결과, 첫째, 데이터 공유 규범과 학술적 상호주의는 데이터 공유 의도에 직접적으로 긍정적인 영향을 미친 것으로 나타났다. 둘째, 공동체 신뢰는 학술적 상호주의가 공동체 신뢰와 데이터 공유 의도의 매개변인일 때, 데이터 공유 의도에 유의미한 영향을 미치는 것으로 나타났다. 셋째, 학술적 평판은 데이터 공유 규범과 학술적 상호주의, 그리고 데이터 공유 규범과 데이터 공유 의도 간의 관계에서, 학술적 상호주의와 데이터 공유 의도의 관계에서 유의한 조절효과를 보였다. 본 연구는 국내 생명공학 연구자들의 데이터 공유 의도에 영향을 미치는 요인에 대하여 Ostrom의 집단행동이론을 적용하여 살펴보았다는 점과 변인들의 영향 관계 안에서 학술적 평판의 조절효과를 발견하였다는 점에서 그 의의가 있다. 이러한 결과는 연구자들의 데이터 공유 행위를 촉진시킬 수 있는 방안으로 학술적인 보상 시스템의 개발의 필요성을 시사한다.

Abstract

The objective of this study is to investigate the factors which influence biotechnology scientists’ data sharing intention. This study employed Ostrom’s theory of collective action. The target population of this study includes scientists and students of biotechnology field in South Korea. A total of 411 responses which collected by e-mail were used for the final data analysis. The summary of this study is as follows. First, norm of data sharing and academic reciprocity were found to have significant positive influences on data sharing intention directly. Second, perceived community trust was found to have significant positive influences on data sharing intention when academic reciprocity was the mediator. Third, academic reputation showed the moderating effects on the relationship between norm of data sharing and academic reciprocity, and between norm of data sharing and data sharing intention. These findings show that researchers can approach the data sharing behaviors by using the mechanism of trust, norms, reciprocity, and reputation and indicate necessity for a development of academic reputation system to promote more data sharing behaviors of researchers.

19
김지현(이화여자대학교) ; 정은경(이화여자대학교) ; 윤정원(University of South Florida) ; 이재윤(명지대학교) 2017, Vol.34, No.1, pp.7-29 https://doi.org/10.3743/KOSIM.2017.34.1.007
초록보기
초록

학술 커뮤니티 내에서 논문의 인용은 보편적인 규범으로 자리 잡은 데 비해 데이터의 인용은 아직 초보적인 단계에 머물러 있다. 이를 개선하기 위해 제기되고 있는 데이터 인용의 필요성 및 원칙과 가이드라인에 대해서 살펴보았다. 또한 데이터 인용체계 구축 사례에서는 데이터 인용 요소들을 정의하고 서비스를 제공하는 DataCite, Dataverse Network, Data Citation Index 사례를 중심으로 살펴보았다. 마지막으로 한국종합사회조사 데이터 인용 분석을 통해 국내 데이터세트 인용/이용 정보 제공 실태를 조사하였다.

Abstract

Data citation remains in its infancy, although providing the citation to a journal article is a typical norm in an academic community. This study examines the need for data citation, its principles and guidelines for improving the issue. In addition, the study investigates cases that established data citation mechanism, including DataCite, Dataverse Network and Data Citation Index that define elements of data citation and provide relevant services. At the end, it explores the current state of data citation in Korea through the analysis of citations to dataset from Korean General Social Survey.

20
김순(이화여자대학교) ; 이보람(한국전자통신연구원) ; 김환민(한국과학기술정보연구원) ; 김혜선(한국과학기술정보연구원) 2017, Vol.34, No.3, pp.229-249 https://doi.org/10.3743/KOSIM.2017.34.3.229
초록보기
초록

공공연구 성과물(출판물 및 데이터)을 디지털 포맷으로 공개하여 이들 자료에 대한 접근성을 높이고자 하는 오픈 사이언스 프로젝트가 국외에서 활발히 진행되고 있다. 해외에서는 오픈 사이언스의 주요 특징인 공개 연구, 오픈 액세스, 연구데이터 공유, 공개적인 동료 평가, 투명한 연구 성과 평가에 맞추어 연구자 중심의 다양한 연구지원 서비스가 이루어지고 있다. 본 연구는 오픈 사이언스 시대를 대비하여 해외의 과학기술정보 서비스에 대해 심층 분석하고 국내 활용현황을 조사하였다. 국외의 적극적인 오픈 사이언스 대응현황에 비해 국내에서는 오픈 액세스나 기관 리포지터리 정도만 준비가 되어 있고, 연구데이터 관리나 협력 연구에 대해서는 아직까지 준비가 미비한 상태로 분석되었다. 따라서 국내 정보서비스 기관에서도 오픈 사이언스 시대를 대비하여 해외 우수 사례들을 충분히 고찰하여 이를 효과적으로 실행할 수 있는 연구지원 서비스 정책과 가이드라인 마련이 시급한 것으로 나타났다.

Abstract

Open science projects are being actively carried out globally. Publishing the results of public research (publications and data) in digital format and enhancing access to these materials are getting more important. Various research support tools are being used to support open research, open access, open data, open peer review and open research performance evaluation. We analyzed research support services to prepare open science movement in Korea. Korea is not ready for research data management and research collaboration except open access and institutional repositories. It can be seen as an urgent matter to analyze these international open science research support services carefully and reflect them in research support policy and service guideline.

정보관리학회지