바로가기메뉴

본문 바로가기 주메뉴 바로가기

logo

단어 의미 정보를 활용하는 이용자 자연어 질의 유형의 효율적 분류

Efficient Classification of User's Natural Language Question Types using Word Semantic Information

정보관리학회지 / Journal of the Korean Society for Information Management, (P)1013-0799; (E)2586-2073
2004, v.21 no.4, pp.251-263
https://doi.org/10.3743/KOSIM.2004.21.4.251
윤성희 (상명대학교)
백선욱 (상명대학교)
  • 다운로드 수
  • 조회수

초록

질의응답 시스템에서의 질의 분석 과정은 이용자의 자연어 질의 문장에서 질의 의도를 파악하여 그 유형을 분류하고 정답 추출을 위한 정보를 구하는 것이다. 본 연구에서는 복잡한 분류 규칙 집합이나 대용량의 언어 지식 자원 대신 이용자 질의 문장에서 질의 초점 어휘를 추출하고 구문 구조적으로 관련된 단어들의 의미 정보에 기반하여 효율적으로 질의 유형을 분류하는 방법을 제안한다. 질의 초점 어휘가 생략된 경우의 처리와 동의어와 접미사 정보를 이용하여 질의 유형 분류 성능을 향상시킬 수 있는 방법도 제안한다.

keywords
질의응답 시스템, 질의 유형 분류, 정답 추출, 단어 의미 정보, 자연어 질의 question-answering system, question type classification, answer extraction, word semantic information, natural language question

Abstract

For question-answering system, question analysis module finds the question points from user’s natural language questions, classifies the question types, and extracts some useful information for answer. This paper proposes a question type classifying technique based on focus words extracted from questions and word semantic information, instead of complicated rules or huge knowledge resources. It also shows how to find the question type without focus words, and how useful the synonym or postfix information to enhance the performance of classifying module.

keywords
질의응답 시스템, 질의 유형 분류, 정답 추출, 단어 의미 정보, 자연어 질의 question-answering system, question type classification, answer extraction, word semantic information, natural language question

참고문헌

1.

김수민. (2000). 시소러스 범주정보를 이용한 질의응답 시스템 (-). 한글 및 한국어 정보처리 학술대회.

2.

김영택. (2001). 자연언어처리:생능출판사.

3.

김학수. (2003). 하이브리드 방법의 사용자 질의 의도 분류. 정보과학회논문지 : 소프트웨어 및 응용, 30(2), 51-57.

4.

김현돈. (2000). 한메일넷 질의 자동응답을 위한 이단계 자기구성 지도 (-). 정보과학회 춘계학술대회.

5.

박세영,. (2002). 한글공학: 정보검색. 한국정보처리학회지, 5(5), -.

6.

박소연. (2002). 로그 분석을 통한 이용자의 웹 문서 검색 행태에 관한 연구. 정보관리학회지, 19(3), 111-122.

7.

신승은. (2004). 구문 관계 정보를 이용한 한국어 질의-응답 시스템. 한국콘텐츠학회 논문지, 4(2), 36-42.

8.

양수정. (2003). 질의문의 구문정보를 이용한 키워드 추출 (-). 한국콘텐츠학회 추계 종합 학술대회.

9.

윤성희. (2004). 자연어 질의 분석과 검색어 확장에 기반한 웹 정보 검색.. 정보관리학회지, 21(2), 235-248.

10.

원정임. (1997). 사객체 검색에 의한 협력 질의 응답. 한국정보처리학회 추계, , -.

11.

이경순. (2000). KorQuA: 질의응답에서 자료 유형을 고려한 대답 검색과 대답 해석. (-). 한글 및 한국어 정보처리 학술대회.

12.

이재홍. (2003). 념어의 습득을 위한 지식기반 질의응답시스템 (-). 제15회 한글 및 한국어 정보처리 학술대회.

13.

황이규. (2004). 질의응답 기술 개발.. 정보처리학회지, 11(2), 48-56.

14.

(2009). AAAI Fall Symposium on Question Answering. http://www.aaai.org/Press/Reports/Symposia/Fall.

15.

Baeza Yates Ricardo. (1989). Modern Information Retrieval:Addison Wesley.

16.

Burger J, Cardie C. (2009). Issues, Tracks and Program Structures to Roadmap Research in Question & Answering(Q&A). http://www-nlpir.nist.gov/projects/duc/pubs.html.

17.

Edward H. (2002). Using Knowldege to Facilitate Factoid Answer Pinpointing:Coling.

18.

Ellen M. (1999). The TREC-8 Question Answering Track Report.

19.

Ellen M. (2000). Building a Question Answering Test Collecion:SIGIR.

20.

Ittycheriah A. (2000). IBM's Statistical Question Answering System. TREC, , 229-234.

21.

Jimmy L. (2002). The Web as Resource for Question Answering:LREC.

22.

Jimmy L. (2003). Question Answering Techniques for the World Wide Web (-). 10th Conference of the European Chapter of the Association for Computational Linguistics(EACL-2003).

23.

Lee G. (2001). Site/Q: Engineering high performance QA system using Lexico-semantic pattern matching and shallow NLP. TREC, 10, 437-446.

24.

Moldovan D.. (2002). Lexical Chain for Question Answering:Coling.

25.

(2009). TREC(Text Retrieval Conference. http://trec.nist.gov/pubs.html.

정보관리학회지