• 제목/요약/키워드: 실험문헌집단

검색결과 83건 처리시간 0.019초

지식 분류의 자동화를 위한 클러스터링 모형 연구 (Development of a Clustering Model for Automatic Knowledge Classification)

  • 정영미;이재윤
    • 정보관리학회지
    • /
    • 제18권2호
    • /
    • pp.203-230
    • /
    • 2001
  • 본 연구에서는 문헌을 기반으로 한 지식의 자동분류를 위해 최적의 클러스터링 모형을 제시하고자 하였다. 클러스터링 실험을 위해서 신문기사 실험집단과 학술논문 초록 실험집단을 구축하였고, 분류 성능 평가 척도인 WACS를 개발하였다. 분류자질로 사용한 용어의 집합은 다양한 자질 축소 기준을 적용하여 생성하였으며, 다양한 용어 가중치를 사용하였다. 유사계수 공식으로는 코사인 계수와 자카드 계수를 적용하였으며, 클러스터링 알고리즘으로는 비계층적 기법인 완전연결 기법과 계층적 기법인 K-means기법을 각각 사용하였다. 실험 결과 신문기사 원문 집단에서의 성능이 좋았으며, 완전연결 기법의 성능이 K-means 기법보다 높게 나타났다. 역문헌빈도의 적용은 완전연결 클러스터링에서는 긍정적인 효과가 나타났으나, K-means 클러스터링에서는 그렇지 못했다. 분류자질은 전체의 7.66%만 사용하였을 경우에도 성능 저하가 크지 않았으며, K-means 클러스터링에서는 오히려 성능 향상 효과가 있었다.

  • PDF

이용자 중심 요약문 생성에 관한 실험적 연구 (An Experimental Study on Generation of User-focused Summaries)

  • 김정하;정영미
    • 한국정보관리학회:학술대회논문집
    • /
    • 한국정보관리학회 2001년도 제8회 학술대회 논문집
    • /
    • pp.185-188
    • /
    • 2001
  • 본 연구에서는 단락검색 기법을 응용하여 이용자의 질의에 적합한 최적의 요약문을 자동 생성하는 방안을 모색하고자 하였다. 이를 위해 먼저 실험문헌집단을 구축한 후, 실험을 통해 이용자 중심 요약문을 생성하는 정적 단락검색 기법과 동적 단락추출 기법의 최적의 모형을 찾고 이들의 성능을 비교하였다.

  • PDF

사전학습 된 언어 모델 기반의 양방향 게이트 순환 유닛 모델과 조건부 랜덤 필드 모델을 이용한 참고문헌 메타데이터 인식 연구 (A Study on Recognition of Citation Metadata using Bidirectional GRU-CRF Model based on Pre-trained Language Model)

  • 지선영;최성필
    • 정보관리학회지
    • /
    • 제38권1호
    • /
    • pp.221-242
    • /
    • 2021
  • 본 연구에서는 사전학습 된 언어 모델을 기반으로 양방향 게이트 순환 유닛 모델과 조건부 랜덤 필드 모델을 활용하여 참고문헌을 구성하는 메타데이터를 자동으로 인식하기 위한 연구를 진행하였다. 실험 집단은 2018년에 발행된 학술지 40종을 대상으로 수집한 PDF 형식의 학술문헌 53,562건을 규칙 기반으로 분석하여 추출한 참고문헌 161,315개이다. 실험 집합을 구축하기 위하여 PDF 형식의 학술 문헌에서 참고문헌을 분석하여 참고문헌의 메타데이터를 자동으로 추출하는 연구를 함께 진행하였다. 본 연구를 통하여 가장 높은 성능을 나타낸 언어 모델을 파악하였으며 해당 모델을 대상으로 추가 실험을 진행하여 학습 집합의 규모에 따른 인식 성능을 비교하고 마지막으로 메타데이터별 성능을 확인하였다.

2-포아송 모형을 이용한 한글 주제어 선정에 관한 연구 (A Study on the Applicability of 2-Poisson Model for Selecting Korean Subject Words)

  • 정영미;최대식
    • 정보관리학회지
    • /
    • 제17권1호
    • /
    • pp.129-148
    • /
    • 2000
  • 최근 구축된 한글 실험문헌 집단을 대상으로 2-포아송 모형의 Z값의 주제어 식별력을 측정하였으며, 역문헌빈도와 2 포아송 모형간의 상관관계를 분석하였다. 이를 위해 Z와 수정 $\beta$값 및 IDF와 수정 TF.IDF 가중치를 하위 실험집단별로 각기 산출, 비교하였다. 실험 결과 Z값의 주제어 선정능력은 3개의 하위 실험집단 가운데 과학기술분야에서만 확인되었다. 2-포아송 모형의 Z값과 역문헌빈도 가중치간의 상관관계 분석에서는 전문(full text)인 여성학분야 실험집단에 비해 초록 및 신문기사와 같이 단문(short text)으로 구성된 과학기술분야 및 일반사회 분야 실험집단에서 상관관계가 더 크게 나타 났다.

  • PDF

용어 가중치부여 기법을 이용한 로치오 분류기의 성능 향상에 관한 연구 (A Study on the Performance Improvement of Rocchio Classifier with Term Weighting Methods)

  • 김판준
    • 정보관리학회지
    • /
    • 제25권1호
    • /
    • pp.211-233
    • /
    • 2008
  • 로치오 알고리즘에 기반한 자동분류의 성능 향상을 위하여 두 개의 실험집단(LISA, Reuters-21578)을 대상으로 여러 가중치부여 기법들을 검토하였다. 먼저, 가중치 산출에 사용되는 요소를 크게 문헌요소(document factor), 문헌집합 요소(document set factor), 범주 요소(category factor)의 세 가지로 구분하여 각 요소별 단일 가중치부석 기법의 분류 성능을 살펴보았고, 다음으로 이들 가중치 요소들 간의 조합 가중치부여 기법에 따른 성능을 알아보았다. 그 결과, 각 요소별로는 범주 요소가 가장 좋은 성능을 보였고, 그 다음이 문헌집합 요소, 그리고 문헌 요소가 가장 낮은 성능을 나타냈다. 가중치 요소 간의 조합에서는 일반적으로 사용되는 문헌 요소와 문헌집합 요소의 조합 가중치(tfidf or ltfidf)와 함께 문헌 요소를 포함하는 조합(tf*cat or ltf*cat) 보다는, 오히려 문헌 요소를 배제하고 문헌 집합 요소를 범주 요소와 결합한 조합 가중치 기법(idf*cat)이 가장 좋은 성능을 보였다. 그러나 실험집단 측면에서 단일 가중치와 조합 가중치를 서로 비교한 결과에 따르면, LISA에서 범주 요소만을 사용한 단일 가중치(cat only)가 가장 좋은 성능을 보인 반면, Reuters-21578에서는 문헌집합 요소와 범주 요소간의 조합 가중치(idf*cat)의 성능이 가장 우수한 것으로 나타났다. 따라서 가중치부여 기법에 대한 실제 적용에서는, 분류 대상이 되는 문헌집단 내 범주들의 특성을 신중하게 고려할 필요가 있다.

정보활용능력 교육의 효용성에 관한 실험적 연구 (An Experimental Study on the Effectiveness of Education for Information Literacy)

  • 이정연;최은주
    • 한국문헌정보학회지
    • /
    • 제40권1호
    • /
    • pp.315-334
    • /
    • 2006
  • 본 연구는 정보활용능력 교육의 효용성을 알아보고자 선정된 실험집단과 통제집단을 통하여 각 집단의 수업전후의 정보활용능력을 측정하였다. 교육 후에 실험집단과 통제집단의 정보활용능력의 차이는 유의한 것으로 나타났다. 정보활용능력 교육의 효과는 각 영역에서 높은 것으로 나타났는데 특히 정보윤리 영역과 정보분석 영역에서 그 효과가 높음을 보였다. 그러나 정보활용능력 교육은 기초환경요인에 영향을 받지 않는 것으로 밝혀졌다. 또한 교육을 수강한 학생들은 정보활용능력에 대한 자신감과 도서관에 대한 인식도가 변화되었다. 이로서 정보활용능력의 교육은 인지적, 태도적 측면 모두 대학생들에게 교양과목으로서 효용성이 높은 것으로 나타났다.

분포유사도를 이용한 문헌클러스터링의 성능향상에 대한 연구 (Improving the Performance of Document Clustering with Distributional Similarities)

  • 이재윤
    • 정보관리학회지
    • /
    • 제24권4호
    • /
    • pp.267-283
    • /
    • 2007
  • 이 연구에서는 분포 유사도를 문헌 클러스터링에 적용하여 전통적인 코사인 유사도 공식을 대체할 수 있는 가능성을 모색해보았다. 대표적인 분포 유사도인 KL 다이버전스 공식을 변형한 Jansen-Shannon 다이버전스, 대칭적 스큐 다이버전스, 최소스큐 다이버전스의 세 가지 공식을 문헌 벡터에 적용하는 방안을 고안하였다. 분포 유사도를 적용한 문헌 클러스터링 성능을 검증하기 위해서 세 실험 집단을 대상으로 두 가지 실험을 준비하여 실행하였다. 첫 번째 문헌클러스터링실험에서는 최소스큐다이버전스가 코사인 유사도 뿐만 아니라 다른 다이버전스공식의 성능도 확연히 앞서는 뛰어난 성능을 보였다. 두번째 실험에서는 피어슨 상관계수를 이용하여1차 유사도 행렬로부터2차 분포 유사도를 산출하여 문헌 클러스터링을 수행하였다. 실험결과는 2차 분포 유사도가 전반적으로더 좋은 문헌 클러스터링성능을 보이는 것으로 나타났다. 문헌클러스터링에서 처리 시간과 분류 성능을 함께 고려한다면 이 연구에서 제안한 최소 스큐 다이버전스 공식을 사용하고, 분류 성능만 고려할 경우에는 2차 분포 유사도 방식을 사용하는 것이 바람직하다고 판단된다.

목차, 책 소개를 이용한 단행본 문서 범주화에 관한 기초연구 (A preliminary Study on Text Categorization of Book using Table of Contents and Book Description)

  • 도현호;이용구
    • 한국정보관리학회:학술대회논문집
    • /
    • 한국정보관리학회 2014년도 제21회 학술대회 논문집
    • /
    • pp.127-130
    • /
    • 2014
  • 이 연구에서는 도서관의 주요 장서에 해당하는 단행본 도서에 대한 자동 분류를 적용가능한지 알아보고자 하였다. 분류자질로 메타데이터인 서명, 목차, 책 소개를 사용하였으며, 다양한 자질 가중치를 적용하여 581건의 단행본 도서를 통해 kNN 분류기의 분류성능을 파악하였다. 실험 결과 이들 메타데이터를 모두 사용하였을 때 가장 좋은 분류성능을 가져왔으며, 실험문헌집단의 규모가 작은 한계가 있지만 로그 TF를 취한 가중치 방법이 좋은 성능을 가져왔다.

  • PDF

경추장애에서 운동치료의 효과 (The Evidence for Exercise Therapy in Cervical Dysfunction)

  • 김영민
    • 대한정형도수물리치료학회지
    • /
    • 제10권1호
    • /
    • pp.5-41
    • /
    • 2004
  • 운동치료는 환자가 자기 자신의 치료에 직접 참여한다는 측면에서 다른 수동적인 치료보다 더 효과적이라고 생각된다. 이 논문의 목적은 관련문헌을 찾아내어 경추의 장애를 치료하는데 운동치료가 효과적이라는 것을 입증하는 증거를 찾아내기 위한 것이다. 경추 장애를 치료하기 위한 여러 가지 형태의 운동치료를 포함하는 연구를 찾아내기 위하여 7가지의 컴퓨터 문헌탐색을 수행하였고 출판된 전문을 아들레이드 내에서 구할 수 있는 것만 검토하였다. 문헌 평가도구를 사용하여 연구의 질을 평가하였고 그 결과를 표로 제시하였다. 111개의 문헌 중 34개가 포함 기준에 합당하였으며 이 중 18개의 임상실험연구를 수집하여 운동치료의 효과를 조사하기 위하여 그 질을 분석하였다. 임상실험연구의 전체적인 질은 "우수"였다. 도수치료와 운동치료를 병행하여 치료를 실시한 5개의 "탁웰"한 질의 임상실험연구에서 근력의 증가와 통증의 감소를 보였다. 3개의 임상연구에서 근력강화운동이 증상의 경감에 효과가 있다고 하였다. 2개의 "우수"와 "중등도"의 질의 문헌에서 집단운동이 개별적인 물리치료만큼 효과가 있다고 하였다. 고유수용성 운동과 다른 형태의 운동 또한 경추의 장애의 치료에 효과가 있는 것으로 나타났다. 이 글의 소견은 경추 장애의 치료에 운동이 효과적이라는 이전의 연구결과를 지지한다. 또한 경추 장애의 치료에 다른 형태의 운동의 상대적인 효과를 확인하기 위한 훌륭한 질의 연구가 더 행해질 필요가 있다고 본다.

  • PDF

공직 적격성 검사의 개발

  • 김청택;김명소;이순묵
    • 한국조사연구학회:학술대회논문집
    • /
    • 한국조사연구학회 2001년도 추계학술대회 발표논문집
    • /
    • pp.89-109
    • /
    • 2001
  • 이 연구의 목적은 국가 고등고시 1차 시험에서 우수한 인재를 선발하기 위하여 적성검사를 개발하는 것이었다. 일반적성이론에 관한 문헌조사와 재직자와의 면접을 통한 직무분석 결과에 기초하여 언어능력, 상황판단능력, 자료해석 능력, 상식의 네 가지 하위영역을 측정하는 검사를 제작하여 대학생 집단, 재직자 집단, 수습사무관 집단을 대상으로 1차 실험평가를 실시하였다. 문항분석을 통해 문항의 양호도를 검토한 후 이러한 정보를 기초로 새로운 문항을 제작하고 대학생 집단, 재직자 집단, 수습사무관 집단을 대상으로 2차 실험평가를 실시하였다. 최종적으로 개발된 문항들은 신뢰도와 타당도 면에서 수용할만한 수준이었다. 개발된 공직 적격성 검사의 의의와 앞으로 고등고시에 지원할 응시자들에게 미치는 순기능을 논의하였다.

  • PDF