• 제목/요약/키워드: 시소러스 갱신

검색결과 5건 처리시간 0.018초

집단지성을 활용한 시소러스 갱신에 관한 연구: 위키피디아를 중심으로 (Thesaurus Updating Using Collective Intelligence: Based on Wikipedia Encyclopedia)

  • 한승희
    • 정보관리학회지
    • /
    • 제26권3호
    • /
    • pp.25-43
    • /
    • 2009
  • 이 연구에서는 위키피디아를 활용하여 시소러스를 갱신하고, 그 결과를 평가함으로써 시소러스 갱신에 있어 집단지성의 활용가능성에 대해 확인하고자 하였다. ASIS&T 시소러스를 대상으로 시소러스를 갱신한 결과, 용어 포괄성의 측면에서 ASIS&T 시소러스에 비해 위키 시소러스가 우수한 것으로 나타났다. 또한, 갱신된 시소러스를 평가한 결과, 위키피디아가 시소러스 갱신에 활용될 수 있음이 증명되었다. 특히, 리디렉션, 카테고리, 상호 링크로 요약되는 위키피디아의 구조적 특성은 시소러스의 의미관계를 추출하는 데 있어 적합하다는 것을 확인하였다. 이 연구의 결과를 일반화하기 위해 다국어 시소러스를 포함한 다양한 시소러스를 대상으로 적용해 볼 필요가 있다.

대순사상 시소러스의 구축에 관한 연구 (A study on the establishment and development of the Daesoon Thought Thesaurus)

  • 이상복;장인호
    • 대순사상논총
    • /
    • 제19권
    • /
    • pp.21-45
    • /
    • 2005
  • The purpose of this study is to examine the establishment and development of Daesoon Thought Thesaurus. Specifically, this study examined the matters to be considered in the stage of Thesauri planning according to the Thesauri Construction process : presents the methods and standards of Thesauri Construction according to processes such as identification of the indexing policy, establishment of Thesauri system, collection of vocabulary, selection of preferred term, clustering of the terms, establishment of term relationships, overall adjustment, Thesauri test, proofreading by professional display, maintenance and updating. Since religion information is unique or totally different from the information in other areas, it is most important to construct the Thesauri suitable for system after carefully recognizing the concept of religion terms.

  • PDF

패싯 분류를 이용한 객체지향 컴포넌트의 계층구조화 (A Hierarchy of Object-Oriented Component Using Facet Classification)

  • 한정수;김귀정
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2004년도 춘계학술발표대회
    • /
    • pp.321-324
    • /
    • 2004
  • 본 연구는 재사용이 가능한 객체지향 컴포넌트의 효율적인 검색을 위해 클래스 개념 범주(CCC)를 정의하고 클래스의 상속 관계를 이용한 CCC 상속을 제안하였다. CCC의 상속은 클래스 간 상속관계를 인지한 후, 하위 클래스는 상위 클래스의 모든 CCC를 자동 상속받게 되며, 클래스 구문분석에 의해 객체지향 코드로부터 자동 인식된다. 본 연구는 모든 용어에 대한 범주를 수동으로 할당해주는 기존 방법의 단점을 극복할 수 있으며, 시소러스를 자동으로 갱신할 수 있다는 장점이 있다.

  • PDF

유전자 알고리즘을 이용한 전자메일분류 시스템에서의 사용자선호도 추출모델링 (User Modeling in E-Mail Classification System with Genetic Algorithm)

  • 안희국;노희영
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 가을 학술발표논문집 Vol.29 No.2 (2)
    • /
    • pp.673-675
    • /
    • 2002
  • 본 논문에서는 전자메일을 사용자 적합도(선호도)를 기준으로 분류함에 있어 좀더 사용자 선호도를 반영할 수 있는 시스템 구조를 제안한다. 사용자 선호도는 2단계에 걸쳐서 반영되는데, 1단계에서는 사용자 관련메일로 판단된 메일정보추출어구(MIWs)들로부터 사용자 동적 시소러스(DS)의 갱신을 통해 이뤄지며, 2단계에서는 DS로부터 추출된 키워드들을 갖고 유전자 알고리즘을 작동시킬 때, 사용자선호도 feedback을 받음으로서 이뤄진다. 테스트는 kaist뉴스그룹으로부터 임의로 추출된 5개 분야 10개씩의 메일을 sample로 사용하였으며, DS로부터 추출된 키워드가 유전자알고리즘 모듈을 통해 사용자 feedback을 받았을 때, 세대가 거듭함에 따라 사용자가 요구하는 threshold 값에 근사하게 관련키워드들이 수집되었다. 그 결과 사용자 전자메일분류시스템(PECS)의 성능도 폴더정보키워드(FIWs)의 변화에 따라 향상될 수 있음을 확인하였다.

  • PDF

ASKERIC 데이터베이스의 품질에 관한 연구 (An Evaluative study on information quality of ASKERIC databases)

  • 이명희
    • 한국비블리아학회지
    • /
    • 제9권1호
    • /
    • pp.221-240
    • /
    • 1998
  • 국내에서 제작되는 데이터베이스의 품질 개선에 도움을 주고자 교육학 분야에서 널리 알려진 ERIC 데이터베이스에 대한 품질의 평가작업을 수행하였다. 선정된 데이터베이스는 웹상에서 검색이 가능한 ASKERIC 이었으며, 데이터의 정확성, 일관성, 완전성, 현행성의 4가지 평가기준을 가지고 평가가 진행되었다. 정확성의 측정은 미국과 영국식 단어의 차이를 가진 글자를 가지고 수행되었는데 미국식 영어로 색인된 문헌의 검색결과가 영국식 영어로 된 문헌의 검색결과보다 훨씬 많은 것을 발견하였다. 틀리기 쉬운 10개의 단어를 가지고 철자에러를 체크해 보았을 때 상당한 양의 철자에러가 발견되었다. 일관성의 측정을 위해 색인어의 일관성을 조사하였는데 시소러스가 동의어 통제를 완전히 감당하지 못하는 것으로 드러났고 대소문자의 구별은 이루어지지 않는 것으로 나타났다. 완전성을 검증하기 위해 접근필드를 조사하였는데 ASKERIC은 상당히 다양한 접근 필드를 가지고 있었으나 매뉴얼에 나타난 접근필드와 검색창에 나타난 접근필드는 달랐으며. 검색창에 나타난 추가적인 필드를 가지고 검색하였을 때는 에러가 나타났다. 매뉴얼에서는 데이터의 갱신작업이 매월 이루어진다고 명시하였지만 현행성을 위해 실제로 검색해 보았을 때 데이터의 갱신주기는 매우 느린 것으로 나타났다. 그럼에도 불구하고 일반적으로 ERIC 데이터베이스의 품질은 대체로 양호한 것으로 나타났는데 이는 시스템의 자동 에러수정을 위한 부단한 노력과 이용자 피드백을 시스템의 품질 향상에 적극 반영하는 정책덕분인 것으로 보인다.

  • PDF