• 제목/요약/키워드: Document information retrieval

검색결과 410건 처리시간 0.027초

XMDR을 이용한 지능형 검색 온톨로지 서버 구축 (A Construction of an Ontology Server based Intelligent Retrieval using XMDR)

  • 황치곤;정계동
    • 한국통신학회논문지
    • /
    • 제30권8B호
    • /
    • pp.549-561
    • /
    • 2005
  • 인터넷 기술과 통신망 기술이 발전됨에 따라 전자상거래는 복잡하고 다양해지고 있다. 본 논문에서는 이기종 데이터베이스 시스템들 간의 메타데이터 및 데이터 교환을 위해 W3C에서 제안한 XML Schema를 사용하고, XML Schema는 관계형 데이터베이스 시스템의 메타데이터 및 데이터를 계층적 구조인 XML 문서형식으로 나타낼 수 있고, 다양한 원시 데이터 형식을 지원하여 관계형 데이터베이스 시스템이 제공하는 데이터형식을 충분히 반영할 수 있는 구조를 사용한다. 그리고 기존 전자상거래에서는 이질적인 플랫폼을 사용함으로 인해 발생하는 시스템간의 상호 호환 및 운영의 어려움이 있다. 이러한 문제를 해결하기 위해 상품 분류와 속성표현의 표준과 관계성을 정의한 표준 온톨로지와 상품들에 대한 전자상거래 사이트의 정보를 제공하는 로케이션 온톨로지를 구축한다. 이 온톨로지 정보를 검색시스템에 적용하여 고객의 선택에 필요한 정보를 제공함으로서 효율적인 검색을 수행한다. 이러한 온톨로지와 상품 분류 카테고리 정보를 결합하여 XMDR이라 하고, 이 XMDR을 상품 검색 시스템에 도입하여 효율적인 검색을 수행하기 위한 은톨로지 서버 구축에 관한 방법을 제안한다.

온라인 이용자 피드백을 사용한 정보필터링 시스템의 수정질의 최적화에 관한 연구 (A Study on Query Refinement by Online Relevance Feedback in an Information Filtering System)

  • 최광;정영미
    • 정보관리학회지
    • /
    • 제20권4호통권50호
    • /
    • pp.23-48
    • /
    • 2003
  • 이 연구의 목적은 대량의 최신정보를 제공하는 정보필터링 시스템에서 이용자 피드백에 의해 수정질의를 자동생성하여 재검색을 수행함으로써 검색 성능을 최적화할 수 있는 방안을 찾는 데 있다. 이용자가 입력한 초기질의를 사용하여 정보필터링 시스템이 검색한 문헌에 대해 이용자가 적합성 여부를 온라인으로 입력하도록 하고, 이 피드백 결과를 토대로 '중복제거법'과 ‘저빈도제거법' 두 가지 방법에 의해각각 17개의 수정질의를 생성하여 재검색한 결과를 초기 검색결과와 비교 분석하였다. 수정질의는 각각의 방법마다 17개 패턴의 불논리 질의형태를 미리 만든 다음 초기질의에 디스크립터와 분류기호를 결합하여 생성하였으며, 재검색 결과에 대한 적합성 평가를 통해 최적의 수정질의식을 도출하였다.

유지보수에 특화된 웹 문서 작성기의 설계 및 구현 (Design and Implementation of a WebEditor Specialized for Web-Site Maintenance)

  • 조영석;권용호;도재수
    • 융합보안논문지
    • /
    • 제7권4호
    • /
    • pp.73-81
    • /
    • 2007
  • 웹 사이트들은 정보의 양이 방대해지고 웹 문서들의 잦은 생성, 삭제와 수정이 반복되면서 더욱 복잡한 구조의 양상을 띠게 되었으며 사용자가 원하는 최적의 정보에 접근하는 방법 또한 예측하기 힘든 구조를 가지게 되었다. 또한 웹 사이트를 처음 만드는데 들이는 노력에 비해 유지 보수에는 요구되는 비용 때문에 적은 노력을 들이고 있다. 이런 환경에서 웹 문서간의 관계와 그 관계들의 유효성을 분석하여 그 정보가 제공된다면 개발자 뿐 아니라 관리자들도 효과적이고 효율적인 서비스를 제공할 수 있다. 웹 사이트 전체의 구조를 쉽게 파악할 수 있고 하이퍼링크의 유효성을 확인하기 위해 웹 문서의 분석을 통해 하이퍼링크의 구조를 추출하고 체계적인 방법으로 웹 사이트를 관리 하는데 필요한 여러 가지 정보를 제공하여야 한다. 본 논문에서는 HTML 태그를 분석하여 하이퍼링크 정보를 추출, 문서간의 관계를 체계적으로 구조화 하고 관계를 이루는 하이퍼링크가 유효한지 여부를 판단하여 알려주는 두 가지 방법을 사용하여 웹 사이트의 유지 보수를 지원함과 동시에 새로운 문서를 생성 편집할 수 있는 웹 문서 작성 방안을 제안한다.

  • PDF

웹 통합문서의 효율적 생성과 검색을 위한 자동링크지원 시스템의 설계 및 구축 (Design and Implementation of Automatic Linking Support System for Efficient Generating and Retrieving Integrated Documents Based on Web)

  • 이원중;정은재;주수종;이승용
    • 정보처리학회논문지A
    • /
    • 제10A권2호
    • /
    • pp.93-100
    • /
    • 2003
  • 분산 컴퓨팅과 웹 서비스 기술의 발달과 함께, 급증하는 인터넷 사용자는 웹 기반의 맞춤형 정보를 편리하게 작성하고 제공받을 수 있는 서비스들을 요구하고 있다. 이를 위해, 본 논문에서는 맞춤형 정보로서 웹 기반의 통합문서를 생성하고, 사용자 요구에 따라 다양한 검색을 지원할 수 있는 자동링크지원 시스템(ALSS : Automatic Linking Support System)을 구축하고자 한다. 본 시스템의 구성은 클라이언트/서버 환경을 기반으로, 서버는 어휘분석, 질의처리 및 통합문서생성 기능들을 제공하는 자동링크엔진과 사전, 이미지 컨텐츠 및 URLs로 이루어진 데이터베이스를 지원하도록 구축하였다. 클라이언트 측은 서버 측의 자동링크엔진과 데이터베이스를 접근하여 웹 기반의 통합문서를 생성하는 웹 에디터와 검색 서비스를 지원하는 웹 도우미로 구축하였다. 웹 에디터나 웹 도우미 프로그램은 클라이언트 측에 별도의 설치 없이 서버로부터 다운로딩하여 실행할 수 있으며, 서버의 실행기능들의 일부를 글라이언트 측에 분산시키므로써 서버의 부하를 감소시켰다. 본 시스템의 구현으로서, 사용자 인터페이스는 JDK 1.3 기반의 SWING을 이용하고, 클라이언트와 서버간의 연동을 위한 자바 RMI 기법을 적용하였으며, SQL Server 7.0을 사용하여 데이터베이스를 구축하였다. 마지막으로 웹 에디터와 웹 도우미에 의해 자동링크엔진과 데이터베이스를 접근하는 과정과 그들의 실행결과를 보였다.

과학 기술 문헌 분석을 위한 기계학습 기반 범용 전문용어 인식 시스템 (Terminology Recognition System based on Machine Learning for Scientific Document Analysis)

  • 최윤수;송사광;전홍우;정창후;최성필
    • 정보처리학회논문지D
    • /
    • 제18D권5호
    • /
    • pp.329-338
    • /
    • 2011
  • 문헌에서의 전문용어 인식 연구는 정보검색, 정보추출, 시맨틱 웹, 질의응답 분야 등의 연구를 위한 선행 연구로서, 지금까지 대부분 특정 분야, 특히 생의학 분야에서 집중되어 연구되어 왔다. 그러나 기존 연구들이 특정 도메인 또는 문헌 내부 통계 정보를 활용함으로써 범용적인 전문용어 인식에 한계점을 보여 왔기 때문에, 본 연구에서는 웹 검색 결과와 사전, 후보용어의 문형 특징 등을 활용하는 기계 학습 기반 범용 전문용어 인식 방법을 제안하였다. 제안한 방법을 문헌의 지역 통계 정보를 사용하는 방법(C-value)과 비교 실험하여 80.8%의 F-값으로 6.5%의 성능향상을 보였다. 다양한 응집도 자질들을 접목한 두 번째 실험에서는 Normalized Google Distance 방법과 접목한 방식이 F-값 81.8%의 성능으로 최고의 성능을 나타냈다. 기계 학습 방법으로는 로지스틱 회귀분석, C4.5, SVMs 등을 적용하였는데, 일반적으로 이진 분류에 좋은 성능을 보이는 SVMs과 로지스틱 회귀분석 방법보다 결정 트리 방식의 C4.5가 전반적으로 좋은 성능을 보였다.

모바일기기 PDA를 이용한 E-Learning Contents에 대한 XML기반 검색 시스템 (XML-based Retrieval System for E-Learning Contents using mobile device PDA)

  • 박용빈;양해술
    • 한국산학기술학회논문지
    • /
    • 제10권4호
    • /
    • pp.818-823
    • /
    • 2009
  • 웹은 다양한 정보의 제공 면에서 크게 기여하고 있다. 특히 인적자원 개발과 교육을 목적으로 하는 매체로서 웹의 역할은 중요하다. 더욱이 웹을 통한 E-Learning은 각 기업체와 교육기관에 중요한 역할을 감당하게 되었다. 또한 웹에서의 수많은 교육 컨텐츠를 관리하고 검색하기 위해서는 무엇보다도 다양하고 빠른 검색이 요구되어진다. 그러나 현재 웹에서 대부분을 차지하고 있는 정보는 HTML 구성되어 많은 제한을 가지고 있다. 이에 대한 해결방안으로 웹문서의 표준으로 XML을 구성하고 그에 대한 다양한 검색 기능들이 다양하게 확장 연구되어지고 있다. 더욱이 AJAX는 오래된 어떤 기술과 새로운 기술 양면성을 가지고 있다. 그것은 이미 존재하는 기술과 전에는 전혀 고려하지 않았던 기술들을 결합하였기에 새로운 기술이라고 본다. 한편 AJAX는 Web 2.0을 보완하며 많은 웹기술들이 결합된 기술로 본다. 본 논문에서는 E-Learning에서의 XML과 AJAX에 의한 non-XML의 다양한 컨텐츠를 모바일기기인 PDA를 이용하여 검색할 수 있는 검색 시스템을 제안한다.

사회망 기반 순환 탐지 기법을 이용한 저자명 명확화 기법 (Name Disambiguation using Cycle Detection Algorithm Based on Social Networks)

  • 신동욱;김태환;정하나;최중민
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제36권4호
    • /
    • pp.306-319
    • /
    • 2009
  • 이름은 사람을 구별하기 위한 특징이지만 여러 사람이 하나의 이름을 공유하는 경우와 한 사람이 여러 이름을 사용하는 경우 때문에 이름만으로는 사람을 명확히 구별할 수 없다. 이러한 문제는 정보 검색 분야에서 문서 검색이나 웹 검색, 데이터베이스 통합 등에 영향을 미친다. 특히 서지 정보에는 저자들 중 동명이인이 존재하거나 한 저자가 축약된 이름 혹은 잘못된 철자를 사용하기도 하기 때문에 에러정보가 많이 포함되어 있다. 이러한 문제를 해결하기 위해 데이터베이스에 입력된 자료 중 이름에 대한 정보를 명확하게 해야 한다. 본 논문에서는 저자간의 관계로부터 구축된 사회망을 이용해 이름의 모호성을 해결하는 방법을 제안하고 컴퓨터 과학 서지정보를 제공하는 DBLP(Digital Bibliography & Library Project) 데이터를 기반한 실험을 통해 제안한 시스템의 성능의 효율성을 평가하였다.

정보검색 기법을 이용한 효율적인 자동 키워드 태깅 (An Efficient Method of IR-based Automated Keyword Tagging)

  • 김진숙;최호섭;류범종
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2008년도 춘계 종합학술대회 논문집
    • /
    • pp.24-27
    • /
    • 2008
  • 위키피디아의 백과사전에서 보여주는 바와 같이 주요한 용어에 대한 링크를 통한 태깅은 문서의 가독성을 크게 향상시킨다. 웹 2.0에서도 사회적 태깅(Social Tagging)의 중요성이 부각되고 있으며 시멘틱웹의 태그클라우드(Tag Cloud) 형태로 발전하고 있다. 본 논문에서는 대용량 통제어 사전에 등재된 주요 용어를 대상문서에 태깅하는 방법에 대해 연구결과를 제시한다. 기본적으로 사전에 있는 모든 용어(항목수 N)를 주어진 문서(길이 m)에서의 출현 여부를 문자열탐색을 통해 비교하여 태깅하는 방식은 O(mN)의 계산복잡도를 가진다. 그러나 본 논문에서 제시하는 바와 같이 정보검색을 이용할 경우에는 계산복잡도를 O(mlogN)으로 줄일 수 있었다. 정보검색을 활용하면 단순문자열 탐색에 비해서 평균 17.8배, 빠른 문자열탐색 알고리즘에 비해서도 평균 5.6배 이상 태깅 속도가 향상되었다.

  • PDF

질의응답시스템 응답순위 개선을 위한 새로운 유사도 계산방법 (A New Similarity Measure for Improving Ranking in QA Systems)

  • 김명관;박영택
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제10권6호
    • /
    • pp.529-536
    • /
    • 2004
  • 본 논문에서는 질의응답시스템의 성능을 개선하기 위해 문장의 위치정보와 질의형태분류기를 사용하여 질의에 대한 대답순위를 조정하는 새로운 질의-문서 유사도 계산을 제안한다. 이를 위해 첫째로 문서내용을 표현하고 문서의 위치정보를 반영하기 위해 개념그래프를 사용한다. 이 방법은 문서비교에 대표적으로 사용되는 Dice-Coefficient에 기반하고 문장에서 단어의 위치정보론 반영한 유사도 계산이다. 두번째로 질의응답시스템의 대답순위를 개선하기 위하여 질의형태를 고려한 기계학습을 통한 질문에 대한 분류를 하였으며 이를 위해서 뉴스그룹의 FAQ 문서 30,000개를 가지고 기계학습 방법인 나이브 베이지안을 사용한 분류기를 구현하였다. 이에 대한 평가를 위해 세계적인 정보검색대회인 TREC-9의 질의응답시스템분야에 제출된 데이타를 가지고 실험하였으며 기존의 방법에 비해 자동학습기법을 사용하였음에도 평균상호순위가 0.29, 상위 5위에 정답을 포함시킨 경우가 55.1%의 성능을 보였다. 이 방법은 다른 시스템과 달리 질의형태분류를 기계학습 방법을 사용하여 자동으로 학습하는 것에 의의를 갖는다.

CT 전문방사선사 교육을 위한 웹기반 문항관리 시스템의 설계 및 구현 (Design and Implementation of Web-based Problem Management System for CT Radiological Technologist Education)

  • 신용원;구봉오;심춘보
    • 한국콘텐츠학회논문지
    • /
    • 제5권1호
    • /
    • pp.27-35
    • /
    • 2005
  • 최근 의료 및 보건 분야의 정보화가 급격히 진행됨에도 불구하고 보건 분야 중의 전문방사선사와 관련된 의료 및 교육 컨텐츠 개발에 해당하는 시험문제 개발이나 관리가 여전히 수작업이나 문서편집기를 이용한 오프라인 방식에 머무르고 있다. 따라서 본 연구에서는 CT 방사선사 전문자격증 취득 및 보수교육의 효율성을 향상시키기 위해 다양한 종류의 문항들을 시간과 공간의 제약 없이 언제 어디서든지 효율적으로 문항을 출제하고 관리할 수 있는 웹기반 문항 관리 시스템을 설계 및 구현한다. 제안하는 시스템은 관리자 모듈과 사용자 모듈로 구성되어 있으며, 관리자 모듈 내에서는 관련 있는 문항들을 그룹핑할 수 있는 분류관리와 문항출제 및 사용자관리, 난이도조절등과 같은 기능이 있으며, 사용자 모듈에서는 시험응시, 문항검색, 개인성적 조회, 해설듣기 등과 같은 기능을 포함하고 있다. 아울러 구현된 문항관리시스템은 CT전문방사선사 자격시험을 준비하는 방사선사들에게 정보교류, 의료컨텐츠 제공 및 학습능력 배양시킬 뿐만 아니라, 테스트 후 성적결과의 분석 및 문제해설까지 제공하는 활용가치가 높은 시스템으로 기대된다.

  • PDF