• 제목/요약/키워드: information retrieval.

검색결과 3,667건 처리시간 0.048초

저자명 모호성 해결을 위한 개념망 기반 카테고리 유틸리티 (WordNet-Based Category Utility Approach for Author Name Disambiguation)

  • 김제민;박영택
    • 정보처리학회논문지B
    • /
    • 제16B권3호
    • /
    • pp.225-232
    • /
    • 2009
  • 동명이인의 저자를 구분하는 것은 웹에서 문서 색인과 검색의 성능을 향상시킨다. 동명이인의 저자 구분은 웹사이트 상에서 같은 이름을 갖는 여러 명의 사람이 존재했을 때 야기되는 여러 가지 문제점을 해결한다. 본 논문은 동명이인의 저자 구분을 위해 개념망 기반의 카테고리 유틸리티를 제안한다. 따라서 본 논문에서는 학술회의 웹 사이트를 대상으로 제안하고자 하는 방법을 설명한다. 제안된 방법은 저자가 가지고 있는 다양한 속성(제목, 요약, 공동저자, 소속)을 반영한 저자 온톨로지와 개념망을 활용한다. 저자 온톨로지는 OWL API와 휴리스틱한 방법을 사용하여 반자동으로 구축 되었다. 저자명 모호성 해결은 개념망 기반 카테고리 유틸리티를 사용하여 저자 온톨로지 내에 존재하는 동명이인 저자(Candidate Authors)들로부터 해당 논문에 관련된 정확한 저자를 결정한다. 카테고리 유틸리티는 각각의 저자간의 intra-class 유사성 와 inter-class 비유사성을 기본적인 개념으로 하는 평가 함수다. 이에 비해 개념망 기반 카테고리 유틸리티는 모호성 해결을 위해 개념망이 갖는 개념 정보를 추가로 활용한다. 실험 결과를 분석한 결과 개념망 기반 카테고리 유틸리티가 일반적인 카테고리 유틸리티에 비교해서, 저자명 모호성 해결에 있어서 10% 정도 우수한 성능을 보였으며, 전체적으로 98%의 정확도를 보였다.

CORBA-ORB, JAVA-RMI, 소켓을 이용한 그룹 통신의 구현 및 성능 분석 (Implementation and Performance Analysis of the Group Communication Using CORBA-ORB, JAVA-RMI and Socket)

  • 한윤기;구용완
    • 인터넷정보학회논문지
    • /
    • 제3권1호
    • /
    • pp.81-90
    • /
    • 2002
  • 대다수의 인터넷 기반의 분산 어플리케이션이나 클라이언트/서버의 응용은 부하균등, 통신 지연, 네트워크 결함 등의 문제점을 처리하여 사용자에게 서비스해야 한다. 또한 화상 회의, VOD, 병행 소프트웨어 공학과 같은 정교한 응용프로그램들은 추상적인 그룹 통신을 필요로 한다. 이러한 페러다임들을 현재의 CORBA 버전들은 적절히 수용하지 못한다. CORBA는 주로 Point-to-Point통신을 하기 때문에 분산 시스템에서 예측 행위를 하는 신뢰성 있는 응용 기술에 대한 구현은 지원하지 않는다. 따라서, 본 논문에는 분산 컴퓨팅 환경 하에서 CORBA-ORB를 이용한 그룹 통신, JAVA-RMI를 이용한 그룹 통신, 소켓을 이용한 그룹 통신 등을 설계 및 구현을 하였으며, 이에 따른 성능 분석을 실시하였다. 성능 분석은 객체의 증가에 따른 지연시간으로 측정하였고 CORBA의 ORB를 이용한 그룹 통신의 경우 평균은 14.5172msec, JAVA의 RMI를 이용한 그룹 통신의 경우 평균은 21.4085msec, 소켓을 이용한 그룹 통신의 경우 평균은 18,0714msec가 나왔다. 멀티캐스트와 UDP를 이용한 그룹 통신은 각각 0.2735msec, 0.2157msec로 측정되었음을 알 수 있다. 논문의 결과로 객체의 증가에 따라 CORBA-ORB 그룹 통신의 성능향상을 보였다. 본 연구는 결함 허용 클라이언트/서버 시스템. 그룹웨어, 텍스트 검색엔진. 금융 정보 시스템 등에 적용 가능하다.

  • PDF

이동통신 HLR 시스템에서의 효과적인 색인 및 백업 기법 (Effective Index and Backup Techniques for HLR System in Mobile Networks)

  • 김장환;이충세
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제9권1호
    • /
    • pp.33-46
    • /
    • 2003
  • HLR system은 이동전화 망에서 지속적으로 변하는 개별 가입자의 위치 정보를 관리한다. 이를 수행하기 위해, HLR database system은 table 관리 기능과 색인 관리 기능, 그리고 백업 관리 기능을 제공한다. 본 논문에서는, 이동 전화 번호(MDN : Mobile Directory Number)를 위한 적절한 객인 기법으로서 이단계 색인 기법의 사용과, 단말번호(ESN : Electronic Serial Number)를 위한 버켓 연결 해슁 기법을 제안한다. 이동 전화 번호(MDN)와 단말번호(ESN)는 HLR database system에서 key로 사용된다. 또한 HLR database transaction의 특성을 고려한 효율적인 백업 방법을 제안한다. 이단계 색인 기법은 기존의 T 트리 색인 기법보다 검색 속도와 기억 공간 사용 효율 측면에서 우수하다. 버켓 연결 해슁 기법은 기존의 변형된 선형 해슁 기법보다 삽입과 삭제 시의 오버헤드가 적다. 제안한 백업 방법에서는, 빈번한 위치 등록 기능 수행으로 인해 야기되는 성능 저하 문제론 해결하기 위해 두가지 종류의 갱신 플래그를 사용하였다. 100만 가입자 수용시. 제안 기법을 사용하게 되련 기존 기법보다 메모리 사용량 절감(62% 이상), 디렉토리 증가 작업(25만 번 이상)제거, 백업 작업 감소(80% 이상)를 제공받게 된다.

기록물의 검색 향상을 위한 패싯 개발에 관한 연구 - 대통령기록물을 중심으로 - (Research on the Development of Facets for Improvement in Searching Records: Focusing on Presidential Records)

  • 성효주;이해영
    • 한국기록관리학회지
    • /
    • 제17권2호
    • /
    • pp.165-188
    • /
    • 2017
  • 최근 이용자 중심 서비스의 중요성에 대한 인식이 증가함에 따라 검색의 효율성을 향상시킬 수 있는 검색도구에 대한 연구들이 많이 진행되고 있다. 본 연구에서는 검색의 효율성 향상을 위한 차세대 검색도구에서 패싯의 중요성을 감안하고, 특히 대통령중심제인 우리나라에서 대통령 기록의 중요성 측면에서 검색도구의 고도화가 필수 불가결하다는 판단 하에, 대통령기록을 사례로 다양한 정보원을 분석하여, 대통령기록의 검색시스템에 적용 가능한 다양한 패싯 요소들을 도출해보고자 하였다. 이를 위해 미국, 영국, 호주의 국가 기록관(National Archives)과 국가별 개별 대통령(수상) 기록관의 웹사이트를 살펴보고, 그 검색 옵션을 분석하였으며, 대통령기록 건명의 형태소 분석 결과와, 대통령기록관 이용자의 검색용어 및 정보공개청구 용어, 대통령기록관 포털의 검색 옵션 및 기록 기술과 메타데이터 등의 요소를 종합 분석하고 매핑하여 대통령기록의 특성에 기반한 패싯 요소를 도출하였다. 특히 본 연구의 의의는 대통령기록을 사례로 검색도구의 주요 요소로서의 다양한 패싯의 개발에 관한 방법론을 제시하고자 한 것이다.

유행성 질병이 공공도서관의 대출책수에 미치는 영향: 메르스 사태를 중심으로 (A Study on the Impact of the Epidemic Disease on the Number of Books Checked Out of the Public Libraries: Based on the Middle East Respiratory Syndrome Coronavirus)

  • 김완종
    • 정보관리학회지
    • /
    • 제32권4호
    • /
    • pp.273-287
    • /
    • 2015
  • 본 연구는 국민들에게 불안감을 야기하고 전반적인 사회활동을 위축시키는 메르스와 같은 질병의 유행이 공공도서관의 이용에 어떠한 영향을 주는지 알아보고자 하였다. 이를 위해 국립세종도서관에 위치하고 있는 "공공도서관 빅데이터 수집 및 분석 플랫폼"을 통해 전국 303개 공공도서관에서 수집된 18,711,453건의 대출기록을 분석하였다. 분석 결과는 다음과 같다. 첫째, 메르스가 유행했던 2015년도는 64,645.05권으로 2014년보다 하루 평균 6,300권 가량 대출책수가 감소하였다. 둘째, 2014년의 경우 7월 5일부터 8월 19일까지의 일평균 대출책수가 4월 4일부터 5월 19일까지와 5월 20일부터 7월 4일까지보다 많은 것으로 나타났다. 이는 학생들의 여름방학이 공공도서관의 대출책수 증가에 영향을 주었을 것으로 파악할 수 있다. 셋째, 메르스가 발생했던 2015년의 경우 메르스 유행 후 기간의 일평균 대출책수가 메르스 유행기간인 5월 20일부터 7월 4일까지보다 많은 것으로 나타났으나 메르스 유행 전 기간과는 유의한 차이가 존재하지 않았다. 넷째, 2014년과 2015년의 메르스 유행 전 기간의 일평균 대출책수와 2014년과 2015년의 메르스 유행 기간의 일평균 대출책수에는 유의한 차이가 없었으나, 2014년과 2015년의 메르스 유행 후 기간의 일평균 대출책수에서는 유의한 차이가 있었다. 연구 결과 국민들에게 불안감을 가져다 준 메르스는 질병의 유행 기간 보다는 오히려 유행 후 기간 동안 공공도서관의 일평균 대출책수에 영향을 주었음을 확인할 수 있었다.

MRI에 있어서 체동 아티팩트의 제거 (Cancellation of Motion Artifact in MRI)

  • 김응규
    • 대한전자공학회논문지SP
    • /
    • 제37권3호
    • /
    • pp.70-78
    • /
    • 2000
  • 본 연구에서는 촬상단면내의 평행이동에 기인한 MRI 아티팩트를 제거하는 새로운 방법을 제안한다 임상 진단에 있어서 종종 문제가 되고 있는 호흡에 따른 두뇌부분의 상하이동을 고려해서 위상 엔코드 축인 y 방향만의 강체의 평행이동을 취급한다 종래의 발견적인 반복위상탐색 처리법과는 달리, MRI 촬상과정과 화장 특성의 해석에 근거한 MRI 신호내의 체동성분과 화상성분을 단순한 대수연산에 의해 분리할 수 있는 새로운 구속조건을 도출한다 MRI 신호에 대해서 x 방향의 1차원 푸리에 변환을 행한 후의 y 방향 스펙트럼 위상값은 화상자신의 성분과 체동성분의 합이 되고 있다 한편 두뇌부위 등의 단층상에 있어서 주위의 피하지방 부분의 밀도는 거의 균일하다고 알려져 있어, 이 부위상에 있는 y 방향의 한 라인의 말도분포는 대칭모양으로 간주할 수 있다 밀도함수가 대칭인 경우 스펙트럼의 위상은 그 위치에 대하여 선형적으로 변화한다 따라서 이 선형함수로부터 벗어난 성분을 체동으로 분리할 수 있다. 이러한 구속조건에 기초를 둔 새로운 아티팩트의 제거방법이 본 연구에서 제안된다 최종적으로 phantom 화상을 사용한 시뮬레이션을 통해 본 방 법의 유효성을 나타낸다.

  • PDF

분산 모바일 멀티에이전트 플랫폼을 이용한 사용자 기반 디지털 라이브러리 구축 (A Personal Digital Library on a Distributed Mobile Multiagents Platform)

  • 조영임
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제31권12호
    • /
    • pp.1637-1648
    • /
    • 2004
  • 분산 환경에서 디지털 라이브러리 구축시 기존의 단일 에이전트를 이용한 클라이언트/서버 방식으로 시스템을 구축할 경우, 일차원적인 자료검색으로 인해 검색결과의 관련성이 없고, 검색 견과에 대한 사용자의 성향이 반영되지 않으며, 클라이언트가 서버에 접속할 때마다 인증을 받아야 하므로 다수의 서버 접근시 문서 처리 효율이 낮고 사용하기 불편하다는 문제점을 갖는다. 따라서 본 논문에서는 이의 해결을 위해 기존의 멀티 에이전트 플랫폼인 DECAF와 표준안으로 제시되는 모바일 ORB인 Voyager를 응용해 새로운 모바일 환경에 적합한 멀티 에이전트 플랫폼을 개발 제안하였고, 이를 이용한 사용자 기반의 디지털 라이브러리 시스템(PDS)을 구축하였다. 이러한 접근방법은 국내외적으로 처음 시도되는 연구이다. 새로운 플렛폼은 관련정보의 검색문제를 위해 신경회로망을 이용한 문서분류를 통해 관련 문서의 검색을 세분화시킴으로써 검색결과의 관련성을 높였고. 사용자 성향을 반영하기 위해 모듈화된 클라이언트를 구성하여 신경회로망을 이용함으로써 사용자의 성장과 탐색 결과를 최적화 시켰으며, 네트워크 문제를 위해 멀티에이전트 플랫폼과 모바일 클래스를 이용한 모바일 기능을 개발하였다. 또한 모바일 시스템과 멀티에이전트 시스템을 적절히 결합하고 멀티 에이전트 사이의 협상 알고리즘과 스케줄링 방법을 개발함으로써 제안한 플랫폼이 효율적으로 동작하도록 구성하였다. 시뮬레이션한 결과, 분산환경에서 모바일 서버의 개수와 에이전트의 개수가 늘어날수록 PDS는 기존의 디지털 라이브러리보다는 탐색시간이 훨씬 줄어들었고 결과에 대한 사용자 만족도도 기존 C/S 방식에 비해 약 4배정도 향상됨을 알 수 있었다

커뮤니티 주도적 과학 데이터 큐레이션 협업 환경의 개발 (Development of Collaborative Environment for Community-driven Scientific Data Curation)

  • 최동훈;박재원;김병규;신진섭
    • 한국콘텐츠학회논문지
    • /
    • 제17권9호
    • /
    • pp.1-11
    • /
    • 2017
  • 데이터 재사용 수요가 증가할수록 데이터 큐레이션의 중요성에 대한 인식은 점차 증가하고 있다. 데이터의 폭증으로 인해, 과학자들은 전체 노력의 90%를 자신의 연구에 필요한 데이터의 검색 및 수집에 들이고 있다. 이러한 노력을 절감시키기 위해, 본 논문에서는 과학 데이터의 재사용성을 높이는 데 필수적인 커뮤니티 주도적 데이터 큐레이션 협업 환경의 개발 및 적용에 대해 다룬다. 본 과학 큐레이션 협업 환경은 특정연구 분야의 연구 결과 간에 상호 연관성을 포획하고 재구성하기 위해 데이터 (또는 데이터 컬렉션) 및 관련 문헌 간의 상호 연결에 초점을 맞추고 있다. 또한 풍부한 문맥 정보를 메타데이터로 제공하여 사용자의 데이터 이해를 돕는다. 데이터 및 데이터-문헌 간의 상호 연결을 영구적으로 접근할 수 있도록 보장하기 위해, DOI 시스템을 이용하여 실현하였다. 이 큐레이션 협업 환경은 국내외 연구자들로 구성된 무정형 단백질 연구 그룹에 의해 커뮤니티 주도적인 큐레이션 데이터베이스 구축에 적용되었다. 이렇게 구축된 데이터 베이스는 무정형 단백질 연구자의 과학적 발견을 위한 데이터 검색 및 수집 노력을 절감해 줄 것이다.

다중요인모델에 기반한 텍스트 문서에서의 토픽 추출 및 의미 커널 구축 (Multiple Cause Model-based Topic Extraction and Semantic Kernel Construction from Text Documents)

  • 장정호;장병탁
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제31권5호
    • /
    • pp.595-604
    • /
    • 2004
  • 문서 집합 내의 개념 또는 의미 관계의 자동 분석은 보다 효율적인 정보 획득과 단어 이상의 개념 수준에서의 문서간 비교를 가능케 한다. 본 논문에서는 다중요인모델에 기반 하여 텍스트 문서로부터 토픽들을 추출하고 이로부터 의미 커널(semantic kernel)을 구축하여 문서간 유사도를 측정하는 방안을 제시한다. 텍스트 문서는 내재된 토픽들의 다양한 결합에 의해 생성된다고 가정하며 하나의 토픽은 공통 주제에 관련되거나 적어도 자주 같이 나타나는 단어들의 집합으로 정의한다. 다중요인모델은 은닉층을 갖는 하나의 네트워크 형태로 표현되며, 토픽을 표현하는 단어 집합은 은닉노드로부터의 가중치가 높은 단어들로 구성된다. 일반적으로 이러한 다중요인 네트워크에서의 학습과 추론과정을 용이하게 하기 위해서는 근사적 확률 추정 기법이 요구되는데, 본 논문에서는 헬름홀츠 머신에 의한 방법을 활용한다. TDT-2 문서 집합에 대한 실험에서 토픽별로 관련 있는 단어 집합들을 추출할 수 있었으며, 4개의 텍스트 집합에 대한문서 검색 실험에서는 다중요인모델의 분석결과에 기반 한 의미 커널을 사용함으로써 기본 벡터공간 모델에 비해 평균정확도 면에서 통계적으로 유의한 수준의 성능 향상을 얻을 수 있었다.

광대역 ISDN용 MPEG 오디오-비쥬열 대화형 통신단말의 설계 및 구현 (A MPEG Audio-Visual Conversational Communication Terminal on the B-ISDN Environment)

  • 황대환;조규섭
    • 한국정보처리학회논문지
    • /
    • 제5권8호
    • /
    • pp.1960-1971
    • /
    • 1998
  • 광대역 ISDN에서 사용될 수 있는 멀티미디어 통신서비스로서 Video on Demand(V0D)와 같은 검색형 분배서비스와 영상전화, 다지점 영상회의와 같은 실시간 대화형 서비스를 대상으로 활발한 연구, 개발이 이루어지고 있다. V0D 서비스에 대한 연구는 Digital Audio-Visual Council(DAVIC)에서 V0D 서버, 전달 망, 그리고 Set-Top Box(STB) 등을 포함한 전체 시스템에 대한 규격을 확정하였고 대화형 멀티미디어 통신단말은 ITU-T SG16에서 H.300 계열 단말의 표준을 대부분 완료한 상태이다. 그러나 이들 기구에서 권고하고 있는 멀티미디어 통신단말의 구조는 주 연구대상의 차이로 인해, 검색형 분배서비스와 대화형 통신서비스를 모두 제공할 수 있는 효율적인 구성 형태를 갖고 있지 못하다. 본 논문은 ITU-T, DAVIC, ATM Forum 등의 권고 및 규격을 면밀히 분석한 후, 동일한 멀티미디어 통신단말에서 V0D 및 대화형 통신서비스를 제공할 수 있는 효율적인 단말의 구조를 제안하고 설계, 구현하였다. 광대역 ISDN을 대상으로 한 통신단말은 범용 PC에 탑재되는 두 개의 add-on 카드로 구현하였으며, ATM 접속을 통한 V0D 및 일-대-일 대화형 멀티미디어 통신 세션 설정와 실험을 통해 기능의 검증을 완료하였다.

  • PDF