• 제목/요약/키워드: 검색 알고리즘

검색결과 1,682건 처리시간 0.029초

질의 재구성 알고리즘의 검색성능을 측정하기 위한 새로운 평가 방법의 개발 (Development of New Retieval Performance Measures for Query Reformulation Algorithms)

  • 김남호
    • 한국정보처리학회논문지
    • /
    • 제4권4호
    • /
    • pp.963-972
    • /
    • 1997
  • 정보 검색에서 대부분의 질의 재구성 알고리즘들은 초기 입력 문서나 피드백 문을 이용 하여 질의를 재구성하므로, 질의 재구성 알고리즘의 검색 성능은 입력되는 문서들의 질 에 따라 달라진다. 본 연구에서는 질의 재구성 알고리즘의 입력 문서에 대한 성능 감도를 새로운 검색성능 평가방법을 개발하여 분석하였다. 또한 CIRA라고 불리는 새로운 평가기준을 개발하여 질의 재구성 사이의 성능 변화추이를 분석하였다. 세가지의 질의 재구성 알고리즘(질의나무 (query tree), DNF 방법, Dillon 방법)의 감도와 성능변화를 테시트 세트인 CACM, CISI, Medlars 상에서 분석하였다. 세 실험에서 질의나무가 가장 작은 CIRA를 취득했으며, 감도 분석에서는 비록 다른 알고리즘과 차이는 적으나 가장 높은감도를 나타냈다.

  • PDF

정보검색 성능 향상을 위한 단어 중의성 해소 모형에 관한 연구 (Improving the Retrieval Effectiveness by Incorporating Word Sense Disambiguation Process)

  • 정영미;이용구
    • 정보관리학회지
    • /
    • 제22권2호
    • /
    • pp.125-145
    • /
    • 2005
  • 이 연구에서는 문헌 및 질의의 내용을 대표하는 주제어의 중의성 해소를 위해 대표적인 지도학습 모형인 나이브 베이즈 분류기와 비지도학습 모형인 EM 알고리즘을 각각 적용하여 검색 실험을 수행한 다음 주제어의 중의성 해소를 통해 검색 성능의 향상을 가져올 수 있는지를 평가하였다. 실험문헌 집단은 약 12만 건에 달하는 한국어 신문기사로 구성하였으며, 중의성 해소 대상 단어로는 한국어 동형이의어 9개를 선정하였다. 검색 실험에는 각 중의성 단어를 포함하는 18개의 질의를 사용하였다. 중의성 해소 실험 결과 나이브 베이즈 분류기는 최적의 조건에서 평균 $92\%$의 정확률을 보였으며, EM 알고리즘은 최적의 조건에서 평균 $67\%$ 수준의 클러스터링 성능을 보였다. 중의성 해소 알고리즘을 통합한 의미기반 검색에서는 나이브 베이즈 분류기 통합 검색이 약 $39.6\%$의 정확률을 보였고, EM 알고리즘 통합 검색이 약 $36\%$의 정확률을 보였다. 중의성 해소 모형을 적용하지 않은 베이스라인 검색의 정확률 $37\%$와 비교하면 나이브 베이즈 통합 검색은 약 $7.4\%$의 성능 향상률을 보인 반면 EM 알고리즘 통합 검색은 약 $3\%$의 성능 저하율을 보였다.

고속 라우터를 위한 향상된 비트맵 룩업 알고리즘 (Enhanced Bitmap Lookup Algorithm for High-Speed Routers)

  • 이강우;안종석
    • 정보처리학회논문지A
    • /
    • 제11A권2호
    • /
    • pp.129-142
    • /
    • 2004
  • 인터넷 회선의 고속화에 따라 패킷을 초당 기가비트 이상의 속도로 전송하는 라우터에 대한 연구가 활발하다. 본 논문에서는 라우터의 병목인 최장 프리픽스 검색(LPM : longest prefix matching)을 효율적으로 수행하기 위해 제안된 비트맵 트라이(Bitmap Trie) 알고리즘을 혁신적으로 향상시킨 방법을 제시한다. 이 방법은 검색시간을 단축하기 위하여 다음과 같은 세 가지 기법을 적용하였다. 첫째, 카운트 테이블을 추가하여 기존 알고리즘에서의 과도한 시프트 연산을 제거하여 프로세서 내의 처리시간을 단축했다. 두 번째는 트랜스퍼 테이블내의 중복된 포워딩 정보를 제거하여 메모리 효율을 증가시켰으며, 마지막으로, 포워딩 정보에 대한 접근빈도에 따라 검색범위를 다원화하여 데이터 접근을 최적화하였다. 또한, 신뢰도가 가장 놀은 실행-구동 시뮬레이션 방법을 채택함으로써 검색의 지연요소를 발생 원인별로 세분하여 알고리즘이 실행되는 과정을 면밀하게 분석할 수 있었다. 실험 결과는 실제 시스템으로부터 실측한 결과와 비교하는 검증과정을 거쳤으며, 그 결과 기존 알고리즘에 비해 검색 수행시간을 약 82% 단축한 알고리즘을 개발하였다.

Backtracking을 이용한 모바일 에드혹 네트워크에서 Chord 검색 방법 (Backtracking Chord over Mobile Ad-hoc Network)

  • 이세연;장주욱
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 봄 학술발표논문집 Vol.31 No.1 (A)
    • /
    • pp.517-519
    • /
    • 2004
  • Chord(6)는 N개의 노드로 이루어진 P2P(Peer-to-Peer)네트워크에서 검색에 사용되는 메시지를 O(logN)으로 줄인 P2P 검색 알고리즘이다. 하지만 모바일 Ad-hoc 네트워크에 이를 적용할 경우 검색 성공률이 매우 떨어져 (1000개의 노드가 도보속도(2m/s)로 움직이는 경우: 검색 성공률 30%이하)P2P 검색이 거의 이루어지지 않는 문제점이 발생한다. 본 논문에서는 이 같은 문제점을 극복하기 위한 알고리즘인 Backtracking Chord을 제안한다. Backtracking Chord 방식은 O(logN)메시지를 사용하여 순차적으로 t번까지 검색을 요청함으로써(t: Timeout의 횟수(0 < t< logN)) t에 따라 최고 88%(t>4)까지 검색 성공률을 높일 수 있다.

  • PDF

감성기반 영상검색을 위한 대화형 유전자 알고리즘의 적용 (Application of Interactive Genetic Algorithm to Image Retrieval based on Emotion)

  • 이주영;조성배
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제26권3호
    • /
    • pp.422-430
    • /
    • 1999
  • 멀티미디어 영상검색 중 영상의 내용을 기반으로 한 검색방법에 관한 연구가 활발히 진행되고 있다. 이는 기존의 키워드기반 영상검색 방법에 비해 효율적인 관리와 검색 방법을 제공하고 있다. 그러나 대부분의 방법이 단순한 공학적 방법에 치우쳐 사람의 감성과는 무관한 검색 결과를 제공한다. 이러한 문제점을 해결하기 위해 본 논문에서는 대화형 유전자 알고리즘을 도입하여 검색과정에 사람의 감성을 반영할 수 있는 방법을 제안한다. 이 방법은 구체적으로 표현될 수 있는 영상 뿐 아니라 우울한 느낌의 영상, 즐거운 느낌의 영상과 같은 추상적인 느낌의 영상을 검색할수 있도록 한다. 2000개의 영상으로 이루어진 데이터베이스로 실험한 결과 , 제안한 방법이 유용함을 알 수 있었다.

수식 관계를 이용한 키워드 추출을 통한 검색 과정의 효율성 향상 (Keyword Extraction Using Modifying Relation to Improve Search Experience)

  • 문욱성;이신목
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2007년도 가을 학술발표논문집 Vol.34 No.2 (C)
    • /
    • pp.228-232
    • /
    • 2007
  • 정보화 시대에 방대한 양의 정보에서 필요한 정보를 효율적으로 찾아내는 것은 그 무엇보다도 중요하다. 이를 위해 많은 검색 엔진이 효율적인 검색 결과 제공을 위해 노력하고 있지만 그 인터페이스의 문제로 인하여 사용자가 검색결과를 효율적으로 받아들이기 어려우며 또한 원하는 정보를 검색하기 위해서는 일정 수준 이상의 검색 능력을 필요로 한다. 이 논문에서는 기존의 검색 엔진의 인터페이스 변경을 통하여 시각적인 연관성 정보를 제공하며 이를 통해 사용자가 검색 능력에 구애받지 않고 정확한 답을 얻을 수 있도록 유도한다. 또한 이 과정에서 기존의 키워드 추출 알고리즘의 문제점을 발견하여 이를 단어간의 수식 관계를 이용하여 해결하였다. 또한 단어간의 수식 관계를 이용하여 효율적으로 문서간의 연관성을 생성할 수 있는 알고리즘을 제시하였다.

  • PDF

관광지 검색을 위한 이미지비교와 GPS기술 (Image comparison and GPS technology for Search attractions)

  • 이건희;하진영
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2011년도 추계학술발표대회
    • /
    • pp.403-406
    • /
    • 2011
  • 대한민국의 스마트폰 보유자 수는 1300만 명 이상으로 세계최고의 수준을 자랑하고 있다. 그에 따라 스마트폰의 다양한 기능을 활용해 손쉽게 필요한 정보를 얻을 수 있어졌다. 본 논문서는 스마트폰 의 GPS기능과 카메라 기능을 활용해 쉽고 새로운 방법으로 서울시관광지를 검색 할 수 있는 기능을 제안한다. 기존에는 관광지의 이름을 이용해서 검색하는 방법이 일반적이었다. 검색의 정확성을 요할 수 있지만 사용자가 관광자의 이름을 모르는 상활에서는 검색에 어려움이 있었다, 하지만 이미지를 이용해 관광지를 검색하므로 사진 한 장만 있으면 바로 이미지의 검색이 가능해서 글자 검색의 한계를 극복 할 수 있었다. 논문에서는 이미지 비교알고리즘 중 색의 분포도를 이용한 이미지 비교알고리즘을 기술하고자 한다. 그리고 안드로이드의 GPS기능을 이용해 사용자의 위치와 관광지의 위치를 구글맵에 표시해서 사용자가 관광지를 보다 쉽게 찾아갈 수 있는 방법에 대해서도 기술했다.

슈퍼피어를 이용한 모바일 P2P시스템을 위한 효율적인 플러딩 알고리즘 (Efficient Flooding Algorithm for Mobile P2P Systems using Super Peer)

  • 강소영;이광조;양성봉
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제16권2호
    • /
    • pp.217-221
    • /
    • 2010
  • 다양한 종류의 새로운 모바일 기기의 등장과 이들 기기들의 사용자의 증가에 따라 모바일 P2P 시스템과 관련된 연구가 활발히 진행되고 있다. 본 논문에서는 모바일 환경에서 double-layered 슈퍼 피어 시스템을 위한 새로운 검색 알고리즘을 제안한다. 제안한 검색 알고리즘에서는 전체 실험 영역을 그리드 셀로 분할하며 셀들은 같은 크기를 가지고 있다. 그리드는 모바일 기기의 통신 반경과 피어들의 수를 고려하여 적절히 구성된다. 제안한 검색 알고리즘은 방향 분할 플러딩으로서 검색시 셀들의 검색 방향을 포함하는 방법을 기반으로 한다. 이 방법은 성공적으로 네트워크의 부하를 줄였으나 낮은 검색 성공률을 보여준다. 성공률을 보다 개선하기 위해 슈퍼 피어를 위한 bridge-peer table과 n-way 검색을 활용하였다. 그 실험결과 제안한 알고리즘은 기존의 double-layered 시스템에 비하여 평균 20~30%의 메시지 패킷수가 감소되었음을 보여주었다. 성공률 역시 double-layered 시스템에 비해 약2~5% 개선되었다.

웹 문서 중요도 평가를 위한 적합도 향상 HITS 알고리즘 설계 (Design of Advanced HITS Algorithm by Suitability for Importance-Evaluation of Web-Documents)

  • 김분희;한상용;김영찬
    • 한국전자거래학회지
    • /
    • 제8권2호
    • /
    • pp.23-31
    • /
    • 2003
  • 링크 기반 검색엔진은사용자의 질의어와 관련된 웹 문서들의 링크 정보를 이용하여 순위를 생성한다. 이러한 링크기반 웹 문서의 특성을 이용한 대표적인 순위 평가 알고리즘. HITS는 웹 페이지들 간의 상호 연결된 링크 정보로부터 웹 문서들의 중요도를 평가하고, 순위 정보에 따른 결과를 제시한다. 이러한 HITS 알고리즘의 문제점은 문서 내의 링크 빈도 수만을 고려하고, 입력 값으로 주어지는 웹 문서 집합의 특성에 의존적이라는 것이다. 본 논문에서는 링크기반 웹 검색 엔진들로부터 얻어진 문서 집합에 대해 질의와 검색결과 간의 적합도를 향상시킨 HITS 알고리즘을 수행하는 검색 에이전트를 설계하였다. 이로써 향상된 검객 성능과 결과의 지역성을 보완한다.

  • PDF

MSMP 알고리즘과 RIFLE 알고리즘의 구현 및 성능비교 평가 (Implementation and Performance Evaluation of Comparing MSMP with RIFLE Algorithm)

  • 김동희;원영상;고영웅;김진
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 가을 학술발표논문집 Vol.31 No.2 (2)
    • /
    • pp.304-306
    • /
    • 2004
  • 생물정보학에서 서열의 유사성을 예측하는 것은 가장 중요한 문제 중의 하나이다. 염기 서열의 유사성을 검색하는 유용한 검색도구들에는 BLAST와 FASTA 등이 있으며 이러한 도구들은 새로운 유기체에 대한 실제 염기 서열을 필요로 한다. 이 경우 서열을 얻기 위한 sequencing 작업이 필요로 하며 시간적인 면에 있어서 상당한 비용을 요구한다. 본 논문에서는 sequencing 작업을 하지 않고 간단한 실험에서 얻을 수 있는 부분적인 Sequence 정보만을 대상으로 데이터 베이스에서 검색을 할 수 있는 두 개의 RIFLE(Rapid Identification of Microorganisms by Fragment Length Evaluation), MSMP(Maximum Site Matching Problem) 알고리즘을 구현하고 실험을 통해 두 알고리즘을 비교 평가한다. 실험결과 RIFLE 알고리즘이 수행 속도 면에서 빠른 반면 MSMP가 산출한 결과에 비해서 신뢰성이 떨어짐을 확인하였다.

  • PDF