• 제목/요약/키워드: 검색 알고리즘

검색결과 1,682건 처리시간 0.031초

용어가중치 결합이 검색 효율성에 미치는 영향 연구 (The Impact of Combining Term Wights on Retrieval Effectiveness)

  • 최성환;정영미
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 봄 학술발표논문집 Vol.29 No.1 (B)
    • /
    • pp.481-483
    • /
    • 2002
  • 본 논문에서는 데이터 결합 영역에서 문서값을 정규화 하는 기법과 결합함수에 따라 용어가중치 결합이 검색성능에 어떤 영향을 미치는가를 분석하였으며, 특히 용어가중치 결합이 실질적으로 효율적인가를 성능 향상률 측면과 검색시스템의 효율성 측면에서 검증하고, 성능이 향상된 용어가중치 결합의 특징을 분석하였다. 실헙결과 대부분의 장어가중치 결합은 문서값 정규화 기법과 실험집단에 관계없이 높은 성능 향상률을 보이지 않았다. 특히 단일가중치고 높은 검색성능을 보였던 상위 가중치 알고리즘들은 다른 가중치 알고리즘과 결합할 경우 두드러진 성능 향상률을 보이지 않았다. 검색시스템의 효율성 측면에서 용어가중치 결합을 평가한 결과 문헌 내 단어빈도를 최대단어 빈도로 정규화한 가중치 알고리즘이 코사인 정규화 기법을 적용한 가중치 알고리즘들과 결합될 때 5개 실험집안에서 최적 단일가중치 보다 2% 이상 높은 성능을 보였다. 이는 서로 다른 특성을 지니는 용어가중치 알고리즘들이 장단점을 보완하여 검색성능을 향상시킨 수 있다는 것을 의미한다. 그러나 용어가중치 결합의 효율성은 컬렉션과 가중치 알고리즘의 특성에 의존적이었으며, 비록 각 용어가중치 결합의 성능이 높게 나타날지라도 최적의 성능을 보인 달일가중치와 비교하면 그 성능 차이가 미미하거나 낮아서 대부분의 용어가중치 결합이 실질적으로 효과적이지 못하였다.

  • PDF

협력적 여과 시스템을 위한 효과적인 사용자 군집 알고리즘 (Effective User Clustering Algorithm for Collaborative Filtering System)

  • 고수정;임기욱;이정현
    • 정보처리학회논문지B
    • /
    • 제8B권2호
    • /
    • pp.144-154
    • /
    • 2001
  • 협력적 여과 시스템은 사용자가 검색하고 읽었던 웹문서를 기반으로 사용자 군집을 생성하여 웹문서의 정확한 추천을 가능하게 한다. 이러한 목적으로 설계된 다양한 알고리즘이 있으나 속도가 느리거나 정확도가 낮다는 등의 단점이 있다. 본 논문에서는 이러한 단점을 보완하기 위하여 협력적 여과 시스템을 위한 효과적인 사용자 군집 알고리즘인 CUG알고리즘은 사용자 군집을 생성하기 위해 Apriori 알고리즘, Native Bayes 알고리즘을 이용한다. Apriori 알고리즘은 연관 단어 지식 베이스를 구축하고, Native Bayes 알고리즘은 구축된 연관 단어 지식 베이스에 가중치를 추가하며, 사용자가 검색하여 읽은 웹문서를 클래스별로 분류한다. CUG 알고리즘은 분류된 웹문서를 기반으로 하여 사용자 군집을 만든다. 이러한 방법으로 설계된 CUG 알고리즘은 사용자들이 사용할 문서를 미리 검색하여 저장함에 의해 정보검색의 효율성을 향상시키는데 사용될 수 있다. 본 논문에서 설계한 CUG 알고리즘의 선능을 평가하기 위하여 기존의 K-means 방법과 Gibbs샘플링 방법에 의한 군집과 비교한다.

  • PDF

링크 구조 기반의 순위 알고리즘을 이용한 메타 검색 에이전트 (The Meta Search Agent using Ranking Algorithm with Link Structure Analysis)

  • 김형욱;김민구;최경희
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 가을 학술발표논문집 Vol.29 No.2 (2)
    • /
    • pp.373-375
    • /
    • 2002
  • 하이퍼 텍스트 구조의 특성을 이용한 순위 평가 알고리즘 중의 하나인 HITS 알고리즘은 웹 페이지들의 상호간에 연결된 링크 정보로부터 웹 문서들의 중요도를 평가하여 순위에 따른 결과를 제시한다. 그러나 초기의 HITS 알고리즘은 문서 내의 링크 빈도 수만을 고려하고, 입력 값으로 주어지는 웹 문서 집합의 특성에 의존적인 단점을 가지고 있다. 본 논문에서는 여러 웹 검색 엔진들로부터 얻어진 문서 집합에 수정된 HITS 알고리즘을 수행하는 메타 검색 에이전트를 설계하여 보다 나은 검색 성능을 구하고, 결과의 지역성을 보완한다.

  • PDF

내용 기반 멀티미디어 정보 검색을 위한 근사 k-최근접 데이타 탐색 알고리즘 (An Approximate k-Nearest Neighbor Search Algorithm for Content- Based Multimedia Information Retrieval)

  • 송광택;장재우
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제27권2호
    • /
    • pp.199-208
    • /
    • 2000
  • 내용 기반 멀티미디어 정보 검색에서 유사성에 기반한 k-최근접 데이타 탐색 질의는 매우 중요한 질의이다 일반적으로 멀티미디어 데이타는 고차원 특정 벡터로 표현되기 때문에 기존의 k-최근접 탐색 알고리즘은 멀티미디어 정보 검색에 효율적이지 못하다. 따라서 이러한 응용을 위해서는 다소 근사적 검색 결과를 가져오더라도 빠른 검색 성능을 제공하는 근사 k-최근접 탐색 알고리즘이 요구된다. 이를 위해 본 논문에서는 고차원 데이타를 위한 새로운 근사 k-최근접 탐색 알고리즘을 제안한다. 아울러, 제안하는 근사 k-최근접 탐색 알고리즘을 기존의 알고리즘과 검색 성능변에서 성능 평가를 수행한다. 성능 평가 결과, 기존 알고리즘의 검색 성능을 크게 개선할 수 있었다.

  • PDF

대화형 유전자 알고리즘을 이용한 감성적 음악검색 (Emotional Musical Expression Retrieval Using Interactive Genetic Algorithm)

  • 이준승;조성배
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 가을 학술발표논문집 Vol.29 No.2 (2)
    • /
    • pp.175-177
    • /
    • 2002
  • 본 논문에서는 대화형 유전자 알고리즘을 이용한 음악검색 시스템을 개발한다. 기존의 음악검색 시스템은 찾고자 하는 음악에 대한 정보를 필요로 하기 때문에 사용자가 시스템이 요구하는 정보를 가지고 있지 않는 경우 검색이 힘들다. 하지만 대화형 유전자 알고리즘을 통한 질의어 생성방식을 이용하면 사용자의 주관적 감정에 의한 음악검색을 할 수 있다. 먼저 사용자가 초기 유전자형에 의해 선택된 음악을 듣고 주관적인 평가를 내리면 이 평가값으로 유전자 알고리즘을 이용하여 질의어를 생성, 가장 가까운 음악을 검색하여 들려준다. 사용자는 이러한 과정을 반복하여 자신의 주관적 평가에 따라 진화되는 유전자형에 의해 원하는 음악을 점진적으로 검색한다. 이를 통해 사용자는 전문적인 음악적 지식이나 찾고자 하는 음악에 대한 특별한 정보없이 개인의 주관에 의한 검색을 할 수 있을 것이다.

  • PDF

병렬 정보검색 시스템의 순차적인 검색엔진 알고리즘의 병렬화를 위한 연구 (A Study for Parallelizing Sequential Algorithms of Search Engine in Parallel Information Retrieval System)

  • 김석영;박미영;박혁로;정인상
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2007년도 추계학술발표대회
    • /
    • pp.693-696
    • /
    • 2007
  • 대규모 데이터를 효율적으로 검색하기 위한 병렬 정보검색 시스템에서는 하드웨어 확장으로 인한 병렬화로 시스템 전체의 작업 처리량을 증가시켰다. 그러나 병렬 시스템 상에서 수행되는 검색엔진의 알고리즘들은 여전히 순차적으로 수행되기 때문에, 사용자의 개별적인 질의처리 시간은 단축되지 않는다. 본 연구는 검색엔진의 병렬화를 위하여 사용자 질의처리 과정과 역색인 파일처리 과정의 순차 알고리즘들을 조사하여 병렬화의 필요성과 가능성을 평가한다. 이러한 평가는 병렬 정보검색 시스템에서 수행되는 순차 알고리즘들의 효과적이고 체계적인 병렬화를 도모하고, 보다 효율적인 병렬 정보검색 시스템의 구축을 가능하게 한다.

  • PDF

접미사 배열에서의 패턴 검색 알고리즘 (Pattern Search Algorithm in Suffix Arrays)

  • 최용욱;박근수
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 봄 학술발표논문집 Vol.31 No.1 (A)
    • /
    • pp.958-960
    • /
    • 2004
  • 접미사 배열은 긴 문자열에 대한 효율적인 패턴 검색을 위해 널리 쓰이는 자료 구조로서 지금까지 접미사 배열을 이용하여 텔스트 T 안에서 패턴 P를 검색하는 O(|P|ㆍ|∑|), O(|P|ㆍlog|∑|)시간 알고리즘(|∑|:알파벳 크기)들 이 발표되었다. 본 논문에서는 O(|P|)시간 알고리즘을 제시하고, 기존의 알고리즘들과 비교한 실험 결과를 보여준다.

  • PDF

퍼지 ART 신경망을 이용한 내용기반 영상검색 (Contents-based Image Retrieval using Fuzzy ART Neural Network)

  • 박상성;이만희;장동식;김재연
    • 융합신호처리학회논문지
    • /
    • 제4권2호
    • /
    • pp.12-17
    • /
    • 2003
  • 본 논문은 퍼지 ART 신경망 알고리즘을 이용하여 내용기반 영상을 검색하는 연구를 제시한다. 대용량의 영상 데이터베이스를 검색할 때, 클러스터링은 빠른 검색을 위해 중요하다. 그러나 많은 양의 영상 데이터를 적절하게 클러스터링 하는 것은 상당히 어렵다. 기존의 유사도에 따른 검색 방법은 검색의 정확도가 떨어지고 검색시간이 많이 걸리는 단점이 있기 때문에 이러한 단점을 보완하는 방법이 필요하다. 본 논문에서는 앞서 언급한 문제점을 보완하기 위하여 신경망 알고리즘을 사용한 내용기반 영상검색 시스템을 제안한다. 퍼지 ART 신경망 알고리즘을 사용한 본 검색 시스템에서는 색상과 질감을 검색에 필요한 특징치로 잡아 데이터를 0과 1사이의 데이터로 정규화 하여 신경망 알고리즘의 입력 데이터로 넣어서 영상을 클러스터링 한 후 검색을 실시하였다 300개의 영상을 가지고 실험한 결과 약 87%의 검출률을 보여 주었다.

  • PDF

소셜 관계 랭크 및 토픽기반_소셜 관계 랭크 알고리즘; 소셜 검색을 향해 (SRR(Social Relation Rank) and TS_SRR(Topic Sensitive_Social Relation Rank) Algorithm; toward Social Search)

  • 박건우;정재학;이상훈
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2009년도 춘계학술발표대회
    • /
    • pp.364-368
    • /
    • 2009
  • "소셜 네트워크(Social Network)와 검색(Search)의 만남"은 현재 인터넷 상에서 매우 의미 있는 두 영역의 결합이다. 이와 같은 두 영역의 결합을 통해 소셜 네트워크 내에서 친구들의 생각이나 관심사 및 활동을 검색하고 공유함으로써 검색의 효율성과 적합성을 높이기 위한 연구들이 활발히 수행되고 있다. 본 논문에서는 일반적인 소셜 관계 랭크(SRR : Social Relation Rank) 및 토픽이 반영된 소셜 관계 랭크(TS_SRR : Topic Sensitive_Social Relation Rank) 알고리즘을 제안한다. SRR은 소셜 네트워크 내에 존재하는 웹 사용자들의 내재적인 특성 및 검색 성향 등에 대한 관련성(또는 유사정도)을 수치로 산정한 '소셜 관계 지수(SRV : Social Relation Value)'에 랭킹(Ranking)을 부여한 것을 의미한다. 제안하는 알고리즘의 검색 적용 가능성을 검증하기 위해 첫째, 웹 사용자간 직접 또는 간접적인 연결로 구성된 소셜네트워크를 구성 한다. 둘째, 웹 사용자들의 속성에 내재된 정보를 이용하여 토픽별 SRV를 산정한 후 랭킹을 부여하고, 토픽별 변화되는 랭킹에 따라 소셜 네트워크를 재구성 한다. 마지막으로 (TS_)SRR과 웹 사용자들의 검색 패턴(Search Pattern)을 비교 실험 한다. 실험 결과 (TS_)SRR이 높은 웹 사용자 간에는 검색 패턴 또한 유사함을 확인 하였다. 결론적으로 (TS_)SRR 알고리즘을 기반으로 관심분야에 연관성이 높은, 즉 상위에 랭크 된 웹 사용자들을 검색하여 검색 패턴을 공유 또는 상속받는 다면 개인화 검색(Personalized Search) 및 소셜 검색(Social Search)의 효율성과 신뢰성 향상에 기여 할 수 있다.

실시간 시뮬레이션을 위한 검색 기법들의 속도 연구 (A Study on Real-time Speed of Searching Algorithms)

  • 윤석준;강현주
    • 한국시뮬레이션학회:학술대회논문집
    • /
    • 한국시뮬레이션학회 1999년도 추계학술대회 논문집
    • /
    • pp.254-262
    • /
    • 1999
  • 실시간 시뮬레이션에서 주어지는 다양한 종류의 불연속적인 파라미터 값을 가지는 데이터 테이블에서 실시간의 제약 하에서의 검색을 수행하기 위해서는 최적의 기법이 요구된다. 실시간의 제약 하에서 최적 기법의 기준이 되는 것은 보통의 알고리즘들과는 달리 평균 속도가 아니라 worst case에서의 속도가 된다. 검색 알고리즘 들은 iteration을 거치게 되므로 총 탐색에 걸리는 시간은 iteration의 수(logical speed)와 1 probe를 수행하는 데 걸리는 시간(실제 수행속도)의 곱으로 정의된다. 본 연구에서 총 탐색에 걸리는 시간을 이론적으로 계산한 검색 속도 기존의 수행한 수치비교시험의 결과와 대체로 일치하였고, 이분 검색법이 iteration의 수와 실제 수행시간 모두에 있어서 가장 우수하다. 한편, 검색하고자 하는 파라미터 값의 dynamics를 이용하여 주어진 데이터 테이블 내의 검색 영역을 축소시키는 dynamic-window 개념을 도입하여 검색 알고리즘의 속도를 향상시킬 수 있었다. 이 개념의 도입은 데이터 테이블의 형태에 민감한 보간 검색법(interpolation method)과 그 응용 기법들에 대해 탁월한 효과를 나타내었다. 결론적으로 일반적 데이터 테이블에 있어서는 이분 검색법이 logical speed와 실제 수행속도가 우수하고, dynamic-window 개념을 도입한 보간 검색법과 그 변형들은 logical speed가 탁월하게 향상된다.

  • PDF