• 제목/요약/키워드: 검색 알고리즘

검색결과 1,682건 처리시간 0.027초

검색어의 연관법칙 (ARMS : Association Rule for sMall Set)

  • 문상준;최재걸
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 가을 학술발표논문집 Vol.31 No.2 (2)
    • /
    • pp.10-12
    • /
    • 2004
  • 검색엔진에 사용자가 입력한 검색어를 분석하면 상호 연관이 있는 검색어들을 찾아낼 수 있다. 검색어들간의 상호 연관성을 찾기 위해서 데이타 마이닝 분야의 연관법칙을 위한 알고리즘을 적용하였다. 그러나 이 알고리즘들은 모두 일정 횟수 이상 검색된 검색어간의 연관법칙에 집중되어 있어서 일정 횟수 이상 검색되지 않은 검색어들은 버려진다. 이 연구에서는 이런 검색어들을 스몰 셋(small set)이라고 정의하고 스몰 셋의 연관법칙을 찾기 위한 방법을 제시한다. 실험결과는 이 연구에 제시한 방법이 효과적으로 동작하는 것을 입증해준다.

  • PDF

비디오 데이터베이스에서 이동 객체의 유사 부분 움직임 궤적을 위한 N-워핑 검색 (N-Warping Searches for Similar Sub-Trajectories of Moving Objects in Video Databases)

  • 심춘보;장재우
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 봄 학술발표논문집 Vol.29 No.1 (B)
    • /
    • pp.124-126
    • /
    • 2002
  • 본 논문에서는 비디오 데이터가 지니는 이동 객체의 움직임 궤적(moving objects'trajectories)에 대해 유사 부분 움직임 궤적 검색을 효율적으로 지원하는 N-워핑(N-warping) 알고리즘을 제안한다. 제안하는 알고리즘은 기존의 시계열 데이터베이스에서 유사 서브시퀸스 검색을 위해 사용되었던 타임 워핑 변환 기법(time-warping transformation)을 변형란 알고리즘이다. 또한 제안하는 알고리즘은 움직임 궤적을 모델링하기 위해 사용되는 단일 속성(property)인 각도뿐만 아니라, 거리와 시간과 같은 다중 속성을 지원하며, 사용자 질의에 대해 유사 부분 움직임 궤적 검색을 가능하게 하는 근사 매칭(approximate matching)을 지원한다

  • PDF

멜로디 라인의 변곡점을 활용한 커버곡 검색 알고리즘 (Cover Song Search Algorithm Using Inflection Points of The Melody Lines)

  • 이보현;김명
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2020년도 추계학술발표대회
    • /
    • pp.1084-1086
    • /
    • 2020
  • 동영상 공유 플랫폼의 발전으로 다양한 영상들이 업로드 되고 있는데, 영상에 사용된 음악의 저작권 행사를 위해서는 음악 검색 알고리즘의 역할이 매우 중요하다. 그러나, 커버곡과 같이 원곡을 변형하여 사용한 경우에는 단순한 음악 검색 알고리즘으로는 이러한 상황을 탐지하기가 쉽지 않다. 음악의 높낮이나 빠르기 등이 바뀌어도 검색 성능이 유지되어야 하지만, 현재까지 연구된 알고리즘들은 이러한 변화에 취약하기 때문이다. 이에 본 연구에서는 멜로디 라인의 변곡점을 활용한 커버곡 검색 알고리즘을 제안한다. 본 알고리즘은 멜로디 라인을 중심으로 하여 높낮이 변화에도 높은 성능을 유지하고, 변곡점을 이용하기 때문에 빠르기 변화에 강하고 사용되는 메모리 양은 적다는 장점이 있다.

고속 라우터를 위한 IP 주소 검색 기법 (A IP Address Lookup Scheme For High Speed Routers)

  • 정상훈;권위남;권보섭;진성기;윤현수;조정완
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 가을 학술발표논문집 Vol.27 No.2 (3)
    • /
    • pp.366-368
    • /
    • 2000
  • 현재 인터넷은 매우 빠른 속도로 커가고 있으며 기존의 인터넷 하부구조(infrastructure), 특히 라우터에 커다란 부담이 되고 있다. IP 주소 검색은 라우터에 들어오는 패킷의 출력 링크를 위해 전송 테이블에서 가장 길게 일치하는 프리픽스를 찾는 것이다. 이러한 작업은 매우 복잡하고 고속의 라우터에 커다란 병목이 되고 있으며 이를 해소하기 위해서는 하드웨어기반의 빠른 IP 주소 검색 기법이 필요하다. 본 논문은 유니 캐스트 상에서 전송 테이블의 크기와 검색 시간을 줄이고 점차적인 갱신이 가능한 하드웨어기반의 알고리즘을 제시하고 다른 하드웨어 기반의 알고리즘과 성능을 비교한다. 제시한 알고리즘은 작은 크기의 SRAM과 단순한 로직의 하드웨어로 구현되기 때문에 값이 싸고 파이프라인으로의 구성이 가능하기 때문에 빠른 IP 주소 검색이 가능하다. 10ns의 SRAM으로 구현할 경우, 초당 100$\times$106의 검색이 가능하고 이는 지금까지 제안된 알고리즘보다 빠른 검색을 제공할 수 있다.

  • PDF

영상의 질감 정보를 이용한 검색에서 회전 불변 유사도 측정에 대한 연구 (Study of Rotation invariant similarity measurement for content based image indexing using Texture)

  • 강호경;유기원;최정윤;노용만
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2000년도 정기총회 및 학술대회
    • /
    • pp.155-159
    • /
    • 2000
  • 본 논문에서는 MPEG-7 질감 기술자에 기반한 영상의 내용기반 검색 시스템에서 유사도 검색 알고리즘에 대하여 다룬다. 제안하는 알고리즘은 영상의 회전에 대하여 변화하지 않는 특성을 지닌다. 실제적으로 영상이나 비디오에서 질감 정보를 이용하여 검색을 수행하고자 하는 영상에 대하여 회전 불변 알고리즘은 반드시 필요하다. 본 논문에서 제한된 알고리즘을 이용하여 질감 영상회전 불변 유사도 측정에 따른 검색을 수행하였다. 본 논문의 실험은 회전 불변 성능을 측정하는 MPEG-7 질감 데이터베이스에서 검색 율을 측정하였다. 실험결과 본 영상 회전 불변 질감 기술자 표현 방법은 우수한 검색 성능과 빠른 특징 추출 능력을 보였다.

  • PDF

효율적인 검색을 위한 논문 키워드 추출 알고리즘 설계 및 연구 검색 시스템 개발 (Academic Paper Keyword Extracting Algorithm for Efficient Search and Development of Research Searching System)

  • 이종현;이원준;김호숙
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2018년도 추계학술발표대회
    • /
    • pp.463-466
    • /
    • 2018
  • 본 연구는 논문을 기반으로 연구의 주요 키워드를 추출하는 알고리즘을 설계하고 이를 적용한 연구 검색 시스템을 개발하여 효율적인 검색 환경을 제공하는 것을 목표로 한다. 논문 키워드 추출 알고리즘은 논문 내에서의 단어 출현 빈도와 PMI 지표를 바탕으로 정의한 단어간 연관성 K(x,y)을 기반으로 설계하였다. 연구 검색 시스템은 고등학교 R&E 등 제한적인 환경에서 이루어지는 연구들의 선행 연구 자료 부족을 해결하는 것을 주 목적으로 한다. 또한, 구현한 연구 검색 시스템에 제안된 알고리즘을 적용하여 보다 정확하고 직관적인 검색 환경을 제공할 수 있었으며, 추후 연구 자료가 추가됨에 따라 그 가치가 높아질 것으로 전망한다.

다중바이트 문자집합 텍스트에서의 문자열 검색 알고리즘 (String Matching Algorithm on Multi-byte Character Set Texts)

  • 김은상;김진욱;박근수
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제16권10호
    • /
    • pp.1015-1019
    • /
    • 2010
  • 문자열 완전일치 검색 알고리즘용 지금까지 많은 연구가 되어왔지만, EUC-KR 용 다중바이트 문자집합에 대해서는 연구원 것이 부족한 상황이다. 이 논문에서는 기존의 KMP 알고리즘을 사용할 때 EUC-KR과 같은 다중바이트 문자집합 텍스트에서 오검색이 발생할 수 있음을 보이며, 문자 단위의 접두사 함수를 적용하여 오검색이 발생하지 않도록 개선한 KMP 알고리즘을 제안한다. 또한, 널리 사용되고 있는 편집기인 Vim과 Emacs의 검색 알고리즘 및 기존의 오토마타 방식의 연구 결과에 비해 논문에서 제안한 알고리즘이 더 빠른 속도를 보이는 실험 결과를 제시한다.

가중치에 따른 질의확장의 검색효율성 (Retrieval Effectiveness of Query Expansion depending on Term Weights)

  • 최성환
    • 한국정보관리학회:학술대회논문집
    • /
    • 한국정보관리학회 2002년도 제9회학술대회 논문집
    • /
    • pp.259-264
    • /
    • 2002
  • 기존의 질의확장 혹은 적합성 피드백 연구에서 코사인 정규화를 사용하여 검색성능을 향상시킨 연구들이 많다. 본 논문에서 실험한 결과를 근거로 하였을 때 이는 낮은 검색성능을 보였던 것이 검색공간의 확장으로 성능이 크게 향상되었을 가능성이 있다. 실험결과 가중치 유사도 모델간의 커다란 차이는 보이지 않고 코사인정규화 가중치 알고리즘에서 상당한 성능향상이 있었다. 그러나 기존의 코사인정규화 가중치 알고리즘을 이용한 전역적 질의확장의 경우 성능 향상률은 높으나 원질의어를 이용하여 가장 좋은 성능을 보였던 가중치 알고리즘들의 검색성능과 비교하면 오히려 낮은 성능을 보였다.

  • PDF

음성 입력에 의한 음곡선 검색 알고리즘 (A Pitch Contour Retrieval Algorithm Using Voice Input)

  • 이호선
    • 한국산학기술학회:학술대회논문집
    • /
    • 한국산학기술학회 2000년도 추계학술대회
    • /
    • pp.339-347
    • /
    • 2000
  • 본 논문은 디지털 음악 도서관에서 입력된 음성을 인식하여 생성한 음곡선에 의해 임의의 음악정보를 효율적으로 검색하기 위한 알고리즘을 제안한다. 종래의 전형적인 음악정보 검색 항목인 제목이나 작곡자 또는 주제를 입력하는 것이 아니라, 사용자가 음악 데이터베이스로부터 검색하고자 하는 음악의 일부를 마이크를 통해서 노래한다. 그러면 입력된 음성에 대한 음 신호를 처리하여 음표정보를 인식하고, 이를 바탕으로 음정 곡선을 생성하여 이를 탐색 패턴으로 사용한다. 제안한 검색 알고리즘은 일반적으로 근사 탐색을 위해 많이 사용하는 동적 프로그래밍 방법과 함께 실험을 통해 탐색 시간을 비교하여 향상된 탐색 시간을 보인다.

정규 표현식을 이용한 패턴 매칭 엔진 개발 (Development of the Pattern Matching Engine using Regular Expression)

  • 고광만;박홍진
    • 한국콘텐츠학회논문지
    • /
    • 제8권2호
    • /
    • pp.33-40
    • /
    • 2008
  • 스트링 패턴 매칭 알고리즘은 특정 검색어, 키워드를 검색하는 속도에서는 우수성이 다양한 방법으로 입증되었지만 다양한 패턴에 대해서는 기존의 알고리즘으로는 한계를 가지고 있다. 본 논문에서는 정규 표현식을 이용하여 특정 키워드를 포함하여 다양한 패턴의 검색어에 대해서도 효율적인 패턴 매칭을 수행하여 패턴 검색의 효율을 높이고자 한다. 이러한 연구는 기존의 단순한 키워드 매칭에 비해 각종 유해한 스트링 패턴을 효과적으로 검색할 수 있으며 스트링 패턴 매칭 속도에서도 기존의 알고리즘에 비해 우수성을 갖는다. 본 연구에서 제안한 LEX로부터 생성된 스트링 검색 엔진은 패턴 검색 속도에 대한 실험에서 패턴의 수가 1000개 이상인 경우에서는 BM&AC 알고리즘보다 효율적이지만 키워드 검색에서는 유사한 결과를 얻었다.