• 제목/요약/키워드: 검색속도

검색결과 743건 처리시간 0.028초

한글 단어의 고속 검색을 위한 두 단계 알고리즘 (A Two-Pass Algorithm for Fast Retrieval of Korean Words)

  • 양진호;오일석
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 가을 학술발표논문집 Vol.28 No.2 (2)
    • /
    • pp.439-441
    • /
    • 2001
  • 대용량 한글 문서를 대상으로 하는 검색 시스템은 고속의 단어 매칭 알고리즘을 필요로 한다. 이 논문은 두 단계 매칭 접근 방법을 제시하고 그 유용성을 실험을 통해 입증한다. 특징으로는 웨이브렛(wavelet) 계수를 사용하여 첫 단계에서는 적은 수의 특징만을 사용하여, 거친 정합(coarse matching)을 하며 두 번째 단계에서는 미세한 정합(fine matching)을 한다. 거친 정합은 가능성이 없는 단어를 아주 빠른 속도로 걸러내는 역할을 한다. 실제 한글 단어 영상 데이터베이스에 적용한 실험 결과 검색률의 희생 없이 약 7배의 속도 향상을 얻었다.

  • PDF

점진적 알고리즘을 이용한 웹 문서 클러스터링 시스템의 설계 및 구현 (Design and implementation of web document clustering system using on incremental algorithm)

  • 황태호;손기락
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1999년도 가을 학술발표논문집 Vol.26 No.2 (1)
    • /
    • pp.207-209
    • /
    • 1999
  • 클러스터 분석은 관측의 대상이 되는 집합에 맞는 분류 구조를 생성하는데 이용되는 통계학적인 기술이다. 정보검색 응용에서 전형적으로 발견되는 높은 차원을 가진 많은 데이터 집합을 클러스터하기 위하여, 많은 공간과 시간이 필요하다. SLINK 알고리즘은 O(n2)의 시간과 O(n)의 공간의 성능을 갖으며 점진성을 반영할 수 있는 알고리즘이다. SLINK알고리즘을 이용하여 검색 엔진의 검색결과에 온라인으로 클러스터 분류를 수행하는 시스템을 구현하였다. 구현된 시스템은 상대적으로 높은 정확도와 각 클러스터를 저장하고 표현하는데 있어서의 장점을 제공하며, 상대적으로 느린 수행 속도는 온라인으로 문서들이 다운로드 되는 속도가 느리므로 문제가 되지 않음을 알 수 있었다.

  • PDF

검색 트래픽 정보를 활용한 고속도로 교통지표 분석 연구 (Analysis of Highway Traffic Indices Using Internet Search Data)

  • 류인곤;이재영;박경철;최기주;황준문
    • 대한교통학회지
    • /
    • 제33권1호
    • /
    • pp.14-28
    • /
    • 2015
  • 2000년대 중반부터 인터넷 검색 트래픽을 활용한 다양한 연구가 진행되었다. 대표적으로 구글은 미국의 독감 발병 상황을 인터넷 유저의 검색 패턴을 통해 예측하는 서비스를 만들기도 하였다. 교통지표 역시 인터넷 검색 패턴과 유사할 수 있다는 가설을 확인하기 위하여, 검색 트래픽 데이터를 활용하여 고속도로의 진입 교통량과 구간 속도를 추정하는 모형을 구축하고 적합도 등을 확인하는 것이 본 연구의 목적이다. 그 결과, 첫째, 출퇴근의 상시적 통행이 이루어지는 지점의 TCS 진입 교통량 모형은 구글 검색 트래픽이 입력변수로 우수하였고, 검색 트래픽과는 음의 상관관계를 보였다. 둘째, 여가 통행이 집중적으로 나타났던 지점의 TCS 진입 교통량 모형은 네이버의 검색 트래픽이 입력변수로 선정되었으며, 검색 트래픽과는 양의 상관관계가 나타났다. 셋째, VDS 속도의 경우 시계열 도표상 검색 트래픽과 음의 상관관계를 보였다. 넷째, 검색 트래픽을 입력변수로 활용한 전이함수 잡음 시계열 모형은 그렇지 않은 시계열 모형에 비해 비교적 적합도가 우수하다는 결과를 도출하였다. 다만, VDS 속도 모형의 경우 다수의 입력변수가 포함되고 모형 계수의 부호가 상이함에 따른 한계가 존재하였다. 향후 검색 트래픽의 출처나 검색어, 혹은 시차 및 집계 단위에 대한 추가적 연구가 진행된다면, 교통 분야의 빅 데이터 연구시 활용 폭이 넓어질 것으로 판단된다.

시맨틱 자원을 이용한 KOSEN 통합검색 서비스 (Unified Search Service using Semantic Resource in KOSEN)

  • 한희준;윤정선
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2010년도 춘계 종합학술대회 논문집
    • /
    • pp.533-535
    • /
    • 2010
  • 검색기능은 사용자가 원하는 정보를 효과적으로 탐색하고 이용가능하게 하는 중요한 서비스 요소이다. 본 논문에서는 과학기술분야 전문분석자료, 수집자료, 동향정보를 제공하는 KOSEN(한민족과학기술자네트워크)의 통합검색 서비스 구축에 대해 논한다. 어휘지능망, 연구주제망 등 시맨틱 자원을 활용하여 사용자의 검색 편의성 및 효율성을 최대화 하였으며, 빠른 검색속도와 다양한 검색 부가기능을 제공함으로써 정보의 획득 및 이용의 만족도를 증가시키고자 FAST 검색엔진을 적용한 특징이 있다.

  • PDF

내용기반 초음파 영상 검색 시스템 (Content-Based Ultrasound Image Retrieval System)

  • 곽동민;김범수;윤옥경;김현순;김남철;고광식;박길흠
    • 대한의용생체공학회:의공학회지
    • /
    • 제22권1호
    • /
    • pp.1-7
    • /
    • 2001
  • 본 논문에서는 초음파 의료영상 데이터베이스로부터 원하는 영상들을 찾아내기 위한 내용기반 영상 검색기법을 제안한다. 전체 영상 검색 시스템은 공간영역의 히스토그램과 웨이브릿 변환영역에서 부대역의 통계적 특성벡터를 이용한 2단계 검색 알고리즘을 사용하였다. 또한 히스토그램의 인덱싱 기법으로 Legendre 모멘트를 이용해서 데이터베이스에 저장되는 인덱스의 크기를 최소화시켜서 기존의 히스토그램을 이용한 검색방법 비해서 검색속도를 높이면서 검색결과를 개선시켰다.

  • PDF

단계적 후보 축소에 의한 예제기반 초해상도 영상복원을 위한 고속 패치 검색 (Fast Patch Retrieval for Example-based Super Resolution by Multi-phase Candidate Reduction)

  • 박규로;김인중
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제37권4호
    • /
    • pp.264-272
    • /
    • 2010
  • 예제기반 초해상도 영상복원은 영상 패치의 대한 학습 및 검색을 통해 저해상도 영상으로부터 고해상도 영상을 복원하는 방법으로써 성능이 좋고 한 장의 저해상도 영상에 대하여도 적용 가능하다. 그러나 복원 과정에서 패치 검색에 많은 비교 연산이 요구되기 때문에 속도가 매우 느리다. 복원 속도를 향상시키기 위해서는 효과적인 패치 검색 알고리즘이 요구된다. 본 논문에서는 패치 검색에 사용 가능한 다양한 고차원 특징 검색 방법들을 실제 초해상도 영상복원 시스템에 적용하여 그 성능을 비교하였다. 또한 문자 인식 분야에서 성공적으로 적용되어왔으나 초해상도 영상복원에서는 사용되지 않았던 단계적 후보축소 방법을 패치 검색 단계에 적용할 것을 제안한다. 실험 결과 기존의 방법 중에서는 LSH가 가장 좋은성능을 나타내었다. 본 논문에서 제안한 단계적 후보 축소에 의한 패치 검색 방법은 LSH보다 더욱 우수하여 $1024{\times}1024$ 영상의 복원 시 LSH보다 최대 3.12배 빠른 복원 속도를 나타내었다.

단축-경로와 확장성 해싱 기법을 이용한 경로-지향 질의의 평가속도 개선 방법 (A Way to Speed up Evaluation of Path-oriented Queries using An Abbreviation-paths and An Extendible Hashing Technique)

  • 박희숙;조우현
    • 정보처리학회논문지D
    • /
    • 제11D권7호
    • /
    • pp.1409-1416
    • /
    • 2004
  • 최근 인터넷의 폭발적인 성장과 인기로 인하여 인터넷을 통한 정보 교환이 극적으로 증가하고 있다. 또한 XML은 인터넷상에서 데이터를 교환하기 위한 표준인 동시에 중요한 수단이 되고 있다. 따라서 XML 문서를 검색하는데 있어서, 경로-지향 질의에 대한 평가 속도를 개선하는 문제는 중요한 이슈이다. 본 논문에서는 문서 데이터베이스에서 경로-지향 질의의 검색 성능을 개선하기 위한 새로운 인덱싱 방법을 제안하다. 새로운 인덱싱 방법에서는 경로-지향 질의를 효과적으로 수행하기 위해 단축-경로 파일을 생성하고 그것의 해시 코드 값을 인덱스 키로 사용한다. 또한 검색 평가 속도를 촉진시키기 위하여 단축-경로 파일을 확장성 해싱 기법과 결합하는 것으로 검색질의의 평가속도를 가속화하였다.

포털의 노블리스 오블리제를 기대한다!

  • 한국데이터베이스진흥센터
    • 디지털콘텐츠
    • /
    • 10호통권161호
    • /
    • pp.102-117
    • /
    • 2006
  • 지식정보화사회가 도래함에 따라 지식과 정보의 중요성이 더욱 대두되고 있으며 IT 기술의 급속한 발전은 지식의 기술 기반화, 정보 환경화를 가져왔다. 인터넷 사용이 급속도로 증가하면서 필요한 정보들은 지식 검색서비스를 이용해 찾는 것이 일상화 되었다. 이에 검색기술환경의 변화에 따른 지식검색서비스의 등장과 일상화 추세를 통해 지식의 개념과 특징, 지식검색서비스의 체계를 살펴보는 것은 지식 정보화 사회를 살아가는 이들에게 의미 있는 연구가 될 것이다.

  • PDF

IP 주소 검색의 속도 향상을 위한 분할된 압축 트라이 구조 (A Partitioned Compressed-Trie for Speeding up IP Address Lookups)

  • 박재형;장익현;정민영;원용관
    • 정보처리학회논문지C
    • /
    • 제10C권5호
    • /
    • pp.641-646
    • /
    • 2003
  • 인터넷에서 IP 패킷 전송은 링크의 전송 속도와 더불어 라우터에서의 패킷 처리 속도에 영향을 받는다. 라우터는 외부 인터페이스에서 입력되는 패킷을 목적지로 보내기 위한 다음 홉을 결정하여 패킷을 전달하는 역할을 수행한다. 이 과정에서 주소 검색은 고성능의 라우터 설계에 중요한 요인이다. 본 논문에서는 트라이 자료 구조 기반의 IP 주소 검색 알고리즘의 성능을 향상시키기 위해서 경로 압축을 이용한 분할 압축 트라이 구조를 제안한다. 제안된 분할 압축 트라이에서는 IP 주소 프리픽스들을 여러 개의 분할 압축 트라이로 나누어서 하나의 분할된 압축 트라이에서만 검색이 이루어지도록 하여 압축 트라이에서 탐색하는데 드는 시간을 줄이는 방법이다. 분할을 함으로써 늘어나게 되는 메모리의 부담이 적음을 보여준다.

2-Level Trie를 이용한 고속 라우팅 검색 (A High-Speed Routing Lookups Using 2-Level Trie)

  • 오승현
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 2003년도 추계학술발표대회(하)
    • /
    • pp.790-793
    • /
    • 2003
  • 라우터의 IP 주소검색은 라우터에 도착한 IP 패킷의 목적지 주소를 이용하여 적절한 출력링크를 검색하고 결정하는 것으로 고속 IP 주소검색은 초고속 라우터 개발에 필수적인 부분이다. 본 논문은 일반 PC에서도 고속의 라우팅 검색이 가능 하도록 2-단계 트라이를 이용하는 트라이 기반의 IP 주소검색 자료구조를 소개한다. 2-단계 트라이는 최소 크기의 포워딩 데이블을 구축, 접근속도가 빠른 캐시 메모리에 저장함으로써 고속의 검색이 지원된다.

  • PDF