• 제목/요약/키워드: 정보 검색 패턴

검색결과 486건 처리시간 0.027초

접미사 배열에서의 패턴 검색 알고리즘 (Pattern Search Algorithm in Suffix Arrays)

  • 최용욱;박근수
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 봄 학술발표논문집 Vol.31 No.1 (A)
    • /
    • pp.958-960
    • /
    • 2004
  • 접미사 배열은 긴 문자열에 대한 효율적인 패턴 검색을 위해 널리 쓰이는 자료 구조로서 지금까지 접미사 배열을 이용하여 텔스트 T 안에서 패턴 P를 검색하는 O(|P|ㆍ|∑|), O(|P|ㆍlog|∑|)시간 알고리즘(|∑|:알파벳 크기)들 이 발표되었다. 본 논문에서는 O(|P|)시간 알고리즘을 제시하고, 기존의 알고리즘들과 비교한 실험 결과를 보여준다.

  • PDF

토픽별 인간 속성의 영향력 기반 소셜 관계 지수 산정 (Social Relationship Value Computation based on the Influence of Human Attributes classified by Topics)

  • 권오상;박건우;이상훈
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2010년도 춘계학술발표대회
    • /
    • pp.884-887
    • /
    • 2010
  • 최근 검색엔진의 효율성을 향상시키고 검색결과에 있어서 사용자들의 요구사항을 충족시키기 위한 연구들이 활발히 수행되고 있으며, 많은 방법론들이 제시되고 있다. 이는 방대한 정보 속에서 사용자의 검색 의도에 맞는 정보를 효과적으로 제공하는 것을 그 목표로 한다. 특히 본 논문에서는 검색하고자 하는 토픽별 사용자의 인적 속성들이 미치는 영향력을 기반으로 사용자간 소셜 관계 지수(SRV : Social Relationship Value)를 산정하는 방법을 제안한다. 소셜 관계 지수란 인간의 내재적인 특성을 수치로 산정한 것으로, 웹 사용자들에게 있어서는 검색 성향의 유사정도와 직결된다. 따라서 검색하고자 하는 토픽별 개인 성향의 유사정도를 수치로 부여하고 유사성이 높은 사람들의 검색 정보를 이용하면 사용자에 보다 만족된 검색결과를 제공할 수 있다. 본 연구에서는 구글 디렉터리(Google directory)의 정제된 각 토픽별 하위 범주(category)에 대해 선택 결과가 같은 사람들을 대상으로 인적 속성을 분석하고, 그 영향력을 가중치로 적용해 산정된 소셜 관계 지수와 사용자들의 검색 패턴을 비교 하였다. 그 결과 특정인을 기준으로 소셜 관계 지수가 높은 사람들의 검색 패턴이 매우 유사함을 확인 하였다. 이를 통해 토픽별 개인 간 연결 강도가 강할수록, 즉 유사성이 높은 사용자간에는 검색 패턴 또한 유사함을 검증 할 수 있었다.

일반적인 웹 검색 경로패턴 추출 알고리즘 (Algorithm for Extracting the General Web Search Path Pattern)

  • 장민석;하은미
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2005년도 춘계종합학술대회
    • /
    • pp.771-773
    • /
    • 2005
  • 웹 환경에서 사용자들의 정보검색 패턴을 얻어내기 위해 흔히 로그 파일의 정보검색 패턴을 분석하는 기존 연구들이 있어 왔다. 이들에서 흔히 사용하는 방법은 경로 순회 패턴(path traversal patterns)에서 효율적으로 빈번 패턴(frequent patterns)을 찾아내는 알고리즘을 제안하는 것이다. 하지만 이들의 기존 연구의 가장 일반적인 문제점들 중의 하나는 일반적인 패턴 즉, 복잡한 형태 패턴(topological patterns)에 대한 적절한 해답을 찾아주지는 못한다는 것이다. 따라서 본 논문에서는 일반적인 패턴 유형을 정의하고 이들로부터 정보검색 패턴을 알아내는 효율적인 알고리즘을 제안하고자 한다.

  • PDF

소셜지수와 질의패턴의 상관관계 분석을 통한 검색 편의성 향상 (Improvement of Retrieval Convenience through the Correlation Analysis between Social Value and Query Pattern)

  • 안무현;박건우;이상훈
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2009년도 춘계학술발표대회
    • /
    • pp.391-394
    • /
    • 2009
  • 정보의 양이 폭발적으로 증가함에 따라 웹 사용자가 원하는 적합한 데이터를 찾아내는 것은 매우 어렵다. 이는 웹 사용자마다 서로 다른 검색의도와 질의의 모호성에 의한 것으로, 이와 같은 검색의 어려움을 해결하기 위해 많은 연구들이 수행되어 왔다. 질의 로그는 검색자의 검색 의도가 내포되어 있는 중요한 자료이다. 따라서 웹 사용자별 질의 로그 패턴을 분석하여 유사한 질의를 사용하는 웹 사용자들을 클러스터링 하여 검색에 적용한다면 좀 더 유용한 정보를 획득할 수 있다. 즉, 특정 카테고리와 연관된 질의를 자주 사용하는 웹 사용자들은 해당 분야에 관심이 많을 것이며, 또한 다른 카테고리에 관심이 높은 사람보다 상호간에 소셜지수가 높게 나타날 것이다. 특정 주제에 대해 검색을 할 경우 해당 분야에 관심이 높은 웹 사용자들의 질의 및 클릭한 URL 정보를 상속받을 수 있다면 찾고자 하는 정보에 보다 빨리 접근할 수 있다. 따라서 본 연구는 질의패턴 분석을 통해 카테고리별로 관심도가 높은 웹 사용자들을 클러스터링 한 후 해당 카테고리에 대한 정보 검색시 이들이 사용한 질의와 클릭한 URL 정보를 웹 사용자들에게 제공해줌으로써 정보검색의 편의성을 향상시키기 위한 방안을 제안한다.

한국어 문장 패턴 기반 개인형 메타 검색 시스템 (A Personalized Meta-Search System based on Korean Sentence Pattern)

  • 이덕남;정혜경;박기선;이용석
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 봄 학술발표논문집 Vol.30 No.1 (B)
    • /
    • pp.498-500
    • /
    • 2003
  • 인터넷의 급속한 팽창으로 인해 가을 정보의 양이 폭발적으로 증가하고 있다. 웹 사용자에게 이용 가치가 없는 정보 범람(information overflow)안이 발생한다면 효율적인 정보검색이 되지 못하므로 사용자가 원하는 정보만을 얻을 수 있다면 시간과 미숙한 정보의 검색을 방지 할 수 있다. 본 논문에서는 한국어 질의 생성과 관련하여 웹 사용자의 편의성과 효율성을 고려한 한국어 질의 처리 방법론과 개인형 메타 검색 모델을 제안하고자 한다. 한국어 질의를 기본으로 하여 한국어 문장 패턴 및 개인 정보 평가 구성 요소를 이용한 방법론과 모델을 제안하고자 한다.

  • PDF

VHDL 행위-레벨 설계의 코딩 오류 검출을 위한 패턴 생성 (Pattern generation for coding error detection in VHDL behavioral-level designs)

  • 김종현;김동욱
    • 대한전자공학회논문지SD
    • /
    • 제38권3호
    • /
    • pp.31-31
    • /
    • 2001
  • 최근 VHDL 코딩 및 합성방법에 의한 설계가 널리 사용되고 있다. 집적도가 증가함에 따라 VHDL에 의한 설계 또한 그 분량이 증가하여 많은 코딩오류가 발생하고 있으며, 이를 검색하는데 많은 시간과 노력이 소요되고 있다. 본 논문에서는 VHDL 행위-레벨 설계를 대상으로 코딩오류를 검색하는 방법을 제안하였다. 그 방법에 있어서는 검색패턴을 생성하여 오류가 없는 응답과 설계의 응답을 비교함으로써 설계오류를 찾는 방법을 택하였다. 따라서 본 논문에서는 코딩오류를 검색하기 위한 검색패턴을 생성하는 알고리듬을 제안하였다. 검색패턴 생성은 각 코드에 대해 수행하며, 할당오류와 조건오류를 구분하여 수행하였다. 패턴생성을 위해 VHDL 코드를 CDFG로 변환하여 사용하며, CDFG상의 경로를 탐색하여 패턴생성에 필요한 정보를 추출한다. 경로탐색은 오류가 발생하였다고 가정한 지점으로부터 역방향 탐색과 정방향 탐색을 수행하여 패턴을 생성한다. 제안한 알고리듬은 C-언어로 구현하였다. 펜티엄-Ⅱ 400MHz의 환경에서 여러 가지 VHDL 행위-레벨 설계를 대상으로 제안한 알고리듬을 적용하였다. 그 결과, 고려한 모든 설계의 모든 코드에 대한 검색패턴을 생성할 수 있었으며, 가정한 모든 오류를 검색할 수 있었다. 검색패턴 생성에 소요되는 시간은 고려한 모든 대상 설계에서 1초 미만의 CPU 시간을 보여 속도면에서도 매우 우수함을 나타내었다. 따라서 본 논문에서 제안한 검색방법은 VHDL에 의한 설계에서 설계검증에 필요한 시간과 노력을 상당히 감소시킬 것으로 기대된다.

전위 트리를 이용한 사용자 프로파일 기반의 문서 패턴 검색 기법 (Text Pattern Search Based on User Profile using Prefix Tree)

  • 우호진;이원석
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2005년도 추계학술발표대회 및 정기총회
    • /
    • pp.533-536
    • /
    • 2005
  • 기하급수적으로 증가하는 데이터 중에서 개개인 사용자에게 적합한 정보를 추출하여 제공해야 할 필요성이 증대되고 있다. 본 논문에서는 대용량의 문서 집합으로부터 사용자가 원하는 특정 주제의 정보를 정확하게 추출해 낼 수 있는 문서 패턴 검색 방법을 제시한다. 사용자 선호도를 정확하게 반영할 수 있도록 전위 트리를 기반으로 사용자의 키워드 마이닝 프로파일을 생성하고, 이를 이용하여 문서 집합에서 매치된 패턴을 찾아내는 방법을 제안하였다. 생성된 프로파일을 이용한 검색 기법의 효용성을 실험을 통해 검증하였다.

  • PDF

정보검색에서 사용자 검색 패턴을 이용한 질의 확장 (Query Expansion Using User Search Pattern in Information Retrieval)

  • 천우관;김영도;정인정
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2001년도 춘계학술발표논문집 (하)
    • /
    • pp.771-774
    • /
    • 2001
  • 정보검색에서 가장 많이 사용되는 불리언(Boolean)검색에서는 키워드 일치에 의해서만 검색하는 단점을 가지고 있다. 이를 보완하기 위해 다양한 정보원에서 추출한 관련 용어들을 원질의어에 첨가하여 검색의 효율을 높이기 위한 질의 확장 방법들이 모색되어 왔다. 본 논문에서는 질의 확장을 위하여 사용자가 검색에 사용하였던 질의어들의 연속성을 찾아내어 첨가할 용어를 선택하고 질의 확장을 하는 방법을 제시한다. 사용자가 입력한 질의어의 연속성을 찾아내는 방법으로는 데이터 마이닝 기법중 연관 규칙 탐사 방법을 이용한다. 실험은 현재 구축된 정보통신 기술기준 정도시스템에서 사용자들이 검색한 키워드 정보를 이용하였으며 사용자 검색 패턴(USP) 정보를 이용함으로써 사용자가 검색하고자 하는 질의어와 좀더 연관성 있는 용어로 확장하여 사용자 중심적 결과를 얻을 수 있다.

  • PDF

질의어 패턴 자동분석을 통한 커뮤니티 기반 개인화 검색 (Personalized Search based on Community through the Automatic Analysis of Query Pattern)

  • 박건우;정재학;이상훈
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2008년도 한국컴퓨터종합학술대회논문집 Vol.35 No.1 (A)
    • /
    • pp.37-38
    • /
    • 2008
  • 기존의 웹 검색 엔진들은 사용자의 검색 의도를 충분히 반영하지 못하기 때문에 개인이 원하는 정보를 보다 정확하게 제공 할 수 없는 단점을 가지고 있다. 따라서 개인의 특성을 이해하고 검색에 반영함으로써 보다 정확한 개인화 검색 서비스를 제공하기 위한 많은 연구들이 진행되고 있다. 이러한 개인화된 검색 서비스를 통해, 사용자는 방대한 웹상의 정보를 보다 효율적으로 검색하여 자신에게 적합한 정보를 편리하게 획득 할 수 있으며 짧은 시간에 정확한 정보 획득을 보장 받을 수 있다. 본 논문에서는 개인의 질의어 패턴을 자동으로 분석하고 상위에 순위화 된 질의어 유형에 따라 주요 관심사 별 커뮤니티를 형성하여 검색에 반영함으로써 개인의 정보요구에 보다 큰 접한 개인화 검색 방안을 제안한다.

  • PDF

마크업 패턴을 이용한 웹 검색 (Web Information Retrieval Exploiting Markup Pattern)

  • 김민수;김민구
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제13권6호
    • /
    • pp.407-411
    • /
    • 2007
  • HTML은 웹 페이지의 시각적 표현을 목적으로 하고 있기 때문에, HTML로 작성된 웹 문서에 대한 색인과 질의는 쉬운 문제가 아니다. 그러나 웹 페이지를 표현하는 태그들이 가진 내재적 의미들은 검색 엔진의 성능을 향상시킬 수 있는 가능성을 가지고 있다. 본 논문은 이러한 HTML 태그의 내재적 의미를 이용하기 위해 마크업 패턴을 정의하고, 이를 웰 검색에 응용함으로서 검색 성능을 향상하고자 한다. 마크업 패턴은 웹 레이지 작성자의 표현 의도를 담고 있으며, 명시적으로 하나 이상의 HTML 태그의 연속으로 표현된다. 웹 페이지에서 마크업 패턴을 찾아내고, 이를 웹 검색에 응용하기 위해 본 논문에서는 웹 문서를 재색인하는 방법을 제안한다. 제안하는 방법을 적용한 웹 검색의 성능 향상을 증명하기 위해, BBC와 CNN 웹 사이트의 문서들을 대상으로 실험을 진행하였다. 대상 문서들은 제안한 방법을 통해 가중치를 갖게 되며, 특정 질의에 대한 정확도를 기존 검색 엔진과 비교하여, 본 논문에서 제안하는 마크업 패턴을 이용한 웹 검색의 성능 향상을 증명할 것이다.