• 제목/요약/키워드: 정보 검색 패턴

검색결과 486건 처리시간 0.045초

효율적인 유전자 서열 비고를 위한 데이타베이스 검색 모델 (A Database Retrieval Model for Efficient Gene Sequence Alignment)

  • 김민준;임성화;김재훈;이원태;정진원
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제31권3호
    • /
    • pp.243-251
    • /
    • 2004
  • 대부분의 생물정보학의 프로그램들은 데이타베이스로부터 유전자 등의 데이타를 검색하고 처리하여 생화학자와 생물학자에게 서비스를 제공한다. 이때 각각 클라이언트의 요청마다 데이타베이스의 검색을 수행한다면 많은 디스크 접근 시간이 소요된다. 또한 서버에 과부하를 초래하여 응답시간이 길어질 수 있다. 본 논문에서는 생물정보학에서 서열 검색 프로그램의 데이타베이스 사용 패턴을 이용하여 많은 데이타베이스 요청에 대하여 데이타베이스의 검색을 위한 디스크 접근을 공유하는 그룹핑 기법을 제안한다. 또한, 사용자 요청을 대기 시간 없이 처리중인 작업과 동시에 데이타베이스의 검색을 위한 디스크 접근을 공유하여 시스템 처리율을 높이고 빠른 응답시간을 가지는 카플 방식을 제안한다. 제안된 기법은 수학적 분석과 시뮬레이션을 통하여 성능을 검증하였다.

일반화된 패턴을 이용한 관계 추출 시스템 (Relation Extraction System using Generalized Patterns)

  • 김혜민;최익규;김민구
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2005년도 한국컴퓨터종합학술대회 논문집 Vol.32 No.1 (B)
    • /
    • pp.658-660
    • /
    • 2005
  • 텍스트 형태의 문서에는 않은 종류의 유용한 관계가 존재한다. 이러한 관계들을 문서에서 자동으로 찾아내는 것은 정보검색 분야에서 매우 중요한 작업 중 하나이다. 그러나 각각의 관계마다 다양한 형태의 패턴이 존재하기 때문에 많은 양의 문서에서 이러한 관계들을 찾아내는 것은 쉬운 일이 아니다. 이러한 어려움을 해결하기 위해 본 논문에서는 일반화된 패턴을 이용하여 자동으로 관계를 찾는 방법을 제안한다. 본 논문에서 제안하는 방법은 초기에 사용자로부터 얻은 정보를 이용하여 관계를 자동으로 찾는다. 약 1,000,000개의 문장을 이용해 실험한 결과 자동으로 일반화된 패턴을 이용하는 방법을 이용할 경우 그렇지 않은 경우보다 성능이 향상됨을 확인할 수 있었다.

  • PDF

XML 문서 관리 시스템의 순환적 DTD 구조 저장 기법 및 질의 변환 전략 (Method of storing nested DTD structure and Query translation strategy in XML Repository system)

  • 김정은;신판섭;정헌석;이재호;임해철
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 가을 학술발표논문집 Vol.27 No.2 (1)
    • /
    • pp.299-301
    • /
    • 2000
  • XML은 문서의 구조를 독립적으로 작성할 수 있어 문서의 체계적인 구조화가 가능하다. 이러한 이유로 최근, XML 문서를 구조화하여 데이터베이스에 저장, 관리하는 XML 문서 관리 시스템 연구가 활발하다. XML 문서 관리 시스템은 XML의 구조 정보를 효과적으로 표현하기 위해 여러 가지 기법을 사용하고 있다. 그러나, 기존의 방법들은 XML 문서 구성에 따라 저장 스키마가 유동적이거나 문서 정보 검색의 제약을 가지고 있을 뿐만 아니라, DTD의 문서 구조가 순환 관계와 같이 복잡한 형태를 지닐 때, 그 구조를 적절히 반영하지 못하거나, 구조를 반영하더라도 검색 시, 모든 요소를 순차적으로 탐색해야 하는 등의 문제점을 지니고 있다. 따라서 본 연구에서는 XML의 내용이나 구성에 영향받지 않는 저장 스키마를 설계하고 정보검색의 제약을 해결가능한 경로 정보를 제안한다. 또한 순환 관계를 갖는 DTD의 구조 정보를 비 순환 구조 부분과 순환 구조 부분으로 분리, 정의하고 질의처리 시, 입력되는 XML-QL을 SQL로 변환하기 위하여 XML-QL의 패턴을 분류하고 이에 따른 중간 단계의 SQL을 정의하여 질의어 변환기법을 제안한다.

  • PDF

문서 분류에서 단어의 통계 정보를 이용한 특징 선택 기법의 비교 (Comparison of Feature Selection Methods using the Statistics of Words in Text Categorization)

  • 임윤택;윤충화
    • 대한안전경영과학회:학술대회논문집
    • /
    • 대한안전경영과학회 1999년도 추계학술대회
    • /
    • pp.209-216
    • /
    • 1999
  • 정보 검색 분야의 문서 분류에 기계 학습 기법을 적용할 때 발생하는 가장 큰 문제는 문서를 패턴으로 표현할 때, 하나의 패턴이 가지는 특징의 수가 기계 학습 기법에서 처리할 수 있는 범위를 넘어서는 것이다. 이러한 문제를 해결하기 위하여 특징 선택 기법은 패턴을 구성하고 있는 특징 중에서 실제 문서 분류에 많은 영향을 주는 특징만을 선택하여, 기계 학습 기법에서 쉽게 처리할 수 있을 정도의 패턴을 구성하게 한다. 본 논문에서는 이러한 특징 선택 기법 중에서 IG(Information Gain), Gini index, Relief-F, DF(Document Frequency)를 비교하였다. 실험 결과 문서들에 포함된 모든 고유 단어를 특징의 길이로 하여 패턴을 구성했을 때보다 특징 선택 기법을 적용하여 고유 단어 중 일부를 특징으로 패턴을 구성할 때 기계학습에서 더 향상된 분류 성능을 보였다

  • PDF

시간 및 공간 마이닝 기술을 이용한 다이렉트 마케팅 시스템 프로토타입 개발 (A Development of Direct Marketing System Prototype Using Temporal & Spatial Mining Techniques)

  • 이헌규;최용훈;나동길;정훈;박종흥
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2010년도 추계학술발표대회
    • /
    • pp.1402-1405
    • /
    • 2010
  • 본 논문에서는 시간 및 공간 마이닝 기술을 적용한 다이렉트 마케팅 지원 시스템 프로토타입을 개발하였다. 개발한 프로토타입은 서울시를 대상으로 약 인구 500명 크기의 블록단위 e-Commerce 구매 패턴과 유사블록 그룹핑 및 기타 마케팅에 유용한 외부 공개 자료의 검색 기능을 포함한다. 또한, 마케팅 캠페인에 프로토타입의 활용도를 높이기 위해서 상품선호도 기반 검색, 라이프스타일 기반 검색 및 복합정보 기반 검색 모듈 등의 다양한 서비스를 제공한다.

아날로지를 기반으로 한 객체모델의 재사용 (Analogy-based Reuse of Object Model)

  • 배제민
    • 정보처리학회논문지D
    • /
    • 제14D권6호
    • /
    • pp.665-674
    • /
    • 2007
  • 소스 코드 재사용은 다른 개발자에 의해 만들어진 코드를 정확하게 이해하거나 검색하기 어렵다는 점에서 몇 가지 제한점을 갖는다. 이러한 문제점을 해결하기 위해서 소스코드 자체보다는 분석 및 설계 정보를 재사용하는 것이 가능해야 한다. 이에 본 논문은 객체 모델 및 패턴을 재사용하기 위해 필요한 analogical 매칭 기법을 제안한다. 그리고_ 객체 모델과 디자인 패턴을 재사용 컴포넌트로서 저장할 수 있도록 표현하는 방법을 제안한다. 즉, 재사용 라이브러리에 저장된 유사 컴포넌트를 검색하는 analogical 매칭 함수와 매칭을 지원할 수 있는 라이브러리 구조 및 재사용 컴포넌트의 라이브러리내 표현 방법에 대해 기술하였다.

세그먼트 적합성 판단을 위한 계층적 최근접 검색 기법 (Hierarchical Nearest-Neighbor Method for Decision of Segment Fitness)

  • 신복숙;차의영;이임건
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2007년도 추계종합학술대회
    • /
    • pp.418-421
    • /
    • 2007
  • 이 논문에서는 곤충 발자국의 패턴을 판별하기 위한 전 단계로 추출되는 군집화된 세그먼트들 중에서, 곤충 발자국의 패턴을 분석하는 데에 부적합한 세그먼트들을 제거하기 위한 계층적 최근접 검색 기법을 제안한다. 발자국 형태와 거의 구별되지 않는 비정형적인 노이즈는 발자국과 서로 구별되는 특징을 규명하기 전까지는 영상처리 전 단계에서 완전히 제거될 수 없어 군집화 기법에 의해 추출된 세그먼트에도 이러한 노이즈를 내포하게 된다. 따라서 모든 세그먼트의 적합성을 평가하여, 노이즈 정보로 인해 타당성이 부족한 세그먼트를 제거함으로써 다음 단계에 수행되는 세그먼트들에 대한 곤충 발자국 패턴의 특징값 추출 성능이 향상될 수 있다.

  • PDF

인터넷 쇼핑몰을 위한 지능형 대화기반 판매 에이전트 시스템의 설계 (Design of Selling Agent System based on Intelligent Dialogue for Internet Shopping Mall)

  • 이광형;김정재;오해석
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1999년도 가을 학술발표논문집 Vol.26 No.2 (2)
    • /
    • pp.81-83
    • /
    • 1999
  • 본 논문은 전자상거래에서 판매와 구매방법의 획일화된 검색기법을 이용한 상품의 검색 및 사용자 인터페이스를 지능형 대화 판매 에이전트를 설계함으로써 보다 편리하고 효율적인 사용자 인터페이스를 제공하는 시스템을 설계하였다. 기존 사이버 쇼핑몰에서 구매자의 검색에 의한 방식을 판매자와의 대화에 의한 검색방법으로 전환하여 구매자의 구매의욕을 증가시키고 검색에 소요되는 시간을 절약할 수 있을 뿐만 아니라 구매자 어휘를 분석하고 구매패턴을 파악하여 추가의 수요를 창출 할 수 있는 데이터를 축적하는 방법을 제시하고 많은 고객을 동일한 시간에 상대해야 하는 웹의 전자상거래 시스템에서 판매를 담당하는 에이전트를 설계하게 되었다.

  • PDF

SOM을 이용한 등록상표에 대한 내용기반 이미지 검색 (Content-based Trademark Image Retrieval System using SOM)

  • 이재준;신민기;백우진;신문선
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2007년도 춘계학술발표대회
    • /
    • pp.489-492
    • /
    • 2007
  • 산업재산권중 하나인 상표에 대한 효율적인 이미지 검색은 상표도용 및 이로 인한 분쟁을 방지할 수 있다. 이를 위해서는 효율적인 내용기반 유사이미지 검색이 필요하다. 본 논문에서는 상표이미지검색에 있어 가시적인 특성(visual feature)을 그레이 히스토그램을 통해서 상표이미지의 특성값을 추출하여 이를 입력패턴으로 SOM(Self-Organizing Map)알고리즘을 적용한 내용기반 유사이미지 검색시스템을 제안한다.

정보량과 개념적 밀도를 이용한 단어 의미 중의성 해결 (Word Sense Disambiguation using the Information Content and the Conceptual Density)

  • 조미영;김판구
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2005년도 추계학술발표대회 및 정기총회
    • /
    • pp.445-448
    • /
    • 2005
  • 기존의 정보 검색은 단순 키워드 매칭에 의한 패턴 매칭으로 의미적 정보 검색에는 한계가 있다. 이를 해결하기 위한 많은 연구가 이루어졌으나 질의 혹은 문서에 중의적 의미를 가진 단어를 포함하고 있는 경우에 검색시 문제가 되었다. 이에 본 논문에서는 WordNet기반의 단어 빈도수를 고려한 정보량과 단어 영역내 존재하는 노드 수를 고려한 개념적 밀도를 이용한 WSD(Word Sense Disambiguation)를 제안한다. SemCor를 이용하여 테스트한 결과 두 요소를 결합한 방법에 의해 WSD가 약 20% 향상되었다.

  • PDF