• 제목/요약/키워드: 분류검색

검색결과 1,717건 처리시간 0.028초

하천공간정보의 온톨로지 구축방안 연구 (Construction of Ontology for River GeoSpatial Information)

  • 신형진;신승희;황의호;채효석
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2015년도 학술발표회
    • /
    • pp.627-627
    • /
    • 2015
  • 기존 물관련 시스템들은 독자적인 DB 구조를 가지고 있고 검색 서비스는 자체 시스템의 DB를 직접 접근하여 사용자에게 결과를 제시하는 형식이다. 이러한 서비스의 단점은 사용자가 개별 시스템의 서비스에 대한 지식이 없으면 접근하기 어렵다는 점이다. 개별 시스템의 개별 서비스의 개념을 벗어나기 위하여 물관련 시스템에 있는 하천공간자료 검색 정보를 카탈로그 서버에 등록하고, 카탈로그 서버에 등록된 검색정보를 사용자가 검색하는 방식을 적용하고자 한다. 카탈로그 서버에 자료에 대한 정보를 등록할 때 자료의 정보를 어떻게 기술할 것인가의 문제가 발생한다. 개별 서버마다 등록하게 된다면 용어 및 문화에 의한 차이로 같은 개념을 다른 용어로 등록하게 되는 혼란이 발생할 소지가 있다. 예를 들어 강우자료에 대하여 "강우", "Precipitation", "Railfall", "비" 등으로 등록할 소지가 있다. 이러면 실제 자료가 존재하는 데도 등록 방법에 따라 자료의 검색이 어려워진다. 이러한 상황을 제어하기 위하여 검사어휘(Controlled Vocabulary)를 도입한다. 이는 포털의 운영자가 미리 용어의 개념과 용어의 분류체계를 설정하고 등록 자료의 검색어를 미리 설정하여 자료의 원천 소유자가 자료를 등록 시 검사어휘를 참고하여 등록하거나 또는 등록되지 않는 용어의 자료인 경우 이 용어를 포탈에 신규로 등록한다. 검색용어의 난립을 피하기 위하여 사용자의 신규등록은 포탈의 운영자가 어느 정도 제어할 필요가 있다. 검사어휘의 정립과 하천 관련된 분류체계는 하천공간정보 검색의 포탈을 위한 필수사항이다. 검사어휘의 정립의 주된 목적은 이질성의 극복이다. 이질성의 종류는 문법적 이질성, 데이터 형식과 구조 및 문맥적 이질성이 있다. 이 중에서 문맥적 이질성이 가장 넓고 어려운 문제이다. 단위는 분야마다 호칭이 다르고 채택하는 기준마다 다르다. 유사어는 전문용어라도 분야마다 다르다. 우리나라에서 서비스 인코딩시 국어와 영어를 어떻게 처리할 지에 대한 대책도 필요하다. 수문학의 시계열 자료를 다루는 CUAHSI/HIS의 온톨로지는 대 개념으로 물리학적, 화학적 및 생물학적인 분야로 분류하고 있다. 하천공간정보의 온톨로지 구축을 위해 데이터 분석 및 분류, 온톨로지 요소 설정, 온톨로지 데이터 테이블 작성, 클래스 생성 및 계층화, 클래스 계층화에 따른 속성 설정, 클래스에 적합한 개체 삽입, 논리 관계 확인 및 수정과 같은 과정으로 온톨로지 개발을 진행하고자 한다.

  • PDF

토목공학분야 문헌정보분류법의 류.강체계 비교분석 (Comparative study of class and division classification for the civil engineering field in a library classification system)

  • 강인석
    • 정보관리학회지
    • /
    • 제14권2호
    • /
    • pp.105-122
    • /
    • 1997
  • 토목공학분야의 도서는 최근 건설기술의 발전과 토목공학 적용분야의 확대로 인하여 방대한 양의 도서자료들이 발생하고 있다. 도서정보의 분류체계는 현재 각 도서관과 건설관련기관내의 자료실 등에서 서지, 논문 및 정기간행물 등의 분류체계로서 듀이십진분류법(Dewey Decimal Classification-DDC) 또는 한국십진분류법(Korean Decimal Classification-KDC)등을 사용하고 있다. 그러나 기존 분류체계의 토목공학 분류항들이 학문의 학술적, 기술적 분류와 일치하지 않는 점 등으로 효과적인 도서분류와 정보검색에 어려움이 있으므로, 토목공학분야의 도서분류체계를 보다 학문이론적 분류에 적합하도록 재구성할 필요가 있다. 본 연구에서는 국내외의 도서분류체계중 토목공학분야의 분류항들을 검토한 후, 적용상의 문제점 분석과 함께, 학술정보를 위한 학문적 분류와 실무자료검색을 위한 기술적 분류의 연계성을 갖추어, 요구되는 정보를 보다 편리하게 검색할 수 있는 새로운 토목공학분야 도서분류의 류, 강 분류체계를 제시하고 있다. 제시된 분류체계는 건설 기술정보분류체계의 구성시에 시설물 정보분류항으로 활용될 수 있으며, 한국십진분류법의 개 ㅍ\ulcorner토목공학분야 분류코드로 참조될 수 있을 것이다.

  • PDF

Suffix Tree를 이용한 웹 문서 클러스터의 제목 생성 방법 성능 비교 (Performance Comparison of Keyword Extraction Methods for Web Document Cluster using Suffix Tree Clustering)

  • 염기종;권영식
    • 한국지능정보시스템학회:학술대회논문집
    • /
    • 한국지능정보시스템학회 2002년도 추계정기학술대회
    • /
    • pp.328-335
    • /
    • 2002
  • 최근 들어 인터넷 기술의 발달로 웹 상에 많은 자료들이 산재해 있습니다. 사용자가 원하는 정보를 검색하기 위해서 키워드 검색을 이용하고 있는데 이러한 키워드 검색은 사용자들이 입력한 단편적인 정보에 바탕하여 검색하고 검색된 결과들을 자체적인 기준으로 순위를 매겨 나열식으로 제시하고 있다. 이러한 경우 사용자들의 생각과는 다르게 결과가 제시될 수 있다. 따라서 사용자들의 검색 시간을 줄이고 편리하게 검색하기 위한 환경의 필요성이 높아지고 있다. 본 논문에서는 Suffix Tree 알고리즘을 사용하여 관련있는 문서들을 분류하고 각각의 분류된 클러스터에 제목을 생성하기 위하여 문서 빈도수, 단어 빈도수와 역문서 빈도수, 카이 검정, 공통 정보, 엔트로피 방법을 비교 평가하여 제목을 생성하는데 어떠한 방법이 가장 효과적인지 알아보기 위해 비교 평가해본 결과 문서빈도수가 TF-IDF보다 약 10%정도 성능이 좋은 결과를 보여주었다.

  • PDF

특징기반 영상 검색 시스템을 위한 다단계 영상 검색 기법 (Multi-Level Image Retrieval Technique for Feature-Based Image Retrieval System)

  • 김봉기;신창둔;오해석
    • 정보기술과데이타베이스저널
    • /
    • 제5권1호
    • /
    • pp.85-96
    • /
    • 1998
  • 최근 멀티미디어 기술의 발전으로 인해 영상을 효율적으로 검색할 수 있는 영상 데이터베이스 시스템이 정보화 사회의 중요한 핵심 기술로 대두되고 있다. 본 논문에서는 내용기반 영상 데이터 검색을 위한 영상 특징 추출 방법으로 색상 정보와 모양 정보를 고려하는 다단계 영상 검색 시스템을 제안하였다. 제안된 시스템에서는 2단계로 이루어진다. 1단계에서는 색상 정보를 위해서 Striker 등이 제시한 색상 분포 특성을 이용한 색인 방법의 문제점을 보완하고 확장하여 지역 색상 분포 특성을 고려한 색인 방법을 사용하여 1차로 영상을 대 분류한다. 2단계에서는 1단계에서 대 분류된 집단 영상들에 대하여 2차로 모양 정보를 이용하여 사용자가 질의한 영상과 유사한 영상을 최종적으로 검색한다. 모양 정보를 위해서는 기존 불변 모멘트의 문제점인 많은 연산량과, Jain 등이 제시한 방향 히스토그램 인터섹션 방법에서 제기된 회전에 민감하다는 문제점을 해결하기 위해 물체의 윤곽선에 해당하는 화소들만을 대상으로 연산을 수행하는 향상된 불변 모멘트(Improved Moment Invariants: IMI)를 이용한다. 실험 영상으로 300개의 상표 영상을 사용하여 기존 방법들과의 비교 실험을 통해 향상된 검색 결과를 얻을 수 있었다.

  • PDF

웨이브렛 변환에 기반한 밝기 변화와 회전에 적응적인 영상 검색 알고리즘 (An Adaptive Image Retrieval Algorithm for Brightness Transforms and Rotational Image based on Wavelet Transform)

  • 이한성;박정호;곽훈성
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2003년도 춘계학술발표논문집 (상)
    • /
    • pp.543-546
    • /
    • 2003
  • 본 논문에서는 최근 영상 처리 및 검색 분야에서 많이 활용되고 있는 웨이브렛 변환과 원 영상의 영역 분류를 이용하여 밝기가 변화된 영상과 회전된 영상의 검색이 가능한 알고리즘을 제안하였다. 제안한 방식을 통해 영상 전제에 대해 검색이 수행되지 않고 영역 분류 결과인 블록맵과 변환 대역에서의 분산값을 이용함으로써 적은 양의 정보만을 저장하고, 이를 기반으로 영상 검색을 수행함으로써 검색속도의 향상과 효율적인 검색이 가능함을 실험을 통해 확인하였다.

  • PDF

범주 대표어의 가중치 계산 방식에 의한 자동 문서 분류 시스템 (Automatic Document Classification by Term-Weighting Method)

  • 이경찬;강승식
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 봄 학술발표논문집 Vol.29 No.1 (B)
    • /
    • pp.475-477
    • /
    • 2002
  • 자동 문서 분류는 범주 특성 벡터와 입력 문서 벡터의 유사도 비교에 의해 가장 유사한 범주를 선택하는 방법이다. 문서 분류 시스템을 구현하기 위하여 각 범주의 특성 벡터를 정보 검색 시스템의 역파일 형태로 구축하였으며, 용어 가중치를 계산하는 방법을 달리하여 문서 분류 시스템의 정확도를 실험하였다. 실험 문서는 일간지의 신문기사들을 무작위로 추출한 문서 집합을 대상으로 하였으며, 정보 검색 모델에서 보편적으로 사용되는 TF-lDF 방식이 변형된 방식에 비해 더 나은 성능을 보였다.

  • PDF

클릭 로그에 근거한 네이버 검색 질의의 형태 및 주제 분석 (An Analysis of Query Types and Topics Submitted to Navel)

  • 박소연;이준호;김지승
    • 한국문헌정보학회지
    • /
    • 제39권1호
    • /
    • pp.265-278
    • /
    • 2005
  • 웹 검색 분야의 대부분의 선행 연구들은 검색 질의를 살펴본 연구자의 판단에 근거하여 질의의 주제를 분석하였다. 그러나 웹 검색 질의의 주제 분야가 방대하고 다양하여서 이용자가 검색 결과에서 실제로 조회한 문서를 모르는 상태에서 연구자의 판단에 근거하여 질의의 주제를 분류하기에는 한계가 있다. 이에 본 연구에서는 1년 동안 네이버 이용자들이 입력한 질의를 기록한 질의로그와 질의에 대한 검색 결과에서 이용자가 조회한 문서를 기록한 클릭 로그에 근거하여 국내 웹 검색 질의의 형태 및 주제를 분석하였다. 질의를 형태별로 분류한 결과 사이트 검색 질의가 내용 검색 질의보다 많은 것으로 나타났다. 또한 이용자들이 전반적으로 가장 많이 검색한 주제는 컴퓨터/인터넷. 엔터테인먼트, 쇼핑, 게임. 교육 순으로 나타났다. 본 연구의 결과는 인터넷 포탈 업체들의 효과적인 컨텐츠 구축 및 효율적인 검색 시스템 개발에 기여할 것으로 기대된다.

검색 문서의 분류 정보에 기반한 용어 클러스터 질의 확장 모델 (A Term Cluster Query Expansion Model Based on Classification Information of Retrieval Documents)

  • 강현수;강현규;박세영;이용석
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1999년도 제11회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.7-12
    • /
    • 1999
  • 정보 검색 시스템은 사용자 질의의 키워드들과 문서들의 유사성(similarity)을 기준으로 관련 문서들을 순서화하여 사용자에게 제공한다. 그렇지만 인터넷 검색에 사용되는 질의는 일반적으로 짧기 때문에 보다 유용한 질의를 만들고자 하는 노력이 지금까지 계속되고 있다. 그러나 키워드에 포함된 정보가 제한적이기 때문에 이에 대한 보완책으로 사용자의 적합성 피드백을 이용하는 방법을 널리 사용하고 있다. 본 논문에서는 일반적인 적합성 피드백의 가장 큰 단점인 빈번한 사용자 참여는 지양하고, 시스템에 기반한 적합성 피드백에서 배제한 사용자 참여를 유도하는 검색 문서의 분류 정보에 기반한 용어 클러스터 질의 확장 모델(Term Cluster Query Expansion Model)을 제안한다. 이 방법은 검색 시스템에 의해 검색된 상위 n개의 문서에 대하여 분류기를 이용하여 각각의 문서에 분류 정보를 부여하고, 문서에 부여된 분류 정보를 이용하여 분류 정보의 수(m)만큼으로 문서들을 그룹을 짓는다. 적합성 피드백 알고리즘을 이용하여 m개의 그룹으로부터 각각의 용어 클러스터(Term Cluster)를 생성한다. 이 클러스터가 사용자에게 문서 대신에 피드백의 자료로 제공된다. 실험 결과, 적합성 알고리즘 중 Rocchio방법을 이용할 때 초기 질의보다 나은 성능을 보였지만, 다른 연구에서 보여준 성능 향상은 나타내지 못했다. 그 이유는 분류기의 오류와 문서의 특성상 한 영역으로 규정짓기 어려운 문서가 존재하기 때문이다. 그러나 검색하고자 하는 사용자의 관심 분야나 찾고자 하는 성향이 다르더라도 시스템에 종속되지 않고 유연하게 대처하며 검색 성능(retrieval effectiveness)을 향상시킬 수 있다.사용되고 있어 적응에 문제점을 가지기도 하였다. 본 연구에서는 그 동안 계속되어 온 한글과 한잔의 사용에 관한 논쟁을 언어심리학적인 연구 방법을 통해 조사하였다. 즉, 글을 읽는 속도, 글의 의미를 얼마나 정확하게 이해했는지, 어느 것이 더 기억에 오래 남는지를 측정하여 어느 쪽의 입장이 옮은 지를 판단하는 것이다. 실험 결과는 문장을 읽는 시간에서는 한글 전용문인 경우에 월등히 빨랐다. 그러나. 내용에 대한 기억 검사에서는 국한 혼용 조건에서 더 우수하였다. 반면에, 이해력 검사에서는 천장 효과(Ceiling effect)로 두 조건간에 차이가 없었다. 따라서, 본 실험 결과에 따르면, 글의 읽기 속도가 중요한 문서에서는 한글 전용이 좋은 반면에 글의 내용 기억이 강조되는 경우에는 한자를 혼용하는 것이 더 효율적이다.이 높은 활성을 보였다. 7. 이상을 종합하여 볼 때 고구마 끝순에는 페놀화합물이 다량 함유되어 있어 높은 항산화 활성을 가지며, 아질산염소거능 및 ACE저해활성과 같은 생리적 효과도 높아 기능성 채소로 이용하기에 충분한 가치가 있다고 판단된다.등의 관련 질환의 예방, 치료용 의약품 개발과 기능성 식품에 효과적으로 이용될 수 있음을 시사한다.tall fescue 23%, Kentucky bluegrass 6%, perennial ryegrass 8%) 및 white clover 23%를 유지하였다. 이상의 결과를 종합할 때, 초종과 파종비율에 따른 혼파초지의 건물수량과 사료가치의 차이를 확인할 수 있었으며, 레드 클로버 + 혼파 초지가 건물수량과 사료가치를 높이는데 효과적이었다.\ell}$ 이었으며 , yeast extract 첨가(添加)하여 배양시(培養時)는 yeast extract

  • PDF

HACM을 사용한 객체지향 재사용 부품의 분류와 검색 (Classification and Retrieval of Object - Oriented Reuse Components with HACM)

  • 배제민;김상근;이경환
    • 한국정보처리학회논문지
    • /
    • 제4권7호
    • /
    • pp.1733-1748
    • /
    • 1997
  • 재사용을 지원하는 라이브러리 구축을 위해서는 다양한 응용영역에 적용할 수 있는 분류스킴과 검색방법이 필요하다. 본 논문에서는 재사용 단계의 접근성의 핵심을 이루는 분류스킴을 클러스터를 이용한 계층적인 구조를 통해 정의하였다. 또한 검색시스템의 기능과 정확도를 결정하는 라이브러리 구조에 클러스터링 정보를 첨가하여 부품의 표현방법과 클래스들간의 유사관계를 기술, 관리하는 방법을 제안하였다. 이에 따라 개발자에게 소프트웨어 부품의 인덱싱 및 스테밍 등을 통한 분류 및 검색 방법을 제공함으로써 재사용부품에 대한 탐색가능성을 높이고 재사용의 효과를 증진시키려한다. 그 결과로 재사용 라이브러리의 구축과정을 자동화하였고 기존의 문제점인 확장성과 관련된 모두를 고려한 분류스킴을 통하여 재사용라이브러리와 검색시스템을 구축하였으며 관련연구를 클러스터 계층도를 통해 시각화함으로써 탐색가능성에 대한 효과를 높였다. 또한 검색결과는 재사용시스템 CARS 2.1에 통합되었다.

  • PDF

용어의 자동분류에 관한 연구 (A Study on Automatic Keyword Classification)

  • 서은경
    • 정보관리학회지
    • /
    • 제1권1호
    • /
    • pp.78-99
    • /
    • 1984
  • 본 논문은 기계가독형 데이타베이스를 탐색하는 자연어 정보검색 시스템에서 검색용 디소오러스를 이용하면 정보검색효율이 향상된다는 전제하에, 검색용 디스오러스 자동 작성방법 중의 하나인 용어 다동분류를 우리말 용어에 적용시켜 실험하였고, 이 결과로 형성된 용어군의 응용방법을 제시하였다. 용어자동분류는 용어사이에 존재하는 어의적 관계가 한 문장에서 출현하는 용어의 통계적 양상에 근거하여 밝혀질 수 있다는 가설하에 세워진 방법으로, 본 논문에서는 심리학 분야의 국내 학술잡지중 초록이 수록된 4개의 잡지를 실험대상잡지로 선택하였다.

  • PDF