• 제목/요약/키워드: 색인 지원 도구

검색결과 17건 처리시간 0.025초

새로운 주제 탐지를 통한 지식 구조 갱신에 관한 연구 (A Study on Updating the Knowledge Structure Using New Topic Detection Methods)

  • 김판준;정영미
    • 정보관리학회지
    • /
    • 제22권1호
    • /
    • pp.191-208
    • /
    • 2005
  • 새로운 주제의 탐지를 위한 여러 접근법들을 지식 구조 표현 방법 중 하나인 디스크립터의 부여 및 갱신 과정에 적용하였다. 새로운 주제 탐지는, 특히 특정 학문 분야에서 새로운 주제의 출현 및 성장으로 인하여 지식구조상의 변화가 발생하는 경우에, 기존의 색인어로는 이를 표현할 수 없거나 표현상의 제한이 따르는 문제를 해결하는 데 응용할 수 있다. 실험 결과, 정보학 내에서 긍정적 측면의 변화가 발생한 것으로 식별된 신흥 주제들은 상당수가 서로 밀접하게 연관되어 있으면서 동시에 성장${\cdot}$발전의 단계에 있는 주제임을 확인하였다. 또한, 새로운 주제 탐지를 통한 후보 디스크립터 리스트의 사용이 색인자의 색인작업을 지원하는 효율적인 도구가 될 수 있다는 가능성을 보여 주었다. 특히, 적절한 디스크립터의 선정과 부여를 위한 후보 디스크립터 리스트의 제공은 색인작업의 효율성과 정확성을 향상시키는 데 기여할 수 있을 것이다.

언어학자를 위한 말뭉치 분석기 (Corpus Analyzer for Linguists)

  • 정석팔;임성현;전진형;이현아
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2012년도 제24회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.95-98
    • /
    • 2012
  • 말뭉치는 언어를 연구하기 위한 중요한 재료이다. 본 논문에서는 말뭉치에서 나타나는 언어 현상을 보다 효율적으로 분석하기 위한 언어학자를 위한 말뭉치 분석기를 제안하고 그 구현 방법을 설명한다. 제안하는 말뭉치 분석기는 기본적인 통계 정보와 함께, 형태소 분석된 파일을 대상으로 위치 색인을 포함하는 역파일 색인을 구성하여 빠른 형태소 검색과 다앙한 수준의 연어 검색을 제공한다. 분석기는 세종말뭉치를 기본 말뭉치로 하며, 다앙한 말뭉치에 대한 통계자료와 검색 기능을 제공하기 위해 사용자 말뭉치 파일에 대한 처리도 지원한다. 시스템은 사용자가 업로드한 말뭉치 파일에 대하여 자동 형태소 분석을 제공하며 형태소 분석 결과 수정을 가능하게 하여 다앙한 말뭉치에서 언어학자들의 우리말 연구를 지원한다.

  • PDF

MPEG-7 시각 정보 기술자와 텍스트 정보를 이용한 내용 기반 웹 이미지 검색 시스템 (A Content based Web Image Retrieval System using MPEG-7 Visual Descriptors and Textual Information)

  • 박주현;낭종호
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2006년도 한국컴퓨터종합학술대회 논문집 Vol.33 No.1 (A)
    • /
    • pp.232-234
    • /
    • 2006
  • 인터넷 기술의 발달과 디지털 카메라와 같은 디지털 미디어 생산 장비의 발달로 WWW에 이미지 데이터의 양이 급격하게 늘어나면서 웹 이미지에 대한 효율적인 검색에 대한 요구가 증가하고 있다. 본 논문에서는 사용자의 다양한 검색 요구를 만족시킬 수 있도록 기존의 텍스트 기반의 검색과 시각 정보 기반의 검색을 병합하여 수행할 수 있는 웹 이미지 검색 시스템을 설계하고 구현한다. 제안한 웹 이미지 검색 시스템은 웹 이미지 수집 및 검색정보 추출 도구. 검색 서버. 그리고 검색 클라이언트로 구성된다. 웹 이미지 수집 및 검색 정보 추출 도구는 웹에서 이미지를 수집하여 이미지가 속해있는 웹 문서 구조를 이용하여 적절한 키워드를 선택하며 시각 정보 기반의 검색을 지원하기 위해 MPEG-7 시각 정보 기술자(1)를 추출한다. 빠른 검색을 위해 추출된 텍스트 정보는 상용 데이터베이스에 저장되며 MPEG-7 시각 정보 기술자는 고차원 데이터 색인 방법인 HBI (Hierarchical Bitmap Index)(2)를 사용하여 색인 정보를 만들어 사용한다. 검색 클라이언트는 사용자가 각 검색 요소에 가중치를 부여하여 검색 할 수 있도록 하며 원하는 검색 결과를 얻을 때까지 반복하여 검색할 수 있는 연관 피드백 과정도 포함한다.

  • PDF

안전기준 자동검색을 위한 지원도구 시범개발 (Pilot Development of Supporting Tools for Automatic Detection of Safety Standards)

  • 임수정;박덕근
    • 한국콘텐츠학회논문지
    • /
    • 제20권5호
    • /
    • pp.609-622
    • /
    • 2020
  • 사회가 발달하면서 법령의 규모는 점차 증가하고 있을 뿐만 아니라 내용도 복잡해지고 있다. 법령 내에 존재하고 있는 안전기준의 규모 또한 증대되고 있고 전문화되고 있어 안전기준 상호간의 상충이나 중복 등을 최소화하기 위한 통합관리에 어려움이 있다. 안전기준의 통합관리를 위해서는 기본적으로 법령 내의 안전기준을 검색하여 추출하는 기술이 우선 확보되어야 한다. 본 연구에서는 한정된 시간 및 인력 등의 한계를 고려하여 몇 가지 특정사례를 기반으로 안전기준 자동검색 지원도구를 개발하고자 하였다. 이를 위해 우선 기존 연구에서 분류된 안전기준과 행정안전부에서 고시한 안전기준을 대상으로 안전기준이 가진 특성을 분석하고 2018년에 국립재난안전연구원에서 추출한 안전기준을 포함하는 법령정보를 수집하였다. 수집된 법령을 정제하고 형태소 분석을 실시하여 안전기준 시소러스를 구축한 후 색인 작업을 거쳐 안전기준 검색도구를 개발하였다. 향후 안전기준을 찾는데 자동검색도구가 일상적으로 적용된다면 방대하고 복잡한 안전기준의 중복 또는 상충 문제해결에 도움이 될 것으로 기대된다.

가상 조경 생성을위한 디지털 잎 저작도구 개발 (Development of Digital Leaf Authoring Tool for Virtual Landscape Production)

  • 김진모
    • 한국컴퓨터그래픽스학회논문지
    • /
    • 제21권5호
    • /
    • pp.1-10
    • /
    • 2015
  • 본 연구는 가상 조경을 구성하는 다양한 종류의 디지털 잎을 쉽고 직관적으로 제작할 수 있는 저작도구 개발방법을 제안한다. 제안하는 저작도구의 핵심 시스템은 영상 워핑기반의 잎몸 윤곽선 변형 방법, 잎맥의 절차적 모델링 그리고 잎의 색과 명암 등을 표현하기 위한 수리모델기반 시각화 방법으로 구성된다. 우선 잎 영상을 입력으로 받아 잎몸에 대한 윤곽선 정보를 찾고, 특징기반 영상 워핑을 활용하여 다양한 잎몸 형상을 직관적인 구조에서 쉽게 생성할 수 있는 잎몸 변형 방법을 설계한다. 그리고 계산된 잎몸 윤곽선을 기반으로 잎몸 형상에 적합한 자연스러운 잎맥 패턴을 생성하는 일반화된 절차적 모델링 방법을 저작도구에 맞게 구현한다. 마지막으로 약수 함수의 합성 기반의 수리모델을 활용하여 잎의 색, 명암 그리고 시간에 따른 변화를 표현할 수 있는 시각화 기능을 적용한다. 제안한 저작도구를 활용하여 제작된 디지털 잎이 다양한 3차원 디지털 콘텐츠 분야에 활용 가능하도록 텍스쳐 지원 기능을 제공한다.

이동체의 과거, 현재 및 미래 위치 질의 처리를 위한 통합 색인의 설계 및 구현 (Design and Implementation of Unified Index for Query Processing Past, Current and Future Positions of Moving Objects)

  • 반재훈;전희철;안성우;김진덕;홍봉희
    • 한국공간정보시스템학회 논문지
    • /
    • 제7권1호
    • /
    • pp.77-89
    • /
    • 2005
  • 최근 이동 통신과 GPS 기술의 발달로 위치 기반 서비스에 대한 요구 및 관련된 연구가 활발히 진행되고 있다. 이동체 색인에 관한 기존 연구는 시간 도메인에 따라 과거 궤적 색인과 현재 및 미래 위치 색인으로 분류된다. 그러나 실세계 응용에서는 과거 궤적뿐만 아니라 현재 및 미래 위치 검색을 모두 요구하므로 모든 시간 도메인에 대한 질의를 지원하는 통합 색인을 개발해야 한다. 이 논문에서는 이동체의 과거 궤적을 표현하는 3차원 공간상의 선분과 이동체의 현재 및 미래 위치를 표현하는 시간에 대한 선형 함수를 하나의 색인에 구성함으로써 이동체의 과거, 현재, 미래의 위치 데이터가 통합된 새로운 색인인 PCR-tree(Past, Current R-tree)을 제안한다. PCR-tree 는 노드 내에 포함된 과거, 현재, 미래 위치 데이터에 대한 새로운 경계 영역을 가지며 색인의 모든 엔트리에 대한 단일 인터페이스를 제공한다. 그리고, 제안된 색인과 색인 실험 도구를 구현하여 모든 시간 도메인에 대한 질의 처리가 가능함을 보인다.

  • PDF

연구.학술정보 효율적 검색을 위한 온톨로지 기반의 주제 색인어 구조화 방안 연구 (A Study on Ontology-based Keywords Structuring for Efficient Information Retrieval)

  • 송인석
    • 정보관리연구
    • /
    • 제39권4호
    • /
    • pp.121-154
    • /
    • 2008
  • 본 연구에서는 정보검색도구 관점에서 지식조직체계로서 기존 시소러스 구축방안의 특성과 한계점을 검토하고, 대상 정보의 지식구조의 반영 및 정보 간의 의미관계 추론을 지원하는 온톨로지 기반의 주제 색인어 구조화 방안을 제시한다. 기존의 용어 중심의 시소러스와 달리, 단계별 연구프로세스 과정에서 수행되는 연구자의 정보행위 및 수요 분석에 때라 주제색인어의 개념을 식별 범주화하고, 인문사회과학 분야 학술논문의 지식체계를 구성하는 그 개념들 간의 유기적 관계정의를 통해 주제 색인어 집합의 의미구조를 정형화하였다. 이를 기반으로 각각의 온톨로지 기반 주제 색인어 집합은 구조화된 의미 색인으로서 대상 문서의 지식체계를 표현한다. 정보수요에 따라 정의된 공리나 추론규칙을 활용하여 이용자는 문제 해결에 적합한 정보를 대상 정보의 의미관계로 구성된 주제 도메인의 학술커뮤니케이션 네트워크상에서 분석적 정보탐색을 통해 효율적으로 검색 할 수 있다.

기록 검색도구의 발전과 전망 (A Study on Development and Prospects of Archival Finding Aids)

  • 설문원
    • 기록학연구
    • /
    • 제23호
    • /
    • pp.3-43
    • /
    • 2010
  • 검색도구는 기록을 찾고 이해할 수 있도록 지원하는 도구이다. 검색도구는 크게 수직형 검색도구와 수평형 검색도구로 구분할 수 있는데, 수직형 검색도구는 우리가 보통 '보존기록 기술(archival description)'이라 부르는, 출처 기반의 계층형 검색도구를 말하며, 수평형 검색도구는 목록이나 색인 등과 같은 주제 기반의 검색도구로서, 주로 수직형 검색도구로 안내해주는 역할을 수행했다. 그러나 이러한 검색도구들은 인터넷 환경에 맞추어 진화하고 있으며, 가령 수직형 검색도구의 경우, ISAD(G), ISAAR(CPF), ISDF와 같은 국제표준기술규칙의 개발에 발맞추어, 출처와 원질서 존중의 원칙을 견지하되 다중 엔티티 구조로 변화해가는 경향을 살펴볼 수 있다. 그러나 이용자 입장에서 기록관리 원칙을 적용한 수직형 검색도구는 어렵고 복잡하며, 구체성과 접근성이 떨어진다는 비판을 받는다. 이러한 문제를 극복하기 위하여 각국에서는 기록에 대한 다양한 접근경로를 제공하는 다양한 디지털 콘텐츠를 개발하여 제공하고 있는데, 이것들이 이른바 새로운 유형의 주제 기반 검색도구라고 볼 수 있다. 이 연구에서는 보존기록을 위한 수직형 검색도구의 변화와 그 한계를 조사하였고, 이를 보완하기 위하여 인터넷 환경에서 새롭게 출현하는 검색도구 및 관련 연구들을 전반적으로 살펴 본 결과 복합화, 통합화, 개방화라는 3가지 경향으로 유형화할 수 있었다. 즉, 주제 해설과 검색도구를 연계시킨 복합적 형태의 검색도구, 여러 기관이 소장한 기록을 한꺼번에 검색할 수 있도록 하는 통합 검색도구, 이용자 참여가 보장되는 개방적 형태의 검색도구는 향후 검색도구의 개발 전망을 보여주는 대표적 유형으로 볼 수 있다. 새로운 검색도구의 출현에 따라 우려되는 문제로는 탈 맥락화, 편견과 객관성 유지, 이용자 참여방식과 질적 통제 등으로 보았다. 앞으로 새로운 흐름을 적극적으로 수용하되 오히려 수직형 검색도구 기반을 지속적으로 강화해 나아가고 이용자를 적극 참여시키는 전략을 개발할 것을 제안하였다. 이 연구가 앞으로 국가기록원을 비롯한 영구기록물 관리기관들이 검색도구 개발 전략을 수립할 때 시사점을 제공할 수 있기를 기대한다.

샷 경계 검출을 이용한 영상 클립 생성 (Generation of Video Clips Utilizing Shot Boundary Detection)

  • 김혁만;조성길
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제7권6호
    • /
    • pp.582-592
    • /
    • 2001
  • 대용량 영상을 다루는 디지털 비디오 라이브러리나 웹 방송에서는 영상 색인이 매우 중요한 역할을 하며, 이는 영상을 내용 단위로 분할하는 알고리즘에 기반한다. 본 논문에서 구현된 V2Web Studio는 영상 색인을 지원하는 시스템으로서, 샷 경계 검출 알고리즘을 이용한 영상 클립 생성 시스템이다. V2Web Studio는 영상 클립 생성 과정을 1) 영상 신호를 분석하여 샷 경계를 자동 검출하는 단계, 2) 검출된 결과에 포함될 수 있는 오류를 수작업으로 제거하는 단계, 3) 물리적인 샷 경계를 논리적인 계층구조로 모델링하는 단계, 4) 계층구조로 모델링된 각 모델링 인스턴스를 다양한 표준 압축 포맷으로 생성하는 단계로 구분하고, 각 단계에 해당하는 작업은 샷 검출기, 샷 검증기, 영상 모델기, 클립 생성기라는 독립적인 소프트웨어 도구로 구현하였다.

  • PDF

COVA: 내용 기반 강의 검색을 지원하는 원격 학습 시스템 (COVA: A Distance Learning System supporting Content-based Lecture Retrieval)

  • 차광호
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제31권2호
    • /
    • pp.99-107
    • /
    • 2004
  • 인터넷, 데이타베이스, 멀티미디어 기술의 복합적인 영향으로 교육과 학습의 형태가 크게 변하고 있다. 그러나 강의 내용을 효과적으로 관리하고 검색할 수 있는 시스템과 도구의 부족으로 원격 학습은 크게 효과적이지 못하다. 이 논문은 대용량 강의 데이타베이스에서 사용자가 내용에 기반 하여 관심 있는 강의 부분만 발췌하여 접근할 수 있도록 하는 프로토타입 시스템 COVA를 소개한다. COVA는 원격 학습에서 내용 기반 강의 검색을 위한 다음과 같은 새로운 기법을 포함한다: (1) 강의 내용을 표현하기 위한 XML 기반의 준 구조적(semistructured) 데이타 모델, (2) XML 강의 데이타베이스의 구조적 요약, 즉, 스키마 추출 기법: (3) 원하는 강의 부분의 빠른 탐색을 위한 색인 기법.