• 제목/요약/키워드: Retrieval technique

검색결과 449건 처리시간 0.022초

Word2Vec를 이용한 한국어 단어 군집화 기법 (Korean Language Clustering using Word2Vec)

  • 허지욱
    • 한국인터넷방송통신학회논문지
    • /
    • 제18권5호
    • /
    • pp.25-30
    • /
    • 2018
  • 최근 인터넷의 발전과 함께 사용자들이 원하는 정보를 빠르게 획득하기 위해서는 효율적인 검색 결과를 제공해주는 정보검색이나 데이터 추출등과 같은 연구 분야에 대한 중요성이 점점 커지고 있다. 하지만 새롭게 생겨나는 한국어 단어나 유행어들은 의미파악하기가 어렵기 때문에 주어진 단어와 의미적으로 유사한 단어들을 찾아 분석하는 기법들에 대한 연구가 필요하다. 이를 해결하기 위한 방법 중 하나인 단어 군집화 기법은 문서에서 주어진 단어와 의미상 유사한 단어들을 찾아서 묶어주는 기법이다. 본 논문에서는 Word2Vec기법을 이용하여 주어진 한글 문서의 단어들을 임베딩하여 자동적으로 유사한 한국어 단어들을 군집화 하는 기법을 제안한다.

Digital Application of Intangible Cultural Heritage from the Perspective of Cultural Ecology

  • Jing, Xiuli;Tan, Fang;Zhang, Mu
    • Journal of Smart Tourism
    • /
    • 제1권1호
    • /
    • pp.41-52
    • /
    • 2021
  • This paper explored the digital application of intangible cultural heritage from the perspective of cultural ecology. Through field investigations, combined with cultural ecology theory, an ontology-based semantic web technology was proposed, and Nanjing "Yunjin" brocade weaving technique was selected as the research object. The specific steps were as follows: First, based on the field surveys and cultural ecology theory, the intangible cultural ecological environment was divided into natural and social environments. Next, constructing the intangible cultural heritage ontology was constructed, including the collection and collation of Nanjing Yunjin weaving technique knowledge corpus, based on user needs analysis and corpus analysis, CIDOC CRM was used to create rules to build the ontology. Finally, based on the MediaWiki platform and Semantic MediaWiki, the semantic web model of the intangible cultural heritage was designed, and its semantic retrieval function was realized, thereby achieving the practical application of intangible cultural heritage digitization. Based on the perspective of cultural ecology, a set of intangible digital application models was proposed, which expanded the digital application of the cultural ecology theory, verified the application of this model in the sustainable development of cultural tourism, and provided reference for the sustainable development of cultural tourism.

우편주소정보 추출모듈 개발 및 평가 (Development and Evaluation of Information Extraction Module for Postal Address Information)

  • 신현경;김현석
    • 창의정보문화연구
    • /
    • 제5권2호
    • /
    • pp.145-156
    • /
    • 2019
  • 본 연구에서는 명명된 실체 인식 기법에 기초한 정보 추출 모듈을 개발하고 평가하였다. 본 논문의 제시된 목적을 위해, 모듈은 사전 지식 없이 임의의 문서에서 우편 주소 정보를 추출하는 문제에 적용하도록 설계되었다. 정보 기술 실무의 관점에서, 우리의 접근방식은 유니그램 기반 키워드 매칭과 비교하여 일반화된 기법인 확률론적 n-gram(바이오그램 또는 트리그램) 방법이라고 말할 수 있다. 모델을 순차적으로 적용하지 않고 문장검출, 토큰화, POS 태그를 재귀적으로 적용하는 것이 우리의 접근법과 자연어 처리에 채택된 전통적인 방법 사이의 주요한 차이점이다. 이 논문에서는 약 2천 개의 문서를 포함한 시험 결과를 제시한다.

비디오 데이타를 위한 그리드 기반의 유사 부분 궤적 검색 기법 (Similar sub-Trajectory Retrieval Technique based on Grid for Video Data)

  • 이기영;임명재;김규호;김정준
    • 한국인터넷방송통신학회논문지
    • /
    • 제9권5호
    • /
    • pp.183-189
    • /
    • 2009
  • 최근, PCS, PDA와 같은 이동기기 보급의 확산, GPS(Global Positioning System)의 활용, 유무선 네트워크의 급속한 발전 등으로 일반 사용자들조차 이미지, 오디오, 비디오 등과 같은 멀티미디어 데이타에 대한 활용이 증가하고 있다. 특히, 멀티미디어 데이타 중에서도 비디오 데이타는 텍스트나 이미지 데이타와는 달리 이동 객체에 대한 움직임 정보를 포함하고 있고 시간의 변화에 따라 공간의 변화를 가지는 시공간적 특성을 가진다. 객체의 공간적 위치가 시간의 흐름에 따라 계속 변하는 이동객체(Moving Object)들의 연속적인 움직임들의 모임을 궤적이라 하며, 데이타베이스에서 사용자로부터 주어진 질의 궤적과 유사한 궤적을 포함하는 데이타를 찾는 것을 유사 부분궤적 검색(Similar Sub-trajectory Retrieval)이라 한다. 그리고 이러한 유사 부분궤적 검색을 하기 위해선 사용자 질의 궤적과 주어진 유사정도(Tolerance) 내에서 유사한 데이타 궤적을 검색 할 수 있는 근사 매칭(Approximate Matching)이 가능해야 한다. 또한, 방대한 멀티미디어 데이타베이스에서 사용자가 원하는 데이타 만을 보다 빠른 시간 내에 찾을 수 있도록 기존 연구와는 다른 효과적인 검색방법이 요구된다. 이를 위해, 본 논문에서는 효과적인 검색을 위해 궤적을 그리드로 분할하여 이동 객체의 궤적에 대한 효율적인 유사 부분궤적 검색을 지원하는 새로운 그리드 기반 검색 기법을 제안한다.

  • PDF

개념 망을 이용한 키워드 기반의 효율적인 정보 검색 시스템 설계 (Design of an Efficient Keyword-based Retrieval System Using Concept lattice)

  • 마진;전인호;최영근
    • 인터넷정보학회논문지
    • /
    • 제16권3호
    • /
    • pp.43-57
    • /
    • 2015
  • 본 논문에서는 개념망을 이용한 효율적인 정보검색을 위한 방법을 제안한다. 본 논문은 일반적인 개념망을 기반으로 시스템을 설계하였기 때문에 온톨로지와 접근 방식은 같지만 사용자가 보다 효율적으로 정보검색을 하고자 하는 객체와 개념사이의 협업 관계를 구축하여 사용할 수 있도록 개념망을 제안한다. 제안한 시스템은 다음과 같다. 첫 번째, 입력 키워드 중심의 키워드 개념망과 전문가 그룹이 추천한 전문가 개념망 그리고 테마 개념망 이러한 세 종류의 개념을 이용하여 협업적 검색을 하며, 이를 기반으로 사용자가 원하는 정보를 검색할 수 있는 효율적인 검색 시스템을 제안한다. 그리고 전문가 개념과 키워드 개념이 결합되어 키워드의 빈도 및 카테고리의 빈도를 제공함으로써, 사용자가 입력한 검색어와 관련된 키워드를 추천하는 역할을 할 수 있다. 그리고 테마 개념망을 이용하여 사용자의 관심 테마에서 사용되는 키워드 또는 카테고리를 알려주는 기능도 제공한다. 두 번째, 사용자가 입력한 키워드가 없을 경우 2차 검색을 통해 입력 키워드와 관련 있는 키워드를 제공해줌으로써 관련키워드를 이용하여 검색의 목적달성이 가능하다. 세 번째, 이러한 정보들은 대부분 분산되어 관리되고 있기 때문에 이렇게 분산되어 관리되는 정보는 표현방식이 다를 뿐만 아니라 시간에 따라 정보가 변하게 된다. 따라서 분산된 정보의 효율적 데이터 접근 및 통합을 위해 XMDR(eXtended Mata-Data Registry)을 이용하였고, 본 논문에서는 분산된 데이터를 통합하기 위한 기법 및 검색 시스템을 제시한다.

분산 그리드 기법을 위한 연속 k-최근접 질의처리 알고리즘 (Countinuous k-Nearest Neighbor Query Processing Algorithm for Distributed Grid Scheme)

  • 김영창;장재우
    • 한국공간정보시스템학회 논문지
    • /
    • 제11권3호
    • /
    • pp.9-18
    • /
    • 2009
  • 최근 GPS 및 무선 이동 컴퓨팅 기술의 발달로 인해, 텔레매틱스(telematics) 및 위치기반 서비스(LBS) 응용이 활발하게 연구되고 있다. 이러한 위치 기반 서비스 응용에서는 이동객체의 위치 정보가 시간의 흐름에 따라 계속적으로 변하기 때문에, 이를 위한 빈번한 업데이트 연산은 시스템에 많은 부하를 가중시키며 이로 인해 검색 성능의 저하를 초래한다. 이를 해결하기 위해 공간 네트워크에서 대용량 이동객체의 위치정보를 분산 처리하기 위한 DS-GRID(distributed S-GRID) 및 이를 위한 k-최근접 질의처리 알 고리즘이 제안되었다[1]. 그러나 k-최근접 질의처리 기법은 질의점 및 이동객체의 위치가 변경되면 그 결과 가 유효하지 않기 때문에, 연속 k-최근접(CKNN:continuous k-nearest neighbor) 질의처리 알고리즘의 연구가 필요하다. 본 연구에서는 DS-GRID를 위한 MCE-CKNN 알고리즘 및 MBP-CKNN 알고리즘을 제안한다. MCE-CKNN 알고리즘은 주어진 경로를 셀 단위로 분할하여 각 셀에서 질의 처리를 병렬적으로 수행하여 검색 성능을 향상시킨다. 아울러 MBP-CKNN 알고리즘은 그리드 셀의 각 경계점에서 가까운 POI를 미리 저장하여 인접셀 탐색 횟수를 줄임으로써 검색 성능을 향상시킨다. 마지막으로, 제안하는 알고리즘의 성능 분석을 통해, 기존 알고리즘보다 15-53% 검색 성능이 우수함을 나타내었다.

  • PDF

모바일 인터넷 기반 이미지 검색을 위한 초기질의 자동생성 기법 (An Automatic Generation Method of the Initial Query Set for Image Search on the Mobile Internet)

  • 김덕환;조윤호
    • 지능정보연구
    • /
    • 제13권1호
    • /
    • pp.1-14
    • /
    • 2007
  • 휴대전화의 배경화면을 위한 캐릭터 이미지의 수요가 모바일 컨텐츠 시장에서 빠르게 성장함에도 불구하고 지능형 검색 도구의 부재로 인해 사용자들은 원하는 이미지를 검색하는 데 많은 어려움을 겪고 있다. 이 문제를 해결하기 위한 방법으로 이미지 검색을 위해 가장 널리 사용되는 내용기반 이미지 검색(Content-Based Image Retrieval; CBIR)이 사용될 수 있겠으나 PC-기반 시스템과는 달리 초기 질의 요구를 만족시킬 수 없는 모바일 응용 소프트웨어의 제약 사항의 극복이 필요하다. 본 연구에서는 적합성 피드백과정에서 얻어진 선호도 정보를 이용하는 협업필터링(Collaborative Filtering; CF) 기법을 사용하여 내용기반 이미지 검색의 초기 질의로 사용될 수 있는 후보이미지의 리스트를 자동 생성하는 IQS-AutoGen이라고 하는 새로운 방법을 제안한다. IQS-AutoGen은 CBIR로부터 피드백된 이미지들에 대한 적합성 정보를 이용하여 목표 사용자와 선호도가 유사한 이웃(neighbor)을 확인하고 이웃들이 선호하는 이미지들의 리스트를 제공하는 CF 프로세스를 통해 CBIR을 위한 초기 질의 집합(Initial Query Set : IQS)을 자동으로 생성한다. 따라서 모바일 사용자는 IQS에 있는 이미지들 중의 하나를 선택하여 CBIR 세션을 위한 질의 이미지로 사용할 수 있게 된다. PC-기반 프로토타입 시스템을 사용하여 실험한 결과로부터 제안한 방법이 모바일 인터넷 환경에서 CBIR의 초기질의 요구를 성공적으로 만족시킬 뿐만 아니라 현재의 검색 방법보다 우수한 성능을 보여주고 있음을 알 수 있다.

  • PDF

디스크 배열로 구성된 VOD 서버에서 효율적인 VCR 기능 지원을 위한 참조 카운터 기반의 디스크 부하 균등 기법 (A Disk Load Balancing Technique based on The Access Counter for Efficiently Providing VCR Functions in Disk Array Based VOD Servers)

  • 권춘자;김근혜;최황규
    • 한국멀티미디어학회논문지
    • /
    • 제5권5호
    • /
    • pp.477-487
    • /
    • 2002
  • 멀티미디어의 대표적인 응용분야인 VOD 시스템에서 사용자에게 효과적인 대화형 서비스를 제공하기 위해서는 고속 전진과 후진 서비스 등의 VCR 기능을 제공해야 한다. 지금까지 디스크 배열을 기반으로 하는 VOD서버에서 이를 실현하는 방법으로써 세그먼트 인터리빙 기법이 주로 사용되고 있다. 그러나 세그먼트 인터리빙 기법은 일부 디스크에 대한 부하 편중 현상을 초래하여 사용자에 대한 QoS의 보장이 어렵다는 단점을 가진다. 한편 이를 해결하기 위한 지금까지의 연구는 대부분 서로 다른 배속을 갖는 단일 사용자에 대한 경우가 대부분으로 같은 배속을 요청하는 여러 사용자들을 고려한 현실적인 경우에 대해서는 다시 부하 편중 현상이 발생할 수 있다. 본 논문에서는 이러한 문제를 해결하기 위한 새로운 디스크 부하 균등 기법을 제안한다. 제안된 기법은 각 디스크마다 참조 카운터를 두고 이를 비교하여 상대적으로 참조 횟수가 적은 디스크를 우선적으로 선택함으로써 전체적인 디스크 부하의 균형을 이룬다. 시뮬레이션을 통한 성능 분석에서 제안된 기법은 기존의 방법들 보다 우수한 성능을 나타냄을 보인다.

  • PDF

SIF기반 우선순위 검색기법의 설계 및 구현 (Design and Implementation of Priority Retrieval Technique based on SIF)

  • 이은식;조대수
    • 한국정보통신학회논문지
    • /
    • 제14권11호
    • /
    • pp.2535-2540
    • /
    • 2010
  • 전통적인 Pub/Sub(Publish/Subscribe) 시스템에서는 출판자(Pub)가 출판정보(Event)를 중개자(Broker)에게 전달을 하고 등록되어져 있는 구독조건(Subscription)과 매칭유무를 파악한 뒤 매칭된 구독조건들을 등록한 구독자(Sub)에게 출판정보를 전달한다. 이 시스템에서 정보의 전달은 출판자에서 구독자로의 단 방향으로 이루어졌다. 최근 새로운 용용 프로그램에서는 구독조건을 출판자에게도 전달하는 양 방향 정보전달의 필요성이 제기되었다. 따라서 출판자와 구독자들 간의 양방향 정보전달이 가능한 확장된 Pub/Sub 시스템을 제안하고자 한다. 확장된 Pub/Sub 시스템에서는 출판정보에 매칭되는 구독조건이 다수가 있을 수 있으므로 우선순위에 따라 상위 n개만을 출판자에게 전달할 수 있는 가능이 요구된다. 이 논문에서는 구독조건 간 우선순위를 결정하고 정하기 위한 SIF(Specific Interval First)를 정의하고 IS-List(Interval Skip List)를 이용하여 SIF기반의 우선순위 검색기법을 두 가지 방법으로 제안하였다. 성능평가 결과 집합정렬 방법은색인 생성 측면에서 그리고 삽입 시간 정렬 및 스팩을 이용한역 탐씩 방법은 검색 시간측면에서 좋은 성능을 보였다.

비집중화된 조정 기법을 이용한 에이전트 기반 웹 서비스 지원 (Agent_based Web Service Support using Decentralized Coordination Technique)

  • 정슬기;이태경
    • 정보처리학회논문지B
    • /
    • 제15B권5호
    • /
    • pp.449-456
    • /
    • 2008
  • 본 논문은 웹 환경에서 기존의 웹서비스 골격과 기능을 유지하면서, 에이전트 사이를 조정하여 웹 서비스를 지원하는 새로운 시스템을 설계하고 구현하였다. 본 논문에서는 제안한 LDL을 사용함으로 에이전트가 사용자의 요청을 동적으로 수행 할 수 있었고, 그룹화된 에이전트들이 공동의 목표를 상호 협력적으로 수행하기 위해 위임 과정을 수행함으로써 멀티 에이전트에 의한 웹서비스의 가능성을 보였다. 구현된 시스템의 검증을 위해서 수식계산 시나리오를 사용하였으며, 실험결과 제안한 새로운 시스템은 웹 서비스를 위해 필요한 모듈 검색의 시간 비용이 절감됨을 알 수 있었으며, 일반 사용자도 쉽게 접근이 가능하였다.