• 제목/요약/키워드: exact matching

검색결과 188건 처리시간 0.029초

시소러스를 기반으로 하는 자동색인 시스템에 관한 연구 (The Development of an Automatic Indexing System based on a Thesaurus)

  • 임형묵;정상철
    • 인지과학
    • /
    • 제4권1호
    • /
    • pp.213-242
    • /
    • 1993
  • 그동안 자동색인 기법에 대해서는 단일어 색인,구색인,시소러스 기반 색인 등의 연구가 이루어져 왔는데,단일어 색인 기법이 단일어에 기초한 단순한 색인 방법 임에도 불구하고 다른 두가지 기법보다 일반적으로 우수하다고 알려져왔다. 시소러스 기반 색인은 이중에서도 검색효율이 낮은 것으로 알려져 왔는데,이는 일반적으로 시소러스가 포함하고 있는 색인용어들이 한정되어 있어 색인하려는 자료들이 이색인 용어에 부합(match)되지 않을 경우 색인 자체가 이루어 지지 않기 때문이다. 본 연구에서는 시소러스 기반 색인이 지금까지 기법으로는 검색효율이 좋지 않지만 실제 전문 색인들이 하는 색인과 매우 유사하다는 장범에 기초하여,입력 자료를 구문분석하고,분석된 자료들과 색인용어들을 정확부합(exact match)이 아닌 부분부합(partial match)을 통하여 색인 함으로써 검색효율이 우수한 시소러스기반 자동 색인 시스템을 개발하고자 한다. 본 연구에서 개발된 색인 시스템이 THINS는 우선 시소러스를 트리형태로 구성하고 입력자료들을 KAIST에서 개발한 언어번역기 MATES/EK를 통하여 구문분석한 후 명사구들만 뽑아낸다.그다음 명사구에 있는 용어들중 불용어를 제거하고 스테밍작업을 진행한후 생기는 형태를 색인 용어들과 부분부합 과정을 반복하여,유사한 색인 용어들과 가능하면 색인이 되도록 한다. 본 연구에서는 CACM 데이타 집합을 가지고 본 시소러스 기반 색인 시스템과 단일어 색인방식을 혼성지식기반 시스템인 HYKIS에서 성능을 평가하였다.이 성능평가에서 시소러스를 기반으로 하는 색인 시스템이 단일어 색인방식보다 회상도에서는 8-9%떨어지지만 정확도에서는 10%정도 높은 결과를 나타내었다.그러나 이는 기존의 시소러스 기반시스템이 단일어 색인 방식보다 정확도가 25%-30%정도 떨어진다는 것을 비추어 볼때 기존의 방식보다 우수한 것이라 평가된다.또한 CACM 에서 제공하는 시소러스인 CRCS 가 1000여개의 색인어밖에 포함하고 있어 매우 불완전한 것이라는 것을 고려하면,THINS가 최근에 개발되고 있는 시소러스와 접속된다면 매우 우수한 검색효율을 내리라 사료된다.

깊이정보를 이용한 고속 고정밀 얼굴검출 및 추적 방법 (A Fast and Accurate Face Detection and Tracking Method by using Depth Information)

  • 배윤진;최현준;서영호;김동욱
    • 한국통신학회논문지
    • /
    • 제37권7A호
    • /
    • pp.586-599
    • /
    • 2012
  • 본 논문에서는 RGB영상과 깊이영상을 사용하여 얼굴검출 및 추적을 고속으로 수행할 수 있는 방법을 제안한다. 이 방법은 얼굴검출 과정과 얼굴추적 과정으로 구성되며, 얼굴검출 과정은 기본적으로 기존의 Adaboost 방법을 사용하나, 깊이영상을 사용하여 탐색영역을 축소한다. 얼굴추적은 템플릿 매칭방법을 사용하며, 조기종료 기법을 사용하여 수행시간을 줄였다. 이 방법들을 구현하여 실험한 결과, 얼굴검출 방법은 기존의 방법에 비해 약 39%의 수행시간을 보였으며, 얼굴추적 방법은 $640{\times}480$ 해상도의 프레임 당 2.48ms의 추적시간을 보였다. 또한 검출율에 있어서도 제안한 얼굴검출 방법은 기존의 방법에 비해 약간 낮은 검출률을 보였으나, 얼굴로 인식하였지만 실제로는 얼굴이 아닌 경우의 오검출률에 있어서는 기존방법의 약 38% 향상된 성능을 보였다. 또한 얼굴추적 방법은 추적시간과 추적 정확도에 있어서 상보적인 관계를 가지며, 특별한 경우를 제외한 모든 경우에서 약 1%의 낮은 추적오차율을 보였다. 따라서 제안한 얼굴검출 및 추적방법은 각각 또는 결합하여 고속 동작과 높은 정확도를 필요로 하는 응용분야에 사용될 수 있을 것으로 기대된다.

영역카메라를 이용한 이송중인 제재목의 화상처리시스템 개발 (The Development of Image Processing System Using Area Camera for Feeding Lumber)

  • 김병남;이형우;김광모
    • Journal of the Korean Wood Science and Technology
    • /
    • 제37권1호
    • /
    • pp.37-47
    • /
    • 2009
  • 최근 목재산업계에서는 사람의 시각을 대체하는 기계시각을 이용한 화상처리시스템을 도입하여 제재목 등급 판정의 자동화, 제품의 품질향상 및 재단 최적화 등에 활용하고 있다. 본 연구에서는 국내산 소나무 제재목을 대상으로 표면결함검출을 위한 화상처리시스템을 개발하고자 하였으며, 주로 이용되고 있는 라인스캔카메라를 대신하여 비교적 저가의 영역카메라를 이용하였을 때 발생되는 문제점을 해결하고자 하였다. 벨트컨베이어의 불균일한 이송속도에 따른 문제점을 해결하기 위해 화상의 특징점을 이용한 결과 효과적인 화상병합을 할 수 있었다. 일반적인 영역카메라는 송재속도 15.7 m/min 이상에서는 모션블러에 의한 화상의 품질저하로 인하여 화상처리가 어려웠고 화상처리에 적합한 송재속도는 13.8 m/min였으며 추후 송재속도를 향상시키기 위해서는 전자셔터 속도가 빠른 카메라의 사용이 요구되었다. 녹색 컨베이어벨트상의 제재목 화상의 배경과의 분리를 위해서는 RGB필터의 red 채널을 이용하면 효과적이었다. 옹이검출을 위한 문턱값 판정법은 화상분석형인 문턱값 감소법이 우수하였으며 히스토그램분석형 중에서는 엔트로피법이 적합하였다.

깊이정보와 컬러정보를 이용한 고속 고정밀 얼굴검출 및 추적 방법 (A Fast and Accurate Face Detection and Tracking Method by using Depth Information and color information)

  • 김우열;서영호;김동욱
    • 한국정보통신학회논문지
    • /
    • 제16권9호
    • /
    • pp.1825-1838
    • /
    • 2012
  • 본 논문에서는 RGB영상과 깊이영상을 사용하여 얼굴검출 및 추적을 고속으로 수행할 수 있는 방법을 제안한다. 이 방법은 얼굴검출 과정과 얼굴추적 과정으로 구성되며, 얼굴검출 과정은 기본적으로 기존의 Adaboost 방법을 사용하나, 깊이정보와 피부색을 사용하여 탐색영역을 축소한다. 얼굴추적은 템플릿 매칭방법을 사용하며, 조기종료 기법을 사용하여 수행시간을 줄였다. 이 방법들을 구현하여 실험한 결과, 얼굴검출 방법은 기존의 방법에 비해 약 39%의 수행시간을 보였으며, 얼굴추적 방법은 프레임 당 2.48ms의 추적시간을 보였다. 또한 검출율에 있어서도 제안한 얼굴검출 방법은 기존방법과 비슷한 검출률을 보였지만, 오검출률에 있어서는 0.66%로 기존방법보다 상당히 향상된 성능을 보였다. 또한 얼굴추적 방법은 특별한 경우를 제외한 모든 경우에서 약 1%의 낮은 추적오차율을 보였다. 따라서 제안한 얼굴검출 및 추적방법은 각각 또는 결합하여 고속 동작과 높은 정확도를 필요로 하는 응용분야에 사용될 수 있을 것으로 기대된다.

Quantitative Feasibility Evaluation of 11C-Methionine Positron Emission Tomography Images in Gamma Knife Radiosurgery : Phantom-Based Study and Clinical Application

  • Lim, Sa-Hoe;Jung, Tae-Young;Jung, Shin;Kim, In-Young;Moon, Kyung-Sub;Kwon, Seong-Young;Jang, Woo-Youl
    • Journal of Korean Neurosurgical Society
    • /
    • 제62권4호
    • /
    • pp.476-486
    • /
    • 2019
  • Objective : The functional information of $^{11}C$-methionine positron emission tomography (MET-PET) images can be applied for Gamma knife radiosurgery (GKR) and its image quality may affect defining the tumor. This study conducted the phantom-based evaluation for geometric accuracy and functional characteristic of diagnostic MET-PET image co-registered with stereotactic image in Leksell $GammaPlan^{(R)}$ (LGP) and also investigated clinical application of these images in metastatic brain tumors. Methods : Two types of cylindrical acrylic phantoms fabricated in-house were used for this study : the phantom with an array-shaped axial rod insert and the phantom with different sized tube indicators. The phantoms were mounted on the stereotactic frame and scanned using computed tomography (CT), magnetic resonance imaging (MRI), and PET system. Three-dimensional coordinate values on co-registered MET-PET images were compared with those on stereotactic CT image in LGP. MET uptake values of different sized indicators inside phantom were evaluated. We also evaluated the CT and MRI co-registered stereotactic MET-PET images with MR-enhancing volume and PET-metabolic tumor volume (MTV) in 14 metastatic brain tumors. Results : Imaging distortion of MET-PET was maintained stable at less than approximately 3% on mean value. There was no statistical difference in the geometric accuracy according to co-registered reference stereotactic images. In functional characteristic study for MET-PET image, the indicator on the lateral side of the phantom exhibited higher uptake than that on the medial side. This effect decreased as the size of the object increased. In 14 metastatic tumors, the median matching percentage between MR-enhancing volume and PET-MTV was 36.8% on PET/MR fusion images and 39.9% on PET/CT fusion images. Conclusion : The geometric accuracy of the diagnostic MET-PET co-registered with stereotactic MR in LGP is acceptable on phantom-based study. However, the MET-PET images could the limitations in providing exact stereotactic information in clinical study.

IPA분석을 통한 울산의 체류형 관광 활성화 방안 연구 (A Study for Promotion of the Stay Type Tourism in Ulsan by IPA Analysis Techniques)

  • 유영준;이지훈;정윤조
    • 한국엔터테인먼트산업학회논문지
    • /
    • 제13권8호
    • /
    • pp.1-12
    • /
    • 2019
  • 본 연구는 울산의 체류형 관광을 활성화할 수 있는 방안을 탐색해보는 것이 그 목적이다. 이를 위해 IPA 분석 기법을 적용하여 전문가, 관광객 및 호텔 이용객들을 대상으로 중요도와 만족도를 조사하여 그룹 간 공통적인 사항을 대상으로 활성화 방안을 수립하였다. 대부분의 연구에서는 한 집단의 설문조사 결과를 분석하지만, 본 연구에서는 전문가, 관광객, 호텔 이용객의 3그룹 간의 결과를 비교·분석하여 활성화가 필요한 부분을 도출하였다. 각 집단별 결과를 종합한 결과 매력요인으로는 '문화시설'이 선정되었으며, 중점적으로 개선해야 할 기본요인으로는 '야간관광'이 선정되었다. 반면에 관광지, 깨끗한 환경 및 도시공원 등은 실행요인으로 선정되었는데, 깨끗한 환경과 도시공원은 울산 관광의 5색 테마 중 하나인 '생태관광'에 해당한다. 체류형 관광 활성화 방안에 대한 항목을 순위별로 종합한 결과 전문가, 관광객 및 호텔 이용객 3그룹 모두 정확하게 일치하는 요인이 발생하지 않았지만, 3순위까지 선정된 우선 항목 결과를 살펴볼 수 있었다. 두 그룹이 선택한 항목은 야간 볼거리 다양화와 관광지의 교통접근성, 한 그룹이 선택한 항목은 야간경관 개선, 야간 체험프로그램 운영, 야간 개장시간 연장 운영 및 야시장 활성화 등이었다.

PinDemonium 기반 Original Entry Point 탐지 방법 개선 (Improved Original Entry Point Detection Method Based on PinDemonium)

  • 김경민;박용수
    • 정보처리학회논문지:컴퓨터 및 통신 시스템
    • /
    • 제7권6호
    • /
    • pp.155-164
    • /
    • 2018
  • 많은 악성프로그램은 역공학을 막기 위해 다양한 상용 패커를 사용해 압축 혹은 암호화를 했기 때문에 악성코드 분석가는 압축해제 혹은 복 호화를 먼저 수행해야 한다. OEP(Original Entry Point)는 암호화되거나 압축되어 있는 실행파일을 다시 원본 바이너리 상태로 되돌린 후 실행된 첫 번째 명령어의 주소이다. 여러 언패커는 OEP가 나타나기 전까지 패킹된 파일을 실행하며 주소를 기록한다. 그리고 기록된 주소들 중에 OEP를 찾는다. 그러나 일부 언패커에서 제공하는 OEP 후보들은 비교적 큰 OEP 후보 집합을 제공하거나 후보들 중에 OEP가 없는 경우가 있다. 이에 악성코드 분석가들은 더 적은 OEP 후보 집합을 제공하는 도구가 필요한 실정이다. 본 논문에서는 PinDemonium이라 불리는 언패커에 두 가지 OEP 탐지방법을 추가하여 더 적은 OEP 후보 집합을 제공하는 도구를 만들었다. 첫 번째 방법은 패킹된 프로그램이 완전히 원본 바이너리상태로 되돌아 간 후에는 원프로그램 함수 호출과 동일하다는 것을 활용한 OEP 탐지방법이다. C/C++ 언어로 작성된 프로그램은 바이너리 코드로 언어를 변환하는 컴파일 과정을 거친다. 컴파일 과정을 거친 프로그램에는 특정 시스템 함수들이 추가된다. 이 시스템 함수들은 컴파일러 별로 다르다. 컴파일러 별로 사용되는 시스템 함수를 조사한 후, 패킹된 프로그램에서 호출되는 시스템 함수와 패턴매칭하여 언패킹 작업이 끝났는지 탐지하는 방법이다. 두 번째 방법은 패킹된 프로그램이 완전히 원본 바이너리 상태로 돌아간 후 시스템함수에서 사용되는 매개 변수가 원프로그램과 동일하다는 것을 활용한 OEP 탐지방법이다. 시스템함수에서 사용되는 매개변수의 값을 이용해 OEP를 찾는 방법이다. 본 연구는 16종의 상용 패커로 압축된 샘플 프로그램을 대상으로 OEP 탐지 실험을 했다. 본 연구에선 안티 디버깅 기법으로 프로그램을 실행하지 못하는 경우인 2종을 제외하고 PinDemonium 대비 평균 40% 이상 OEP후보를 줄일 수 있었다.

법령정보 검색을 위한 생활용어와 법률용어 간의 대응관계 탐색 방법론 (Term Mapping Methodology between Everyday Words and Legal Terms for Law Information Search System)

  • 김지현;이종서;이명진;김우주;홍준석
    • 지능정보연구
    • /
    • 제18권3호
    • /
    • pp.137-152
    • /
    • 2012
  • 인터넷 환경에서 월드 와이드 웹이 등장한 이후 웹을 통해 수많은 웹 페이지들이 생산됨에 따라 사용자가 원하는 정보를 검색하기 위한 다양한 형태의 검색 서비스가 여러 분야에서 개발되어 활용되고 있다. 특히 법령 검색은 사용자가 현재 자신이 처한 상황에 필요한 법령을 검색하여 법령에 대한 지식을 얻기 위한 창구로써 국민의 편의를 제공하기 위해 반드시 필요한 서비스 중 하나이다. 이에 법제처는 2009년부터 국민 누구나 편리하게 법령에 관련된 정보를 검색할 수 있도록 국가의 법령뿐만 아니라 행정규칙이나 판례 등 모든 법령정보를 검색할 수 있는 검색 서비스를 제공하고 있다. 하지만 현재까지의 검색엔진 기술은 기본적으로 사용자가 입력한 질의어를 문서에 포함하고 있는지의 여부에 따라 해당 문서를 검색 결과로 제시한다. 법령 검색 서비스 또한 해당 법령에 등장하는 키워드를 활용하여 사용자에게 검색 결과를 제공해주고 있다. 따라서 법제처의 이런 노력에도 불구하고 법령이 전문가의 시각에서 작성되었기 때문에 법에 익숙하지 않은 일반 사용자는 자신이 필요한 법령을 검색하기 어려운 한계점을 가지고 있다. 이는 일반적으로 법령에 사용되는 용어들과 일반 사용자가 실생활에 사용하는 단어가 서로 상이하기 때문에 단순히 키워드의 단순 매칭 형태의 검색엔진에서는 사용자들이 주로 사용하는 생활용어를 이용해서 원하는 법령을 검색할 수 없다. 본 연구에서는 법률용어에 관한 사전지식이 부족한 일반 사용자가 일상에서 주로 사용되는 생활용어를 이용하여 키워드 기반의 법령정보 검색 사이트에서 정확한 법령정보 검색이 가능하도록 생활용어와 법률용어 간의 대응관계를 탐색하고 이를 이용하여 법령을 검색할 수 있는 방법론을 제안하고자 한다. 우선 생활용어와 법률용어 간의 대응관계를 발견하기 위해 본 논문에서는 사용자들의 집단지성을 활용한다. 이를 위해 사용자들이 블로그의 분류 및 관리, 검색에 활용하기 위해 작성한 태그 정보를 이용하여 질의어인 생활용어와 관련된 태그들을 수집한다. 수집된 태그들은 K-means 군집분석 기법을 통해 태그들을 클러스터링하고, 생활용어와 가장 가까운 법률용어를 찾기 위한 평가 방법을 통해 생활용어에 대응될 수 있는 적절한 법률용어를 선택한다. 선택된 법률용어는 해당 생활용어와 명시적인 관계성이 부여되며, 이러한 생활용어와 법률용어와의 관계는 온톨로지 기반의 시소러스를 기술하기 위한 SKOS를 이용하여 표현된다. 이렇게 구축된 온톨로지는 사용자가 생활용어를 이용하여 검색을 수행할 경우 생활용어에 대응되는 적절한 법률용어를 찾아 법령 검색을 수행하고 그 결과를 사용자에게 제시한다. 본 논문에서 제시하고자 하는 방법론을 통해 법령 및 법률용어에 관련된 사전 지식이 없는 일반 사용자도 편리하고 효율적으로 법령을 검색할 수 있는 서비스를 제공할 것으로 기대한다.