• Title/Summary/Keyword: 자동정보 추출

Search Result 1,996, Processing Time 0.027 seconds

Automated Text Categorization using high quality Bigrams (효율적인 바이그램을 이용한 자동문서 범주화)

  • Choi, Joon-Young;Lee, Chan-Do
    • Annual Conference of KIPS
    • /
    • 2003.05a
    • /
    • pp.261-264
    • /
    • 2003
  • 본 연구는 바이그램을 이용하여 자동문서범주화 성능을 향상시키는 알고리즘의 개발을 목표로 한다. 기존의 문서 범주화 알고리즘의 장단점을 비교하여 개선된 바이그램 추출 알고리즘을 구현하고, 이 알고리즘을 실험한 결과 Reuters-21579 data set은 개별 단어를 사용하여 시험한 결과보다 단어+바이그램을 사용하였을 경우 BEP은 2.07%, F1은 1.40% 향상률을 보였고, Korea-web data set은 BEP의 8.12%, F1의 6.25% 향상을 보였다. 이와 같은 실험결과는 단어를 사용한 경우보다 단어+바이그램을 사용한 자동문서 범주화 시스템이 더 효율적이라는 것을 보여준다.

  • PDF

An Automatic recognition system for Wild edible greens classification (산나물 자동 인식 시스템)

  • Kim, Jin-seo;Kwon, Su-jeong;Kim, Hyun-jung;Won, Il-Young
    • Annual Conference of KIPS
    • /
    • 2013.11a
    • /
    • pp.1521-1524
    • /
    • 2013
  • 식물의 종류를 자동으로 인식하는 방법에 대한 연구는 그 필요성이 증가하고 있다. 본 연구는 한국의 산나물을 자동으로 인식하는 방법에 관한 것이다. 본 논문에서 제안하는 방법은 산나물의 잎을 대상으로 잎의 비율과 잎맥을 추출하여 히스토그램을 구하고, K-NN을 통해 학습하고 판단하는 시스템이다. 제안하는 시스템의 성능은 실험으로 증명하였으며, 어느 정도 의미 있는 결과를 얻을 수 있었다.

Automatic Recognition of Wire Bobbins using Machine Vision Techniques (머신 비젼 기술을 이용한 전선 보빈의 자동인식)

  • Tai-Hoon Cho
    • Journal of Institute of Control, Robotics and Systems
    • /
    • v.4 no.4
    • /
    • pp.494-498
    • /
    • 1998
  • 이 논문은 에나멜 전선의 제조공정의 자동화에 있어서 핵심역할을 하는 보빈의 자동인식을 위한 머신 비젼 시스템에 관한 것이다. 이 시스템의 역할은 컨베이어 라인의 팔레트 위에 놓인 보빈들의 영상을 CCD 카메라로 취득, 분석하여 보빈 형태, 색상, 제조공정번호 등의 다양한 정보를 추출하여, 전체 생산공정을 제어하는 주 컴퓨터로 보내는 일을 수행한다. 이 비젼 시스템은 개발된 후 에나멜 전선 생산공장에 설치되어 일정 시험기간을 거쳐 현재 성공적으로 운영되고 있다.

  • PDF

A Recognition of Word Spacing Errors Using By Syllable (음절 bigram 특성을 이용한 띄어쓰기 오류의 인식)

  • 강승식
    • Proceedings of the Korean Society for Cognitive Science Conference
    • /
    • 2000.06a
    • /
    • pp.85-88
    • /
    • 2000
  • 대용량 말뭉치에서 이웃 음절간 공기빈도 정보를 추출하여 한글의 bigram 음절 특성을 조사하였다. Bigram 음절 특성은 띄어쓰기가 무시된 문서에 대한 자동 띄어쓰기, 어떤 어절이 띄어쓰기 오류어인지 판단, 맞춤법 검사기에서 절차 오류어의 교정 등 다양한 응용분야에서 유용하게 사용될 것으로 예상되고 있다. 본 논문에서는 한글의 bigram 음절 특성을 자동 띄어쓰기 및 입력어절이 띄어쓰기 오류어인지를 판단하는데 적용하는 실험을 하였다. 실험 결과에 의하면 bigram 음절 특성이 매우 유용하게 사용될 수 있음을 확인하였다.

  • PDF

Implementation of code generation algorithm for Statechart based on XMI (Statechart에서의 XMI기반 소스코드생성 알고리듬 구현 연구)

  • Kim, Jin-Man;Lim, Joa-Sang
    • 한국IT서비스학회:학술대회논문집
    • /
    • 2008.11a
    • /
    • pp.277-280
    • /
    • 2008
  • MDA는 UML과 XMI 표준을 사용해 플랫폼에 무관한 설계모델에서 플랫폼에 의존적인 실행 가능한 모델을 생산하는 것이다. 본 연구에서는 UML의 Statechart를 대상으로 XMI 정보를 추출하고 이로부터 Java 소스코드를 자동 생성하는 알고리듬을 구현하였다. 에어컨 시스템을 사례로 비즈니스 로직이 포함된 소스코드를 자동 생성하는 알고리듬을 구현하였으며 XMI의 사용으로 두 개의 다른 CASE 도구 각각에서 설계된 모델이 동일한 소스코드를 생성함을 확인 했다.

  • PDF

Passport Recognition using PCA-based Face Verification and SOM Algorithm (PCA 기반 얼굴 인증과 SOM 알고리즘을 이용한 여권 인식)

  • Lee Sang-Soo;Jang Do-Won;Kim Kwang-Baek
    • Proceedings of the Korean Institute of Information and Commucation Sciences Conference
    • /
    • 2006.05a
    • /
    • pp.285-290
    • /
    • 2006
  • 본 논문에서는 출입국자 관리의 효율성과 체계적인 출입국 관리를 위하여 여권 코드를 자동으로 인식하고 위조 여권을 판별할 수 있는 여권 인식 및 얼굴 인증 방법을 제안한다. 본 논문의 구성은 여권 인식과 얼굴 인증 부분으로 구성되며, 여권 인식 부분에서는 소벨 연산자, 수평 최소값 필터 등을 적용한 후, 8 방향 윤곽선 추적 알고리즘을 적용하여 코드의 문자열 영역을 추출하고 기울기를 보정한다. 추출된 문자열은 반복 이진화 방법을 적용하여 코드의 문자열 영역을 이진화 한다. 이진화된 문자열 영역에 대해 8 방향 윤곽선 추적 알고리즘을 적용하여 개별 코드를 추출한 후에 SOM(Self-Organizing Maps) 알고리즘을 적용하여 여권 코드를 인식한다. 얼굴 인증 부분에서는 여권 사진 영역의 특징을 이용하여 얼굴 후보 영역을 추출한 후, RGB와 YCbCr 색공간에서 피부색 정보를 이용하여 얼굴 영역을 추출한다. 추출된 얼굴 영역은 PCA(Principal Component Analysis) 알고리즘을 적용하여 특징 벡터를 구하고 여권 코드가 인식된 결과를 바탕으로 여권 소지자의 데이터 베이스에 있는 얼굴 영상의 특징벡터와의 거리 값을 계산하여 사진 위조 여부를 판별한다. 제안된 여권 인식 및 얼굴 인증 방법의 성능 평가를 위하여 원본 여권의 얼굴 부분을 위조한 여권과 기울어진 여권 영상을 대상으로 실험한 결과, 제안된 방법이 여권의 코드 인식 및 얼굴 인증에 있어서 우수한 성능이 있음을 확인하였다.

  • PDF

Automatic Registration Between KOMPSAT-2 and TerraSAR-X Images (KOMPSAT-2 영상과 TerraSAR-X 영상 간 자동기하보정)

  • Han, You-Kyung;Byun, Young-Gi;Chae, Tae-Byeong;Kim, Yong-Il
    • Journal of the Korean Society of Surveying, Geodesy, Photogrammetry and Cartography
    • /
    • v.29 no.6
    • /
    • pp.667-675
    • /
    • 2011
  • In this paper, we propose an automatic image-to-image registration between high resolution multi-sensor images. To do this, TerraSAR-X image was shifted according to the initial translation differences of the x and y directions between images estimated using Mutual Information method. After that, the Canny edge operator was applied to both images to extract linear features. These features were used to design a cost function that finds matching points based on the similarities of their locations and gradient orientations. For extracting large number of evenly distributed matching points, only one point within each regular grid constructed throughout the image was extracted to the final matching point pair. The model, which combined the piecewise linear function with the global affine transformation, was applied to increase the accuracy of the geometric correction, and the proposed method showed RMSE lower than 5m in all study sites.

Developing a Dynamic Selection Algorithm in Multiple Cameras (다중 카메라의 동적인 선택 알고리즘 개발)

  • Jang, Seok-Woo;Choi, Hyun-Jun;Lee, Suk-Yun
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2013.01a
    • /
    • pp.223-225
    • /
    • 2013
  • 본 논문에서는 카메라가 여러 개 존재하는 다중의 카메라 환경에서 주변의 환경에 최적으로 적합한 카메라를 동적으로 선택하는 알고리즘을 제안한다. 제안된 알고리즘에서는 초기의 입력영상을 받아들인 후, 이 영상으로부터 주위의 환경을 가장 잘 표현할 수 있는 특징인 밝기와 텍스처 특징을 추출한다. 그리고 이전 단계에서 추출된 밝기와 텍스처 특징값들을 가장 잘 반영할 수 있는 카메라를 선택하는 규칙을 생성함으로써 주위 환경에 맞는 카메라를 자동으로 선택해 준다. 본 논문의 실험결과에서는 제안된 방법이 여러 가지 환경에서 잘 동작하며, 결과적으로 주위 환경에 적합한 카메라의 선택을 통해 보다 정확한 3차원의 정보를 추출함을 보여준다.

  • PDF

Browsing Technique of Contents for Digital Broadcasting Based on Linux (리눅스 기반 디지털 방송 컨텐츠의 브라우징 기술)

  • 김창원;남재열
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2001.11b
    • /
    • pp.221-225
    • /
    • 2001
  • 논문은 리눅스를 기반으로 하여 디지털 방송 컨텐츠를 브라우징하는 기술과 서비스에 필요한 기술들을 제시하고 이를 활용한 서비스 모델을 제시한다. 사용자에게 방송 프로그램의 정보의 습득과 검색을 위해 EPG(Electronic Program Guide)를 이용하여 방송 컨텐츠를 장르와 채널 카테고리로 자동 분류한다. 각 프로그램에서 키 프레임을 추출하여 사용자에게 빠르게 탐색하게 하고 줄거리 파악을 쉽게 하였다. 비순차적인 재생 요구를 수용하기 위해 랜덤 엑세스와 컨텐츠와 추출된 키 프레임을 동기화 하여 하이라이트 모드로 재생하고 연속 재생을 할 수 있게 한다. 사용자와의 상호 작용에서 얻어진 채널과 장르 선호도 정보를 이용하여 컨텐츠를 개인의 성향에 맞게 장르와 채널별로 분류하여 개인화된 프로그램 가이드를 제공한다. 컨텐츠의 획득에서 누적된 취향에 따른 분류, 브라우징을 위한 키프레임 추출과 샷 분류를 통한 가공, Payper-View를 위한 사용정보에 이르기까지 리눅스 기반의 로컬 스토리지를 활용한 디지털 방송 브라우징 모델을 제시한다.

  • PDF

Automatic Dictionary Construction of Indonesian Field-Associated Terms by Using Korean Associated Knowledge (한국어의 분야 연상 지식의 추출 방법에 관한 연구)

  • Lee, Sang-Gon
    • 한국어정보학회:학술대회논문집
    • /
    • 2016.10a
    • /
    • pp.205-210
    • /
    • 2016
  • 인간은 문서전체를 읽지 않고 대표적인 단어를 보는 것만으로 정치나 스포츠 등의 분야를 정확히 인지할 수 있다. 문서 전체는 물론 부분 텍스트(단락)에 출현하는 소수의 단어 정보에서 문서의 분야를 정확히 결정하기 위한 분야연상어의 구축은 중요한 연구과제이다. 미리 분야체계를 정의하고, 각 분야에 해당하는 문서를 인터넷이나 서적을 통해 수집한다. 본 논문은 수집 문서의 분야를 정확히 지시하는 분야연상어를 수집하는 방법을 제안한다. 문서의 분야결정 시점을 고려하여 분야연상어의 수준을 정하였다. 인도네시아어의 분야연상어 사전을 자동으로 구축하기 위해 먼저 한국어로 구축한 분야 연상 지식을 추출하는 방법을 제안한다.

  • PDF