• Title/Summary/Keyword: 레이블 추출

Search Result 120, Processing Time 0.026 seconds

A Study on the Extraction into the Logical Structure of a Specific Document using Knowledge (지식을 이용한 특정 문서의 논리 구조 추출에 관한 연구)

  • 손영우;남궁재찬
    • The Journal of Information Technology and Database
    • /
    • v.3 no.1
    • /
    • pp.85-95
    • /
    • 1996
  • 본 논문은 특정문서에서 문서가 갖고 있는 일반적인 지식을 이용하여 논리적 항목을 추출하는 방법에 관한 연구이다. 먼저 입력된 문서의 영역 분할, 분리자 추출, 그리고 문자와 비문자를 구별하였다. 논리구조 추출단계에서는 구별된 요소의 상대적 크기, 위치 및 전후 블록들의 연관성에 관한 지식을 이용하여 각 블록들을 레이블링 하였고, 레이블된 항목들의 위치정보값을 이용하여 각 항목들을 자료화하였다. 마지막으로, 오분류된 항목에 대해서는 배치기술자를 이용한 검증을 통해 정정하였다. 본 논문에서 구현한 방법으로 실험한 결과 96.5%의 논리항목 추출율을 획득함으로써 그 유효성을 입증하였다.

  • PDF

Moving Object Segmentation and Tracking Using Markov Random Fields (Markov Random Fields를 이용한 움직이는 객체 추출 및 추적)

  • 장세일;황선규;김회율
    • Proceedings of the IEEK Conference
    • /
    • 2003.07e
    • /
    • pp.2100-2103
    • /
    • 2003
  • 기존의 객체 추출 및 추적 기법은 외형 변화가 없는 객체를 대상으로 하거나 배경이 고정된 영상만을 고려하였다 본 논문에서는 영역의 색상과 움직임 정보, 그리고 인접한 영역의 상관 관계를 고려한 Markov Random Field (MRF) 모델을 제안한다. MRF 모델은 영상의 시간적 공간적 상관성을 기반으로 최적의 레이블 셋을 계산함으로써 보다 정확하게 객체를 추출 및 추적할 수 있다. 또한, 블록 기반 움직임 추출 알고리즘인 Diamond Search (DS)를 분할된 영역에 적용하여 빠르게 영역의 움직임과 전역 움직임을 추정하였다. 실험 결과 제안한 방법이 객체의 외형 변화와 카메라 움직임이 있는 동영상에서 빠른 속도로 정확하게 객체를 추출 및 추적하는 것을 확인하였다.

  • PDF

Car Plate Detection by HSI Color Information and Labelling (HSI 컬러 정보와 레이블링을 통한 차량 번호판 추출)

  • 이병모;차의영
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2001.10b
    • /
    • pp.442-444
    • /
    • 2001
  • 본 논문은 차량의 번호판 인식 시스템을 구축하는 첫 단계인 번호판 추출에 관한 것으로 차량과 번호판의 색상이 같은 경우에 대해서도 실험을 하였다. 본 논문에서는 RGB 컬러 정보 대신에 HSI 컬러 정보를 사용하여 특징점을 추출하였고, morphology를 이용하여 크기 보정을 반복 실행하며, 실패할 경우 merge 등을 통하여 최종적으로 크기를 보정한다. 그리고, 정확한 번호판 추출을 위해 한번 더 hue값을 이용한 보정을 함으로써 원하는 번호판 영역을 정확히 추출한다.

  • PDF

Probabilistic based Web Contents Mining (확률 기반 웹 콘텐츠 마이닝)

  • Yun, Bo-Hyun;Cho, Kwang-Moon
    • Proceedings of the Korea Contents Association Conference
    • /
    • 2006.11a
    • /
    • pp.16-20
    • /
    • 2006
  • In Web contents mining, it is important to recognize the unlabeled entities and to integrate the sub-linked information and the extracted results. This paper presents the probabilistic based method which can recognize the unlabeled entity by using the Baysien model. Moreover, we propose the method that can use the information of the sub-linked web pages and integrate the extracted results. In the experimental results, we can see that the probabilistic based entity and information integration show the most significant precision.

  • PDF

Character Region Detection using Edge Features of Character and Character String in Signboard Image (문자 및 문자열의 에지 특징을 이용한 표시판 이미지에서 문자영역 검출)

  • Park, Jong-Cheon;Hwang, Dong-Guk;Jun, Byoung-Min
    • Proceedings of the KAIS Fall Conference
    • /
    • 2008.05a
    • /
    • pp.212-214
    • /
    • 2008
  • 자연이미지에 포함된 안내 표시판은 많은 유용한 정보를 포함하고 있으므로 이를 효과적으로 검출하여 문자인식시스템과 연동될 수 있다면 다양한 응용분야에서 활용될 수 있다. 그러므로 본 논문에서는 문자 및 문자열의 에지 특징을 이용하여 표시판이미지로부터 문자영역을 검출하는 방법을 제안한다. 캐니-에지 검출기로 에지를 검출하여 에지 이미지를 생성한다. 에지 이미지를 레이블링을 하여 연결요소 성분을 추출한다. 레이블 영역에서 문자와 문자열 에지 특징을 분석하여 후보 문자영역으로 추출한다. 후보 문자영역에 대한 검증을 수행함으로서 최종적인 문자영역을 검출한다. 제안한 방법은 다양한 종류의 자연이미지를 대상으로 실험하였고, 자연이미지에서 기울어진 문자영역과 다양한 크기의 문자를 갖는 문자영역을 효과적으로 검출하였다.

  • PDF

Multi-Label Classification Approach to Effective Aspect-Mining (효과적인 애스팩트 마이닝을 위한 다중 레이블 분류접근법)

  • Jong Yoon Won;Kun Chang Lee
    • Information Systems Review
    • /
    • v.22 no.3
    • /
    • pp.81-97
    • /
    • 2020
  • Recent trends in sentiment analysis have been focused on applying single label classification approaches. However, when considering the fact that a review comment by one person is usually composed of several topics or aspects, it would be better to classify sentiments for those aspects respectively. This paper has two purposes. First, based on the fact that there are various aspects in one sentence, aspect mining is performed to classify the emotions by each aspect. Second, we apply the multiple label classification method to analyze two or more dependent variables (output values) at once. To prove our proposed approach's validity, online review comments about musical performances were garnered from domestic online platform, and the multi-label classification approach was applied to the dataset. Results were promising, and potentials of our proposed approach were discussed.

A Study on Fast and Robust Techniques for Detection of Car Plate using HSV and Weighted Morphology (HSV와 가변 모폴로지를 이용한 빠르고 강인한 차량 번호판 검출에 관한 연구)

  • 이병모;박은경;차의영
    • Proceedings of the Korea Multimedia Society Conference
    • /
    • 2002.05c
    • /
    • pp.365-370
    • /
    • 2002
  • 본 논문은 차량의 번호판 인식 시스템을 구축할 목적으로 번호판 추출을 컬러 정보를 이용하여 구현하였다. 본 실험은 특히 번호판 추출에 많은 장애 요인, 즉, 흐린날, 늦은 오후에 촬영된 차량, 번호판과 같은 색상을 가지는 차량, 그늘진 곳에 주차된 차량 그리고, 운행중인 차량에 대해서도 실험 대상으로 하였다. 그리고, 본 논문에서는 빠른 번호판 검출을 위하여 부분 영역에 대한 특정 픽셀을 추출하였고, 변형 모폴로지와 레이블링의 반복 적용을 통하여 번호판을 검출하며, 후처리를 통하여 보다 정확한 영역을 재보정 한다.

  • PDF

Extraction of Facial Feature Component using Section Segmentation of Block-units (블록단위 영역분할을 이용한 얼굴 특징 요소 추출)

  • 김승업;이우범;김욱현
    • Proceedings of the Korea Institute of Convergence Signal Processing
    • /
    • 2000.12a
    • /
    • pp.97-100
    • /
    • 2000
  • 본 논문에서는 얼굴의 특징 추출 알고리즘을 제안한다. 입력 영상을 이진 영상으로 처리한 후, 얼굴 요소 후보 블록의 면적, 둘레, 원형도, 종횡비를 이용하여 불변하는 눈, 코, 입의 특징 요소를 추출한다. 사람의 얼굴에 대한 특징 요소를 추출하기 위하여 우선 이진 영상을 생성한다. 하나 하나의 고립된 영역으로 분리하기 위하여 화소 레이블링을 한 후 만들어진 얼굴 요소 후보 블록 단위로 면적을 구하고, 윤곽선 추적 방법에 의하여 둘레를 구한 다음 면적, 둘레, 원형도 및 종횡비의 유사도를 구한다 블록의 종합 유사도, 대칭적 거리, 위치의 유사도를 활용하여 눈, 코, 입을 추출한다. 추출된 각 특징 요소간의 거리와 각도를 이용하여 12개의 특징 인수를 구하는 제안 알고리즘을 수행함으로써 얼굴의 특징 인수들을 추출한다. 각 특징점 사이의 거리와 각 거리간의 기울기를 이용하여 100명으로부터 획득한 297개의 원 영상을 대상으로 12개의 특징 파라미터를 추출한 결과 92.93%의 추출 성공률을 보였다. 이러한 결과는 외부 환경의 영향을 덜 받는 눈, 코, 입의 위치 관계의 블록을 근거로 특징 요소를 추출할 수 있도록 제안 알고리즘을 구성하였던 것으로 판단된다.

  • PDF

Menu Structure Design using Asymmetric Transition in Spreading Activation (활성화 확산의 비대칭 전이를 이용한 메뉴 구조 디자인)

  • Oh, Se-Eung;Park, Jong-Soon;Myung, Ro-Hae;Lee, Suk-Jae
    • 한국HCI학회:학술대회논문집
    • /
    • 2008.02b
    • /
    • pp.386-391
    • /
    • 2008
  • 제품의 기능이 다양화 되고 신제품의 출시기간이 짧아지면서 소비자들은 새로운 제품의 조작 방법을 익히는데 어려움을 겪게 된다. 사용자 중심의 잘 설계된 메뉴 구조는 이러한 사용성 문제를 해결 해줄 수 있을 것이다. 따라서 본 연구에서는 사용자 중심의 좋은 정보 구조 설계를 위해 활성화 확산의 비대칭 전이를 이용한 메뉴구조 및 레이블 평가 방법을 연구하였다. 활성화 확산 실험은 반응 시간이 짧을수록 연상 강도가 강하고, 단어 쌍간의 관계가 밀접함을 보여주므로, 잘 디자인된 메뉴구조는 상-하위 메뉴 쌍의 연상 정도가 활성화 진행 방향의 영향을 받지 않는다는 가설을 세울 수 있다. 따라서 본 연구는 휴대폰(모델명;SPH-W2900)의 메뉴를 추출하여 1차 활성화 확산(SAT)실험을 수행한 뒤, 각 메뉴 쌍에 대하여 정확도와 진행 방향에 따른 반응시간의 차이(비대칭 전이)를 파악함으로 레이블의 문제점을 도출하고 메뉴 구조 및 어휘를 개선하였다. 2차 활성화 확산 실험은 개선된 메뉴 쌍에 대해 비대칭 전이 현상이 감소하였는지를 확인하기 위해 실시되었으며 활성화 진행 방향에 대한 반응시간의 차이(비대칭 전이)는 월등히 감소함을 알 수 있었다. 따라서 본 연구에서 제시하는 활성화 확산의 비대칭전이는 사용자 중심의 메뉴 레이블을 정의 하는데 도움이 될 것이다.

  • PDF

Comparing Features, Models and Training for Span-based Entity Extraction (스팬 기반 개체 추출을 위한 자질, 모델, 학습 방법 비교)

  • Seungwoo Lee
    • Annual Conference on Human and Language Technology
    • /
    • 2023.10a
    • /
    • pp.388-392
    • /
    • 2023
  • 개체 추출은 정보추출의 기초를 구성하는 태스크로, 관계 추출, 이벤트 추출 등 다양한 정보추출 태스크의 기반으로 중요하다. 최근에는 다중 레이블 개체와 중첩 개체를 다루기 위해 스팬기반의 개체추출이 주류로 연구되고 있다. 본 논문에서는 스팬을 표현하는 다양한 매핑과 자질들을 살펴보고 개체추출의 성능에 어떤 영향을 주는지를 분석하여 최적의 매핑 및 자질 조합을 제시하였다. 또한, 모델 구조에 있어서, 사전 학습 언어모델(PLM) 위에 BiLSTM 블록의 추가 여부에 따른 성능 변화를 분석하고, 모델의 학습에 있어서, 미세조정(finetuing) 이전에 예열학습(warmup training)을 사용하는 것이 효과적인지를 실험을 통해 비교 분석하여 제시하였다.

  • PDF