• 제목/요약/키워드: 지도 레이블링

검색결과 129건 처리시간 0.021초

추론 및 비교사학습 기법 기반 레이블링을 적용한 탐지 모델 (A Detection Model using Labeling based on Inference and Unsupervised Learning Method)

  • 홍성삼;김동욱;김병익;한명묵
    • 인터넷정보학회논문지
    • /
    • 제18권1호
    • /
    • pp.65-75
    • /
    • 2017
  • 탐지 모델은 인공지능 기법들이나 데이터 마이닝 기법, 또는 지능형 알고리즘들을 이용하여 어떠한 목적에 맞는 결과를 찾고자 하는 모델들이다. 사이버 보안에서는 주로 침입탐지, 악성코드 탐지, 침해사고 탐지, 공격 탐지로 활용되고 있다. 보안데이터와 같은 실제 환경에 수집되는 데이터들을 레이블이 되지 않은 데이터들이 많다. 클래스 레이블이 정해지지 않아 유형을 알 수 없는 데이터가 많아 정확한 탐지 및 분석을 하기 위해서는 레이블 결정과정이 필요하다. 본 논문에서 제안하는 방법은 레이블 결정을 위해 D-S 추론 알고리즘과 비교사 방법인 k-means 알고리즘을 적용하여 각 데이터의 레이블을 융합하여 결정할 수 있는 KDFL(K-means and D-S Fusion based Labeling)제안하였으며 이를 적용한 탐지 모델 구조를 제안하였다. 제안하는 방법은 실험을 통해 기존의 방법에 비해 탐지율, 정확도, F1-measure 성능 지표에서 우수한 성능을 나타냈다. 또한 오류율도 크게 개선된 결과를 나타내어 제안하는 방법의 성능을 검증할 수 있었다.

페로몬 트랩 영상에서 해충 검출을 위한 객체 분할 (Object Segmentation for Detection of Moths in the Pheromone Trap Images)

  • 김태우;조태경
    • 한국산학기술학회논문지
    • /
    • 제18권12호
    • /
    • pp.157-163
    • /
    • 2017
  • 객체 분할 방식은 객체를 먼저 분할한 후, 검출된 객체에 대해 해충 검출 알고리즘을 적용하므로 해충 개체를 검출하는 데 필요한 처리 비용이 줄어드는 장점이 있다. 본 논문에서는 페로몬 트랩 영상에서 해충 검출을 위한 객체 분할 방법을 제안한다. 제안한 방법은 전처리, 문턱치 처리, 형태학적 필터링, 레이블링 처리로 구성된다. 이들 과정 중 문턱치 처리는 객체 분할의 성능을 좌우하는 매우 중요한 처리 과정이다. 제안한 방법은 문턱치 처리 과정에서 해충 영상의 국소적 특성을 반영하므로 매우 정교한 문턱치 처리를 할 수 있다. 과수원에 설치된 페로몬 트랩에서 수집된 복숭아심식나방 영상에 대해 Otsu의 방법의 전역적 방식과 국소적 방식, 그리고 제안한 방법으로 처리한 결과, 제안한 방법이 조명과 배경의 특성을 잘 반영함을 알 수 있었다. 페로몬 트랩에 수집된 복숭아심식나방 영상에 대해 객체 분할과 개체 분류를 수행하였다. 개체 분류는 SVM 분류기로 학습하여 사용하였다. 실험에서 제안한 방법으로 10개의 해충 영상에 대해 복숭아심식나방 검출 결과 95%의 평균 검출율을 보임으로써 과수원의 복숭아심식나방의 개체 모니터링 방법으로서 효과적임을 보였다.

컴퓨터비젼을 이용한 백라이트 표면결함 검사시스템 개발에 관한 연구 (A Study on the Development of Backlight Surface Defect Inspection System using Computer Vision)

  • 조영창;최병진;윤정오
    • 한국산업정보학회논문지
    • /
    • 제12권3호
    • /
    • pp.116-123
    • /
    • 2007
  • 평판 디스플레이 부품시장 및 관련 개발장비 시장의 확대에 따른 백라이트 생산업체들의 수가 크게 증가했음에도 불구하고 LCD부품의 색재현에 좋지 못한 영향을 끼치는 백라이트 표면의 이물이나 백점, 스크래치와 같은 결함검사는 여전히 작업자의 육안에 의존하고 있는 실정이다. 그러나 육안검사에서는 작업자의 신체상태나 작업능력에 따라 검사정밀도와 검사속도 등이 달라질 수 있기 때문에 검사품질의 일관성을 유지시키기 어려울 뿐만 아니라 전체 공정의 효율도 저하시킨다. 본 연구에서는 백라이트 표시면치육안 결함검사를 자동화할 수 있는 백라이트 표면결함 검사시스템 개발에 관해 연구하였으며, 이를 위해 컴퓨터비젼시스템을 구성하고 검사공정을 위한 운용프로그램과 검사작업에 필요한 작업자 인터페이스 그리고 결함정보 추출을 위한 영상처리모듈을 구현하였다 또한, 이진화된 결함화소들 간의 연결구조로부터 고립된 결함영역을 추출하기 위해 레이블 테이블과 결함 인덱스를 사용한 레이블링 알고리즘을 고안하였다. 본 검사시스템의 검사성능을 평가하기 위한 실험결과, 시각적으로 식별가능 한 모든 결함영역이 검사시스템에 의해 검출됨에 따라 본 연구의 검사시스템이 작업자의 육안검사를 대체하기에 만족할만한 성능을 보임을 착인 할 수 있었다.

  • PDF

흉부 CT 영상의 밝기값 정보를 사용한 폐구조물 자동 분할 (Automatic Segmentation of Pulmonary Structures using Gray-level Information of Chest CT Images)

  • 임예니;홍헬렌
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제33권11호
    • /
    • pp.942-952
    • /
    • 2006
  • 본 논문에서는 흉부 CT 영상의 밝기값 정보를 사용하여 폐 구조물을 자동 분할하기 위한 방법을 제안한다. 본 제안방법은 다음과 같은 다섯 단계로 구성된다. 첫 번째, 영상의 밝기값 차이를 이용하여 폐 구조물을 분할하기 위해 최적 임계값 기법을 사용하여 임계값을 계산한다. 두 번째, 흉부 CT 영상에 2차원 영역성장법의 역 연산을 사용하여 배경으로부터 흉부를, 흉부로부터 기관지 및 폐를 단계적으로 분할한다. 이 때, 밝기값이 비슷한 다른 영역들을 3차원 연결화소군 레이블링을 통해 제거한다. 세 번째, 흉부 CT 영상에 3차원 분기 기반 영역성장법을 적용하여 기관과 좌우 기관지를 분할한다. 네 번째, 기관지 및 폐에서 기관지를 영상 감산함으로써 정확한 폐 영역을 얻는다. 마지막으로, 히스토그램 분석을 통해 임계값을 계산하고 기관지 및 폐에 밝기값 기반 임계값 기법을 적용하여 폐혈관을 분할한다. 제안방법의 정확성을 검증하기 위해 폐, 기관지, 폐혈관의 분할 결과에 대해 육안평가를 수행한다. 제안한 3차원 분기 기반 영역성장법을 통한 기관지 분할 결과를 평가하기 위해 기존 영역성장법으로 분할한 결과와 비교한다. 실험 결과는 제안 분할 방법이 폐, 기관지, 폐혈관을 자동으로 정확하게 추출함을 보여준다.

해리스 코너 검출기를 이용한 비디오 자막 영역 추출 (Text Region Extraction from Videos using the Harris Corner Detector)

  • 김원준;김창익
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제34권7호
    • /
    • pp.646-654
    • /
    • 2007
  • 최근 많은 TV 영상에서 시청자의 시각적 편의와 이해를 고려하여 자막을 삽입하는 경우가 늘어나고 있다. 본 논문에서는 자막을 비디오 내 하단부에 위치하는 인위적으로 추가된 글자 영역으로 정의한다. 이러한 자막 영역의 추출은 비디오 정보 검색(video information retrieval)이나 비디오 색인(video indexing)과 같은 응용에서 글자 추출을 위한 첫 단계로 널리 쓰인다. 기존의 자막 영역 추출은 자막의 색, 자막과 배경의 자기 대비, 에지(edge), 글자 필터 등을 이용한 방법을 사용하였다. 그러나 비디오 영상내 자막이 갖는 낮은 해상도와 복잡한 배경으로 인해 자막 추출에 어려움이 있다. 이에 본 논문은 코너검출기(corner detector)를 이용한 효율적인 비디오 자막 영역 추출 방법을 제안하고자 한다. 제안하는 알고리즘은 해리스 코너 검출기를 이용한 코너 맵 생성, 코너 밀도를 이용한 자막 영역 후보군 추출, 레이블링(labeling)을 이용한 최종 자막 영역 결정, 노이즈(noise) 제거 및 영역 채우기의 네 단계로 구성된다. 제안하는 알고리즘은 색 정보를 이용하지 않기 때문에 여러 가지 색으로 표현되는 자막 영역 추출에 적용가능하며 글자 모양이 아닌 글자의 코너를 이용하기 때문에 언어의 종류에 관계없이 사용 될 수 있다. 또한 프레임간 자막 영역 업데이트를 통해 자막 영역 추출의 효율을 높였다. 다양한 영상에 대한 실험을 통해 제안하는 알고리즘이 효율적인 비디오 자막 영역 추출 방법임을 보이고자 한다.

불꽃 감지를 위한 임베디드 시스템에 적합한 딥러닝 구조 (Deep Learning Structure Suitable for Embedded System for Flame Detection)

  • 라승탁;이승호
    • 전기전자학회논문지
    • /
    • 제23권1호
    • /
    • pp.112-119
    • /
    • 2019
  • 본 논문에서는 불꽃 감지를 위한 임베디드 시스템에 적합한 딥러닝 구조를 제안한다. 제안하는 딥러닝 구조의 불꽃 감지 과정은 불꽃 색깔 모델을 사용한 불꽃 영역 검출, 불꽃 색깔 특화 딥러닝 구조를 사용한 불꽃 영상 분류, 검출된 불꽃 영역의 $N{\times}N$ 셀 분리, 불꽃 모양 특화 딥러닝 구조를 사용한 불꽃 영상 분류 등의 4가지 과정으로 구성된다. 첫 번째로 입력 영상에서 불꽃의 색만을 추출한 다음 레이블링하여 불꽃 영역을 검출한다. 두 번째로 검출된 불꽃 영역을 불꽃 색깔에 특화 학습된 딥러닝 구조의 입력으로 넣고, 출력단의 불꽃 클래스 확률이 75% 이상에서만 불꽃 영상으로 분류한다. 세 번째로 앞 단에서 75% 미만 불꽃 영상으로 분류된 영상들의 검출된 불꽃 영역을 $N{\times}N$ 단위로 분할한다. 네 번째로 $N{\times}N$ 단위로 분할된 작은 셀들을 불꽃의 모양에 특화 학습된 딥러닝 구조의 입력으로 넣고, 각 셀의 불꽃 여부를 판단하여 50% 이상의 셀들이 불꽃 영상으로 분류될 경우에 불꽃 영상으로 분류한다. 제안된 딥러닝 구조의 성능을 평가하기 위하여 ImageNet의 불꽃 데이터베이스를 사용하여 실험하였다. 실험 결과, 제안하는 딥러닝 구조는 기존의 딥러닝 구조보다 평균 29.86% 낮은 리소스 점유율과 8초 빠른 불꽃 감지 시간을 나타내었다. 불꽃 검출률은 기존의 딥러닝 구조와 비교하여 평균 0.95% 낮은 결과를 나타내었으나, 이는 임베디드 시스템에 적용하기 위해 딥러닝 구조를 가볍게 구성한데서 나온 결과이다. 따라서 본 논문에서 제안하는 불꽃 감지를 위한 딥러닝 구조는 임베디드 시스템 적용에 적합함이 입증되었다.

열화상 카메라를 활용한 딥러닝 기반의 1·3종 차량 분류 (Class 1·3 Vehicle Classification Using Deep Learning and Thermal Image)

  • 정유석;정도영
    • 한국ITS학회 논문지
    • /
    • 제19권6호
    • /
    • pp.96-106
    • /
    • 2020
  • 본 연구에서는 루프 센서를 통한 교통량 수집방식의 오류를 해결하기 위해 1종(승용차)과 3종(일반 트럭)의 구분이 어려운 부분 및 영상 이미지의 단점을 보완하기 위해 도로변에 열화상 카메라를 설치하여 영상 이미지를 수집하였다. 수집된 영상 이미지를 레이블링 단계를 거쳐 1종(승용차)과 3종(일반 트럭)의 학습데이터를 구성하였다. 정지영상을 대상으로 labeling을 진행하였으며, 총 17,536대의 차량 이미지(640x480 pixel)에 대해 시행하였다. 열화상 영상 기반의 차종 분류를 달성하기 위해 CNN(Convolutional Neural Network)을 이용하였으며, 제한적인 데이터량과 품질에도 불구하고 97.7%의 분류정확도를 나타내었다. 이는 AI 영상인식 기반의 도로 교통량 데이터 수집 가능성을 보여주는 것이라 판단되며, 향후 더욱더 많은 학습데이터를 축적한다면 12종 차종 분류가 가능할 것이다. 또한, AI 기반 영상인식으로 도로 교통량의 12종 차종뿐만 아니라 다양한(친환경 차량, 도로 법규 위반차량, 이륜자동차 등) 차종 분류를 할 수 있을 것이며, 이는 국가정책, 연구, 산업 등의 통계 데이터로 활용도가 높을 것으로 판단된다.

EPC 프로젝트의 위험 관리를 위한 ITB 문서 조항 분류 모델 연구: 딥러닝 기반 PLM 앙상블 기법 활용 (Research on ITB Contract Terms Classification Model for Risk Management in EPC Projects: Deep Learning-Based PLM Ensemble Techniques)

  • 이현상;이원석;조보근;이희준;오상진;유상우;남마루;이현식
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제12권11호
    • /
    • pp.471-480
    • /
    • 2023
  • 국내 건설수주 규모는 2013년 91.3조원에서 2021년 총 212조원으로 특히 민간부문에서 크게 성장하였다. 국내외 시장 규모가 성장하면서, EPC(Engineering, Procurement, Construction) 프로젝트의 규모와 복잡성이 더욱 증가되고, 이에 프로젝트 관리 및 ITB(Invitation to Bid) 문서의 위험 관리가 중요한 이슈가 되고 있다. EPC 프로젝트 발주 이후 입찰 절차에서 실제 건설 회사에게 부여되는 대응 시간은 한정적일 뿐만 아니라, 인력 및 비용의 문제로 ITB 문서 계약 조항의 모든 리스크를 검토하는데 매우 어려움이 있다. 기존 연구에서는 이와 같은 문제를 해결하고자 EPC 계약 문서의 위험 조항을 범주화하고, 이를 AI 기반으로 탐지하려는 시도가 있었으나, 이는 레이블링 데이터 활용의 한계와 클래스 불균형과 같은 데이터 측면의 문제로 실무에서 활용할 수 있는 수준의 지원 시스템으로 활용하기 어려운 상황이다. 따라서 본 연구는 기존 연구와 같이 위험 조항 자체를 정의하고 분류하는 것이 아니라, FIDIC Yellow 2017(국제 컨설팅엔지니어링 연맹 표준 계약 조건) 기준 계약 조항을 세부적으로 분류할 수 있는 AI 모델을 개발하고자 한다. 프로젝트의 규모, 유형에 따라서 세부적으로 검토해야 하는 계약 조항이 다를 수 있기 때문에 이와 같은 다중 텍스트 분류 기능이 필요하다. 본 연구는 다중 텍스트 분류 모델의 성능 고도화를 위해서 최근 텍스트 데이터의 컨텍스트를 효율적으로 학습할 수 있는 ELECTRA PLM(Pre-trained Language Model)을 사전학습 단계부터 개발하고, 해당 모델의 성능을 검증하기 위해서 총 4단계 실험을 진행했다. 실험 결과, 자체 개발한 ITB-ELECTRA 모델 및 Legal-BERT의 앙상블 버전이 57개 계약 조항 분류에서 가중 평균 F1-Score 기준 76%로 가장 우수한 성능을 달성했다.

사회문제 해결형 기술수요 발굴을 위한 키워드 추출 시스템 제안 (A Proposal of a Keyword Extraction System for Detecting Social Issues)

  • 정다미;김재석;김기남;허종욱;온병원;강미정
    • 지능정보연구
    • /
    • 제19권3호
    • /
    • pp.1-23
    • /
    • 2013
  • 융합 R&D가 추구해야 할 바람직한 방향은 이종 기술 간의 결합에 의한 맹목적인 신기술 창출이 아니라, 당면한 주요 문제를 해결함으로써 사회적 니즈를 충족시킬 수 있는 기술을 개발하는 것이다. 이와 같은 사회문제 해결형 기술 R&D를 촉진하기 위해서는 우선 우리 사회에서 주요 쟁점이 되고 있는 문제들을 선별해야 한다. 그런데 우선적이고 중요한 사회문제를 분별하기 위해 전문가 설문조사나 여론조사 등 기존의 사회과학 방법론을 사용하는 것은 참여자의 선입견이 개입될 수 있고 비용이 많이 소요된다는 한계를 지닌다. 기존의 사회과학 방법론이 지닌 문제점을 보완하기 위하여 본 논문에서는 사회적 이슈를 다루고 있는 대용량의 뉴스기사를 수집하고 통계적인 기법을 통하여 사회문제를 나타내는 키워드를 추출하는 시스템의 개발을 제안한다. 2009년부터 최근까지 3년 동안 10개 주요 언론사에서 생산한 약 백 30만 건의 뉴스기사에서 사회문제를 다루는 기사를 식별하고, 한글 형태소 분석, 확률기반의 토픽 모델링을 통해 사회문제 키워드를 추출한다. 또한 키워드만으로는 정확한 사회문제를 파악하기 쉽지 않기 때문에 사회문제와 연관된 키워드와 문장을 찾아서 연결하는 매칭 알고리즘을 제안하다. 마지막으로 사회문제 키워드 비주얼라이제이션 시스템을 통해 시계열에 따른 사회문제 키워드를 일목요연하게 보여줌으로써 사회문제를 쉽게 파악할 수 있도록 하였다. 특히 본 논문에서는 생성확률모델 기반의 새로운 매칭 알고리즘을 제안한다. 대용량 뉴스기사로부터 Latent Dirichlet Allocation(LDA)와 같은 토픽 모델 방법론을 사용하여 자동으로 토픽 클러스터 세트를 추출할 수 있다. 각 토픽 클러스터는 연관성 있는 단어들과 확률값으로 구성된다. 그리고 도메인 전문가는 토픽 클러스터를 분석하여, 각 토픽 클러스터의 레이블을 결정하게 된다. 이를 테면, 토픽 1 = {(실업, 0.4), (해고, 0.3), (회사, 0.3)}에서 토픽 단어들은 실업문제와 관련있으며, 도메인 전문가는 토픽 1을 실업문제로 레이블링 하게 되고, 이러한 토픽 레이블은 사회문제 키워드로 정의한다. 그러나 이와 같이 자동으로 생성된 사회문제 키워드를 분석하여 현재 우리 사회에서 어떤 문제가 발생하고 있고, 시급히 해결해야 될 문제가 무엇인지를 파악하기란 쉽지 않다. 따라서 제안된 매칭 알고리즘을 사용하여 사회문제 키워드를 요약(summarization)하는 방법론을 제시한다. 우선, 각 뉴스기사를 문단(paragraph) 단위로 세그먼트 하여 뉴스기사 대신에 문단 세트(A set of paragraphs)를 가지게 된다. 매칭 알고리즘은 각 토픽 클러스터에 대한 각 문단의 확률값을 측정하게된다. 이때 토픽 클러스터의 단어들과 확률값을 이용하여 토픽과 문단이 얼마나 연관성이 있는지를 계산하게 된다. 이러한 과정을 통해 각 토픽은 가장 연관성이 있는 문단들을 매칭할 수 있게 된다. 이러한 매칭 프로세스를 통해 사회문제 키워드와 연관된 문단들을 검토함으로써 실제 우리 사회에서 해당 사회문제 키워드와 관련해서 구체적으로 어떤 사건과 이슈가 발생하는 지를 쉽게 파악할 수 있게 된다. 또한 매칭 프로세스와 더불어 사회문제 키워드 가시화를 통해 사회문제 수요를 파악하려는 전문가들은 웹 브라우저를 통해 편리하게 특정 시간에 발생한 사회문제가 무엇이며, 구체적인 내용은 무엇인지를 파악할 수 있으며, 시간 순서에 따른 사회이슈의 변동 추이와 그 원인을 알 수 있게 된다. 개발된 시스템을 통해 최근 3년 동안 국내에서 발생했던 다양한 사회문제들을 파악하였고 개발된 알고리즘에 대한 평가를 수행하였다(본 논문에서 제안한 프로토타입 시스템은 http://dslab.snu.ac.kr/demo.html에서 이용 가능함. 단, 구글크롬, IE8.0 이상 웹 브라우저 사용 권장).