• 제목/요약/키워드: Automatic Data Extraction

검색결과 310건 처리시간 0.025초

변화지역 탐지를 위한 시계열 KOMPSAT-2 다중분광 영상의 MAD 기반 상대복사 보정에 관한 연구 (A Study on Object Based Image Analysis Methods for Land Use and Land Cover Classification in Agricultural Areas)

  • 염종민;김현옥;윤보열
    • 한국지리정보학회지
    • /
    • 제15권3호
    • /
    • pp.66-80
    • /
    • 2012
  • 원격탐사 방법을 활용한 변화지역 탐지, 재난재해 지도 작성, 작황 모니터링 등 다중시기의 위성영상을 활용한 결과를 도출하기 위해서는 시계열 영상 정보를 서로 비교할 수 있는 공통의 스케일로 정규화 하는 것이 필요하다. 다중시기 영상에 대한 정규화 방법은 절대복사보정과 상대복사 보정으로 나눌 수 있으며, 본 연구에서는 상대복사 보정을 통한 시계열 위성영상처리 기법을 다루고자 한다. 2011년 3월 해일 피해가 발생했던 일본 센다이 지역을 연구대상지로 선정하였고, KOMPSAT-2 다중분광영상을 이용한 사고 전, 후의 피해지역 탐지에 있어 상대복사 보정의 실효성을 분석하였다. 다양한 상대복사 보정 기법 중에서 정준상관분석을 통해 PIFs(Pseudo Invariant Features) 지역을 자동으로 추출하는 MAD(Multivariate Alteration Detection) 기법을 적용하였다. 본 사례연구 분석결과 MAD 방식에 의한 자동 PIFs 지역의 추출은 비교적 높은 정확도 수준에서 이루어짐을 확인할 수 있었으며, 상대복사 보정된 시계열 위성영상을 사용함으로써 변화지역 자동탐지의 신뢰수준을 높일 수 있는 것으로 나타났다.

영역 확장 기반 추적을 이용한 3차원 의료 영상 분할 기법 (3D Medical Image Segmentation Using Region-Growing Based Tracking)

  • 고선영;이재연;임정은;나종범
    • 대한의용생체공학회:의공학회지
    • /
    • 제21권3호
    • /
    • pp.239-246
    • /
    • 2000
  • 본 논문에서는, 입력으로 주어진 사람이 직접 분할한 1장의 슬라이스의 결과로부터 인접한 슬라이스들에 대해서 자동으로 원하는 장기를 추적하여 분할하는 반자동 분할 알고리즘을 제안한다. 일반적으로. 영역 확장에 기반한 추적 방법은 객체 투영. 초기 영역(seed) 추출, 그리고 영역확장에 의한 윤곽선 결정의 세 단계로 이루어진다. 이 때 의료 영상의 특성 상 장기들 사이의 경계가 모호한 경우 잘못 선택된 초기 영역은 최종 윤곽선이 장기 안쪽으로 파고 들거나 주변 영역으로 퍼져 나가는 결과를 만들 수 있다. 제안한 알고리즘에서는 영상의 특성을 이용하여 분할하려는 장기와 비슷한 밝기 값을 가지는 주변 장기와 붙어 있는 부분에서 주의 깊게 초기 영역을 선택해 줌으로써. 적절한 경계를 얻을 수 있으며, 경사도가 낮은 영역에서 깨끗한 윤곽선을 얻지 못하는 영역 확장 방법의 문제점의 해결을 위하여 Fourier descriptor를 사용한 후처리(post-Processing) 방법을 제안하였다. 또한, 양 방향 추적을 통해서 새로운 영역이 나타났을 때에도 놓치지 않고 찾아낼 수 있다. 본 논문에서 제안한 알고리즘을 1mm 간격의 82장의 X선 CT 영상에서 좌우측 신장 분할에 적용한 결과 만족할 만한 결과를 얻었다.

  • PDF

토픽 모델링을 이용한 트위터 이슈 트래킹 시스템 (Twitter Issue Tracking System by Topic Modeling Techniques)

  • 배정환;한남기;송민
    • 지능정보연구
    • /
    • 제20권2호
    • /
    • pp.109-122
    • /
    • 2014
  • 현재 우리는 소셜 네트워크 서비스(Social Network Service, 이하 SNS) 상에서 수많은 데이터를 만들어 내고 있다. 특히, 모바일 기기와 SNS의 결합은 과거와는 비교할 수 없는 대량의 데이터를 생성하면서 사회적으로도 큰 영향을 미치고 있다. 이렇게 방대한 SNS 데이터 안에서 사람들이 많이 이야기하는 이슈를 찾아낼 수 있다면 이 정보는 사회 전반에 걸쳐 새로운 가치 창출을 위한 중요한 원천으로 활용될 수 있다. 본 연구는 이러한 SNS 빅데이터 분석에 대한 요구에 부응하기 위해, 트위터 데이터를 활용하여 트위터 상에서 어떤 이슈가 있었는지 추출하고 이를 웹 상에서 시각화 하는 트위터이슈 트래킹 시스템 TITS(Twitter Issue Tracking System)를 설계하고 구축 하였다. TITS는 1) 일별 순위에 따른 토픽 키워드 집합 제공 2) 토픽의 한달 간 일별 시계열 그래프 시각화 3) 토픽으로서의 중요도를 점수와 빈도수에 따라 Treemap으로 제공 4) 키워드 검색을 통한 키워드의 한달 간 일별 시계열 그래프 시각화의 기능을 갖는다. 본 연구는 SNS 상에서 실시간으로 발생하는 빅데이터를 Open Source인 Hadoop과 MongoDB를 활용하여 분석하였고, 이는 빅데이터의 실시간 처리가 점점 중요해지고 있는 현재 매우 주요한 방법론을 제시한다. 둘째, 문헌정보학 분야뿐만 아니라 다양한 연구 영역에서 사용하고 있는 토픽 모델링 기법을 실제 트위터 데이터에 적용하여 스토리텔링과 시계열 분석 측면에서 유용성을 확인할 수 있었다. 셋째, 연구 실험을 바탕으로 시각화와 웹 시스템 구축을 통해 실제 사용 가능한 시스템으로 구현하였다. 이를 통해 소셜미디어에서 생성되는 사회적 트렌드를 마이닝하여 데이터 분석을 통한 의미 있는 정보를 제공하는 실제적인 방법을 제시할 수 있었다는 점에서 주요한 의의를 갖는다. 본 연구는 JSON(JavaScript Object Notation) 파일 포맷의 1억 5천만개 가량의 2013년 3월 한국어 트위터 데이터를 실험 대상으로 한다.

시공단계의 BIM기반 건설사업관리 업무절차 모델 개발 (Development of BIM-based Work Process Model in Construction Phase)

  • 유용신;정지성;정인수;윤호빈;이찬식
    • 한국건설관리학회논문집
    • /
    • 제14권1호
    • /
    • pp.133-143
    • /
    • 2013
  • BIM과 건설사업관리(Construction Management; 이하 CM)는 건설정보를 통합 관리하고 신뢰성 있는 의사결정을 지원하는 수단이라는 점에서 그 성격이 유사하기 때문에 BIM은 CM에 효율적으로 활용할 수 있으나, CM 분야에서 BIM 도입은 미흡한 실정이다. 이 연구의 목적은 시공단계의 CM 업무에 BIM을 효과적으로 활용할 수 있도록 업무절차 모델 및 가이드를 제시하는 것이다. 문헌조사를 통해 BIM 기능을 BIM 전환설계, 모델 검토, 데이터 추출, 자동 견적, 4D 시뮬레이션, 도면 생성, 엔지니어링 분야 연계분석 등으로 정의하고, CM 업무와 프로세스를 분석하여 BIM의 적용이 가능한 CM 업무를 도출하였다. BIM 기능과 CM 업무 간 연관성 분석을 통해 기존의 업무절차를 BIM 기능과 연계하여 재구성하고, 사업 참여자별 역할을 재정립하여 BIM기반 CM 업무절차 모델을 개발하였다. 개발된 모델의 효용성을 향상시키고자 면담조사와 사례조사를 통해 사업 참여자들의 BIM 업무를 기술한 가이드를 작성하였다. 또한 BIM기반 CM 업무절차 모델의 활용성을 검증하기 위한 선행연구의 BIM 프로세스와 비교 분석하고 전문가를 대상으로 설문조사를 수행하였다. 이 연구는 CM 분야에서 BIM의 활용성을 높이는데 기여할 수 있다. 향후에는 사례적용을 통해 실무적 관점에서 모델을 평가할 필요가 있으며, BIM 도입으로 인한 CM 업무의 확대를 고려하여 지속적으로 BIM기반 CM 업무절차 모델을 업데이트할 필요가 있다.

국방 디지털 아카이브의 효율적 연관정보 검색을 위한 자동화된 비즈니스 서비스 식별 (An Automatic Business Service Identification for Effective Relevant Information Retrieval of Defense Digital Archive)

  • 변영태;황상규;정찬기
    • 정보관리학회지
    • /
    • 제27권4호
    • /
    • pp.33-47
    • /
    • 2010
  • 정보기술혁명 및 네트워크 기반 정보공유 대중화는 국방 분야 디지털콘텐츠 수를 증가시켰다. 이에 따라 급격하게 그 수가 증가한 장기 보존된 디지털화된 공공정보 가운데 사용자 본인에게 적합한 공공정보를 찾는 것은 매우 중요한 문제로 대두되고 있다. 디지털콘텐츠는 원 자료의 출처 및 생산 시기에 따라 그 형태가 매우 다양하고, 디지털콘텐츠간에는 많은 상호 연관 관계가 존재한다. 비즈니스 서비스 온톨로지는 공공분야 디지털 아카이브 정보 생산자와 정보 이용자 간의 상호 지식을 명시화하고 지식을 공유할 수 있는 방안을 제공함으로써 디지털 공공정보 검색능력을 증진시키는데 많은 도움을 줄 수 있다. 비즈니스 서비스 온톨로지는 정보 생산자와 정보 이용자 간의 교량과 같은 인터페이스 역할을 수행하는 것이다. 그러나 업무 처리절차에 대한 의미 지식 추출의 어려움으로 인하여, 비정형의 업무 활동들로부터 정형화된 비즈니스 서비스로의 매핑 정보를 제공하는 비즈니스 서비스 온톨로지 자동화는 실용화하기가 매우 힘든 실정이다. 이러한 문제점을 해결하고자 본 연구에서는 비즈니스 서비스 온톨로지 구축을 위한 첫단계로써 전사적 아키텍처(ITA/EA)로부터 단위 비즈니스 서비스 식별 자동화 방안을 제안한다.

다중요인모델에 기반한 텍스트 문서에서의 토픽 추출 및 의미 커널 구축 (Multiple Cause Model-based Topic Extraction and Semantic Kernel Construction from Text Documents)

  • 장정호;장병탁
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제31권5호
    • /
    • pp.595-604
    • /
    • 2004
  • 문서 집합 내의 개념 또는 의미 관계의 자동 분석은 보다 효율적인 정보 획득과 단어 이상의 개념 수준에서의 문서간 비교를 가능케 한다. 본 논문에서는 다중요인모델에 기반 하여 텍스트 문서로부터 토픽들을 추출하고 이로부터 의미 커널(semantic kernel)을 구축하여 문서간 유사도를 측정하는 방안을 제시한다. 텍스트 문서는 내재된 토픽들의 다양한 결합에 의해 생성된다고 가정하며 하나의 토픽은 공통 주제에 관련되거나 적어도 자주 같이 나타나는 단어들의 집합으로 정의한다. 다중요인모델은 은닉층을 갖는 하나의 네트워크 형태로 표현되며, 토픽을 표현하는 단어 집합은 은닉노드로부터의 가중치가 높은 단어들로 구성된다. 일반적으로 이러한 다중요인 네트워크에서의 학습과 추론과정을 용이하게 하기 위해서는 근사적 확률 추정 기법이 요구되는데, 본 논문에서는 헬름홀츠 머신에 의한 방법을 활용한다. TDT-2 문서 집합에 대한 실험에서 토픽별로 관련 있는 단어 집합들을 추출할 수 있었으며, 4개의 텍스트 집합에 대한문서 검색 실험에서는 다중요인모델의 분석결과에 기반 한 의미 커널을 사용함으로써 기본 벡터공간 모델에 비해 평균정확도 면에서 통계적으로 유의한 수준의 성능 향상을 얻을 수 있었다.

병리특이적 형태분석 기법을 이용한 HRCT 영상에서의 새로운 봉와양폐 자동 분할 방법 (A Novel Method for Automated Honeycomb Segmentation in HRCT Using Pathology-specific Morphological Analysis)

  • 김영재;김태윤;이승현;김광기;김종효
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제1권2호
    • /
    • pp.109-114
    • /
    • 2012
  • 봉와양폐(Honeycomb)는 직경 2~10mm 정도의 크기가 같지 않은 낭포(Cyst)가 경계가 명확한 섬유질(Fibrosis)로 이루어진 벽에 둘러싸여 밀집된 형태로 이루어져 있다. 봉와양폐가 발견될 경우 급성악화의 발생 빈도가 높으며 따라서 봉와양폐의 관찰 여부와 측정은 임상에서 중요한 지표가 된다. 따라서 본 논문에서는 봉와양폐 영역의 정량적 측정을 위하여 봉와양폐의 특징을 이용한 형태학적 기법과 군집성 평가 기법을 통해 자동 구획 방법을 제안하였다. 첫 번째로 영상의 잡음을 제거하기 위하여 가우시안 필터링을 적용하고, 모폴로지 기법 중 팽창 기법을 이용하여 폐 영역을 구획하였다. 두번째로, 주변 8방향 검사를 통해 봉와양폐를 구성하는 낭포의 후보군을 찾고, 영역 확장과 외곽선 검사를 통해 비 낭포들을 제거하였다. 마지막으로 군집화 검사를 통해 최종적으로 봉와양폐를 구획하였다. 제안한 방법은 80장의 고해상도 컴퓨터 단층촬영 영상에서 실험한 결과, 89.4%의 민감도와, 72.2%의 양성 예측도를 보였다.

중소기업 스마트공장 구축을 위한 OpenCV 기반 재고관리 시스템의 설계 및 구현 (Design and Implementation of OpenCV-based Inventory Management System to build Small and Medium Enterprise Smart Factory)

  • 장수환;정종필
    • 한국인터넷방송통신학회논문지
    • /
    • 제19권1호
    • /
    • pp.161-170
    • /
    • 2019
  • 다품종 대량 생산 중소기업 공장에서는 제품의 종류가 다양하고 그 수량이 많기 때문에 재고의 관리를 위한 인력과 경비가 낭비되고 있다. 또한 재고의 현황을 실시간으로 확인 할 방법이 마련 되있지 않아서 재고의 과적재, 과부족 현상으로 인한 경제적 피해를 받고 있다. 실시간 데이터 수집 환경을 구축하기 위한 많은 방안이 있지만 대부분 구축비용과 시간이 중소 중견기업이 감당하기 어려운 수준이다. 그렇기 때문에 중소 중견기업의 스마트 공장은 구현되기 어려운 현실을 마주하고 있으며, 적절한 대책을 찾기 힘든 실정이다. 따라서 본 논문에서는 현재 생산품 관리 기술로 많이 채택되는 바코드, QR코드와 함께 라벨에 표기되어 있는 글자추출을 통해 기존 재고관리 방법의 확장에 대한 내용을 구현하고 그 효과를 평가하였다. 기술적으로는 컴퓨터 이미지 처리를 통해서 기존의 생산품의 입출고 관리를 위한 방법인 재고라벨 및 바코드에 대한 자동인식 및 분류를 하기 위한 OpenCV를 이용한 전처리, 구글 비젼 API의 OCR(Optical Character Recognition)기능을 통해서 글자를 추출하고, Zbar를 통해서 바코드를 인식할 수 있게 설계하였고, 값비싼 장비를 사용하지 않고 라즈베리파이를 통해 실시간 영상을 통한 인식으로 재고를 관리할 수 있는 방법을 제안한다.

A computer vision-based approach for behavior recognition of gestating sows fed different fiber levels during high ambient temperature

  • Kasani, Payam Hosseinzadeh;Oh, Seung Min;Choi, Yo Han;Ha, Sang Hun;Jun, Hyungmin;Park, Kyu hyun;Ko, Han Seo;Kim, Jo Eun;Choi, Jung Woo;Cho, Eun Seok;Kim, Jin Soo
    • Journal of Animal Science and Technology
    • /
    • 제63권2호
    • /
    • pp.367-379
    • /
    • 2021
  • The objectives of this study were to evaluate convolutional neural network models and computer vision techniques for the classification of swine posture with high accuracy and to use the derived result in the investigation of the effect of dietary fiber level on the behavioral characteristics of the pregnant sow under low and high ambient temperatures during the last stage of gestation. A total of 27 crossbred sows (Yorkshire × Landrace; average body weight, 192.2 ± 4.8 kg) were assigned to three treatments in a randomized complete block design during the last stage of gestation (days 90 to 114). The sows in group 1 were fed a 3% fiber diet under neutral ambient temperature; the sows in group 2 were fed a diet with 3% fiber under high ambient temperature (HT); the sows in group 3 were fed a 6% fiber diet under HT. Eight popular deep learning-based feature extraction frameworks (DenseNet121, DenseNet201, InceptionResNetV2, InceptionV3, MobileNet, VGG16, VGG19, and Xception) used for automatic swine posture classification were selected and compared using the swine posture image dataset that was constructed under real swine farm conditions. The neural network models showed excellent performance on previously unseen data (ability to generalize). The DenseNet121 feature extractor achieved the best performance with 99.83% accuracy, and both DenseNet201 and MobileNet showed an accuracy of 99.77% for the classification of the image dataset. The behavior of sows classified by the DenseNet121 feature extractor showed that the HT in our study reduced (p < 0.05) the standing behavior of sows and also has a tendency to increase (p = 0.082) lying behavior. High dietary fiber treatment tended to increase (p = 0.064) lying and decrease (p < 0.05) the standing behavior of sows, but there was no change in sitting under HT conditions.

뉴스기사를 이용한 소비자의 경기심리지수 생성 (Construction of Consumer Confidence index based on Sentiment analysis using News articles)

  • 송민채;신경식
    • 지능정보연구
    • /
    • 제23권3호
    • /
    • pp.1-27
    • /
    • 2017
  • 경제주체들의 경기상황에 대한 판단 및 전망은 경기변동에 영향을 미치므로 경기심리지수와 거시경제지표들 간에는 밀접한 관련성을 나타내는 것으로 알려져 있다. 경기선행지표로 국내에서 많이 사용되는 경기심리지수에는 소비자동향조사, 기업경기조사, 경제심리지수가 있다. 그러나 설문조사를 통해 생성된 지수는 자료의 성격상 속보성이 떨어지는 문제가 있다. 본 연구에서는 이러한 정형데이터의 한계를 보완할 수 있도록 비정형데이터에서 정보를 추출해 경기심리지수를 생성하고, 경제분석에서의 활용 가능성을 검토하였다. 민간소비와 관련된 실물지표에는 소매판매업지수와 서비스업생산지수를 사용하였고, 고용지표에는 고용률과 실업률을, 가격지표에는 소비자물가상승률과 가계의 대출금리를 사용하여 지표들 간의 추이 분석 및 시차구조 파악을 위한 교차상관분석을 수행하였다. 마지막으로 이들 지표들에 대한 예측 가능성을 점검하였다. 분석결과, 다른 지표들의 선행지수로 많이 사용되는 소비자심리지수와 비교해 선택 지표들과 높은 상관관계를 보이며, 1~2개월 선행한 것으로 나타났다. 예측력 또한 향상되어 텍스트데이터에서 생성한 소비자 경기심리지수의 유용성이 확인되었다. 온라인에서 생성되는 뉴스기사나 소셜 SNS 등의 텍스트 데이터는 속보성이 뛰어나고, 커버리지가 넓어 특정 경제적 이슈가 발생할 경우 이것이 경제에 미치는 영향을 빠르게 파악할 수 있다는 점에서 경기판단지표로써의 잠재적 가능성이 클 것으로 보인다. 경제분석에서 비정형데이터를 활용한 국내연구는 초기 단계지만 데이터의 유용성이 확인되면 그 활용도가 크게 높아질 것으로 기대한다.