• 제목/요약/키워드: 대용량 분류

검색결과 243건 처리시간 0.026초

이미지 단어집과 관심영역 자동추출을 사용한 이미지 분류 (Image Classification Using Bag of Visual Words and Visual Saliency Model)

  • 장현웅;조수선
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제3권12호
    • /
    • pp.547-552
    • /
    • 2014
  • 플리커, 페이스북과 같은 대용량 소셜 미디어 공유 사이트의 발전으로 이미지 정보가 매우 빠르게 증가하고 있다. 이에 따라 소셜 이미지를 정확하게 검색하기 위한 다양한 연구가 활발히 진행되고 있다. 이미지 태그들의 의미적 연관성을 이용하여 태그기반의 이미지 검색의 정확도를 높이고자 하는 연구를 비롯하여 이미지 단어집(Bag of Visual Words)을 기반으로 웹 이미지를 분류하는 연구도 다양하게 진행되고 있다. 본 논문에서는 이미지에서 배경과 같은 중요도가 떨어지는 정보를 제거하여 중요부분을 찾는 GBVS(Graph Based Visual Saliency)모델을 기존 연구에 사용할 것을 제안한다. 제안하는 방법은 첫 번째, 이미지 태그들의 의미적 연관성을 이용해 1차 분류된 데이터베이스에 SIFT알고리즘을 사용하여 이미지 단어집(BoVW)을 만든다. 두 번째, 테스트할 이미지에 GBVS를 통해서 이미지의 관심영역을 선택하여 테스트한다. 의미연관성 태그와 SIFT기반의 이미지 단어집을 사용한 기존의 방법에 GBVS를 적용한 결과 더 높은 정확도를 보임을 확인하였다.

$Na{\ddot{i}}ve$ Bayesian 분류화 기법을 이용한 시간대별 평균 구간 속도 기반 주행 시간 예측 알고리즘 (Travel Time Prediction Algorithm Based on Time-varying Average Segment Velocity using $Na{\ddot{i}}ve$ Bayesian Classification)

  • 엄정호;니하드카림초우더리;이현조;장재우;김연중
    • 한국공간정보시스템학회 논문지
    • /
    • 제10권3호
    • /
    • pp.31-43
    • /
    • 2008
  • 주행 시간 예측은 첨단 여행정보 시스템 (ATIS) 및 교통관리 시스템 (ITS)에서 필수적이다. 이를 위해 본 연구에서는 대용량의 데이터 분류에서 높은 정확도와 빠른 속도를 보장하는 $Na{\ddot{i}}ve$ Bayesian 분류화 기법을 기반으로 한 주행시간 예측 알고리즘을 제안한다. 제안된 알고리즘은 도로 네트워크 상에서 사용자 지정 주행 경로에 대하여 주행시간 예측이 가능하며, 또한 주어진 경로에 대해 시간대 별 평균 구간 속도를 고려하여 보다 정확한 주행 시간 예측을 수행한다. 제안된 알고리즘을 기존의 링크-기반 예측(link-based prediction)알고리즘[1] 및 Micro T* 알고리즘[2]과 성능 비교를 수행하였다. 성능 비교 결과, 제안된 기법이 타 예측기법에 비해 MARE (mean absolute relative error)가 크게 감소하여 성능이 향상되었음을 보였다.

  • PDF

초분광 이미지 픽셀 분류를 위한 풀링 연산과 PSNR을 이용한 최적 밴드 선택 기법 (Optimal Band Selection Techniques for Hyperspectral Image Pixel Classification using Pooling Operations & PSNR)

  • 장두혁;정병현;허준영
    • 한국인터넷방송통신학회논문지
    • /
    • 제21권5호
    • /
    • pp.141-147
    • /
    • 2021
  • 본 연구를 통해 임베디드 시스템(Embedded System)에서 뉴럴 네트워크(Neural Network) 인풋의 차원 감소 방식으로 복잡한 연산량을 줄여 초분광 대용량 데이터 특징 정보의 활용률을 개선하기 위해, 전체 밴드를 밴드별 최댓값과 최솟값 차이로 부분집합으로 군집화하여, 각 부분집합에서 밴드 선택 알고리즘을 적용한다. 특징 추출과 특징 선택 기법 중에, 특징 선택 기법을 통해, 파장 범위와 관계없이 데이터세트에 맞는 최적의 밴드 수와 기존 알고리즘 적용 소요 시간과 성능을 향상하고자 한다. 이 실험을 통해 기존 밴드 선택 기법보다 1/3~ 1/9배 소요 시간을 단축했음에도 불구하고 K-최근접 이웃 분류기를 통한 성능 면에서는 약 4% 이상 향상된 의미 있는 결과를 도출하였다. 실시간 초분광 데이터 분석 활용에는 어렵지만, 개선된 가능성을 확인했다.

배후지 지하수위를 고려한 인공신경망 기반의 수평정별 취수량 결정 기법 (Determination of the Groundwater Yield of horizontal wells using an artificial neural network model incorporating riverside groundwater level data)

  • 김규범;오동환
    • 지질공학
    • /
    • 제28권4호
    • /
    • pp.583-592
    • /
    • 2018
  • 최근들어 방사형 집수정 방식의 대용량 강변여과수 개발에 따른 배후지의 지하수위 강하에 대한 우려가 존재하고 있다. 본 연구에서는 안성천의 방사형 집수정을 대상으로 Modflow를 활용하여 수평정의 취수량에 따른 배후지의 수위 강하를 예측하였으며, 이 데이터를 기반으로 배후지 수위 강하가 최소가 되는 수평정별 취수량을 결정하는 다층퍼셉트론 기반의 인공신경망 모델을 개발하였다. 하천 방향으로 굴착된 수평정 HW-6의 취수량을 높이는 것이 OW-7 및 OB-11 관측정의 지하수위를 높게 유지하는데 필요한 것으로 평가되었다. 또한, 모델 입력 자료의 수 및 훈련과 검증 자료의 분류는 인공신경망 모델 결과에 영향을 미치므로 유의하여야 한다. 향후 현장의 실제 운영 자료와 수치모델의 비교를 통하여 인공신경망 모델을 보완한다면 배후지의 지하수 관리에 기여할 것으로 본다.

대용량 고해상 위성영상처리 시스템 개발 (Development of an Image Processing System for the Large Size High Resolution Satellite Images)

  • 김경옥;양영규;안충현
    • 대한원격탐사학회지
    • /
    • 제14권4호
    • /
    • pp.376-391
    • /
    • 1998
  • 위성의 발달에 따라 고해상영상이 등장하게 되었고 지표상태 분석에 매우 유용하게 되었다. GeoWatch는 지능형 영상처리 시스템으로서, 고해상도 영상을 이용하여 디지타이징, 지리보정, 강조, 여러 가지 연산, 식생지수 분석, 등을 하여 지표면 분석 등을 할 수 있는 시스템이다. 도한 지능형 분석 방법등 여러 가지 기법을 이용하여 변화지역분석, 토지 분류, 도시정보추출 등을 수행한다. 이 시스템의 강점은 full scene 영상같은 대용량 영상을 다룰 경우 역동적인 알고리즘 저장 방식을 채택하였고, 자동메뉴 생성, 사용자 편의를 위한 비쥬얼 프로그래밍 환경 등을 제공한다. 이 시스템은 또한 위성영상 위에 벡터를 중첩하여 분석하거나 수정 작업을 할 수 있고, 3차원 비행 시뮬레이션도 가능하다. 이 시스템은 영상 처리 모듈 외에도 영상 변환 및 수정 유틸리티 기능을 많이 제공한다. 본 논문에서는 또한 지능형 영상 분석 방법 뿐만 아니라, 대용량처리나, 비쥬얼 프로그램을 위한 디자인 개념을 제공한다.

클러스터링 해쉬 테이블을 이용한 다차원 선박 USN 스트림 데이터의 효율적인 처리 (Efficient Processing of Multidimensional Vessel USN Stream Data using Clustering Hash Table)

  • 송병호;오일환;이성로
    • 대한전자공학회논문지SP
    • /
    • 제47권6호
    • /
    • pp.137-145
    • /
    • 2010
  • 디지털 선박에서는 선박 내의 각종 센서로부터 측정된 디지털 데이터에 대한 정확하고 에너지 효율적인 관리가 필요하다. 그러나, 센서 네트워크에서 대용량 스트림 데이터를 제한된 네트워크, 전력, 프로세서를 이용하여 모든 센서 데이터를 전송하고 분석하는 것은 어렵고 효율적이지 못하다. 그러므로, 연속적으로 입력되는 데이터를 사전에 분류하여 특성에 따라 선택적으로 데이터를 처리하는 데이터 분류 기법이 요구된다. 본 논문에서는 디지털 선박 내에 다수 개의 센서(온도, 습도, 조도, 음성 센서)를 배치하고 효율적인 입력 스트림 처리를 위해서 슬라이딩 윈도우 기반으로 다중 Support Vector Machine(SVM) 알고리즘을 이용하여 사전 분류(pre-clustering)한 후 요약된 정보를 해쉬 테이블로 관리하는 효율적인 처리 기법을 제안한다. 해쉬테이블을 이용하여 다차원 스트림 데이터의 저장될 레코드 순서를 빠르게 찾아 저장 및 검색함으로서 처리 속도가 향상되고 메모리에 해쉬 테이블 만을 유지하면 되므로 메모리 사용량이 감소한다. 35,912개의 데이터 집합을 사용하여 실험한 결과 제안 기법의 정확도와 처리 성능이 향상되었다.

클라우드 환경에서 문서의 유형 분류를 위한 시맨틱 클러스터링 모델 (Semantic Clustering Model for Analytical Classification of Documents in Cloud Environment)

  • 김영수;이병엽
    • 한국콘텐츠학회논문지
    • /
    • 제17권11호
    • /
    • pp.389-397
    • /
    • 2017
  • 최근 시맨틱 웹 문서는 클라우드 기반으로 생성 및 유통되고 문서유형 분류에 따른 쉽고 신속한 정보 검색을 위해 지능형 시맨틱 에이전트를 요구하고 있다. 기존의 웹 문서의 검색은 키워드를 이용하여 해당하는 질의어가 포함된 문서 목록을 결과로 가져오며 사용자의 요구시에 내용을 제시하는 것이 일반적인 형태이다. 이는 웹 문서의 유사도와 시맨틱 관련성을 고려하지 않음으로써 사용자가 내용 검색과 분석에 많은 시간과 노력을 요구한다. 이의 해결을 위해서 빅 데이터 요소 기술인 하둡과 NoSQL을 활용하여 시맨틱 웹 문서에 포함된 키워드 빈도에 기반한 웹 문서의 유형 분류와 유사도를 제시하는 시맨틱 클러스터링 모델을 제안한다. 제안 모델은 실시간 데이터 처리가 요청되는 이종 모델을 가진 공공 데이터와 웹 데이터를 취합하여 일반 사용자가 쉽게 질의할 수 있는 대용량 지식 기반 시스템을 구축하는데 응용 모델로 활용될 수 있다.

온라인 쇼핑몰의 상품평 자동분류를 위한 감성분석 알고리즘 (A Sentiment Analysis Algorithm for Automatic Product Reviews Classification in On-Line Shopping Mall)

  • 장재영
    • 한국전자거래학회지
    • /
    • 제14권4호
    • /
    • pp.19-33
    • /
    • 2009
  • 급속한 전자상거래의 발전으로 인하여 온라인상으로 상품을 구매하고 그에 대한 평가를 작성하는 것이 일반적인 구매 패턴이 되었다. 기존 구매자들의 상품평들은 다른 잠재적인 소비자들의 상품 구입을 이끌어내는데 큰 동기가 된다. 사용자가 작성한 상품평은 하나의 상품에 대해 실제 사용자의 좋고 나쁨에 대한 감정을 표현한 결과로, 개개인에 따라 긍정 또는 부정적인 의견으로 나눠진다. 상품평 중에서 소비자가 원하는 정보를 얻기 위해서는 이들을 일일이 수작업으로 확인해야하지만, 온라인 쇼핑몰에 상품평이 대용량으로 축적된 환경에서 이러한 작업은 비효율적일 수밖에 없다. 본 논문에서는 오피니언 마이닝 기술을 이용하여 제품 사용자의 주관적 의견을 자동으로 분류할 수 있는 감성분석 알고리즘을 제시한다. 본 논문에서 제시하는 알고리즘은 온라인 쇼핑몰에 등록된 개별 상품평을 대상으로 긍정 및 부정 의견으로 판단하여 요약된 결과를 제공하는 기능을 한다. 본 논문에서는 또한 제안된 알고리즘을 바탕으로 개발된 상품평 자동분석 시스템을 소개하고, 알고리즘의 효율성을 검증하기 위한 실험결과도 제시한다.

  • PDF

클라우드 컴퓨팅 환경에서 무감독학습 방법과 퍼지이론을 이용한 결합형 데이터 분류기법 (Coupled data classification method using unsupervised learning and fuzzy logic in Cloud computing environment)

  • 조규철;김재권
    • 한국컴퓨터정보학회논문지
    • /
    • 제19권8호
    • /
    • pp.11-18
    • /
    • 2014
  • 본 논문은 무감독학습을 통한 데이터 분류기법인 ART에서 퍼지이론을 이용한 결합형 데이터 분류 방법을 제안한다. 무감독학습기법 기반의 데이터 분류 기술은 분류기술의 향상의 장점이 있지만, 처리성능이 저하된다는 단점이 있다. 민첩성 있는 대용량데이터 처리와 분류인식률을 만족하는 최적의 임계값 결정기법이 필요하지만, 이는 불확실성이 많이 따르기 때문에 두 가지를 고려하여 상호보완 할 수 있는 처리기법이 필요하다. 제안하는 기법은 무감독학습을 하기 위해 퍼지매개변수와 퍼지 규칙을 설계하여 최적의 임계값을 도출한다. 제안하는 기법의 성능평가를 위해 클라우드 컴퓨팅환경에서 G 단백질 연결 수용체(G protein coupled receptor, GPCR)데이터를 이용하여 실험하였으며, 실험결과는 높은 인식률과 낮은 처리시간을 통해 결합형 데이터 분류에 효과적임을 입증하였다.

중규모급 단어 인식기의 실시간 구현을 위한 무감독 단어집단화 알고리듬 (Unsupervised Word Grouping Algorithm for real-time implementation of Medium vocabulary recognition)

  • 임동식;김진영;백성준
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1999년도 학술발표대회 논문집 제18권 2호
    • /
    • pp.81-84
    • /
    • 1999
  • 본 논문에서는 중규모급 단어인식기의 실시간 구현을 위한 무감독 단어집단화 알고리듬을 제안한다. 무감독 단어집단화는 인식대상 어휘 수가 많은 대용량 음성인식 시스템에서 대상 어휘 수를 줄여주는 역할을 하는 전처리기의 성격을 갖는다. 무감독 집단화를 위해 각 단어의 유$\cdot$무성음 고유의 특성을 잘 반영할 수 있는 특징 파라미터 5개를 사용하여 패턴 인식과 회귀분석에서 널리 사용되고 있는 분류$\cdot$회귀트리(Classification And Regression Tree)에 적용시키는 방법으로 접근하였고, 각 단어의 frame 수를 일정하게 n개로 분할(segment)하여 1개의 tree를 생성시키는 방법과 각 segment에 해당하는 tree를 생성시켜 segment들 사이의 교집합 성분으로 단어들을 집단화 하였다 실험결과 탐색 대상단어 22개에서 평균2.21개로 줄어 전체 대상 단어의 $10\%$만을 탐색하여 인식할 수 있는 방법을 제시할 수 있었다.

  • PDF