• Title/Summary/Keyword: Database Normalization

Search Result 84, Processing Time 0.027 seconds

카메라 기반 문서영상에서의 문자 추출 (Text extraction from camera based document image)

  • 박희주;김진호
    • 한국산업정보학회논문지
    • /
    • 제8권2호
    • /
    • pp.14-20
    • /
    • 2003
  • 본 논문에서는 카메라로 획득한 문서영상에 대해 조명의 영향에 관계없이 고속으로 문자영역을 추출하는 알고리즘을 제안하였다. 카메라 문서는 스캐너 문서와는 달리 주변 환경이나 조명의 영향으로 인하여 문자영역을 추출하는 것이 매우 어렵다. 먼저 영상 사전처리 단계에서 컬러영상을 명도영상으로 변환한 후 조명의 영향에 무관하게 배경 그림으로부터 문자 영역을 정확히 추출하기 위해서 명도레벨 정규화를 사용하였다. 또한 배경 그림 및 잡음은 제거하고 문자 획의 손실 없이 문자 영역을 추출하기 위하여 국소-적응적-이진화-방법(local adaptive binarization method)을 새롭게 개발하여 문서영상을 이진화시켰다. 문자영역 추출 단계에서는 수평 및 수직 투영과 연결요소 정보에 의해 문자열, 단어 및 개별 문자 영역을 단계적으로 추출하였다. 제안된 방법의 타당성을 검증하기 위하여 ETRI에서 구축한 한글/영어/숫자/특수기호가 혼합된 현장 문서영상 DB를 가지고 실험해 보았다.

  • PDF

모양 기반 이미지 분류를 위한 최적의 우세점 추출 (Extraction of Optimal Interest Points for Shape-based Image Classification)

  • 조성택;엄기현
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제30권4호
    • /
    • pp.362-371
    • /
    • 2003
  • 이 논문에서는 이미지 데이타베이스에서 모양 특징 기반 이미지 분류와 인덱싱을 위해 객체의 윤곽선 특성을 고려해 임계값을 동적으로 결정하여 최적 우세점을 추출하는 알고리즘을 제안한다. 동적 임계값결정은 원본 모양의 윤곽선 길이 비와 근사화된 다각형의 둘레 길이 비를 알고리즘 수행시 점진적으로 검사하는 방법을 사용한다. 이 알고리즘은 윤곽선 특징을 반영하여 동적인 임계값 검사를 함으로써 의사점 수를 최대한 줄이며 최소 우세점만으로 모양 특징 정보를 추출할 수 있는 장점을 보인다. 제안한 방법은 객체의 윤곽선을 이루는 n개의 점에서 m개의 최적 우세점을 찾는데 평균 O(nlogn)이 걸린다. 최적화 평가는 7가지 서로 다른 특성을 가지는 70개의 합성 모양과 1,100개의 어류 모양에 대해 알고리즘을 적용하고 피 결과에 대해 평가 함수를 구성하여 수행하였다. 최적화율은 실험 모양들에 대해 평균0.92를 보였으며 기존 알고리즘에 대해 약 14% 최적화 성능 개선을 보였다. 제안한 알고리즘을 통해 추출한 모양 특징 정보는 정규화를 통해 이미지 분류와 인덱싱, 유사도 검색에 활용할 수 있다.

이종의 OCT 기기로부터 생성된 볼륨 데이터로부터 심층 컨볼루션 신경망을 이용한 AMD 진단 (AMD Identification from OCT Volume Data Acquired from Heterogeneous OCT Machines using Deep Convolutional Neural Network)

  • 권오흠;정유진;권기룡;송하주
    • 데이타베이스연구회지:데이타베이스연구
    • /
    • 제34권3호
    • /
    • pp.124-136
    • /
    • 2018
  • 신경망을 이용하여 OCT 영상을 분석하고 다양한 망막 질환을 자동 진단하는 것에 관한 연구들이 활발하게 이루어지고 있다. 이러한 연구가 현실에 적용되기 위한 하나의 중요한 요건은 학습된 신경망이 학습에 사용된 데이터와는 다른 기기에서 생성된 데이터에 대해서도 성능의 큰 하락 없이 일반화될 수 있어야 한다는 것이다. 본 논문에서는 심층 CNN을 이용하여 OCT 영상으로부터 노년기황반변성(AMD)을 자동 진단하는 것을 다룬다. 하나의 OCT 기기로부터 획득한 데이터 셋을 이용하여 신경망을 학습시킨 후 다른 OCT 기기로부터 생산된 이미지를 테스트한 결과 상당한 성능의 하락을 관찰할 수 있었다. 이러한 성능의 하락을 방지하기 위해서 OCT 이미지를 정규화 하는 기법을 제안하고 실험을 통해 그 효과를 분석하였다. 제안한 기법은 OCT 이미지를 분할하여 망막에 해당하는 영역을 찾아낸 후 이미지 내에서 망막 영역이 수평에 가까운 기울기를 가지도록 정렬(align)하여 형태적인 측면에서 OCT 이미지를 정규화 하는 것을 목적으로 한다. 실험을 통하여 제안한 기법이 이종의 기기에서 생성된 OCT 이미지로부터 AMD를 자동진단 하는데 있어서 상당한 성능의 향상을 달성함을 보였다.

한반도 식생에 대한 MODIS 250m 자료의 BRDF 효과에 대한 반사도 정규화 (A Reflectance Normalization Via BRDF Model for the Korean Vegetation using MODIS 250m Data)

  • 염종민;한경수;김영섭
    • 대한원격탐사학회지
    • /
    • 제21권6호
    • /
    • pp.445-456
    • /
    • 2005
  • 지표변수는 지면 근처의 기후변화에 중요한 역할을 하기 때문에, 충분히 높은 정확성을 가진 값이 산출되어야 한다 하지만 지표 반사도는 강한 이방성(non-Lambertian) 특징을 가지고 있기 때문에, 위성 천저각으로부터 멀어질수록 태양-지점-위성과의 기하학적 영향을 더욱 강하게 받는 효과를 가져온다. 또한 지표 각 영향을 포함하고 있는 지표 반사도는 노이즈를 가지게 된다. 따라서 본 연구의 목적은 한반도 지역의 MODIS 반사도 자료(250m)를 이용하여 각 영향이 제거된 보다 정확한 반사도 값에 대한 데이터베이스를 제공하는 것이다. 본 연구에서는 매일 2회씩 제공하는 MODIS(Moderate Resolution Imaging Spoctroradiometer) 센서의 가시영역과 근적외영역의 반사도(250m)자료를 이용하였다. 먼저 구름화소를 제거하기 위해서 연속적인 물리과정을 통하여 각각의 구름 화소를 제거하였다. 그리고 지리보정은 MODIS 센서에서 제공하는 지리정보자료를 이용하여 2차 다항회귀식을 통한 최근접 내삽법을 사용하였다. 본 연구에서는 지표 이방성 효과를 보정하기 위해서 반 경험적 양방향성분포함수(BRDF) 모델을 사용하였다. 이 알고리즘은 위성으로부터 관측된 위성천정각, 태양천정각, 위성방위각, 태양방위각과 같은 각 성분을 이용하여 Kernel-deriven 모델의 역변환을 통하여 지표 반사도를 재생산한다. 먼저 우리는 BRDF 모델을 수행하기 위해 총 31일 모델 관측 실행기간을 고려하였다. 다음 단계로 각각의 화소 및 밴드에 대해서 BRDF 모델을 통하여 분리된 각 성분들을 변조함으로써 위성 직하점 반사도 정규화가 수행되었다. 모델을 이용하여 산출된 반사도 값은 실제 위성 반사도 값과 잘 일치하였고, RMSE(Root Mean Square Error)값은 전체적으로 약 0.01(최고값=0.03)이였다. 마지막으로, 우리는 한반도 지역에 대해서 2001년 동안 총 36개로 구성된 정규화 지표반사도 값의 데이터베이스를 구축하였다.

실시간 얼굴인식 시스템을 위한 새로운 LINF 알고리즘의 제안 (The Suggestion of LINF Algorithm for a Real-time Face Recognition System)

  • 장혜경;강대성
    • 대한전자공학회논문지SP
    • /
    • 제42권4호
    • /
    • pp.79-86
    • /
    • 2005
  • 본 논문에서는 실시간 얼굴인식 시스템을 위한 새로운 LINF(Linear Independent Non-negative Factorization) 알고리즘을 제안한다. 시스템은 크게 얼굴추출 부분과 얼굴인식 부분으로 구성 되어 있으며, 얼굴추출 부분에는 차영상, 눈과 입의 영역 검출 그리고 정규화 방법을 사용하였고, 얼굴인식 부분에는 추출된 얼굴 후보 영역 영상에 LINF 를 적용하였다. 기존의 PCA(Principal Component Analysis)만을 사용한 인식시스템은 낮은 인식률을 보였으며, LDA(Linear Discriminants Analysis)만을 사용한 인식시스템에서는 학습데이터의 수에 비하여 영상의 화소 개수가 많은 경우 LDA를 그대로 적용하기 곤란하였다. 이러한 단점을 극복하기 위하여, 본 논문에서 제안하는 시스템은 기존의 고유얼굴과 달리 비음수 값을 갖는 행렬로 차원을 축소하여 LDA를 적용하였다. 제안한 시스템의 성능을 평가하기 위하여 자체 제작한 DAUface 데이터베이스와 영국 Cambridge 에 있는 AT&T 연구소에서 제공하는 ORL 데이터베이스를 가지고 실험을 하였다. 실험 결과, 제안된 방법이 PCA 방법과 LDA 방법, ICA(Independent Component Analysis) 방법, 그리고 PLMA(PCA-based LDA mixture algorithm)에 비해 인식률이 상당히 우수함을 알 수 있었다.

식품 데이터 정규화를 위한 쌀 음식의 건물중 기반 영양 편차 고찰 (A Study on Dry Weight-Based Nutritional Deviations in Rice Foods for Normalization of Food Data)

  • 김상철;이운용;박우풍;윤기오;김종린
    • 스마트미디어저널
    • /
    • 제11권7호
    • /
    • pp.76-84
    • /
    • 2022
  • 동일한 재료를 사용하고, 식품명이나 음식명이 같음에도 불구하고 동일한 중량에서 식품의 영양성분이 편차를 나타내는 경우가 많이 있다. 그 원인은 조리 방법과 조리 공정에 따른 음식의 수분함량과 깊은 관계가 있다. 개인의 건강 맞춤형 식단을 설계하고, 정확한 열량과 양분을 공급하기 위해서는 조리 공정이나 조리 방법에 영향을 받지 않는 음식 데이터의 표시 방법이 필요하다. 이 연구에서는 동일한 식자재나 식품이 함수율의 차이로 인해 다른 식자재나 식품으로 분류됨으로 데이터베이스의 복잡성과 활용측면의 어려움이 증가하는 문제를 개선하기 위해 건물중(乾物重) 기반의 식품 데이터 표시를 제안하고자 하며, 이를 위해 식품재료로서 쌀의 특징과 쌀을 재료로 한 다양한 쌀 가공 식품의 물성에 대하여 수분의 변화에 따른 주요 영양성분의 변화를 고찰하고, 이를 통해 식품 데이터를 정규화 하기 위한 예시로서 쌀의 건물중 기반 영양 표시를 제안하고자 하였다. 동일한 재료로 가공된 32종의 쌀 가공 식품 데이터는 수분 분포에 있어 1.1~95%, 에너지량은 20~415kcal, 단백질은 0.3~9.1g, 지질은 0.1~3.9g, 탄수화물은 4.4~91.0g의 범위로 매우 넓은 영역에 분포하고 있다. 그러나 수분영향을 제거하고 고형물로 환산한 쌀가공 식품의 100g 당 영양성분은 에너지량의 최대값과 최소값의 범위는 376.9~421.1kcal, 단백질의 최대값과 최소값의 범위는 4.3~12.6g, 지질의 최대값과 최소값의 범위는 0.1~4.1g, 탄수화물의 최대값과 최소값의 범위는 80.5~95.1g 로 나타났다. 수분 중량을 포함한 음식의 영양성분 데이터에 비해 최대값과 최소값, 데이터의 표준편차가 90%이상 감소하고, 정규화되는 경향을 나타내었다.

시설재배 상추에 대한 전과정평가 (LCA) 방법론 적용 (Application of LCA Methodology on Lettuce Cropping Systems in Protected Cultivation)

  • 유종희;김계훈
    • 한국토양비료학회지
    • /
    • 제43권5호
    • /
    • pp.705-715
    • /
    • 2010
  • 기후변화협약과 탄소배출권문제 등 환경에 관한 관심과 규제 등이 국제적 주요 관심 사항이 되고 있는 상황에서 농업생산에 대한 환경영향평가의 필요성이 대두되고 있다. 현재 우리나라는 환경부에서 시행하는 탄소성적표지제도 도입에서 농업분야의 LCI (Life Cycle Invemtory)database 부재를 이유로 1차 농산물을 대상에서 제외하고 있다. 따라서 농산물 탄소성적표지제도 도입을 위한 농업분야 LCI database에 대한 연구와 구축이 시급한 실정이다. 따라서 본 연구는 농업생산체계에 대한 LCA 적용을 위하여 시설상추를 대상으로 LCI 구축과 LICA 수행을 위한 방법론을 고찰하였다. LCA의 방법론은 ISO 14040 규격에 의거하여 연구 목적 및 범위, LCI분석 (전과정 목록분석), LCIA(전과정 영향평가), 해석의 단계로 구성되었다. 연구 목적은 시설 상추재배체계에 대한 LCA 방법론 적용이며, 기능단위는 상추 1 kg 생산으로 하였다. LCI 구축을 위한 영농 투입물과 산출물에 대한 데이터 수집은 농진청의 농축산물소득자료를 중심으로 관련 통계, 문헌자료를 통하여 수집하였다. LCI 구축을 위한 자료 수집결과 상추를 재배할 때 투입되는 물질 중 유기질 비료와 무기질 비료의 시용과, 식물보호제의 투입이 주요배출인자로 분석되었다. 농업활동으로 배출되는 주요 환경부하물질은 비료가 시용된 토양으로부터 대기로 발생되는 $N_2O$와 수계로 배출되는 ${NO_3}^-$, ${PO_4}^-$과 농약잔류물질로부터 발생되는 유기화학물질, 농기계에 쓰이는 화석연료 연소에 의한 대기오염물질 등 이었다. LCIA는 해외의 LCA 방법론과 LCA적용사례를 조사하여 농업분야 LCIA 방법론에 대하여 고찰하였다. LCIA는 분류화, 특성화, 정규화(일반화), 가중화의 4단계로 이루어지며, 이 중 분류화와 특성화는 의무절차이고, 정규화와 가중화는 선택사항이다. 해석단계는 LCI 분석결과와 LCIA 결과에 대하여 검증하고, 결과로부터 도출된 환경적 문제점과 개선안 등을 제시한다. LCA 수행에 사용하는 국내 소프트웨어는 지경부와 환경부에서 개발하여 보급하고 있는 'PASS'와 'TOTAL' 이다. 그러나 국내 프로그램에 적용되고 있는 환경영향평가 모델은 국외에서 개발한 기존모델들이다. 그러므로 보다 정확한 농업분야 LCA 분석이 가능하도록 추후 국내 농업환경에 적합한 영향평가 모델 및 특성화, 일반화, 가중화 계수의 선정 등이 이루어져야 할 것이다.

고로슬래그가 콘크리트의 전 과정 환경영향에 미치는 효과 (Effect of Ground Granulated Blast-Furnace Slag on Life-Cycle Environmental Impact of Concrete)

  • 양근혁;서은아;정연백;태성호
    • 콘크리트학회논문집
    • /
    • 제26권1호
    • /
    • pp.13-21
    • /
    • 2014
  • 혼화재로서 고로슬래그가 콘크리트의 전과정 환경영향에 미치는 효과를 정량적으로 평가하기 위하여, 3395개의 실내 배합 및 1263개의 레미콘 배합을 분석하였다. 콘크리트의 환경영향을 평가하기 위한 전 과정 평가 방법을 요약하면, 1) 고려된 시스템 경계는 요람에서 시공 전단계까지이며, 2) 재료, 운송 및 콘크리트 생산에서의 환경부하 평가는 국가 생애주기 데이터목록을 주로 기반으로 하였으며, 3) 환경부하는 분류화, 특성화, 정규화 및 가중치 단계를 거쳐 정량적인 환경영향 지표로 환산되었다. 콘크리트 전과정 환경영향은 주로 지구 온난화, 광화학 산화생성물 및 무생물 자원고갈의 세 범주로 분류될 수 있었다. 또한, 콘크리트의 환경영향 지표들은 주로 보통 포틀랜드 시멘트의 양에 의해 결정되었으며, 고로슬래그 치환율의 증가와 함께 감소하였다. 이를 고려하여, 콘크리트의 환경영향 지표들은 단위 결합재 양 및 고로슬래그 치환율의 함수로 간단하게 모델링 될 수 있었다.

국내의 지역 및 계절에 따른 콘크리트 배합별 환경영향평가 (Environmental Impact Assessment of Different Concrete Mixture Proportions according to Domestic Region and Season)

  • 서은아;양근혁;정연백
    • 콘크리트학회논문집
    • /
    • 제26권3호
    • /
    • pp.239-245
    • /
    • 2014
  • 지역과 계절이 콘크리트의 전과정 환경영향에 미치는 효과를 정량적으로 평가하기위해 6331개의 레디믹스 콘크리트 배합을 분석하였다. 콘크리트의 환경영향은 국가 생애주기 데이터목록을 기반으로 산출한 환경부하 발생량을 분류화, 특성화, 정규화 및 가중치 단계를 거쳐 6가지 환경영향 범주(지구온난화, 자원고갈, 광화학산화물생성, 산성화, 부영향화, 인간독성)로 나타났다. 단위압축강도에서의 환경영향 지표를 평가하기 위해 콘크리트 압축강도로 무차원한 환경영향 지수로 정의하였다. 국내에서 가장 많이 사용되는 콘크리트의 압축강도($f_{ck}$)는 24 MPa와 27 MPa이다. $f_{ck}$이 24 MPa일때 환경영향 지표가 가장 낮은 지역은 울산이었으며 가장 높은 지역은 광주와 대구였다. 지역에 따른 환경영향의 차이는 지역에 따라 사용되는 혼화재의 종류와 치환율이 다르기 때문이다. 또한 압축강도 24 MPa일때, 콘크리트의 환경영향지수는 동절기가 하절기 및 표준기에 비해 약 5% 높았다. 반면에 콘크리트의 환경영향 지수는 콘크리트 압축강도가 35 MPa을 넘어서면서 계절의 영향은 미미하였다.

PCA와 개선된 k-Nearest Neighbor를 이용한 모델 기반형 물체 인식 (Model-Based Object Recognition using PCA & Improved k-Nearest Neighbor)

  • 정병수;김병기
    • 정보처리학회논문지B
    • /
    • 제13B권1호
    • /
    • pp.53-62
    • /
    • 2006
  • 주성분 분석법을 사용한 물체 인식 기술은 영상의 조명 변화가 있을 때 인식률이 떨어지는 경향이 있다. 본 논문에서는 실험영상이 학습영상에 대해 조명의 차이가 있는 경우에도 데이터 베이스안의 물체인지 가려내는 새로운 PCA 분석방법을 사용한 물체 인식 기술을 제안하는데 그 목적이 있다. 그리고 개선된 k-nearest neighbor를 이용하여 물체 인식률을 향상 시켰다. 본 논문에서 제안된 물체 인식 알고리즘은 히스토그램 이퀄라이제이션과 미디언 필터를 이용하여 영상을 전처리하고 그것을 학습시켜서 물체 공간을 생성한다. 이때 히스토그램 이퀄라이제이션를 사용하여 히스토그램을 펼침으로써 조명 변화에 영향을 감소시키는 결과를 나았고, 이것은 기본적인 주성분 분석방법과 휘도치 정규화를 한 방법 등과 비교해 본 결과 조명 변화의 영향을 최소화하여 좋은 인식률을 유지할 수 있었다. 그리고 모델 영상내의 각각의 물체의 대표 값을 만든다. 그런 후 테스트영상을 물체 공간에 투영 시켜서 나온 성분과 대표 값의 거리를 비교하여 인식하게 된다. 기존의 방식으로는 거리 계산오차가 많기 때문에 본 논문에서는 개선된 k-Nearest Neighbpr 이용하여 몇 개의 연속적인 입력영상에 대해 각 각의 모델 영상들을 인식의 단위로 이용하였다.