• Title/Summary/Keyword: Size Normalization

Search Result 110, Processing Time 0.025 seconds

Distance LSTM-CNN with Layer Normalization을 이용한 음차 표기 대역 쌍 판별 (Verification of Transliteration Pairs Using Distance LSTM-CNN with Layer Normalization)

  • 이창수;천주룡;김주근;김태일;강인호
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2017년도 제29회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.76-81
    • /
    • 2017
  • 외국어로 구성된 용어를 발음에 기반하여 자국의 언어로 표기하는 것을 음차 표기라 한다. 국가 간의 경계가 허물어짐에 따라, 외국어에 기원을 두는 용어를 설명하기 위해 뉴스 등 다양한 웹 문서에서는 동일한 발음을 가지는 외국어 표기와 한국어 표기를 혼용하여 사용하고 있다. 이에 좋은 검색 결과를 가져오기 위해서는 외국어 표기와 더불어 사람들이 많이 사용하는 다양한 음차 표기를 함께 검색에 활용하는 것이 중요하다. 음차 표기 모델과 음차 표기 대역 쌍 추출을 통해 음차 표현을 생성하는 기존 방법 대신, 본 논문에서는 신뢰할 수 있는 다양한 음차 표현을 찾기 위해 문서에서 음차 표기 후보를 찾고, 이 음차 표기 후보가 정확한 표기인지 판별하는 방식을 제안한다. 다양한 딥러닝 모델을 비교, 검토하여 최종적으로 음차 표기 대역 쌍 판별에 특화된 모델인 Distance LSTM-CNN 모델을 제안하며, 제안하는 모델의 Batch Size 영향을 줄이고 학습 시 수렴 속도 개선을 위해 Layer Normalization을 적용하는 방법을 보인다.

  • PDF

이미지 정규화를 이용한 Edge Histogram Descriptor 이미지 매칭 성능 개선 (The Performance Improvement of Edge Histogram Descriptor Image Matching using Image Normalization)

  • 조민혁;이상걸;조재현;차의영
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2013년도 춘계학술대회
    • /
    • pp.385-388
    • /
    • 2013
  • 본 논문에서는 MPEG-7의 EHD(Edge Histogram Descriptor)를 이용한 이미지 매칭기법의 취약점을 보이고 이미지 정규화를 이용해 이를 개선하는 방법을 제안한다. EHD 알고리즘은 edge의 기울기 분포를 수집하여 같은 분포를 가지는 이미지를 매칭하는 기법에 사용한다. 하지만 EHD는 매칭하고자 하는 객체의 회전과 왜곡의 변화에 민감하여 오인식률이 높다. 따라서 이미지를 정규화 하여 매칭하고자 하는 이미지 내의 객체의 edge 정보를 보다 정확하게 추출하여 매칭 성능을 개선한다. 실험을 통해 왜곡과 회전으로 정규화한 EHD 알고리즘을 비교 및 분석하여 기존의 방법에 비해 크기와 회전의 변화에 강인함을 보인다.

  • PDF

가시광 및 근적외선 분광기법을 이용한 방울토마토의 내부품질 예측에 관한 연구 (Study on Prediction of Internal Quality of Cherry Tomato using Vis/NIR Spectroscopy)

  • 김대용;조병관;모창연;김영식
    • Journal of Biosystems Engineering
    • /
    • 제35권6호
    • /
    • pp.450-457
    • /
    • 2010
  • Although cherry tomato is one of major vegetables consumed in fresh vegetable market, the quality grading method is mostly dependant on size measurement using drum shape sorting machines. Using Visible/Near-infrared spectroscopy, apparatus to be able to acquire transmittance spectrum data was made and used to estimate firmness, sugar content, and acidity of cherry tomatoes grown at hydroponic and soil culture. Partial least square (PLS) models were performed to predict firmness, sugar content, and acidity for the acquired transmittance spectra. To enhance accuracy of the PLS models, several preprocessing methods were carried out, such as normalization, multiplicative scatter correction (MSC), standard normal variate (SNV), and derivatives, etc. The coefficient of determination ($R^2_p$) and standard error of prediction (SEP) for the prediction of firmness, sugar, and acidity of cherry tomatoes from green to red ripening stages were 0.859 and 1.899 kgf, with a preprocessing of normalization, 0.790 and $0.434^{\circ}Brix$ with a preprocessing of the 1st derivative of Savitzky Golay, and 0.518 and 0.229% with a preprocessing normalization, respectively.

물체 검출 컨벌루션 신경망 설계를 위한 효과적인 네트워크 파라미터 추출 ((Searching Effective Network Parameters to Construct Convolutional Neural Networks for Object Detection))

  • 김누리;이동훈;오성회
    • 정보과학회 논문지
    • /
    • 제44권7호
    • /
    • pp.668-673
    • /
    • 2017
  • 최근 몇 년간 딥러닝(deep learning)은 음성 인식, 영상 인식, 물체 검출을 비롯한 다양한 패턴인식 분야에서 혁신적인 성능 발전을 거듭해왔다. 그에 비해 네트워크가 어떻게 작동하는지에 대한 깊은 이해는 잘 이루어지지 않고 있다. 본 논문은 효과적인 신경망 네트워크를 구성하기 위해 네트워크 파라미터들이 신경망 내부에서 어떻게 작동하고, 어떤 역할을 하고 있는지 분석하였다. Faster R-CNN 네트워크를 기반으로 하여 신경망의 과적합(overfitting)을 막는 드랍아웃(dropout) 확률과 앵커 박스 크기, 그리고 활성 함수를 변화시켜 학습한 후 그 결과를 분석하였다. 또한 드랍아웃과 배치 정규화(batch normalization) 방식을 비교해보았다. 드랍아웃 확률은 0.3일 때 가장 좋은 성능을 보였으며 앵커 박스의 크기는 최종 물체 검출 성능과 큰 관련이 없다는 것을 알 수 있었다. 드랍아웃과 배치 정규화 방식은 서로를 완전히 대체할 수는 없는 것을 확인할 수 있었다. 활성화 함수는 음수 도메인의 기울기가 0.02인 leaky ReLU가 비교적 좋은 성능을 보였다.

선박 수리장비 관리를 위한 이미지 비교기법 (A Method to Compare Images for Managing Tools to Repair Ships)

  • 박성훈;김진덕
    • 한국정보통신학회논문지
    • /
    • 제18권10호
    • /
    • pp.2489-2496
    • /
    • 2014
  • 기존 수기 작성기반 선박 수리장비 관리 시스템은 빈번한 장비 분실 및 연체로 장비 관리에 많은 문제점들이 있다. 이러한 문제를 해결하고자 바코드 시스템을 도입하였다. 그러나 바코드 훼손에 따른 위조 장비의 대체 문제에 대처할 수 없다. 따라서 고가의 선박 수리장비의 관리를 위해 추가적인 확인 절차가 필요하다. 본 논문에서는 선박 수리장비 관리를 위한 이미지 비교기법을 제안한다. 구체적으로 모바일 디바이스의 특징을 이용한 정규화와 이미지 비교 판단 조건을 제안한다. 실시간 촬영 및 오버랩과 Crop 기능을 가진 모바일 디바이스를 이용하여 이미지를 정규화 하였고, 유사이미지에 대처할 수 있는 이미지 비교 판단 조건 세 가지(사각형의 내각의 합, 각 내각의 크기, 모서리의 좌표점)를 적용하였다. 그 결과 본 논문에서 제시한 방법이 방향, 조명, 크기 등의 변화에도 강건함을 보이며 테스트 결과 95% 이상의 정확도를 보였다.

Towards Low Complexity Model for Audio Event Detection

  • Saleem, Muhammad;Shah, Syed Muhammad Shehram;Saba, Erum;Pirzada, Nasrullah;Ahmed, Masood
    • International Journal of Computer Science & Network Security
    • /
    • 제22권9호
    • /
    • pp.175-182
    • /
    • 2022
  • In our daily life, we come across different types of information, for example in the format of multimedia and text. We all need different types of information for our common routines as watching/reading the news, listening to the radio, and watching different types of videos. However, sometimes we could run into problems when a certain type of information is required. For example, someone is listening to the radio and wants to listen to jazz, and unfortunately, all the radio channels play pop music mixed with advertisements. The listener gets stuck with pop music and gives up searching for jazz. So, the above example can be solved with an automatic audio classification system. Deep Learning (DL) models could make human life easy by using audio classifications, but it is expensive and difficult to deploy such models at edge devices like nano BLE sense raspberry pi, because these models require huge computational power like graphics processing unit (G.P.U), to solve the problem, we proposed DL model. In our proposed work, we had gone for a low complexity model for Audio Event Detection (AED), we extracted Mel-spectrograms of dimension 128×431×1 from audio signals and applied normalization. A total of 3 data augmentation methods were applied as follows: frequency masking, time masking, and mixup. In addition, we designed Convolutional Neural Network (CNN) with spatial dropout, batch normalization, and separable 2D inspired by VGGnet [1]. In addition, we reduced the model size by using model quantization of float16 to the trained model. Experiments were conducted on the updated dataset provided by the Detection and Classification of Acoustic Events and Scenes (DCASE) 2020 challenge. We confirm that our model achieved a val_loss of 0.33 and an accuracy of 90.34% within the 132.50KB model size.

랜덤 심볼에 기반한 정보이론적 학습법의 스텝 사이즈 정규화 (Step-size Normalization of Information Theoretic Learning Methods based on Random Symbols)

  • 김남용
    • 인터넷정보학회논문지
    • /
    • 제21권2호
    • /
    • pp.49-55
    • /
    • 2020
  • 랜덤 심볼열을 기반으로 한 정보이론적 학습법 (ITL)은 특정 확률분포를 갖도록 랜덤하게 발생시킨 심볼열을 타겟 데이터로 활용하고, 입력 데이터 사이의 확률분포 거리 최소화를 비용함수로 하여 설계된다. 이 방식의 단점으로, 고정상수를 알고리듬 갱신의 스텝사이즈로 사용하므로 입력 전력의 통계적 추이를 활용할 수 없다. 정보포텐셜 출력(information potential output, IPO)와 연관된 기울기에서는 정보포텐셜 입력(information potential input, IPI)이, 정보포텐셜 오차(information potential error, IPE)와 관련된 기울기에서는 입력자체가 입력으로 작용함을 이 연구에서 밝혀내고, 입력의 전력 추이를 따로 계산하여 스텝사이즈 (step size)를 정규화하도록 제안하였다. 제안된 알고리듬은 충격성잡음과 다중경로 페이딩 환경의 통신시스템 실험에서 기존 방식보다 약 4dB 정도 더 낮은 정상상태 오차 전력, 약 2배 이상 빠른 수렴속도를 나타냈다.

필기체 한글문자의 크기 및 형태정규화에 관한 연구 (A Study on the Size and Shape Pattern Normalization of Hand-Written Hangul Patterns)

  • 안석출;김명기
    • 한국통신학회논문지
    • /
    • 제11권5호
    • /
    • pp.332-339
    • /
    • 1986
  • 한글문자패튼의 인식율을 향상시키기 위해서 Gaussian 확율밀도 함수를 이용한 형태정규화의 한 방법을 제안한다. 제안된 방법은 입력패튼의 패튼 영역을 추출하여 2변수보간법으로 패튼의 크기를 정규화 한 후, 크기 정규화된 패튼의 상관계수를 0으로 하는 선형변환을 시켜 문자패튼의 기하학적 기울어짐 변형을 정규화시켰다. 입력패튼과 형태정규화된 패튼간의 관계를 이론적으로 해석하고 컴퓨터 시뮬레이션을 통해서 이론의 타당성을 확인하였다.

  • PDF

영오차 확률 기반 알고리즘의 입력 정력 정규화 (Input Power Normalization of Zero-Error Probability based Algorithms)

  • 김종일;김남용
    • 한국통신학회논문지
    • /
    • 제42권1호
    • /
    • pp.1-7
    • /
    • 2017
  • 충격성 잡음 환경에서 최대 영확률 (MZEP) 알고리듬은 최소자승오차 (MSE) 기반의 알고리듬 보다 우수한 성능을 지닌다. 그리고 알고리듬 자체에 내재한 크기 조절 입력 (MCI)가 MZEP 알고리듬을 충격성 잡음으로부터 알고리듬을 안정되게 유지하는 역할을 하는 것으로 알려져 있다. 이 논문에서는 MCI 입력의 평균전력으로 MZEP 알고리듬의 스텝 사이즈를 정규화하는 방식을 제안하였다. 충격파 발생률이 0.03인 충격성 잡음하의 시뮬레이션에서 정상상태 MSE 성능 비교에서 기존 MZEP에 비해 제안한 방식이 약 2dB 정도 향상된 특성을 보인다.

최대 상호코렌트로피 알고리듬을 위한 스텝사이즈 정규화 (Step Size Normalization for Maximum Cross-Correntropy Algorithms)

  • 김남용
    • 한국통신학회논문지
    • /
    • 제41권9호
    • /
    • pp.995-1000
    • /
    • 2016
  • 무작위 발생된 심볼 집합과 최대 상호 코렌트로피 (maximum cross-correntropy) 로 설계된 MCC 알고리듬은 최소자승평균 (MSE) 기반 알고리듬과 달리, 충격성 잡음 하에서 최적 가중치가 동요 없이 안정을 유지하며 그 요인이 오차 전력에 따라 입력의 세기를 조절하는 입력 크기 조정기 (input magnitude controller, IMC)에 있음이 밝혀졌다. 이 논문에서는 스텝사이즈를 정규화한 알고리듬 (normalized MCC, NMCC)를 제안하였으며 여기서 IMC 통과된 신호 전력은 1-pole 저역 통과 필터로 반복적 추정한다. 두 가지 다중경로 채널 모델과 충격성 잡음 환경에서 시행된 시뮬레이션 결과, 정규화된 NMCC알고리듬은 MCC알고리듬에 비해 정상상태 MSE에서 1 dB 정도의 성능 향상을, 수렴 속도에서도 500 샘플 정도 빠른 성능을 나타냈다.