• 제목/요약/키워드: combined algorithm

검색결과 1,607건 처리시간 0.029초

다중(多重) 근거리사진측정(近距離寫眞測定)에 의한 피사체(被寫體)의 3차원(次元) 정밀해석(精密解析)에 관한 연구(硏究) (A Study on the 3 Dimensional Precision Analysis of Objects by means of Multiple Close Range Photogrammetry)

  • 강준묵;류복모
    • 대한토목학회논문집
    • /
    • 제5권2호
    • /
    • pp.109-120
    • /
    • 1985
  • 본(本) 논문(論文)은 multiple close range photogrammetry에 의한 피사체(被寫體)의 3차원(次元) 정밀해석(精密解析)에 관한 연구(硏究)로서 2매(枚)의 사진(寫眞)과 다중사진(多重寫眞)에 대한 기하학적(幾何學的) 표준오차(標準誤差)와 관측자료(觀測資料)에 의한 표준오차(標準誤差) 비교분석(比較分析)함으로써 보다 이상적(理想的)인 3차원(次元) 위치해석(位置解析)의 한 기법(技法)을 제시(提示)하는 데 목적(木的)이 있다. 종래(從來)의 해석기법(解析技法)을 기하학적(幾何學的) model 형성(形成)에 의해 다중사진(多重寫眞) 해석(解析)한 데 비해, 본(本) 연구(硏究)는 공선조건(共線條件)을 지상사진(地上寫眞)에 맞는 기본이론(基本理論)으로 유도(誘導)하고, simultaneous bundle adjustment에 의한 다중사진(多重寫眞)의 해석(解析) algorithm을 개발(開發)하였다. 본(本) 연구(硏究)에 의한 기법(技法)은 균일(均一) 정확도(正確度) 및 일정한 오차(誤差)의 변화(變化)를 나타내었으며, 2매(枚)의 사진(寫眞)에 비하여 3매(枚)의 사진(寫眞)은 약(約) 15%, 4매(枚)의 사진(寫眞)은 35%, 5매(枚)의 사진(寫眞)은 50%까지 정도(精度)가 향상(向上)되는 결과(結果)를 얻었다. 따라서 본(本) 연구(硏究)는 높은 정확도(正確度)를 요(要)하는 각종(各種), 구조물(構造物), 특히 문화재(文化財) 등의 정밀측정(精密測定)에 그 이용(利用)이 기대(期待)되며 또한 다중사진(多重寫眞) 조합해석(組合解析)은 장애물(障碍物)이 있는 시설물(施設物)의 정밀측정(精密測定)에도 널리 이용(利用)될 것으로 기대(期待)된다.

  • PDF

A Novel Query-by-Singing/Humming Method by Estimating Matching Positions Based on Multi-layered Perceptron

  • Pham, Tuyen Danh;Nam, Gi Pyo;Shin, Kwang Yong;Park, Kang Ryoung
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제7권7호
    • /
    • pp.1657-1670
    • /
    • 2013
  • The increase in the number of music files in smart phone and MP3 player makes it difficult to find the music files which people want. So, Query-by-Singing/Humming (QbSH) systems have been developed to retrieve music from a user's humming or singing without having to know detailed information about the title or singer of song. Most previous researches on QbSH have been conducted using musical instrument digital interface (MIDI) files as reference songs. However, the production of MIDI files is a time-consuming process. In addition, more and more music files are newly published with the development of music market. Consequently, the method of using the more common MPEG-1 audio layer 3 (MP3) files for reference songs is considered as an alternative. However, there is little previous research on QbSH with MP3 files because an MP3 file has a different waveform due to background music and multiple (polyphonic) melodies compared to the humming/singing query. To overcome these problems, we propose a new QbSH method using MP3 files on mobile device. This research is novel in four ways. First, this is the first research on QbSH using MP3 files as reference songs. Second, the start and end positions on the MP3 file to be matched are estimated by using multi-layered perceptron (MLP) prior to performing the matching with humming/singing query file. Third, for more accurate results, four MLPs are used, which produce the start and end positions for dynamic time warping (DTW) matching algorithm, and those for chroma-based DTW algorithm, respectively. Fourth, two matching scores by the DTW and chroma-based DTW algorithms are combined by using PRODUCT rule, through which a higher matching accuracy is obtained. Experimental results with AFA MP3 database show that the accuracy (Top 1 accuracy of 98%, with an MRR of 0.989) of the proposed method is much higher than that of other methods. We also showed the effectiveness of the proposed system on consumer mobile device.

내시경 초음파 영상의 점막하 종양 분석 (Submucosal Tumor Analysis of Endoscopic Ultrasonography Images)

  • 김광백
    • 한국멀티미디어학회논문지
    • /
    • 제13권7호
    • /
    • pp.1044-1050
    • /
    • 2010
  • 내시경 초음파는 초음파 진동자를 내시경 끝에 부착하여 그 주위의 장기를 관찰할 목적으로 개발된 의료기기이다. 내시경 초음파 검사는 점막하 종양을 직접 관찰 할 수 있어 종양의 병리 소견이 예측 가능하지만, 종양의 악성화 여부 등에 대해 주관적인 소견이 개입될 수 있는 문제점이 있다. 따라서 본 논문에서는 주관적인 소견으로 인해 나타나는 문제점을 객관화하여 질병의 정확도와 재현성을 높이기 위해 종양의 각 특징을 분석하는 방법을 제안한다. 제안된 방법을 적용하기 위해서 내시경 초음파 검사로 얻어진 초기 영상에서 분석에 필요한 초음파 영역을 추출한다. 초음파 영역은 여러 요인으로 인하여 명암도 값의 차이가 발생하는데, 이는 객관적인 분석에는 비효율적이다. 따라서 초기 검사 시에 매질로써 주입되는 물 영역의 명암도를 기준으로 하여 초음파 영역의 명암도를 표준화 한다. 표준화된 초음파 영역에서 전문의에 의하여 선택된 종양 영역에 LVQ 알고리즘과 비트 평면 분할 방법을 각각 적용하여 에코가 높은 spot 영역과 칼슘이 침착된 영역을 추출하고 분석한다. 종양 영역의 세밀한 분석을 위하여 명암도 값과, 종양 영역 내에서 전문의가 임의로 선택한 두 지점의 거리에 포함된 명암도 정보를 추출한다. 또한 선택된 종양의 악성도를 구분하기 위하여 종양 영역에서 외곽의 기울기를 계산한다. 내시경 초음파 영상에서 각 질병의 특징을 분석한 결과, 제시된 방법이 종양이 가지는 특징을 분석하는데 도움이 되는 것을 확인할 수 있었다.

온라인 문서 군집화에서 군집 수 결정 방법 (Determining the number of Clusters in On-Line Document Clustering Algorithm)

  • 지태창;이현진;이일병
    • 정보처리학회논문지B
    • /
    • 제14B권7호
    • /
    • pp.513-522
    • /
    • 2007
  • 군집화는 주어진 데이터를 분할하여 데이터 속에 숨겨져 있는 의미를 자동으로 발견하는 방법으로, 사람이 일일이 살펴보기 어려운 데이터를 분석해서 비슷한 성향을 가진 데이터들끼리 모은 여러 개의 군집들을 만들어 낸다. 온라인 문서 군집화는 검색 엔진을 통해 검색된 문서들을 대상으로 군집화를 실행하여 유사한 특성의 문서들을 묶어서 보여줌으로써 사용자의 검색 환경의 편의성을 증진시키는 것이 목적이다. 문서군집화는 사람의 개입이 없이 자동으로 이루어져야 하고, 군집화 결과에 영향을 미치는 군집의 개수 선정도 자동으로 이루어져야 한다. 또한, 온라인 시스템에서는 빠른 응답 시간을 보장하는 것이 중요하다. 본 논문에서는 기하학적인 정보를 이용하여 군집의 수를 결정하는 방법을 제안한다. 제안하는 방법은 군집의 중심을 저차원 평면에 사상하는 것과 사상된 군집 중심의 거리 정보를 이용하여 군집들을 병합하는 두 단계로 이루어져 있다. 제안하는 방법을 실데이터에 적용하여 실험한 결과 군집화 성능이 향상되고, 처리 시간도 온라인 환경에 적합한 것을 확인 할 수 있었다.

다파장 라만 라이다 시스템을 이용한 고도별 황사의 단산란 알베도 산출 (Retrieval of Vertical Single-scattering albedo of Asian dust using Multi-wavelength Raman Lidar System)

  • 노영민;이철규;김관철;신성균;신동호;최성철
    • 대한원격탐사학회지
    • /
    • 제29권4호
    • /
    • pp.415-421
    • /
    • 2013
  • 본 연구에서는 다파장 라만 라이다 시스템을 이용하여 대기 중의 비구형 순수 황사입자와 구형 오염 입자가 혼합된 황사 입자의 단산란 알베도를 산출할 수 있는 방법론을 제시하고, 실제 대기 관측 사례 분석 자료로부터 정확도를 검증하고자 하였다. 편광소멸도는 황사와 비황사와의 혼합정도에 반비례함을 응용하여 편광소멸도 값으로부터 황사비를 산출하고 이를 이용하여 황사와 비황사로 황사층을 구분하였다. 산출된 비황사의 두 파장(355, 532 nm)의 소산계수와 세 파장(355, 532, 1064 nm)의 후방산란계수를 이용하여 역행렬 분석을 수행하여 비황사의 고도별 단산란알베도를 도출하였다. 황사와 비황사의 가중치를 소산계수값으로부터 산출하고 각 가중치를 황사와 비황사에 적용하여 황사 층 전체의 고도별 단산란알베도를 산출하였다. 단, 황사의 단산란알베도는 순수황사로 가정하여 발원지에서 측정된 순수황사가 나타내는 0.96의 값을 적용하였다. 본 연구로부터 개발된 분석방법은 기존의 원격탐사 기술의 한계점을 극복하여 황사의 이동시 타 오염입자와의 혼합에 따른 광학적 특성의 변화에 대한 정밀한 자료를 제공할 수 있을 것으로 기대된다.

혼합된 위성 및 지상 전송 시스템에서 새로운 상위 계층 복호 알고리즘 (A New Upper Layer Decoding Algorithm for a Hybrid Satellite and Terrestrial Delivery System)

  • 김민혁;박태두;김남수;김철승;정지원;천승룡
    • 한국전자파학회논문지
    • /
    • 제20권9호
    • /
    • pp.835-842
    • /
    • 2009
  • 이동체에 대해서 위성을 이용한 통신 방식을 규정하고 있는 DVB-SSP(Satellite Services for Portable devices) 표준화에서는 physical layer와 upper layer의 두 단계로 부호화 및 복호화를 한다. 수신단에서 physical layer의 복호 방식인 LDPC 복호후 upper layer의 erasure RS 복호를 위해, CRC 검사를 수행하여 수신된 데이터에서 1 bit의 오류에도 IP 패킷 모두를 삭제함으로써 복호시 오류가 발생하지 않은 정보가 손실될 수 있다. 따라서 본 논문에서는 두 가지 방식의 복호 알고리즘을 제안하며, LDPC 복호기에 출력되는 LLR 값을 이용하여 IP 패킷 전체를 삭제하는 것이 아니라 LLR 값이 낮은 비트만 선택적으로 삭제하는 방식과 삭제되는 개수에 따라 복호 알고리즘을 혼합하는 혼합형 복호 알고리즘을 제안하며, 이를 시뮬레이션하여 기존의 CRC 방식과 비교하였다. 그 결과 제안한 알고리즘이 Gaussian 채널일 때, 성능이 약 0.2 dB 개선됨을, 이동하는 철도의 환경에서는 오류 마루현상이 제거됨을 알 수 있다.

CASA 시스템의 청각장면과 PAR를 이용한 음성 영역 검출에 관한 연구 (A Study on Voice Activity Detection Using Auditory Scene and Periodic to Aperiodic Component Ratio in CASA System)

  • 김정호;고형화;강철호
    • 전자공학회논문지
    • /
    • 제50권10호
    • /
    • pp.181-187
    • /
    • 2013
  • 인간의 청각은 청각 장면 분석을 통해 배경 잡음이나 여러 사람들이 동시에 말하는 상황에서도 특정 목적을 가지는 음성 신호를 청취할 수 있는 능력을 가지고 있다. 인간의 청각 능력 시스템을 잘 반영한 CASA 시스템을 이용해 음성을 분리를 할 수 있다. 그러나 CASA 세그먼트에서 음성의 위치를 잘못 결정 했을 때 CASA 시스템의 성능은 감소된다. 본 논문에서는 CASA 시스템에서 잘못된 음성 영역 위치로 인해 발생되는 성능 감소를 개선하기 위하여 청각 장면, 그리고 주기 성분과 비주기 성분의 비율(PAR)을 결합한 음성 영역 검출 알고리즘을 제안한다. 음성 영역 검출의 성능을 평가하기 위하여 백색 잡음과 자동차 잡음 환경에서 신호 대 잡음비의 변화에 따라 실험을 수행하였다. 본 논문에서는 신호 대 잡음비 15~0dB에서 기존의 알고리즘(Pitch 와 Guoning Hu)과 제안한 알고리즘을 비교한 결과, 음성 영역 검출의 정확도가 백색잡음과 자동차 잡음에서 신호 대 잡음비 15dB 에서 최대 4%, 0dB에서 최대 34% 씩 각각 향상되었다.

PCA와 HMM을 이용한 실시간 립리딩 시스템의 설계 및 구현 (Design and Implementation of a Real-Time Lipreading System Using PCA & HMM)

  • 이지근;이은숙;정성태;이상설
    • 한국멀티미디어학회논문지
    • /
    • 제7권11호
    • /
    • pp.1597-1609
    • /
    • 2004
  • 립리딩은 잡음 환경에서 저하되는 음성 인식률의 보상과 음성을 청취하기 어려운 상황에서의 음성인식보조 수단으로 많은 연구가 시도되고 있다. 기존 립리딩 시스템은 인위적인 조명 환경이나 얼굴과 입술 추출을 위하여 미리 정해진 제한된 조건에서 실험되어 왔다. 본 논문에서는 화자의 움직임이 허용되고 컬러나 조명과 같은 환경 변화에 제한조건을 완화한 영상을 이용하여 실시간 립리딩 시스템을 구현하였다. 본 논문의 시스템은 범용으로 사용되는 PC 카메라를 통해 입력받은 영상에서 얼굴과 입술 영역을 실시간으로 검출한 후, 립리딩에 필요한 영상정보를 추출하고 이 입술 영상 정보를 이용하여 실시간으로 발성 단어를 인식할 수 있다. 얼굴과 입술 영역 검출을 위하여 조명환경에 독립성을 갖는 색도 히스토그램 모델을 이용하였고 움직이는 화자의 얼굴 추적을 위하여 평균 이동 알고리즘을 이용하였다. 검출된 입술 영역에서 학습과 인식에 필요한 영상 정보를 추출하기 위하여 PCA(Principal Component Analysis)를 사용하였고, 인식 알고리즘으로는 HMM을 이용하였다. 실험 결과 화자종속일 경우 90%의 인식률을 보였으며 잡음이 있는 음성과 합병하여 인식률 실험을 해 본 결과, 음성 잡음비에 따라서 음성 인식률을 약 40~85%까지 향상시킬 수 있었다.

  • PDF

TCP Vegas의 공정성 향상을 위한 혼잡 제어 알고리즘 (A Congestion Control Algorithm for the fairness Improvement of TCP Vegas)

  • 오민철;송병훈;정광수
    • 한국정보과학회논문지:정보통신
    • /
    • 제31권3호
    • /
    • pp.269-279
    • /
    • 2004
  • 인터넷의 안정성에 가장 큰 영향을 미치는 요소는 종단간에 이루어지는 TCP 혼잡제어이다. 현재 인터넷의 주요 TCP 버전인 Reno가 사용하는 수동적인 혼잡제어 방법은 네트워크의 혼잡을 심화시키는 원인이 된다. 이러한 Reno의 문제점을 개선하기 위해 제안된 Vegas는 Reno에 비해 우수한 성능을 가짐이 증명되었음에도 불구하고 두 가지 심각한 불공정성 문제를 가지고 있기 때문에 범용적으로 사용되지 못하고 있다. 본 논문에서는 이러한 Vegas의 문제점을 보완하기 위해서 기존의 Vegas 혼잡제어 알고리즘을 개선한 새로운 TCP PowerVegas 혼잡제어 알고리즘을 제안한다. rtt(round trip time)만을 기반으로 네트워크의 혼잡을 제어하는 기존의 Vegas에 비해서 제안한 PowerVegas는 rtt와 패킷 손실 정보를 유기적으로 결합시킨 새로운 기법으로 경쟁력 있는 혼잡제어를 수행한다. 그러므로 기존의 Vegas에서 발생했던 불공정성 문제를 모두 효과적으로 개선할 수 있다. 제안한 알고리즘의 성능을 검증하기 위해 동일한 시뮬레이션 환경에서 PowerVegas와 Reno 및 Vegas를 비교하는 실험을 수행하였다. 실험 결과를 통해서 제안한 PowerVegas가 기존 Reno의 혼잡제어 방법에 비해 우수한 성능을 보일 뿐만 아니라, Vegas의 불공정성 문제도 크게 개선되었음을 확인할 수 있었다.

HEVC 부호화기 고효율 압축을 위한 인지시각 특징기반 양자화 방법 (Human Visual Perception-Based Quantization For Efficiency HEVC Encoder)

  • 김영웅;안용조;심동규
    • 방송공학회논문지
    • /
    • 제22권1호
    • /
    • pp.28-41
    • /
    • 2017
  • 본 논문에서는 사람의 인지특성을 기반으로 대조 민감도에 의해 나타나는 특성을 모델링 한 JND (Just Noticeable Difference) 모델을 비디오 코딩에 적용하여 압축률을 높이는 방법을 제안한다. 제안하는 방법은 JND 모델에 따른 임계치를 기준으로 양자화 단계에서 비가시 신호를 제한하여 주관적 화질을 유지하면서 비트율을 낮추는 방법으로, 변환을 통해 주파수 도메인으로 변환된 잔차 신호들을 양자화 단계에서 입력으로 받아 신호제한 및 양자화를 수행한다. 양자화 단계에서 주파수 도메인의 신호가 JND 관점에서 유사하게 인지되는 기준 임계치를 구해 잔차 신호에서 비가시 신호를 제한하고 양자화를 수행한 후, 최적의 율-인지왜곡 비용을 갖는 양자화 계수를 선택함으로써 비트율을 절감시킨다. 제안하는 알고리즘의 성능 검증은 최신 비디오 압축 표준인 HEVC (High Efficiency Video Coding)의 참조 소프트웨어인 HM16.0에 적용했으며, CTC (Common Test Condition)의 Random Access 모드에서 HM 16.0을 통해 압축된 영상 대비 평균 4.11%, BQTerrace 영상의 양자화 파라미터 22에서 최대 17.22%의 비트율 절감을 보였으며, Low Delay 모드에서 평균 7.16%, 최대 22.55%, All intra 모드에서 평균 13.41%, 최대 21.64%의 비트율 절감을 보였다. 5명의 평가자들의 주관적 화질 측정으로 평균 DMOS (Difference Mean Opinion Score) 값은 최대 약 0.36 최소 0 정도의 분포를 보였다.