• 제목/요약/키워드: Encoder-decoder

검색결과 451건 처리시간 0.024초

순서적 역방향 상태천이 제어에 의한 역추적 비터비 디코더 (Trace-Back Viterbi Decoder with Sequential State Transition Control)

  • 정차근
    • 대한전자공학회논문지TC
    • /
    • 제40권11호
    • /
    • pp.51-62
    • /
    • 2003
  • 본 논문에서는 역추적 비터비 디코더의 순서적 역방향 상태천이 제어에 의한 새로운 생존 메모리 제어와 복호기법을 제안한다. 비터비 알고리즘은 채널오류의 검출과 정정을 위한 부호기의 상태를 추정해서 복호하는 최우추정 복호기법이다. 이 알고리즘은 심볼간 간섭의 제거나 채널등화 등 디지털 통신의 광범위한 분야에 응용되고 있다. 반복연산의 과정을 내포하고 있는 비터비 디코더에서 처리속도의 향상과 함께 VLSI 칩 설계시 점유면적의 삭감을 통한 칩 사이즈의 축소 및 소비전력의 저감 등을 달성하기 위해서는 새로운 구조의 ACS 및 생존 메모리 제어에 관한 연구가 요구되고 있다. 이를 해결하기 위한 하나의 방안으로, 본 논문에서는 역추적 기법에 의한 복호과정에서 역방향 상태천이의 연속적인 제어에 의한 자동 복호 알고리즘을 제안한다. 제안방식은 기존의 방법에 비해 전체 메모리 사용량이 적을 뿐만 아니라 구조가 간단하다. 또한, 메모리 억세스 제어를 위한 주변 회로구성이 필요 없고, 메모리 억세스를 위한 대역폭을 줄일 수 있어 칩 설계시 area-efficiency가 높고 소비전력이 적어지는 특성이 있다 시스톨릭 어레이 구조 형태를 갖는 병렬처리 구성과, 채널잡음을 포함한 수신 데이터로부터의 복호와 구체적인 응용 시스템에 적용한 결과를 제시한다.

공간적 유사성과 심볼단위 오류정정 채널 코드를 이용한 경량화 비디오 부호화 방법 (Lightweight video coding using spatial correlation and symbol-level error-correction channel code)

  • 고봉혁;심혁재;전병우
    • 방송공학회논문지
    • /
    • 제13권2호
    • /
    • pp.188-199
    • /
    • 2008
  • 기존의 부호화 기술은 부호화기의 복잡도가 복호화기에 비해 매우 높은 구조로 이루어져 있다. 하지만 최근에 부호화기 복잡도의 대부분을 차지했던 움직임 예측/보상과정을 없애는 경량화 부호화 구조에 대한 연구가 중요해졌다. Wyner-Ziv 부호화 기술은 이의 대표적인 기술로서 부호화기는 단순히 현재 프레임에 대한 패리티 정보만을 생성하며 프레임 간 유사성을 이용하는 어떠한 처리절차도 행하지 않기 때문에 종래의 기술에 비해 매우 간단한 구조를 갖는다. 하지만 Wyner-Ziv 부호화 구조에서는 잡음이 많은 보조영상을 복호화에 이용 할 경우 채널 코드의 복호화 오류가 발생한다. 이러한 복호화 오류는 특히 영상 간 유사성이 적어 보조정보를 잘 만들 수 없는 경우 더 많이 발생하며 복원된 영상에 마치 Salt & Pepper와 같은 형태의 잡음으로 나타난다. 이러한 잡음은 비록 그 발생빈도가 적더라도 복원된 영상의 주관적인 화질을 상당히 떨어뜨리는 요소로 작용하므로 이전에는 공간적 유사성을 이용하여 이러한 오류를 정정하는 선택적 미디언 필터를 사용한 경량화 부호화 방법을 제안하였었다. 하지만 이전 방법에서는 텍스처가 복잡한 영상의 경우, 필터적용에 따른 텍스처의 손실이 오류정정으로 얻는 이득보다 더 큰 경우가 발생하는 문제점이 있었다. 따라서 본 논문에서는 선택적 미디언 필터에 복원영상과 보조정보 내 잡음에 관한 정보를 제공함으로써 필터링에 따른 텍스처의 손실을 최소화하는 향상된 경량화 부호화 방법을 제안한다. 실험결과는 이전 방법에 비해 최대 0.84dB에 이르는 성능향상을 보였다.

적응적 경판정 출력을 이용한 고속 분산 비디오 복호화 기술 (Adaptive Hard Decision Aided Fast Decoding Method in Distributed Video Coding)

  • 오양근;심혁재;전병우
    • 대한전자공학회논문지SP
    • /
    • 제47권6호
    • /
    • pp.66-74
    • /
    • 2010
  • 최근 부호화기의 성능 및 전력이 제한된 환경을 위한 비디오 부호화 기술로 분산 비디오 부호화 기술 (DVC : Distributed Video Coding)이 각광받고 있으며, Wyner-Ziv (WZ) 부호화 기술은 이의 대표적인 기술이다. WZ 부호화기는 기존 인트라 부호화 기술과 채널 부호를 사용하여 각각 키 (key)프레임과 WZ 프레임을 독립적으로 부호화한다. WZ 복호화기는 프레임 간 시간적 유사도를 기반으로, 복호화 된 키 프레임으로부터 보조 정보 (Side Information)를 생성한다. 보조 정보는 가상의 채널 잡음이 존재하는 WZ 프레임으로 간주되고, 가상의 채널 잡음은 채널 부호 복호화 과정을 통해 제거된다. 따라서 WZ 부호화 기술의 성능은 채널 부호의 성능에 크게 좌우된다. 현존하는 채널 부호 중 LPDC 채널 부호와 Turbo 채널 부호는 강력한 에러 정정 능력을 가지고 있으며, 확률적인 계산을 기반으로 반복적인 복호화 알고리즘을 수행하는 것이 특징이다. 하지만 반복적인 복호화 과정은 상당히 소모적인 과정으로 WZ 복호화기의 복잡도를 증가시킨다. 실제 WZ 부호화 기술에 LDPCA 채널 부호를 사용한 경우, WZ 복호화기 전체 복잡도에서 채널 복호화 과정이 차지하는 비율은 평균 60%에 이른다. 채널 복호화 과정 복잡도의 감소를 위해 채널 부호 분야에서 제안되었던 HDA (Hard Decision Aided) 방법을 LDPCA 채널 부호에 적용할 경우, 채널 복호화 과정의 복잡도는 상당히 줄어든다. 하지만 HDA 방법 적용을 위해 설정할 경계치에 따라 율 왜곡 측면에서 상당한 성능 저하가 있을 수 있으며. 적정 경계치는 영상마다 각각 다르다. 이에 본 논문에서는 영상의 특성에 따라 경계치가 설정되는 적응적 HDA 방법을 제안한다. 제안 방법은 적정 율 왜곡 성능을 유지하며, 채널 복호화 과정 및 WZ 복호화 과정에서 각각 약 62%, 32%의 시간 절감 성능을 보인다.

GALS 시스템에서의 저비용 데이터 전송을 위한 QDI모델 기반 인코더/디코더 회로 설계 (Design of QDI Model Based Encoder/Decoder Circuits for Low Delay-Power Product Data Transfers in GALS Systems)

  • 오명훈
    • 대한전자공학회논문지SD
    • /
    • 제43권1호
    • /
    • pp.27-36
    • /
    • 2006
  • 기존의 지연 무관 (Delay-Insensitive(DI)) 데이터 인코딩 방식은 N 비트 데이터 전송에 물리적으로 2N+1 개의 도선이 필요하다. GALS(Globally Asynchronous Locally Synchronous) 시스템과 같은 대규모 칩 설계 시에 많은 도선 수로 인해 발생할 수 있는 전력 소모와 설계 복잡성을 줄이기 위해, 의사지연 무관 (Quasi D디ay-Insensitive(QDI)) 모델에 기반하고, N+1 개의 도선으로 N 비트 데이터를 전송할 수 있는 인코더와 디코더 회로를 설계한다. 이 회로들은 전류모드 다치 논리 회로(Current-Mode Multiple Valued Logic(CMMVL))를 사용하여 설계되었으며, 도선수를 줄임으로써 파생되는 효율성을 검증하기 위해 0.25 um CMOS 공정에서 기존의 DI 인코딩 방식인 dual-rail 방식 및 1-of-4 방식과 delay-power product ($D{\ast}P$) 값 측면에서 비교하였다. HSPICE를 통한 모의실험 결과 4 mm 이상의 도선의 길이에서, dual-rail 방식과는 5 MHz의 data rate 이상에서, 1-of-4 방식과는 18 MHz의 data rate 이상에서 제안된 CMML 방식이 유리하였다. 또한, 긴 도선에 버퍼를 장착한 dual-rail 방식, 1-of-4방식과의 비교에서도 개선된 CMMVL 방식이 10 mm 도선, 32 비트 데이터 전송에서 각각 4 MHz, 25 MHz data rate 이상에서 최대 $57.7\%$$17.9\%$$D{\ast}P$ 값 감소 효과를 나타냈다.

캡슐형 무선 내시경의 양방향 통신을 위한 CPLD 기반의 제어기 설계 및 구현 (CPLD-based Controller for Bi-directional Communication in a Capsule Endoscope)

  • 이정현;문연관;박희준;원철호;이승하;최현철;조진호
    • 대한의용생체공학회:의공학회지
    • /
    • 제25권6호
    • /
    • pp.447-453
    • /
    • 2004
  • 사람의 장속에서 영상을 획득하여 이를 체외로 전송하는 무선 내시경과 같은 초소형 텔레메트리 캡슐에서는 캡슐의 크기와 전원 공급에 많은 제약을 받는다. 캡슐을 삼킬 수 있는 크기로 제작하기 위해서는 소형의 건전지를 사용하여 캡슐이 소화관 내를 조사하는 동안 안정적인 전원 공급이 이루어지도록 해야 한다. 이를 위해서는 양방향 통신을 이용한 캡슐의 동작 및 전원 제어가 필수적이다. 본 연구에서는 캡슐형 내시경에서의 양방향 통신을 위한 CPLD (complex programmable logic device) 기반의 제어기를 설계 및 구현하였다. 캡슐 제어기는 체외의 제어기로부터 제어 명령을 전달받아 이를 수행하며 제어 동작의 수행 결과로 장내부의 영상을 획득하여 체외로 전송한다. 설계한 제어기를 컴퓨터 모의실험을 통해 설계사양을 검증하고 이를 CPLD로 구현하였다. 구현한 제어기를 캡슐형 무선 내시경에 탑재하여 동물실험을 수행하였으며 동물 실험 결과 실험 대상 동물의 체내에서 캡슐의 동작과 전원을 제어 할수 있었으며 동작제어의 결과로 장내부의 영상을 획득하여 이를 복원 할 수 있었다.

딥러닝을 이용한 화강암 X-ray CT 영상에서의 균열 검출에 관한 연구 (Pixel-level Crack Detection in X-ray Computed Tomography Image of Granite using Deep Learning)

  • 현석환;이준성;전성환;김예진;김광염;윤태섭
    • 터널과지하공간
    • /
    • 제29권3호
    • /
    • pp.184-196
    • /
    • 2019
  • 본 연구에서는 화강암 시편에서 수압 파쇄법에 의해 생성된 미세균열의 3차원 형상을 X-ray CT 영상과 딥러닝을 이용하여 추출하였다. 실험으로 생성된 미세균열은 X-ray CT 영상 상에서 일반적인 영상처리방법으로는 추출하기 매우 어렵고 육안으로만 관찰이 가능한 형태를 지닌다. 하지만 본 연구에서 제안한 합성곱 신경망(Convolutional neural network) 기반 인코더-디코더(Encoder-Decoder) 구조의 딥러닝 모델을 통해 미세균열을 정량적으로 추출할 수 있었다. 특히 픽셀 단위의 미세균열 추출을 위해 인코딩 과정에서 소실되는 정보를 디코딩 과정으로 직접 전달하는 디코더 모델을 제안하였다. 또한, 딥러닝 기반 신경망 학습에 필요한 데이터의 수를 증가시키기 위해 이미지의 분할(Division), 회전(Rotation), 그리고 반전(Flipping) 등으로 데이터를 생성하는 영상 증대 방법을 적용하였으며 이때 최적의 조합을 확인하였다. 최적의 영상 학습 데이터 증대 방법을 적용하였을 때 검증 데이터뿐만 아니라 테스트 데이터에서의 성능 향상을 확인하였다. 학습 데이터의 원본 개수가 딥러닝 기반 신경망의 균열 추출 성능에 미치는 영향을 확인하고 딥러닝 기술을 사용하여 성공적으로 미세균열을 추출하였다.

어텐션 기반 엔드투엔드 음성인식 시각화 분석 (Visual analysis of attention-based end-to-end speech recognition)

  • 임성민;구자현;김회린
    • 말소리와 음성과학
    • /
    • 제11권1호
    • /
    • pp.41-49
    • /
    • 2019
  • 전통적인 음성인식 모델은 주로 음향 모델과 언어 모델을 사용하여 구현된다. 이때 음향 모델을 학습시키기 위해서는 음성 데이터에 대한 정답 텍스트뿐만 아니라 음성인식에 사용되는 단어의 발음사전과 프레임 단위의 음소 정답 데이터가 필요하다. 이 때문에 모델을 훈련하기 위해서는 먼저 프레임 단위의 정답을 생성하는 등의 여러 과정이 필요하다. 그리고 음향 모델과 별도의 텍스트 데이터로 훈련한 언어 모델을 적용하여야 한다. 이러한 불편함을 해결하기 위하여 최근에는 하나의 통합 신경망 모델로 이루어진 종단간(end-to-end) 음성인식 모델이 연구되고 있다. 이 모델은 훈련에 여러 과정이 필요없고 모델의 구조를 이해하기 쉽다는 장점이 있다. 하지만 인식이 내부적으로 어떤 과정을 거쳐 이루어지는지 알기 어렵다는 문제가 있다. 본 논문에서는 어텐션 기반 종단간 모델을 시각화 분석하여 내부적인 작동 원리를 이해하고자 하였다. 이를 위하여 BLSTM-HMM 하이브리드 음성인식 모델의 음향 모델과 종단간 음성인식 모델의 인코더를 비교하고, 신경망 레이어 별로 어떠한 차이가 있는지 분석하기 위해 t-SNE를 사용하여 시각화하였다. 그 결과로 음향모델과 종단간 모델 인코더의 차이점을 알 수 있었다. 또한 종단간 음성인식 모델의 디코더의 역할을 언어모델 관점에서 분석하고, 종단간 모델 디코더의 개선이 성능 향상을 위해 필수적임을 알 수 있었다.

양방향 예측 모드를 위한 저복잡도 LIC 방법 연구 (Low-complexity Local Illuminance Compensation for Bi-prediction mode)

  • 최한솔;변주형;방건;심동규
    • 방송공학회논문지
    • /
    • 제24권3호
    • /
    • pp.463-471
    • /
    • 2019
  • 본 논문에서는 양방향 화면 간 예측에서 LIC(Local Illuminance Compensation)의 복잡도 감소를 위한 방법을 제안한다. LIC는 화면 간 예측의 정확도를 높이기 위해 현재 블록과 참조블록의 주변 복원샘플을 이용하여 지역 조명 보상을 수행한다. 지역 조명 보상을 위해 필요한 가중치와 오프셋을 주변 복원 샘플을 이용하여 부/복호화기 양측에서 계산하기 때문에 별도의 정보 전송 없이 부호화 효율이 향상되는 장점이 있지만 부호화 예측 단계 및 복호화 단계에서 가중치와 오프셋을 구하기 때문에 부/복호화 복잡도가 높아지는 단점을 가지게 된다. 따라서 본 논문에서는 저 복잡도 LIC를 위해 크게 두 가지 방법을 제안한다. 첫 번째 방법은 양방향 예측 시 가중치 없이 오프셋만으로 조명보상을 적용하는 방법이고, 두 번째는 양방향 예측에서 LIC를 양방향예측을 통해 구해진 참조 블록의 가중 평균 단계 이후 적용하는 방법이다. 제안하는 방법의 성능 평가를 위하여 RA(Random Access) 조건에서 MPEG 표준 실험 영상의 B, C, D 클래스를 이용하여 BMS-2.0.1과 BD-rate 성능을 비교한다. 실험결과로서 본 논문에서 제안하는 방법이 BMS-2.0.1 대비 BD-rate 성능 관점에서 Y, U, V 각각에 대하여 평균 0.29%, 0.23%, 0.04%의 BD-rate 결과를 보이고 부/복호화 시간은 거의 동일하다. BD-rate의 손실이 있었지만, LIC 파라미터 유도과정에서 곱셈 연산이 제거되고 덧셈 연산이 절반으로 감소됨에 따라 LIC의 계산 복잡도가 크게 감소되었다.

스택-포인터 네트워크와 부분 트리 정보를 이용한 한국어 의존 구문 분석 (Korean Dependency Parsing Using Stack-Pointer Networks and Subtree Information)

  • 최용석;이공주
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제10권6호
    • /
    • pp.235-242
    • /
    • 2021
  • 본 연구에서는 포인터 네트워크 모델을 의존 구문 분석에 맞게 확장한 스택-포인터 네트워크 모델을 이용하여 한국어 의존 구문 분석기를 구현한다. 스택-포인터 네트워크 모델 기반 의존 구문 분석기는 인코더-디코더로 구성되어 있으며 다른 의존 구문 분석기와 달리 내부 스택을 갖고 있어 루트부터 시작하는 하향식 구문 분석이 가능하다. 디코더의 각 단계에서는 의존소를 찾기 위해 부모 노드뿐만 아니라 이미 파생된 트리 구조에서 조부모와 형제 노드를 참조할 수 있다. 기존 연구에서는 단순하게 해당 노드들의 합을 계산하여 입력으로 사용하였고, 형제 노드의 경우에는 가장 최근에 방문했던 것만을 사용할 수 있었다. 본 연구에서는 그래프 어텐션 네트워크를 도입하여 이미 파생된 부분 트리를 표현하고 이를 스택-포인터 네트워크의 입력으로 사용하도록 구문 분석기를 수정한다. 세종 코퍼스와 모두의 코퍼스를 대상을 실험한 결과 레이어 2의 그래프 어텐션 네트워크를 이용하여 부분 트리를 표현했을 때 특히 문장 단위의 구문 분석 정확도에서 많은 성능 향상을 확인할 수 있었다.

RapidEye 위성영상과 Semantic Segmentation 기반 딥러닝 모델을 이용한 토지피복분류의 정확도 평가 (Accuracy Assessment of Land-Use Land-Cover Classification Using Semantic Segmentation-Based Deep Learning Model and RapidEye Imagery)

  • 심우담;임종수;이정수
    • 대한원격탐사학회지
    • /
    • 제39권3호
    • /
    • pp.269-282
    • /
    • 2023
  • 본 연구는 딥러닝 모델(deep learning model)을 활용하여 토지피복분류를 수행하였으며 입력 이미지의 크기, Stride 적용 등 데이터세트(dataset)의 조절을 통해 토지피복분류를 위한 최적의 딥러닝 모델 선정을 목적으로 하였다. 적용한 딥러닝 모델은 3종류로 Encoder-Decoder 구조를 가진 U-net과 DeeplabV3+, 두 가지 모델을 결합한 앙상블(Ensemble) 모델을 활용하였다. 데이터세트는 RapidEye 위성영상을 입력영상으로, 라벨(label) 이미지는 Intergovernmental Panel on Climate Change 토지이용의 6가지 범주에 따라 구축한 Raster 이미지를 참값으로 활용하였다. 딥러닝 모델의 정확도 향상을 위해 데이터세트의 질적 향상 문제에 대해 주목하였으며 딥러닝 모델(U-net, DeeplabV3+, Ensemble), 입력 이미지 크기(64 × 64 pixel, 256 × 256 pixel), Stride 적용(50%, 100%) 조합을 통해 12가지 토지피복도를 구축하였다. 라벨 이미지와 딥러닝 모델 기반의 토지피복도의 정합성 평가결과, U-net과 DeeplabV3+ 모델의 전체 정확도는 각각 최대 약 87.9%와 89.8%, kappa 계수는 모두 약 72% 이상으로 높은 정확도를 보였으며, 64 × 64 pixel 크기의 데이터세트를 활용한 U-net 모델의 정확도가 가장 높았다. 또한 딥러닝 모델에 앙상블 및 Stride를 적용한 결과, 최대 약 3% 정확도가 상승하였으며 Semantic Segmentation 기반 딥러닝 모델의 단점인 경계간의 불일치가 개선됨을 확인하였다.