• 제목/요약/키워드: 전자/처리세트

검색결과 39건 처리시간 0.025초

Residual Multi-Dilated Recurrent Convolutional U-Net을 이용한 전자동 심장 분할 모델 분석 (Fully Automatic Heart Segmentation Model Analysis Using Residual Multi-Dilated Recurrent Convolutional U-Net)

  • 임상헌;이명숙
    • 정보처리학회논문지:컴퓨터 및 통신 시스템
    • /
    • 제9권2호
    • /
    • pp.37-44
    • /
    • 2020
  • 본 논문에서는 딥 러닝 기반의 전-자동 심장 분할 알고리즘을 제안한다. 본 논문에서 제안하는 딥 러닝 모델은 기존 U-Net에 residual recurrent convolutional block과 residual multi-dilated convolutional block을 삽입하여 성능을 개선한 모델이다. 모델의 성능은 테스트 데이터 세트를 전-자동 분할한 결과와 영상의학 전문가의 수동 분할 결과를 비교하여 분석하였다. CT 영상에서 평균 96.88%의 DSC, 95.60%의 precision과 97.00%의 recall 결과를 얻었다. 분할된 영상은 3차원 볼륨 렌더링 기법을 적용하여 시각화한 후 관찰하여 분석할 수 있었다. 실험 결과를 통해 제안된 알고리즘이 다양한 심장 하부 구조를 분할하기에 효과적인 것을 알 수 있었다. 본 논문에서 제안하는 알고리즘이 전문의 또는 방사선사의 임상적 보조역할을 수행할 수 있을 것으로 기대한다.

비디오 데이터 세트의 하이퍼 사각형 표현에 기초한 비디오 유사성 검색 알고리즘 (Similarity Search Algorithm Based on Hyper-Rectangular Representation of Video Data Sets)

  • 이석룡
    • 정보처리학회논문지D
    • /
    • 제11D권4호
    • /
    • pp.823-834
    • /
    • 2004
  • 이 연구에서는 대용량 비디오 데이터 스트림에 대한 유사성 검색 알고리즘을 제시한다. 수많은 프레임으로 이루어진 비디오 스트림은 각 프레임을 다차원 벡터(multidimensional vector)로 나타냄으로써 다차원 데이터 공간 상에서 시퀸스로 나타낼 수 있다. 이 시퀸스의 특성을 분석 함으로써 각 시퀸스를 비디오 세그먼트(video segment)와 이 세그먼트의 집합인 비디오 클러스터(video cluster)로 표현한다. 본 연구에서는 이러한 비디오 세그먼트와 클러스터를 사용하여 두 비디오 스트림 사이의 유사성 함수(similarity function)를 제시하고, 이 함수에 근거하여 비디오 세그먼트의 하이퍼 사각형과 대표 프레임에 기초한 두 가지의 유사성 검색 알고리즘을 제안한다. 전자는 정해성(correctness)을 보장하는 알고리즘이며, 후자는 정해성을 약간 희생하는 대신 상당한 효율성을 얻을 수 있는 알고리즘이다. 다양한 유형의 비디오 스트림 및 가상으로 생성된 스트림 데이터에 대한 실험을 통하여 제시한 알고리즘의 성능을 분석한다.

구조화된 자연어 요구사항으로부터 테스트 케이스 및 스크립트 생성 (Generating Test Cases and Scripts from Requirements in Controlled Language)

  • 한혜진;정기현;최경희
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제8권8호
    • /
    • pp.331-342
    • /
    • 2019
  • 본 논문은 신뢰성 있는 임베디드 시스템 소프트웨어 개발을 위해 제한된 자연어 형식으로 작성된 소프트웨어 요구사항으로부터 테스트 케이스 및 테스트 스크립트를 생성하는 방안을 제안한다. 제안하는 방법에서는 자연어로 기술된 요구사항을 제한된 자연어 형식으로 작성하고, 이를 파싱하여 테스트에 사용되는 입력, 출력 및 연산자를 추출한다. 추출된 정보를 이용하여 Decision Coverage, Condition Coverage, Modified Condition/Decision Coverage와 같은 테스트 케이스 생성 전략을 적용하여 테스트 케이스를 생성한다. 또한 테스트 명령어 사전을 이용하여 임베디드 시스템의 물리적인 입력 값인 테스트 스크립트를 생성한다. 제안한 방법을 이용하면, 개발된 소프트웨어가 요구사항에 적합하게 개발되었는지를 직접적으로 테스트하는 것이 가능하다. 제안한 방법의 효과는 요구사항 세트에 적용하여 실험적으로 보인다.

시각적 어텐션을 활용한 입술과 목소리의 동기화 연구 (Lip and Voice Synchronization Using Visual Attention)

  • 윤동련;조현중
    • 정보처리학회 논문지
    • /
    • 제13권4호
    • /
    • pp.166-173
    • /
    • 2024
  • 본 연구에서는 얼굴 동영상에서 입술의 움직임과 음성 간의 동기화 탐지 방법을 제안한다. 기존의 연구에서는 얼굴 탐지 기술로 얼굴 영역의 바운딩 박스를 도출하고, 박스의 하단 절반 영역을 시각 인코더의 입력으로 사용하여 입술-음성 동기화 탐지에 필요한 시각적인 특징을 추출하였다. 본 연구에서는 입술-음성 동기화 탐지 모델이 음성 정보의 발화 영역인 입술에 더 집중할 수 있도록 사전 학습된 시각적 Attention 기반의 인코더 도입을 제안한다. 이를 위해 음성 정보 없이 시각적 정보만으로 발화하는 말을 예측하는 독순술(Lip-Reading)에서 사용된 Visual Transformer Pooling(VTP) 모듈을 인코더로 채택했다. 그리고, 제안 방법이 학습 파라미터 수가 적음에도 불구하고 LRS2 데이터 세트에서 다섯 프레임 기준으로 94.5% 정확도를 보임으로써 최근 모델인 VocaList를 능가하는 것을 실험적으로 증명하였다. 또, 제안 방법은 학습에 사용되지 않은 Acappella 데이터셋에서도 VocaList 모델보다 8% 가량의 성능 향상이 있음을 확인하였다.

HD 해상도에서 실시간 구동이 가능한 딥러닝 기반 블러 제거 알고리즘 (A Deep Learning-based Real-time Deblurring Algorithm on HD Resolution)

  • 심규진;고강욱;윤성준;하남구;이민석;장현성;권구용;김은준;김창익
    • 방송공학회논문지
    • /
    • 제27권1호
    • /
    • pp.3-12
    • /
    • 2022
  • 영상 블러 제거(deblurring)는 피사체의 움직임, 카메라의 흔들림, 초점의 흐림 등으로 인해 촬영 도중 발생한 영상 블러(blur)를 제거하는 것을 목표로 한다. 최근 스마트폰이 보급되며 휴대용 디지털카메라를 들고 다니는 것이 일상인 시대가 오면서 영상 블러 제거 기술은 그 필요성을 점점 더해가고 있다. 기존의 영상 블러 제거 기술들은 전통적인 최적화 기법을 활용하여 연구되어 오다가 최근에는 딥러닝이 주목받으며 합성곱 신경망 기반의 블러 제거 방법들이 활발하게 제안되고 있다. 하지만 많은 방법들이 성능에 먼저 초점을 맞추어 개발되어 알고리즘의 속도로 인하여 현실에서 실시간 활용이 어렵다는 문제점을 안고 있다. 이를 해결하고자 본 논문에서는여러 신경망 설계 기법을 활용하여 HD 영상에서도 30 FPS 이상의 실시간 구동이 가능한 딥러닝 기반 블러 제거 알고리즘을 설계하여 이를 제안한다. 또한 학습 및 추론 과정을 개선하여 속도에 별다른 영향 없이 신경망의 성능을 높이고 동시에 성능에 별다른 영향없이 신경망의 속도를 높였다. 이를 통해 최종적으로 1280×720 해상도에서 초당 33.74장의 프레임을 처리하며 실시간 동작이 가능함을 보여주었고 GoPro 데이터 세트를 기준으로 PSNR 29.79, SSIM 0.9287의 속도 대비 우수한 성능을 보여주었다.

교량 구조물 손상탐지를 위한 Open Set Recognition 기반 다중손상 인식 모델 개발 (Development of Open Set Recognition-based Multiple Damage Recognition Model for Bridge Structure Damage Detection)

  • 김영남;조준상;김준경;김문현;김진평
    • 대한토목학회논문집
    • /
    • 제42권1호
    • /
    • pp.117-126
    • /
    • 2022
  • 현재 국내 교량 구조물은 지속적으로 증가 및 대형화되고 있으며 그에 따라 공용된 지 30년 이상 된 노후 교량도 꾸준히 늘어나고 있다. 교량 노후화 문제는 국내뿐 아니라 전 세계적으로도 심각한 사회 문제로 다루어지고 있으며, 기존 인력 위주의 점검 방식은 그 한계점을 드러내고 있다. 최근 들어 딥러닝 기반의 영상처리 알고리즘을 활용한 각종 교량 손상탐지 연구가 이루어지고 있지만 교량 손상 데이터 세트의 한계로 인하여 주로 균열 1종에 국한된 교량 손상탐지 연구가 대부분이고, 이 또한 Close set 분류모델 기반 탐지방식으로서 실제 교량 촬영 영상에 적용했을 시 배경이나 기타 객체 등 학습되지 않은 클래스의 입력 이미지들로 인하여 심각한 오인식 문제가 발생할 수 있다. 본 연구에서는 균열 포함 5종의 교량 손상을 정의 및 데이터 세트를 구축해서 딥러닝 모델로 학습시키고, OpenMax 알고리즘을 적용한 Open set 인식 기반 교량 다중손상 인식 모델을 개발했다. 그리고 학습되지 않은 이미지들을 포함하고 있는 Open set에 대한 분류 및 인식 성능평가를 수행한 후 그 결과를 분석했다.

감정 분류를 이용한 표정 연습 보조 인공지능 (Artificial Intelligence for Assistance of Facial Expression Practice Using Emotion Classification)

  • 김동규;이소화;봉재환
    • 한국전자통신학회논문지
    • /
    • 제17권6호
    • /
    • pp.1137-1144
    • /
    • 2022
  • 본 연구에서는 감정을 표현하기 위한 표정 연습을 보조하는 인공지능을 개발하였다. 개발한 인공지능은 서술형 문장과 표정 이미지로 구성된 멀티모달 입력을 심층신경망에 사용하고 서술형 문장에서 예측되는 감정과 표정 이미지에서 예측되는 감정 사이의 유사도를 계산하여 출력하였다. 사용자는 서술형 문장으로 주어진 상황에 맞게 표정을 연습하고 인공지능은 서술형 문장과 사용자의 표정 사이의 유사도를 수치로 출력하여 피드백한다. 표정 이미지에서 감정을 예측하기 위해 ResNet34 구조를 사용하였으며 FER2013 공공데이터를 이용해 훈련하였다. 자연어인 서술형 문장에서 감정을 예측하기 위해 KoBERT 모델을 전이학습 하였으며 AIHub의 감정 분류를 위한 대화 음성 데이터 세트를 사용해 훈련하였다. 표정 이미지에서 감정을 예측하는 심층신경망은 65% 정확도를 달성하여 사람 수준의 감정 분류 능력을 보여주었다. 서술형 문장에서 감정을 예측하는 심층신경망은 90% 정확도를 달성하였다. 감정표현에 문제가 없는 일반인이 개발한 인공지능을 이용해 표정 연습 실험을 수행하여 개발한 인공지능의 성능을 검증하였다.

VR, AR 시뮬레이션 및 3D Printing을 활용한 어깨와 팔꿈치 수술실습 (VR, AR Simulation and 3D Printing for Shoulder and Elbow Practice)

  • 임원봉;문영래
    • 전자공학회논문지
    • /
    • 제53권12호
    • /
    • pp.175-179
    • /
    • 2016
  • 최근 의료 영상 기술의 발전은 진단, 수술계획, 또는 교육에 도움이 되는 수술 시뮬레이션을 만들어 왔다. 개선된 고화질 영상과 3차원 시각화는 의료 영상 가용성을 향상시키고 수술, 교육 분야에서 더 잘 이용할 수 있게 되었다. 실제 인간의 시각은 입체이다. 따라서, 외과의사의 판단을 통해 2차원 영상을 스테레오로 재구성하여 처리하는 것이 함께 필요하다. 이러한 과정을 줄이기 위해, 3차원 (3D) 이미지가 사용되어 왔다. 3D 영상은 복잡한 상황에서 외과 의사가 매우 짧은 시간에 판단할 수 있도록 3D 시각화를 강화하여 제공한다. 3D 화상 데이터 세트에 기초하여, 가상 내시경 수술 계획, 실시간 상호 작용 가상 의료 시뮬레이션이 가능하게 되었다. 본 논문은 새로운 이미징 기술의 최근 응용 프로그램을 설명하고 이의 기본과 특별히 주목할만한 의료 3D 복원 기술에 관한 것이다. 최근 CT, MR 및 기타 영상 양식의 기술발전은 흥미로운 새로운 솔루션과 어깨 영상의 활용 가능성을 넓혀왔다. 특히, 의료 기기에서 파생 된 3차원 (3D) 이미지는 고급 정보를 제공한다. 이 프레젠테이션은 어깨와 팔꿈치의 수술실습에서 원리, 3D 영상기술의 잠재적 응용가능성, 시뮬레이션, 3D프린팅을 설명한다.

웨이블렛 계수의 효율적인 전송에 따른 가변제로트리코더의 성능개선 (Improvement of Flexible Zerotree Coder by Efficient Transmission of Wavelet Coefficients)

  • 주상현;신재호
    • 전자공학회논문지C
    • /
    • 제36C권9호
    • /
    • pp.76-84
    • /
    • 1999
  • Shaprio가 발표한 EZW에서는 한 대역의 부(父)계수가 유사방향의 인접 고주파대역에 4개의 자(子)계수들과 부자관계를 구성하는 고정트리를 기반으로 한다. 이러한 고정트리는 대역간의 계층적 상관관계를 고찰하는데는 적합할 수 있으나, 4개의 계수가 하나의 $2{\times}2$의 블록단위로 처리되기 때문에 대역내 인접계수들간에 존재하는 공간적 상관관계를 고찰하기에는 부적합하다. 이러한 대역간의 계층적 상관관계와 대역내의 공간적 상관관계의 동시에 고찰하기 위하여 가변트리가 제안되었다. 그러나 가변트리는 웨이블렛 계수들을 표현하는데 있어, 고정트리에 비해 많은 심볼들을 필요로 한다. 반면 심볼당 정보량(entropy)이 낮아지는 결과를 가져오기 때문에 고정트리에 비해 압축성능을 향상시킨다. 본 논문에서는 가변트리로 인한 심볼 수의 증가를 억제하는 두 가지 기법ㅂ을 제안한다. 첫째, 무효계수에 대한 불필요한 스캔을 억제하기 위하여 각각의 유효 부계수에 대하여 유효 자계수의 소유여부를 미리 알려주는 1비트의 탐사비트(probing bit)를 발생시킨다. 둘째, 대역에 따라 필요로 하는 심볼 알파벳이 다르다는데 근거하여 대역별 특성을 고려한 심볼세트를 새로이 정의한다. 이러한 두 가지의 기법에 의하여 발생하는 심볼의 수는 상당히 줄어들게 되고, 출력된 심볼들은 추가 엔트로피코딩을 하지 않고 그대로 전송되더라도 비교적 좋은 압축결과를 가져올 수 있다. 가변트리와 심볼수의 억제기법에 의하여 변형된 EZW 부호화 방식은 적응산술부호화기를 포함한 모드와 포함하지 않은 모드의 두 가지 형태에서 제안된다. 본 논문에서 제안하는 부호화방식은 가변트리와 심볼발생억제 방식을 EZW에 적용시켜 성능향상을 꾀하며, 적용되어진 EZW와의 성능비교를 통하여 이러한 제안방식의 유효성을 점검해 본다.

  • PDF