• 제목/요약/키워드: 합성 데이터

검색결과 1,387건 처리시간 0.031초

모발 슈퍼 해상도를 위한 인공신경망 기반의 머리카락 합성기 (Artificial Neural Networks based Strand Synthesizer for Hair Super-Resolution)

  • 김동희;김종현
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2021년도 제64차 하계학술대회논문집 29권2호
    • /
    • pp.661-662
    • /
    • 2021
  • 본 논문에서는 인공신경망 기반의 슈퍼 해상도(Super-resolution, SR) 기법을 이용하여 저해상도(Low-resolution, LR) 헤어 시뮬레이션을 고해상도(High-resolution, HR)로 노이즈 없이 표현할 수 있는 기법을 제안한다. LR과 HR 머리카락 간의 쌍은 헤어 시뮬레이션을 통해 얻을 수 있으며, 이렇게 얻어진 데이터를 이용하여 HR-LR 데이터 쌍을 설정한다. 학습할 때 사용되는 데이터는 머리카락의 위치를 지오메트리 이미지로 변환하여 사용한다. 우리가 제안하는 헤어 네트워크는 LR 이미지를 HR 이미지로 업스케일링 시키는 이미지 합성기를 위해 사용된다. 테스트 결과로 얻어진 HR 이미지가 HR 머리카락으로 다시 변환되면, 하나의 매핑 함수로 표현하기 어려운 머리카락의 찰랑거리는(Elastic) 움직임을 잘 표현할 수 있다. 합성 결과에 대한 성능으로는 전통적인 물리 기반 시뮬레이션보다 빠른 성능을 보였으며, 복잡한 수치해석을 몰라도 쉽게 실행이 가능하다.

  • PDF

딥러닝 네트워크 압축을 위한 양자화 오프셋의 바이어스 임베딩 기법 (Bias embedding of quantization offset for convolutional network compression)

  • 정진우;김성제;홍민수
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2020년도 추계학술대회
    • /
    • pp.127-128
    • /
    • 2020
  • 본 논문은 딥러닝 네트워크의 압축을 위한 양자화 오프셋의 바이어스 기법을 제안한다. 양자화는 32비트 정밀도를 갖는 가중치와 활성화 데이터를 특정 비트 이하의 정수로 압축한다. 양자화는 원 데이터에 스케일과 오프셋을 더함으로써 수행되므로 오프셋을 위한 합성곱 연산이 추가된다. 본 논문에서는 입력 활성화 데이터의 양자화 오프셋과 가중치의 합성곱의 출력은 바이어스에 임베딩될 수 있음을 보여준다. 이를 통해 추론 과정 중 오프셋의 합성곱 연산을 제거할 수 있다. 실험 결과는 오프셋의 합성곱이 바이어스에 임베딩이 되더라도 영상 분류 정확도에 영향이 거의 없음을 증명한다.

  • PDF

정확한 균열 데이터를 효율적으로 생성하는 벡터와 두께 기반의 데이터 증강 (A Vector and Thickness-Based Data Augmentation that Efficiently Generates Accurate Crack Data)

  • 윤주영;김종현
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2023년도 제67차 동계학술대회논문집 31권1호
    • /
    • pp.377-380
    • /
    • 2023
  • 본 논문에서는 합성곱 신경망(Convolutional Neural Networks, CNN)과 탄성왜곡(Elastic Distortion) 기법을 통한 데이터 증강 기법을 활용하여 학습 데이터를 구축하는 프레임워크를 제안한다. 실제 균열 이미지는 정형화된 형태가 없고 복잡한 패턴을 지니고 있어 구하기 어려울 뿐만 아니라, 데이터를 확보할 때 위험한 상황에 노출될 우려가 있다. 이러한 데이터베이스 구축 문제점을 본 논문에서 제안하는 데이터 증강 기법을 통해 비용적, 시간적 측면에서 효율적으로 해결한다. 세부적으로는 DeepCrack의 데이터를 10배 이상 증가하여 실제 균열의 특징을 반영한 메타 데이터를 생성하여 U-net을 학습하였다. 성능을 검증하기 위해 균열 탐지 연구를 진행한 결과, IoU 정확도가 향상되었음을 확인하였다. 데이터를 증강하지 않았을 경우 잘못 예측(FP)된 경우의 비율이 약 25%였으나, 데이터 증강을 통해 3%까지 감소하였음을 확인하였다.

  • PDF

가변 블록 매칭을 이용한 중간 영상 합성 (Intermediate Image Synthesizing using Variable Block size)

  • 곽지현;김경태
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 2001년도 추계학술발표논문집
    • /
    • pp.137-142
    • /
    • 2001
  • 입체 시점 확장을 위하여 많은 양의 영상 데이터가 필요하다. 그러나 이를 전송하치 위해서는 전송량, 장치 등의 여러 어려움이 존재한다. 이에 소량의 영상 데이터를 보내고 수신 측에서 시점을 확장하는 방법으로 중간 영상 합성이 연구되고 있다. 중간 영상 합성을 위해서는 많은 방법들이 제안되었다 블록 매칭, 화소 기반 매칭, 에페폴라 방식, 옵티컬 플로워 등이 그것이다. 본 고에서는 위의 방법들 중에서 블록 매칭 방법을 기본으로, 블록을 생성하는 과정에서 고정 블록이 아닌 영상의 차분 신호를 이용하여 가변 블록을 생성하게 되며, 좌에서 우나 우에서 좌의 단방향이 아닌 양 방향으로 매칭하는 방법을 제안한다.

  • PDF

다화자 음성 합성 시스템 (Multi speaker speech synthesis system)

  • 이준모;장준혁
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2018년도 춘계학술발표대회
    • /
    • pp.338-339
    • /
    • 2018
  • 본 논문은 스피커 임베딩을 이용한 다화자 음성 합성 시스템을 제안한다. 이 모델은 인공신경망을 기반으로 하는 당일화자 음성 합성 시스템인 타코트론을 기초로 구성된다. [1]. 제안 된 모델은 입력 데이터에 화자 임베딩을 추가 데이터로 항께 넣어주는 간단한 방식으로 구현되며 당일화자 모델에 비해 큰 성능 저하 없이 성공적으로 음성을 생성한다.

자막방송을 위한 잔차 합성곱 순환 신경망 기반 음향 사건 분류 (Residual Convolutional Recurrent Neural Network-Based Sound Event Classification Applicable to Broadcast Captioning Services)

  • 김남균;김홍국;안충현
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2021년도 하계학술대회
    • /
    • pp.26-27
    • /
    • 2021
  • 본 논문에서는 자막방송 제공을 위해 방송콘텐츠를 이해하는 방법으로 잔차 합성곱 순환신경망 기반 음향 사건 분류 기법을 제안한다. 제안된 기법은 잔차 합성곱 신경망과 순환 신경망을 연결한 구조를 갖는다. 신경망의 입력 특징으로는 멜-필터벵크 특징을 활용하고, 잔차 합성곱 신경망은 하나의 스템 블록과 5개의 잔차 합성곱 신경망으로 구성된다. 잔차 합성곱 신경망은 잔차 학습으로 구성된 합성곱 신경망과 기존의 합성곱 신경망 대비 특징맵의 표현 능력 향상을 위해 합성곱 블록 주의 모듈로 구성한다. 추출된 특징맵은 순환 신경망에 연결되고, 최종적으로 음향 사건 종류와 시간정보를 추출하는 완전연결층으로 연결되는 구조를 활용한다. 제안된 모델 훈련을 위해 라벨링되지 않는 데이터 활용이 가능한 평균 교사 모델을 기반으로 훈련하였다. 제안된 모델의 성능평가를 위해 DCASE 2020 챌린지 Task 4 데이터 셋을 활용하였으며, 성능 평가 결과 46.8%의 이벤트 단위의 F1-score를 얻을 수 있었다.

  • PDF

실측데이터를 이용한 빔 영역 합성처리 기법에 관한 연구 (A Study on Synthetic Aperture Technique in Beam Domain using Real Data)

  • 강진석;김기만;강현우;이충용;윤대희;도경철;오원천;조점군
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 2004년도 추계학술발표대회논문집 제23권 2호
    • /
    • pp.455-458
    • /
    • 2004
  • 소나 시스템의 표적 탐지 성능을 향상시키기 위해 물리적으로 제한된 길이의 어레이를 확장하는 합성 어퍼쳐 소나에 대한 연구와 실험이 이루어지고 있다. 본 논문에서는 왜곡된 어레이의 형상을 추정하여 왜곡을 보상한 후에 빔 영역에서 어레이를 합성하는 FFTSA(Fast Fourier Transform Synthetic Aperture) 기법의 성능을 분석하였다. 실험 데이터로는 한국 근해에서 견인 어레이로부터 획득한 데이터를 이용하였으며 실측된 데이터로 부어레이 간의 시-공간적인 위상 차이를 보상함으로써 어레이 길이를 확장하였다.

  • PDF

네트워크-플로우 방법을 기반으로 한 통합적 데이터-경로 합성 알고리즘 (Integrated Data Path Synthesis Algorithm based on Network-Flow Method)

  • 김태환
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제27권12호
    • /
    • pp.981-987
    • /
    • 2000
  • 이 논문은 상위 단계 데이터-경로 합성에서 연산 스케쥴링과 자원 할당 및 배정을 동시에 고려한 통합적 접근 방법을 제시한다. 제안한 방법은 스케쥴링 되어있지 않은 데이터-플로우 그래프에 대해서 수행에 필요한 총 clock 스텝 수와 필요한 회로 면적을 동시에 최소화하는 데이터-경로 생성에 특징이 있다. 일반적으로, 연결선의 결정이 합성의 마지막 단계에서 이루어지는 기존의 방법과는 다르게, 우리의 접근 방법은 연산 스케쥴링과 연산의 연산 모듈 배정 그리고 변수의 레지스터 배정 작업을 동시에 수행하여 추가적인 연결선의 수를 매 clock 스텝마다 최적화(optimal) 시킨다. 본 논문은, 이 문제를 최소-비용의 최대-플로우 문제로 변형하여 minimum cost augmentation 방법으로 polynomial time 안에 해결하는 알고리즘을 제안한다.

  • PDF

화학 구조 문서 합성 데이터셋 제안 및 Mask R-CNN 기반의 화학 구조 인식 (Synthetic Chemical Structure Documentation Dataset Proposal and Mask R-CNN Based Chemical Structure Segmentation)

  • 윤정환;조남익
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2022년도 하계학술대회
    • /
    • pp.1301-1304
    • /
    • 2022
  • 최근 인공지능 신경망에 대한 활발한 연구를 바탕으로 다양한 분야에서의 적용에 대해 많은 시도들이 이루어지고 있다. 이러한 흐름에 맞추어 화학 문서에서 화학 구조를 인식하는 문제 또한 딥러닝을 이용하여 해결하려는 시도들이 생겨나고 있다. 본 논문에서는 화학 문서에서 화학 구조를 인식하는 모델을 학습시키기 위한 합성 데이터셋을 제안하였다. 문서의 구조를 이용하여 정교하게 화학 구조들을 문서에 합성하여 데이터셋을 생성하였고, 이를 최신 딥러닝 모델 중 하나인 Mask R-CNN[7]에 학습시켜 제안한 데이터셋을 이용하여 문서에서 화학 구조를 인식할 수 있음을 보였다.

  • PDF

RGB 3 채널에 대한 컬러 수차가 없는 논호겔 라이트필드 기반 컴퓨터 생성 홀로그램 합성

  • 민다빈;민교식;박재형
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2021년도 추계학술대회
    • /
    • pp.45-48
    • /
    • 2021
  • 본 논문은 RGB 컬러 3 채널에 대해 공유되는 홀로그램 픽셀 피치를 사용하여 3 차원 장면의 라이트 필드 데이터에서 비호겔 기반 컴퓨터 생성 홀로그램(CGH)을 합성하는 방법을 제안한다. 비호겔 기반 CGH 기술은 라이트 필드의 광선 각도를 평면 파면의 공간 주파수로 해석하여 주어진 라이트 필드 데이터에서 임의의 반송파로 연속 파면을 생성한다. 그러나 광선 각도와 공간 주파수 관계는 파장에 따라 달라지므로 라이트 필드 데이터에서 공간 주파수 샘플링 그리드가 달라져서 홀로그램 재구성에서 색 수차가 발생한다. 제안하는 방법은 가장 작은 청색 회절각이 라이트 필드의 시야를 커버하도록 모든 색상 채널에 공통적인 홀로그램 픽셀 피치를 설정한다. 그런 다음 라이트 필드를 파란색 파장의 공간 주파수 범위와 빨간색 파장의 샘플링 간격으로 보간하여 모든 색상 채널에 공통적인 공간 주파수 샘플링 그리드를 설정한다. 공통 홀로그램 픽셀 피치 및 라이트 필드 공간 주파수 샘플링 그리드는 홀로그램 재구성에서 색상 수차 또는 라이트 필드에 포함된 정보 손실 없이 컬러 홀로그램 합성을 보장한다. 제안된 방법은 다양한 테스트와 리얼 3D 장면의 컬러 라이트 필드 데이터를 사용하여 검증되었다.

  • PDF