• Title/Summary/Keyword: 데이터 합성

Search Result 1,378, Processing Time 0.032 seconds

Plant leaf area estimation using synthetic dataset and deep learning model (합성 데이터셋과 딥러닝 모델을 이용한 식물 엽면적 추정)

  • Suh, Hyun Kwon;Ahn, Juyeon;Park, Hyeonji
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2022.06a
    • /
    • pp.90-92
    • /
    • 2022
  • 이 논문에서는 합성된 애기장대 데이터셋을 활용하여 딸기의 엽면적을 추정할 수 있는 딥러닝 모델을 제안한다. 제안된 모델에서는 개별 잎 검출을 위하여 합성 데이터셋으로 학습된 Mask R-CNN 의 객체 검출 모델을 사용하였고, 이어 이미지 후처리 작업에 해당되는 모폴로지 연산의 침식 및 팽창, 픽셀 카운터를 통해 엽면적을 추정하였다. 각기 다른 역할을 수행하는 신경망 계층에 어텐션 메커니즘 적용하여 검출 성능의 향상과 검출 시간을 단축하였다. 제안된 모델은 딸기 데이터셋을 사용하지 않는 합성된 데이터셋만으로도 실제 온실에서 획득한 다양한 이미지에서의 딸기 엽면적을 추정하는 데에 우수한 성능을 보여준다.

  • PDF

Design of the Linguistic Contents of Speech Corpus for Speech Recognition and Synthesis (인식 및 합성용 음성 코퍼스의 발성 목록 설계)

  • 김형주;김봉완;이용주
    • Proceedings of the Korea Multimedia Society Conference
    • /
    • 2002.05c
    • /
    • pp.330-335
    • /
    • 2002
  • 최근 컴퓨터와 인간간의 대화 수단으로 음성을 활용하는 기술인 음성정보기술이 발달함에 따라 대어휘 연속 음성 인식 및 무제한 어휘 음성 합성의 고도화를 위한 연구가 진행되고 있다. 음성 인식의 경우 HMM으로 대표되는 통계적 수법의 발달에 따라 시스템의 학습을 위해 대량의 음성데이터가 필요하며, 음성 합성의 경우에도 최근 대형의 음성 데이터 베이스로부터 임의 길이의 음성 부분을 골라내어 접속함으로써 좋은 합성 품질을 얻고 있다. 본 논문에서는 이러한 음성 인식 및 합성을 위해 공동으로 사용하기 위한 음성 데이터베이스의 발성 목록을 설계하고 설계된 결과에 대하여 논의한다.

  • PDF

Efficient Cloth Modeling Using Boundary CNN based Image Super-Resolution Method (효율적인 옷감 모델링을 위한 경계 합성곱 신경망 기반의 이미지 슈퍼 해상도 기법)

  • Kim, Jong-Hyun;Kim, Donghui
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2020.07a
    • /
    • pp.425-428
    • /
    • 2020
  • 본 논문에서는 경계 합성곱 신경망(Convolutional neural network, CNN)기반의 슈퍼 해상도 기법을 이용하여 저해상도 옷감 메쉬를 슈퍼 해상도로 노이즈 없이 안정적으로 표현할 수 있는 기법을 제안한다. 저해상도와 고해상도 메쉬들 간의 쌍은 옷감 시뮬레이션을 통해 얻을 수 있으며, 이렇게 얻어진 데이터를 이용하여 고해상도-저해상도 데이터 쌍을 설정한다. 학습할 때 사용되는 데이터는 옷감 메쉬를 지오메트리 이미지로 변환하여 사용한다. 우리가 제안하는 경계 합성곱 신경망은 저해상도 이미지를 고해상도 이미지로 업스케일링 시키는 이미지 합성기를 학습시키기 위해 사용된다. 테스트 결과로 얻어진 고해상도 이미지가 고해상도 메쉬로 다시 변환되면, 저해상도 메쉬에 비해 주름이 잘 표현되며, 경계 부근에서 나타나는 노이즈 문제가 완화된다. 합성 결과에 대한 성능으로는 전통적인 물리 기반 시뮬레이션보다 약 10배 정도 빠른 성능을 보여준다.

  • PDF

Entity Embeddings for Enhancing Feasible and Diverse Population Synthesis in a Deep Generative Models (심층 생성모델 기반 합성인구 생성 성능 향상을 위한 개체 임베딩 분석연구)

  • Donghyun Kwon;Taeho Oh;Seungmo Yoo;Heechan Kang
    • The Journal of The Korea Institute of Intelligent Transport Systems
    • /
    • v.22 no.6
    • /
    • pp.17-31
    • /
    • 2023
  • An activity-based model requires detailed population information to model individual travel behavior in a disaggregated manner. The recent innovative approach developed deep generative models with novel regularization terms that improves fidelity and diversity for population synthesis. Since the method relies on measuring the distance between distribution boundaries of the sample data and the generated sample, it is crucial to obtain well-defined continuous representation from the discretized dataset. Therefore, we propose an improved entity embedding models to enhance the performance of the regularization terms, which indirectly supports the synthesis in terms of feasible and diverse populations. Our results show a 28.87% improvement in the F1 score compared to the baseline method.

A Automated Method for Training Keyword Spotter based on Speech Synthesis (키워드 음성인식을 위한 음성합성 기반 자동 학습 기법)

  • Lim, Jaebong;Lee, Jongsoo;Cho, Yonghun;Baek, Yunju
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2021.05a
    • /
    • pp.494-496
    • /
    • 2021
  • 최근 경량 딥러닝 기반 키워드 음성인식은 가전, 완구, 키오스크 등 다양한 응용에 음성 인터페이스를 쉽게 적용할 수 있는 기술로서 주목받고 있다. 키워드 음성인식은 일부 키워드만 인식 가능한 음성인식 기술로서 저성능 디바이스에서 활용 가능한 장점이 있다. 그러나 응용에 따라 필요한 키워드에 대하여 다시 음성데이터를 수집해야하고 이를 학습하여 모델을 새로 준비해야하는 단점이 있다. 따라서 본 연구에서는 음성데이터 수집 없이 음성합성을 통해 생성한 음성으로만 키워드 음성인식 모델을 학습하는 음성합성 기반 자동 학습 기법을 제안하였다. 생성한 음성데이터를 활용하고자하는 시도가 활발히 이루어지고 있으나, 기존 연구에서는 정확도를 유지하기 위하여 수집한 실제 음성데이터가 필요한 한계가 있다. 제안한 자동 학습 기법은 생성한 음성데이터에 대해 복합 데이터 증대 기법을 적용하여 실제 음성데이터 없이 키워드 음성인식의 정확도를 높였다. 제안한 기법에 대하여 상용 음성합성 서비스를 기반으로 수집한 한국어 키워드 데이터세트를 활용하여 성능평가를 진행하였다. 20개 한국어 키워드에 대해 실험한 결과, 제안한 기법을 적용하여 학습시킨 키워드 음성인식 모델의 정확도는 86.44%임을 확인하였다.

A Statistical Methodology Study for Measuring Privacy Disclosure Riskin Open Data Environment (오픈 데이터 환경에서 개인정보 노출 위험 측정을 위한 통계적 방법론 연구)

  • Sieun Kim;Ieck-chae Euom
    • Journal of the Korea Institute of Information Security & Cryptology
    • /
    • v.34 no.2
    • /
    • pp.323-333
    • /
    • 2024
  • Recently, Syntheic data has been in the spotlight as a technology that can protect personal information while maintaining the patterns and characteristics of actual data. Accordingly, technical and institutional research on synthetic data is actively being conducted, but it is difficult to actively use synthetic data due to the lack of clear standards and guidelines. This study is a preliminary study for quantifying the disclosure risk of synthetic data, and derives a privacy disclosure risk index through statistical methodology and suggests specific application measures to comply with the General Data Protection Regulation(GDPR). It is expected that the disclosure risk and the balance of data utility can be controlled through the privacy disclosure risk index of this study in an open data environment.

A Study on the MRC and EGC in Nakagami-m Fading Channel (나까카미-m 페이딩 채널에서 최대비합성과 동이득합성에 관한 연구)

  • Lee, Kwan-Houng;Lee, Myung-Ho
    • Journal of the Korea Society of Computer and Information
    • /
    • v.11 no.5 s.43
    • /
    • pp.195-201
    • /
    • 2006
  • In multicarrier code division multiple access(MC-CDMA), the total system bandwidth is divided into a number of sub-bands, where each subband may use direct-sequence(DS) spreading and each subband signal is transmitted using a subcarrier frequency. In this paper, the system performance analysis of MC-CDMA using to gain combining(EGC) and maximal ratio combining(MRC) method over frequency selective Nakagami-m fading channel is analyzed. In the proposed system, a data sequence is serial-to-parallel converted, and MC-CDMA is used on each of the parallel data streams. The data streams are spread at both the symbol fraction level and at the chip level by the transmitter. In this paper, the compare to analysis,two standard diversity combining techniques, EGC and MRC, The good performance of system using to MRC more than EGC

  • PDF

Bio-signal Data Augumentation Technique for CNN based Human Activity Recognition (CNN 기반 인간 동작 인식을 위한 생체신호 데이터의 증강 기법)

  • Gerelbat BatGerel;Chun-Ki Kwon
    • Journal of the Institute of Convergence Signal Processing
    • /
    • v.24 no.2
    • /
    • pp.90-96
    • /
    • 2023
  • Securing large amounts of training data in deep learning neural networks, including convolutional neural networks, is of importance for avoiding overfitting phenomenon or for the excellent performance. However, securing labeled training data in deep learning neural networks is very limited in reality. To overcome this, several augmentation methods have been proposed in the literature to generate an additional large amount of training data through transformation or manipulation of the already acquired traing data. However, unlike training data such as images and texts, it is barely to find an augmentation method in the literature that additionally generates bio-signal training data for convolutional neural network based human activity recognition. Thus, this study proposes a simple but effective augmentation method of bio-signal training data for convolutional neural network based human activity recognition. The usefulness of the proposed augmentation method is validated by showing that human activity is recognized with high accuracy by convolutional neural network trained with its augmented bio-signal training data.

Texture Synthesis Framework via Artificial Neural Networks for Generating Realistic Foam Pattern Textures (사실적인 거품 패턴 텍스처를 생성하기 위한 인공신경망 기반의 텍스처 합성 프레임워크)

  • Yeon Hee Choo;Jong-Hyun Kim
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2024.01a
    • /
    • pp.399-401
    • /
    • 2024
  • 본 논문에서는 텍스처 합성 기술을 활용하여 가상의 거품 패턴 텍스처를 생성하기 위한 합성 데이터 구축 방법을 소개한다. 물리 기반 유체 시뮬레이션에서 거품 표현은 2차 효과(Secondary effects)로 분류되며, 그만큼 계산량이 큰 작업이다. 게임 업계에서는 저사양 디바이스에서도 실시간으로 게임이 실행되어야 하므로 상대적으로 계산량이 큰 물리 기반 시뮬레이션을 통해 거품을 표현하기 어렵다. 대부분 사용자가 임의로 그린 거품 패턴을 화면에 매핑하여 적은 계산량을 통해 거품을 표현하지만, 시뮬레이션을 통해 만들어진 데이터가 아니기 때문에 품질을 보장하기 어렵다. 본 논문에서는 물리 기반 시뮬레이션을 통해 만들어진 거품 패턴을 텍스처 합성 기술을 통해 재생산(Reproduction)함으로써 수작업으로 그린 거품 패턴에서는 표현하기 어려운 고품질 거품 패턴 텍스처를 만들어 낸다.

  • PDF

3D Road Shape Production Technique Using Composition of Laser Data and CCD Image (레이저 데이터와 CCD영상의 합성을 통한 3차원 도로형상 생성기법)

  • Rhee Soo-Ahm;Kim Tae-Jung;Jeong Dong-Hoon;Sung Jung-Gon
    • Proceedings of the KSRS Conference
    • /
    • 2006.03a
    • /
    • pp.15-18
    • /
    • 2006
  • 도로의 정보를 취득하기 위하여 제작된 도로 안정성 조사 분석 차량(RoSSAV)은 도로의 3차원 정보를 취득하는 한 방법으로 레이저 스캐너를 사용한다. 레이저 스캐너로부터 취득된 도로의 3차원 정보는 많은 목적으로 활용할 수 있는 매우 유용한 정보이나, 도로의 3차원 정보를 사용자가 육안으로 확인할 수 있도록 영상으로 편집을 하게 되면, 현실감 있는 영상이 생성되기는 어렵다. 이를 보완하기 위하여 본 연구에서는 레이저 스캐너로부터 얻은 정보와는 별도로 CCD 카메라로 도로 전방 영상을 촬영하였고, 이 두 가지 데이터를 합성하여 현실감 있는 3차원 도로영상을 생성하는 기법을 연구 개발하였다. 레이더 영상과 CCD 영상의 합성은 레이저 데이터가 가지고 있는 3차원의 위치에 해당하는 CCD영상에서의 영상점을 찾아 이 점에서의 RGB 밴드의 밝기값을 찾아내어 이를 레이저 데이터에 기록, 적용시키는 것을 의미한다. 이 방법을 사용하기 위해서는 영상간의 관계모델을 수립할 필요가 있으며, 본 연구에서는 직접선형변환(DLT) 모델을 사용하였다. 이 모델을 이용하기 위해 레이저 데이터를 영상으로 편집하였고 이 영상과 CCD영상과 일치하는 지점을 육안으로 찾아 각 영상별로 DLT센서모델에 필요한 개수의 기준점을 제작하여 실행하였다. 실험 결과 영상은 기준점의 정확도에 따라 약간의 차이는 있으나 합성 전의 레이저 데이터 영상에 비해 실세계에 가까운 색깔을 나타냄이 확인되었다.

  • PDF