• 제목/요약/키워드: Pix2pix

검색결과 59건 처리시간 0.018초

옷감 이미지 렌더링을 위한 Pix2Pix 기반의 Normal map 생성 (Normal map generation based on Pix2Pix for rendering fabric image)

  • 남현길;박종일
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2020년도 하계학술대회
    • /
    • pp.257-260
    • /
    • 2020
  • 본 논문은 단일의 옷감 이미지로 가상의 그래픽 렌더링을 위해 Pix2Pix 방법을 이용하여 Normal map 을 생성하는 방법을 제시한다. 구체적으로 단일의 이미지를 이용해서 Normal map 를 생성하기 위해, Color image 와 Normal map 쌍의 training dataset 을 Pix2Pix 방법을 이용해서 학습시킨다 또한, test dataset 의 Color image 를 입력으로 넣어 생성된 Normal map 결과를 확인한다. 그리고 선행연구에서 사용되어오던 U-Net 방식의 방법과 본 논문에서 사용한 Pix2Pix 를 이용한 Normal map 생성 결과를 SSIM(Structural Similarity Index)으로 비교 평가한다. 또한, 생성된 Normal map 을 렌더링하고자 하는 가상 객체의 사이즈에 맞게 사이즈를 조정하여 OpenGL 로 렌더링한 결과를 확인한다. 본 논문을 통해서 단일의 패턴 이미지를 Pix2Pix 로 생성한 Normal map 으로 옷감의 디테일을 사실감 있게 표현할 수 있음을 확인할 수 있었다.

  • PDF

Pix2Pix의 활용성을 위한 학습이미지 전처리 모델연계방안 연구 (A Study on the Image Preprosessing model linkage method for usability of Pix2Pix)

  • 김효관;황원용
    • 한국정보전자통신기술학회논문지
    • /
    • 제15권5호
    • /
    • pp.380-386
    • /
    • 2022
  • 본 논문은 적대적 생성 신경망 기법의 하나인 Pix2Pix를 활용하여 컬러색상을 입히는 경우 학습된 이미지의 빛 반사 정도에 따라 예측결과가 손상되어 나오는 부분에 집중하여 Pix2Pix 모델 적용 전 이미지 전처리 프로세스 및 모델 최적화를 위한 파라미터 테이블을 구성한다. 기존 논문에 나온 Pix2Pix 모델을 활용하여 실생활에 적용하기 위해서는 해상도에 대한 확장성을 고려해야한다. 학습 및 예측결과 이미지 해상도를 키우기 위해서는 동시에 모델의 커널 사이즈 등을 같이 맞춰주는 부분을 수정해줘야 하는데 이부분은 파라미터로 튜닝 가능하도록 설계했다. 또한 본 논문에서는 예측결과가 빛 반사에 의해 손상된 부분만 별도 처리하는 로직을 같이 구성하여 예측결과를 왜곡시키지 않는 전처리 로직을 구성하였다. 따라서 활용성을 개선하기 위하여 Pix2Pix 모델의 학습이미지에 공통적인 빛반사 튜닝 필터를 적용하는 부분과 파라미터 구성부분을 추가하여 모델 정확도를 개선하였다.

R2와 어텐션을 적용한 유넷 기반의 영상 간 변환에 관한 연구 (Image-to-Image Translation Based on U-Net with R2 and Attention)

  • 임소현;전준철
    • 인터넷정보학회논문지
    • /
    • 제21권4호
    • /
    • pp.9-16
    • /
    • 2020
  • 영상 처리 및 컴퓨터 비전 분야에서 하나의 영상을 통해 다른 영상으로 재구성하거나 새로운 영상을 생성하는 문제는 하드웨어의 발전에 따라 꾸준히 주목받고 있다. 그러나 컴퓨터를 통해 생성한 이미지를 사람의 눈으로 바라봤을 때 자연스럽지 않다는 문제 또한 계속해서 대두되고 있다. 최근 딥러닝 분야에 대한 연구가 활발히 진행됨에 따라 이를 활용한 영상 생성 및 개선 문제 또한 활발히 연구되고 있으며 그 중에서도 적대적 생성 신경망(Generative Adversarial Network)이라는 네트워크가 영상 생성 분야에 있어 좋은 결과를 보이고 있다. 적대적 생성 신경망이 제안된 이후 이를 기반으로 하는 다양한 네트워크가 제시됨에 따라 영상 생성 분야에서 더 자연스러운 영상을 생성하는 것이 가능해졌다. 그 중 pix2pix은 조건 적대적 생성 신경망 모델로 다양한 데이터셋에서도 좋은 성능을 보이는 범용적인 네트워크이다. pix2pix는 U-Net을 기반으로 두고 있으나 U-Net을 기반으로 하는 네트워크 중에서는 더 좋은 성능을 보이는 네트워크가 다수 존재한다. 때문에 본 연구에서는 pix2pix의 U-Net에 다양한 네트워크를 적용해 영상을 생성하고 그 결과를 상호 비교 평가한다. 각 네트워크를 통해 생성된 영상을 통해 기존의 U-Net을 사용한 pix2pix 모델보다 어텐션, R2, 어텐션-R2 네트워크를 적용한 pix2pix 모델이 더 좋은 성능을 보이는 것을 확인하고 그 중 가장 성능이 뛰어난 네트워크의 한계점을 향후 연구로 제시한다.

RAPGAN와 RRDB를 이용한 Image-to-Image Translation의 성능 개선 (Performance Improvement of Image-to-Image Translation with RAPGAN and RRDB)

  • 윤동식;곽노윤
    • 사물인터넷융복합논문지
    • /
    • 제9권1호
    • /
    • pp.131-138
    • /
    • 2023
  • 본 논문은 RAPGAN(Relativistic Average Patch GAN)과 RRDB(Residual in Residual Dense Block)을 이용한 Image-to-Image 변환의 성능 개선에 관한 것이다. 본 논문은 Image-to-Image 변환의 일종인 기존의 pix2pix의 결점을 보완하기 위해 세 가지 측면의 기술적 개선을 통한 성능 향상을 도모함에 그 목적이 있다. 첫째, 기존의 pix2pix 생성자와 달리 입력 이미지를 인코딩하는 부분에서 RRDB를 이용함으로써 더욱 더 깊은 학습을 가능하게 한다. 둘째, RAPGAN 기반의 손실함수를 사용해 원본 이미지가 생성된 이미지에 비해 얼마나 진짜 같은지를 예측하기 때문에 이 두 이미지가 모두 적대적 생성 학습에 영향을 미치게 된다. 마지막으로, 생성자를 사전학습시켜 판별자가 조기에 학습되는 것을 억제하도록 조치한다. 제안된 방법에 따르면, FID 측면에서 기존의 pix2pix보다 평균 13% 이상의 우수한 이미지를 생성할 수 있었다.

Pix2Pix의 수용 영역 조절을 통한 전통 고궁 이미지 복원 연구 (A Study on the Restoration of Korean Traditional Palace Image by Adjusting the Receptive Field of Pix2Pix)

  • 황원용;김효관
    • 한국정보전자통신기술학회논문지
    • /
    • 제15권5호
    • /
    • pp.360-366
    • /
    • 2022
  • 본 논문은 흑백 사진으로만 남아 있는 한국의 전통 고궁 사진을 적대적 생성 신경망 기법의 하나인 Pix2Pix를 활용하여 컬러 사진으로 복원하기 위한 학습 모델 구조를 제시한다. Pix2Pix는 합성 이미지를 생성기와 합성 여부를 판정하는 판별기의 학습 모델 조합으로 구성된다. 본 논문은 판별기의 수용 영역을 조절하여 인공지능 모델을 학습하고 그 결과를 고궁 사진이 가지는 특성을 고려하여 분석하는 내용을 다룬다. 기존에 흑백 사진 복원에 사용하는 Pix2Pix의 수용 영역은 주로 고정된 크기로 사용하였으나 이미지의 변화가 다양한 고궁 사진을 복원함에 있어서는 고정된 수용 영역을 일률적으로 적용하기에 적합하지 않다. 본 논문에서는 고궁의 특성을 반영할 수 있는 판별기의 수용 영역을 확인하기 위해 기존의 고정된 수용 영역의 크기를 변화시켜 나타나는 결과를 관찰하였다. 실험은 사전에 준비한 고궁 사진을 기반으로 판별기의 수용 영역을 조정하고 모델의 학습을 진행하였다. 판별기의 수용 영역 변화에 따른 모델의 손실을 측정하고 최종 학습한 학습 모델을 복원 대상 흑백 사진에 대입하여 복원 결과를 확인한다.

Loss of βPix Causes Defects in Early Embryonic Development, and Cell Spreading and Platelet-Derived Growth Factor-Induced Chemotaxis in Mouse Embryonic Fibroblasts

  • Kang, TaeIn;Lee, Seung Joon;Kwon, Younghee;Park, Dongeun
    • Molecules and Cells
    • /
    • 제42권8호
    • /
    • pp.589-596
    • /
    • 2019
  • ${\beta}Pix$ is a guanine nucleotide exchange factor for the Rho family small GTPases, Rac1 and Cdc42. It is known to regulate focal adhesion dynamics and cell migration. However, the in vivo role of ${\beta}Pix$ is currently not well understood. Here, we report the production and characterization of ${\beta}Pix$-KO mice. Loss of ${\beta}Pix$ results in embryonic lethality accompanied by abnormal developmental features, such as incomplete neural tube closure, impaired axial rotation, and failure of allantois-chorion fusion. We also generated ${\beta}Pix$-KO mouse embryonic fibroblasts (MEFs) to examine ${\beta}Pix$ function in mouse fibroblasts. ${\beta}Pix$-KO MEFs exhibit decreased Rac1 activity, and defects in cell spreading and platelet-derived growth factor (PDGF)-induced ruffle formation and chemotaxis. The average size of focal adhesions is increased in ${\beta}Pix$-KO MEFs. Interestingly, ${\beta}Pix$-KO MEFs showed increased motility in random migration and rapid wound healing with elevated levels of MLC2 phosphorylation. Taken together, our data demonstrate that ${\beta}Pix$ plays essential roles in early embryonic development, cell spreading, and cell migration in fibroblasts.

Pix2Pix 모델을 활용한 단일 영상의 깊이맵 추출 (Depth Map Extraction from the Single Image Using Pix2Pix Model)

  • 강수명;이준재
    • 한국멀티미디어학회논문지
    • /
    • 제22권5호
    • /
    • pp.547-557
    • /
    • 2019
  • To extract the depth map from a single image, a number of CNN-based deep learning methods have been performed in recent research. In this study, the GAN structure of Pix2Pix is maintained. this model allows to converge well, because it has the structure of the generator and the discriminator. But the convolution in this model takes a long time to compute. So we change the convolution form in the generator to a depthwise convolution to improve the speed while preserving the result. Thus, the seven down-sizing convolutional hidden layers in the generator U-Net are changed to depthwise convolution. This type of convolution decreases the number of parameters, and also speeds up computation time. The proposed model shows similar depth map prediction results as in the case of the existing structure, and the computation time in case of a inference is decreased by 64%.

픽셀내 다수의 산화물 박막트랜지스터로 구성된 동영상 엑스레이 영상센서와 디텍터에 대한 평가 (Evaluation of Dynamic X-ray Imaging Sensor and Detector Composing of Multiple In-Ga-Zn-O Thin Film Transistors in a Pixel)

  • 전승익;이봉구
    • 한국방사선학회논문지
    • /
    • 제17권3호
    • /
    • pp.359-365
    • /
    • 2023
  • 높은 초당 프레임 속도와 낮은 영상지연을 갖는 동영상 엑스레이 디텍터의 요구조건을 만족하기 위해서는 픽셀내 포토다이오드와 금속 배선간 중첩 영역의 기생정전용량을 최소화하여야 한다. 본 연구에서는 리드아웃 박막트랜지스터, 리셋 박막트랜지스터, 그리고 포토다이오드로 픽셀이 구성된 듀오픽스TM(duoPIXTM) 동영상 엑스레이 영상센서를 처음으로 제시하였다. 이후 150 × 150 mm2 영상영역, 73 ㎛ 픽셀 크기, 2048 × 2048 해상도(4.2 M pixels), 최대 초당 50 프레임의 특성을 갖는 duoPIXTM 동영상 엑스레이 디텍터를 제작하여 초당 프레임 속도, 감도, 노이즈, MTF, 영상지연과 같은 엑스레이 영상 성능을 기존 엑스레이 영상센서를 적용한 동영상 엑스레이 디텍터와 비교 평가하였다. 평가 결과 이전 연구에서 기대했던 것과 같이 duoPIXTM 동영상 엑스레이 디텍터가 기존 동영상 엑스레이 디텍터 대비 모든 특성에서 우위의 성능을 보여 주었다.

도로 토목 공사 현장에서 UAV를 활용한 위성 영상 지도의 정확도 분석 (Accuracy Analysis of Satellite Imagery in Road Construction Site Using UAV)

  • 신승민;반창우
    • 한국산업융합학회 논문집
    • /
    • 제24권6_2호
    • /
    • pp.753-762
    • /
    • 2021
  • Google provides mapping services using satellite imagery, this is widely used for the study. Since about 20 years ago, research and business using drones have been expanding. Pix4D is widely used to create 3D information models using drones. This study compared the distance error by comparing the result of the road construction site with the DSM data of Google Earth and Pix4 D. Through this, we tried to understand the reliability of the result of distance measurement in Google Earth. A DTM result of 3.08 cm/pixel was obtained as a result of matching with 49666 key points for each image. The length and altitude of Pix4D and Google Earth were measured and compared using the obtained PCD. As a result, the average error of the distance based on the data of Pix4D was measured to be 0.68 m, confirming that the error was relatively small. As a result of measuring the altitude of Google Earth and Pix4D and comparing them, it was confirmed that the maximum error was 83.214m, which was measured using satellite images, but the error was quite large and there was inaccuracy. Through this, it was confirmed that there are difficulties in analyzing and acquiring data at road construction sites using Google Earth, and the result was obtained that point cloud data using drones is necessary.