• Title/Summary/Keyword: 분할 학습

Search Result 897, Processing Time 0.029 seconds

Understanding Documents With Chemical Structures Using Image Segmentation (영상 분할을 활용한 화학 구조 문서 이해)

  • Yang, Haeyoon;Cho, Nam Ik
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2022.06a
    • /
    • pp.1297-1300
    • /
    • 2022
  • Document layout analysis는 문서 이미지의 구조와 구성요소를 파악하는 기술이다. 기존 딥러닝을 사용한 학습 기반 방법에는 각 구성 요소를 검출하는 detection 기반 방식이 많으나 이는 다양한 형식의 문서 이미지에 확장될 수 있는 가능성이 낮다는 한계가 존재한다. 특히, 다양한 모양과 크기의 화학 구조를 포함하는 화학 문서 이미지에 적용하기 어렵다. 본 논문에서는 영상분할을 활용하여 화학 구조 문서를 이해하는 연구를 진행하였다. 기존의 블록 단위로 레이블링된 벤치마크와 다르게 객체 단위로 레이블링한 학습 데이터를 가지고 DeepLabv3 구조의 네트워크를 학습하여 화학 문서 이미지를 효과적으로 분할하였다. 객체 단위 레이블링과 영상 분할을 사용한 방식이 문서 이해 및 화학 구조 검출에 준수한 성능을 보이는 것을 확인하였고 이 방식이 다양한 형식의 문서 이미지에 확장될 수 있음을 보였다.

  • PDF

Image Denoising Method Using Region Segmentation (영역 분할을 통한 영상 잡음 제거 기법)

  • Kim, Sung-Yong;Cheong, Hejin;Kang, Hang-Bong
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2010.11a
    • /
    • pp.683-686
    • /
    • 2010
  • 본 논문은 영상 내에서 영역을 분할하여 영상 잡음을 효과적으로 제거하는 기법을 제안한다. 제안한 방법을 통해 잡음 영상을 영역 분할 경우 잡음부분까지 영역 분할되는 문제가 발생하기 때문에 잡음 영상을 저대역(Low-pass) 필터를 통과함으로써 잡음을 최소화한다. 저대역 필터를 통과한 영상에서 에지를 추출하여 비정상적인 에지의 추출을 방지함으로써 영상이 가진 근본적인 에지를 정확하게 추출한다. 획득한 에지 정보를 바탕으로 각 영역간의 히스토그램의 평균 오차를 이용하여 영역을 분할한다. 분할된 영역은 각 영역별로 저대역(Low-pass) 필터를 통과시킴으로써 영역에 맞는 잡음 제거를 통해서 더욱 빠르고 효과적으로 제거한다. 본 논문의 방법은 기존의 학습을 통한 잡음 제거 방법과 다르게 학습 시간이 요구되지 않으며, Non-local Means의 방법과 다르게 큰 연산량을 요구하지 않기 때문에 유사한 성능으로 빠른 잡음 제거를 할 수 있다.

LANGUAGE LEARNING SOURCE ANALYSIS METHOD AND ELECTRONIC DEVICE FOR PLAYING LANGUAGE LEARNING SOURCE RESEARCH (언어 학습 음원 분석 방법 및 언어 학습 음원을 재생하는 전자 디바이스 연구)

  • Song, Gyu-Bin;Oh, Jeong-Hyeon;Hwang, Chae-won;Yu, Dong-Wan
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2020.05a
    • /
    • pp.355-357
    • /
    • 2020
  • 언어 학습 음원 분석 방법 및 언어 학습 음원을 재생하는 전자 디바이스 연구로, 음원을 문장 단위로 분할하여 스크립트화하는 것을 주요 목표로 한다. 분석과정은 크게 세단계로 나눌 수 있다. 무음 구간 분석, 음원 분할 및 STT 구간, 스크립트 재구성이다. 이런 분석 과정을 통해 나온 결과물의 정확도는 90%로서 본 연구의 목표를 달성한다.

A Study on Sixth Grade Students' Understanding of Fraction as Quotient (초등학교 6학년 학생들의 몫으로서의 분수에 대한 이해 분석)

  • Lee, Ji-Young;Pang, JeongSuk
    • School Mathematics
    • /
    • v.16 no.4
    • /
    • pp.783-802
    • /
    • 2014
  • The purpose of this study was to explore in detail students' understanding of fraction as quotient. A total of 158 sixth graders in 6 elementary schools were surveyed by 8 tasks in relation to fraction as quotient. As a result, students used various partitioning strategies to solve the given sharing tasks such as partitioning the singleton unit, the composite unit, or the whole unit of the dividend. They also used incorrect partitioning strategies that were not appropriate to the given context. Students' partitioning strategies and performance of fraction as quotient varied depending on the given contexts and models. This study suggests that students should have rich experience to partition various units and reinterpret the context based on the singleton unit of the dividend.

  • PDF

2D to 3D Conversion Using The Machine Learning-Based Segmentation And Optical Flow (학습기반의 객체분할과 Optical Flow를 활용한 2D 동영상의 3D 변환)

  • Lee, Sang-Hak
    • The Journal of the Institute of Internet, Broadcasting and Communication
    • /
    • v.11 no.3
    • /
    • pp.129-135
    • /
    • 2011
  • In this paper, we propose the algorithm using optical flow and machine learning-based segmentation for the 3D conversion of 2D video. For the segmentation allowing the successful 3D conversion, we design a new energy function, where color/texture features are included through machine learning method and the optical flow is also introduced in order to focus on the regions with the motion. The depth map are then calculated according to the optical flow of segmented regions, and left/right images for the 3D conversion are produced. Experiment on various video shows that the proposed method yields the reliable segmentation result and depth map for the 3D conversion of 2D video.

Auto Labelling System using Object Segmentation Technology (객체 분할 기법을 활용한 자동 라벨링 구축)

  • Moon, Jun-hwi;Park, Seong-hyeon;Choi, Jiyoung;Shin, Wonsun;Jung, Heokyung
    • Proceedings of the Korean Institute of Information and Commucation Sciences Conference
    • /
    • 2022.10a
    • /
    • pp.222-224
    • /
    • 2022
  • Deep learning-based computer vision applications in the field of object segmentation take a transfer learning method using hyperparameters and models pretrained and distributed by STOA techniques to improve performance. Custom datasets used in this process require a lot of resources, such as time and labeling, in labeling tasks to generate Ground Truth information. In this paper, we present an automatic labeling construction method using object segmentation techniques so that resources such as time and labeling can be used less to build custom datasets used in deep learning neural networks.

  • PDF

The VOD realization that used Moving Image Contents development and free CGI for an ICT Utilization Instruction (ICT 활용 수업을 위한 동영상 콘텐츠 개발과 공개CGI를 활용한 VOD구현)

  • Kim, Sang-Baek;Moon, We-Sik
    • 한국정보교육학회:학술대회논문집
    • /
    • 2004.01a
    • /
    • pp.495-504
    • /
    • 2004
  • 학습자에게 학습의 자율성 및 유연한 학습활동 제공, 자기 주도적 학습환경 제공, 창의력 및 문제해결력 향상, 다양한 교수학습 활동 촉진, 교육의 장 확대를 위하여 범국가적인 차원에서 ICT교육을 실시하고 있다. ICT소양 교육에는 교사들에 대한 연수기회가 많고 멀티미디어 콘텐츠가 많이 개발되어 효과를 보고 있지만 ICT활용 교육은 다양한 멀티미디어 콘텐츠의 부족으로 교사들이 부담감을 가지고 있다. 이와 같은 문제점을 인식하여 ICT활용 교육에 바로 투입할 수 있는 2분 이내의 짧은 동영상 콘텐츠를 개발하고 이를 공개 CGI를 활용하여 VOD로 구현하였다. 아울러 10분 내외의 다큐멘터리 형식의 VOD로 방송학습이 이루어지도록 했으며, 동영상 콘텐츠 개발에 필요한 사전 지식 및 방송학습에 대한 올바른 인식을 갖게 하고자 텍스트 연수 자료도 함께 탑재하여 교실 수업 개선에 이바지하고자 하였다.

  • PDF

Improving Levenberg-Marquardt algorithm using the principal submatrix of Jacobian matrix (Jacobian 행렬의 주부분 행렬을 이용한 Levenberg-Marquardt 알고리즘의 개선)

  • Kwak, Young-Tae;Shin, Jung-Hoon
    • Journal of the Korea Society of Computer and Information
    • /
    • v.14 no.8
    • /
    • pp.11-18
    • /
    • 2009
  • This paper proposes the way of improving learning speed in Levenberg-Marquardt algorithm using the principal submatrix of Jacobian matrix. The Levenberg-Marquardt learning uses Jacobian matrix for Hessian matrix to get the second derivative of an error function. To make the Jacobian matrix an invertible matrix. the Levenberg-Marquardt learning must increase or decrease ${\mu}$ and recalculate the inverse matrix of the Jacobian matrix due to these changes of ${\mu}$. Therefore, to have the proper ${\mu}$, we create the principal submatrix of Jacobian matrix and set the ${\mu}$ as the eigenvalues sum of the principal submatrix. which can make learning speed improve without calculating an additional inverse matrix. We also showed that our method was able to improve learning speed in both a generalized XOR problem and a handwritten digit recognition problem.

A Representative Pattern Generation Algorithm Based on Evaluation And Selection (평가와 선택기법에 기반한 대표패턴 생성 알고리즘)

  • Yih, Hyeong-Il
    • Journal of the Korea Society of Computer and Information
    • /
    • v.14 no.3
    • /
    • pp.139-147
    • /
    • 2009
  • The memory based reasoning just stores in the memory in the form of the training pattern of the representative pattern. And it classifies through the distance calculation with the test pattern. Because it uses the techniques which stores the training pattern whole in the memory or in which it replaces training patterns with the representative pattern. Due to this, the memory in which it is a lot for the other machine learning techniques is required. And as the moreover stored training pattern increases, the time required for a classification is very much required. In this paper, We propose the EAS(Evaluation And Selection) algorithm in order to minimize memory usage and to improve classification performance. After partitioning the training space, this evaluates each partitioned space as MDL and PM method. The partitioned space in which the evaluation result is most excellent makes into the representative pattern. Remainder partitioned spaces again partitions and repeat the evaluation. We verify the performance of Proposed algorithm using benchmark data sets from UCI Machine Learning Repository.

Training a semantic segmentation model for cracks in the concrete lining of tunnel (터널 콘크리트 라이닝 균열 분석을 위한 의미론적 분할 모델 학습)

  • Ham, Sangwoo;Bae, Soohyeon;Kim, Hwiyoung;Lee, Impyeong;Lee, Gyu-Phil;Kim, Donggyou
    • Journal of Korean Tunnelling and Underground Space Association
    • /
    • v.23 no.6
    • /
    • pp.549-558
    • /
    • 2021
  • In order to keep infrastructures such as tunnels and underground facilities safe, cracks of concrete lining in tunnel should be detected by regular inspections. Since regular inspections are accomplished through manual efforts using maintenance lift vehicles, it brings about traffic jam, exposes works to dangerous circumstances, and deteriorates consistency of crack inspection data. This study aims to provide methodology to automatically extract cracks from tunnel concrete lining images generated by the existing tunnel image acquisition system. Specifically, we train a deep learning based semantic segmentation model with open dataset, and evaluate its performance with the dataset from the existing tunnel image acquisition system. In particular, we compare the model performance in case of using all of a public dataset, subset of the public dataset which are related to tunnel surfaces, and the tunnel-related subset with negative examples. As a result, the model trained using the tunnel-related subset with negative examples reached the best performance. In the future, we expect that this research can be used for planning efficient model training strategy for crack detection.