• 제목/요약/키워드: Instance Generation

검색결과 89건 처리시간 0.02초

Mask R-CNN을 이용한 물체인식 및 개체분할의 학습 데이터셋 자동 생성 (Automatic Dataset Generation of Object Detection and Instance Segmentation using Mask R-CNN)

  • 조현준;김다윗;송재복
    • 로봇학회논문지
    • /
    • 제14권1호
    • /
    • pp.31-39
    • /
    • 2019
  • A robot usually adopts ANN (artificial neural network)-based object detection and instance segmentation algorithms to recognize objects but creating datasets for these algorithms requires high labeling costs because the dataset should be manually labeled. In order to lower the labeling cost, a new scheme is proposed that can automatically generate a training images and label them for specific objects. This scheme uses an instance segmentation algorithm trained to give the masks of unknown objects, so that they can be obtained in a simple environment. The RGB images of objects can be obtained by using these masks, and it is necessary to label the classes of objects through a human supervision. After obtaining object images, they are synthesized with various background images to create new images. Labeling the synthesized images is performed automatically using the masks and previously input object classes. In addition, human intervention is further reduced by using the robot arm to collect object images. The experiments show that the performance of instance segmentation trained through the proposed method is equivalent to that of the real dataset and that the time required to generate the dataset can be significantly reduced.

한국어 자가 지식 학습을 위한 패턴 및 인스턴스 생성 (Pattern and Instance Generation for Self-knowledge Learning in Korean)

  • 윤희근;박성배
    • 한국지능시스템학회논문지
    • /
    • 제25권1호
    • /
    • pp.63-69
    • /
    • 2015
  • 웹의 비구조 문서로부터 자동으로 인스턴스를 생성하기 위한 다양한 연구가 제안되었다. 영어권의 기존 연구들에서는 간단한 규칙과 정규식 기반의 패턴을 활용하였다. 영어에서는 단순한 정규식 기반의 패턴만으로도 충분히 높은 정확도를 보여주었지만. 한국어는 영어와 다른 언어적인 특성으로 인하여 기존의 정규식 형태의 패턴으로는 적합한 패턴을 생성할 수 없다. 이에 본 논문에서는 한국어에 적합한 패턴 및 인스턴스 생성 방법을 제안한다. 제안한 방법은 대상 문장의 의존 관계를 고려함으로써 높은 정확도를 가지는 패턴 집합을 생성한다. 또한 인스턴스의 주어(subject)와 목적어(object) 판별을 위하여 조사 정보를 함께 활용함으로써 한국어의 자유로운 어순으로부터 오는 제약을 해결한다. 실험 결과에 따르면 본 논문에서 제안한 패턴 생성 방법이 단순 어순만을 고려하여 생성된 패턴들에 비하여 더 높은 정확률을 보여주어, 한국어 대상 자동 인스턴스 생성에 적합함을 확인하였다.

키워드를 활용한 온톨로지 인스턴스 생성에 관한 연구 (A Study on Ontology Instance Generation Using Keywords)

  • 한광록;강현민;손석원
    • 한국컴퓨터정보학회논문지
    • /
    • 제15권5호
    • /
    • pp.1-11
    • /
    • 2010
  • 시맨틱 웹의 성공 여부는 온톨로지 구축과 생성을 위해서 지식을 체계화하는 시맨틱 어노테이션에 달려있다. 그러므로 각 분야의 많은 지식 표현을 변환하여 온톨로지 인스턴스로 생성하기 위해서 시맨틱 어노테이션의 효율성이 중요하다. 본 논문에서는 기존 웹에서 시맨틱 어노테이션 작업을 통하여 온톨로지 인스턴스를 정확하고 효율적으로 생성하는 규칙기반 온톨로지 인스턴스 생성 시스템을 제안한다. 기존연구에서는 사용자가 관련 정보를 찾아서 온톨로지와 대조하여 정보를 입력하는 수동적인 과정이 필요하였다. 그러나 제안한 방식에서는 추출할 정보들에 관한 키워드 데이터와 규칙정보를 분할해서 관리한다. 따라서 소수의 키워드와 규칙정보들을 추가함으로써 다양한 웹문서의 효율적 정보 추출이 가능하다. 이것은 여러 사이트에서 규칙과 키워드를 재사용할 수 있는 온톨로지 인스턴스 생성이 가능하다는 것을 보여준다.

Unit Generation Based on Phrase Break Strength and Pruning for Corpus-Based Text-to-Speech

  • Kim, Sang-Hun;Lee, Young-Jik;Hirose, Keikichi
    • ETRI Journal
    • /
    • 제23권4호
    • /
    • pp.168-176
    • /
    • 2001
  • This paper discusses two important issues of corpus-based synthesis: synthesis unit generation based on phrase break strength information and pruning redundant synthesis unit instances. First, the new sentence set for recording was designed to make an efficient synthesis database, reflecting the characteristics of the Korean language. To obtain prosodic context sensitive units, we graded major prosodic phrases into 5 distinctive levels according to pause length and then discriminated intra-word triphones using the levels. Using the synthesis unit with phrase break strength information, synthetic speech was generated and evaluated subjectively. Second, a new pruning method based on weighted vector quantization (WVQ) was proposed to eliminate redundant synthesis unit instances from the synthesis database. WVQ takes the relative importance of each instance into account when clustering similar instances using vector quantization (VQ) technique. The proposed method was compared with two conventional pruning methods through objective and subjective evaluations of synthetic speech quality: one to simply limit the maximum number of instances, and the other based on normal VQ-based clustering. For the same reduction rate of instance number, the proposed method showed the best performance. The synthetic speech with reduction rate 45% had almost no perceptible degradation as compared to the synthetic speech without instance reduction.

  • PDF

i-Manager : LOD 인스턴스 개발 시스템의 구현 (i-Manager: An Implementation of LOD Instance Development System)

  • 문희경;한성국
    • 한국정보통신학회논문지
    • /
    • 제21권6호
    • /
    • pp.1174-1182
    • /
    • 2017
  • 웹상에서 이질적 형태의 다양한 데이터를 개방, 공유하여 차세대 데이터웹을 실현하고자 하는 연구개발이 활발하게 수행되고 있다. 이를 위해 표준 데이터 모델로 온톨로지 기반의 LOD가 개발되었다. LOD기반 시스템을 효과적으로 개발하기 위해서는 전문화된 인스턴스 생성 시스템이 필수적으로 요구되고 있다. 본 논문은 LOD 시스템의 요구사항과 다양한 응용분야의 개발환경을 고려하여, LOD 인스턴스 개발에 적합한 i-Manager를 설계 구현하였다. i-Manager는 LOD 인터페이스 시트를 이용해서 온톨로지와 인스턴스 계층을 분리하고, 인스턴스 편집/저장, 시각화, LOD 질의 처리 등 LOD 인스턴스 개발에 전문화된 기능들을 제공한다. 본 논문은 LOD 인스턴스 개발의 새로운 방향을 제시하고 있으며, 구현된 i-Manager는 다양한 분야에서 LOD 개발 범용환경으로 활용할 수 있다.

네트웍 관리를 위한 MIB의 자동생성 (Automatic Generation of MIB for Network Management)

  • 유재우;김영철;김성근
    • 한국통신학회논문지
    • /
    • 제25권6A호
    • /
    • pp.848-854
    • /
    • 2000
  • TMN에서의 네트웍 관리는 네트웍에 존재하는 운영체제나 통신 장비를 객체로 정의하고 관리한다. 이들 객체를 기술하기 위해 GDMO(Guidelines for the DefInition of Managed Objects)를 사용하고 있다. GDMO는 네트웍 관리를 위해 직접 이용되지 않으며, 객체지향 파라다임을 가지는 언어로 변환되어 사용된다. 또한 GDMO는 객체들을 관리하기 위하여 ASN.1(Abstract Syntax Notation One)을 참조한다. 본 논문에서는 ASN.1 & GDMO 명세를 Managed object Instance Base(MIB) 생성에 사용되는 객체지향 언어로 자동 번역하는 번역기를 설계하고 구현하였다. 본 시스템은 기존의 네트워크 관리를 위한 원시코드 생성기와는 달리 MIB 생성에 이용될 수있는 다양한 객체지향 언어를 자동 생성할 수 있도록 고안되었으며, ASN.1과 GDMO를 하나의 부라우져에서 처리할 수 있는 통합 환경을 제공함으로써 응용프로그램을 개발하는데 편리하도록 하였다.

  • PDF

A Multiple Instance Learning Problem Approach Model to Anomaly Network Intrusion Detection

  • Weon, Ill-Young;Song, Doo-Heon;Ko, Sung-Bum;Lee, Chang-Hoon
    • Journal of Information Processing Systems
    • /
    • 제1권1호
    • /
    • pp.14-21
    • /
    • 2005
  • Even though mainly statistical methods have been used in anomaly network intrusion detection, to detect various attack types, machine learning based anomaly detection was introduced. Machine learning based anomaly detection started from research applying traditional learning algorithms of artificial intelligence to intrusion detection. However, detection rates of these methods are not satisfactory. Especially, high false positive and repeated alarms about the same attack are problems. The main reason for this is that one packet is used as a basic learning unit. Most attacks consist of more than one packet. In addition, an attack does not lead to a consecutive packet stream. Therefore, with grouping of related packets, a new approach of group-based learning and detection is needed. This type of approach is similar to that of multiple-instance problems in the artificial intelligence community, which cannot clearly classify one instance, but classification of a group is possible. We suggest group generation algorithm grouping related packets, and a learning algorithm based on a unit of such group. To verify the usefulness of the suggested algorithm, 1998 DARPA data was used and the results show that our approach is quite useful.

유전 알고리즘을 이용한 정렬 알고리즘의 최악의 인스턴스 탐색 (Finding the Worst-case Instances of Some Sorting Algorithms Using Genetic Algorithms)

  • 전소영;김용혁
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2010년도 한국컴퓨터종합학술대회논문집 Vol.37 No.1(B)
    • /
    • pp.1-5
    • /
    • 2010
  • 정렬 알고리즘에서 사용한 원소 간 비교횟수를 기준으로, 비교횟수가 많게 되는 순열을 최악의 인스턴스(worst-case instance)라 명명하고 이를 찾기 위해 유전 알고리즘(genetic algorithm)을 사용하였다. 잘 알려진 퀵 정렬(quick sort), 머지 정렬(merge sort), 힙 정렬(heap sort), 삽입 정렬(insertion sort), 쉘 정렬(shell sort), 개선된 퀵 정렬(advanced quick sort)에 대해서 실험하였다. 머지 정렬과 삽입 정렬에 대해 탐색한 인스턴스는 최악의 인스턴스에 거의 근접하였다. 퀵 정렬은 크기가 증가함에 따라 최악의 인스턴스 탐색이 어려웠다. 나머지 정렬에 대해서 찾은 인스턴스는 최악의 인스턴스인지 이론적으로 보장할 수 없지만, 임의의 1,000개 순열을 정렬해서 얻은 비교횟수들의 평균치보다는 훨씬 높았다. 본 논문의 최악의 인스턴스를 탐색하는 시도는 알고리즘의 성능 검증을 위한 테스트 데이터를 생성한다는 점에서 의미가 크다.

  • PDF

개선된 배깅 앙상블을 활용한 기업부도예측 (Bankruptcy prediction using an improved bagging ensemble)

  • 민성환
    • 지능정보연구
    • /
    • 제20권4호
    • /
    • pp.121-139
    • /
    • 2014
  • 기업의 부도 예측은 재무 및 회계 분야에서 매우 중요한 연구 주제이다. 기업의 부도로 인해 발생하는 비용이 매우 크기 때문에 부도 예측의 정확성은 금융기관으로서는 매우 중요한 일이다. 최근에는 여러 개의 모형을 결합하는 앙상블 모형을 부도 예측에 적용해 보려는 연구가 큰 관심을 끌고 있다. 앙상블 모형은 개별 모형보다 더 좋은 성과를 내기 위해 여러 개의 분류기를 결합하는 것이다. 이와 같은 앙상블 분류기는 분류기의 일반화 성능을 개선하는 데 매우 유용한 것으로 알려져 있다. 본 논문은 부도 예측 모형의 성과 개선에 관한 연구이다. 이를 위해 사례 선택(Instance Selection)을 활용한 배깅(Bagging) 모형을 제안하였다. 사례 선택은 원 데이터에서 가장 대표성 있고 관련성 높은 데이터를 선택하고 예측 모형에 악영향을 줄 수 있는 불필요한 데이터를 제거하는 것으로 이를 통해 예측 성과 개선도 기대할 수 있다. 배깅은 학습데이터에 변화를 줌으로써 기저 분류기들을 다양화시키는 앙상블 기법으로 단순하면서도 성과가 매우 좋은 것으로 알려져 있다. 사례 선택과 배깅은 각각 모형의 성과를 개선시킬 수 있는 잠재력이 있지만 이들 두 기법의 결합에 관한 연구는 아직까지 없는 것이 현실이다. 본 연구에서는 부도 예측 모형의 성과를 개선하기 위해 사례 선택과 배깅을 연결하는 새로운 모형을 제안하였다. 최적의 사례 선택을 위해 유전자 알고리즘이 사용되었으며, 이를 통해 최적의 사례 선택 조합을 찾고 이 결과를 배깅 앙상블 모형에 전달하여 새로운 형태의 배깅 앙상블 모형을 구성하게 된다. 본 연구에서 제안한 새로운 앙상블 모형의 성과를 검증하기 위해 ROC 커브, AUC, 예측정확도 등과 같은 성과지표를 사용해 다양한 모형과 비교 분석해 보았다. 실제 기업데이터를 사용해 실험한 결과 본 논문에서 제안한 새로운 형태의 모형이 가장 좋은 성과를 보임을 알 수 있었다.

$CO_2$ 아크 용접에 있어서 다중회귀분석에 의한 아크 끊어짐을 고려한 아크 안정성 예측 모델 개발 (Development of Estimation Model Are Stability Considering Arc Extinction with Multiple Regression Analysis in $CO_2$ Arc Welding)

  • 강문진;이세헌;우재진
    • 대한기계학회논문집A
    • /
    • 제24권8호
    • /
    • pp.1885-1898
    • /
    • 2000
  • Welding quality is closely related to the arc state. So, it is very important to estimate the arc state in real time. In the short circuit transfer region of CO2 are welding, the spatter , as it is well known, is mainly generated on an instance of short circuit or on an instance that the are is ignited after short circuit, or on the cases of an instantaneous short circuit. If the short circuit period or the arc time is irregular, the spatter is generated more than it is regular. Thus there is a close relationship of the amount of the spatter generation with the arc stability. In this paper, to develop the index for estimating the arc stability in short circuit transfer range Of CO2 arc welding, the welding current and are voltage waveforms were measured and the spatter generated was captured and measured. The correlation analysis of the measured amount of the spatter with the factors (the components and the standard deviations of the components) was performed, and the factors that have a considerable influence on the spatter generation among all factors were selected. And some cases of models consisted of the factors were presented, and a mathematical index model which can make an estimation the amount of the spatter from these models with multiple regression analysis. Also, it was compared how much the amount of the spatter generated under the selected welding conditions do these index models fit, and the index model to estimate the arc stability which represent the spatter generation most appropriately was developed