• 제목/요약/키워드: Wrapper Method

검색결과 53건 처리시간 0.025초

Microblog User Geolocation by Extracting Local Words Based on Word Clustering and Wrapper Feature Selection

  • Tian, Hechan;Liu, Fenlin;Luo, Xiangyang;Zhang, Fan;Qiao, Yaqiong
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제14권10호
    • /
    • pp.3972-3988
    • /
    • 2020
  • Existing methods always rely on statistical features to extract local words for microblog user geolocation. There are many non-local words in extracted words, which makes geolocation accuracy lower. Considering the statistical and semantic features of local words, this paper proposes a microblog user geolocation method by extracting local words based on word clustering and wrapper feature selection. First, ordinary words without positional indications are initially filtered based on statistical features. Second, a word clustering algorithm based on word vectors is proposed. The remaining semantically similar words are clustered together based on the distance of word vectors with semantic meanings. Next, a wrapper feature selection algorithm based on sequential backward subset search is proposed. The cluster subset with the best geolocation effect is selected. Words in selected cluster subset are extracted as local words. Finally, the Naive Bayes classifier is trained based on local words to geolocate the microblog user. The proposed method is validated based on two different types of microblog data - Twitter and Weibo. The results show that the proposed method outperforms existing two typical methods based on statistical features in terms of accuracy, precision, recall, and F1-score.

새로운 얼굴 특징공간을 이용한 모델 기반 얼굴 표정 인식 (Model based Facial Expression Recognition using New Feature Space)

  • 김진옥
    • 정보처리학회논문지B
    • /
    • 제17B권4호
    • /
    • pp.309-316
    • /
    • 2010
  • 본 연구에서는 얼굴 그리드 각도를 특징공간으로 하는 새로운 모델 기반 얼굴 표정 인식 방법을 제안한다. 제안 방식은 6가지 얼굴 대표 표정을 인식하기 위해 표정 그리드를 이용하여 그리드의 각 간선과 정점이 형성하는 각도를 기반으로 얼굴 특징 공간을 구성한다. 이 방법은 다른 표정 인식 알고리즘의 정확도를 낮추는 원인인 변환, 회전, 크기변화와 같은 어파인 변환에 강건한 특징을 보인다. 또한, 본 연구에서는 각도로 특징공간을 구성하고 이 공간 내에서 Wrapper 방식으로 특징 부분집합을 선택하는 과정을 설명한다. 선택한 특징들은 SVM, 3-NN 분류기를 이용해 분류하고 분류 결과는 2중 교차검증을 통해 검증하도록 한다. 본 연구가 제안한 방법에서는 94%의 표정 인식 결과를 보였으며 특히 특징 부분집합 선택 알고리즘을 적용한 결과 전체 특징을 이용한 경우보다 약 10%의 인식율 개선 효과를 보인다.

레거시 시스템에서 공통 클래스를 통한 컴포넌트 도출 방법 (Method of Identifying Component in Legacy System through Common Class)

  • 이종민
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2005년도 가을 학술발표논문집 Vol.32 No.2 (2)
    • /
    • pp.415-417
    • /
    • 2005
  • 레거시 시스템을 컴포넌트화 하기 위해 시스템을 서브 시스템으로 계층화하고, 각각의 서브 시스템을 객체 기반으로 변형한 후, 래퍼(Wrapper)를 이용하여 컴포넌트화 한다. 이런 절차 중 Wrapper컴포넌트를 도출하는 방법 중 UML Component방법론을 사용, 컴포넌트 도출 중 여러 핵심타입(Core Type) 객체가 하나의 객체와 연관관계를 가지고 있는 경우 경험이나 직관을 최소화하여 의존성을 최소할 수 있는 개선된 컴포넌트 도출방법을 제안한다.

  • PDF

원시 타입의 값과 래퍼 클래스의 객체간 자동차 변환를 지원하기 위한 Java의 확장 (Java Extension for supporting Automatic Transformation between Values of Primitive Types and Objects of Wrapper Classes)

  • 김성기;김상철;정병수
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제28권10호
    • /
    • pp.785-794
    • /
    • 2001
  • Java 에서 원시 타입과 클래스 타입간에 호환성이 제공되지 않으므로 원시값이 클래스 타입의 변수에 저장되지 못하며, 클래스 타입의 값이 원시 타입 변수에 저장되지 못한다. 객체가 필요한 곳에서 원시값을 사용하기 위해서는 원시 값을 저장하는 래퍼 클래스의 객체 생성이 필요하며, 패러 클래스의 객체에서 저장된 원시 값을 꺼내기 위해서는 특정 메소드를 호출하여야 한다.이러한 불편함과 변환시의 오류를 줄이기 위하여 본 논문에서는 Java의 원시타입과 래퍼 클래스 타입의 호환성 제공을 위한 변환방법을 제안하였다. 원시 타입과 래퍼 클래스 타입간의 호환성 뿐 아니라 원시 타입간의 호환성에 상응하는 래퍼 클래스간의 호환성도 제공하기 위해 래퍼 클래스 계층방법, java.lang.Number 클래스 이용방법, 래퍼 인터페이스 계층방법 등 3가지 변환방법을 제시하였다. 이들 방법의 비교분석과 성능측정을 통하여 래퍼 인터페이스 계층방법이 가장 우수한 방법임을 확인하였다.

  • PDF

Hybrid Feature Selection Method Based on a Naïve Bayes Algorithm that Enhances the Learning Speed while Maintaining a Similar Error Rate in Cyber ISR

  • Shin, GyeongIl;Yooun, Hosang;Shin, DongIl;Shin, DongKyoo
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제12권12호
    • /
    • pp.5685-5700
    • /
    • 2018
  • Cyber intelligence, surveillance, and reconnaissance (ISR) has become more important than traditional military ISR. An agent used in cyber ISR resides in an enemy's networks and continually collects valuable information. Thus, this agent should be able to determine what is, and is not, useful in a short amount of time. Moreover, the agent should maintain a classification rate that is high enough to select useful data from the enemy's network. Traditional feature selection algorithms cannot comply with these requirements. Consequently, in this paper, we propose an effective hybrid feature selection method derived from the filter and wrapper methods. We illustrate the design of the proposed model and the experimental results of the performance comparison between the proposed model and the existing model.

유전 알고리즘 기반의 비정상 행위 탐지를 위한 특징선택 (Feature Selection for Anomaly Detection Based on Genetic Algorithm)

  • 서재현
    • 한국융합학회논문지
    • /
    • 제9권7호
    • /
    • pp.1-7
    • /
    • 2018
  • 데이터 전처리 기법 중 하나인 특징 선택은 대규모 데이터셋을 다루는 다양한 응용분야에서 주요 연구 분야 중 하나로 각광받고 있다. 특징 선택은 패턴 인식, 기계학습 및 데이터 마이닝에서 사용됐고, 최근에는 텍스트 분류, 이미지 검색, 침입 탐지 및 게놈 분석과 같은 다양한 분야에 널리 적용되고 있다. 제안 방법은 메타 휴리스틱 알고리즘 중의 하나인 유전 알고리즘을 기반으로 한다. 특징 부분 집합을 찾는 방법은 크게 필터(filter) 방법과 래퍼(wrapper) 방법이 있는데, 본 연구에서는 최적의 특징 부분 집합을 찾기 위해 실제 분류기를 사용한 평가를 하는 래퍼 방법을 사용한다. 실험에 사용한 훈련 데이터셋은 클래스 불균형이 심하여 희소클래스에 대한 분류 성능을 높이기 어렵다. SMOTE 기법을 적용한 훈련 데이터셋을 사용하여 특징 선택을 하고 다양한 기계학습 알고리즘을 사용하여 선택한 특징들의 성능을 평가한다.

컴포넌트 테스트를 위한 래퍼의 자동 생성에 관한 연구 (Automated Generation of Wrapper to Test Components)

  • 송호진;최은만
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제32권8호
    • /
    • pp.704-716
    • /
    • 2005
  • 미리 만들어진 컴포넌트를 조립하여 새로운 소프트웨어를 개발하는 방법은 개발비용과 기간을 획기적으로 줄일 수 있다는 장점으로 전통적인 방법의 대안이 되고 있다. 하지만 컴포넌트를 통합 조립하면서 신뢰도를 확인하고 새 환경에 맞는지 테스트하는 과정이 복잡하고 비용이 많이 소요된다면 효과적인 방법이 될 수 없다. 대규모 시스템에 효율적으로 사용, 조림될 컴포넌트들은 원시코드 형태로 배포되지 않아서 새 환경에 적합한지 시험하고 관찰하는 철저한 테스트가 어렵다. 이러한 문제점을 해결하기 위하여 컴포넌트가 재사용되었을 때 쉽게 검증되도록 미리 테스트 모듈을 내장한 Built-In 테스트 방법이 있지만 컴포넌트의 기능이 다양하고 복잡하게 되면 컴포넌트에 포함된 테스트 모듈의 규모가 커지고 다양하고 융통성 있는 테스트가 어려워진다. 이 논문에서는 컴포넌트의 Built-In 테스트 기능을 대체할만한 컴포넌트 테스트를 위한 래퍼(wrapper)를 제안하고 이를 설계, 구현하여 실용성을 보였다. 래퍼를 자동 생성하여 테스트하면 컴포넌트의 테스트 준비 과정에 드는 노력이 줄어들고 테스트를 다양한 측면에서 테스트해 볼 수 있다.

비표준 센서 및 구동기 노드를 지원하는 표준사양 기반 스마트팜 연구 (A Study on the Standard-interfaced Smart Farm Supporting Non-Standard Sensor and Actuator Nodes)

  • 방대욱
    • 한국IT서비스학회지
    • /
    • 제19권3호
    • /
    • pp.139-149
    • /
    • 2020
  • There are now many different commercial weather sensors suitable for smart farms, and various smart farm devices are being developed and distributed by companies participating in the government-led smart farm expansion project. However, most do not comply with standard specifications and are therefore limited to use in smart farms. This paper proposed the connecting structure of operating non-standard node devices in smart farms following standard specifications supporting smart greenhouse. This connecting structure was proposed as both a virtual node module method and a virtual node wrapper method. In addition, the SoftFarm2.0 system was experimentally operated to analyze the performance of the implementation of the two methods. SoftFarm2.0 system complies with the standard specifications and supports non-standard smart farm devices. According to the analysis results, both methods do not significantly affect performance in the operation of the smart farm. Therefore, it would be good to select and implement the method suitable for each non-standard smart farm device considering environmental constraints such as power, space, distance of communication between the gateway and the node of the smart farm, and software openness. This will greatly contribute to the spread of smart farms by maximizing deployment cost savings.

유전자 선택을 위해 속성 삭제에 기반을 둔 최적화된 분류기 설계 (A Design of an Optimized Classifier based on Feature Elimination for Gene Selection)

  • 이병관;박석규;유슬리나 티파니
    • 한국정보전자통신기술학회논문지
    • /
    • 제8권5호
    • /
    • pp.384-393
    • /
    • 2015
  • 본 논문은 두 가지 속성 삭제 방법인 ReliefF와 SVM-REF를 조합하여 유전자 선택을 위한 속성 삭제에 기반을 둔 최적화된 분류법(OCFE)을 제안한다. ReliefF 알고리즘은 데이터의 중요도에 따라 데이터 순위를 매기고 필터(filter) 속성 선택 알고리즘이다. SVM-RFE 알고리즘은 속성의 가중치 기반으로 데이터 순위를 매기고 데이터를 감싸는 래퍼(wrapper) 속성 선택 알고리즘이다. 이러한 두 가지 기법을 조합함으로써, 우리는 SVM-RFE는 0.3096779이고 OCFE는 0.3016138으로 에러율 평균이 좀 더 낮게 나타났다. 또한, 제안된 기법은 SVM-RFE가 69%이고 OCFE는 70%으로 좀 더 정확한 것으로 나타났다.

MINLP를 이용한 제지 공정의 파지 손실 최소화 (Minimization of Trim Loss Problem in Paper Mill Scheduling Using MINLP)

  • 나성훈;고대호;문일
    • 제어로봇시스템학회:학술대회논문집
    • /
    • 제어로봇시스템학회 2000년도 제15차 학술회의논문집
    • /
    • pp.392-392
    • /
    • 2000
  • This study performs optimization of paper mill scheduling using MINLP(Mixed-Integer Non-Linear Programming) method and 2-step decomposing strategy. Paper mill process is normally composed of five units: paper machine, coater, rewinder, sheet cutter and roll wrapper/ream wrapper. Various kinds of papers are produced through these units. The bottleneck of this process is how to cut product papers efficiently from raw paper reel and this is called trim loss problem or cutting stock problem. As the trim must be burned or recycled through energy consumption, minimizing quantity of the trim is important. To minimize it, the trim loss problem is mathematically formulated in MINLP form of minimizing cutting patterns and trim as well as satisfying customer's elder. The MINLP form of the problem includes bilinearity causing non-linearity and non-convexity. Bilinearity is eliminated by parameterization of one variable and the MINLP form is decomposed to MILP(Mixed-Integer Linear programming) form. And the MILP problem is optimized by means of the optimization package. Thus trim loss problem is efficiently minimized by this 2-step optimization method.

  • PDF