• Title/Summary/Keyword: 데이터 기반 방식

Search Result 3,491, Processing Time 0.034 seconds

Efficient Retrieval of Similar Shape-Based Subsequences for Sequence Database (시퀀스 데이터베이스를 위한 모양기반의 유사 부분시퀀스 검색)

  • 이정화;윤지희
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 1999.10a
    • /
    • pp.340-342
    • /
    • 1999
  • 시퀀스 데이터(sequence data)에서는 각 데이터 값보다는 전후 그들 사이의 변화추세 등이 더 큰 정보로 작용하는 것이 일반적이다. 본문에서는 시퀀스 데이터베이스를 대상으로 하여 주어진 시퀀스 패턴과 모양이 유사한 모든 부분시퀀스를 검색해 내는 새로운 방식을 제안한다. 본 방식에서는 시퀀스 데이터의 모양 추출을 위한 데이터 변환, 유사 모양 패턴 클러스터링, 새로운 유사도 계산 방식 등을 도입함으로써, 기존의 방식이 매우 제한적인 패턴만을 유사패턴으로 간주하던 것에 비하여, 패턴이 데이터축 혹은 타임축으로 각각 확대, 축소, 이동된 경우에도 유사패턴으로 검색이 가능하다.

  • PDF

A Model Using IOT Based Railway Infrastructure Sensor Data for Recognition of Abnormal state (IOT기반 철도인프라 데이터를 활용한 이상상황 인식모델)

  • Jang, Gyu-JIn;Ahn, Tae-Ki;Kim, Young-Nam;Jung, Jae-Young
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2018.10a
    • /
    • pp.771-773
    • /
    • 2018
  • 인공지능(AI), 사물인터넷(IoT)등의 4차 산업기술은 철도안전의 핵심수단으로 부상하고 있으며 차량, 위험관리, 운행관리, 보안관리 등의 점진적인 적용분야 확장을 통해 철도안전에 대한 신뢰성을 향상시킬 수 있는 방안에 대한 관심이 집중되고 있다. 본 논문에서는 IoT 기반의 다양한 철도인프라 데이터를 활용하여 열차주행상태에 영향을 줄 수 있는 이상상황 인식 모델 및 열차자율주행을 위한 제어기술에 필요한 정보로 인프라 상태를 제공하는 방식을 제안한다. 철도 인프라 상황인지에 필요한 데이터는 레일온도, 선로 지정물, 승객 수, 선로 적설량을 지정하였고, 제안 인식모델의 스게노 퍼지추론 방식을 적용한 후 철도차량 운전관련 취급규정 및 취급세척을 기반으로 퍼지규칙(Fuzzy Rule)을 15개 생성하였다. 인프라데이터셋을 활용하여 제안모델의 인식률 평가에 사용하였으며 인식률 결과는 약 86%의 정확성을 보였다. 퍼지추론 기반 방식의 철도인프라 이상상태 인식모델을 철도분야에 접목시킨다면 기존의 관제기반 방식보다 효율적인 철도인프라 상황인식이 가능할 것으로 판단된다.

Extension and Management of Verb Phrase Patterns based on Lexicon Reconstruction and Target Word Information (사전 재구성과 대역어 정보를 통한 동사구 패턴의 확장 및 관리)

  • Hong, Mun-Pyo;Kim, Young-Kil;Ryu, Chul;Choi, Sung-Kwon;Park, Sang-Kyu
    • Annual Conference on Human and Language Technology
    • /
    • 2002.10e
    • /
    • pp.103-107
    • /
    • 2002
  • 데이터 기반 기계번역의 성공여부는 대량의 데이터를 단기간에 구축하는 방법과, 또 구축된 데이터에 대한 효과적인 관리 방법이 좌우한다고 할 수 있다. 대표적인 데이터 기반 기계번역 방법론인 예제 기반 기계번역 방식이나 패턴 기반 기계번역 방식에서는 최소한의 학습 내지는 학습과정 없이 데이터를 구축하는 데에 연구가 중점적으로 이루어져왔으나, 데이터의 관리 문제에 대해서는 많은 연구가 이루어지지 못하였다. 그러나 데이터의 확장 못지않게 데이터의 효율적인 관리도 데이터 기반 기계번역 시스템의 개발에서 매우 중요하다. 이 논문에서는 사/피동 링크 등을 이용하여 사전을 재구성하는 것이 데이터의 일관성과 관리성을 향상시키고, 이론적인 면에서는 정보 기술상의 잉여성을 줄인다는 점을 보인다. 또한 이러한 정보에 기반하여 기구축된 동사구 패턴으로부터 대역어 정보를 이용하여 새로운 패턴을 만들어내는 방법론도 제시한다.

  • PDF

Unmanned aircraft that are optimized for communication method and algorithm development of secondary links (무인항공기에 최적화된 보조 링크의 통신 방식 및 알고리즘 개발)

  • Choi, Jun-Su;Hur, Chang-Wu
    • Proceedings of the Korean Institute of Information and Commucation Sciences Conference
    • /
    • 2012.05a
    • /
    • pp.85-87
    • /
    • 2012
  • This paper, UAVs of the secondary communication link that applies to the analysys of time-division communication system and communication method proposed algorithm has been developed. UAVs of the important characteristics of the data link latency and throughput, the frequency is availability, weight. The data needed to operate UAVs vehicle control data, status data, there is an acquisition. Control and data acquisition will require real-time communication. Based on the requirements being applied to the secondary communication link communication method were compared and analyzed. The results of analysis of ground-base TDD method is suitable.

  • PDF

ID3 Algorithm Improved with Time-weighted Entropy (시간 가중치 엔트로피를 이용한 결정 트리 생성 알고리즘)

  • Dong, Liq-Uan;Lee, Jee-Hyong
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2005.07b
    • /
    • pp.625-627
    • /
    • 2005
  • 결정 트리(Decision Tree)는 주어진 데이터의 경향을 학습하는 데 사용되는 대표적인 방식이다. 이것은 주어진 데이터를 구조화하기 위하여 데이터의 속성과 정보의 엔트로피에 기반을 둔 정보획득량을 이용한다. 본 논문에서는 유비쿼터스 환경에서 사용자 프로파일 정보처럼 시간에 따라 그 경향이 변하는 데이터에 유용하게 적용할 수 있는 시간 가중치 엔트로피를 정의한다. 그리고 ID3 알고리즘을 기반으로 새롭게 제안하는 시간 가중치 엔트로피를 이용하는 향상된 ID3 알고리즘을 쓰고 사용자의 경향을 분석한다. 본 논문에서 제안하는 엔트로피를 이용하는 방식은 데이터들의 시간에 관한 영향을 고려해서 기준방식보다 분석결과가 더욱 유리하다. 두 방식의 비교 테스트 결과를 보면 시간 가중치 엔트로피를 이용하는 알고리즘은 기존의 ID3 알고리즘보다 구성된 트리의 구조가 매우 간단하고 유리하다.

  • PDF

Feature Selection by Using Distance Histogram (거리 히스토그램을 이용한 특성 추출 기법)

  • 최기석;전성진;양명석
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2003.04a
    • /
    • pp.713-715
    • /
    • 2003
  • 특성 추출은dimensionality reduction technique로서 잡음을 제거하기 위해 사용되는 중요한 전처리 방식이다. 이러한 과정을 통해 데이터의 크기를 줄일 수 있으며 학습의 정확성 및 이해도를 높일 수 있다. Classification에 사용되는 다양한 특성 추출방식들이 존재하는 반면에 클러스터링에 적용될 수 있는 방식들은 양적으로도 많이 부족하며 존재하는 방식들도 대부분 사용되는 클러스터링 알고리즘 자체에 의존적인 실세계 어플리케이션에는 적용하기 부적합한 Wrapper 방식을 도입하고 있다. 본 논문에서는 클러스터링 알고리즘으로부터 독립적인 필터 솔루션(filter solution)을 제안하였다. 이 방식은 클러스터를 가진 데이터와 가지지 않고 있는 데이터 사이의 point-to-point 거리 히스토그램의 차이에 기반하고 있다.

  • PDF

ID 기반 암호방식을 이용한 데이터 공유와 권한 관리

  • Park, Kwang-Yong;Song, You-Jin
    • Review of KIISC
    • /
    • v.19 no.4
    • /
    • pp.78-84
    • /
    • 2009
  • 최근 인터넷의 급속한 보급으로 인해 많은 정보가 네트워크를 통해서 전송되고 있는 가운데 보안상의 위험을 고려하여 비밀정보를 암호화하여 전송한다. 본 논문에서는 비밀정보를 안전하게 보내기 위해 ID기반 암호방식을 이용하여 암호화된 데이터의 공유와 권한관리에 대하여 검토하고자 한다.

Adaptive Receiver-driven Layered Multicast Protocol (적응적 수신자 기반 계층 멀티캐스트 프로토콜)

  • 고민수;안종석
    • Proceedings of the Korea Multimedia Society Conference
    • /
    • 1998.10a
    • /
    • pp.191-195
    • /
    • 1998
  • 최근 인터넷상에서는 이형 네트워크 상황에서 효율적인 화상회의를 하기 위한 연구가 활발히 진행되고 있다. 이형 네트워크에서 화상회의를 효과적으로 수행하기 위해서는 각 수신자의 네트워크 상태에 알맞게 데이터를 보내주어야 한다. 이러한 문제를 해결하기 위해서 McCanne은 계층적 코딩 방식과 RLM(Receiver-driven Layered Multicast)방식을 결합하여 사용할 것을 제안하였다. 계층적 코딩 방식은 하나의 이미지 프레임을 여러 계층의 데이터 스트림으로 나누는 방식으로 수신자는 많은 계층의 스트림을 받아볼수록 선명한 영상을 볼 수 있다. RLM은 각 수신자의 네트워크 상태에 따라 몇 개의 데이터 스트림을 수신할 것인가를 결정하는 방식이다.. 본 논문에서는 기존 RLM방식의 효율을 향상시킬 수 있는 적응적 기법을 제안한다. 기존의 RLM방식은 무작위적으로 정한 시간에 수신하는 데이터 스트림의 개수를 증가시키고 또한 네트워크가 정체가 되면 수신하는 데이터 스트림의 개수를 감소시키는 방식을 사용한다. 본 논문에서는 데이터 스트림의 개수를 증가시키는 시간을 네트워크의 상태에 따라 적응적으로 결정하는 기법을 소개한다. 시뮬레이션 실험에 의하면 적응적 기법이 기존 RLM에 비해 네트워크 사용 효율을 10%-30%정도 향상시킨다.

  • PDF

Multicast Routing Protocol for Mobile Network (이동 네트워크를 위한 멀티캐스트 라우팅 프로토콜)

  • 장문정;이미정
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2002.04a
    • /
    • pp.139-141
    • /
    • 2002
  • 차세대 인터넷은 유.무선이 혼합된 초고속의 네트워크 구조에서 사용자가 시간과 장소에 관계없이 실시간 멀티미디어 서비스를 제공받을 수 있는 환경으로 변화될 것이다. 이 변화에 잘 대응하기 위해서는 이동하는 사용자에게 효율적으로 멀티캐스팅을 지원할 필요가 있다. Mobile IP 기반의 이동 네트워크 환경에서 멀티캐스팅을 지원하기 위만 연구는 크게 HA(Home Agent)기반 방식과 FA(Foreign Agent)기반 방식으로 연구되어 왔다. HA기반 방식은 데이터 전송 경로의 비최적화, 비효율적인 데이터 중복 전송의 문제를 가지고, FA기반 방식은 빈번한 멀티캐스트 전송 트리의 재구성으로 인한 오버헤드의 문제를 내포하고 있다. 따라서, 본 논문에서는 MH(Mobile Host)의 잦은 핸드오프(handoff) 문제를 해결하고, 멀티캐스트 전송 트리의 재구성으로 인한 오버헤드를 줄이는 방법을 제안한다. 이 방법은 계층적 트리 구조의 도메인을 구성하고 MFA(Multicast Forwarding Agent)와 홉 카운터로 정의된 MFA의 서비스 범위를 사용한다. 또한, MFA를 Root FA들 중에서 선택함으로써 멀티캐스트 전송 트리 재구성의 회수를 줄여 Mobile IP를 이용하는 MH에게 효과적인 멀티캐스팅을 제공한다.

  • PDF

Multitask Transformer Model-based Fintech Customer Service Chatbot NLU System with DECO-LGG SSP-based Data (DECO-LGG 반자동 증강 학습데이터 활용 멀티태스크 트랜스포머 모델 기반 핀테크 CS 챗봇 NLU 시스템)

  • Yoo, Gwang-Hoon;Hwang, Chang-Hoe;Yoon, Jeong-Woo;Nam, Jee-Sun
    • Annual Conference on Human and Language Technology
    • /
    • 2021.10a
    • /
    • pp.461-466
    • /
    • 2021
  • 본 연구에서는 DECO(Dictionnaire Electronique du COreen) 한국어 전자사전과 LGG(Local-Grammar Graph)에 기반한 반자동 언어데이터 증강(Semi-automatic Symbolic Propagation: SSP) 방식에 입각하여, 핀테크 분야의 CS(Customer Service) 챗봇 NLU(Natural Language Understanding)을 위한 주석 학습 데이터를 효과적으로 생성하고, 이를 기반으로 RASA 오픈 소스에서 제공하는 DIET(Dual Intent and Entity Transformer) 아키텍처를 활용하여 핀테크 CS 챗봇 NLU 시스템을 구현하였다. 실 데이터을 통해 확인된 핀테크 분야의 32가지의 토픽 유형 및 38가지의 핵심 이벤트와 10가지 담화소 구성에 따라, DECO-LGG 데이터 생성 모듈은 질의 및 불만 화행에 대한 양질의 주석 학습 데이터를 효과적으로 생성하며, 이를 의도 분류 및 Slot-filling을 위한 개체명 인식을 종합적으로 처리하는 End to End 방식의 멀티태스크 트랜스포머 모델 DIET로 학습함으로써 DIET-only F1-score 0.931(Intent)/0.865(Slot/Entity), DIET+KoBERT F1-score 0.951(Intent)/0.901(Slot/Entity)의 성능을 확인하였으며, DECO-LGG 기반의 SSP 생성 데이터의 학습 데이터로서의 효과성과 함께 KoBERT에 기반한 DIET 모델 성능의 우수성을 입증하였다.

  • PDF