• 제목/요약/키워드: Data Scientists

검색결과 3,360건 처리시간 0.026초

무선 센서-엑터 네트워크에서 주기적 메시지의 실시간 전송 (Real-Time Communication of Periodic Messages on Wireless Sensor and Actor Networks)

  • ;이상진;김명균
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2008년도 한국컴퓨터종합학술대회논문집 Vol.35 No.1 (D)
    • /
    • pp.291-296
    • /
    • 2008
  • Wireless network technologies are becoming more widely used in industrial environment. The industrial communication system requires a real-time delivery of messages. The sensors periodically senses the physical environment and wants to deliver the data in real-time to the sink. This paper proposes a real-time protocol for periodic messages on wireless sensor and actor networks to be used in industrial communications. The proposed protocol delivers the data message using the shortest path from the source and the nearest actor. The protocol considers the energy consumption by reducing the number of broadcast messages during flooding. We have evaluated the performance of the proposed protocol using QualNet simulator. The simulation results show that the data messages have been delivered in real-time and the number of broadcast messages is reduced from 90% to 35% compared the existing protocols.

  • PDF

DPA(DNP3.0 Protocol Analyzer) 플랫폼 개발 (Development of DPA(DNP3.0 Protocol Analyzer) Platform)

  • 송병권;이상훈;정태의;김건웅;김진칠;김영억
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2008년도 한국컴퓨터종합학술대회논문집 Vol.35 No.1 (D)
    • /
    • pp.480-484
    • /
    • 2008
  • DNP3.0은 산업 분야에서 SCADA(Supervisory Control And Data Aquisition) system의 개방형 프로토콜로 사용되어지고 있다. 본 논문에서는 개발하거나 개발된 Module들 사이에서 송 수신되는 DNP3.0 PDU를 분석할 수 있는 기능을 제공하는 DPA(DNP3.0 Protocol Analyzer) Module을 설계 및 구현하였다. 해당 Master Station에서 Request 메시지를 생성하여 Outstation으로 전송하고 Outstation에서 수신된 Request 메시지를 분석하여 Response 메시지를 생성하여 Response 한다. 또한 Master Station 과 Outstation에서 DNP3.0 프로토콜을 사용하여 통신하는 중간에서 송 수신하는 메시지를 Monitoring한다.

  • PDF

Nonnegative Matrix Factorization with Orthogonality Constraints

  • Yoo, Ji-Ho;Choi, Seung-Jin
    • Journal of Computing Science and Engineering
    • /
    • 제4권2호
    • /
    • pp.97-109
    • /
    • 2010
  • Nonnegative matrix factorization (NMF) is a popular method for multivariate analysis of nonnegative data, which is to decompose a data matrix into a product of two factor matrices with all entries restricted to be nonnegative. NMF was shown to be useful in a task of clustering (especially document clustering), but in some cases NMF produces the results inappropriate to the clustering problems. In this paper, we present an algorithm for orthogonal nonnegative matrix factorization, where an orthogonality constraint is imposed on the nonnegative decomposition of a term-document matrix. The result of orthogonal NMF can be clearly interpreted for the clustering problems, and also the performance of clustering is usually better than that of the NMF. We develop multiplicative updates directly from true gradient on Stiefel manifold, whereas existing algorithms consider additive orthogonality constraints. Experiments on several different document data sets show our orthogonal NMF algorithms perform better in a task of clustering, compared to the standard NMF and an existing orthogonal NMF.

반구조적 데이터의 효율적인 최소경계 스키마 추출 기법 (An Efficient Technique for Extracting Lower Bound Schema from Semistructured Data)

  • 박경현;김록원;양은주;최은선;류근호
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 가을 학술발표논문집 Vol.27 No.2 (1)
    • /
    • pp.27-29
    • /
    • 2000
  • 반구조적 데이터는 기존의 스키마와는 달리 고정된 스키마가 없고 주어진 데이터 인스턴스에 대해 하나 이상의 스키마가 존재한다. 따라서 여러 개의 스키마 추출이 가능한데 그중 가장 정확한 스키마를 추출해야 하는 문제(S초듬 Fxtraction)가 발생한다. 이러한 문제를 해결하기 위해 지금까지 여러 가지 스키마 추출 기번들이 제안되었는데 대표적인 것으로 데이터가이드(DataGuide)를 이용하여 최대경계 스키마를 추출하는 방법과 데이터로그(DataLog)를 이용하여 최소경계 스키마를 추출하는 방법이 있다. 이 논문에서는 기존의 데이터로그를 이용하는 방법보다 최소경계 스키마 추출 기법을 제안하고 이전의 스키마 추출 기법들과 비교함으로써 알고리즘의 성능을 살펴본다.

  • PDF

학습을 위한 네거티브 데이터가 존재하지 않는 경우의 microRNA 타겟 예측 방법 (microRNA target prediction when negative data is not available for learning)

  • 이제근;김수진;장병탁
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2008년도 한국컴퓨터종합학술대회논문집 Vol.35 No.1 (C)
    • /
    • pp.212-216
    • /
    • 2008
  • 기존의 알려진 데이터에 기반하여 분류 알고리즘을 통해 새로운 생물학적인 사실을 예측하는 것은 생물학 연구에 매우 유용하다. 하지만 생물학 데이터 분류 문제에서 positive 데이터만 존재할 뿐, negative 데이터는 존재하지 않는 경우가 많다. 이와 같은 상황에서는 많은 경우에 임의로 negative data를 구성하여 사용하게 된다. 하지만, negative 데이터는 실제로 negative임이 보장된 것이 아니고, 임의로 생성된 데이터의 특성에 따라 분류 성능 및 모델의 특성에 많은 차이를 보일 수 있다. 따라서 본 논문에서는 단일 클래스 분류 알고리즘 중 하나인 support vector data description(SVDD) 방법을 이용하여 실제 microRNA target 예측 문제에서 positive 데이터만을 이용하여 학습하고 분류를 수행하였다. 이를 통해 일반적인 이진 분류 방법에 비해 이와 같은 방법이 실제 생물학 문제에 보다 적합하게 적용될 수 있음을 확인한다.

  • PDF

The Efficient Query Evaluation Plan in the Spatial Database Engine

  • Liu, Zhao-Hong;Kim, Sung-Hee;Lee, Jae-Dong;Bae, Hae-Young
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 봄 학술발표논문집 Vol.28 No.1 (B)
    • /
    • pp.22-24
    • /
    • 2001
  • A new GIS software Spatial Database Engine(SDE) has been developed to integrated with spatial database that combines conventional and spatially related data. As we known well in the traditional relation database system, the query evaluation techniques are a well-researched subject, many useful and efficient algorithms have been proposed, but in the spatial database system, it is a litter difference with the traditionally ones. Based on the Query Graph Model(QGM), we implemented our own query evaulation plan in the SDE, which can deal with the full functionality query statement SELECT-FROM-WHERE_GROUPBY-HAVING, and treat the spatial data and non-spatial data seamlessly. We proposed a novel multi way join algorithm base on nest loop that may be attractive.

  • PDF

유전자 데이터베이스의 설계 및 구현: streptomyces data를 예로 (Design and Implementation of gene sequence database with streptomyces data)

  • 김진;김범준;김정미;김동회
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 봄 학술발표논문집 Vol.28 No.1 (B)
    • /
    • pp.160-162
    • /
    • 2001
  • 유전자의 서열 및 관련 정보가 폭발적으로 증가함에 따라, 사용자들에 대한 유전자정보 서비스, 온라인 상에서의 효율적이 서열정보 분석, 서열정보에 대한 효율적인 관리, 관련된 연구자들과의 정보공유 등이 필요하게 되었다. 본 논문에서는 인터넷 상에서 streptomyces 유전자 data를 효율적으로 관리하는 한편, 사용자들에게 유용한 서비스를 제공하는 시스템의 설계 및 구현에 관하여 논의하였다. 사용자는 본 시스템으로부터 원하는 유전자 정보를 다운로드 받을 수 있다. 또한 분석을 원하는 유전자를 streptomyces database내의 유전자들과 비교하여 유용한 정보를 추론할 수 있다.

  • PDF

Design of Spatial Query Language for GEO Millennium Server TM

  • Zhaohong Liu;Kim, Sung-Hee;Oh, Young-Hwan;Bae, Hae-young
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 가을 학술발표논문집 Vol.27 No.2 (1)
    • /
    • pp.113-115
    • /
    • 2000
  • A GIS software GEO Millennium SystemTM has been developed to integrated with spatial database that combines conventional and spatially related data. As we known well the standard query language lacks the support of spatial data type and predicate, and can not serve as the query language in the spatial database directly; some extended strategies have been proposed, but some of them need their own storage manager, some introfuce new clause into the SELECT-FROM-WHERE structure, and some is very complex and available to us. So we designed our own query language on the conventional storage manager system. It supports the Spatial Data Type and predicate, and provides the full query capabilities of SQL on the non-spatial part of the database while being tightly integrated with the spatial part, without changing the standard SQL structure.

  • PDF

음성통신 중 웨이브렛 계수 양자화를 이용한 비밀정보 통신 방법 (Secret Data Communication Method using Quantization of Wavelet Coefficients during Speech Communication)

  • 이종관
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2006년도 가을 학술발표논문집 Vol.33 No.2 (D)
    • /
    • pp.302-305
    • /
    • 2006
  • In this paper, we have proposed a novel method using quantization of wavelet coefficients for secret data communication. First, speech signal is partitioned into small time frames and the frames are transformed into frequency domain using a WT(Wavelet Transform). We quantize the wavelet coefficients and embedded secret data into the quantized wavelet coefficients. The destination regard quantization errors of received speech as seceret dat. As most speech watermark techniques have a trade off between noise robustness and speech quality, our method also have. However we solve the problem with a partial quantization and a noise level dependent threshold. In additional, we improve the speech quality with de-noising method using wavelet transform. Since the signal is processed in the wavelet domain, we can easily adapt the de-noising method based on wavelet transform. Simulation results in the various noisy environments show that the proposed method is reliable for secret communication.

  • PDF

다차원 FCM을 이용한 웹 로그 데이터의 유사 패턴 분석 (Similarity Pattern Analysis of Web Log Data using Multidimensional FCM)

  • 김미라;조동섭
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 가을 학술발표논문집 Vol.29 No.2 (2)
    • /
    • pp.190-192
    • /
    • 2002
  • 데이터 마이닝(Data Mining)이란 저장된 많은 양의 자료로부터 통계적 수학적 분석방법을 이용하여 다양한 가치 있는 정보를 찾아내는 일련의 과정이다. 데이터 클러스터링은 이러한 데이터 마이닝을 위한 하나의 중요한 기법이다. 본 논문에서는 Fuzzy C-Means 알고리즘을 이용하여 웹 사용자들의 행위가 기록되어 있는 웹 로그 데이터를 데이터 클러스터링 하는 방법에 관하여 연구하고자 한다. Fuzzv C-Means 클러스터링 알고리즘은 각 데이터와 각 클러스터 중심과의 거리를 고려한 유사도 측정에 기초한 목적 함수의 최적화 방식을 사용한다. 웹 로그 데이터의 여러 필드 중에서 사용자 IP, 시간, 웹 페이지 필드를 WLDF(Web Log Data for FCM)으로 가공한 후, 다차원 Fuzzy C-Means 클러스터링을 한다. 그리고 이를 이용하여 샘플 데이터와 임의의 데이터간의 유사 패턴 분석을 하고자 한다.

  • PDF