• 제목/요약/키워드: Data-set

검색결과 10,944건 처리시간 0.036초

Knowledge Discovery in Nursing Minimum Data Set Using Data Mining

  • Park Myong-Hwa;Park Jeong-Sook;Kim Chong-Nam;Park Kyung-Min;Kwon Young-Sook
    • 대한간호학회지
    • /
    • 제36권4호
    • /
    • pp.652-661
    • /
    • 2006
  • Purpose. The purposes of this study were to apply data mining tool to nursing specific knowledge discovery process and to identify the utilization of data mining skill for clinical decision making. Methods. Data mining based on rough set model was conducted on a large clinical data set containing NMDS elements. Randomized 1000 patient data were selected from year 1998 database which had at least one of the five most frequently used nursing diagnoses. Patient characteristics and care service characteristics including nursing diagnoses, interventions and outcomes were analyzed to derive the meaningful decision rules. Results. Number of comorbidity, marital status, nursing diagnosis related to risk for infection and nursing intervention related to infection protection, and discharge status were the predictors that could determine the length of stay. Four variables (age, impaired skin integrity, pain, and discharge status) were identified as valuable predictors for nursing outcome, relived pain. Five variables (age, pain, potential for infection, marital status, and primary disease) were identified as important predictors for mortality. Conclusions. This study demonstrated the utilization of data mining method through a large data set with stan dardized language format to identify the contribution of nursing care to patient's health.

On connected dominating set games

  • Kim, Hye-Kyung
    • Journal of the Korean Data and Information Science Society
    • /
    • 제22권6호
    • /
    • pp.1275-1281
    • /
    • 2011
  • Many authors studied cooperative games that arise from variants of dominating set games on graphs. In wireless networks, the connected dominating set is used to reduce routing table size and communication cost. In this paper, we introduce a connected dominating set game to model the cost allocation problem arising from a connected dominating set on a given graph and study its core. In addition, we give a polynomial time algorithm for determining the balancedness of the game on a tree, for finding a element of the core.

이동 컴퓨팅 환경에서 데이타 방송을 위한 동시성 제어 기법 (A Concurrency Control Method for Data Broadcasting in Mobile Computing Environment)

  • 윤혜숙;김영국
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제31권2호
    • /
    • pp.140-149
    • /
    • 2004
  • 수많은 이동 클라이언트가 있는 이동 사용자 환경에서 데이타 방송 기법은 매우 효과적인 데이타 전달 방식으로 주목을 받고 있다. 이 방식에서 데이타베이스 서버는 데이타를 무선채널을 통해 주기적으로 배포하며 클라이언트는 필요한 데이타를 선택적으로 액세스하는 읽기 전용 트랜잭션을 수행한다. 한편, 서버에서는 데이타 방송과 병행해서 데이타베이스 갱신도 수행하므로 플라이언트가 일관성 있는 데이타를 액세스할 수 있으려면 동시성제어 문제가 해결되어야 한다. 본 연구에서는 이러한 동시성제어 문제를 효율적으로 해결하는 알고리즘인 SCDSC(Serialization Checking with DirtySet on Commit) 기법을 제안한다. SCDSC는 이동 클라이언트에서 다중 데이타를 요구하는 읽기 트랜잭션을 커미트할 때 일반 데이타와 함께 방송된 DirtySet을 점검하여 일관성을 유지하는 일종의 낙관적 동시성 제어기법이다. DirtySet은 일정 방송주기 동안 변경된 데이타 집합으로 방송주기가 바뀔 때마다 슬라이딩 윈도우 방식으로 서버에서 갱신되어 배포된다. 또한, 제안하는 알고리즘의 성능을 데이타 일관성(data consistency) 및 현재성(data currency) 관점에서 분석하고 시뮬레이션을 통해 알아본다.

A Tolerant Rough Set Approach for Handwritten Numeral Character Classification

  • Kim, Daijin;Kim, Chul-Hyun
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 1998년도 The Third Asian Fuzzy Systems Symposium
    • /
    • pp.288-295
    • /
    • 1998
  • This paper proposes a new data classification method based on the tolerant rough set that extends the existing equivalent rough set. Similarity measure between two data is described by a distance function of all constituent attributes and they are defined to be tolerant when their similarity measure exceeds a similarity threshold value. The determination of optimal similarity theshold value is very important for the accurate classification. So, we determine it optimally by using the genetic algorithm (GA), where the goal of evolution is to balance two requirements such that (1) some tolerant objects are required to be included in the same class as many as possible. After finding the optimal similarity threshold value, a tolerant set of each object is obtained and the data set is grounded into the lower and upper approximation set depending on the coincidence of their classes. We propose a two-stage classification method that all data are classified by using the lower approxi ation at the first stage and then the non-classified data at the first stage are classified again by using the rough membership functions obtained from the upper approximation set. We apply the proposed classification method to the handwritten numeral character classification. problem and compare its classification performance and learning time with those of the feed forward neural network's back propagation algorithm.

  • PDF

객체 검출을 위한 2차원 인조데이터 셋 구축 시스템과 데이터 특징 및 배치 구조에 따른 검출률 분석 : 자동차 번호판 검출을 중점으로 (2D Artificial Data Set Construction System for Object Detection and Detection Rate Analysis According to Data Characteristics and Arrangement Structure: Focusing on vehicle License Plate Detection)

  • 김상준;최진원;김도영;박구만
    • 방송공학회논문지
    • /
    • 제27권2호
    • /
    • pp.185-197
    • /
    • 2022
  • 최근 객체 인식에 높은 성능을 가진 딥러닝 네트워크가 나오고 있다. 딥러닝을 이용한 객체 인식의 경우 성능 향상을 위해 학습 데이터 셋 구축이 중요하다. 데이터 셋을 구축하기 위해서는 이미지를 수집하고 라벨링 해야 한다. 이 과정은 많은 시간과 인력이 필요하다. 때문에 오픈 데이터 셋을 사용한다. 그러나 방대한 오픈 데이터 셋을 가지고 있지 않는 객체도 존재한다. 그 중 하나가 번호판 검출과 인식에 필요한 데이터이다. 이에 본 논문에서는 이미지를 최소화 하여 대용량 데이터 셋을 만들 수 있는 인조 번호판 생성기 시스템을 제안한다. 또한 인조 번호판 배치구조에 따른 검출률을 분석했다. 분석결과 가장 좋은 배치구조는 FVC_III, B이며 가장 적합한 네트워크는 D2Det이었다. 인조 데이터셋 성능은 실제 데이터셋의 성능보다 2~3%가 낮았지만, 인조 데이터를 구축하는 시간이 실제 데이터셋을 구축하는 시간보다 약 11배 빨라 시간적으로 효율적인 데이터 셋 구축 시스템임을 증명하였다.

대화식 주문형 비디오 서비스에서의 셋톱박스 버퍼 제어 방안 연구 (A Study on Buffer Control Method of Set-top Box in Interactive Video-on-Demand Service)

  • 신준호;김용득
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 1999년도 추계종합학술대회 논문집
    • /
    • pp.1041-1044
    • /
    • 1999
  • This paper propose a solution to resolve data overflow or leakage when a subscriber receive data to service provider. The set-top box can communicate with a service provider and can inform the service provider its data overflow or leakage. When service provider received this control signal, it changes data transmit rate and transmits data with changed rate. The buffer of set-top box is important because incoming data from a service provider are stored by it.

  • PDF

One-Class 서포트 벡터 머신을 이용한 레벨 셋 트리 생성 (Creating Level Set Trees Using One-Class Support Vector Machines)

  • 이계민
    • 정보과학회 논문지
    • /
    • 제42권1호
    • /
    • pp.86-92
    • /
    • 2015
  • 레벨 셋 트리는 다차원에 정의된 확률 밀도 함수를 표현하는데 유용하다. 복잡한 데이터의 구조를 트리 형태로 시각화하여 데이터의 형태를 효율적으로 파악할 수 있으며 클러스터링 분석에 효과적으로 이용할 수 있다. 본 논문에서는 미지의 확률 밀도 함수에서 생성된 데이터 샘플로부터 레벨 셋 트리를 생성하는 알고리즘을 제안한다. 제안된 알고리즘은 레벨을 0에서부터 무한대로 증가시키며 밀도 함수의 각 레벨 셋을 추정하고, 이로부터 레벨 셋 트리를 생성한다. 이를 위해 본 논문에서는 one-class 서포트 벡터 머신 (OC-SVM)을 이용하여 직접적으로 레벨 셋을 추정한다. 이때 다양한 레벨 값에 대해 OC-SVM 학습을 반복해야 하는데, OC-SVM 솔루션 path 알고리즘을 통해 빠른 시간 안에 모든 레벨값에 해당하는 레벨 셋를 추정할 수 있다.

국부 확률을 이용한 데이터 분류에 관한 연구 (A Study on Data Clustering Method Using Local Probability)

  • 손창호;최원호;이재국
    • 제어로봇시스템학회논문지
    • /
    • 제13권1호
    • /
    • pp.46-51
    • /
    • 2007
  • In this paper, we propose a new data clustering method using local probability and hypothesis theory. To cluster the test data set we analyze the local area of the test data set using local probability distribution and decide the candidate class of the data set using mean standard deviation and variance etc. To decide each class of the test data, statistical hypothesis theory is applied to the decided candidate class of the test data set. For evaluating, the proposed classification method is compared to the conventional fuzzy c-mean method, k-means algorithm and Discriminator analysis algorithm. The simulation results show more accuracy than results of fuzzy c-mean method, k-means algorithm and Discriminator analysis algorithm.

벤 다이어그램 기반 퍼지 집합 시각화 (Visualizing Fuzzy Set Based on Venn Diagram)

  • 박예슬;박진아
    • 한국HCI학회:학술대회논문집
    • /
    • 한국HCI학회 2009년도 학술대회
    • /
    • pp.15-20
    • /
    • 2009
  • 퍼지 정보 시스템이 요구되는 다량의 데이터들은 퍼지 집합 시각화를 통한 다양한 분석을 필요로 한다. 따라서 본 연구는 퍼지 데이터 집합을 벤 다이어그램을 이용하여 시각화하는 방법을 제안하였다. 여러 주제에 관련되고 관련순위를 갖는 퍼지 데이터를 대상으로 여러 주제를 동시에 갖고 있는 데이터 집합과 여러 주제를 갖고 있는 모든 데이터들의 집합, 그리고 한 주제와 관련되지 않은 데이터 집합을 효과적으로 시각화하여 사용자가 원하는 결과를 제공할 수 있도록 하였다. 또한 서로 다른 주제 클러스터를 겹치거나 포개어서 결과 데이터를 표현하므로 사용자 중심의 정보 검색을 도모한다. 이러한 방법은 웹 검색 엔진 사용자와 웹 개발자에게 원하는 웹 문서를 보다 빠르게 전달 할 수 있는 장점을 갖으며 그 외, 정보 추출과 관련된 여러 목적으로 유용하게 쓰일 수 있는 발전 가능성이 있다.

  • PDF