• 제목/요약/키워드: Data Linkage

검색결과 722건 처리시간 0.029초

확률적 자료연계의 이론과 적용에 관한 연구 (A study on the probabilistic record linkage and its application)

  • 최연옥;이상인
    • 응용통계연구
    • /
    • 제34권5호
    • /
    • pp.849-861
    • /
    • 2021
  • 본 논문은 확률적 자료연계 방법의 기본 개념과 이론적 모형을 소개하고, 실제 통계청 데이터를 사용하여 확률적 자료연계가 진행되는 과정과 원리를 보여준다. 먼저 확률적 자료연계와 결정적 자료연계와의 차이를 간단히 알아보고, 확률적 자료연계 방법론의 토대가 되는 Fellegi-Sunter 모형의 기본 구성과 관련된 모수(m-확률, u-확률), 가중치, 매치여부 판정기준에 대해 기술한다. 그리고 통계청 등록센서스와 인구총조사 자료를 이용하여 그 모형을 적용한 자료연계가 이루어지는 구체적인 과정에 대해 설명하고, 이를 통해 얻어진 연계 결과의 정확성을 살펴본다.

Construction of Genetic Linkage Map for Korean Soybean Genotypes using Molecular Markers

  • 조예진;박대진;한성진;오주호;황정규;고미숙;정종일
    • 한국작물학회지
    • /
    • 제48권4호
    • /
    • pp.297-302
    • /
    • 2003
  • Genetic linkage maps serve the plant geneticist in a number of ways, from marker assisted selection in plant improvement to map-based cloning in molecular genetic research. Genetic map based upon DNA polymorphism is a powerful tool for the study of qualitative and quantitative traits in crops. The objective of this study was to develop genetic linkage map of soybean using the population derived from the cross of Korean soybean cultivar 'Kwangkyo, and wild accession 'IT182305'. Total 1,000 Operon random primers for RAPD marker, 49 combinations of primer for AFLP marker, and 100 Satt primers for SSR marker were used to screen parental polymorphism. Total 341 markers (242 RAPD, 83 AFLP, and 16 SSR markers) was segregated in 85 $\textrm{F}_2$ population. Forty two markers that shown significantly distorted segregation ratio (1:2:1 for codominant or 3:1 for domimant marker) were not used in mapping procedure. A linkage map was constructed by applying the computer program MAPMAKER/EXP 3.0 to the 299 marker data with LOD 4.0 and maximum distance 50 cM. 176 markers were found to be genetically linked and formed 25 linkage groups. Linkage map spanned 2,292.7 cM across all 25 linkage groups. The average linkage distance between pair of markers among all linkage groups was 13.0 cM. The number of markers per linkage group ranged from 2 to 55. The longest linkage group 3 spanned 967.4 cM with 55 makers. This map requires further saturation with more markers and agronomically important traits will be joined over it.

교통카드 빅 데이터를 활용한 철도역의 대중교통 연계영향권 설정을 위한 GIS 분석 기법 연구 (A Study on the GIS Analysis Techniques for Finding an Catchment Area by Public Transport at Railway Stations Using Transport Cards Big Data)

  • 진상규;김황배
    • 대한토목학회논문집
    • /
    • 제36권6호
    • /
    • pp.1093-1099
    • /
    • 2016
  • 현재 우리나라의 수도권 전철역이 499개가 있지만 철도역과 연계수단간의 연계영향권에 대한 연구가 많지 않다. 대부분 진행된 연구들은 연계영향권보다는 접근영향권에 대한 연구가 주를 이루고 있다. 또한 연계영향권의 연구들은 설문조사와 기초통계자료를 이용하여 연계영향권의 설정에 대한 이론적기반과 분석기법에 한계를 가지고 있다. 본 논문에서는 새로운 연계영향권을 설정 방법론을 정립하고 이를 빅데이터인 교통카드 이용자들의 철도역 이용 공간자료와 GIS 기반 연계영향권 분석 기법을 접목하여 수단별 네트워크 통행시간기반 연계영향권 설정 연구를 수행 하였다. 연구결과 마을버스 15분이내, 지선버스 20분이내, 간선버스 25분 이상 등의 연계영향권이 네트워크 접근시간의 차이에 따라 명확히 구분됨을 확인하였다.

BIM-BEMS 연계를 위한 M-BDL 기반 BIM 데이터 맵핑 (BIM data mapping based on M-BDL for BIM-BEMS connection)

  • 강태욱
    • 한국산학기술학회논문지
    • /
    • 제19권9호
    • /
    • pp.348-354
    • /
    • 2018
  • 최근 BEMS(Building Energy Management System)는 공간정보를 적극 활용하고 있다. 공간정보가 포함된 BIM(Building Information Modeling)을 잘 활용한다면, 사용자는 공간정보와 연계된 직관적 건물 에너지 관리가 가능하다. 이 연구는 BIM-BEMS 연계를 위한 MF(Model Filter)을 활용한 데이터 맵핑 방법인 M-BDL(MF-based BIM Data Linkage)제안한다. 최근 BEMS은 3차원 공간정보를 적극 활용하고 있다. 이를 통해 사용자는 공간정보가 연계된 직관적인 건물 에너지관리가 가능하다. BIM 데이터를 에너지 관리 시스템에 활용하기 위해서는, 사용자 요구사항 관점에서 필요한 BIM 데이터만 BEMS과 연계할 필요가 있다. 하지만, Rich dataset인 BIM을 그대로 연계한다면 사용자가 불필요한 정보까지 관리해야 하는 부담을 주게 된다. M-BDL을 통해, 무거운 BIM 데이터에서 BEMS에 필요한 데이터만 맵핑함으로써, BIM데이터를 경량화할 수 있었고, 유지보수에 필요한 데이터량을 줄일 수 있다. 이 기술은 필요한 BIM 데이터만 필터링된 BIM 데이터와 BEMS 데이터베이스 간 연계할 수 있는 M-BDL 맵핑 방법을 제안한다.

일부 노인 장기요양보호기관 종사자간의 서비스연계 조사 (The Analysis of Factors on the Service-Linkage of Long-term Care Workers for the Elderly)

  • 유재응;김경;차용준
    • The Journal of Korean Physical Therapy
    • /
    • 제24권1호
    • /
    • pp.35-40
    • /
    • 2012
  • Purpose: This study was to analyze the factors that affect the service relationship of long term care workers for the elderly and to provide basic resource for the successful connection of long term care services. Methods: 259 subjects who were engaged in long term care units completed a self-administered questionnaire that measured the extent of service linkage among one another. The Cronbach's ${\alpha}$ score determined the internal consistency of the acquired data and the discriminated validity was estimated by Pearson's correlation coefficient. Multiple regression analysis was conducted to investigate the influence of the known factors on the service linkage. Results: Acceptance and participation negatively influenced on the service linkage. Reliance, comprehension, recognition on service, and frequent contact with others positively activated the service linkage of long term care workers. Conclusion: The establishments of systemic training courses providing education that emphasizes reliability and recognizes other services, including work environment to contact easily are needed to improve the service-linkage of long-term care workers for the elderly.

Predicting the Accuracy of Breeding Values Using High Density Genome Scans

  • Lee, Deuk-Hwan;Vasco, Daniel A.
    • Asian-Australasian Journal of Animal Sciences
    • /
    • 제24권2호
    • /
    • pp.162-172
    • /
    • 2011
  • In this paper, simulation was used to determine accuracies of genomic breeding values for polygenic traits associated with many thousands of markers obtained from high density genome scans. The statistical approach was based upon stochastically simulating a pedigree with a specified base population and a specified set of population parameters including the effective and noneffective marker distances and generation time. For this population, marker and quantitative trait locus (QTL) genotypes were generated using either a single linkage group or multiple linkage group model. Single nucleotide polymorphism (SNP) was simulated for an entire bovine genome (except for the sex chromosome, n = 29) including linkage and recombination. Individuals drawn from the simulated population with specified marker and QTL genotypes were randomly mated to establish appropriate levels of linkage disequilibrium for ten generations. Phenotype and genomic SNP data sets were obtained from individuals starting after two generations. Genetic prediction was accomplished by statistically modeling the genomic relationship matrix and standard BLUP methods. The effect of the number of linkage groups was also investigated to determine its influence on the accuracy of breeding values for genomic selection. When using high density scan data (0.08 cM marker distance), accuracies of breeding values on juveniles were obtained of 0.60 and 0.82, for a low heritable trait (0.10) and high heritable trait (0.50), respectively, in the single linkage group model. Estimates of 0.38 and 0.60 were obtained for the same cases in the multiple linkage group models. Unexpectedly, use of BLUP regression methods across many chromosomes was found to give rise to reduced accuracy in breeding value determination. The reasons for this remain a target for further research, but the role of Mendelian sampling may play a fundamental role in producing this effect.

학술정보의 식별체계 현황 분석 및 연계 방안 연구 (A Study on the Analysis of Identification System and the Linkage Method of Academic-information)

  • 강주연;설재욱;황혜경
    • 한국도서관정보학회지
    • /
    • 제51권1호
    • /
    • pp.115-143
    • /
    • 2020
  • 4차 산업혁명 시대의 도래로 데이터 중심의 융합 연구가 증가하고 있다. 이러한 연구는 정보의 식별 및 연계의 중요성을 증가시키고 있어, 이를 지원하기 위한 학술정보의 효과적인 관리 및 유통을 위한 방안 모색이 필요하다. 이에 본 연구는 국내외 주요 학술정보서비스 12개의 식별체계 현황과 연계 가능한 정보를 분석하여 학술정보를 식별하고 연계할 수 있는 방안을 제안하고자 하였다. 현황 분석은 2차에 걸쳐 진행되었으며, 각 서비스가 제공하고 있는 학술정보의 유형과 검색 가능한 항목, 연계 정보 유형, 사용 중인 식별체계 등을 살펴보았다. 분석 결과, 국내외 주요 학술정보서비스들은 영구 식별자와 더불어 자체 식별자를 중심으로 평균 3~4개의 정보를 직·간접적으로 연계하고 있다. 또한, 기계학습 방법론을 기반으로 하여 동일 학술정보를 반자동으로 식별하고, 해당 데이터를 수집, 구축하고 있다. 상기 분석 결과를 바탕으로 실무적인 측면에서 영구 식별자 중심의 학술정보 연계 방안과 사회적인 측면에서 기관 협력 네트워크 기반의 연계 방안을 제안하였다.

분산제어를 위한 필드제어시스템의 실시간 데이터 연계 (a Study on the Real-time Data Linkage of Field Control System for Distributed Control)

  • 김석곤;송성일;오응세;이성우;곽귀일;이은웅;박태림
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 2003년도 하계학술대회 논문집 B
    • /
    • pp.777-779
    • /
    • 2003
  • This paper describes the real-time data linkage of the field control system for distributed control in nuclear power plant environment. The most important keys of digital control system in nuclear power plant are the reliability and stability of system, and real-time control ability. This Paper brought up the hardware construction using a new method about the design of each station located upon control transmission network to improve real-time ability of field control system, and measured the station binding time between devices connected to field control module. And it was confirmed performance improvement of overall system for real-time data linkage between control devices.

  • PDF

A Major DNA marker Mining of ILST035 microsatellite loci in Hanwoo Chromosome 6

  • 이제영;여정수;김재우;이용원
    • Journal of the Korean Data and Information Science Society
    • /
    • 제13권2호
    • /
    • pp.97-104
    • /
    • 2002
  • K-Means modelling has been tried for finding major DNA marker of ILST035 microsatellite loci in Hanwoo Chromosome 6 linkage map. Major DNA markers are obtained from the ILST035 microsatellite through quantitative trait loci(QTL) and data mining modelling.

  • PDF

Priority Queue 를 이용한 Hierarchical Clustering (Centroid Linkage) 성능 개선 (A Performance Improvement Study On Hierarchical Clustering (Centroid Linkage) Using A Priority Queue)

  • 전용권;윤성로
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2010년도 추계학술발표대회
    • /
    • pp.1837-1838
    • /
    • 2010
  • 기존 hierarchical clustering 은 Time complexity 와 space complexity 가 Large data set 을 clustering 하기에는 적당하지 못하며 이것을 일반 PC 의 메모리 내에서 해결하는데 어려움이 있다. 따라서 본 연구에서는 이러한 어려움을 극복하기 위해 기존 Hierarchical clustering 중 Centroid Linkage 에 새로운 Algorithm 을 제안하여 보다 적은 메모리를 사용하고 빠르게 처리하는 방법을 제안하고자 한다.