• 제목/요약/키워드: Dataset Catalog

검색결과 9건 처리시간 0.026초

유통산업에 적용되는 GDAS와 UNSPSC 분류체계 (GDAS and UNSPSC for the Distribution Industry)

  • 이창수
    • 한국경영과학회:학술대회논문집
    • /
    • 한국경영과학회 2001년도 추계학술대회 논문집
    • /
    • pp.265-268
    • /
    • 2001
  • As growing the electronic commerce there are significant changes in the products/services catalog into the on-line environment. Advertent of e-catalog business opportunity for their own product/services enlarges the market volume and there are diverse methods for the presentation of its product/services. A method for the presentation of product/services features one uses identification and classification system. This study constructs a classification system and database layout for the product/services classification system as a part of e-catalog system. We consider the specific method for the GDAS-based dataset and UNSPSC classification system in the distribution industry.

  • PDF

DCAT을 활용한 디지털도서관 데이터셋 관리와 서비스 설계 (Designing Dataset Management and Service System for Digital Libraries Using DCAT)

  • 박진호
    • 한국문헌정보학회지
    • /
    • 제53권2호
    • /
    • pp.247-266
    • /
    • 2019
  • 본 연구는 새로운 지식정보자원으로 중요성이 높아지고 있는 데이터셋을 관리 서비스하기 위해 W3C 표준인 DCAT 활용방안을 제시하고자 하였다. 이를 위해 먼저 DCAT을 구성하는 8개의 클래스 중 핵심 클래스 4가지를 중심으로 클래스와 속성을 분석하였다. 또한 디지털도서관에서 DCAT을 기반으로 다양한 데이터셋을 관리 서비스할 수 있는 시스템을 모델링하여 제시하였다. 이 시스템은 원천데이터, 데이터셋 관리, 링크드 데이터 연결, 이용자 서비스로 구분하여 구성하였으며 특히 데이터셋관리에서는 DCAT 매핑 기능을 제시하여 다양한 데이터셋 서비스와 상호운용성 확보가 가능하도록 하였다.

Stellar Photometric Variability in the Open Cluster M37 Field on Time-Scales of Minutes to Days

  • 장서원;변용익
    • 천문학회보
    • /
    • 제37권1호
    • /
    • pp.58.1-58.1
    • /
    • 2012
  • We present a comprehensive re-analysis of stellar photometric variability in the field of open cluster M37, using our new high-precision light curves. This dataset provides a rare opportunity to explore different types of variability between short (-minutes) and long (-one month) time-scales. To investigate the variability properties of -30,000 objects, we developed new algorithms for detecting periodic, aperiodic, and sporadic variability in their light curves. About 7.5% (2,284) of the total sample exhibits convincing variations that are induced by flares, pulsations, eclipses, starspots and, in some cases, unknown causes. The benefits of our new photometry and analysis package are evident. The discovery rate of new variables is increased by 63% in comparison with the existing catalog of variables, and 51 previously identified variables were found to be false positives resulting from time-dependent systematic effects. Based on extended and improved catalog of variables, we will review the basic properties (e.g., periodicity, amplitude, type) of the variability and how different they are for different spectral types and for cluster memberships.

  • PDF

기계학습 분석을 위한 차원 확장과 차원 축소가 적용된 지진 카탈로그 (Application of Dimensional Expansion and Reduction to Earthquake Catalog for Machine Learning Analysis)

  • 장진수;소병달
    • 지질공학
    • /
    • 제32권3호
    • /
    • pp.377-388
    • /
    • 2022
  • 최근, 다수의 연구가 지수적으로 증가하는 지진 자료를 효율적이고 정확하게 처리하기 위해 기계학습을 활용하고 있다. 본 연구는 지진의 발생 시간, 위치, 규모의 정보를 확장하여 기계학습에 적용 가능한 자료를 제작한 후, 주성분 분석을 통해 추출한 자료의 주요 성분으로 자료의 차원을 축소하였다. 차원이 확장된 자료는 36,699개의 지진 사건을 포함하는 Global Centroid Moment Tensor 카탈로그로부터 얻은 지진 정보의 통계량으로 구성되었다. 표준화와 최대-최소화 스케일링을 활용하여 자료 전처리를 수행하였으며, 스케일링이 완료된 자료에 주성분 분석을 적용하여 자료의 주요 특징을 추출하였다. 스케일링은 상이한 단위로 인한 특징 값의 차이를 현저히 감소시켰으며, 그 중 표준화는 다른 전처리에 비해서 각 특징의 중앙값을 더 균등하게 변환하였다. 주성분 분석이 스케일링이 적용되지 않은 자료로부터 추출한 여섯 개의 주성분은 원본 자료의 정보를 99% 설명하였다. 표준화와 최대-최소 스케일링이 적용된 자료로부터 추출한 열여섯 개의 주성분은 원본 자료의 정보의 98%를 재구성하였다. 이는 특징 값의 분포가 균등한 자료의 정보를 보존하기 위해서는 더 많은 주성분이 필요함을 지시한다. 본 연구는 지진 데이터와 지진 거동과의 관계를 분석하는 효율적이고 정확한 기계 학습 모형을 훈련시키기 위한 데이터 처리 방법을 제안하였다.

구미시내 긴급차량의 도달시간 산정을 위한 Network해석 (Network Analysis for Estimating Reach Time of Emergency Vehicles in Gumi City)

  • 이진덕;박민철;박희영;강소희
    • 한국측량학회:학술대회논문집
    • /
    • 한국측량학회 2010년 춘계학술발표회 논문집
    • /
    • pp.363-365
    • /
    • 2010
  • In this study, based on numerical map GIS-T Dataset build and by using ArcGIS Network Analysis emergency vehicle's reach time were analyzed. AutoCad using 1: 50,000 based on roads and hospitals of numerical map were creating a Polyline and Point and Network Dataset made using ArcCatalog. ArcGIS Analysis setting the interval for the period reached 3 minutes, 5 minutes, 15 minutes was set and then U-Turn was set to not allow because U-turn takes a long time to calculate and does not happen often on the real road. Intersection of the passage of time, considering that the emergency vehicles were set to 3 seconds. To expand by taking advantage of this facility on Vulnerable area will be used as base material. If we focus on analyzing the emergency activity to convert little data, To prepare for disaster and disaster will be able to use the materials.

  • PDF

Short Reads Phasing to Construct Haplotypes in Genomic Regions That Are Associated with Body Mass Index in Korean Individuals

  • Lee, Kichan;Han, Seonggyun;Tark, Yeonjeong;Kim, Sangsoo
    • Genomics & Informatics
    • /
    • 제12권4호
    • /
    • pp.165-170
    • /
    • 2014
  • Genome-wide association (GWA) studies have found many important genetic variants that affect various traits. Since these studies are useful to investigate untyped but causal variants using linkage disequilibrium (LD), it would be useful to explore the haplotypes of single-nucleotide polymorphisms (SNPs) within the same LD block of significant associations based on high-density variants from population references. Here, we tried to make a haplotype catalog affecting body mass index (BMI) through an integrative analysis of previously published whole-genome next-generation sequencing (NGS) data of 7 representative Korean individuals and previously known Korean GWA signals. We selected 435 SNPs that were significantly associated with BMI from the GWA analysis and searched 53 LD ranges nearby those SNPs. With the NGS data, the haplotypes were phased within the LDs. A total of 44 possible haplotype blocks for Korean BMI were cataloged. Although the current result constitutes little data, this study provides new insights that may help to identify important haplotypes for traits and low variants nearby significant SNPs. Furthermore, we can build a more comprehensive catalog as a larger dataset becomes available.

Factors Affecting the Sales of Newspapers and Magazines Based on Concise Catalog

  • Dayou Jiang
    • Journal of Information Processing Systems
    • /
    • 제19권4호
    • /
    • pp.498-512
    • /
    • 2023
  • The traditional newspaper industry faces the opportunities and challenges of industry transformation and integration with new media. Consequently, the catalogs of newspapers and magazines are also updated. In this study, necessary information on catalogs was obtained and used to analyze the overall development trend of the newspaper industry. A word frequency analysis was then performed on the introduction and product categories of the catalogs, and the content and types of newspapers and magazines were examined. Furthermore, related factors such as price, number of pages, publishing frequency, and best-selling status were analyzed; the correlation among factors affecting best-selling status was also explored. Subsequently, each element and a combination of elements were used to generate a dataset, build three classification models, and analyze the accuracy of predictions of whether newspapers sold well under other circumstances. The experimental results showed that price is the most critical factor affecting the best-selling status of newspapers and magazines. Publishing frequency and the number of pages were also found to be significant indicators that impact people's subscription choices. Finally, a competitive strategy regarding content, price, quality, and positioning was developed.

Classification of Gravitational Waves from Black Hole-Neutron Star Mergers with Machine Learning

  • Nurzhan Ussipov;Zeinulla Zhanabaev;Almat, Akhmetali;Marat Zaidyn;Dana Turlykozhayeva;Aigerim Akniyazova;Timur Namazbayev
    • Journal of Astronomy and Space Sciences
    • /
    • 제41권3호
    • /
    • pp.149-158
    • /
    • 2024
  • This study developed a machine learning-based methodology to classify gravitational wave (GW) signals from black hol-eneutron star (BH-NS) mergers by combining convolutional neural network (CNN) with conditional information for feature extraction. The model was trained and validated on a dataset of simulated GW signals injected to Gaussian noise to mimic real world signals. We considered all three types of merger: binary black hole (BBH), binary neutron star (BNS) and neutron starblack hole (NSBH). We achieved up to 96% correct classification of GW signals sources. Incorporating our novel conditional information approach improved classification accuracy by 10% compared to standard time series training. Additionally, to show the effectiveness of our method, we tested the model with real GW data from the Gravitational Wave Transient Catalog (GWTC-3) and successfully classified ~90% of signals. These results are an important step towards low-latency real-time GW detection.

해외 도서관 링크드 데이터 구축의 최근 동향 연구 - 발행 데이터세트, 재사용 어휘집, 인터링킹 외부 데이터세트를 중심으로 - (A Study on Recent Trends in Building Linked Data for Overseas Libraries: Focusing on Published Datasets, Reused Vocabulary, and Interlinked External Datasets)

  • 이성숙
    • 한국문헌정보학회지
    • /
    • 제56권4호
    • /
    • pp.5-28
    • /
    • 2022
  • 이 연구에서는 해외 도서관의 LD 구축 사례를 발행 데이터세트, 재사용 어휘집, 인터링킹 외부 데이터세트를 중심으로 분석하고, 분석 결과를 토대로 국내도서관의 LD 구축 방안에 대한 기초적인 데이터를 확보하였다. 21개 해외 도서관 사례 분석 결과, 해외 도서관은 충실한 전거 LD를 구축하였고, 발행 LD를 활용한 새로운 서비스를 진행하였다. 이를 위해 해외 도서관은 도서관의 주도하에 다른 도서관과 문화기관들과 지역 내에서, 국가 내에서, 국가적으로 협력하였고, 이러한 협력을 바탕으로 특성화된 데이터세트를 발행하였다. 해외 도서관은 발행 LD의 가시성을 높이기 위해 Schema.org를 사용하였고, 기술의 세분화를 위해 BIBFRAME 등을 사용하여 다양한 개체를 정의하고, 정의된 개체에 기반하여 LD를 구축하였다. 해외 도서관은 다양한 개체를 관련 정보 연계와 검색 결과 디스플레이, 브라우징, 대량 다운로드에 활용하였다. 해외 도서관은 인터링킹 외부 데이터세트를 지속해서 현행화하였고, 외부 데이터를 직접적으로 활용하여 목록정보를 보강하였다. 이 연구에서는 도출된 시사점을 토대로 국내도서관의 LD 구축 시 고려할 점을 제안하였다. 연구 결과는 향후 국내도서관이 LD 서비스를 계획하거나 기존 서비스를 고도화할 때 기초자료로 활용될 수 있을 것이다.