• Title/Summary/Keyword: 데이터 비교

Search Result 12,458, Processing Time 0.049 seconds

Data selection method for Incremental learning using prior evaluation of data importance (데이터 중요도의 사전 평가를 이용한 증가학습을 위한 데이터 선택 방법)

  • 이선영;조성준;방승양
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 1998.10c
    • /
    • pp.339-341
    • /
    • 1998
  • 다층 퍼셉트론 학습은 학습 데이터의 능동적인 선택 여부에 따라 능동적 학습(Active learning)과 피동적 학습(Passive learning)으로 구분할 수 있다. 기존의 능동적 학습 방법들은 학습 데이터의 중요도를 측정할 수 있는 기준(measure)을 제시하고 이 기준에 따라 학습 데이터를 선택하는 방법을 취하고 있다. 이 방법들은 학습 데이터 선택을 위해 Hessian Approximation과 같은 복잡한 계산이나 학습 데이터를 선택하는 과정에 있어서 데이터의 중요도를 평가하기 위한 반복적인 계산을 필요로 한다. 본 논문에서는 학습 데이터 선택 시 반복적인 계산이 필요하지 않는 비교사 학습을 이용한 능동적 학습 데이터 선택 방법을 제안하고 그 수렴 특성과 일반화 성능을 분석한다. 또한 비교 실험을 통하여 제안된 방법이 기존의 능동적 학습방법보다 간단한 계산만으로 수렴 속도를 향상시키며 일반화에도 뒤떨어지지 않음을 보인다.

  • PDF

Study of Mobile Phone Antenna for SAR Reduction (SAR 저감을 위한 이동통신 단말기 안테나 연구)

  • 정민석;이범선
    • Proceedings of the Korea Electromagnetic Engineering Society Conference
    • /
    • 2001.11a
    • /
    • pp.123-126
    • /
    • 2001
  • 본 논문에서는 균질, 비균질 두부 모델에 대한 SAR 평가 방법들을 비교 분석한 후, 균질 두부모델에 대한 SAR 데이터가 비균질 두부 모델의 그것과 유사함을 확인한다. 이러한 결과는 근거로 두부 모델을 가정하여, 설계된 λ/8 Back-mounted PIFA 사용시의 SAR 데이터와 기존의 안테나 사용시의 SAR 데이터를 비교 분석한다. 이러한 비교 분석 결과 기존의 폴더형 안테나가 구조 특성상 전형적인 통화자세에서 방사부가 두부에서 멀어 1g-SAR와 10g-SAR가 λ/8 Back-mounted PIFA 보다 약 50% 작으나 전체 두부 흡수율은 오히려 높음을 알 수 있었다.

  • PDF

Performance Comparison of Cell-based Clustering Method for Data Mining Applications (데이터마이닝을 위한 셀-기반 클러스터링 방법의 성능비교)

  • 진두석;장재우
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2001.04b
    • /
    • pp.124-126
    • /
    • 2001
  • 최근 데이터마이닝 응용분야에서 대용량의 고차원 데이터가 증가하고 있기 때문에 이를 효율적으로 처리할 수 있는 방법이 요구된다. 이를 위해 CLIQUE 방법과 셀-기반 클러스터링 방법을 선택하기 위해, 셀-기반 클러스터링 방법을 CLIQUE 방법 및 CLIQUE 방법에 근사정보(Approximation)를 결합한 방법과 성능 비교를 수행한다. 성능비교 결과, 셀-기반 클러스터링 방법이 데이터 클러스터링 및 데이터 검색시간에서 가장 우수한 성능을 보이며, 정확율은 CLIQUE 방법에 비해 다소 뒤떨어지거나 전체적인 효율성에서 매우 우수한 성능을 보인다.

  • PDF

GML Data Integration Method for Load Processing of Spatial Data Warehouse (공간 데이터 웨어하우스에서 GML 데이터의 효율적인 적재를 위한 데이터 통합 기법)

  • Jeon Byung-Yun;Lee Dong-Wook;You Byeong-Seob;Bae Hae-Young
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2006.05a
    • /
    • pp.27-30
    • /
    • 2006
  • GIS 분야에서 데이터 교환의 표준으로 OGC(Open Geospatial Consortium)에서 GML(Geography Markup Language)이 제안되어 웹 어플리케이션이나 공간 데이터 교환에서 사용이 일반화 되어가고 있다. 또한, 공간 데이터를 효과적으로 수집하여 의사결정을 지원하기 위한 시스템인 공간 데이터 웨어하우스에서도 GML 데이터를 추출하여 소스 데이터로 활용하는 것이 요구되고 있다. 하지만 GML 은 반구조형식(semi-structured)의 데이터 형식을 가진다. 따라서 기존 구조적인 데이터와는 추출하는 방식이 다르므로 GML 의 특징에 맞는 공간 데이터 추출이 수행되어야 한다. 본 논문에서는 공간 데이터 웨어하우스에서 GML 기반의 공간 데이터 소스를 추출할 때, 중복되는 공간 객체를 하나의 표현으로 통합하여 효율적으로 적재하는 기법을 제안한다. 이는 GQuery를 이용하여 GML 데이터를 추출한 후, GML 스키마를 메타데이터에서 관리하는 스키마 정보와 비교하여 공간 데이터 웨어하우스에 통합된 공간 데이터를 제공하는 기법이다. 성능평가에서는 기존의 GML 데이터를 추출하는 기법과 제안기법과의 비교를 통하여 제안 기법의 기존 기법에 비해 평균적으로 약 9.95%의 성능향상을 보였다.

  • PDF

A Study on the Compression Methods of Hangul Data File by the Huffman Encoding (허프만부호화 방식에 의한 한글데이터의 압축에 관한 비교 연구)

  • Nam, Sang-Kee;Chung, Jin-Wook
    • Annual Conference on Human and Language Technology
    • /
    • 1989.10a
    • /
    • pp.168-173
    • /
    • 1989
  • 데이터의 압축은 화일의 저장공간과 전송시간을 줄이는 중요한 이점을 제공한다. 국내에는 많은 경우 데이터 화일에 2 바이트로 구성된 표준한글부호를 포함하고 있다. 본 논문에서는 2 바이트로 부호화 된 한글을 포함한 데이터 화일을 허프만 부호화 방식에 의해 압축 할때 한글을 한 바이트 단위로 인식하여 압축하는 경우와 두 바이트 단위로 인식하여 압축하는 경우의 여러가지 압축 특성을 비교하였다. 아울러 사전에 조사된 한글의 찾기 순서에 따라 고정된 압축 부호를 사용하는 경우와 앞에서 제시된 방법들을 비교하였다. 비교 결과 두 바이트 단위로 인식하여 압축하는 방법이 더 좋은 압축율을 보이었다.

  • PDF

A Comparative Study on Metadata Formats of Digital Contents (디지털콘텐츠 메타데이터 포맷의 비교 연구)

  • Cho, Yoon-Hee
    • Journal of the Korean Society for Library and Information Science
    • /
    • v.37 no.2
    • /
    • pp.135-152
    • /
    • 2003
  • With the rapid growth of the Internet, digital contents have increased in a geometric progression and the types also became much varied. In order to make it easier to identify and search digital contents on the Internet, which is basically a distributed network environment, it is essential to organize and manage metadata. In this study, we have comparatively analyzed the data elements of the meta data formats currently approached from different aspects in diverse fields, so as to provide basic materials for securing interoperability of the meta data formats. We selected Dublin Core, Semantic Header, MARC, IAFA Templates, and TEI Header as the general metadata formats of digital contents used widely in all areas, and we carried out comparisons and analyses based on the literature.

The Comparative Analysis of Water Quality Environment Data of Wando Onshore Seawater Farm and Tidal Observatory (완도 육상 해수 양식장과 조위관측소의 수질 환경 데이터 비교 분석)

  • Ye, Seoung-Bin;Kwon, In-Yeong;Kim, Tae-Ho;Park, Jeong-Seon;Han, Soon-Hee;Ceong, Hee-Taek
    • The Journal of the Korea institute of electronic communication sciences
    • /
    • v.16 no.5
    • /
    • pp.957-968
    • /
    • 2021
  • To improve the data on reliability of the onshore fish farm water quality monitoring system and operate the system efficiently, the water quality data of the onshore seawater fish farms which are progressing test operation, and the marine environmental information network(Wando tidal station) were compared and analyzed. Furthermore, data validation, data range filters, and data displacement checks were applied to analyze the data in a way that eliminates the data errors in water quality monitoring systems and increases the reliability of measurement data.

시공간 데이터를 위한 클러스터링 기법의 성능 비교

  • 강주영;이봉재;송재주;신진호;용환승
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2004.10b
    • /
    • pp.49-51
    • /
    • 2004
  • 최근 GPS시스템, 감시 시스템, 기상 관측 시스템과 같은 다양한 응용 시스템으로부터 수집된 시공간 속성을 가진 데이터를 분석하고자 하는 시공간 데이터 마이닝에 대한 관심이 더욱 높아지고 있다. 기존의 시공간 데이터 마이닝에 대한 연구는 문자.숫자 데이터를 기반의 마이닝 기법을 그대로 적용하고 있기 때문에 데이터의 시공간 속성을 충분히 고려한 분석으로는 한계가 많은 것이 사실이다. 본 논문에서는 패턴 인식과 클러스터링 능력이 뛰어나다고 알려진 SOM을 기반으로 시공간 클러스터링 모듈을 개발하고, 개발된 모듈의 성능과 클러스터링 정확성에 대하여 K-means, 응집 계층 알고리즘(Average Linkage, Ward)과 비교함으로써 시공간 데이터 마이닝을 위한 각 알고리즘들의 성능을 분석하였다 또한 입력 데이터의 특성과 클러스터링 결과를 더욱 정확하게 나타내어 가시적인 분석을 도울 수 있도록 시공간 데이터 클러스터링을 위한 가시화 모듈을 개발하였다.

  • PDF

우주환경 예보를 위한 VAP 데이터 처리 시스템 및 실시간 데이터 표출

  • Lee, JongKil;Lee, Jaejin;Kim, KyungChan
    • The Bulletin of The Korean Astronomical Society
    • /
    • v.40 no.1
    • /
    • pp.65.1-65.1
    • /
    • 2015
  • 근지구 우주환경 예측을 위해서는 태양의 주기, 흑점, 그리고 코로나의 방출과 함께 Van Allen Belt에 붙잡힌 고에너지 입자의 상태 변화가 우주 환경의 예보를 위한 중요 요소가 된다. 이런 고에너지 입자를 측정하기 위해서는 Van Allen Belt를 통과하는 VAP 위성의 데이터를 살펴보는 것이 매우 중요하다. 이 연구에서는 한국천문연구원에서 APL과 공동으로 VAP 위성의 실시간 데이터를 송수신하는 시스템을 구축하고, 그 실시간 데이터를 우주환경감시실에서 표출하여 Van Allen Belt의 변화를 바로 알아보는 과정을 기술 하였다. 이를 통해 데이터의 경향성을 바로 파악하여 특정 이벤트의 발생을 알아 낼 수 있을 뿐만아니라 과거의 데이터를 손쉽게 찾아볼 수 있었다. 별도의 프로그램을 개발하여 데이터의 표출 비교를 가능하게 함으로써 다른 위성의 데이터나 태양 이미지를 보지 않아도 자체 비교를 통해 이벤트의 발생을 찾아 볼 수 있게 되었다.

  • PDF

A Hierarchical Representatives Clustering Technique for Data Mining (데이터 마이닝을 위한 계층적 대표값 군집화 기법)

  • 안병주;김은주;이일병
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2000.10b
    • /
    • pp.69-71
    • /
    • 2000
  • 군집화는 데이터 집합을 유사한 데이터 개체들의 군집들로 분할하여 데이터 속에 존재하는 의미 있는 정보를 얻는 과정이다. 대부분의 군집화 기법들은 비교적 적은 양의 데이터를 대상으로 한 것이고 다차원 대용량의 데이터 처리에 관한 문제는 다루지 않고 있어서 데이터 마이닝을 위한 군집화 기법으로는 부적절하다. 따라서 본 논문을 통해 대용량의 데이터에 적용할 수 있는 새로운 군집화 알고리즘인 계층적 대표값 군집화(HRC) 기법을 제안한다. HRC는 자기조직화지도와 계층적 군집화 기법을 접목한 하이브리드 방법으로 두 단계에 거쳐 군집화를 수행한다. 첫 번째 단계에서 자기조직화지도를 통해 데이터를 요약하고, 두 번째 단계에서 요약된 대표값 정보만을 가지고 계층적인 군집화를 수행한다. 또한, 두 번째 단계의 계층적 군집화 적용시 양질의 군집을 발견하기 위해 군집간의 유사도를 측정하는 새로운 척도를 고안하였다. 그리고 실험을 통해 HRC와 기존 군집화 알고리즘이 발견한 군집의 질을 비교하여 성능을 평가했다.

  • PDF