• Title/Summary/Keyword: 속성데이터

Search Result 1,594, Processing Time 0.027 seconds

Location Generalization Method for Pattern Mining of Moving Object (이동 객체의 패턴 마이닝을 위한 위치 일반화 방법)

  • Ko, Hyun;Kim, Kwang-Jong;Lee, Yon-Sik
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2006.11a
    • /
    • pp.405-408
    • /
    • 2006
  • 사용자들의 특성에 맞게 개인화되고 세분화된 위치 기반 서비스를 제공하기 위해서는 방대한 이동객체의 위치 이력 데이터로부터 유용한 패턴을 추출하기 위한 시간 패턴 탐사가 필요하다. 기존의 시간 패턴 탐사 기법들은 이동 객체의 시간에 따른 공간 속성들의 변화를 충분히 고려하지 못하거나, 시공간 속성을 동시에 고려한 패턴 탐사는 가능하나 제약을 가진 공간 정보를 포함하는 패턴 탐사 문제에는 적용하기 어렵다. 따라서 이동 객체의 위치 이력 데이터들에 대한 시공간적 속성들을 동시에 고려하여 다양한 이동 패턴들 중 공간 제약을 만족하는 패턴들을 추출하기 위한 새로운 이동 패턴 탐사 기법이 요구된다. 이러한 패턴 탐사 기법의 개발을 위해서는 상세 수준의 위치 이력 데이터들을 공간 영역 정보 형태로 변환하는 위치 일반화 접근법이 필요하다. 이에 본 논문에서는 객체의 위치값과 공간 영역간의 위상 관계를 고려하여 이동 객체의 위치 속성에 대한 공간영역으로의 일반화 방법을 제안한다. 이동 객체의 상세 수준의 위치 정보에서는 의미있는 패턴을 찾기가 어렵기 때문에 데이터 전처리 과정을 통해 일반화된 데이터 집합을 형성함으로써 효율적인 이동 객체의 시간 패턴 마이닝을 유도할 수 있다.

  • PDF

Performance Evaluation between Models for Smoker Classification Based on Health Examination Data (건강검진 데이터 기반 흡연자 분류를 위한 모형별 성능 분석)

  • Yun, Jisun;Yu, Heonchang
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2018.10a
    • /
    • pp.648-651
    • /
    • 2018
  • 흡연여부를 감별하는 지표가 있지만 반감기 등 여러 가지 요인에 따라 결과가 변한다는 단점이 있다. 그렇기 때문에 흡연여부 감별 시 외부요인에 영향을 덜 받는 지표가 필요하게 되었다. 그래서 흡연 여부 감별하는데 적합한 모형을 찾아 외부요인에 영향이 적은 지표를 개발에 도움이 될 것을 기대하며 연구를 진행하였다. 실험은 국민건강보험공단에서 제공한 건강검진정보데이터를 기반으로, SVM, Logistic Regression, KNN 등의 머신러닝 모델을 이용하여 흡연 여부를 감별하는 것을 진행한다. 이 실험은 속성에 따른 모형의 성능변화와 학습데이터 수에 따른 모형의 성능변화에 대한 2가지 측면에서 모델의 성능을 측정하였다. 모델의 평가는 정확도(accuracy), 정밀도(precision), 재현율(recall), 조화 평균(f1-score)으로 진행하였으며, 약 70퍼센트 정도의 정확도와, 60퍼센트 대의 재현율을 보인다. 실험 결과, SVM이 속성에 따른 모형의 성능 변화 실험에서는 63%의 재현율, 학습데이터 수에 따른 성능 변화 실험에서는 68%의 재현율을 보여, 흡연자 판별에 가장 좋은 성능을 보였다. 또한 재현율을 기준으로 실험 차수별로 가장 좋은 성능을 보인 모델과 가장 저조한 성능을 보인 모델의 차이를 비교한 결과, '속성에 따른 모형의 성능 변화 실험'에서는 최고 36%의 차이를 보였으며, '학습데이터 수에 따른 성능 변화 실험'에서 최고 42%의 차이를 보여 주었다. 이에 판별을 위한 속성도 중요하지만, 적합한 모형 선택 또한 중요하다는 것을 확인하였다.

Integrated Method Based on Rough Sets for Knowledge Discovery (지식 발견을 위한 라프셋 중심의 통합 방법 연구)

  • Chung, Hong;Chung, Hwan-Mook
    • Journal of the Korean Institute of Intelligent Systems
    • /
    • v.8 no.6
    • /
    • pp.27-36
    • /
    • 1998
  • This paper suggests an integrated method based on rough sets for discovering useful knowledge from a large databse. Our approach applies attribute-oriented concept hierarchy ascension technique to extract generalized data from actual data in database, induction of decision trees to measure the information gain, and knowledge reduction method of rough set theory to remove superfluous attributes and attribute values. The integrated algorithm first reduces the size of database through the concept generalization, reduces the number of attributes by means of eliminating condition attributes which have little influence on decision attribute, and finally induces simplified decision rules by removing the superfluous attribute values by analyzing the dependency relationships among the attributes.

  • PDF

Feature Selection by Genetic Algorithm and Information Theory (유전자 알고리즘과 정보이론을 이용한 속성선택)

  • Jo, Jae-Hun
    • Proceedings of the Korean Institute of Intelligent Systems Conference
    • /
    • 2007.11a
    • /
    • pp.108-111
    • /
    • 2007
  • 속성선택(Feature Selection)은 패턴분류 문제에서 분류기들의 성능을 향상시킬 수 있는 중요한 부분으로 다양한 기법들이 연구되어지고 있다. 특히, 많은 변수와 속성들을 가지는 데이터를 패턴분류 하는 과정에서 주요 속성부분집합을 추출하여 이용함으로써 분류기의 연산속도 및 정확도를 향상시킬 수 있다. 본 논문에서는 유전자 알고리즘과 정보이론의 상호정보량을 이용하여 속성선택을 하는 기법을 제안하였다. 제안된 기법의 성능을 평가하기 위하여 패턴분류 문제에 적용하고 그 성능이 우수함을 확인하였다.

  • PDF

A Study on the Object Interoperability using the Fuzzy Property Space (퍼지 속성 공간을 이용한 객체 상호 작용에 관한 연구)

  • 이진호;이전영
    • Proceedings of the Korean Institute of Intelligent Systems Conference
    • /
    • 1997.10a
    • /
    • pp.387-390
    • /
    • 1997
  • 퍼지 속성 공간(fuzzy property space)은 데이터베이스의 각 객체를 분류하고 분석하는데 유용한 도구로서 사용됨을 보였다[1]. 이는 수학적인 속성 집합 이론(property set theory)[2]에 근간을 두고 만들어진 이론으로, 데이터의 분석에 무척 유리한 도구로 사용될 수 있다. 본 연구에서는 근래에 들어 많은 연구가 이루어지고 있는 분산 데이터베이스 환경(distributed database management)에서 이를 응용해보고자 시도하였다. 즉, 분산 환경에서 어떠한 객체의 데이터를 상호 교환하고자 하는 간단한 상호 작용(object interoperability)을 수행함에 있어, 각 시스템은 이들 상호간의 규약에 의한 합치(object integration)를 이룰 수 있어야 한다. 여기에 퍼지 속성 공간을 이용하여, 가장 근사한 합치를 이룰 수 있도록 하는 것이다. 예를 들어, A와 B 두 개의 시스템에서 객체의 상호 작용을 수행한다. 하면, A시스템의 하나의 객체를 두 개의 공통된 속성 공간에 위치시키고, B라는 시스템에서 이를 다시 해석하여 자신의 데이터베이스에 입력으로 받아들이는 방식을 채택하여 상호 작용의 연산을 설계하는 방식이다.

  • PDF

an Automatic Calculation Method of Feature Weights in k Nearest Neighbor Algorithms (kNN 알고리즘에서의 속성 가중치 자동계산 방법)

  • Lee, Kang-Il;Lee, Chang-Hwan
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2005.05a
    • /
    • pp.423-426
    • /
    • 2005
  • 기억기반학습의 일종인 최근접 이웃(k nearest neighbor) 알고리즘은 과거의 데이터들 중에서 새로운 개체와 유사한 데이터들을 이용해서 새로운 개체의 목적 값을 예측하는 것이다. 이 경우 속성의 가중치를 계산하는 방식은 kNN의 성능을 결정하는 중요한 요소가 된다. 본 논문에서는 기존의 다른 이론들과 달리 정보이론에서 사용되는 엔트로피 개념을 이용해서 속성의 가중치를 이론적이고, 효과적으로 계산하는 새로운 방법을 제시하고자한다. 제안된 방법은 각 속성이 목적속성에 제공하는 정보의 양에 따라 가중치를 자동으로 계산하여 kNN의 성능을 향상시킨다. 마지막으로 이러한 방식의 성능을 다수의 실험을 통해 비교하였다.

  • PDF

A Vertical File Partitioning Method Allowing Attribute Replications (속성 중복을 허용한 파일 수직분할 방법)

  • 유종찬;김재련
    • The Journal of Information Technology and Database
    • /
    • v.4 no.2
    • /
    • pp.3-19
    • /
    • 1998
  • 관계형 데이터베이스 성능을 향상시키는데 중요한 요소 중의 하나는 트랜잭션을 처리하기 위해 데이터를 디스크에서 주 기억장치로 옮기는데 필요한 디스크 액세스(access) 횟수이다. 본 연구는 관계형 데이터베이스에서 트랜잭션을 처리할 때, 릴레이션(relation)을 속성의 중복할당을 허용하여 분할하고, 디스크에 단편(fragment)으로 저장하므로써 필요한 단편만을 액세스하여 디스크의 액세스 횟수를 줄이는 방법을 연구하였다. 본 연구에서는 속성의 중복할당을 허용하여 디스크의 액세스 횟수를 최소화시킬 수 있는 수직분할문제에 수리모형을 조회, 갱신트랙잭션을 모두 고려하여 0-1 정수계획법으로 개발하였다. 또한 모형에 대한 최적해법으로 분지한계법을 제안하였으며, 분지한계법으로 큰 문제를 푸는데는 많은 시간이 소요되므로 계산량을 줄일 수 있는 초기처리방법과 비용계산방법을 제안하였다. 속성의 중복을 허용하여 구한 해가 중복을 고려하지 않은 경우의 해보다 디스크 액세스횟수가 감소한 것으로 나타났으며, 갱신트랜?션의 수가 증가함에 따라 중복되는 속성의 수가 감소하는 결과를 나타내었다.

A Study on the application replotting design of GIS (GIS를 활용한 환지설계)

  • Han, Soo-Heup;Choi, Yun-Soo;Park, Sun-Mi;Kim, Young-Gil
    • Proceedings of the Korean Association of Geographic Inforamtion Studies Conference
    • /
    • 2008.10a
    • /
    • pp.333-334
    • /
    • 2008
  • 본 연구에서는 GIS 기반의 환지설계방식을 도입하여 환지업무에 사용되는 도형과 속성자료를 GIS데이터로 구축하고 공간데이터 결합 및 속성을 연계(Link)하여 환지설계업무를 수행하였다.

  • PDF

Investigating Opinion Mining Performance by Combining Feature Selection Methods with Word Embedding and BOW (Bag-of-Words) (속성선택방법과 워드임베딩 및 BOW (Bag-of-Words)를 결합한 오피니언 마이닝 성과에 관한 연구)

  • Eo, Kyun Sun;Lee, Kun Chang
    • Journal of Digital Convergence
    • /
    • v.17 no.2
    • /
    • pp.163-170
    • /
    • 2019
  • Over the past decade, the development of the Web explosively increased the data. Feature selection step is an important step in extracting valuable data from a large amount of data. This study proposes a novel opinion mining model based on combining feature selection (FS) methods with Word embedding to vector (Word2vec) and BOW (Bag-of-words). FS methods adopted for this study are CFS (Correlation based FS) and IG (Information Gain). To select an optimal FS method, a number of classifiers ranging from LR (logistic regression), NN (neural network), NBN (naive Bayesian network) to RF (random forest), RS (random subspace), ST (stacking). Empirical results with electronics and kitchen datasets showed that LR and ST classifiers combined with IG applied to BOW features yield best performance in opinion mining. Results with laptop and restaurant datasets revealed that the RF classifier using IG applied to Word2vec features represents best performance in opinion mining.

An Addaptive SAO Method for Efficient Texture Video Coding of V-PCC (V-PCC의 효율적인 Texture 영상 부호화를 위한 적응적 SAO 방법)

  • Son, Sohee;Gwon, Daehyeok;Choi, Haechul
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2022.06a
    • /
    • pp.1216-1217
    • /
    • 2022
  • 포인트 클라우드는 객체 또는 장면을 재구성하기 위한 3D 데이터의 표현 방식 중 하나로써 가상 및 증강 현실을 포함한 다양한 분야에서 활용되고 있다. 포인트 클라우드 데이터는 품질에 따라 수많은 포인트로 이루어질 수 있으며, 이와 관련된 데이터의 양은 2차원 영상의 데이터보다 상당히 많다. 따라서 포인트 클라우드 데이터를 사용하여 다양한 서비스를 제공하기 위해서는 포인트 클라우드의 특징을 고려한 효율적인 압축 기술이 요구되며, 이에 따라 국제 표준화 단체의 Moving Picture Experts Group은 포인트 클라우드 데이터의 효율적인 압축을 위한 V-PCC 표준을 제정하였다. V-PCC는 포인트 클라우드 데이터를 다수의 2차원 공간으로 투영하여 점유 맵, 기하 영상, 그리고 속성 영상을 생성하고 각 2차원 영상을 기존의 비디오 코덱을 활용하여 압축하는 방식이다. 기존의 코덱을 사용하여 압축함에 따라 활용성이 높지만, 3차원 데이터를 다수의 2차원 영상을 통하여 압축하기 때문에 압축의 효율성을 높이기 위한 많은 연구가 필요하다. 본 논문에서는 V-PCC의 부호화 효율을 높이기 위해 점유 맵의 투영 정보를 활용한 속성 영상의 효율적인 압축 방법을 소개하고 이를 위한 적응적 SAO 방법을 제안한다. 실험에서 제안 방법은 V-PCC의 속성 영상에 대해 약 3.2%의 부호화 효율을 보인다.

  • PDF