• 제목/요약/키워드: 데이터 연관

검색결과 1,883건 처리시간 0.028초

Socially aware computing을 위한 대규모 데이터베이스의 연관 규칙 감축 기법 (Association Rule Mining Scheme of Large-Scale Database for Socially Aware Computing)

  • 정휘운;박건용;박종창;윤희용
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2013년도 제47차 동계학술대회논문집 21권1호
    • /
    • pp.291-294
    • /
    • 2013
  • 연관 규칙 감축 기법은 대규모 데이터를 사용하는 Socially aware computing분야에서 매우 중요한 이슈이다. 본 논문에서는 수집된 각종 데이터들을 각 속성 기준에 따라 이진 변환한 후 가중치를 부여하고 논리식 감축 방법을 이용하여 신뢰성을 보장하는 규칙을 도출하는 새로운 데이터 감축 기법을 제안한다. 이는 컴퓨터 시뮬레이션 결과 기존의 방식들에 비해 지지도, 신뢰도, 규칙 감소율, 연관 규칙 추출 시간에 좋은 성능을 보였으며 이는 빠른 시간 내에 신뢰성 높은 대규모 데이터 처리가 필요한 Socially aware computing분야에 적합하다고 판단한다.

  • PDF

연관분석에 기반한 건강검진결과 시각화 방법 (Association Mining based Visualization Method for Health Examination Results)

  • 김준우;박상찬
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2014년도 제49차 동계학술대회논문집 22권1호
    • /
    • pp.281-282
    • /
    • 2014
  • 병의원에서 다양한 정보시스템을 도입하면서 환자들과 관련된 방대한 의료 데이터들이 전자적인 형태로 축적되어 왔고, 최근에는 의료진이나 환자에게 적절한 정보를 제공하는데 이러한 데이터를 활용하고자 하는 노력이 이어지고 있다. 그러나 의료 데이터는 분량이 방대하고 전문적인 내용을 다루기 때문에 이에 기반한 정보를 개인 환자에게 제공하는데 있어서는 데이터에 포함된 내용을 사용자의 이해가 편리한 형태로 가공하는 것이 중요하다. 이에 본 논문에서는 연관분석과 관련된 행렬 기반 표현 방법을 기반으로 한 하이브리드 시각화 방법을 개발하고, 이를 건강검진 결과에 적용하는 것을 제안하고자 한다.

  • PDF

밀리미터파 대역 차량용 레이더를 위한 순서통계 기법을 이용한 다중표적의 데이터 연관 필터 (Multi-target Data Association Filter Based on Order Statistics for Millimeter-wave Automotive Radar)

  • 이문식;김용훈
    • 대한전자공학회논문지SP
    • /
    • 제37권5호
    • /
    • pp.94-104
    • /
    • 2000
  • 차량 충돌 경보용 레이더 시스템의 개발에 있어 표적 추적의 정확도와 신뢰도는 매우 중요한 요소이다. 여러 표적을 동시에 추적할 때 중요한 것은 표적과 측정치와의 데이터 연관(data association) 이며, 부적절한 측정치가 어느 표적과 연관되면 그 표적은 트랙을 벗어나 추적능력을 잃어버릴 수 있고 심지어 다른 표적의 추적에도 영향을 줄 수 있다 지금까지 발표된 대부분의 데이터 연관 필터들은 근접하여 이동하는 표적들의 경우 이와 같은 문제점을 보여왔다 따라서, 현재 개발되고 있는 많은 알고리즘들은 이러한 데이터 연 관 문제의 해결에 초점을 맞추고 있다 본 논문에서는 순서통계(order statistics)를 이용한 새로운 다중 표적의 데이터 연관 방법에 대하여 서술하고자 한다 OSPDA와 OSJPDA로 불리는 제안된 방법은 각각 PDA 필터 또는 JPDA 필터에서 계산된 연관 확률을 이용하며 이 연관 확률을 결정 논리(dicision logic)에 의한 가중치로 함수화 하여 표적과 측정치 사이에 최적 혹은 최적 근처의(near optimal) 데이터 연관이 가능하도록 한 것이다 시뮬레이션 결과를 통해, 제안한 방법은 기존의 NN 필터, PDA 필터, 그리고 JPDA 필터의 성능과 비교 분석되었으며, 그 결과 제안한 OSPDA, OSJPDA 필터는 PDA, JPDA 필터보다 추적 정확도에 대해 각각 약 18%, 19% 이상으로 성능이 향상됨을 확인하였다 제안한 방법은 CAN을 통해 차량 엔진 등의 ECU와 통신하도록 개발된 DSP 보드를 이용하여 구현되었다

  • PDF

빈발 패턴 네트워크에서 연관 규칙 발견을 위한 아이템 클러스터링

  • 오경진;정진국;조근식
    • 한국지능정보시스템학회:학술대회논문집
    • /
    • 한국지능정보시스템학회 2007년도 한국지능정보시스템학회
    • /
    • pp.321-328
    • /
    • 2007
  • 데이터마이닝은 대용량의 데이터에 숨겨진 의미있고 유용한 패턴과 상관관계를 추출하여 의사결정에 활용하는 작업이다. 그 중에서도 고객 트랜잭션의 데이터베이스에서 아이템 사이에 존재하는 연관규칙을 찾는 것은 중요한 일이 되었다. Apriori 알고리즘 이후 연관규칙을 찾기 위해 대용량 데이터베이스로부터 압축된 의미있는 정보를 저장하기 위한 데이터 구조와 알고리즘들이 제안되어 왔다. 본 논문에서는 정점으로 아이템을 표현하고, 간선으로 두 아이템집합을 표현하는 빈발 패턴 네트워크(FPN)이라 불리는 새 자료 구조를 제안한다. 빈발 패턴 네트워크에서 아이템 사이의 연관 관계를 발견하기 위해 이 구조를 어떻게 효율적으로 사용 하느냐에 초점을 두고 있다. 구조의 효율적인 사용을 위하여 한 아이템이 클러스터 내의 아이템과는 유사도가 높고, 다른 클러스터의 아이템과는 유사도가 낮도록 네트워크의 정점을 클러스터링하는 방법을 사용한다. 실험은 신뢰도, 상관관계 그리고 간선 가중치 유사도를 이용하여 네트워크에서 아이템 클러스터링의 정확도를 보여준다. 본 논문의 실험 결과를 통해 신뢰도 유사도가 네트워크의 정점을 클러스터링할 때 클러스터의 정확성에 가장 많은 영향을 미친다는 것을 알 수 있었다.

  • PDF

가중치가 부여된 연관 규칙을 이용한 문서 분류 (Document Classification using Weighted Associative Classifier)

  • 김흥남;이기성;조근식
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 가을 학술발표논문집 Vol.30 No.2 (1)
    • /
    • pp.154-156
    • /
    • 2003
  • 인터넷의 급속한 성장과 더불어 많은 정보와 데이터들을 인터넷을 통하여 얻을 수 있게 되었으며 많은 단체들이 문서들을 웹을 통하여 이용 가능하게 만들고 있다. 이에 따라 다양한 정보와 데이터를 효과적으로 분류하고 검색하는 문서 분류 (Document Classification)에 대한 알고리즘이 다양한 분야에서 널리 연구되어 왔으며 본 논문에서 초점을 두고 있는 전자 도서관 (Digital Library) 분야에서도 활발히 연구되어지고 있다. 하지만 기존의 전자 도서관의 문서 분류 알고리즘들은 문서들의 각 단락의 비중을 고려하지 않은 채 단어들의 발생 빈도에 초점을 두어 많은 잡음 단어 (Noise Term)를 포함하고 그로 인하여 분류 성능이 떨어졌다. 본 논문에서는 문서 단락의 중요도에 따라 다른 .가중치를 부여하여 단어 지지도 (Term Support)가 높은 단어들을 추출하고 그 단어들로 연관 규칙 (Association Rules)을 이용하여 분류 규칙을 생성하는 방법을 제안한다. 제안된 방법의 성능평가를 위해 문서 분류에 널리 쓰이는 나이브 베이지안 분류자 (Na$\square$ve Bayesian Classifier) 및 기존의 단순 연관 규칙 분류자 (Associative Classifier)와 비교 평가하였다. 그 결과, 각 가중치가 부여된 연관 규칙 분류 방법이 나이브 베이지안 분류 방법과 단순 연관 규칙 분류 방법보다 높은 성능을 보였다.

  • PDF

NFP-Algorithm 알고리즘을 기반한 텍스트 연관 패턴 추출 (Text Assocation Pattern Extraction using NFP-tree Algorithm)

  • 유수경;김교정
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2004년도 춘계학술발표대회
    • /
    • pp.97-100
    • /
    • 2004
  • 인터넷상에서 존재하는 많은 데이터베이스들 중 현실적으로 유용한 정보를 가지고 있는 것은 텍스트 데이타베이스이다. 텍스트 마이닝 기법에서 비구조적인 특징을 가진 텍스트 데이타로부터 유용한 정보를 분석하고 추출하여 연관된 패턴을 탐색하는 과정은 중요한 연구과제이다. 이에 본 논문은 인터넷에서 저장된 텍스트 데이터를 가지고 기존 텍스트 마이닝 기법 중 연관탐색 기법을 적용하여 사용자 중심의 연관된 패턴을 찾아서 의미있는 정보를 얻고자 한다. 탐색하기 위해 먼저 전처리 작업으로 용어의 객체를 추출하고. 추출된 각 객체들은 대용량 데이터에서 시간적, 공간적면에서 효율적인 연관탐색 기법인 NFP-Algorithm(N-most interesting k-itemsets Using FP-tree and FP-Growth)을 적용시켜서 의미있는 정보를 추출했다. 또한 Apriori계 Algorithm, FP-Algorithm, NFP-Algorithm을 비교하여 NFP-Algorithm이 시간적면에서 효율적임을 보여주었다.

  • PDF

사회 연결망 분석을 활용한 공공데이터 간 연관성에 관한 연구 (A Study on the Linkability of Public Information Using Social Network Analysis)

  • 정다운;이미숙;신동빈
    • 한국측량학회지
    • /
    • 제35권6호
    • /
    • pp.461-470
    • /
    • 2017
  • 한국은 정부 3.0 정책을 기조로 하여 경제 성장을 증진하기 위한 주요 추진 동력으로써 공공데이터의 활용이 주요 이슈로 부각되고 있다. 그러나 한국정부는 현재 공공 영역에 축적되어 있는 데이터의 공개나 제공 수준에 머무르고 있다. 따라서 단순 공공데이터뿐만 아닌 공공데이터 간의 연계를 통한 새로운 정보를 창출하고, 관련 서비스의 개발 등이 요구되고 있다. 이에 본 연구는 공공데이터 목록을 수집 및 정제하고, 사회 연결망 분석을 통해 핵심 주제별 연관성이 높은 공공데이터 정보 목록을 도출하였다. 이를 위해서 첫째, 수집한 공공데이터 목록을 지자체 담당자를 대상으로 설문조사를 수행하였다. 이를 통해 접근 용이성 측면과 가공 용이성 측면에서 전처리 과정을 수행하여 불필요한 공공데이터를 정제하였다. 다음으로 개념적인 차원에서의 공공데이터 간 연관성을 분석하기 위해서 형태소 분석을 통해 공공데이터의 대표 키워드를 도출하였다. 이후 사회 연결망 분석을 활용하여 핵심 키워드(상위 10개) 및 연관성이 높은 공공데이터 목록을 도출하였다. 본 연구결과를 바탕으로, 향후에는 공공데이터 간 연계를 통해 융${\cdot}$복합된 새로운 정보를 기반으로 다양한 스마트시티 서비스를 창출할 수 있을 것으로 전망된다. 또한, 이를 위해서는 개념적 연계뿐만 아니라 실질적인 연계 방안이 도출되어야 할 것이며, 이에 따른 법${\cdot}$제도적 정비도 필요할 것으로 사료된다.

이력 영상의 시간 간격과 연관성에 의한 데이터 관리 기법 (Management of Historical Images by Time Interval and Interrelation)

  • 윤홍원
    • 한국멀티미디어학회논문지
    • /
    • 제4권6호
    • /
    • pp.543-553
    • /
    • 2001
  • 본 논문에서는 기존 의료 영상 이동 방법에서 생기는 문제점을 해결하기 위해서 의료 영상 데이터의 관리기법을 제안하였다. 의료영상 데이터의 관리기법으로써 EAT(Expanded Average Transaction time) 데이터 이동 기법과 시간 연관성 기반 데이터 저장 방법을 제안하였다. EAT데이터 이동 기법에서는 각 저장 영역에 저장되는 개체 버전을 구분하는 경계값과 각 영역에 저장되는 개체 버전을 정의하였다 시간 연관성에 기반한 데이터 저장 방법에서는 임의 두 개체 버전에 대한 겹침의 정도와 간격의 정도를 정의하였고, 두 값을 통합하여 개체 버전을 저장 장치에 배치하는 방법을 보였다. 시간 질의의 비율을 변화시키면서 클러스터의 참조 회수를 비교한 실험에서 기존의 방법보다 제안한 방법의 클러스터 참조 회수가 적게 나타났다.

  • PDF

음의 연관성 규칙 생성을 위한 음의 기여 순수 신뢰도의 제안 (Negatively attributable and pure confidence for generation of negative association rules)

  • 박희창
    • Journal of the Korean Data and Information Science Society
    • /
    • 제23권5호
    • /
    • pp.939-948
    • /
    • 2012
  • 데이터 마이닝 기법들 중에서 가장 많이 활용되고 있는 연관성 규칙은 방대한 데이터베이스에서 항목간의 관계를 흥미도 측도에 의해 명확히 수치화함으로써 그들간의 관련성을 표시해주는 기법이다. 양의 연관성 규칙 마이닝이 임의의 한 항목이 발생하면 다른 항목도 발생한다는 규칙을 생성하기 위한 기법인 반면에, 음의 연관성 규칙은 어느 항목이 발생하면 다른 항목은 발생하지 않는다는 규칙을 찾아내는 기법이다. 음의 연관성 규칙은 양의 연관성 규칙의 활용과 마찬가지로 고객의 구매 경향 및 마케팅 정책을 제시할 수 있고 교차판매와 매장 진열 등과 같이 타겟 마케팅에 활용 가능하다. 양의 연관성 규칙에 음의 연관성 규칙을 추가하게 되면 어떤 제품을 판매하기 위해서는 그 제품만 마케팅 하는 것뿐만 아니라 더 나아가 그 제품이 아닌 어느 제품을 마케팅 하는것이 필요한지를 판단할 수 있다. 본 논문에서는 기존의 음의 신뢰도의 단점을 보완할 수 있는 음의 기여 순수 신뢰도를 제안한 후, 이에 대해 흥미도 측도가 가져야 할 조건들을 조사하였으며, 예제 데이터를 활용하여 음의 기여 순수 신뢰도의 유용성을 고찰하였다.

데이터의 의미적 정보를 공정하게 반영한 인터트랜잭션들에 대한 연관규칙 탐사 (Association rule mining for intertransactions with considering fairly data semantics)

  • 정희택
    • 한국전자통신학회논문지
    • /
    • 제9권3호
    • /
    • pp.359-368
    • /
    • 2014
  • 최근에는 트랜잭션들 사이의 문맥을 반영하기 위해, 단위 트랜잭션들 사이의 관계를 반영한 확장 트랜잭션을 생성하고 이를 대상으로 인터트랜잭션들에 대한 연관 규칙 탐사방안이 연구되었다. 본 연구에서는 기존 인터트랜잭션들에 대한 연관규칙 탐사 기법에 존재하는 두 가지 문제를 제시하였고 이를 해결하기 위한 방안을 제안하였다. 첫째, 인접한 트랜잭션들 상에 존재하는 데이터의 의미적 변화 정보를 반영하기 위한 방안을 제안했다. 둘째, 트랜잭션을 인터트랜잭션으로 변환하는 과정에서 발생하는 불공정 고려를 해결하기 위한 방안을 제안했다. 이를 통해 기존 연구보다 의미 있는 규칙을 생성할 수 있다. 이를 해양 환경 데이터를 기반으로 실험하여 제시한다.