• 제목/요약/키워드: Rule Items

검색결과 246건 처리시간 0.036초

주요 항목 집합을 이용한 문서 클러스터링 및 연관 탐사 기법 (Clustering and Association Rule Mining of Transactions using Large Items)

  • 서성보;김선철;이준욱;류근호
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 봄 학술발표논문집 Vol.27 No.1 (B)
    • /
    • pp.169-171
    • /
    • 2000
  • 현재 광범위한 웹 문서를 검색하기 위해서 많은 사용자들이 여러 종류의 검색엔진을 사용하고 있다. 하지만 대부분의 사용자는 검색엔진에 의해 검색된 문서의 순서화가 된 긴 리스트의 검색 문서들과 이들이 갖는 낮은 신뢰도에 대해 검색된 문서 중에 자신이 원하는 타당한 문서를 검색하는 불편함이 있어 왔다. 정보 검색에서 문서의 클러스터링은 검색된 결과를 재구성하는 효율적이고 선택적인 방법이다. 이 연구에서는 문서를 트랜잭션 관점에서 해석하여 하나의 클러스터에 대해 유사성을 측정하기 이해 주요항목과 비 주요항목으로 구분하여 각 트랜잭션의 최소 비용 계산을 통해 자동화된 문서 클러스터링 기법을 제안한다. 또한 클러스터링 단계에서 주요 항목간의 연관 규칙을 생성하기 위하여 문서 클러스터링을 위한 디스크 엑세스 동안 키워드간의 연관성을 찾을 수 있는 효율적인 검색 기법을 제시한다.

  • PDF

그룹 검사를 이용한 효율적인 혈액 검사 절차에 대한 연구 (An efficient blood testing procedurer by using group testing)

  • 양원석;채경철
    • 응용통계연구
    • /
    • 제9권1호
    • /
    • pp.17-29
    • /
    • 1996
  • 혈액 검사를 통해 어떤 질병의 감염 여부를 확인하려 한다. g명의 혈액을 검사한다고 하자. g명을 개별적으로 검사하면 g번의 검사가 필요하다. 그러나 g명의 혈액을 섞어서 검사하는 방법도 가능하다. 이처럼 여러 개를 한꺼번에 검사하는 방법을 그룹 검사라고 한다. 본 논문에서는, 질병률이 알려진 경우에 대한 그룹 검사 방법 중에서 계층적 도프만 절차를 이용한다. 그리고 검사의 종속성 때문에 발생하는 단축효고를 고려한다. 이를 통해 개별 검사보다 매우 효율적인 혈액 검사 절차를 제안하겠다. 아울러 실제 상황에 쉽고 간단하게 적용할 수 있는 실용적인 방법을 제안한다.

  • PDF

The Interaction between China, Japan, and Korea in the Export Market

  • JUNG, KYU-CHUL
    • KDI Journal of Economic Policy
    • /
    • 제38권2호
    • /
    • pp.45-62
    • /
    • 2016
  • This paper analyzes changes in the export potential and competitiveness of China, Japan, and Korea. The analysis of Japan's export market share reveals that in sectors where Korea's potential was strong in the early 1990s, Japan's market share diminished. This suggests the possibility that Korea was catching up with Japan, eating into Japan's market share. The same analysis of Korea's export market share in the 2000s shows, for items in which China's export potential was high, Korea's market share has declined comparatively since 2010, with the tendency growing much larger. China's export potential continues to expand in markets for Korea's key export products, making it difficult to rule out the possibility that Korea's competitiveness in key export products will be hindered, driven by the catching up of China. To respond to these challenges, it is important for Korea continuously to foster and enhance creative and core capabilities that latecomers will not easily be able to emulate.

  • PDF

Encoding of XML Elements for Mining Association Rules

  • Hu Gongzhu;Liu Yan;Huang Qiong
    • 한국정보시스템학회지:정보시스템연구
    • /
    • 제14권3호
    • /
    • pp.37-47
    • /
    • 2005
  • Mining of association rules is to find associations among data items that appear together in some transactions or business activities. As of today, algorithms for association rule mining, as well as for other data mining tasks, are mostly applied to relational databases. As XML being adopted as the universal format for data storage and exchange, mining associations from XML data becomes an area of attention for researchers and developers. The challenge is that the semi-structured data format in XML is not directly suitable for traditional data mining algorithms and tools. In this paper we present an encoding method to encode XML tree-nodes. This method is used to store the XML data in Value Table and Transaction Table that can be easily accessed via indexing. The hierarchical relationship in the original XML tree structure is embedded in the encoding. We applied this method to association rules mining of XML data that may have missing data.

  • PDF

시계열 데이터로부터 경향성을 이용한 순차패턴의 탐색 (Rule discovery for sequential patterns of trend from Time-Series)

  • 오용생;남도원;장지숙;이동하;이전영
    • 한국지능정보시스템학회:학술대회논문집
    • /
    • 한국지능정보시스템학회 2000년도 추계정기학술대회:지능형기술과 CRM
    • /
    • pp.325-332
    • /
    • 2000
  • 데이터마이닝 분야에서 시계얼 데이터(time-series data)내에서 숨어 있는 순차패턴의 발견은 상품(Items)이나 어떤 사건(Event)과 같이 데이터의 특징이 명확한 대상에 대한 연구는 많이 되어왔으나 수치 값을 가지는 시계열 데이터에서 이들 내부에 숨어 있는 패턴을 발견하는 것은 최근에 관심을 가지게 되었다. 우리는 시계열 데이터를 시간적 변화에 따라 값의 변화 경향(Trend)이 같은 데이터 그룹을 패턴 요소인 벡터 (Vestor)로 표현하여 이들을 이용해서 흥미로운 패턴들을 발견한다. 이와 같은 벡터적인 표현으로 우리는 벡터들 간의 포함관계를 적용해 모든 가능한 형태의 패턴 발견을 목적으로 한다. 또한 경향성을 가진 패턴 요소를 사건(Event)과 같이 취급함으로써 다양한 종류의 시계열 데이터가 동시에 발생될 때 이들 상호간에 연관된 시간적 패턴을 찾을 수 있다. 따라서 이 연구에서 제안하는 경향성을 기초로 한 순차패턴의 탐식은 기업내부의 판매실적의 변화 패턴이나, 고객의 구매 행동분석에 적용이 가능하리라 여겨진다

  • PDF

수출신용과 관련하여 우리나라 조선산업에 대한 WTO 무역분쟁 연구 (Study on the WTO Disputes over the Korean Shipbuilding Industry in Relation to Export Credit)

  • 이경래
    • 무역학회지
    • /
    • 제44권1호
    • /
    • pp.129-142
    • /
    • 2019
  • This paper draws implications on the ship finance of the Korean ECAs for shipbuilding industry from the perspective of WTO ASCM through studying the trade disputes on export credits. In consideration of the underwriting practice on the case-by-case basis, the ECAs' law regimes and their ship finance programs as such would be judged not conferring a benefit. The ship finance of international commercial banks could be treated as a market benchmark for the purpose of determining the existence of benefit in the ECA ship finance. The ECAs share securities with international commercial banks for the same exposure to the risks in a syndicate. Therefore, WTO DSB would rule that the ECA ship finance confers no benefit for individual transactions. The items (j) and (k-1) of ASCM Annex I are not allowed to interpret a contrario.

기준 확인 측도와 연관성 평가기준과의 관계 탐색 (Exploration of relationship between confirmation measures and association thresholds)

  • 박희창
    • Journal of the Korean Data and Information Science Society
    • /
    • 제24권4호
    • /
    • pp.835-845
    • /
    • 2013
  • 데이터 마이닝닝 기법들 중에서 연관성 규칙 마이닝 (association rule mining)은 대용량의 사건 발생 기록 데이터로부터 항목 간의 연관성을 측정하는 기법이다. 이 기법은 매우 방대한 양의 상품 또는 서비스 거래 기록 데이터로부터 항목들 간의 연관성을 측정하는 기법으로 제조업, 유통업, 보험업, 의료 및 교육 분야 등 많은 분야에 적용되고 있다. 의미 있는 연관성 규칙을 탐색하기 위한 흥미도 측도는 크게 객관적 흥미도 측도와 주관적 흥미도 측도, 그리고 의미론적 흥미도 측도로 분류할 수 있다. 이와는 별개로 기준 확인 또는 증거 지원과 관련된 측도들을 개발하기 위해 많은 시도가 있었으나 기준 확인 측도에 대한 연관성 평가 기준 조건 충족 여부나 기본적인 연관성 평가 측도인 지지도, 신뢰도, 그리고 향상도 등과의 관계는 아직 규명되지 않았다. 이에 본 논문에서는 가장 많이 활용되고 있는 비대칭적 기준 확인 측도에 대해 흥미도 측도의 기준에 대한 조건 충족 여부를 검토하는 동시에 기본적인 연관성 평가 측도들과의 관계를 수식을 통해 유도한 후, 예제를 통해 연관성 규칙의 관점에서 기준 확인 측도의 유용성을 살펴보았다. 그 결과, 본 논문에서 고려한 모든 기준 확인 측도들이 흥미도 측도의 기준에 대한 조건들을 모두 만족하였다. 또한 이들을 기본적인 연관성 평가 기준인 지지도, 신뢰도, 그리고 향상도와의 관계를 식을 통해 규명한 동시에 방향성과 행태적 해석 가능성을 예제를 통해 확인할 수 있었다. 특히 이들 측도 중에서 Kemeny와 Oppenheim이 제안한 측도와 Rips가 제안한 측도가 가장 바람직한 연관성 평가 기준으로 활용할 수 있다는 사실을 확인할 수 있었다.

모든 주변 비율을 고려한 확률적 흥미도 측도 기반 유사성 측도의 연관성 평가 기준 활용 방안 (Utilization of similarity measures by PIM with AMP as association rule thresholds)

  • 박희창
    • Journal of the Korean Data and Information Science Society
    • /
    • 제24권1호
    • /
    • pp.117-124
    • /
    • 2013
  • 연관성 규칙 탐사는 상당한 양의 데이터베이스에 내재되어 있는 항목들 간의 관련성을 파악하는 것으로 쇼핑몰, 보건 및 의료, 교육분야 등의 현장에서 많이 적용되고 있다. 이러한 연관성 규칙을 생성하기 위해 연관성 규칙 평가 기준인 지지도, 신뢰도, 향상도 등이 활용되고 있다. 이들 중에서 신뢰도가 연관성 평가 기준으로 가장 많이 활용되고는 있으나 항상 양의 값을 취하는 비대칭적 측도이기 때문에 항목 간에 연관성 규칙을 생성하는 데 어려움이 존재하게 된다. 이러한 문제를 해결하기 위해 본 논문에서는 주변 비율 전부를 포함한 확률적 흥미도 기반 유사성 측도를 연관성 평가 기준으로 활용하는 방안을 고려하였다. 이 측도들은 주변비율 전부와 교차표의 모든 항을 고려하여 연관성의 강도를 측정하는 측도이므로 나타나는 모든 정보를 충실히 반영해주는 측도라고 할 수 있다. 모의실험을 통해 확인한 결과, 모든 주변 비율을 고려한 확률적 흥미도 기반 유사성 측도 대부분이 기존의 연관성 평가 기준과 마찬가지로 연관성의 정도를 파악할 수 있는 동시에 부호를 포함하고 있어서 연관성의 방향도 알 수 있었다.

의료 정보 추출을 위한 TF-IDF 기반의 연관규칙 분석 시스템 (TF-IDF Based Association Rule Analysis System for Medical Data)

  • 박호식;이민수;황성진;오상윤
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제5권3호
    • /
    • pp.145-154
    • /
    • 2016
  • u-Health에 대한 관심과 IT 기술의 발전에 따라 의료 정보를 적극적으로 활용하고자 하는 요구가 커지고 있으며, 이에 대해 텍스트 형태의 의료 정보 데이터에 연관규칙 기법을 적용하여 질병과 증상과의 관계를 추론하는 시스템에 대한 연구들이 이루어지고 있다. 그러나 일반적인 연관규칙 기법을 의료 정보 데이터에 그대로 적용할 경우, 이전에는 새로운 연관규칙들보다 일반적이며 의미없는 연관규칙들이 많이 생성되는 문제가 발생한다. 또한 필터링으로 인해 빈번하게 함께 발생하지는 않지만 의학적으로 의미있는 항목들의 연관 규칙을 발견할 수 없다는 한계점을 가지게 된다. 본 논문에서는 의료데이터 특성을 고려하여 빈번한 항목과 빈번하지 않지만 의학적으로 의미 있는 항목들을 대상으로 연관규칙을 구성하여 의료 전문가의 의사 결정에 도움을 주기 위한 시스템을 제안한다. 제안 시스템은 의료 기록 데이터에서 용어들을 TF-IDF기반으로 가중치를 부여하고 기존 FP-Growth 알고리즘을 확장하여 TF-IDF 가중치를 고려한 빈번하게 발생하거나 빈번하지 않지만 의미 있는 연관규칙을 구성한다. 특정 질의 데이터가 입력되면 해당 데이터에 나타난 연관 규칙들의 유사도를 의학분야 온톨로지를 이용하여 평가하여 해당 데이터의 내용과 관련된 후보 질병들을 추론한다. 추론된 후보 질병명은 의료 전문가에게 의사 결정의 참고 자료로 제공된다. 실제 임상 진료 및 처방 기록 데이터에 대해 제안 시스템을 적용해 본 결과, 본 제안 시스템을 통해 도출한 연관 규칙이 기존 FP-Growth 알고리즘을 적용했을 때 보다 더 구체적인 질병과 증상과의 관계들을 포함함을 확인할 수 있었다. 또한 본 제안 시스템은 자유형식의 의료 및 병리데이터를 마이닝하고 후보 질병들을 가중치 기반으로 보여주므로, 의료 기록 정보로부터 질병 관련 새로운 정보를 획득하고 의료진의 의사 결정에 도움을 주는 시스템으로 활용될 수 있다.

시민참여형 스마트시티 에너지 서비스 모듈 개발 기획에 관한 연구 (A Study of the Planning for Development of Smart City Energy Service Module with Citizen Participation)

  • 심홍석;이성주;박경민;서윤규;정현채
    • 한국산학기술학회논문지
    • /
    • 제21권11호
    • /
    • pp.519-531
    • /
    • 2020
  • 전 세계적으로 인구 및 도시화율 증가에 따라 온실가스 배출량이 증가하면서 지구온난화가 가속화 되고 있다. 이에 대한 대안으로 스마트시티 건설이 본격적으로 추진되고 있는 상황이다. 본 논문은 한국의 스마트시티 시범도시로 선정된 세종 5-1 생활권을 대상으로 시민들이 활용할 수 있는 에너지 서비스 모듈을 기획하는 방안을 제시하는 것이 목적이다. 본 연구를 위해 정부가 발표한 스마트시티 계획들을 바탕으로 스마트시티 연구개발 참여 전문가들의 의견수렴을 통해 12가지 에너지 서비스에 대한 설문조사 문항을 구성하였다. 설문조사는 세종시민 1,000명을 대상으로 진행하였으며, 응답한 데이터를 바탕으로 세종시민이 생각하는 에너지 서비스의 필요성 정도를 파악하였다. 12개 에너지 서비스 항목들을 축소하여 설명하고 각 항목들의 상관성과 연관성을 분석하고자 주성분분석과 연관규칙탐사를 실시하였다. 마지막으로, 분석된 결과를 활용하여 12개 에너지 서비스들을 효율적인 플랫폼 형태로 구현될 수 있도록 '경제 창출', '에너지거래', '에너지효율' 형태의 3가지 모듈을 제시하였다. 아직 백지상태인 세종 5-1 생활권의 스마트시티 구현을 에너지 분야 플랫폼 서비스를 추진하고자 하는 수많은 연구소들과 기업들이 에너지 서비스 항목을 구상하고자 할 때 쉽게 접근이 가능하도록 기여할 수 있을 것이다.