• Title/Summary/Keyword: IT 연관성

Search Result 3,128, Processing Time 0.031 seconds

연관 규칙 마이닝에서 비교 기여 순수 신뢰도의 제안 (The proposition of compared and attributably pure confidence in association rule mining)

  • 박희창
    • Journal of the Korean Data and Information Science Society
    • /
    • 제24권3호
    • /
    • pp.523-532
    • /
    • 2013
  • 데이터 마이닝은 빅 데이터에 잠재되어 있는 지식이나 패턴을 찾아내는 기술이며, 대표적인 기법 중의 하나가 연관성 규칙 마이닝이다. 이 기법은 지지도, 신뢰도, 향상도 등의 연관성 평가 기준을 기반으로 하여 각 항목들 간의 관련성을 찾아내는 데 활용되고 있다. 연관성을 평가하기 위한 기준으로 여러 가지 흥미도 측도가 개발되어 있는데, 그 중에서도 신뢰도가 가장 많이 활용되고 있으나 연관성의 방향을 알 수가 없다는 단점을 가지고 있다. 이를 보완하기 위한 측도로 순수 신뢰도가 개발되었으나. 양의 신뢰도과 음의 신뢰도의 값이 동일한 경우에는 이 측도의 값이 같아지므로 정확한 연관성 규칙을 발견할 수 없게 된다. 이러한 단점을 보완하기 위해 기여 순수 신뢰도와 비교 신뢰도가 개발되었는데 이들은 이들 측도들이 취할 수 있는 값의 범위에 대한 문제를 제외하고는 흥미도 측도로서는 매우 바람직하다고 할 수 있으나 값의 범위에 대한 문제점이 존재한다. 이 문제를 해결하기 위해 본 논문에서는 기여 순수 신뢰도와 비교 신뢰도의 크기를 동시에 고려한 비교 기여 순수 신뢰도를 제안하였다. 또한 예제를 통하여 그 유용성을 알아본 결과, 비교 기여 순수 신뢰도는 그 부호에 의해 연관성 규칙의 방향을 파악할 수 있는 동시에 그 값의 범위가 [-1, +1]의 값을 가지므로 행태적 해석이 가능한 것으로 확인되었다.

연관성 규칙의 탐색을 위한 순수 대칭적 J 측도의 활용 (Utilizing Purely Symmetric J Measure for Association Rules)

  • 박희창
    • Journal of the Korean Data Analysis Society
    • /
    • 제20권6호
    • /
    • pp.2865-2872
    • /
    • 2018
  • 데이터 마이닝 분야에서 개발된 기법에는 연관성 규칙, 군집분석, 의사결정나무, 신경망 등 여러 가지가 있는데 이들 중에서 연관성 규칙은 지지도, 신뢰도, 그리고 향상도 등 여러 가지 연관성 평가 기준을 이용하여 항목들 간에 특정한 연관성을 탐색하는 기법이다(Park, 2014). 이러한 연관성 규칙은 Agrawal et al.(1993)이 처음 제안하였으며, 그 이후로 여러 연구자들에 의해 연구가 진행되고 있으며, 최근에는 교차 엔트로피와 관련된 연구들이 발표되고 있다(Park, 2016b). 본 논문에서는 기존에 발표된 J 측도에 방향성과 순수성을 고려한 순수 대칭적 J 측도를 제안하고 예제를 활용하여 그 유용성에 대해 알아보았다. 그 결과, 동시발생빈도가 증가함에 따라 순수 대칭적 J 측도가 기존의 J 측도와 대칭적 J 측도, 순수 교차 엔트로피 측도보다 훨씬 분명하게 변하는 것을 알 수 있었으며, 불일치빈도의 크기에 따라서도 순수 대칭적 J 측도가 변화하는 폭이 더 커짐에 따라 연관성 유무를 더 분명하게 파악할 수 있었다. 따라서 순수 대칭적 J 측도는 데이터가 존재하는 어느 분야에서든지 연관성 규칙의 평가에 적용이 가능할 것으로 생각된다.

인과적 확인 측도에 의한 연관성 규칙 탐색 (Proposition of causally confirmed measures in association rule mining)

  • 박희창
    • Journal of the Korean Data and Information Science Society
    • /
    • 제25권4호
    • /
    • pp.857-868
    • /
    • 2014
  • 대량의 데이터로부터 과거에 알려지지 않았던 유용한 정보를 발견하는 기술인 데이터 마이닝 기법은 오늘날 빅 데이터 시대에 가장 대표적인 분석 기법이라고 할 수 있다. 이들 중에서도 연관성 규칙은 지지도, 신뢰도, 향상도 등의 여러 가지 흥미도 측도를 기반으로 하여 항목들 간의 관련성을 찾아내는 것이다. 그러나 기본적인 연관성 평가 기준만으로는 두 항목 간의 인과관계를 설명할 수 없을 뿐만 아니라 연관성의 방향도 파악할 수 없다. 본 논문에서는 이러한 문제를 해결하기 위해 인과적 확인 연관성 평가 기준을 제안하는 동시에, 제안한 평가 기준들이 흥미도 측도의 조건을 충족하는지의 여부를 점검하였다. 본 논문에서 제안한 인과적 확인 향상도는 세 가지 조건 모두를 만족하는 것으로 입증되었다. 인과적 확인 지지도와 인과적 확인 신뢰도는 동시 발생 확률의 값에 따라 단조 증가하는 조건과 각 항목의 주변 확률의 값에 따라 단조 감소하는 조건은 만족하였다. 또한 예제를 통해 기본적인 연관성 평가 기준과 인과적 연관성 평가 기준, 그리고 인과적 확인 연관성 평가 기준을 비교해 본 결과, 본 논문에서 제안하는 인과적 확인 측도들이 다른 평가 기준에 비해 가장 바람직한 측도라는 사실을 파악하였다.

올바른 연관성 규칙 생성을 위한 의사결정과정의 제안 (Decision process for right association rule generation)

  • 박희창
    • Journal of the Korean Data and Information Science Society
    • /
    • 제21권2호
    • /
    • pp.263-270
    • /
    • 2010
  • 데이터마이닝은 방대한 양의 데이터 속에서 쉽게 드러나지 않는 유용한 정보를 체계적이고도 자동적으로 찾아내는 기법이다. 데이터마이닝의 중요한 목표 중의 하나는 여러 변수들 간의 관계를 발견하고 결정하는 것이다. 연관성 규칙은 항목 집합으로 표현된 트랜잭션에서 각 항목간의 연관성을 반영하는 규칙으로서, 항목 집합간의 관계를 지지도, 신뢰도, 순수 신뢰도 등과 같은 흥미도 측도에 의해 명확히 수치화함으로써 두 개 이상의 항목집합간의 관련성을 표시해주기 때문에 현업에서 많이 활용되고 있다. 본 논문에서는 기존에 많이 활용되고 있는 흥미도 측도인 신뢰도와 순수 신뢰도의 문제점을 보완하여 연관성 규칙을 올바르게 생성하기 위한 새로운 의사결정과정을 제안하고자 한다. 본 논문에서 제안하는 의사결정과정은 특히 스트리밍 데이터베이스에서의 연관성 규칙을 탐색하는 데 효율적이다.

모든 가능한 진단도구를 활용한 균형비교신뢰도의 제안 (Proposition of balanced comparative confidence considering all available diagnostic tools)

  • 박희창
    • Journal of the Korean Data and Information Science Society
    • /
    • 제26권3호
    • /
    • pp.611-618
    • /
    • 2015
  • 오늘날 정보 기술과 소셜미디어의 확산으로 인하여 빅 데이터에 관심이 집중되고 있다. 이를 처리하기 위한 기술 중의 하나가 데이터마이닝기법인데, 이들 중에는 연관성 규칙이 많이 활용되고 있다. 연관성 규칙은 방향에 따라 양, 음, 그리고 역의 연관성 규칙 등이 존재하며, 평가 기준을 설정하고자 하는 경우에는 이들 세 가지 연관성 규칙을 동시에 고려하는 것이 바람직하다고 할 수 있다. 이를 위해 본 논문에서는 의학진단분야에서 활용되고 있는 진단도구들 중에서 민감도, 특이도, 위양성도, 그리고 위음성도를 고려한 균형비교신뢰도를 제안하고자 한다. 또한 흥미도 측도가 가져야 할 조건들을 점검한 후, 예제를 통하여 측도의 유용성을 고찰하였다. 그 결과, 균형비교신뢰도는 비교신뢰도와 역의 비교신뢰도가 양의 값을 가지는 경우에는 양의 값을 가지며, 이들 두 값이 음인 경우에는 음으로 나타났다. 따라서 연관성 규칙의 평가 기준 관점에서 볼 때 비교신뢰도와 역의 비교신뢰도를 개별적으로 이용하기 보다는 균형비교신뢰도를 활용하는 것이 더 바람직하다고 할 수 있다.

기업의 시장점유율에 따른 신용거래와 기업수익성간 연관성 (The Effect of Trade Credit on Corporate Profitability according to the degree of Corporate Market Share)

  • 이가연
    • 한국산학기술학회논문지
    • /
    • 제22권6호
    • /
    • pp.207-214
    • /
    • 2021
  • 본 연구에서는 기업의 단기재무의사결정 중 하나인 매출채권관리가 기업수익성에 미치는 영향을 분석하고자 한다. 이러한 연관성이 비선형적 관계에 있는지 분석하여 기업수익성을 극대화시키는 최적 매출채권 수준을 파악하고자 한다. 또한 기업의 시장점유율이 높은 기업군을 독점기업군으로 시장점유율이 낮은 기업군을 경쟁기업군으로 분류할 때 매출채권과 기업수익성간 연관성의 민감도가 다르게 나타나는지를 분석하고자 한다. 한국거래소의 유가증권시장에 상장된 비금융업인 제조업 기업들을 대상으로 2001년부터 2018년까지의 기간동안 재무자료를 수집하여 분석한다. 분석대상 기업들은 불균형 패널자료로 연도별로 270개에서 463개의 기업들로 총 6,632개의 표본수로 구성된다. 기업의 거래 신용인 매출채권과 기업의 수익성 지표인 총자산영업이익률(ROA)간에는 양(+)의 연관성이 있는 것으로 나타났다. 또한 이들간에는 비선형의 관계인 역U자형 관계를 갖고 있는 것으로 나타났다. 이는 기업이 매출채권을 일정수준까지 보유하면 수익성이 높아지지만 그 수준을 초과하여 보유하면 오히려 수익성이 감소할 수 있는 최적 매출채권 수준이 있음을 시사하고 있다. 시장점유율이 시장평균보다 높은 독점기업의 경우 매출채권과 수익성간의 연관성이 시장점유율이 평균보다 낮은 경쟁기업군의 연관성보다 더 큰 것으로 나타났다. 이러한 현상들은 Titman(1984)이 제시하였던 기업의 이해 관계자인 구매자(소비자)와의 거래관계가 기업의 수익성증대에 중요한 역할을 한다는 가설을 지지하고 있다.

연관성 척도의 빈도수준 선호경향에 대한 연구 (A Study on the Frequency Level Preference Tendency of Association Measures)

  • 이재윤
    • 정보관리학회지
    • /
    • 제21권4호
    • /
    • pp.281-294
    • /
    • 2004
  • 연관성 척도는 정보검색 및 데이터마이닝을 비롯한 다양한 분야에서 사용되고 있다. 각 연관성 척도가 높거나 낮은 빈도 중에서 어떤 쪽을 선호하는가를 나타내는 빈도수준 선호경향은 척도의 적용 결과에 중요한 영향을 미치므로 이에 대한 면밀한 조사가 필요하다. 이 연구에서는 주요 연관성 척도들의 빈도수준 선호경향을 가상의 데이터를 통해 분석하고 그 결과를 제시하였다. 또한 코사인 계수를 비롯한 대표적인 연관성 척도에 대해서 빈도수준 선호경향을 조절할 수 있는 방법을 제안하였다. 이 조절 방법을 동시출현 기반 질의확장 정보검색에 적용해본 결과 그 유용성이 확인되었다. 마지막으로 분석 및 실험 결과가 관련 분야에 시사하는 바를 논하였다.

분류 모형 구축에 유용한 신뢰도 측도 간의 비교 (Comparison of confidence measures useful for classification model building)

  • 박희창
    • Journal of the Korean Data and Information Science Society
    • /
    • 제25권2호
    • /
    • pp.365-371
    • /
    • 2014
  • 데이터 마이닝 기법 중에서 연관성 규칙은 하나의 거래나 사건에 포함되어 있는 항목들의 관련성을 파악하기 위한 탐색적 자료 분석 방법이다. 이 기법은 지지도, 신뢰도, 향상도 등과 같은 흥미도 측도들을 이용하여 연관성 규칙을 생성한다. 일반적인 연관성 규칙에서는 최소 지지도를 만족하는 빈발항목집합을 생성한 후 최저 신뢰도를 만족하는 것을 연관성 규칙으로 채택하게 된다. 이 때 규칙 여부를 결정하기 위해 가장 많이 사용되는 신뢰도는 고려하는 항목의 순서가 바뀌게 되면 그 값이 달라지는 비대칭적 측도가 되는 동시에 항상 양의 값을 가진다. 따라서 신뢰도 값의 크기로는 양의 연관성이 있는지, 아니면 음의 연관성이 있는지를 알 수 없다. 본 논문에서는 이러한 문제를 극복하기 위해 분류 모형 구축에 유용한 신뢰도 측도들을 소개하고, 신뢰도들 간의 비교 분석을 통해 유용성을 평가하였다. 그 결과, 인과적 확인 신뢰도가 연관성의 방향을 보다 정확하게 나타내고 있다는 사실을 확인 하였다.

모든 주변 비율을 고려한 확률적 흥미도 측도 기반 유사성 측도의 연관성 평가 기준 활용 방안 (Utilization of similarity measures by PIM with AMP as association rule thresholds)

  • 박희창
    • Journal of the Korean Data and Information Science Society
    • /
    • 제24권1호
    • /
    • pp.117-124
    • /
    • 2013
  • 연관성 규칙 탐사는 상당한 양의 데이터베이스에 내재되어 있는 항목들 간의 관련성을 파악하는 것으로 쇼핑몰, 보건 및 의료, 교육분야 등의 현장에서 많이 적용되고 있다. 이러한 연관성 규칙을 생성하기 위해 연관성 규칙 평가 기준인 지지도, 신뢰도, 향상도 등이 활용되고 있다. 이들 중에서 신뢰도가 연관성 평가 기준으로 가장 많이 활용되고는 있으나 항상 양의 값을 취하는 비대칭적 측도이기 때문에 항목 간에 연관성 규칙을 생성하는 데 어려움이 존재하게 된다. 이러한 문제를 해결하기 위해 본 논문에서는 주변 비율 전부를 포함한 확률적 흥미도 기반 유사성 측도를 연관성 평가 기준으로 활용하는 방안을 고려하였다. 이 측도들은 주변비율 전부와 교차표의 모든 항을 고려하여 연관성의 강도를 측정하는 측도이므로 나타나는 모든 정보를 충실히 반영해주는 측도라고 할 수 있다. 모의실험을 통해 확인한 결과, 모든 주변 비율을 고려한 확률적 흥미도 기반 유사성 측도 대부분이 기존의 연관성 평가 기준과 마찬가지로 연관성의 정도를 파악할 수 있는 동시에 부호를 포함하고 있어서 연관성의 방향도 알 수 있었다.

컴퓨터교육과와 IT 관련 고등학교간 교과과정의 연관성 분석 (An Analysis on the Relationship of Computer Curriculums Between Dept. of Computer Education in Universities and IT-Related High Schools)

  • 최유진;남영호;박재흥
    • 컴퓨터교육학회논문지
    • /
    • 제10권1호
    • /
    • pp.1-8
    • /
    • 2007
  • 본 연구의 목적은 정보 컴퓨터 교사 양성기관인 사범대학 컴퓨터교육과와 IT 관련 고등학교간 교과과정의 연관성을 분석하는 것이다. 이를 위해 전국 15개 사범대학 컴퓨터교육과 교과과정과 17개의 특성화 고등학교와 41개의 상업계 고등학교 컴퓨터 교과과정간에 교과목 수와 시수를 비교, 분석하였다. 그 결과, 멀티미디어, 컴퓨터그래픽 및 컴퓨터그래픽 실무 등의 교과목 영역이 컴퓨터교육과 교과과정에 부족한 것으로 나타났다. IT 관련 고등학교에 필요한 정보 컴퓨터 교사를 양성하기 위해서 연관성이 낮은 것으로 나타난 영역에 속하는 교과목들을 컴퓨터교육과 교과과정에 확대 편성해야 할 것이며, 특히 IT 관련 실무 능력을 겸비할 수 있도록 개선하여야 할 것이다.

  • PDF