• 제목/요약/키워드: 연관성규칙 분석

검색결과 204건 처리시간 0.025초

스마트폰과 서비스 컨버전스에 대한 탐색적 연구 (An Exploratory Study on Smart-Phone and Service Convergence)

  • 노미정;김진화;이재범
    • 한국전자거래학회지
    • /
    • 제15권4호
    • /
    • pp.59-77
    • /
    • 2010
  • 본 연구는 미래 컨버전스의 패턴과 e-비즈니스에 있어서 발전 방향을 모색하고자 스마트폰과 기존 서비스 컨버전스 간의 연관 관계를 살펴보았다. 데이터 분석 및 결과 도출을 위해 연관성 규칙을 사용하였고, 이를 통해 다음과 같은 결과를 도출하였다. 첫 번째, 스마트폰의 주요 사용 패턴과 기존 서비스 컨버전스 패턴이 매우 유사하다는 점이다. 이는 스마트폰의 컨버전스는 이미 사용자들의 사용 패턴을 통해서 예견되었다는 것을 나타낸다. 두 번째, 스마트폰에서의 컨버전스 패턴과 기존 서비스 컨버전스의 패턴에 대한 분석을 통해 스마트폰은 홈 네트워킹과 사무기기와의 컨버전스로 이어지는 것이 사용자들의 요구사항과 가장 크게 부합할 수 있다는 점이다. 본 연구의 의의는 스마트폰 사용자들의 사용 패턴과 기존 서비스 컨버전스 간의 관계를 연관관계 분석을 통해 살펴보고, e-비즈니스의 새로운 발전 방향과 미래 컨버전스 패러다임에 새롭게 접근했다는 점이다.

사회연결망 분석을 활용한 연관규칙 확장기법 (Extension Method of Association Rules Using Social Network Analysis)

  • 이동원
    • 지능정보연구
    • /
    • 제23권4호
    • /
    • pp.111-126
    • /
    • 2017
  • 연관 상품 추천은 수많은 상품을 다루는 온라인 상거래에서 소비자의 상품 탐색 시간을 줄여주며 판매자의 매출 증대에 크게 기여한다. 이는 주문과 같은 거래의 빈도를 기반으로 생성되므로, 통계적으로 판매 확률이 높은 상품을 효과적으로 선별할 수 있다. 하지만, 판매 가능성이 높은 경우라도 신상품처럼 판매 초기에 거래 건수가 충분하지 않은 상품은 추천에서 누락될 수 있다. 연관 추천에서 누락된 상품은 이로 인해 노출 기회를 잃게 되고, 이는 거래 건수 감소로 이어져, 또 다시 추천 기회를 잃는 악순환을 겪을 수도 한다. 따라서, 충분한 거래 건수가 쌓이기 전까지 초기 매출은 일정 기간 동안 정체되는 현상을 보이는데, 의류 등과 같이 유행에 민감하거나 계절 변화에 영향을 많이 받는 상품은 이로 인해 매출에 큰 타격을 입을 수도 있다. 본 연구는 이와 같이 거래 초기의 낮은 거래 빈도로 인해 잘 드러나지 않는 상품 간의 잠재적인 연관성을 찾아 추천 기회를 확보할 수 있도록 연관 규칙을 확장하기 위한 목적으로 수행되었다. 두 상품 간에 직접적인 연관성이 나타나지 않더라도 다른 상품을 매개로 두 상품 간의 잠재적 연관성을 예측할 수 있을 것이며, 이런 연관성은 주문에서 나타나는 상품 간 상호작용으로 표현될 수 있으므로, 사회연결망 분석을 활용한 분석을 시도하였다. 사회연결망 분석기법을 통해 각 상품의 속성과 두 상품 간 경로의 특성을 추출하고 회귀분석을 실시하여, 두 상품 간 경로의 최단 거리 및 경로의 개수, 각 상품이 얼마나 많은 상품과 연관성을 갖는지, 두 상품의 분류 카테고리가 어느 정도 일치하는지가 두 상품 간의 잠재적 연관성에 미친다는 것을 확인하였다. 모형의 성능을 평가하기 위해, 일정 기간의 주문 데이터로부터 연결망을 구성하고, 이후 10일 간 생성될 상품 간 연관성을 예측하는 실험을 진행하였다. 실험 결과는 모형을 적용하지 않는 경우보다 제안 모형을 활용할 때 훨씬 많은 연관성을 찾을 수 있음을 보여준다.

피에이치피와 웨카를 이용한 데이터마이닝 도구의 설계 및 구현 (Design and implementation of data mining tool using PHP and WEKA)

  • 유영재;박희창
    • Journal of the Korean Data and Information Science Society
    • /
    • 제20권2호
    • /
    • pp.425-433
    • /
    • 2009
  • 데이터마이닝은 방대한 양의 데이터 속에서 유용한 정보를 찾아내는 과정이며, 이를 위해 데이터마이닝 도구가 필요하다. 데이터마이닝 도구 또는 솔루션은 E-Miner, Clementine, WEKA, R 등 상당히 많은 종류가 있으나 대부분의 데이터마이닝 도구는 다양성과 범용성에 초점을 맞추어 개발되어 사용 편의성과 분석 자동화에 대해서는 소홀한 실정이어서 비전문가가 사용하기 어려운 경우가 대부분이다. 본 논문에서는 피에이치피와 웨카를 이용하여 인터넷 환경에서 데이터마이닝 기법을 실행하고, 생성된 분석결과를 보다 쉽게 해석할 수 있도록 개선하여 일반 사용자도 쉽게 사용할 수 있는 시스템을 설계하고 구현하고자 한다. 본 논문에서 구현하는 데이터마이닝 기법은 가장 많이이용되고 있는 연관성 규칙의 Apriori 알고리즘, 군집분석의 K-평균 알고리즘, 의사결정나무의 J48 알고리즘 등이다.

  • PDF

어선원 공제보험데이터 기반 조업 중 재해사고 특성 분석

  • 노유나;정회민;강동수
    • 한국항해항만학회:학술대회논문집
    • /
    • 한국항해항만학회 2021년도 추계학술대회
    • /
    • pp.5-7
    • /
    • 2021
  • 최근 해양사고 발생 건수의 급격한 증가와 더불어 어선의 조업 중 안전사고로 인한 인명피해 또한 크게 증가하였다. 중앙해양안전심판원의 공식 통계에 따르면, 2017년 46명이었던 안전사고의 사망실종자는 2019년 38명으로 소폭 감소하였으나, 2020년 60명으로 크게 증가하였다. 그러나, 사망자가 감소하였던 2019년 안전사고로 인한 부상자는 164명으로 전년도 76명 대비 2배 이상 증가하며 어선원에 대한 안전재해 예방은 실효성을 갖지 못하는 실정이다. 국내 업종별 산업재해율을 비교해볼 때, 어업 재해율은 농업, 광업, 제조업, 건설업, 임업 등을 포괄한 전체 산업 평균 재해율의 약 10배에 이르며 어업인들의 안전이 큰 위협에 놓여있음을 시사한다. 본 연구에서는 2017년부터 2019년의 수협중앙회의 어선원 공제보험데이터를 활용하여 선박별, 재해자별 사고 현황과 발생 형태를 분석하였다. 특히, 교차분석과 연관규칙분석기법을 통해 승선 직책별 부상 부위와 사고발생 형태를 식별하였으며, 이에 따라 직책에 따른 부상 부위를 비교하여 맞춤형 예방대책 수립을 위한 지원과, 사고발생형태의 군집 분석을 통해 발생형태간의 연결고리를 도출하여, 스위스 치즈 모델에서 제안하는 취약점(Weakness)를 식별하고, 이러한 취약점을 보완하기 위한 방어 장벽(Protective barriers)을 제언한다.

  • PDF

개인정보유출 확신도 도출을 위한 전문가시스템개발 (Rule-base Expert System for Privacy Violation Certainty Estimation)

  • 김진형;이알렉산더;김형종;황준
    • 정보보호학회논문지
    • /
    • 제19권4호
    • /
    • pp.125-135
    • /
    • 2009
  • 개인정보 유출을 위한 공격자의 시도는 다양한 보안 시스템에 로그를 남기게 된다. 이러한 로그정보들은 개인정보 유출에 관여했다고 보고된 특정 IP 주소에 대한 확신도를 도출하기위한 요소가 될 수 있다. 본 논문에서는 보편적으로 활용 가능한 보안 시스템들의 로그정보들을 기반으로 확신도를 도출하기 위한 규칙기반 전문가 시스템의 섣계 및 구현을 다루고 있다. 일반적으로 개인정보유출과 연관된 다양한 로그정보들은 개인정보 관리자에 의해서 분석되어, 의심 대상이 되는 IP 주소에 대해 정보유출에 관여한 정도를 도출하게 된다. 이러한 개인정보 관리자가 수행하는 분석절차는 전문가의 축적된 지식 (Know-how)이라고 할 수 있으며, 이는 규칙 형태로 정의되어 분석절차의 자동화에 활용될 수 있다. 특히, 개인정보유출과 관련된 로그정보의 분석 범위는 다양한 해킹시도를 탐지 해내야하는 침입탐지 및 대응 분야와 비교할 때 상대적으로 넓지 않다. 따라서 도출해내야 하는 규칙의 개수가 상대적으로 많지 않다고 할 수 있다. 본 논문에서는 특히 IDS. Firewall 및 Webserver 의 로그정보들을 개인정보유출의 관점에서 상호 연관성을 도출하였고, 이러한 연관성을 기반으로 규칙을 정의하고 이들을 생성/변경/삭제 할 수 있는 시스템을 개발하였다. 본 연구의 결과에 해당하는 규칙기반 지식베이스 및 전문가 시스템은 개인정보유출에 관여 했다고 여겨지는 특정 IP 주소에 대한 낮은 수준(Low-level)의 검증을 수행하여 확신도를 도출하는데 활용이 가능하다.

모바일 러닝에서의 신규 융합서비스 도출을 위한 분석: 사회연결망 분석과 연관성 분석 사례 (An Analysis for Deriving New Convergent Service of Mobile Learning: The Case of Social Network Analysis and Association Rule)

  • 백헌;김진화;김용진
    • 경영정보학연구
    • /
    • 제15권3호
    • /
    • pp.1-37
    • /
    • 2013
  • 본 연구는 모바일 러닝의 활성화를 위한 서비스 융합의 가능성을 보고자 하였다. 이를 위해 모바일 러닝의 유형 및 특성을 분석 하였다. 먼저 현재 모바일 러닝 서비스는 어떤 서비스를 중심으로 활성화되고 있으며, 이러한 서비스를 중심으로 사용자의 활용도가 높은 서비스는 무엇인지 알아 보았다. 두 번째로는 모바일에서 주로 이뤄지고 있는 서비스와 이러닝에서 주로 이뤄지고 있는 서비스의 복합적 융합가능성을 살펴 보았다. 세 번째로는 모바일에서의 서비스와 이러닝에서의 공통된 서비스를 중심으로 앞으로 융합이 활성화 될 가능성을 살펴보았다. 분석을 위하여 포털 사이트에서 관련 웹페이지를 통하여 변수를 추출하였으며, 사회 네트워크 분석과 연관성 분석을 사용하였다. 이는 웹페이지마다 변수의 종류와 수가 다르기 때문에 전체적인 웹 상에서 각각의 변수들의 위치와 네트워크상에서의 복잡한 연결 정도를 살펴보기 힘들다. 이러한 문제점을 해결하기 위해 사회 네트워크 분석을 하였으며, 변수들 간의 연관규칙을 발견하고자 연관성 분석을 하였다. 규칙의 해석을 위해서는 사회 네트워크 분석 결과와 연관규칙을 함께 고려하여 살펴보았다. 분석 결과, 모바일에서 제공되는 서비스와 이러닝에서 제공되고 있는 공통된 서비스 중에서 빈도수가 높은 서비스로는 게임과 SNS로 나타났으며, 이외 결제, 광고, 메일, 이벤트, 동영상, 클라우드, 전자책, 증강현실, 취업 등으로 발견되었다. 이러한 서비스를 중심으로 이러닝의 다양한 서비스와 융합하여 이뤄지고 있음을 알 수 있었다. 공통된 서비스와 함께 모바일에서는 검색, 뉴스, GPS 등의 서비스가 활성화 되고 있으며, 이러닝에서는 시뮬레이션, 교양, 공교육 등의 서비스가 활성화 되고 있음을 알 수 있었다. 모바일과 이러닝의 공통된 변수를 기반으로 각각의 서비스의 융합이 높게 나타난 변수로는 모바일에서는 게임과 SNS, 게임과 스포츠, SNS와 광고, 게임과 이벤트, SNS와 전자책, 게임과 커뮤니티가 융합이 높게 나타났으며, 이러닝에서는 게임, 동영상, 상담, 전자책을 전항으로 하여 시뮬레이션, 말하기, 공교육, 출결관리 등의 서비스의 융합정도가 높게 나타난 것을 알 수 있었다. 다음으로 모바일서비스와 이러닝서비스의 공통된 서비스중에서, 모바일 러닝 서비스에서 활성화가 높은 서비스와 사용자를 기반한 모바일 러닝 서비스의 활성화가 높은 서비스인 게임, SNS, 전자책을 기준으로 서비스 융합 활성화 가능성을 예측했다. 본 연구결과를 통해 모바일을 활용한 이러닝 서비스의 관련 서비스 융합으로, 모바일 러닝의 활성화에 대한 전략적 방향성을 제안할 수 있을 것이다.

  • PDF

연관성 규칙에 기반한 보존된 단백질 도베인 조합의 식별 (Identification of Conserved Protein Domain Combination based on Association Rule)

  • 정석훈;장우혁;한동수
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제15권5호
    • /
    • pp.375-379
    • /
    • 2009
  • 도메인은 단백질의 진화와 삼차구조 및 분자 기능의 기본 단위체이다. 단백질은 한 개 이상의 도메인들로 구정 되며, 단백질의 기능 또한 각 도메인이 가진 기능의 집합으로 구현된다. 단백질은 특정 기능을 담당하기 위해 진화되어 왔으므로, 도메인 또한 단백질 내에서 기능을 위한 특정 조합 패턴, 즉 보존도메인 조합을 가진다. 본 논문은 각 도메인 조합의 진화상 보존 정도를 측정할 수 있는 연관성 규칙 기반 계산 기법을 제안한다. 제안된 기법은 기존 기법에서 주로 고려되었던 도메인 조합의 빈도뿐 아니라, 조합 내 소속 도메인간의 상호 의존도를 측정하여 주어진 조합의 보존 정도를 산출한다. 이를 기반으로 S.cerevisiae의 단백질을 대상으로 보존 도메인 조합을 추출하였으며, Gene Ontology를 이용하여 그 생물학적 의미를 분석하였다. 그 결과 제안된 기법으로 추출된 보존 도메인 조합은 기존의 것에 비해 조합 내 기능의 유사도가 높았으며, 따라서 제안된 기법이 생물학적 기능의 협업 위해 보존된 도메인 조합의 추출에 우수하다 할 것이다. 또한 S.cerevisiae 단백질체에는 서로 의존도가 높고 자주 나타나는 보존 도메인 조합이 존재하며, 그러한 조합들은 molecular function의 협업과 관련 있음을 밝혀냈다.

연관규칙 마이닝에서 랜덤화를 이용한 프라이버시 보호 기법에 관한 연구 (On the Privacy Preserving Mining Association Rules by using Randomization)

  • 강주성;조성훈;이옥연;홍도원
    • 정보처리학회논문지C
    • /
    • 제14C권5호
    • /
    • pp.439-452
    • /
    • 2007
  • 본 논문에서는 랜덤화 기법을 이용한 프라이버시 보존형 데이터 마이닝(PPDM) 기술에 대하여 논한다. 계산 효율성 때문에 실용화 되지 못하고 있는 안전한 다자간 계산(SMC) 기반 PPDM은 현재의 컴퓨팅 환경에서는 실용성 없는 다분히 이론적인 것이다. 그래서 우리는 실용적인 PPDM 기술에 집중하여 가장 널리 사용되고 있는 랜덤화 기법에 대한 연구 결과를 소개한다. 특히, 랜덤화를 이용한 실용적인 PPDM 분야에서 가장 중요한 프라이버시 측도 개념을 심도 있게 분석하였으며, 연관규칙 마이닝에서의 프라이버시 보호 기술에 초점을 맞춘다. Evfimievski 등이 제안한 select-a-size 범주에 속하는 새로운 랜덤화 작용소인 binomial-selector 개념을 제안하고, 적절한 파라미터를 찾기 위한 시뮬레이션 결과를 제시한다. 기존의 cut-and-paste 랜덤화 작용소는 아이템 집합이 큰 경우에는 매우 비효율적이며 복원된 지지도의 분산이 크다는 단점을 지니고 있다. 여기에서 제안하는 binomial-selector 랜덤화 작용소는 cut-and-paste 작용소가 갖는 단점들을 보완한다.

B2B 전자상거래 정보를 활용한 시장 융합 기회 발굴 방법론 (Discovery of Market Convergence Opportunity Combining Text Mining and Social Network Analysis: Evidence from Large-Scale Product Databases)

  • 김지은;현윤진;최윤정
    • 지능정보연구
    • /
    • 제22권4호
    • /
    • pp.87-107
    • /
    • 2016
  • 융합을 통한 기술과 제품의 혁신을 이해하는 것은 중소기업의 생존을 위한 필수가 되었다. 특히, 이종 산업간 융합을 통한 제품 혁신과 성공을 위해서는 융합 가능한 아이템 즉, 제품과 기술, 아이디어를 탐색하고 대안을 찾는 것이 중요하다. 기존의 융합연구는 크게 두 가지의 한계를 갖는다. 첫째, 특허와 논문 등 기술정보를 기반으로 하는 기술융합 발굴은 시장의 수요를 인식하는데 한계가 있다. 본 논문은 중소 창업기업에 적용할 수 있는 시장융합(Market convergence)의 관점에서 새로운 융합 기회를 식별하려고 시도하였다. 이를 위해 세계 중소 수출입 기업이 이용하는 글로벌 B2B e-마켓플레이스의 제품 데이터베이스를 활용하였다. 둘째, 기존의 융합기회 발굴 연구는 이미 융합되어 존재하는 제품 또는 기술 기반의 연관성 및 관계를 파악하는데 집중하였다. 본 연구에서는 융합 가능한 새로운 사업기회의 발굴을 목적으로 구조적공백(Structural Hole) 이론을 적용하여, 상이한 산업군에서 서로 직접적인 연결 관계가 없는 키워드 간의 네트워크를 분석하여 융합의 가능성이 있는 새로운 융합 사업 테마를 도출하고자 한다. 이를 위해 제품명과 제품 기술서를 기반으로 제품 및 기술 용어 사전과 텍스트마이닝 을 활용하여 제품과 서비스의 특성을 추출하고, 이들 특성간 연관관계분석을 수행한 후, 네트워크 분석을 진행 하였다. 실험 데이터는 시장의 최신 동향을 파악하기 위해 2013년 1월 부터 2016년 7월까지 등록된 24만건의 e-카탈로그를 대상으로 하였으며, 분석의 효율성을 높이기 위해 기술 범위를 IT로 제한하고, IT 기술을 매개로 한 "Health & Medical"과 "Security & Protection" 카테고리 간의 융합 기회를 도출 하였다. 실험을 통하여 융합연관규칙 1,729을 추출하였으며, 지지도를 기반으로 100개의 규칙을 샘플링 하여, 구조적 공백을 분석하였다.

건축공사감리 문서 기반 연관규칙 및 비용효율성 분석 모델 (A Study on Association Rule and Cost Efficiency Analysis Model Using Construction Supervision Reports)

  • 송태근;유위성
    • 한국건축시공학회:학술대회논문집
    • /
    • 한국건축시공학회 2023년도 봄 학술논문 발표대회
    • /
    • pp.389-390
    • /
    • 2023
  • To improve the cost performance of construction sites, various systems and standards are constantly being developed and implemented. Although legal requirements for these system and standard improvements have been increasing, the cost efficiency performance of construction sites remains stagnant. We have digitized documents generated through construction supervision work at 39 building construction sites and proposed a model that can support decision-making in cost efficiency evaluation. This model selects key keywords that are considered to be highly related to cost efficiency by identifying the patterns and relationships of keywords through associated rule analysis and social network analysis using keywords derived from documents. In addition, it is expected to be used as a decision-making aid to determine the cost efficiency of a specific building construction site by establishing a logistic regression model using core keywords. As a systematic database of construction supervision documents and an integrated system of massive data generated by digital technology are established in the future, the accuracy and reliability of the cost efficiency evaluation model are expected to be reinforced.

  • PDF