• 제목/요약/키워드: 연관성규칙 분석

검색결과 204건 처리시간 0.025초

선물시장에서 거래확률 조정을 통한 자산운용 투자전략 모델에 관한 연구 (A study on asset management investment strategy model by trade probability control on futures market)

  • 이석준;김지현;정석재
    • 경영과정보연구
    • /
    • 제31권3호
    • /
    • pp.21-46
    • /
    • 2012
  • 최근 국내 기관 투자자들을 중심으로 전통적 투자대상으로부터의 수익이 하락추세에 있어 기관 투자자들이 적극적 자산운용을 기피할 경우, 장기적으로 안정적 수익보장을 유지하기 어렵다는 우려가 제기되었다. 이에 보유자산 구성을 조정한 수익성 개선전략의 요구가 증대되고 있으며, 일부 기관 투자자들은 헤지펀드를 기존 포트폴리오에 편입시킴으로써 운용수익률을 제고하려는 움직임을 보이고 있다. 본 연구에서는 시스템트레이딩을 이용하여 선물시장에서 거래확률 조정을 통한 헤지펀드 투자전략을 제시하고자 한다. 선물시장에서 사용되는 다양한 기술적 지표를 이용하여 연관성 규칙(association rule)을 생성하고 이를 거래규칙(trading rule)으로 전환하여 투자전략으로 활용한다. 한편 연관성 규칙은 기술적 지표의 개수와 개별 지표들의 구간값의 조합으로 생성되며, 조합에 따라 거래확률을 조정함으로써 위험관리가 가능한 투자전략을 수립하는데 사용된다. 제시된 전략의 우수성을 입증하기 위해 KOSPI 200 연결선물데이터를 이용하여 수익성 분석을 수행하였으며, 분석결과 제시된 투자전략이 투자위험관리에 효과적임을 보였다.

  • PDF

다크웹 아동 음란물 추적을 위한 연관규칙 기반 키워드 수집체계 (Keyword Collection System based on Association Rules to Track Pornography of Children on Dark Webs)

  • 김진경;김지연;김창훈
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2023년도 제68차 하계학술대회논문집 31권2호
    • /
    • pp.207-208
    • /
    • 2023
  • 다크웹을 통한 마약, 금융거래, 해킹 등 사이버 범죄가 증가하면서 다크웹 상의 범죄 추적을 위한 사이버 수사 필요성이 증대되고 있다. Tor와 같은 다크웹 접속 브라우저는 강력한 익명성을 제공하기 때문에 주로 다크웹 운영상의 취약점 분석, 악성코드를 활용한 함정수사 기법이 실효성 높은 다크웹 수사 기술로 간주된다. 그러나 사이트 개설 및 폐쇄가 빈번하게 발생하는 다크웹의 특성상 최신 범죄 정보를 수집하기 위해서는 방대한 다크웹 정보를 실시간 수집하고, 능동적으로 검색 키워드를 확장할 수 있는 고도화된 크롤러 기술 개발이 필요하다. 본 논문은 다양한 다크웹 사이트 중, 아동 음란물 사이트를 크롤링을 통해 수집하고, 수집된 텍스트의 연관 분석을 통해 검색 키워드를 확장하는 수집 체계를 제안한다.

  • PDF

한국농수산대학 신입생 자기소개서의 텍스트 마이닝과 연관규칙 분석 (1) (Text Mining and Association Rules Analysis to a Self-Introduction Letter of Freshman at Korea National College of Agricultural and Fisheries (1))

  • 주진수;이소영;김종숙;신용광;박노복
    • 현장농수산연구지
    • /
    • 제22권1호
    • /
    • pp.113-129
    • /
    • 2020
  • 본 연구는 2020년 한농대 입학생의 비정형 텍스트인 자소서에서 의미 있는 정보 혹은 규칙을 추출하기 위하여 고교 재학 중 '학업 및 학습경험'과 '교내 활동'을 기술한 두 개 문항에 대하여 텍스트 마이닝에 의한 토픽 분석과 연관성 분석을 하였다. 모집 전형을 구분하지 않은 텍스트 마이닝 분석 결과에서 '학업 및 학습 경험' 항목과 관련된 주요 키워드는 '공부', '생각', '노력', '문제', '친구' 등의 순으로 많이 나타났으며, '교내 활동' 항목과 관련된 주요 키워드는 '활동', '생각', '친구', '동아리', '학교' 등의 순으로 빈도가 높게 나타났다. 그러나 도시 인재 전형과 농수산 인재 전형 신입생들의 키워드 빈도 순위는 두 항목 모두 전형 특성에 따른 약간의 차이를 나타냈다. 빈도 분석에 결과는 빈도수 상위 50위까지의 키워드를 워드 클라우드로 시각화하여 키워드를 알기 쉽게 표현하였다. 연관 분석은 apriori() 함수를 사용하였으며 적정한 계산을 위하여 support(지지도)와 confidence(신뢰도)의 기준값을 항목별로 설정하였다. 먼저 '학업' 항목에 대한 연관 규칙은 46개를 추출하였으며, 그 가운데 {공부} => {생각}, {성적} => {공부} 및 {과목} => {공부} 등의 규칙에서 높은 연관성을 볼 수 있었다. 이 규칙을 바탕으로 매개체 역할의 키워드를 평가하는 관계 중심성 평가와 노드에 연결된 edge의 수에 따라 중요도를 파악하는 연결 중심성 평가에서는 '생각', '공부', '노력', '시간' 등의 키워드가 중심적인 역할을 하는 정보를 획득하였다. 다음으로 '교내 활동' 항목에서는 45개의 연관 규칙을 생성하여 {활동} => {생각}, {동아리} => {활동} 등의 규칙에서 높은 연관성을 볼 수 있었으며, 관계 중심성 평가와 연결 중심성 평가에서는 '생각', '활동', '학교', '시간', '친구' 등의 키워드가 중심 키워드라는 결과를 얻었다. 다음 연구에서는 자소서의 나머지 두 개의 문항 '배려·나눔·협력·갈등관리' 항목과 한농대 '지원동기와 향후 진로계획' 항목을 분석한다. 분석에는 '키워드의 빈도'에 '문서 빈도의 역수'를 곱하여 주로 다량의 문서에서 핵심어를 추출하는 TF-IDF(Term Frequency-Inverse Document Frequency) 분석을 추가한다.

연관성 규칙 탐사를 이용한 상호운용성 정의의 해석 (An Interpretation of Interoperability Definitions Using Association Rules Discovery)

  • 허환;김자희
    • 한국전자거래학회지
    • /
    • 제16권2호
    • /
    • pp.39-71
    • /
    • 2011
  • 최근 정보기술이 발전함에 따라 전자거래가 증가되고, 시스템의 분산화가 빠르게 진행되면서 상호운용성의 중요성에 대한 공감대가 형성되고 있다. 그러나 적용분야와 이해관계자의 관점에 따라 상호운용성의 정의가 상이하여 특정 시스템에 요구되는 상호운용성의 수준이나 평가 방법에 관한 공감대는 여전히 부족한 실정이다. 예를 들어 국방 분야에서는 동일한 업무를 하는 관계 기관별로도 상이한 정의를 사용하며 상호운용성의 실질적인 시험평가는 정의와는 다소 무관하게 정보교환 능력 수준의 저차원적인 평가만을 수행한다. 본 연구에서는 다양한 상호운용성 정의를 수집하여 그 정의의 구성요소를 추출하고, 이들을 데이터 마이닝의 연관성 규칙 탐사 방법을 이용하여 새로운 상호운용성 정의를 제시한다. 이 정의를 기준으로 한국군에서 사용 중인 정의들과 비교 분석한다. 본 연구에서는 장바구니 분석 기법을 이용하여 민간 및 국방 분야의 상호운용성 정의 구성요소의 연관성을 찾아, 가장 일반적이고 범용적인 정의를 도출하였다. 이 결과는 상호운용성에 대한 정의와 수준 및 평가항목 등에 대한 다양한 이해당사자들의 합의를 도출하는 데에 도움을 줄 것으로 기대한다.

고속연관규칙을 이용한 문맥광고에서의 콘텐츠 추천 (Content Recommendation Using High-Speed Association Rule Generation for Contextual Advertisement)

  • 김성민;이성진;이수원
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2006년도 가을 학술발표논문집 Vol.33 No.2 (B)
    • /
    • pp.362-365
    • /
    • 2006
  • 인터넷 사용자가 급증함에 따라 온톨로지를 이용한 지능형 웹이나 인터넷 사용자에게 개인 맞춤형 서비스를 제공하기 위한 다양한 연구가 진행되고 있다. 대표적인 예로 문맥광고는 인터넷 사용자들이 뉴스나 커뮤니티 사이트에서 콘텐츠를 조회하고, 해당 콘텐츠와 일치하거나 관련성이 높은 제품 또는 서비스 정보를 제공하는 광고기법이다. 그러나 문맥 광고는 사용자에게 다양한 콘텐츠 및 사이트 추천 서비스를 제공하지 못하고 있다. 따라서 다양한 콘텐츠 및 사이트 추천 서비스를 제공하기 위해 본 논문에서는 사용자가 조회한 콘텐츠의 내용을 대표할 수 있는 중요 키워드를 선정하고, 콘텐츠 내에서 추출된 키워드간의 연관성을 분석하여 관련 콘텐츠 및 사이트를 추천하는 방법에 대해 제안한다. 또한 연관키워드리스트 생성방법을 고속연관규칙을 이용하여 처리속도를 줄이고, 사용자가 선호할 만한 다양한 콘텐츠와 관련된 사이트를 제공하는 방법에 대해 제안한다.

  • PDF

개인화에서 사용자 프로파일 구축을 위한 효과적인 규칙확인 방법 (Efficient Rule Validation Methods for User Profiling in Personalization)

  • 손준원;배기성;석민수
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2004년도 춘계학술발표대회
    • /
    • pp.557-560
    • /
    • 2004
  • 추천 시스템에서부터 1:1 마케팅에 이르는 전자 상거래의 다양한 응용 영역에서, 개별 사용자로부터 개인화된 사용자 프로파일을 구축하는 것은 매우 중요하다. 이러한 프로파일들은 사용자들의 구매 행위와 같은 개인별 행동들을 설명해주며, 특히 다양한 데이터 마이닝(Data Mining) 기술들을 이용해 사용자의 거래 기록으로부터 학습된 규칙들을 발견해낼 수 있다. 발견된 규칙들 중에는 거짓이거나 연관 없거나 또는 하찮은 것들도 존재하기 때문에, 가장 중요한 문제 가운데 하나는 발견된 규칙들을 처리후-분석을 어떻게 수행하느냐이다. 예를 들어, 발견된 규칙을 사용자 프로파일에 적합한 것인지를 확인할 때 좋은 규칙과 나쁜 규칙을 어떻게 판명하는가 하는 문제이다. 이 논문에서는 규칙을 확인하는 과정에서 객관적 척도를 이용하는 방법을 제안하였다.

  • PDF

매개 변수를 이용한 의사결정나무 생성에 관한 연구 (A study on decision tree creation using intervening variable)

  • 조광현;박희창
    • Journal of the Korean Data and Information Science Society
    • /
    • 제22권4호
    • /
    • pp.671-678
    • /
    • 2011
  • 데이터마이닝은 방대한 양의 데이터 속에서 쉽게 드러나지 않는 유용한 정보를 찾아내는 기법으로서 의사결정나무, 연관 규칙, 군집분석, 신경망 분석 등의 기법이 있으며, 이중 의사결정나무 알고리즘은 의사결정 규칙을 도표화하여 관심대상이 되는 집단을 몇 개의 소집단으로 분류하거나 예측을 수행하는 방법으로서 고객세분화, 고객 분류, 문제 예측 등의 여러 분야에서 유용하게 활용되고 있다. 일반적으로 의사결정나무의 모형 생성 시, 모형 생성의 기준 및 입력 변수의 수에 따라 복잡한 모형이 생성되기도 하며 특히 입력 변수의 수가 많을 경우 종종 모형 생성 및 해석에 있어 어려움을 격기도 한다. 이에 본 논문에서는 의사결정나무 생성 시, 입력 변수에 대한 매개 관계를 파악하여 나무 생성에 불필요한 입력 변수를 제거하는 방법을 제시하고 그 효율성을 파악하기 위하여 실제 자료에 적용하고자 한다.

연관규칙 마이닝을 활용한 뉴스기사 키워드의 연관성 탐사 (Discovering News Keyword Associations Using Association Rule Mining)

  • 김한준;장재영
    • 한국인터넷방송통신학회논문지
    • /
    • 제11권6호
    • /
    • pp.63-71
    • /
    • 2011
  • 현재 대부분의 웹포털 사이트는 인기도 또는 중요도가 높은 키워드를 제공하는 서비스가 제공되고 있는데, 구체적으로 태그 클라우드 형태와 연관 검색 서비스와 같은 사용자 친화형 서비스를 지원하고 있다. 하지만 일반적으로 뉴스기사는 날짜와 분야별로 기사들이 분류되어 있기에, 사용자는 카테고리별로 나누어진 기사를 읽을 수만 있을 뿐 그 기사와 연관된 다른 기사를 쉽게 찾아보지는 못한 실정이다. 또한 연관 검색어 서비스도 사용자가 검색한 입력내용을 기반으로 연관성 정도를 분석하기에 충분한 객관성을 보장하지 못하고 있다. 본 논문에서는 기존의 태그 클라우드 방식에서 좀 더 나아가 축적된 뉴스 기사로 부터 검색 키워드와 밀접히 연관된 키워드를 추출하여 제공하는 기사 검색 방식을 제안한다. 제안 기법은 기본적으로 연관규칙 마이닝을 이용하여 키워드 연관성을 추출하게 되며, 뉴스기사 특성을 반영하여 문장 내부에 존재하는 키워드에 한정하여 연관성을 추출한다. 연관된 키워드 집합을 이용하여 키워드와 가장 밀접한 기사를 검색할 뿐만 아니라, 연관 키워드간의 관계성을 보여줌으로써 뉴스 기사들 속에 숨겨진 연관정보의 탐색을 가능하게 한다.

다중외적연관성규칙을 이용한 불필요한 입력변수 제거에 관한 연구 (A study on removal of unnecessary input variables using multiple external association rule)

  • 조광현;박희창
    • Journal of the Korean Data and Information Science Society
    • /
    • 제22권5호
    • /
    • pp.877-884
    • /
    • 2011
  • 의사결정나무는 데이터마이닝의 대표적인 알고리즘으로서, 의사결정 규칙을 도표화하여 관심대상이 되는 집단을 몇 개의 소집단으로 분류하거나 예측을 수행하는 방법이다. 일반적으로 의사결정나무의 모형 생성 시, 입력 변수의 수가 많을 경우 생성된 의사결정모형은 복잡한 형태가 될 수 있고, 모형 탐색 및 분석에 있어 어려움을 겪기도 한다. 이때 입력변수들 간의 내재적인 관련성은 없으나, 외적 변수에 의하여 각 변수가 우연히 어떤 다른 변수와 연결됨으로써 관련성이 있는 것으로 나타나는 것을 종종 볼 수 있다. 이에 본 논문에서는 의사결정나무 생성 시, 입력 변수에 대한 외적 관계를 파악할 수 있는 다중외적연관성규칙을 이용하여 의사결정나무 생성에 불필요한 입력변수를 제거하는 방법을 제시하고 그 효율성을 파악하기 위하여 실제 자료에 적용하고자 한다.

국민건강영양조사 자료를 활용한 라이프스타일 위험요인과 다중이환간의 연관관계분석 (Assoication Rule Analysis between lifestyle risk behaviors and multimorbidity: Findings from KHANES)

  • 이현주;명성민
    • 한국학교ㆍ지역보건교육학회지
    • /
    • 제25권1호
    • /
    • pp.29-41
    • /
    • 2024
  • 목적: 본 논문에서는 대한민국 성인의 라이프스타일 위험요인과 복합만성질환간의 연관성 규칙을 탐색하여 보건교육프로그램에 필요한 방향성과 기초정보를 제공하는데 목적을 둔다. 방법: 제8기 국민건강영양조사 중 2019년부터 2020년까지 만 19세 이상 성인 7,609명을 대상으로 하였으며, 6개의 라이프스타일 위험요인과 11가지 이환질환에 대하여 R과 R 스튜디오를 이용하여 연관규칙마이닝을 수행하였다. 결과: 본 연구 결과를 통하여 연관규칙마이닝과 같은 데이터마이닝 기법을 통해 생활 습관 위험 요인의 중요성과 여러 만성 질환의 역할을 보여줬다는 점에서 의미가 있다. 결론: 상기 결과를 통하여 신체 활동 부족을 해결하기 위한 운동 프로그램, 부적절한 체중을 해결하기 위한 식이 중재, 부적절한 수면을 해결하기 위한 정신건강 교육프로그램과 같은 선택적이고 집중적인 건강교육 프로그램에 대한 개발의 필요성이 요구된다.