• 제목/요약/키워드: 일반화된 연관 패턴

검색결과 20건 처리시간 0.029초

소셜 네트워크 기반 맞춤형 콘텐츠 추천 시스템 (Personalized Contents Recommendation System Based on Social Network)

  • 이석필
    • 방송공학회논문지
    • /
    • 제18권1호
    • /
    • pp.98-105
    • /
    • 2013
  • 최근의 미디어 생성/소비 패턴은 UCC 같은 소비자가 직접 미디어를 생성하고 소비하는 프로세스가 등장하여 일반화되고 있다. 그동안 다양한 콘텐츠 중에서 사용자가 원하는 콘텐츠만을 제공하기 위해 사용자 프로파일을 이용한 콘텐츠 추천 엔진에 대한 연구가 많이 진행되어왔다. 본 연구는 사용자 프로파일 이외에 다종의 멀티미디어 콘텐츠의 소비를 바탕으로 사용자들을 소셜 네트워킹화하고 이를 통해 유사 콘텐츠 선호패턴을 가진 구성원들의 사용자 프로파일을 바탕으로 개인화된 맞춤형 콘텐츠를 추천할 수 있는 추천 에이전트를 개발하였다. 개발한 추천 에이전트는 방송/통신망 상에 존재하는 다양한 콘텐츠 중에 사용자의 선호패턴과 일치하는 콘텐츠들을 추천하고 소셜 네트워크상의 사용자들간의 연관성을 통해 선호도를 갱신하는 시스템이다.

일반화 기반 분류기법을 이용한 산불예측시스템 설계 및 구현 (Design and Implementation of Forest Fire Prediction System using Generalization-based Classification Method)

  • 김상호;김대진;류근호
    • 한국지리정보학회지
    • /
    • 제6권1호
    • /
    • pp.12-23
    • /
    • 2003
  • 정보산업의 급속한 발전은 축적되어 있는 대규모의 데이터로부터 보다 가치 있는 정보 생성 및 정확한 데이터 분석 능력을 요구하고 있다. 특히 데이터마이닝 기법을 이용하여 주어진 데이터간의 연관관계를 도출하고, 얻어진 패턴을 바탕으로 미래를 예측하는 방법은 주목을 받고 있다. 이 연구에서는 속성중심 귀납방법과 분류규칙을 통합한 일반화 기반의 분류기법을 제안하였고, 간결한 모델의 구축 및 규칙 추출을 수행하였다. 또한 일반화 기반 분류 예측시스템에 산불데이터를 적용하여, 기상 데이터와 산불발생 사이의 관련성을 분석하고 효율적인 예측을 수행하였다. 이 연구에서 제시한 기법은 반복적으로 발생하는 자연재해에 대한 분석 및 예측, 에너지의 수요량 예측등과 같이 실생활의 중요한 부분들에 다양하게 응용할 수 있다.

  • PDF

개념간 관계의 추출과 명명을 위한 통계적 접근방법 (A Statistical Approach for Extracting and Miming Relation between Concepts)

  • 김희수;최익규;김민구
    • 정보처리학회논문지B
    • /
    • 제12B권4호
    • /
    • pp.479-486
    • /
    • 2005
  • 온톨로지는 차세대 시맨틱 웹을 위한 논리의 기반을 구성하기 위해 제안되었다. 이러한 온톨로지는 특정 분야에 대한 지식을 정형화된 형태로 표현함으로써 기계에 의한 지식의 이해를 가능하게 하고, 이를 사용하여 사용자의 요구에 알맞은 지능화된 서비스를 제공할 수 있게 한다. 하지만, 온톨로지의 구축과 유지는 많은 사람의 시간과 노력을 요구한다. 본 고에서는 온톨로지 구축 방법의 일환으로, 문서로부터 온톨로지를 구성하는 개념간의 관계를 정의하는 자동화된 방법을 제안한다. 본 고에서 제안된 방법은 특정 분야의 문서에 존재하는 개념을 기반으로 개념간의 연관 규칙을 형성하는 개념 쌍을 찾고, 두 개념 사이에 존재하는 내용의 군집화를 통해 두 개념간의 관계를 설명하는 패턴을 찾는다. 마지막으로 패턴간의 군집화를 사용하여 개념 사이의 일반화된 관계를 명시한다. 본 고에서는 제안된 방법을 검증하기 위한 방법으로 TREC(Text REtrieval Conference)에서 제공하는 문서집합을 사용하여 개념간의 관계를 추출, 평가하였으며, 그 결과 제안된 방법은 개념간의 관계를 설명하는 유용한 정보를 제공할 수 있음을 보여준다.

기상인자의 주기성 분석 및 일반화 선형모형을 이용한 강수영향분석: 2004KEOP의 한반도 남서지방 8개 지역 기상관측자료사용 (Analysis of Periodicity of Meteorological Measures and Their Effects on Precipitation Observed with Surface Meteorological Instruments at Eight Southwestern Areas, Korea during 2004KOEP)

  • 김혜중;염준근;이영섭;김영아;정효상;조천호
    • 응용통계연구
    • /
    • 제18권2호
    • /
    • pp.281-296
    • /
    • 2005
  • 본 연구에서는 2004년 기상청 집중관측기간(KEOP)에 수집된 지상관측자료를 사용하여 한반도 남서지방의 지역별(해남 외 7개 지역) 기상인자들의 주기성과 이들이 강수현상에 미치는 영향을 분석하였다. 이를 위하여 기술통계와 스펙트럴분석을 사용하여 주기성을 분석하고, 관측기간 및 지역별 랜덤효과를 반영할 수 있는 일반화 선형모형을 제시하여 강수현상에 미치는 기상인자들의 영향을 분석했다. 분석결과에 의하면 기상인자들과 강수현상은 연관성을 가지며 특정주기에 따라 변동하는 것으로 나타났으며, 기상인자들은 지역에 따라 상이한 패턴으로 강수현상에 영향을 미치는 것으로 나타났다.

NHPP에 기초한 소프트웨어 신뢰도 모형에 대한 비교연구 (The Comparative Study for Software Reliability Models Based on NHPP)

  • 간광현;김희철;이병수
    • 정보처리학회논문지D
    • /
    • 제8D권4호
    • /
    • pp.393-400
    • /
    • 2001
  • 본 논문에서는 비동질 포아송 프로세스(NHPP)에 기초한 소프트웨어 에러 현상에 대한 확률 모형을 고려하였다. 고장 패턴은 NHPP에 대한 강도함수와 평균값 함수로서 나타낼 수 있다. 따라서 본 논문에서는 기존의 모형인 Goel 이 제시한 일반화모형[2]과 Yamada, Ohba-Osaki 모형[11]을 재조명하고 이러한 모형과 연관되고 신뢰도 분포로 많이 사용되는 와이블 분포의 특수형태인 레일리(Rayleigh)분포와 겜벨(Gumbel)분포[5]를 이용한 모형을 제시하고, 또 효율적 모형을 위한 모형선택으로서 편차자승합(SSE)을 이용하여 비교하였다. 모수의 추정을 위해서 최우추정법(MLE)과 일반적인 수치해석적 방법인 이분법을 이용하였다. 수치적인 예에서는 실측자료인 NTDS 자료[4]를 이용하여 모수 및 신뢰도를 추정하였고 편차자승합을 이용한 모형비교의 결과를 나열하였다.

  • PDF

시간간격을 고려한 시간관계 규칙 탐사 기법 (Discovering Temporal Relation Rules from Temporal Interval Data)

  • 이용준;서성보;류근호;김혜규
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제28권3호
    • /
    • pp.301-314
    • /
    • 2001
  • 데이터마이닝은 대용량 데이터베이스에 내재된 유용한 지식을 탐사하는 기술로 정의된다. 데이터마이닝에 대한 연구가 진행되면서 순차 패턴, 유사 시계열 탐사, 시간 연관규칙 탐사 등과 같이 시간 값을 가진 데이터로부터 지식을 탐사하고자 하는 시간 데이터마이닝에 대한 연구가 수행되었다. 그러나 기존 연구는 트랜잭션의 발생 시점만을 가진 데이터를 다루고 있으며 시간 간격을 가진 데이터는 거의 고려하고 있지 않다. 실세계에서는 환자의 병력, 상품 구매 이력, 웹 로그 등과 같은 시간간격을 가진 다양한 데이터가 존재하며 이로부터 여러 유용한 지식을 찾아낼 수 있다. Allen은 시간간격 데이터 사이에 발생할 수 있는 시간 관계와 시간 관계를 구할 수 있는 시간간격 연산자를 정의하였다. 본 논문에서는 Allen의 정의를 기반으로 시간간격 데이터로부터 시간관계 규칙을 효율적으로 탐사하기 위한 새로운 데이터마이닝 기법을 제안하였다. 이 기법은 발생 시점을 가진 시간 데이터를 시간간격 데이터로 요약하여 일반화하는 전처리 알고리즘과 시간간격 데이터로부터 시간관계 규칙을 생성하는 규clr 탐사 알고리즘으로 구성된다. 이 기법은 기존 데이터마이닝 기법에서 찾지 못하는 유용한 시간 규칙을 탐사할 수 있다.

  • PDF

교통사고 데이터의 마이닝을 위한 연관규칙 학습기법과 서브그룹 발견기법의 비교 (Comparison of Association Rule Learning and Subgroup Discovery for Mining Traffic Accident Data)

  • 김정민;류광렬
    • 지능정보연구
    • /
    • 제21권4호
    • /
    • pp.1-16
    • /
    • 2015
  • 교통사고의 원인을 규명하고 미래의 사고를 방지하기 위한 노력의 일환으로 데이터 마이닝 기법을 이용한 교통 데이터 분석의 연구가 이루어지고 있다. 하지만 기존의 교통 데이터를 이용한 마이닝 연구들은 학습된 결과를 사람이 이해하기 어려워 분석에 많은 노력이 필요하다는 문제가 있었다. 본 논문에서는 많은 속성들로 표현된 교통사고 데이터로부터 유용한 패턴을 발견하기 위해 규칙 학습 기반의 데이터 마이닝 기법인 연관규칙 학습기법과 서브그룹 발견기법을 적용하였다. 연관규칙 학습기법은 비지도 학습 기법의 하나로 데이터 내에서 동시에 많이 등장하는 아이템(item)들을 찾아 규칙의 형태로 가공해 주며, 서브그룹 발견기법은 사용자가 지정한 대상 속성이 결론부에 나타나는 규칙을 학습하는 지도학습 기반 기법으로 일반성과 흥미도가 높은 규칙을 학습한다. 규칙 학습 시 사용자의 의도를 반영하기 위해서는 하나 이상의 관심 속성들을 조합한 합성 속성을 만들어 규칙을 학습할 수 있다. 규칙이 도출되고 나면 후처리 과정을 통해 중복된 규칙을 제거하고 유사한 규칙을 일반화하여 규칙들을 더 단순하고 이해하기 쉬운 형태로 가공한다. 교통사고 데이터를 대상으로 두 기법을 적용한 결과 대상 속성을 지정하지 않고 연관규칙 학습기법을 적용하는 경우 사용자가 쉽게 알기 어려운 속성 사이의 숨겨진 관계를 발견할 수 있었으며, 대상 속성을 지정하여 연관규칙 학습기법과 서브그룹 발견기법을 적용하는 경우 파라미터 조정에 많은 노력을 기울여야 하는 연관규칙 학습기법에 비해 서브그룹 발견기법이 흥미로운 규칙들을 더 쉽게 찾을 수 있음을 확인하였다.

지리학에서 제도적 접근법에 관한 연구 -한국금융부문의 제도적 변 화를 사례로- (Institutional approaches in geography -Institutional changes in the Korean financial system-)

  • ;최재헌
    • 대한지리학회지
    • /
    • 제30권4호
    • /
    • pp.364-388
    • /
    • 1995
  • 본 연구는 지리학에서 최근 대두되고 있는 제도적 조직체 (institutions)에 관한 연구를 접근 방법으로 인식하기 위하여 이를 제도적 접근법이라고 칭 하고, 그에 대한 정의와 지리학 내에서의 연구 경향을 살펴본 후, 적용의 예로 한국경제발전 의 공간적 구조를 설명하기 위한 측면에서 금응기관이 담당하였던 역할을 제도적 조직체의 특성면에서 고찰하고자 하였다. 제도적 조직체에 관한 연구방법은 지리학에서 뚜렷한 방법 론의 하나로 인식되어 오지는 않았으나 최근 자본주의 사회에서 공간 구조를 결정짓는 작인 으로 지리학에서 추구하는 공간의 패턴과 과정에 설명력을 부가하여 줄 수 있다는 측면에서 긍정적으로 평가되고 있다. 제도적 접근법은 제도적 조직체의 공간적 역할을 규명함으로써 지리적 현상에 대한 설명을 추구하는 접근법이라고 정의할 수 있다. 그러나 먼저 제도 조직 체에 대한 정의와 제도 조직체가 공간에 미치는 현상에 대한 일반화 문제 제도 조직체적 접 근 방법이 가지는 장점과 단점 등에 관한 논의가 선행되어야 한다. 제도적 접근법이 공통의 관심 대상으로 하는 제도적 조직체(institutions)에 대한 연구는 일찍부터 사회학에서의 조직 이론(organization theory)과 경제적에서 Veblen에 의해 발달되었던 제도경제학파의 이론, 투자와 금융기관의 역할을 강조한 후기케인즈 학파, 그리고 자본축적의 과정에서 국가, 대기 업, 금융기관 등의 역할을 강조하고 있는 정경주의적 접근 방법(political economy approach)등에서 구체적인 관심과 정의를 발견할 수 있다. 특히 제도경제학파에서는 제도적 조직체를 제도(a rule of game)와 조직(organization)으로 정의하고 있다. 지리학에서 제도적 조직체에 대한 정의는 제도 경제학에서 발달한 것과 같은 유사한 토대 위에서 역시 행동을 통제하는 제도와 조직으로 정의가 가능하다. 즉 제도적 조직체란 조직의 내부 구조와 제도 에 의해 활동에 영향을 받는 객체라고 할 수 있다. 그러나 지리학에서의 제도적 조직체에 대한 연구는 지리학적 대상을 설명하는데 그 초점을 두고 있다는 점에서 경제학에서의 접근과 다르다. 즉 지리학에서는 제도적 조직체가 지리적 패턴 형성에 어떤 역할을 하는가 라는 질문이 핵심이 된다. 제도적 조직체를 다루기 위한 구체적 사항으로 제도적 조직체의 목적 (the goal of institutions),규제 제도(system of regulation),조직의 특성(internal structure)등이 공간적 특성과 자원의 공간적 분배와 관련되어 고려되어야 한다. 지리학에서 제도적 접근법에 관한 연구 경향은 첫째, 초기의 정책 및 제도를 공간적 관점에서 관심을 두었던 연구와, 둘째 정부와 국가의 역할에 관한 연구, 세째 'urban managerialism'적인 전 통, 네째 생산체계와 관련된 조절학파(regulation approach) 등으로 요약 가능하다. 첫째, 초기의 제도적 조직체에 관한 연구는 주로 정부 역할에 대한 평가를 기술하는 것으로 이루어 졌다. 계량혁명 이후 제도적 조직체에 관한 연구는 미약하였지만 행태주의자들에 의해 조직 행태와 의사결정 과정을 다룬 연구에서 부분적으로 발견된다. 둘째, 이론적이고 경험적인 측 면에서 정부를 제도적 조직체로 보고 그 지리적 영향을 다룬 연구들에서는 이론적 측면에서 지리적 현상에 영향을 미치는 정부의 본질과 기능을 다루면서 자본주의의 한 구성요소로서 정부를 보는 관점과, 자본주의로부터 독립적인 영역으로서 정부의 역할을 보는 관점 사이에 논쟁이 전개되었다. 또한 경험적인 연구로 정책적 문제부터 제도적 변화 등이 다루어졌다. 세째, 'urban managerialism'적 전통에서 제도적 조직체를 강조하고 있다. 'gatekeeper' 또는 'manager'로 대표되는 제도적 조직체가 도시 내의 토지이용을 결정짓는 작인으로 인식 되어 이들에 의해 사회적인 제약 요건이 설정 됨으로써 도시내에 상이한 자원 배분이 일어 난다고 보는 것이다. 그러나 제도적 조직체가 사회구조(social structure)에서 독립된 역할을 수행하는지의 여부가 쟁점이 된다. 네째, 프랑스 조절학파에 의한 조절론적 접근법 (regulation approach)에서 제도적 조직체는 축적 제도(regime of accumulation)를 지지하는 조절 양식(mode of regulation)의 한 구성요소로 이해되어 진다. 즉 자본주의의 발달은 생산 제도와 조직체 및 조직체의 활동에 의해 특징 지워지며 제도적 조직체는 생산 체계와 밀접 한 연관이 있다는 것이다. 그러나 조절 양식(regulation)의 정의와 위기시의 조절양식의 안 정성, 제도적 조직체의 독립성 등의 측면에서 많은 의문점이 제기 되고 있다. 제도적 조직체 로서 한국의 금융기관을 보면 먼저 그 목적상 한국의 금융기관은 경제 발전에서 자본 형성 을 위한 수단으로서 역할을 수행하여 왔다. 조직적 면에서 볼 때 한국의 금융기관은 지점망 제도를 채택하고 있으며 금융의 자유화가 추진된 1980년대 이후 엄격한 수직적 구조 둠으로 써 지리적 현상에 대한 설명력을 더할 수 있고, 학제적인 접근을 꾀하여 상이한 분야간에 공동적인 관심을 증가시킬 수 있다는 장점이 있지만, 일반적 문제점으로 제도적 조직체에 관한 정의와 관련하여 제조적 조직체 자체를 주위환경을 변화시킬 수 있는 능동적인 작인으 로 보는가, 또는 주변 환경의 영향을 받아 형성된 수동적인 산물로 파악 하는가 하는 점이 'agent'와 'structure' 논쟁의 틀 속에서 지적될 수 있다. 또한 어떻게 상이한 형태의 제도적 조직체가 지리적 패턴에 미치는 영향을 일반화 할 수 있는가라는 점에서 많은 연구가 이루 어져야 된다.

  • PDF

데이터 마이닝의 범죄수사 적용 가능성 (Usefulness of Data Mining in Criminal Investigation)

  • 김준우;손중권;이상한
    • 대한수사과학회지
    • /
    • 제1권2호
    • /
    • pp.5-19
    • /
    • 2006
  • 데이터 마이닝은 컴퓨터와 정보처리의 발전으로 각기 다른 차원에서 다량으로 수집되는 데이터 속에서 숨은 의미나 패턴을 발견하는 유용한 기법이다. 의사결정나무, 신경망 모형, 규칙 귀납, K-평균 군집화, 시각화 등의 데이터 마이닝 개별 기법들은 산재해 있는 데이터에서 연관성을 분석하고, 이를 분류함으로써 일반화된 개념을 정의하고, 새로운 지식을 추론함으로써 실제 생활에 적용 가능한 예측을 가능하게 한다. 따라서 현재 데이터 마이닝은 기업의 마케팅 분야, 금융기관의 고객 분석, 통신 회사의 고객 이탈 방지 등에서 유용하게 활용되고 있다. 우리가 접해야 하는 정보의 양이 늘어나는 것은 범죄 수사에 있어서도 마찬가지 현상이다. 범죄와 범죄자에 대한 데이터는 축적되어 가지만 정작 개별 사안에 있어서는 중요한 데이터가 접근조차 되지 않고 있으며, 많은 데이터 속에서 이것이 내포하고 있는 숨은 의미를 지나치게 되는 경우도 많다. 본 연구에서는 선행 연구와 사례 적용을 통해 데이터 마이닝의 범죄 수사 적용 가능성과 한계점을 살펴보고자 하였다. 미제 사건으로 남는 경우가 많은 절도나 사기 같은 습관적 상습 범죄의 경우 데이터 마이닝의 분류, 군집화 기능을 활용 한다면 향후 여죄 추적에 효율적으로 활용될 수 있음을 파악할 수 있었고, 특히 다양한 문제에 적용 가능하고, 잡음에 대한 견고성이 있음에도 예측의 정확성을 지니고 있는 신경망 모형의 경우 패턴 인식을 통하여 범죄자 프로파일링이나 화상 자료 대비 시스템 구축에 충분히 활용될 것으로 생각한다. 특히 보험 사기 사례 적용에서 살펴본 바와 같이 마약, 테러와 같은 조직적 범죄수사나 자금세탁과 같은 금융 추적 수사의 경우 해당 자료의 방대함과 모호성으로 인해 수사를 하는 데 많은 어려움이 있지만 이러한 데이터 마이닝 가시화 기법을 적절히 활용한다면 전체적인 윤곽을 파악하는 데 매우 유용하며, 효율적인 수사가 가능함을 확인할 수 있었다. 그러나 데이터 마이닝은 예측 모델이므로 오류를 내재하고 있다는 점에서 수사 기관의 데이터 마이닝 접근은 조심스러워야 하며, 정보 독점화 현상과 개인 사생활 보호라는 측면에서 각 수사기관은 해당 법률에 정한 범위 내에서 해당 사건별로 데이터를 수집하고 이를 통합, 재구성하여 활용하는 측면으로 적용되어야 할 것이다. 또한 각 수사기관별로는 자신의 보유하고 있는 데이터에 대해 다차원 처리가 가능하도록 데이터베이스 시스템을 구축하여 데이터 마이닝이 적용 가능한 환경을 구축하도록 하여야 할 것이다. 아직은 논의의 초기 단계이므로 효과가 크게 부각되지는 않았지만 지금까지 제시한 문제에 대한 연구가 계속 이루어진다면 인권중심, 증거중심의 수사 개념을 바탕으로 적법절차에 의한 수사 활동을 요구받는 시대에 새로운 대안으로 자리 잡을 것이며, 수사의 과학화에 기여할 것으로 전망한다.

  • PDF

기술사업화 실패 사례연구 (Case Studies on the Failure of Commercialization of Technology)

  • 김찬호;고창룡;설성수
    • 기술혁신학회지
    • /
    • 제15권1호
    • /
    • pp.203-223
    • /
    • 2012
  • 본 연구는 사업타당성이 있다고 평가되었지만 기술사업화가 중지된 사례의 실패원인을 규명하는데 목적이 있다. 이를 위해 여러 경로로 신기술사업화 타당성 평가 보고서 92건을 수집하고, 확실하게 사업화가 실패한 것으로 판단되는 4건에 대하여 추적조사 하였다. 추적조사는 기술사업화 성공과 실패에 관한 여러 이론적 갈래, 즉 기술사업화 성공실패론, 벤처기업 성공실패론 및 기술가치평가론 등의 선행 연구에서 지적된 결과를 중심으로 작성한 분석 틀에 기초하였다. 연구결과 표면적인 신기술사업화 실패원인들은 자금부족과 불가항력적인 요인, 관리력, 대량생산기술 부재 등으로 본 연구의 분석 틀로 제시된 선행연구 결과와 별반 다르지 않다. 하지만, 이면에 숨겨진 핵심 실패 원인은 광의의 기술이해 부족으로 분석되었다. 특히 기술구성 및 기술제품 단계별 소요기술이 존재한다는 점과 기술개발 성공이 기술사업화 성공과 다르다는 것을 이해하지 못한 것이 주요 원인으로 나타났다. 이러한 결과의 배경은 경영자의 전공과 경력이 평가기술과 연관성이 낮거나, 보유경험의 부족으로 분석되었다. 본 연구는 4개의 사례만 조사했다는 점에서 모든 요인을 일반화시키기 어렵지만 다음과 같은 시사점을 도출할 수 있다. 먼저, 표면상의 기술사업화 실패요인들이 선행연구 결과로 설명되었지만, 기술이해 부족이 이면에 숨겨진 핵심 실패요인임을 규명하였다. 둘째, 실패원인들을 분석함으로써 성공적인 기술사업화를 위한 패턴이 제시되었으며, 마지막으로 향후 기술사업화 주체인 경영자와 기업의 역량에 대한 깊은 분석과 기술사업화 평가 모형에 대한 적합성 검토가 필요하다.

  • PDF