• 제목/요약/키워드: 연관정보

검색결과 3,810건 처리시간 0.037초

연관 태그의 군집화를 위한 클러스터링 기법 비교 연구 (A Comparative Study on Clustering Methods for Grouping Related Tags)

  • 한승희
    • 한국문헌정보학회지
    • /
    • 제43권3호
    • /
    • pp.399-416
    • /
    • 2009
  • 본 연구에서는 태그 공간에서 정보의 효율적 탐색을 위해 이용자에게 제공될 수 있는 연관 태그 클러스터의 생성을 위해 다양한 유사계수와 클러스터링 기법을 적용한 후 그 결과를 평가하고 비교 분석함으로써 연관 태그의 클러스터링에 가장 적합한 클러스터링 알고리즘을 확인하고자 하였다. Delicious에서 임의의 태그 10개를 대상으로 각각 300개의 문서에서 추출한 연관 태그를 대상으로 태그쌍 간의 연관성을 측정한 후 계층적 기법과 비계층적 기법을 적용하여 생성된 클러스터를 대상으로 클러스터 적합도를 측정한 결과, 일반적으로 용어 클러스터링에서 널리 활용되는 것으로 알려진 워드 기법이 코사인 유사계수와 결합했을 때 거의 모든 실험 대상에 대해 유사한 경향을 보이면서 가장 우수한 성능을 나타내는 것으로 나타났다. 연관 태그 클러스터는 정보관리 측면에서 유사한 합목적성을 갖는 태그끼리 군집을 이루면서 용어의 중의성을 해소함으로써 태그 공간에서의 이용자의 정보 탐색에 유용하게 활용될 것이다.

축소 라운드 SHACAL-2의 연관키 공격 (Related-Key Attacks on Reduced Rounds of SHACAL-2)

  • 김종성;김구일;이상진;임종인
    • 정보보호학회논문지
    • /
    • 제15권3호
    • /
    • pp.115-126
    • /
    • 2005
  • SHACAL-2는 해쉬 알고리즘 SHA-2의 압축 함수에 기반을 둔 최대 512 비트 키 크기를 가지는 256 비트 블록 암호이다. 최근에 SHACAL-2는 NESSIE 프로젝트의 256 비트 블록 암호에 선정되었다. 본 논문에서는 연관키를 이용한 두 가지 형태의 연관키 차분-비선형 공격과 연관키 Rectangle 공격에 대한 SHACAL-2의 안전성을 논의한다. 연관키 차분-비선형 공격 기법을 통하여 512 비트 키를 사용하는 35-라운드 SHACAL-2를 분석하고, 연관키 렉탱글 공격 기법을 통하여 512 비트 키를 사용하는 37-라운드 SHACAL-2를 분석한다. 본 논문에서 소개하는 512 비트 키를 가지는 37-라운드 SHACAL-2 연관키 렉탱글 공격은 SHACAL-2 블록 암호에 알려진 분석 결과 중 가장 효과적이다.

퍼지집합을 이용한 실수값 속성 사이에 존재하는 연관규칙의 발견 (Finding Association Rules among Real-valued Items using Fuzzy Sets)

  • 이지형;이광형
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 1996년도 추계학술대회 학술발표 논문집
    • /
    • pp.115-118
    • /
    • 1996
  • 연관규칙(Association Rule)은 데이터 베이스에 존재하는 속성들 사이의 관계를 기술하는 것으로, 간단하면서도 사용자에게 많은 정보를 줄 수 있다. 그러나, 지금까지는 이진 데이터베이스에 존재하는 연관규칙의 발견에 대해서 주로 연구되어 왔으며, 실수값 속성을 갖는 데이터에 관한 연구는 미비하였다. 본 논문에서는 퍼지집합을 이용하여 실수값 사이에 존재하는 연관규칙을 기술하고, 그것을 찾아내는 방법을 제시한다. 제시하는 방법은 사용자에 의해서 정의된 언어항을 이용하여, 실수값 속성을 가진 데이터를 이진 데이터로 재구성한다. 그리고 재구성된 이진 데이터에 기존의 연관규칙 발견 방법을 이용하여 연관규칙을 찾아내고, 찾아진 연관규칙을 정의된 언어항을 이용하여 다시 기술한다.

  • PDF

빈발 패턴 네트워크에서 연관 규칙 발견을 위한 아이템 클러스터링

  • 오경진;정진국;조근식
    • 한국지능정보시스템학회:학술대회논문집
    • /
    • 한국지능정보시스템학회 2007년도 한국지능정보시스템학회
    • /
    • pp.321-328
    • /
    • 2007
  • 데이터마이닝은 대용량의 데이터에 숨겨진 의미있고 유용한 패턴과 상관관계를 추출하여 의사결정에 활용하는 작업이다. 그 중에서도 고객 트랜잭션의 데이터베이스에서 아이템 사이에 존재하는 연관규칙을 찾는 것은 중요한 일이 되었다. Apriori 알고리즘 이후 연관규칙을 찾기 위해 대용량 데이터베이스로부터 압축된 의미있는 정보를 저장하기 위한 데이터 구조와 알고리즘들이 제안되어 왔다. 본 논문에서는 정점으로 아이템을 표현하고, 간선으로 두 아이템집합을 표현하는 빈발 패턴 네트워크(FPN)이라 불리는 새 자료 구조를 제안한다. 빈발 패턴 네트워크에서 아이템 사이의 연관 관계를 발견하기 위해 이 구조를 어떻게 효율적으로 사용 하느냐에 초점을 두고 있다. 구조의 효율적인 사용을 위하여 한 아이템이 클러스터 내의 아이템과는 유사도가 높고, 다른 클러스터의 아이템과는 유사도가 낮도록 네트워크의 정점을 클러스터링하는 방법을 사용한다. 실험은 신뢰도, 상관관계 그리고 간선 가중치 유사도를 이용하여 네트워크에서 아이템 클러스터링의 정확도를 보여준다. 본 논문의 실험 결과를 통해 신뢰도 유사도가 네트워크의 정점을 클러스터링할 때 클러스터의 정확성에 가장 많은 영향을 미친다는 것을 알 수 있었다.

  • PDF

신경망에 기반한 개인화 기술 (A Personalization Technology Based on Neural Networks)

  • 김종수;도영아;류정우;김명원
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 가을 학술발표논문집 Vol.28 No.2 (2)
    • /
    • pp.28-30
    • /
    • 2001
  • 현 인터넷상에서 취향에 맞는 항목(상품) 정보를 사용자에게 추천해 주는 개인화 기술은 대부분 특정 사용자와 유사한 선호도를 갖는 다른 사용자들의 특정 항목에 대한 선호도를 바탕으로 항목의 선호도를 추정하는 협력적 추천 기술을 적용하고 있다. 이중 최근접 이웃 방법은 적용하기가 용이한 반면 항목간의 가중치를 고려하지 못함으로써 추천의 정확도가 크게 떨어지는 문제점이 있다. 연관규칙 방법은 다른 항목에 대한 선호도 자료로부터 데이터 마이닝 기법을 적용하여 항목 선호에 대한 연관규칙을 추출하고 그 규칙을 사용하여 어떤 항목의 선호도를 추정한다. 따라서 항목들 간의 중요도가 연관규칙의 지지도나 신뢰도 등으로 나타난다고 할 수 있으나, 단순히 항목들간의 연관관계 즉 표면적인 연관관계에 의하여 선호도를 결정함으로써 항목들간의 어떤 내용적인 공통성 또는 어떤 상위개념에 의한 선호도가 고려되지 않음으로써 역시 정확도가 떨어지는 문제점이 있다. 본 논문에서는 추천의 정확도를 향상시키기 위한 신경망 추천 방법에 대해 분석하고, 내용기반 추천과 협력적 추천을 병합한 신경망 추천 방법을 제안한다. 또한, 다른 협력적 추천 방법과의 비교를 통하여 본 추천 방법의 장점과 성능의 우수함을 보인다.

  • PDF

부문 분리된 산업연관표 추계방법 (A Method for Estimating Input-output Tables with Disaggregated Sector)

  • 정기호
    • 자원ㆍ환경경제연구
    • /
    • 제31권4호
    • /
    • pp.849-864
    • /
    • 2022
  • 본 연구는 에너지 및 환경경제학에서 기초 데이터로 많이 활용되는 산업연관표에서 특정 부문이 하부 부문들로 분리되는 경우 새로운 산업연관표를 추계하는 과정을 제시하였다. 보편적으로 산업연관표 추계에 이용되는 RAS 방법은 새로운 산업연관표의 부문별 생산액, 중간투입계, 중간수요계의 정보를 반드시 필요로 하지만, 많은 경우에 부문별 중간수요계 정보를 확보하기 어렵다는 문제가 있다. 본 연구는 특정 부문이 하부 부문들로 분리되는 상황에서 부문별 중간수요계 정보를 사용하지 않고도 새로운 산업연관표를 추계할 수 있는 과정을 제시하였다. 핵심 아이디어는 분리 후 산업연관표의 많은 원소들의 값이 분리 전 산업연관표의 원소들 값과 같다는 점과 분리 후 부문들의 원소 합이 분리 전 부문의 원소 값과 같다는 점이다. 중간수요계 정보 대신에 이들 정보를 이용해서 부문 분리 후의 산업연관표에 대한 중간거래행렬이나 투입계수행렬을 추계하는 과정을 제시하였다. 소규모 시뮬레이션 결과, 본 연구가 제시한 과정은 투입계수행렬의 경우 평균 약 11.23%의 추정 오차를 가지며 이것은 중간수요계 정보를 활용하는 RAS의 11.30%의 평균 추정 오차보다 작은 것으로 나타났다. 그러나 여러 선행연구들에서 추가 정보를 활용하는 것이 활용하지 않는 것보다 추정 성과를 항상 향상시키지 않는 것으로 나타났기 때문에, 본 연구의 방법을 현실에 적용하기 위해서는 다양한 시뮬레이션 연구가 필요하다고 판단된다.

향상도 영향 감소화에 의한 연관성 순위결정함수 (Association rule ranking function by decreased lift influence)

  • 박희창
    • Journal of the Korean Data and Information Science Society
    • /
    • 제21권3호
    • /
    • pp.397-405
    • /
    • 2010
  • 데이터 마이닝은 대규모의 데이터베이스에 내재되어 있는 유용한 정보를 찾아내는 과정이며, 중요한 목표 중의 하나는 여러 변수들 간의 관계를 발견하고 결정하는 것이다. 이를 위해 필요한 기법인 연관성 규칙 마이닝은 각 항목들 간의 관련성을 찾아내는 데 활용되며, 지지도, 신뢰도, 향상도 등의 연관성 측도를 기반으로 두 항목간의 관계를 수치화함으로써 의미 있는 규칙을 찾아낸다. 본 논문에서는 3개의 연관기준값들 중 어느 하나라도 기준 이상이 되는 규칙의 순위를 매겨 필요한 연관성 규칙만을 생성할 수 있는 연관성 순위 결정 함수를 개발하는데 기존의 연구 결과를 개선하기 위해 특정 연관 기준값의 영향을 더 많이 받지 않도록 3개 연관기준값의 범위를 조정한 연관성 순위 결정 함수를 제안하고자 한다. 모의실험을 해본 결과, 대체적으로 본 논문에서 제안한 함수는 연관성 측도들과 최저 연관기준값들간의 차이를 잘 반영하고 있으며, 최저 연관성 기준값들의 범위와는 관계없이 항상 -1과 1 사이의 값을 가지며, 최저 연관기준값을 모두 충족하게 되면 1의 값을 가지며, 3개 모두 충족되지 않으면 -1의 값을 갖게 된다는 사실을 알 수 있었다.

레벨 교차 트리를 이용한 연관 서비스 탐사 (Association Service Mining using Level Cross Tree)

  • 황정희
    • 디지털콘텐츠학회 논문지
    • /
    • 제15권5호
    • /
    • pp.569-577
    • /
    • 2014
  • 사용자는 시간적, 공간적 상황에 따라 다양한 정보를 요구한다. 상황변화에 맞는 서비스 정보를 제공하는 것이 중요하다. 그러므로 사용자의 행동 및 서비스 이력의 최신정보를 기반으로 마이닝하여 최적의 서비스를 사용자에게 제공해야 한다. 본 논문에서는 시공간 정보 및 서비스 정보 온톨로지를 기반으로 사용자의 서비스 사용 이력을 이용하여 연관 있는 서비스 규칙을 탐색하기 위한 마이닝 방법을 제안한다. 이를 위해 서비스 온톨로지 계층에 대한 레벨 교차 기반의 연관 서비스 규칙을 발견한다. 제안된 마이닝 방법은 일정한 시간과 공간에 대한 시기별, 위치별, 연령별에 대한 연관 서비스 패턴을 발견할 수 있으므로 사용자의 상황변화에 양질의 서비스를 제공할 수 있는 기반이 된다.

전자 상거래 에이전트를 위한 연관 규칙 발견 및 확장 (Association Rule Discovery & Expansion for Electronic Commerce Agents)

  • 문홍기;이수원
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1999년도 가을 학술발표논문집 Vol.26 No.2 (2)
    • /
    • pp.33-35
    • /
    • 1999
  • 대용량 데이터베이스의 데이터로부터 지식을 발견하는 방법으로 사용되고 있는 연관 규칙 발견은 기존에는 알려지지 않았던 지식을 찾아 이를 이용할 수 있는 형태로 제공된다. 하지만, 제공되는 형태는 단순한 데이터베이스에 포함되어 있는 정보만을 이용하여 보여주므로, 특정한 부분에만 제한적으로 활용된다. 따라서, 본 연구에서는 데이터로부터 연관 규칙을 발견하여 이를 개념 계층구조를 이용하여 일반적인 규칙으로 확장하는 방법을 제안한다. 또한 발견된 규칙을 기반으로 전자 상거래 에이전트를 위해 어떻게 활용될 수 있는지를 제안한다.

  • PDF

지방자치단체별 만족도 지표 연관성 분석 (Correlation Analysis of Satisfaction Indicators by Local Governments)

  • 김석훈;임광혁
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2020년도 제61차 동계학술대회논문집 28권1호
    • /
    • pp.293-294
    • /
    • 2020
  • 생활수준이 높아지면서 단순히 먹고 사는 수준을 넘어서 삶의 만족도에 대한 관심이 높아지고 있다. 통계 정보를 살펴보더라도 근로여건 만족도, 녹지환경 만족도, 의료서비스 만족도, 소득만족도, 소비생활 만족도, 여가활동 만족도, 학생의 학교생활만족도 등 다양한 만족도 지표를 발견할 수 있다. 본 연구는 지방자치단체 통합데이터베이스 및 e지방지표를 이용하여 지방자치단체에 속한 구성원들의 다양한 만족도 지표의 연관성을 분석하고자 한다.

  • PDF