• 제목/요약/키워드: 연관도

검색결과 12,843건 처리시간 0.039초

연관규칙 마이닝을 활용한 뉴스기사 키워드의 연관성 탐사 (Discovering News Keyword Associations Using Association Rule Mining)

  • 김한준;장재영
    • 한국인터넷방송통신학회논문지
    • /
    • 제11권6호
    • /
    • pp.63-71
    • /
    • 2011
  • 현재 대부분의 웹포털 사이트는 인기도 또는 중요도가 높은 키워드를 제공하는 서비스가 제공되고 있는데, 구체적으로 태그 클라우드 형태와 연관 검색 서비스와 같은 사용자 친화형 서비스를 지원하고 있다. 하지만 일반적으로 뉴스기사는 날짜와 분야별로 기사들이 분류되어 있기에, 사용자는 카테고리별로 나누어진 기사를 읽을 수만 있을 뿐 그 기사와 연관된 다른 기사를 쉽게 찾아보지는 못한 실정이다. 또한 연관 검색어 서비스도 사용자가 검색한 입력내용을 기반으로 연관성 정도를 분석하기에 충분한 객관성을 보장하지 못하고 있다. 본 논문에서는 기존의 태그 클라우드 방식에서 좀 더 나아가 축적된 뉴스 기사로 부터 검색 키워드와 밀접히 연관된 키워드를 추출하여 제공하는 기사 검색 방식을 제안한다. 제안 기법은 기본적으로 연관규칙 마이닝을 이용하여 키워드 연관성을 추출하게 되며, 뉴스기사 특성을 반영하여 문장 내부에 존재하는 키워드에 한정하여 연관성을 추출한다. 연관된 키워드 집합을 이용하여 키워드와 가장 밀접한 기사를 검색할 뿐만 아니라, 연관 키워드간의 관계성을 보여줌으로써 뉴스 기사들 속에 숨겨진 연관정보의 탐색을 가능하게 한다.

u-City와 ITS의 서비스 연관성 분석에 관한 연구 (A Study on the Analysis of Service-linkage between the u-City and ITS)

  • 송양빈;김경석;서민호;이선하
    • 한국ITS학회 논문지
    • /
    • 제7권1호
    • /
    • pp.101-114
    • /
    • 2008
  • u-City와 ITS는 서로 상이하면서도 부분적으로 연관도가 깊은 서비스들을 제공하고 있다. 따라서 연관도에 따라 중복성 문제나 효율적 추진의 어려움을 지적 받고 있어 두 시스템간의 서비스 연관분석과 우선순위 도출이 필요하다. 연구 방법으로 서비스간의 연관표를 작성하고 전문가 설문조사를 통하여 연관도를 분석한다. 설문조사 결과를 누적 합산하여 종합점수를 도출한 결과 ITS의 돌발상황관리 서비스와 u-사고/재난재해 서비스가 최빈치로 나타났다. 사업우선순위는 연관도가 높은 서비스를 우선 추진하는 것을 기본원칙으로 하여 단계별로 구분하고 서비스의 패키지화를 통해 시너지 효과를 기대할 수도 있다. 이 논문은 u-City와 ITS 서비스의 연관도 분석과 이를 통한 도입서비스의 우선순위 도출로 효율적 사업추진 방안을 제시한 점에서 의의를 가진다.

  • PDF

상품군 연관망 기반의 상품가치 평가모형 (Product Value Evaluation Models based on Itemset Association Chain)

  • 장용식
    • 지능정보연구
    • /
    • 제16권2호
    • /
    • pp.1-17
    • /
    • 2010
  • 연관분석에 의한 연관규칙은 상품 간 연관성을 나타내고 있으며, 교차판매와 상품진열 등의 마케팅 전략에 활용되고 있다. 그러나, 교차판매 효과를 반영하는 더 실질적인 상품가치를 평가한다면, 상품구색과 이윤극대화 등의 기업 의사결정에 더 유용하게 활용될 수 있을 것이다. 본 연구는 단일상품 간의 연관망과 상품군 간의 연관망 기반에서 상품의 순수가치, 이득가치, 손실가치로 구성되는 유효가치를 바탕으로 상품의 가치를 평가하는 수학적 모형을 제시하고, 두 모형에 대해 각각 예시를 통한 평가과정을 기술하였다. 이 경우, 상품군은 단일상품을 포함하기 때문에 상품군 간 연관망 기반에서의 상품가치 평가모형은 단일상품 기반의 평가모형을 포함하고 있다. 모형의 실질적인 유용성을 보이기 위하여, 국내 한 온라인 쇼핑몰의 과거 1년 간 의류 관련 거래데이터 표본을 이용하여 상품분류군 간의 연관규칙을 발견하고 상품분류별 유효가치를 평가하는 실험을 하였다. 표본은 총 106개 상품분류와 48,044건의 거래 데이터로 이루어져 있다. 먼저, SPSS Clementine 12.0을 이용하여 상품분류군 간 18개의 연관규칙을 발견하였다. 한편, 순수가치와 연관규칙을 바탕으로 이득가치, 손실가치를 계산하고 유효가치를 평가하는 JAVA 어플리케이션을 구현하였다. 유효가치 평가의 실험결과, 순수가치보다 큰 유효가치를 갖는 상품분류가 있는 반면, 순수가치 보다 작은 유효가치를 갖는 상품분류를 확인하였다. 본 연구는 상품 연관망에서 일차적인 관계만을 고려한 유효가치를 평가하였다. 향후, 다단계 연관성의 교차판매 효과를 반영하는 고차적인 평가모형 연구는 보다 효과적인 유효가치 평가를 가능케할 것이다.

검색어의 연관법칙 (ARMS : Association Rule for sMall Set)

  • 문상준;최재걸
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 가을 학술발표논문집 Vol.31 No.2 (2)
    • /
    • pp.10-12
    • /
    • 2004
  • 검색엔진에 사용자가 입력한 검색어를 분석하면 상호 연관이 있는 검색어들을 찾아낼 수 있다. 검색어들간의 상호 연관성을 찾기 위해서 데이타 마이닝 분야의 연관법칙을 위한 알고리즘을 적용하였다. 그러나 이 알고리즘들은 모두 일정 횟수 이상 검색된 검색어간의 연관법칙에 집중되어 있어서 일정 횟수 이상 검색되지 않은 검색어들은 버려진다. 이 연구에서는 이런 검색어들을 스몰 셋(small set)이라고 정의하고 스몰 셋의 연관법칙을 찾기 위한 방법을 제시한다. 실험결과는 이 연구에 제시한 방법이 효과적으로 동작하는 것을 입증해준다.

  • PDF

Boolean Analyzer를 이용한 역 연관규칙의 발견 (Finding negative association rules with Boolean Analyzer)

  • 이종인;박상호;강윤희;박선;이주홍
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 가을 학술발표논문집 Vol.30 No.2 (1)
    • /
    • pp.187-189
    • /
    • 2003
  • 연관 규칙이 구매한 항목에 관심을 가져 구매 항목간의 규칙을 생성하는 것이라면 역 연관규칙은 구매하지 않은 항목에도 관심을 가짐으로써 더욱 효과적으로 데이터 마이닝을 하려는 시도이다. 역 연관규칙을 찾기 위한 기존의 방법들은 규칙의 일부분만 찾거나. 연관규칙을 찾는 알고리즘보다 더 복잡한 알고리즘의 사용으로 역 연관규칙을 찾는데 어려움이 있다. 이에 본 논문에서는 ITEM들 사이의 dependency를 이용하는 Boolean Analyzer를 사용하여 보다 간단한 과정으로 역 연관규칙을 생성하는 방법을 제시하고, 실험을 통하여 Boolean Analyzer로 역 연관규칙을 찾고 다른 알고리즘과 비교를 통해 보다 다양한 규칙을 찾을 수 있음을 보여준다.

  • PDF

웹과 GIS를 통합한 ″Kyonggi21Search″ 구현 : 색인어간 연관도 생성 및 최적화 (Implementation of ″Kyonggi21Search″ combining GIS with The Web : Optimization of Index Association)

  • 장정훈;이룡;상임미언;권용진
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 가을 학술발표논문집 Vol.30 No.2 (2)
    • /
    • pp.79-81
    • /
    • 2003
  • Kyonggi21Search시스템은 GIS와 웹을 통합한 지역정보 검색 시스템이다. 웹과 GIS를 연동하여 지리정보를 검색하기 위해 웹 문서에서 지역관련 색인어를 추출하고, 색인어간의 관련성을 계산한다. "Kyonggi21Search"시스템에서는 웹 문서에 많이 나타나는 일반적인 단어보다는, 많은 문서에 나타나지 않는 지리적 문화적인 단어들 간의 관련성을 찾는 것이 더 중요한데, 본 연구에서는 단어들 간의 관련성을 찾는데 연관규칙과 연관클러스터를 이용하여 연관도를 계산한다. 그리고 이런 단어들의 관련성을 찾는데는 연관 클러스터를 이용하는 것이 더 적합하다는 것을 보여준다. 한편 웹 문서와 색인어를 이용하여 만든 행렬은 희소행렬이라는 점을 이용하여 연관 클러스터 방법의 단점인 높은 계산량을 줄이는 최적화 방법을 제안한다.

  • PDF

PMBOK 프로세스 연관도와 네트워크 토폴로지 특징에 관한 비교 (The comparison about PMBOK process correlation and network topology characteristics)

  • 손주항;김민택;정동수;한정안
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2012년도 한국컴퓨터종합학술대회논문집 Vol.39 No.1(B)
    • /
    • pp.217-219
    • /
    • 2012
  • 효율적으로 일하는 방법을 제시하는 프로젝트 관리 프레임 중의 하나인 PMBOK는 9가지 프로젝트 관리 영역의 필요성을 제시하고 있다. PMBOK 프로세스 연관도를 살펴보면, 네트워크 토폴로지의 특징인 노드, 링크, 순위, 빈도수와 관련된 유사한 면이 있는 것을 발견할 수 있다. PMBOK의 표준 프로세스 연관도에 따라 연결되는 링크를 순차적으로 그린다고 가정했을 때, 실제 업무의 프로세스 링크는 네트워크이론의 Power-law를 따를 것이라고 예상되었다. 이러한 현상을 증명하기 위해 PMBOK 표준 프로세스 연관도를 모델로 하여, 인터넷 위상의 특징을 결정하는 속성 중 Power-law1, 2의 관련성을 분석하였다.

시간 의존적인 상품 추천을 위한 지수 평활 시간 연관 규칙 (Exponential Smoothing Temporal Association Rules for Recommendation of Temperal Products)

  • 정경자
    • 한국컴퓨터정보학회논문지
    • /
    • 제10권1호
    • /
    • pp.45-52
    • /
    • 2005
  • 본 연구에서는 시간 연관 규칙에 지수 평활법을 적용한 상품 추천 알고리즘을 제안한다. 시간 연관 규칙은 기존의 연관 규칙에 시간 개념을 적용한 연관 규칙이다. 본 연구에서는 과거 데이터 보다 최신의 데이터에 가중치를 더 부여한 지수 평활 시간 연관 규칙을 제안한다. 제안한 알고리즘은 시간 의존적인 데이터에 적용하여 시뮬레이션을 한 결과 지수 평활법을 적용한 시간 연관 규칙이 기존의 시간 연관 규칙보다 실행시간 면에서 다소 오래 걸리지만 상품 추천 측면에서 더 효과적이다.

  • PDF

신문 기사 분석을 통한 연관어 비주얼라이저 (Visualizer of Associated Word by Analyzing News Articles)

  • 김현진;문성영;정용기;이정준
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2013년도 추계학술발표대회
    • /
    • pp.1189-1192
    • /
    • 2013
  • 신문기사 분석을 통한 연관어 비주얼라이저는 신문 기사의 단어를 추출하여 단어 간 연관도를 분석하여 다양한 그래프로 표현하는 시스템이다. 인터넷 신문사의 뉴스 기사들을 수집하고 형태소 분석을 통해 기사별로 단어의 출현 횟수를 데이터베이스에 저장하고 단어와 단어 간의 연관성을 분석한다. 단어 간 연관성을 측정하기 위한 기준으로 두 단어 간 동일기사에 존재여부, 동일날짜에 존재여부를 이용한다. 이 값을 바탕으로 웹 페이지 상에서 다양한 그래프로 상위 연관성을 가진 단어들을 표현한다. 표현 되는 그래프는 다양한 형태의 그래프로 단어와 단어사이에 연관성을 보다 쉽게 파악 할 수 있다.

상용화를 고려한 수자원의 지속적 확보기술 개발의 경제적 가치평가기법 제안 - 기술-제품-산업 연관도 분석 - (Economic Effects of Sustainable Water Resources Technology Development - Technology-Product-Industry Diagram Analysis -)

  • 허은녕;김현경;정다연
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2006년도 학술발표회 논문집
    • /
    • pp.1381-1384
    • /
    • 2006
  • 본 연구는 21C 프론티어사업과 같이 상용화를 전제로 하는 기술개발사업의 파급효과 정량화를 위하여, 기술의 분석뿐이 아닌 기술개발로 인하여 산출되는 제품과 이를 수요하게 될 산업 간의 연관도의 작성을 제안한다. 그 사례로서 기술 개발의 실용화를 통하여 물관리 효율을 높이고 친환경적으로 신규 수자원을 개발하여 예상되고 있는 한국의 물부족 나아가서는 세계의 물문제의 해결을 목표로 하고 있는 수자원의 지속적 확보기술개발사업단의 기술을 분석한다. 기술개발사업의 최종목표가 상용화를 통하여 달성된다면 개발하고 있는 기술의 경제적 가치 분석 작업에는 당연히 최종수요자에 대한 고려가 있어야 할 것이다. 그러나 일반적으로 기술개발자는 기술의 개발 시 수요자에 대한 고려가 미흡하며, 수요자 역시 개발자에게 충분한 정보를 주지 못하고 있다. 이로 인하여 수많은 정부주도 기술개발사업에는 이른바 Valley of Death, 즉 기술은 개발되었으나 상용화의 벽을 넘지 못하고 사라져 가는 현상이 매우 빈번히 나타나고 있다. 이를 해결하기 위하여 개별기술평가에 기존의 기술연관도나 산업연관도와 달리 이들을 기술개발단계별로 연결하여주는 가칭 '기술-제품-산업연관도'의 작성을 제안한다. 이를 통하여 기술개발로 인하여 궁극적으로 산출되는 제품과 이들을 수요하는 산업들간의 연관관계를 확인할 수 있어 연구 포트폴리오 구성, 기술가치평가 및 공정분석기법의 적용범위 체계화, 수자원의 지속적 확보 기술의 기술이전 및 실용화를 촉진하기 위한 전략 마련에 도움을 줄 수 있을 것이다. 본 연구에서 제안하는 기술-제품-산업 연관도를 통해 수자원의 지속적 확보기술의 정량적 성과평가가 더욱 용이하여지며, 특히 수요자간의 의견수렴절차에서 매우 긴요하게 쓰일 수 있어, 기술개발사업의 타당성을 확보할 수 있으며, 개발기술의 상용화율 제고 및 잠재수요층 개발과 기업 투자자와 정부관계자의 이해도 중진을 통한 사업진행효율 증대를 기대할 수 있다. 또한 본 연구는 각종 개발기술의 파급효과 분석의 가이드라인으로 활용될 수 있으며 다른 기술분야 평가에도 객관적이고 타당성 있는 평가 틀로서 활용 가능할 것이다.

  • PDF