• 제목/요약/키워드: 연관관계

검색결과 3,387건 처리시간 0.044초

공간 분할 지수를 이용한 이미지 데이터 연관 규칙 마이닝 (Association Rules Mining of Image Data using Spatial Factor)

  • 송임영;김경창;석상기
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2005년도 가을 학술발표논문집 Vol.32 No.2 (2)
    • /
    • pp.82-84
    • /
    • 2005
  • 본 논문에서는 기존의 멀티미디어 연관 규칙 알고리즘인 Max occur 알고리즘에서 추출한 빈발 항목 집합의 결과들에 대하여 빈발 항목 집합들끼리의 공간적인 연관 관계를 고려하기 위챈 공간 데이터 마이닝의 대표적인 공간 분할 방법인 그리드 셀 기반으로 곰간 분할 지수(spatial facotr)인 SF를 이용한 이미지 공간 연관 규칙 마이닝 방법을 제시한다. 또한 최소 공간 지지도를 적용하여 이미지 데이터에서 반복적으로 발생하는 항목과 항목간의 공간 관계를 통해 이미지 연관 규칙을 마이닝 하는데 보다 유효한 알고리즘을 제안한다.

  • PDF

단백질 모티프간 연관성 탐사 (Exploring Association Among Protein Motifs)

  • 이현숙;이도헌
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2002년도 춘계학술발표논문집 (상)
    • /
    • pp.47-50
    • /
    • 2002
  • 단백질 모티프(motif)란 유사한 기능을 가진 여러 단백질 서열에서 공통적으로 발견되는 패턴으로서 단백질의 기능을 예측하는 단서로 활용된다. 현재 Prosite, Pfam 등의 데이터베이스에서 정규식(regular expression), 가중치 행렬(weighted matrix). 은닉 마코프 모델(hidden Markov model)의 형태로 4천여종 이상의 모티프가 등록되어 있다. 하지만, 이러한 데이터베이스는 모티프와 단백질간의 일대일 관계만을 저장하고 있기 때문에, 모티프 간의 연관성을 파악하기는 어렵다. 본 논문에서는 모티프 간의 연관 관계를 연관 규칙의 형태로 발견하는 데이터 마이닝 기법을 제시한다. 아울러 HITS 데이터베이스로부터 입수한 단백질-모티프 데이터베이스에 본 기법을 적용함으로써 상당히 높은 연관성을 갖는 모티프 집단이 실제로 존재한다는 것을 밝힌다.

  • PDF

HTML 문서의 테이블 식별 (Detecting Tables in HTML Documents)

  • 김연석;이경호
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 봄 학술발표논문집 Vol.31 No.1 (B)
    • /
    • pp.163-165
    • /
    • 2004
  • HTML의 <TABLE> 태그는 연관된 정보를 기술하기 위한 테이블은 물론이고 웹 문서의 레이아웃을 표현하기 위하여 사용된다 본 논문에서는 웹으로부터 유용한 정보를 추출하기 위한 목적의 일환으로 HTML 문서로부터 테이블을 식별하는 효율적인 방법을 제안한다. 제안된 방법은 전처리와 속성-값 연관관계에 추출의 두 단계로 구성된다. 전처리 단계에서는 진짜 테이블 또는 레이아웃용으로 사용된 <TABLE> 태그의 일반적인 특징을 반영한 규칙을 적용하여 진짜 또는 가짜로 명확히 식별이 가능한 <TABLE> 태그를 추출한다. 속성-값 연관관계 추출 단계에서는 테이블 영역을 속성 및 값 영역으로 구분한 후. 값 영역에 대하여 구문적 일관성 검사를 수행한다 또한 값 영역의 크기가 작아서 구문적 일관성 검사를 수행할 수 없는 경우, 속성-칸 영역의 의미적 일관성을 검사한다. 제안된 방법의 성능을 명가하기 위하여 1,393개의 HTML 문서로부터 추출한 11,477개의 <TABLE> 태그를 대상으로 실험한 결과. 평균적으로 97.54%의 정확률과 99.22%의 재현률을 보여 기존 연구보다 우수하였다.

  • PDF

유비쿼터스 환경을 위한 웹 서비스 기반의 워크플로우 언어 설계 (Web Services -based workflow language design for ubiquitous environment)

  • 한주현;김은회;최재영
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 봄 학술발표논문집 Vol.31 No.1 (A)
    • /
    • pp.28-30
    • /
    • 2004
  • 본 논문에서는 유비쿼터스 환경에서 발생하는 컨텍스트와 이를 이용하는 서비스간의 연관 관계를 온톨로지 기반의 기술 방식을 이용하여 효과적으로 표현할 수 있는 uWDL (Ubiquitous Workflow Definition Language)을 소개한다. uWDL은 유비쿼터스 환경의 사용자 특성을 이용하여 그에 맞는 서비스들의 관계를 워크플로우 형태로 기술할 수 있는 언어로, uWDL을 이용하여 서비스들 간의 연관 관계를 기술함으로써 작업의 통합 및 자동화를 이를 수 있다. 이를 위해 가장 널리 사용되고 있는 웹 서비스(Web Services)의 WSDL을 바탕으로 uWDL의 서비스를 기술하고, 워크플로우에 의해 구성된 서비스들의 연관 관계는 컨텍스트 정보에 따라 동적으로 재구성되어 상황에 맞는 서비스를 제공하게 된다.

  • PDF

어휘관계 정보와 질의개념연관도를 반영한 정보검색 성능 향상 기법 (Information Retrieval Based on Word Relationships and Degree of Query Concept)

  • 김준길;이경순
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2010년도 춘계학술발표대회
    • /
    • pp.451-454
    • /
    • 2010
  • 정보검색 분야에서 어휘 불일치 문제를 해결하기 위해 질의에서의 어휘 사이의 관계를 반영하는 것은 필수적인 요구사항이 되었다. 본 논문에서는 문장-문장 번역쌍을 이용하여 어휘 번역확률을 계산하였고, 어휘관계 정보를 반영하는 번역기반 언어모델에 어휘와 질의 개념과의 연관 정도를 반영한 모델을 제안한다. 뉴스 컬렉션 집합인 TREC AP 컬렉션에 대한 비교실험을 하였다. 실험결과에서 언어모델보다 어휘 관계를 반영한 번역기반 언어모델의 성능이 향상되었고 어휘의 질의개념 연관도를 반영한 모델이 번역기반 언어모델보다 성능이 향상됨을 보였다.

기후변화 및 식품 관련 뉴스기사의 텍스트 마이닝 (Text mining on internet-news regarding climate change and food)

  • 현윤진;김정선;정진욱;윤시몬;이문수
    • Journal of the Korean Data and Information Science Society
    • /
    • 제26권2호
    • /
    • pp.419-427
    • /
    • 2015
  • 기후변화와 식품 관련 정보가 유기적인 관련이 있음에도 불구하고, 사실상 현실에서는 사용자들이 직접 그 관련성에 대한 관심을 가지고, 해당 정보에 대한 접근이 용이하다고 말하기는 어렵다.본 연구는 실제 사용자들이 직접적으로 노출되는 인터넷 포털 사이트의 뉴스 기사에 대한 빈도분석 및 연관관계 분석을 통해 기후변화 및 식품 관련 정보가 어느 정도의 연관성을 가지고 얼마나 자주 나타나고 있는지에 대해 파악하였다. 또한 추출된 기후변화 및 식품 관련 뉴스를 대상으로 기후변화 용어 사전과 식품 관련 용어 사전을 활용하여 기후변화 관련 용어와 식품 관련 용어의 총 59개의 연관관계 규칙을 도출함으로써, 특정 기후변화 관련 용어가 어떠한 식품 관련 용어와 연관관계를 갖는지 파악하여, 추후 두 용어를 패키징해 제공할 수 있는 발판을 마련하였다.

연관 마이닝을 이용한 고객 관계 관리 적용 (Customer Relation Management Application using Associative Mining)

  • 정경용;김종훈;류중경;임기욱;이정현
    • 한국콘텐츠학회논문지
    • /
    • 제8권6호
    • /
    • pp.26-33
    • /
    • 2008
  • 유비쿼터스 상거래에서 회사가 정보를 효율적으로 이용할 수 있도록 제어하고 필터링하는 일을 도와주는 고객 관계 마케팅이 등장하였으며, 더 나아가 고객이 원하는 제품을 예측하고 추천해주고 있으며 이를 위해 데이터 마이닝 기술을 적용하고 있다. 본 논문에서는 연관 마이닝을 이용한 고객 관계 관리 적용사례 연구를 제안하였다. 제안된 방법으로는 연관 마이닝을 이용하여 후보 고객 집합으로 빈발 고객을 구성하고 연관 고객 규칙을 생성한다. 생성된 연관 규칙의 향상도에 따라서 하이퍼 그래프 분할을 이용하여 효율적인 구매고객들의 특성을 분석한다. 그러므로 기존 고객에 대한 교차 판매와 격상 판매의 전략들을 도출하게 된다. 성능평가를 위해 설문조사 데이터 집합에서 기존의 방법과 비교 평가하였다. 실험 결과 제안한 방법이 기존의 다른 방법들보다 정확도면에서 우수함을 확인하였다.

퍼지 연관 곱을 이용한 SNS 사용자의 계층적 시각화 방법 (Hierarchy Visualization method of SNS User using Fuzzy Relational)

  • 박선;권장우;정민아;이연우;이성로
    • 전자공학회논문지
    • /
    • 제49권9호
    • /
    • pp.76-84
    • /
    • 2012
  • 시각화는 소셜 네트워크의 분석을 위해서 소셜 네트워크의 사용자 관계를 새로운 시각에서 이해할 수 있도록 하는 중요한 역할을 담당하고 있다. 기존의 대부분의 시각화 방법은 복잡한 다차원 그래프를 통하여 소셜 네트워크상의 사용자의 관계를 집중적으로 표현하고 있다. 그러나 이러한 방법은 개인 사용자 중심으로 사회관계의 중요도를 직관적으로 파악하기 힘들다. 또한 대부분의 시각화 방법은 네트워크상의 노드들 간의 상호작용 정보에 의해서만 사용자 관계를 나타내기 때문에 사용자의 메시지가 사용자 상호관계에 반영되는 것이 미흡한 실정이다. 제안방법은 퍼지 연관 곱을 이용하여 사용자의 내부관계를 계산하며, 노드들 간의 상호작용 정보를 이용하여서 사용자의 네트워크상의 외부 접근 정보를 계산한다. 계산된 내부관계정보와 외부 접근 정보를 이용하여서 사용자중심의 계층적 시각화방법을 제한다. 이러한 문제를 해결하기 위해서 본 논문은 퍼지 연관 곱에 의한 사용자들의 내부관계와 네트워크상의 외부 접근 정보를 이용하여서 사용자를 중심으로 계층적으로 시각화하는 새로운 방법을 제안한다.

문항 응답 데이터에서 문항간 연관규칙의 질적 향상을 위한 도구 개발 (A Measure for Improvement in Quality of Association Rules in the Item Response Dataset)

  • 곽은영;김현철
    • 컴퓨터교육학회논문지
    • /
    • 제10권3호
    • /
    • pp.1-8
    • /
    • 2007
  • 본 논문은 연관규칙 마이닝을 이용하여 성취도 평가 결과인 문항 응답 데이터를 대상으로 의미있는 문항간 관련성을 찾아낼 수 있는 도구를 개발하는데 연구의 목적이 있다. 제안된 도구는 의미없는 데이터들을 제거하여 보다 더 흥미(interestingness)있는 연관규칙을 생성하도록 하며, 이러한 결과는 교수-학습 방법이나 문제은행의 질을 향상시키는데 필요한 많은 정보를 제공할 수 있을 것이다. 이를 위하여 임의의 문항 응답 실험 데이터 집합을 생성하고 정보이론(Information Theory) 기반의 surprisal 이라는 도구를 개발하여 의미 없는 데이트를 제거한 후, 연관규칙을 추출하였다. 실험 데이터는 특정 문항간 관계가 의도적으로 빈발 생성되도록 만들어지며, 추출된 연관규칙이 그러한 문항간 관계를 적절히 반영하고 있는지의 여부를 평가하고, 원본 데이터와 지지도(support) 기반으로 추출된 연관규칙과 비교함으로써 surprisal 도구의 타당성을 증명하였다.

  • PDF