• 제목/요약/키워드: 연관정보

검색결과 3,818건 처리시간 0.054초

항목의 개체수를 이용한 확장된 데이터 마이닝 연관규칙 (Extended Association Rules of Data Mining using Number of Items)

  • 조형진;황병연
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2001년도 추계학술발표논문집 (상)
    • /
    • pp.3-6
    • /
    • 2001
  • 현 시대에 살아가는 사람들은 정보의 홍수 속에서 살아간다고 해도 과언이 아니다. 컴퓨터 시스템의 발달과 데이터베이스 시스템의 사용의 증가로 컴퓨터에 저장되는 정보의 양은 폭발적으로 증가하고 있다. 현재의 컴퓨터에 저장되어 있는 대용량 데이터베이스에는 사용자가 미처 파악하지 못하는 중요한 정보가 포함되어 있을 수 있다. 본 논문에서는 데이터 상호간의 연관규칙에서 각 항목의 개체수를 고려하여 사용자들에게 좀 더 유용하고 다양한 종류의 데이터를 제공하기 위해 새로운 데이터 마이닝 연관규칙 방법을 제안한다.

  • PDF

연관성 척도의 빈도수준 선호경향에 대한 연구 (A Study on the Frequency Level Preference Tendency of Association Measures)

  • 이재윤
    • 정보관리학회지
    • /
    • 제21권4호
    • /
    • pp.281-294
    • /
    • 2004
  • 연관성 척도는 정보검색 및 데이터마이닝을 비롯한 다양한 분야에서 사용되고 있다. 각 연관성 척도가 높거나 낮은 빈도 중에서 어떤 쪽을 선호하는가를 나타내는 빈도수준 선호경향은 척도의 적용 결과에 중요한 영향을 미치므로 이에 대한 면밀한 조사가 필요하다. 이 연구에서는 주요 연관성 척도들의 빈도수준 선호경향을 가상의 데이터를 통해 분석하고 그 결과를 제시하였다. 또한 코사인 계수를 비롯한 대표적인 연관성 척도에 대해서 빈도수준 선호경향을 조절할 수 있는 방법을 제안하였다. 이 조절 방법을 동시출현 기반 질의확장 정보검색에 적용해본 결과 그 유용성이 확인되었다. 마지막으로 분석 및 실험 결과가 관련 분야에 시사하는 바를 논하였다.

다중 차량 연관 추적을 위한 겹침 제거 및 배경영상 갱신 (Overlap Removal and Background Updating for Associative Tracking of Multiple Vehicles)

  • 임준식;김수형;이칠우;이명은
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제16권1호
    • /
    • pp.90-94
    • /
    • 2010
  • 본 논문에서는 지능형 교통정보 시스템에서 활용할 수 있는 차량의 연관 추적 방법에 관하여 제안한다. 차량의 연관 추적과정에서 발생하는 차량 간 겹침 문제를 해결하기 위하여 위치 평균값과 시공간 연관 정보를 이용한 연관 추적 방법을 제안하였고 배경영상의 신뢰도를 향상시키기 위하여 배경영상 갱신 방법을 제안하였다. 제안한 방법의 성능 평가를 위하여 다양한 위치의 교통 정보 수집 CCTV에서 촬영된 영상을 사용하였고 평균 96% 이상의 추적 성공률을 보였다.

방문 웹 페이지 로그를 이용한 개인화된 문맥광고 기법 (Personalized Contextual Advertising Scheme using Logs of Web Page Visited)

  • 심규선;이명수;최재호;이상근
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2009년도 추계학술발표대회
    • /
    • pp.743-744
    • /
    • 2009
  • 사용자가 방문한 웹 사이트와 연관된 광고를 웹 페이지에 실어주는 문맥광고 관련 연구가 광고 효율성 측면에서 최근 주목을 받고 있다. 이러한 문맥광고 관련 연구의 핵심은 웹 페이지와 웹 광고간의 연관성을 높여주는데 있는데, 연관성 향상 방안으로 최근 사용자 의도 분석을 통한 연관성 향상 기법이 많이 연구되고 있다. 그러나 기존 연구에서는 사용자가 로그인을 해야 하거나, 로그 정보를 일정기간이상 수집해야만 사용자 의도 분석이 가능 하다는 문제점이 존재 한다. 본 논문에서는 로그인이나 많은 양의 로그정보 수집 없이 한 세션 내에서 방문한 웹 페이지 로그만을 이용하여 개인화된 문맥 광고를 제공하는 문맥광고 기법을 제안한다. 실험 결과에서는 제안하는 기법이 기존의 광고 기법에 비해 사용자가 판단하는 웹 페이지와 웹 광고의 연관성 (precison) 이 기존의 기법에 비해 높아짐을 증명한다.

단백질 서열 연관 규칙 마이닝을 위한 효율적인 알고리즘 설계 (Efficient Sequence Association Rule Mining for Discovering Protein Relations)

  • 김현민;김지혜
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2002년도 춘계학술발표논문집 (하)
    • /
    • pp.1183-1186
    • /
    • 2002
  • DNA 의 염기서열 탐색을 위한 유전체학의 다음 세대인 구조유전체학은 유전체 사업으로 인한 인간 게놈지도의 완성과 축적된 생물정보를 이용한 생물정보학의 발달과 함께 급속한 성장을 계속하고 있다. 포스트 게놈 시대를 맞이하여 생명현상에 대한 궁극적인 이해를 위한 노력으로 단백질의 구조와 기능에 대한 연구가 주목을 받게 되었다. 다양한 구조 규명을 위한 도구들과 단백질 정보를 관리하기 위한 데이터베이스 구축에 따른 관련 기술의 발전은, 앞으로 다가올 생물정보의 방대함을 감안할 때, 가치 있는 지식정보를 얻기 위한 데이터 마이닝 기법들을 통해서만 가능하다. 본 논문은 데이터 마이닝의 근간 기술인 연관규칙 마이닝을 응용한 효율적인 서열 연관 규칙 알고리즘을 제안하며, 단백질 구조의 예측을 위한 단백질 서열 및 DNA 서열간의 패턴 비교 및 연관성을 목적으로 한다. 또한, 공간적 시간적 복잡성을 CMS-tree 라는 자료구조를 통해 알고리즘의 확장성 및 병렬화의 기본 알고리즘으로 사용하도록 개발하였다.

  • PDF

연관 단어 마이닝을 사용한 웹문서의 특징 추출 (Feature Extraction of Web Document using Association Word Mining)

  • 고수정;최준혁;이정현
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제30권4호
    • /
    • pp.351-361
    • /
    • 2003
  • 단어의 연관성을 이용하여 문서의 특징을 추출하는 기존의 방법은 주기적으로 프로파일을 갱신해야하는 문제점, 명사구를 처리해야 하는 문제점, 명사구를 처리해야 하는 문제점, 색인어에 대한 화률을 계산해야 하는 문제점 등을 포함한다. 본 논문에서는 연관 단어 마이닝을 사용하여 문서의 특징을 효율적으로 추출하는 방법을 제안한다. 제안한 방법은 Apriori 알고리즘을 사용하여 문서의 특징을 단일 단어가 아닌 연관 단어 백터로 표현한다. Apriori 알고리즘을 사용하여 문서의 특징을 단일 단어가 아닌 연관 단어 벡터로 표현한다. Apriori 알고리즘을 사용하여 문서로부터 추출된 연관 단어는 이를 구성하는 수와 신뢰도와 지지도에 따라 차이를 보인다. 따라서 본 논문에서는 문서 분류의 성능을 향상 시키기 위허ㅐ 연관 단어를 구성하는 단어의 수와 지지도를 결정하는 효율적인 방법을 제안한다. 연관 단어 마이닝을 이용한 특징 추출 방법은 프로파일을 사용하지 않으므로 프로파일 갱신의 필요성이 없으며, 색인어에 대한 확률을 계산하지 않고도, Apriori 알고리즘의 신뢰도와 지지도에 따라 자동으로 명사구를 생성하므로 단어의 연관성을 이용하여 문서의 특징을 추출하는 기존 방법에 대한 문제점을 해결한다. 제안한 방법의 성능을 평가하기 위해 Naive Bayes 분류자를 이용한 문서 분류에 적용하여 정보이득, 역문헌빈도의 방법과 비교하며, 또한 색인어의 연관성과 확률 모델을 기반으로 단어의 연관성을 이용하여 문서 분류를 하는 기존의 방법과 각각 비교한다.

데이터마이닝에서 수량연관규칙 탐사방법

  • 박원환
    • 한국통계학회:학술대회논문집
    • /
    • 한국통계학회 2003년도 춘계 학술발표회 논문집
    • /
    • pp.91-96
    • /
    • 2003
  • 연관규칙은 데이터베이스에 잠재되어 있는 유용한 정보를 탐사하는 방법으로 데이터마이닝의 한 분야이다. 이는 항목의 발생유무만을 고려하는 이진연관규칙에 대한 연구가 주였으나, 최근에는 항목의 수량까지 고려하는 수량연관규칙 탐사가 소개되고 있다. 수량연관규칙은 수량속성 항목을 임의의 방법으로 여러 개의 소구간 항목으로 분할한 후, 각각을 이진항목으로 취급하여 연관규칙을 탐사하는 방법이다. 본 논문에서는 분할된 여러 소구간 분할항목들 중에서 필요 소구간 항목만을 선택적으로 탐사하는 방법을 제안한다. 제안방법은 블린항목제약식을 사용하여 수량항목의 탐사범위를 제한함으로써 모든 분할을 탐사하지 않고 필요 소구간만을 탐사하기 때문에 탐사시간을 단축할 수 있다.

  • PDF

온톨로지 기반의 의미 연관성을 이용한 효과적인 방송 정보 검색 방법 (An Effective Broadcast Information Retrieval Method Using Ontology-Based Semantic Relevance)

  • 정병희;김항규;박창섭;오연희;박성춘;이윤준
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2008년도 동계학술대회
    • /
    • pp.151-154
    • /
    • 2008
  • 방송된 프로그램의 VOD 서비스는 웹 및 다양한 매체를 통해 중요한 정보 서비스가 되고 있다. 기존의 멀티미디어 검색은 파일명이나 메타데이터를 바탕으로 직접 검색하는 정적인 검색 방법이었다. 본 논문에서는 이런 정적인 검색 방법에서 벗어나 의미적으로 연관된 비디오를 동적으로 검색하여 풍부한 검색 결과를 보여주는 방법을 제안하고, 이를 수행하는 프로토타입 시스템을 설계, 구현함으로써 제안한 방법의 타당성을 보인다. 제안하는 방법은 온톨로지를 이용하여 특정 도메인상에서 사용자가 관심을 가지는 정보의 연관성을 표시하고, 이를 검색과정에 적용한다. 검색 결과는 의미적으로 연관된 정보를 보여줄 뿐 아니라, 연관 카테고리를 바탕으로 관련된 정보를 정리하여 보여줌으로써 사용자는 풍부한 검색 결과 가운데에서 원하는 정보를 쉽고 빠르게 접근할 수 있다. 예를 들면, '고혈압'이라는 검색어를 사용자가 입력하면, 고혈압에 관련된 방송 프로그램 뿐 아니라, '고혈압'에 좋은 음식이나 그 음식의 효능, 효과, 요리법 등 방송을 통해 볼 수 있는 관련 정보들을 한번에 검색할 수 있다.

  • PDF

모바일 라이프로그 검색을 위한 시맨틱 네트워크 자동 생성 (Automatically Generating Semantic Networks for Retrieving Mobile Life-Log)

  • 오근현;조성배
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2011년도 한국컴퓨터종합학술대회논문집 Vol.38 No.1(C)
    • /
    • pp.266-268
    • /
    • 2011
  • 스마트폰을 비롯한 모바일 기기에 내장된 다양한 센서들로부터 수집되는 개인의 일상에 대한 정보인 모바일 라이프로그를 관리하고 검색하는 다양한 연구가 진행되고 있다. 기존에는 에피소딕 메모리 형태로 저장된 모바일 라이프로그 상에서 사용자가 과거 정보를 찾고 회상하는 방법이 일반적으로 사용되었다. 이러한 방법에서는 사용자가 원하는 데이터를 찾기 위해서는 정확하고 충분한 데이터를 사전에 알고 있어야 한다. 하지만 사람은 처음부터 완전한 정보를 가지고 검색을 하는 것이 아니고 검색을 수행하면서 데이터간의 연관도를 바탕으로 추가적인 정보를 떠올리는 연관 검색을 수행한다. 본 논문에서는 연관도 기반 검색을 위해 인지구조를 바탕으로 모바일 라이프로그를 표현하는 시맨틱 네트워크를 자동으로 생성하는 방법을 제안한다. 정의된 구조를 바탕으로 네트워크를 구성하고 관계의 빈도수와 가중치 공유를 통하여 관계의 가중치를 학습한다. 구성된 시맨틱 네트워크상에서 활성화 확산을 기반으로 연관 검색을 수행함으로 방법의 유용성을 입증하였다.

유전자 알고리즘을 이용한 WWW 정보검색 (WWW Information Retrieval Using a Genetic Algorithm)

  • 서영우;장병탁
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 1998년도 춘계학술대회 학술발표 논문집
    • /
    • pp.89-92
    • /
    • 1998
  • 최근 웹 상에서 여러 가지 정보에 대한 접근이 용이하여 많은 사람들이 다양한 검색 시스템을 이용하여 원하는 정보를 얻고 있다. 그러나 웹의 크기가 점점 커지고 그에 따른 사용량 또한 증가함에 딸 원하는 시간 안에 원하는 수준의 정보를 얻기가 매우 어렵다. 본 논문에서는 유전자 알고리즘을 이용하여 사용자의 요구수준에 보다 가까운 저오를 검색하는 학습방법에 대해 고찰한다. 검색 엔진의 초기 검색 결과로부터 만들어진 색인어들이 하나의 염색체로 구성한다. 염색체를 구성하고 있는 각 유전자는 사용자의 기호에 맞는 URL을 추천하기 위해 검색된 문서들과 연관성 값을 비교하여 유전 연산자에 의해 변형된다. 제시된 저오 검색 방식은 기존의 검색 엔진으로부터 반환되는 검색 결과로부터 사용자가 원하는 장보에 연관된 하나 이상의 색인어를 생성한 다음 재검색하여 연관성이 높은 소수의 정보만을 사용자에게 제공한다. 제안된 학습 방식과 기존 검색 엔진으로 검색된 결과를 초기의 사용자 정보 요구와의 연관성에 있어서 비교 분석하였다.

  • PDF