• Title/Summary/Keyword: 데이터 연관

Search Result 1,875, Processing Time 0.033 seconds

하이퍼네트워크 모델을 이용한 비전-언어 크로스모달 연관정보 추출 (Extraction Analysis for Crossmodal Association Information using Hypernetwork Models)

  • 허민오;하정우;장병탁
    • 한국HCI학회:학술대회논문집
    • /
    • 한국HCI학회 2009년도 학술대회
    • /
    • pp.278-284
    • /
    • 2009
  • 하나의 컨텐츠를 위해 동영상, 이미지, 소리, 문장과 같은 하나 이상의 모달리티로 전달하는 멀티모달 데이터가 증가하고 있다. 이러한 형태의 자료들은 잘 정의되지 않은 형태를 주로 가지기 때문에, 모달리티 간의 정보가 명백히 표현되지 못하는 경우가 많았다. 그래서, 본 연구에서 저자들은 자연계를 다루는 다큐멘터리 동영상 데이터를 이용하여 비전-언어 간의 상호 연관정보인 크로스모달 연관정보를 추출하고 분석하는 방법을 제시하였다. 이를 위해 정글, 바다, 우주의 세 가지 주제로 구성된 다큐멘터리로부터 이미지와 자막의 조합으로 이루어진 데이터를 모은 후, 그로부터 시각언어집합과 문장언어집합을 추출하였다. 분석을 통하여, 이 언어집합들간의 상호 크로스 모달 연관정보를 통해 생성된 다른 모달리티 데이터가 의미적으로 서로 관련이 있음을 확인할 수 있었다.

  • PDF

A Development Method of Framework for Collecting, Extracting, and Classifying Social Contents

  • Cho, Eun-Sook
    • 한국컴퓨터정보학회논문지
    • /
    • 제26권1호
    • /
    • pp.163-170
    • /
    • 2021
  • 빅데이터가 여러 분야에서 다양하게 접목됨에 따라 빅데이터 시장이 하드웨어로부터 시작해서 서비스 소프트웨어 부문으로 확장되고 있다. 특히 빅데이터 의미 파악 및 이해 능력, 분석 결과 등 총체적이고 직관적인 시각화를 위하여 애플리케이션을 제공하는 거대 플랫폼 시장으로 확대되고 있다. 그 중에서 SNS(Social Network Service) 등과 같은 소셜 미디어를 활용한 빅데이터 추출 및 분석에 대한 수요가 기업 뿐만 아니라 개인에 이르기까지 매우 활발히 진행되고 있다. 그러나 이처럼 사용자 트렌드 분석과 마케팅을 위한 소셜 미디어 데이터의 수집 및 분석에 대한 많은 수요에도 불구하고, 다양한 소셜 미디어 서비스 인터페이스의 이질성으로 인한 동적 연동의 어려움과 소프트웨어 플랫폼 구축 및 운영의 복잡성을 해결하기 위한 연구가 미흡한 상태이다. 따라서 본 논문에서는 소셜 미디어 데이터의 수집에서 추출 및 분류에 이르는 과정을 하나로 통합하여 운영할 수 있는 프레임워크를 개발하는 방법에 대해 제시한다. 제시된 프레임워크는 이질적인 소셜 미디어 데이터 수집 채널의 문제를 어댑터 패턴을 통해 해결하고, 의미 연관성 기반 추출 기법과 주제 연관성 기반 분류 기법을 통해 소셜 토픽 추출과 분류의 정확성을 높였다.

유비쿼터스 환경에 적용 가능한 사진 메타 데이터 처리 시스템 아키텍쳐 연구 (A Study on Picture Meta Data Processing System Architecture based on Ubiquitous Environment)

  • 경민기;민덕기
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2009년도 춘계학술발표대회
    • /
    • pp.954-956
    • /
    • 2009
  • 디지털 카메라는 단순히 사진을 찍는 장치가 아니며 사진에 연관된 다양한 메타 데이터를 제공하기 위한 다양한 시스템이 사진을 찍는 CCD와 유기적으로 연계되어 있다. 사진에 연관된 메타 데이터들은 디지털 카메라로 찍은 사진을 분류하는 기능을 지원한다. 하지만 사진의 메타 데이터들은 사진에 대한 검색을 가능하게 하지만, 대부분 사람의 수작업으로 이루어지기 때문에 새로운 메타 데이터의 입력이 어렵다는 문제점이 있다. 사진의 메타 데이터를 쉽게 추가하기 위해 본 논문에서는 GPS 시스템과 Wi-Fi, 데이터베이스를 이용해서 사진의 메타 데이터를 Exif(Exchangeable image file format)에 추가하고자 한다. GPS 시스템은 사진을 찍는 사람들이 어디에 있는지를 제시하고, Wi-Fi와 데이터 베이스를 이용해서 사용자에게 사용자가 사진을 찍은 위치와 관련된 메타 데이터를 제공한다. 이를 기반으로 본 논문에서는 이러한 PreTag라는 사진 메타 데이터 추가 아키텍처를 제시한다.

온톨로지 기반에서 연관 마이닝 방법을 이용한 지식 추론 알고리즘 연구 (A Study of a Knowledge Inference Algorithm using an Association Mining Method based on Ontologies)

  • 황현숙;이준연
    • 한국멀티미디어학회논문지
    • /
    • 제11권11호
    • /
    • pp.1566-1574
    • /
    • 2008
  • 정보 검색에 대한 연구는 방대한 데이터에서 원하는 검색 정보를 제공할 뿐 만 아니라 개인의 취향에 따른 맞춤 검색 및 추론된 지식을 제공하는 데 초점을 두고 있다. 본 논문의 목적은 데이터를 개념화하여 분류 및 정의할 수 있는 온톨로지 구조를 기반으로 숨어있는 지식을 발견하여 개인 맞춤 검색을 제공하는 추론 알고리즘에 대해 연구하는 것이다. 현재의 검색에서는 방대한 데이터에서 너무 많은 검색 결과를 제공 하거나 검색 결과를 제공하지 못하는 경우도 발생하고 여다. 이러한 정보 검색의 단점을 보완하기 위해 OWL 온톨로지 제약조건과 연관 마이닝 방법으로 추론된 연관 지식을 SWRL 추론 언어로 표현하여 Jess 엔진을 통한 새로운 지식을 발견하여 효율적인 검색을 지원하는 알고리즘을 제안한다. 식당, 주유소, 제과점 등의 도메인에 따른 개인별 선호 온톨로지를 구축하고, 주유소 개인 선호 데이터를 예제로 하여 연관 및 온톨리지 기반에서 정보를 검색할 때, 연관 및 추론 정보를 제공함을 보여준다.

  • PDF

상품군 연관망 기반의 상품가치 평가모형 (Product Value Evaluation Models based on Itemset Association Chain)

  • 장용식
    • 지능정보연구
    • /
    • 제16권2호
    • /
    • pp.1-17
    • /
    • 2010
  • 연관분석에 의한 연관규칙은 상품 간 연관성을 나타내고 있으며, 교차판매와 상품진열 등의 마케팅 전략에 활용되고 있다. 그러나, 교차판매 효과를 반영하는 더 실질적인 상품가치를 평가한다면, 상품구색과 이윤극대화 등의 기업 의사결정에 더 유용하게 활용될 수 있을 것이다. 본 연구는 단일상품 간의 연관망과 상품군 간의 연관망 기반에서 상품의 순수가치, 이득가치, 손실가치로 구성되는 유효가치를 바탕으로 상품의 가치를 평가하는 수학적 모형을 제시하고, 두 모형에 대해 각각 예시를 통한 평가과정을 기술하였다. 이 경우, 상품군은 단일상품을 포함하기 때문에 상품군 간 연관망 기반에서의 상품가치 평가모형은 단일상품 기반의 평가모형을 포함하고 있다. 모형의 실질적인 유용성을 보이기 위하여, 국내 한 온라인 쇼핑몰의 과거 1년 간 의류 관련 거래데이터 표본을 이용하여 상품분류군 간의 연관규칙을 발견하고 상품분류별 유효가치를 평가하는 실험을 하였다. 표본은 총 106개 상품분류와 48,044건의 거래 데이터로 이루어져 있다. 먼저, SPSS Clementine 12.0을 이용하여 상품분류군 간 18개의 연관규칙을 발견하였다. 한편, 순수가치와 연관규칙을 바탕으로 이득가치, 손실가치를 계산하고 유효가치를 평가하는 JAVA 어플리케이션을 구현하였다. 유효가치 평가의 실험결과, 순수가치보다 큰 유효가치를 갖는 상품분류가 있는 반면, 순수가치 보다 작은 유효가치를 갖는 상품분류를 확인하였다. 본 연구는 상품 연관망에서 일차적인 관계만을 고려한 유효가치를 평가하였다. 향후, 다단계 연관성의 교차판매 효과를 반영하는 고차적인 평가모형 연구는 보다 효과적인 유효가치 평가를 가능케할 것이다.

데이터 마이닝 질의 처리를 위한 질의 처리기 설계 및 구현 (Design and Implementation of a Data Mining Query Processor)

  • 김충석;김경창
    • 정보처리학회논문지D
    • /
    • 제8D권2호
    • /
    • pp.117-124
    • /
    • 2001
  • 데이터 마이닝 시스템은 기본적으로 요약화, 연관화와 분류화 등 다양한 유형의 데이터 마이닝 기능을 포함한다. 이들 기능을 수행하기 위해서 포괄적으로 표현하기 위한 강력한 데이터 마이닝 질의 언어가 요구되며, 사용자에게 보다 친숙한 마이닝 환경을 제공하기 위해서 그래픽 사용자 인터페이스(GUI)를 이용한 데이터 마이닝 질의 언어의 개발이 중요하게 언급된다. 뿐만 아니라 데이터 마이닝 그 자체로서 독립적인 수행이 아니라 수많은 데이터를 포함하며, 의사결정에 적합한 구조로 설계되어 있는 데이터 웨어하우스와 연관된 데이터 마이닝 질의 처리가 필요하다. 본 논문에서는 먼저 GUI를 통하여 사용자가 쉽게 데이터 마이닝 질의를 수행할 수 있도록 한다. 또한 질의를 처리하기 위한 데이터 마이닝 질의 처리 프레임워크를 제시한다. 데이터마이닝 질의의 대상은 데이터 웨어하우스에 저장되어 있는 데이터이기 때문에 데이터 웨어하우스의 구축이 필요하다. 본 논문에서는 데이터 웨어하우스 구축에 필요한 스키마 생성을 위해서 스키마 생성기를 아울러 개발하여 이용한다. 마지막으로 연관 규칙 발견을 위한 데이터 마이닝 질의를 처리하기 위한 질의 처리기의 구현 내용을 보인다.

  • PDF

시맨틱 RDF 데이터에 대한 효과적인 키워드 검색 (Effective Keyword Search on Semantic RDF Data)

  • 박창섭
    • 한국콘텐츠학회논문지
    • /
    • 제17권11호
    • /
    • pp.209-220
    • /
    • 2017
  • 최근 지식 베이스, 시맨틱 웹 등 여러 응용 분야에서 시맨틱 데이터의 활용이 증가함에 따라 대규모 RDF 데이터에 대한 효과적인 검색 방법의 필요성이 커지고 있다. 기존의 개별 루트 시맨틱에 기반한 키워드 검색 방법들은 서로 다른 루트 노드를 갖는 결과 트리들의 집합만을 검색함에 따라, 의미적으로 유사하거나 연관성이 낮은 결과 트리들이 함께 검색되고, 동일한 루트 노드를 공유하되 의미적으로 다르고 질의 연관도가 높은 결과들은 함께 검색될 수 없는 문제점이 있다. 이를 개선하기 위해 본 논문에서는 결과 트리들의 루트 노드의 중복을 제한적으로 허용하여 질의 연관도가 높으면서 다양한 결과들을 함께 검색하는 방법을 제안한다. 이를 위해 결과 트리 집합의 루트 중복도 척도를 정의하고, 주어진 키워드 질의와 최대 루트 중복도에 따라 제한적인 루트 중복성을 가지면서 연관도가 높은 top-k 결과 트리들을 효율적으로 구하기 위한 검색 알고리즘을 제시한다. 실 데이터를 이용한 성능 실험 결과, 제안한 방법이 기존 방법보다 콘텐트 노드들의 중복이 적은 다양한 결과 트리들을 검색할 뿐만 아니라 결과 트리들의 루트 노드의 중복을 허용함으로써 질의 연관도가 더 높은 결과들을 생성할 수 있음을 보였다.

개인화 추천시스템을 위한 효율적 연관 규칙 방법 (Effective Association Rule Method for Personalized Recommender System)

  • 고병진;유영훈;조근식
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2002년도 추계학술발표논문집 (하)
    • /
    • pp.2133-2136
    • /
    • 2002
  • 인터넷 특성상 방대한 양의 정보와 상품 등으로 사용자들이 원하는 정보를 찾기 위해서 많은 시간을 낭비하고 있는 실정이다. 이러한 사용자의 시간 소모를 중이기 위해서 추천 시스템이 개발되었다. 현재 인터넷 상의 추천 기술 중에서 가장 많이 사용하는 기법으로는 협력적 여과(Collaborative filtering) 방법이다. 그러나, 협력적 추천 방법으로 추천 받기 위해서는 특정수 이상의 아이템에 대한 평가가 필요하며, 또한 비슷한 성향을 가지는 일부 사용자 정보에 근거하여 추천함으로써 나머지 사용자 정보를 무시하는 경향이 있다. 이러한 문제점이 발생되므로 최근에는 데이터 마이닝(Data Mining) 기법 중 연관 규칙(Association Rule)을 이용한 추천 시스템이 개발되고 있다[1,10]. 그러나, 연관 규칙 기법은 개인별 사용자의 성향을 반영하지 못하는 단점이 있다[4]. 연관 규칙은 단지 대용량 데이터 베이스에서 아이템간의 지지도(Support)와 신뢰도(Confidence)에 근거하여 규칙을 발견하는 특징을 가지고 있기 때문이다. 즉 개인성향을 무시하고 아이템간의 연관성만을 근거로 하여 아이템을 추천하기 때문이다. 본 논문에서는 효율적인 연관 규칙을 이용한 개인화 추천 시스템을 구현하기 위해서 연관 규칙과 여과 방법을 통합한 시스템을 제안한다. 본 시스템에 대하여 성능 비교 실험을 수행함으로써 제안한 방법의 타당성을 제시한다.

  • PDF

항목 알에프엠 점수를 고려한 가중 연관성 규칙 (Weighted association rules considering item RFM scores)

  • 박희창
    • Journal of the Korean Data and Information Science Society
    • /
    • 제21권6호
    • /
    • pp.1147-1154
    • /
    • 2010
  • 데이터 마이닝의 중요 목표 중의 하나는 여러 변수들 간의 관계를 발견하고 결정하는 것이다. 이를 위해 필요한 기법인 연관성 규칙은 각 항목들 간의 관련성을 찾아내는 데 활용되며, 지지도, 신뢰도, 향상도 등의 연관성 측도를 기반으로 두 항목간의 관계를 수치화함으로써 의미 있는 규칙을 찾아 낸다. 본 논문에서는 수익성이 가장 높은 고객을 찾기 위해 고객 정보를 이용하는 기법으로 가장 널리 사용되어온 방법인 알에프엠 기법을 항목에 적용하여 항목의 알에프엠 점수를 항목의 중요도로 고려하여 가중 연관성 규칙의 평가기준을 제시하였다. 모의실험에서는 일반적인 연관성 규칙과 알에프엠 점수를 가중치로 한 가중 연관성 규칙의 유용성을 비교하였다.

Neural Feature Association Rule을 이용한 효모 단백질-단백질 상호작용의 예측 (Prediction of Yeast Protein-Protein Interactions by Neural Feature Association Rule)

  • 엄재홍;장병탁
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2005년도 한국컴퓨터종합학술대회 논문집 Vol.32 No.1 (B)
    • /
    • pp.277-279
    • /
    • 2005
  • 단백질들은 서로 다른 단백질들과 상호작용하거나 복합물을 형성함으로써 생물학적으로 중요한 기능을 한다고 알려져 있다. 때문에 대부분의 세포작용에 있어 중요한 역할을 하는 단백질들 간의 상호작용 분석 및 예측에 대한 연구는 여러 연구그룹으로부터 풍부한 데이터가 산출된 후게놈시대(post-genomic era)에서 또 하나의 중요한 이슈가 되고 있다. 본 논문에서는 효모에 대해 공개되어있는 단백질 상호작용 데이터들에서 속성들 간의 연관규칙 학습을 통해 잠재적 단백질 상호작용들을 예측하기 위한 연관규칙 기반의 상호작용 예측 방법을 제시한다. 단백질들 간의 상호작용 예측을 위해 고려되는 각 단백질의 다수의 속성차원은 정보이론 기반의 속성선택 알고리즘을 이용하여 효율적으로 줄이며 상호작용의 속성집합을 이용하여 신경망을 훈련시키고 이렇게 훈련된 신경망에서 속성들 간의 연관규칙을 디코딩하여 연관규칙 기반의 상호작용 예측에 활용한다. 연관속성 발굴을 통한 상호작용 예측을 위한 마이닝 방법으로는 연관규칙 발견 알고리즘을 사용하였으며 예측 정확도를 높이기 위하여 신경망 예측 모델의 학습 결과를 디코딩한 규칙들이 추가적으로 사용하였다. 논문에서 제안한 방법을 발견된 연관규칙을 통한 단백질 상호작용 예측문제에 있어 평균 약 $94.5\%$의 예측 정확도를 보였다.

  • PDF