• Title/Summary/Keyword: 데이터 추출

Search Result 6,310, Processing Time 0.041 seconds

Dataset Property - based Algebraic Operators for Data Mining Preprocessing (데이터집합 특성에 기반한 데이터 마이닝 전처리 대수 연산자)

  • Kim, Hyo-Sook;Lee, Won-Suk
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2002.11c
    • /
    • pp.1709-1712
    • /
    • 2002
  • 지식 탐사 연구의 핵심이 되어온 데이터 마이닝은 축적 데이터로부터 쉽게 추출되지 않는 데이터 상호관계나 일정 패턴과 같은 유용한 내재 정보 추출을 주된 목적으로 수행된다. 그러나, 데이터 마이닝은 대용량의 데이터 처리로 인해 빈번한 메모리 공간 제약과 처리 속도 저하 등의 한계성을 드러낸다. 이를 극복하기 위해 많은 마이닝 알고리즘 개발과 기존 알고리즘 개선 방법이 제시되어 왔으나 여전히 궁극적인 해결방안은 대두되지 않고 있다. 따라서, 만약 데이터 전처리 과정을 통해 마이닝 목적에 적합한 부분 데이터집합 추출 및 가공이 선행된다면 보다 효율적인 데이터 마이닝 작업을 유도할 수 있을 것이다. 본 논문은 효과적 데이터 전처리를 위한 필수 기본 연산 기능들을 주어진 데이터집합의 트랜잭션 및 데이터 특성에 기초하여 관계형 대수 형태로 의미를 정립하고, 적용 사례에 의한 상세 설명 및 실제 구현된 온라인 데이터 전처리 시스템을 제안한다.

  • PDF

A study on the Human Network Visualization on Mobile Phone for Characteristics of Relational Data (관계망 데이터 특성을 이용한 모바일 인맥 네트워크의 시각화에 관한 연구)

  • Jeong, Gye-Oun;Lee, Kyung-Won
    • 한국HCI학회:학술대회논문집
    • /
    • 2007.02b
    • /
    • pp.424-431
    • /
    • 2007
  • 본 연구는 관계망 시각화에 이용되는 데이터의 특성을 분석하고 그에 맞는 시각화 요소를 추출하여 시각화하는 것에 관한 연구이다. 사회 관계망 시각화는 점과 선을 기초 요소로 하여 점은 사회적 요소(actor), 선은 관계(relation)를 의미한다, 점과 선은 시각화에 사용되는 데이터의 특성에 따라 다양한 형태를 갖게 된다. 이 논문에서는 관계망 시각화에 사용되는 데이터의 특성을 데이터의 형태, 관계, 상태에 따라 분류하고, 각각의 특성에 맞는 관계망 시각화의 형태를 추출하고, 그에 따른 시각화 요소를 추출하였다. 이를 바탕으로 모바일 커뮤니케이션을 통해 형성되는 인맥 네트워크를 시각화함으로써, 인맥 네트워크 구성원 간의 친밀도를 효과적으로 파악할 수 있는 방법에 대해 제시하였다. 또한, 시각화의 결과를 이용하여 휴대전화로 인맥 네트워크를 유지, 관리하기 위한 서비스를 제안하였다. 이러한 연구는 데이터의 특성에 맞는 시각화의 요소를 추출하고, 데이터의 형태, 관계, 상태를 직관적으로 제공함으로써 사용자로 하여금 자신의 인맥 네트워크 구성원들의 친밀도와 관계 형태, 상태를 파악하여 자신의 인맥을 유지, 관리하고 보수할 수 있도록 한다.

  • PDF

On Developing of a tool for association rule extracting from fuzzy data (퍼지 데이터로부터 연관 규칙을 추출하기 위한 도구의 개발)

  • Kang, Yu-Kyung;Hwang, Suk-Hyung;Kim, Eung-Hee
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2010.11a
    • /
    • pp.413-416
    • /
    • 2010
  • 오늘날, 대량의 데이터를 수집, 저장 및 관리하는 데이터베이스 기술의 진보를 기반으로, 의료, 과학, 교육, 비즈니스 등 다양한 분야에서 발생되는 대규모 데이터를 축적하게 되었다. 다양한 분야에서 축적된 대량의 데이터에 내재된 유용한 정보를 수월하게 추출하여 분석하기 위해 널리 사용되고 있는 형식개념분석기법은, 주어진 데이터로부터 정보의 최소단위로써 개념들을 추출하고, 개념들 사이의 관계를 토대로 개념계층구조를 구축하기 위한 정형화된 데이터마이닝 기법을 제공하고 있다. 본 논문에서는, 주어진 퍼지 데이터에 잠재된 유용한 정보를 추출하기 위해, 퍼지 집합 이론을 형식개념분석기법에 접목한 퍼지개념분석기법과 이를 지원하기 위해 본 연구에서 개발된 FFCA-Wizard를 소개한다. 또한, FFCA-Wizard를 사용하여 실세계 데이터를 대상으로 퍼지개념분석을 실시한 실험 결과를 보고한다.

Effective Feature Extraction for Tweets Classification (트윗 분류를 위한 효과적인 자질 추출)

  • Hong, Cho-Hee;Kim, Hark-Soo
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2011.06a
    • /
    • pp.229-232
    • /
    • 2011
  • 트위터는 소설 네트워크 서비스 중 하나로, 기존의 미디어 형태와 다른 새로운 형태의 미디어이다. 최근 스마트폰의 사용증가로 접근성이 용이하여 사용자가 급격하게 증가하고 있다. 그래서 트위터 메시지 관리와 응용에 대한 관심이 커지고 있다. 그러나 트위터 데이터의 특징상 정보 추출이 어려워 트위터 데이터 처리의 문제가 발생된다. 본 논문에서는 방대한 양의 트위터 데이터를 관리 및 응용을 위하여 트위터 데이터 분류 실험을 통하여 트위터 데이터에 대한 적합한 자질 추출 기법을 소개한다.

특징형상 테이터를 이용한 선행관계 추출과 작업순서 결정

  • 이충수;노형민;김성식
    • Proceedings of the Korean Operations and Management Science Society Conference
    • /
    • 1996.04a
    • /
    • pp.352-357
    • /
    • 1996
  • 특징형상 데이터는 공정설계의 입력 정보로 사용되며, 부품 서술 데이터, 기하학적 데이터, 가공 기술적 데이터로 분류할 수 있다. 또한 공정순서및 작업순서 결정에서 선행관계는 반드시 고려하여 위배되지 않도록 해야하는 중요한 요소이다. 본 연구에서는 작업순서 결정시 만족해야하는 선행관계를 기하형상에 의한 선행관계, 단위 특징형상의 작업내용들간의 선행관계, 가공 경험에 의한 선행관계 등으로 분류/정의하였고, 특징형상 데이터와 가공지식을 이용하여 분류된 선행관계를 자동으로 추출하는 방법을 제안하였다. 그리고 추출한 선행관계를, 공구 교환횟수를 최소로 하는 작업순서 결정 알고리즘에 적용한 사례를 정리하였다.

  • PDF

A Region Based Similar Image Retrieval using Histogram Comparison (히스토그램 비교법을 이용한 영역기반 유사 이미지 검색)

  • 임동혁;김창룡;정진완
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2000.10a
    • /
    • pp.130-132
    • /
    • 2000
  • 주요 멀티미디어 자료인 이미지는 데이터 특성을 표현하기가 어렵고, 특성추출에서 얻은 데이터가 너무 고차원적이라 이를 저차원의 처리가능한 데이터로 변환하는 과정에서 많은 손실이 있다. 이미지의 특성값을 전체 이미지의 평균값으로 변경하여 저차원 데이터를 얻는 기존의 이미지 전체 특성추출기법이나 고정된 블록의 평균값으로 변경하여 저차원 데이터를 얻는 이미지 블록 특성추출기법은 유사 이미지의 검색이 부정확하다는 단점이 있다. 본 논문에서는 이미지를 가변적인 영역으로 나누어 특성값을 얻고, 히스토그램을 이용하여 효율적으로 유사 이미지를 찾는 영역기반 유사 이미지 검색기법을 제안하고 이를 구현하였다.

  • PDF

The Method for Extracting Meaningful Patterns Over the Time of Multi Blocks Stream Data (시간의 흐름과 위치 변화에 따른 멀티 블록 스트림 데이터의 의미 있는 패턴 추출 방법)

  • Cho, Kyeong-Rae;Kim, Ki-Young
    • KIPS Transactions on Computer and Communication Systems
    • /
    • v.3 no.10
    • /
    • pp.377-382
    • /
    • 2014
  • Analysis techniques of the data over time from the mobile environment and IoT, is mainly used for extracting patterns from the collected data, to find meaningful information. However, analytical methods existing, is based to be analyzed in a state where the data collection is complete, to reflect changes in time series data associated with the passage of time is difficult. In this paper, we introduce a method for analyzing multi-block streaming data(AM-MBSD: Analysis Method for Multi-Block Stream Data) for the analysis of the data stream with multiple properties, such as variability of pattern and large capacitive and continuity of data. The multi-block streaming data, define a plurality of blocks of data to be continuously generated, each block, by using the analysis method of the proposed method of analysis to extract meaningful patterns. The patterns that are extracted, generation time, frequency, were collected and consideration of such errors. Through analysis experiments using time series data.

Development of Hardware Platform for Extracting & Composing of SDI Embedded Audio Data at Real-time Capture/Playback System of UHD Video/Audio (UHD 영상/음향 데이터의 실시간 획득/재생 시스템에서의 SDI 내장 음향 데이터의 추출 및 합성을 위한 하드웨어 플랫폼 개발)

  • Lee, Sang-Seol;Jang, Sung-Joon;Choi, Jung-Min;Kim, Je Woo
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2016.06a
    • /
    • pp.258-259
    • /
    • 2016
  • 일반적으로 UHD 방송 편집 시스템에서 UHD 영상의 데이터양이 막대하기 때문에 실시간 전송을 위해 코덱과 함께 압축하여 편집 서버로 혹은 편집 서버로부터 스트림 형태로 전송한다. BT.1120 형태로 전송 송출된 SDI (Serial Digital Interface) 내장 음향 데이터는 영상과 달리 보조 데이터 영역에 다른 메타 데이터들과 함께 합성되어 전송 송출되기 때문에 추출 및 합성이 상대적으로 어렵다. 특히 재생을 위해서는 영상 코덱으로부터의 출력 영상과의 동기를 고려해야 하고 음향 데이터를 BT.1120 표준에 맞춰 보조 데이터 영역에 합성해야하기 때문에 개발에 어려움이 있다. 이에 본 논문은 UHD 영상/음향 데이터의 실시간 획득/재생 시스템에서의 SDI 내장 음향 데이터의 추출 및 합성을 위한 FPGA (Field Programmable Gate Array) 기반 하드웨어 플랫폼을 제안하였다. 또한, 이를 위한 음향 데이터 추출 로직과 합성 로직을 HDL(Hardware Design Language) 설계하여 FPGA 내에 탑재하고 카메라/디스플레이/편집 서버와 통합하였다. 시험 결과 4K 60fps 데이터에서 정상적으로 영상과 음향을 분리/획득 및 합성/재생하였다.

  • PDF

An Efficient Method of Extracting Iris Area Using the Inner Canthus (내안각을 이용한 효율적인 홍채영역 추출 방법)

  • 박지현;성한호;이일병
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2003.10b
    • /
    • pp.544-546
    • /
    • 2003
  • 홍채인식 기술에서 홍채영역 추출 방법은 필요한 데이터를 추출, 변환하는 과정에서 발생하는 홍채정보의 손실을 최소화하는데 그 목적이 있다. 그러나 기존의 홍채인식에서 사용되는 홍채영역 추출 방법은 초기 눈 영상 획득 시 얻은 영상의 눈 기울기가 일정하다는 가정에 기초하거나, 하나의 홍채 데이터를 기준으로 삼고, 다른 홍채데이터를 비교하여 기울기를 보정하기 때문에 동일인에게서 취득한 영상이라 하더라도 영상간의 기울기가 크다면 두 홍채 데이터의 공통된 특징 역시 상대적으로 적거나 차이가 날 수밖에 없다. 결국, 이는 실제 필드에서 사용할 시스템의 인식률에 영향을 줄 수밖에 없다. 본 논문에서는 이 문제를 보완하기 위한 방안으로, 눈 영상 내에서 내안각을 찾아내고 이를 기준으로 하여, 눈 영상의 특정 부분에서 일정한 홍채영역을 추출하는 방법을 제안한다. 본 논문에서는 우리가 제안하는 방법을 사용하여 실제 취득한 모든 눈 영상에 대한 실험을 한 결과, 비교적 일정한 홍채영역을 추출할 수 있음을 입증하였다.

  • PDF

Detection on human Faces in Complex Scene by Use of a skin Color and of a Part of Face (복잡한 배경 화면에서 피부색과 얼굴 부분영역을 이용한 얼굴 추출)

  • 이옥경;김혜경;박연출;오해석
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2000.04b
    • /
    • pp.571-573
    • /
    • 2000
  • 복잡한 이미지에서 얼굴 추출은 얼굴 영상처리 분야에서 기본적이면서도 배경이 복잡함으로 인해 많은 어려움이 따른다. 이 논문에서는 복잡한 화면 이미지에서 얼굴을 추출하기 위해 여러 가지 과정을 거친다. 다양한 피부색을 가진 얼굴에 대해 즉, 흑인과 황인, 백인 등을 모두 추출하기 위해 피부색 모델을 이용한다. 다양한 피부색에 대한 임계값(threshold)을 이용하여 피부색과 다른 영역을 구분하여 얼굴의 후보 데이터로 추출한다. 그 추출된 후보 데이터를 지역적 임계값(local threshold)을 이용하여 얼굴과 눈, 코, 입과 같은 세부사항에 분류한다. 분류된 부분이 즉 얼굴내에서 얼굴이 아닌 부분(눈, 코, 입 등)의 크기가 정규화 되어진 최소 크기보다 박을 경우 그 후보 데이터를 버리고, 그렇지 않을 경우, 즉 얼굴이 아닌 다른 부분의 크기가 정해진 크기보다 크거나 같을 경우 그 후보 데이터를 검출한다. 이 논문에 결과는 배경에서도 피부색과 얼굴의 부분영역을 이용하여 얼굴을 검출할 수 있다는 것을 보인다.

  • PDF