• Title/Summary/Keyword: 후처리데이터

Search Result 1,890, Processing Time 0.029 seconds

A Study on the Efficiency of Imbalanced Data Processing Techniques for Exercise Prediction in COPD Patients (COPD 환자 운동 예측을 위한 불균형 데이터 처리 기법의 효율성에 관한 연구)

  • Hyeonseok Jin;Sehyun Cho;Jayun Choi;Kyungbaek Kim
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2024.05a
    • /
    • pp.652-655
    • /
    • 2024
  • COPD(Chronic Obstructive Pulmonary Disease)는 장기간에 걸쳐 기도가 좁아지는 폐질환으로, 규칙적 운동은 호흡을 용이하게 하고 증상을 개선할 수 있는 주요 자가관리 중재법 중 하나이다. 건강정보 데이터와 인공지능을 사용하여 규직적 운동 이행군과 불이행군을 선별하여 자가관리 취약 집단을 파악하는 것은 질병관리 측면에서 비용효과적인 전략이다. 하지만 많은 양의 데이터를 확보하기 어렵고, 규칙적 운동군과 그렇지 않은 환자의 비율이 상이하기 때문에 인공지능 모델의 전체적인 선별 능력을 향상시키기 어렵다는 한계가 있다. 이러한 한계를 극복하기 위해 본 연구에서는 국민건강영양조사 데이터를 사용하여 머신러닝 모델인 XGBoost와 딥러닝 모델인 MLP에 오버샘플링, 언더샘플링, 가중치 부여 등 불균형 데이터 처리 기법을 적용 후 성능을 비교하여 가장 효과적인 불균형 데이터 처리 기법을 제시한다.

Design and Implementation of Hadoop-based Platform "Textom" for Processing Big-data (하둡 기반 빅데이터 수집 및 처리를 위한 플랫폼 설계 및 구현)

  • Son, ki-jun;Cho, in-ho;Kim, chan-woo;Jun, chae-nam
    • Proceedings of the Korea Contents Association Conference
    • /
    • 2015.05a
    • /
    • pp.297-298
    • /
    • 2015
  • 빅데이터 처리를 위한 소프트웨어 시스템을 구축하기 위하여 필요한 대표적인 기술 중 하나가 데이터의 수집 및 분석이다. 데이터 수집은 서비스를 제공하기 위한 분석의 기초 작업으로 분석 인프라를 구축하는 작업에 매우 중요하다. 본 논문은 한국어 기반 빅데이터 처리를 위하여 웹과 SNS상의 데이터 수집 어플리케이션 및 저장과 분석을 위한 플랫폼을 제공한다. 해당 플랫폼은 하둡(Hadoop) 기반으로 동작을 하며 비동기적으로 데이터를 수집하고, 수집된 데이터를 하둡에 저장하게 되며, 저장된 데이터를 분석한 후 분석결과에 대한 시각화 결과를 제공한다. 구현된 빅데이터 플랫폼 텍스톰은 데이터 수집 및 분석가를 위한 유용한 시스템이 될 것으로 기대가 된다. 특히 본 논문에서는 모든 구현을 오픈소스 소프트웨어에 기반하여 수행했으며, 웹 환경에서 데이터 수집 및 분석이 가능하도록 구현하였다.

  • PDF

Design and Implementation of Spatial Association Rule in GMS (GMS 에서의 공간 연관 규칙 탐사 시스템의 설계 및 구현)

  • Ahn, Chan-Min;Lee, Ju-Hong;Chun, Seok-Ju
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2005.05a
    • /
    • pp.105-108
    • /
    • 2005
  • 본 논문에서는 지리정보 시스템인 GMS 를 기반으로 한 공간 연관 규칙의 구현과 설계 방법을 제안한다. GMS 에는 비공간 데이터와 공간 데이터가 테이블로 구분되어 저장되어 있다. 이를 이용하여 비공간 데이터 집합에서 관련된 데이터 집합을 추출한 후 그에 해당되는 공간 데이터를 이용하여 공간 연관 정보를 찾아내서 연관 규칙을 발견하는 방법에 대입하여 공간 연관 규칙을 발견한다.

  • PDF

A Window-Based Classification of Stream Data (스트림 데이터의 윈도우 기반 분류)

  • Kim, Sung-Hyun;Lee, Yong-Mi;Jin, Long;Seo, Sung-Bo;Ryu, Keun-Ho
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2005.11a
    • /
    • pp.47-50
    • /
    • 2005
  • 센서와 모바일 기술의 발달로 인해 다양한 센서에서 수집된 스트림 데이터를 처리하는 연구들이 많이 수행되고 있다. 다차원 속성의 스트림 데이터는 센서에서 주기적으로 수집되어 버퍼링 후 처리되기 때문에 기존의 투플 기반의 데이터 분류 기법에 적합하지 않다. 따라서 이 논문에서는 윈도우 기반의 스트림 데이터 분류를 위해 각 속성의 평균과 표준편차 값을 이용하여 투플 기반으로 변환하는 기법을 제안한다. 제안된 기법의 타당성은 투플 기반 데이터 분류 기법(의사결정트리, 단순 베이지안 분류기, 베이지안 신뢰 네트워크)에 의한 정확도 측정에 기반 한다. 로봇에서 수집된 센서 데이터를 이용한 실험 결과, 높은 정확도로 제안된 기법이 타당함을 증명하였으며 베이지안 신뢰 네트워크 기법이 다른 기법에 비해 우수함을 발견하였다.

  • PDF

Depth-of-Field Image Post-Processing Method Based on Visual Attention (관심 영역에 기반한 저심도 이미지 후처리 구현 방법)

  • Lee, Yu-Kyeong;Heo, Jeong-Hwan;Jeong, Jechang
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2019.11a
    • /
    • pp.124-127
    • /
    • 2019
  • 본 논문에서는 단일 이미지의 관심 영역에 기반한 저심도 후처리 방법을 제안한다. 저심도 이미지란 사진에서 초점이 선명하게 포착되는 깊이의 범위가 좁은 이미지를 말한다. 기존의 광학적 특성을 이용한 저심도 이미지를 만드는 과정은 물리적인 구조 설계비용 문제가 존재한다. 또한, 이미지의 후처리 보정을 통한 방법은 이미지상의 사물 깊이 정보를 알기 어렵기 때문에 이미지의 심도를 후처리하기 어려웠다. 이에 따라 본 논문에서는 슈퍼 픽셀 군집화 방법을 통해 관심 영역을 찾고, 이에 기반하여 관심 영역이 부각될 수 있는 저심도 후처리 방법을 제안한다. 제안하는 후처리 방법은 슈퍼픽셀 군집화 방법을 통해 관심영역을 설정하여 배경 영역을 분리하고 블러 과정을 수행한다. 관심 영역을 제외한 부분을 확장 한 뒤 배경 블러를 거치기 때문에 후광효과가 현저히 줄어든 저심도 효과가 적용된 이미지를 얻을 수 있었고 MSRA-1000 데이터 셋 이미지에서 우수한 주관적 화질 결과를 보였다.

  • PDF

3D Image Scan Data-based Sweeping Shape Reconstruction Algorithm (3D 이미지 스캔 데이터 기반 SWEEPING 형상 역설계 알고리즘)

  • Kang, Tae-Wook
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2015.04a
    • /
    • pp.896-897
    • /
    • 2015
  • 본 연구는 3D 이미지 스캔 데이터 기반으로, SWEEPING 형상을 효과적으로 역설계하는 기술에 관한 것이다. 사용자가 미리 정의한 형상 단면 모델 데이터베이스를 이용해, 3차원 SWEEPING 형상을 자동으로 역설계하는 알고리즘을 제안한다. 이를 위해, 3D 이미지 스캔 데이터인 포인트 클라우드에서 자동으로 추출한 단면 포인트들을 처리해, 파라메터 정보를 추출하고, 미리 정의된 형상 단면들과 상호간 유사도를 비교한 후, 가장 유사한 형상 단면을 획득한다. 이러한 기술은 SWEEPING 형상 모델의 역설계 과정을 자동화하는 데 도움을 줄 것이다.

Design of Cloud based Grid Test-bed for Handling Science Dataset (클라우드 기반 과학데이터 그리드 테스트베드 설계)

  • Kang, Yun-Hee
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2014.04a
    • /
    • pp.90-92
    • /
    • 2014
  • 이 논문에서는 그리드 환경에서 과학응용을 효율적으로 수행시키기 위해 클라우드 기반의 동적자원 프로비저닝 기술을 그리드 응용에 적용하기 위한 테스드베드 설계를 기술한다. 이를 위해 클라우드 기반 그리드 테스트베드 구축을 위한 요구사항 및 응용 아키텍처 설계를 요약한 후 가상화 자원을 이용하는 과학데이터 그리드 플랫폼을 대용량 데이터 처리에 적합하도록 최적화하고, 그 방안을 제시한다. 설계된 테스트베드는 그리드 환경 고도화를 위한 접근 방법으로 계산 자원 제공을 위해 클라우드 기술을 활용하도록 한다.

Performance Improvement Methods of a Spoken Chatting System Using SVM (SVM을 이용한 음성채팅시스템의 성능 향상 방법)

  • Ahn, HyeokJu;Lee, SungHee;Song, YeongKil;Kim, HarkSoo
    • KIPS Transactions on Software and Data Engineering
    • /
    • v.4 no.6
    • /
    • pp.261-268
    • /
    • 2015
  • In spoken chatting systems, users'spoken queries are converted to text queries using automatic speech recognition (ASR) engines. If the top-1 results of the ASR engines are incorrect, these errors are propagated to the spoken chatting systems. To improve the top-1 accuracies of ASR engines, we propose a post-processing model to rearrange the top-n outputs of ASR engines using a ranking support vector machine (RankSVM). On the other hand, a number of chatting sentences are needed to train chatting systems. If new chatting sentences are not frequently added to training data, responses of the chatting systems will be old-fashioned soon. To resolve this problem, we propose a data collection model to automatically select chatting sentences from TV and movie scenarios using a support vector machine (SVM). In the experiments, the post-processing model showed a higher precision of 4.4% and a higher recall rate of 6.4% compared to the baseline model (without post-processing). Then, the data collection model showed the high precision of 98.95% and the recall rate of 57.14%.

A Study on Implementation of Hangul matching System for Pocket PC (Pocket PC용 한글 매칭 시스템 설계에 관한 연구)

  • Lee, Ho-Hyun;Cho, Beom-Joon
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2003.11a
    • /
    • pp.279-282
    • /
    • 2003
  • 한글위주의 스크립트를 전자 잉크 데이터(electronic ink data)형태로 Pocket PC에서 사용하기 위한 한글 매칭 알고리즘을 적용한 시스템 설계에 관한 연구이다. 적용된 한글 매칭 알고리즘은 전자 잉크 데이터(electronic ink data)를 스크립트 형태로 변화한 후 이를 모바일 환경의 프로그래밍 기법을 사용하여 시스템을 구현한다. Pocket PC의 하드웨어적 제약을 고려하여 효율적인 속도를 보장하면서 인식률을 높이기 위해 기본 획을 인식한 후, 획 정보와 획 간의 위치관계를 이용하여 자소로 분리된 데이터의 값으로 변환하여 이를 CF메모리상에 있는 통계적 수치 데이터로 저장된 한글 데이터의 값과 비교하여 한글을 인식할 수 있는 시스템 구현에 목적이 있다.

  • PDF

Implementation of the Digital Signal Processing Simulator for Optical Data Storage Systems (광 기록 저장 시스템에 대한 디지털 신호처리 시뮬레이터 구현)

  • 김민철;이재진
    • Proceedings of the IEEK Conference
    • /
    • 2000.09a
    • /
    • pp.947-950
    • /
    • 2000
  • 디지털 데이터 처리 및 전송과 함께 방대한 양의 디지털 데이터에 대한 저장 시스템의 용량 증가를 위한 신호처리 기법에 대해 관심이 날로 증가하고 있는 가운데, 다양한 기록 시스템에 대하여 고안된 여러 가지 채널 코딩 및 신호 검출 알고리즘을 분석, 검증하기 위한 시뮬레이터를 하드웨어적으로 구현하였다. 본 시뮬레이터는 광 기록 저장 채널에 대한 신호처리 시뮬레이션프로그램을 토대로 디지털 신호처리 프로세서(DSP)를 이용하여 RLL 변조 코드에 대한 인코더/디코더 및 채널을 통과한 데이터에 대해 심볼간 간섭을 제거하기 위한 등화기와 등화된 채널 출력 신호로부터 전송된 데이터를 결정하기 위한 여러 가지 신호 검출기를 설계하여 채널을 통과하기 전의 원본 데이터와 통과후의 출력 값에 대한 에러율을 분석, 검증하였다.

  • PDF