• 제목/요약/키워드: 데이타

검색결과 4,094건 처리시간 0.034초

휴리스틱 진화에 기반한 효율적 클러스터링 알고리즘 (An Efficient Clustering Algorithm based on Heuristic Evolution)

  • 류정우;강명구;김명원
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제29권1_2호
    • /
    • pp.80-90
    • /
    • 2002
  • 클러스터링이란 한 군집에 포함된 데이터들 간의 유사한 성질을 갖도록 데이터들을 묶는 것으로 패턴인식, 영상처리 등의 공학 분야에 널리 적용되고 있을 뿐만 아니라, 최근 많은 관심의 대상이 되고 있는 데이터 마이닝의 주요 기술로서 활발히 응용되고 있다. 클러스터링에 있어서 K-means나 FCM(Fuzzy C-means)와 같은 기존의 알고리즘들은 지역적 최적해에 수렴하는 것과 사전에 클러스터 개수를 미리 결정해야 하는 문제점을 개선하였으며, 클러스터링의 특성을 분산도와 분리도로 정의하였다. 분산도는 임의의 클러스터의 중심으로부터 포함된 데이터들이 어느 정도 흩어져 있는지를 나타내는 척도인 반면, 분리도는 임의의 데이터와 모든 클러스터 중심간의 거리의 비율로서 얻어지는 소속정도를 고려하여 클러스터 중심간의 거리를 나타내는 척도이다. 이 두 척도를 이용하여 자동으로 적절한 클러스터 개수를 결정하게 하였다. 또한 진화알고리즘의 문제점인 탐색공간의 확대에 따른 수행시간의 증가는 휴리스틱 연산을 적용함으로써 크게 개선하였다. 제안한 알고리즘의 성능 및 타당성을 보이기 위해 이차원과 다차원 실험데이타를 사용하여 실험한 결과 제안한 알고리즘의 성능이 우수함을 나타내었다.

PreSPI: 단백질 상호작용 예측 서비스 시스템 (PreSPI: Protein-Protein Interaction Prediction Service System)

  • 한동수;김홍숙;장우혁;이성독
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제11권6호
    • /
    • pp.503-513
    • /
    • 2005
  • 계산을 통한 단백질 상호작용 예측 기법의 중요성이 제기되면서 많은 단백질 상호 작용 예측 기법이 제안되고 있다. 하지만 이러한 기법들이 일반 사용자가 손쉽게 사용할 수 있는 서비스 형태로 제공되고 있는 경우는 드물다. 본 논문에서는 현재까지 알려진 단백질 상호작용 예측 기법 중 예측 기법의 완성도가 높고 상대적으로 예측 정확도가 높은 것으로 알려진 도메인 조합 기반 단백질 상호 작용 예측 기법을 이용하여 서비스 시스템으로 설계하고 구현하였다. 효모(Yeast)의 단백질 집합에 대하여 학습한 후, 학습된 단백질 집합과 공통된 도메인을 가지지만 학습 집합에 존재하지 않는 단백질 쌍들에 예측 기법을 적용하여 매우 높은 $77\%$의 민감도(sensitivity)와 $95\%$의 특이도(specificity)를 보였다. 더불어 DIP CORE, HMS-PCI, TAP 데이타의 테스트를 통해서 이 기법의 안정성을 확인하였다. 시스템의 기능들은 핵심 기능, 부가 기능 그리고 일반 서비스 기능으로 분류하였다. 시스템 설계의 주요 목표인 성능, 개방성 그리고 확장성에 따라, 개별 서비스들은 병렬화, 웹 서비스 표준 준수 및 계층화된 구조화를 지원하도록 구현하였다. 본 논문에서는 몇 가지 대표적인 사용자 인터페이스와 상세한 사용 지침도 소개한다.

HSPF 모형을 이용한 낙동강의 비점오염원 정량화 기법 연구 (Non-point Souce Quantative Analysis Using Watershed model in Nakdong River)

  • 김동일;김광문;한건연;박태원
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2012년도 학술발표회
    • /
    • pp.782-782
    • /
    • 2012
  • 지금까지 우리나라에서는 도시하수, 공장폐수 등의 점오염원에 국한하여 중점적으로 수질관리를 실행하여 부분적으로 효과를 얻을 수 있었으나, 하천과 호소의 수질은 크게 향상되지 않고 있다. 이는 급속한 도시화와 산업발달로 토지개발이 가속화되고 대지, 도로, 주차장 등 불투수층 면적이 늘어남에 따라 비점오염원에 의한 하천, 호소의 수질영향도가 커지고 있기 때문이다. 인구증가로 인해 물 사용량 뿐만 아니라 이에 따라 배출되는 오염원의 종류 및 오염부하량 역시 함께 증가하고 있다. 장래의 수질관리 성공여부는 비점오염원의 효율적인 관리여부가 큰 변수로 작용할 것으로 본다. 따라서 공공수역의 수질관리를 위해서는 토지이용과 지역특성을 고려한 비점오염원 부하량의 합리적인 조사, 오염 부하량 절감을 위한 관리기술의 개발, 비점오염원 관리정책의 개발 및 수질모형을 이용한 정확한 수질예측 등이 필요하다. 따라서 본 연구에서는 공간정보를 바탕으로 한 낙동강 유역에서의 비점오염원 정량화 분석을 수행하고자 한다. 우선 대상유역으로 낙본 G유역을 선정하여 이에 대한 조사를 통해 점오염원의 실측자료를 구축하고 이를 HSPF의 입력하여 모의를 수행하여 대상유역에 대한 실측치를 이용해 모형의 보정과 검증을 수행한다. 이러한 과정을 통해 도출된 결과는 대상유역의 총 오염량을 의미한다. 따라서 위의 과정에서 도출된 매개변수를 이용하고, 점오염원을 제거한 뒤 모의를 재수행하여 나온 결과가 대상유역의 비점오염원의 양이라 판단하였다. 모의 결과 대상유역인 낙본 G유역에서 약 39% 정도의 비점오염원 비율을 보였다. 그러나 수질 및 유량 관측치를 지금까지는 국립환경과학원 낙동강물환경연구소 유량측정데이타를 사용하고 있는데 이 자료는 8일 이상 간헐적으로 측정이 수행되고 있다. 따라서 검 보정 대상이 되는 실측치의 자료의 부족과 부정확한 유역이 있음이 한계점으로 작용한다. 그러므로 추후의 신경망 모형이나 기타 실측치 보간에 있어서의 신뢰도를 높이는 기법 개발이나 측정제도의 보편적인 기술의 증대도 앞으로의 모델링에 있어서 중요할 것으로 판단된다. 또한 유역수질모형의 모델링 과정에서 좀 더 신뢰도 높은 측정자료와 그 측정자료를 활용하여 PEST 보정기법을 적용한다면 더욱 정확한 예측이 이루어질 수 있을 것이며, 본 연구에서의 평가방법을 바탕으로 유역수질모델링이 이루어진다면 보다 더 정확성 높은 비점오염원 정량화와 수질 예측이 수행될 수 있을 것이며 더 나아가 오염총량제의 수행에 효과적으로 적용될 것으로 판단된다.

  • PDF

PBFiltering: 무선 센서 네트워크에서 우선순위 기반 상향식 필터링을 이용한 에너지 효율적인 스카이라인 질의 처리 기법 (PBFiltering: An Energy Efficient Skyline Query Processing Method using Priority-based Bottom-up Filtering in Wireless Sensor Networks)

  • 성동욱;박준호;김학신;박형순;노규종;여명호;유재수
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제36권6호
    • /
    • pp.476-485
    • /
    • 2009
  • 센서 네트워크에서 병합 질의를 효율적으로 처리하기 위한 다양한 인-네트워크 질의 처리 기법들이 제안되었다. 스카이라인 질의는 일반적인 병합 질의와 달리 다차원 데이터에 대한 총괄적인 비교를 요구한다. 따라서, 부분적인 데이터만을 이용할 수 있는 인-네트워크 방식으로 처리하기 어렵다. 스카이라인 질의를 에너지 효율적으로 처리하기 위해서 불필요한 데이터의 전송을 제거하는 것이 중요하다. 기존에 제안된 스카이라인 처리 기법은 전체 네트워크에 필터를 배포함으로써 불필요한 데이터 전송을 차단한다. 하지만 많은 긍정 오류(False Positive) 발생에 따른 불필요한 데이터 전송과 필터 배포시 발생하는 에너지 소모로 인해 네트워크의 수명이 단축된다. 본 논문에서는 필터 배포에 따른 에너지 소모를 줄이기 위한 방법으로 상향식 필터 설정을 통한 스카이라인 질의 처리 기법과 필터링 성능을 향상시키는 PBFiltering 기법을 제안한다. 제안하는 기법은 필터를 미리 배포하지 않고 하위 노드로부터 기지국으로 데이터를 수집하는 과정에서 스카이라인 필터 테이블(SFT)을 만들고 필터링을 수행한다. 그리고 여기서 제안하는 우선순위 맵을 이용한 선 필터링(Pre-filtering) 기법을 통해 필터링 효율을 증가시킨다. 제안하는 알고리즘의 우수성을 보이기 위해 기존에 제안된 MFTAC 기법과의 시뮬레이션을 통해 비교 평가하였다. 그 결과 기존 기법에 비해 다수의 긍정 오류의 발생을 감소시키고, 네트워크 수명이 연장됨을 보였다.

만성 일차성 불면증 환자에게 적용한 인지행동중재의 효과: 메타분석 (Cognitive Behavioral Therapy for Primary Insomnia: A Meta-analysis)

  • 김지현;오복자
    • 한국산학기술학회논문지
    • /
    • 제17권9호
    • /
    • pp.407-421
    • /
    • 2016
  • 본 연구는 만성 일차성 불면증 환자에게 적용한 인지행동중재의 효과를 평가하는 16개의 논문을 메타분석한 것이다. PubMed, Cochrane Library, EMBASE, CINAHL와 여러 개의 국내 데이타 베이스를 통해 2015년 1월부터 2015년 6월까지 자료검색이 이루어졌다. 주요 검색전략은 인지행동중재와 불면증을 병합하여 이루어졌다. 논문의 방법론적 질 평가는 코크란의 RoB(The Cochrane's Risk of Bias)를 사용하였다. 자료는 Cochrane Library의 RevMan 5.3 프로그램으로 분석하였다. 최종 16편의 논문, 1503명의 대상자가 선정기준에 부합되었다. 자극조절요법, 수면제한법, 수면위생교육과 인지적 재구성이 인지행동중재의 주요 치료적 구성요소였다. 인지행동 중재의 적용 주수는 평균 5.4주, 적용횟수 평균 5.5회, 1회 평균 중재시간 90분으로 조사되었다. 인지행동중재의 효과는 총 수면시간(d=-0.31), 수면 잠복기(d=-0.29), 입면 후 각성시간(d=-0.55), 수면효율성(d=-0.70), 불면증 심각성(d=-0.77)과 수면에 대한 신념 및 태도(d=-0.64)에 유의하였다. 전반적으로 작은 효과크기에서 중간 정도의 효과크기를 나타냈다. 인지행동중재는 불안(d=-0.30)과 우울(d=-0.35)에도 효과적이었다. 이러한 결과는 인지행동중재가 불면증이 있는 환자들의 수면의 질과 수면시간을 증진시키는 것으로 나타났다.

위성영상 검색에서 사용자 관심영역을 이용한 적합성 피드백 (Relevance Feedback using Region-of-interest in Retrieval of Satellite Images)

  • 김성진;정진완;이석룡;김덕환
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제36권6호
    • /
    • pp.434-445
    • /
    • 2009
  • 내용 기반 영상 검색(content based image retrieval)은 영상 자체의 정보를 이용하여 유사 영상을 검색하는 기법이다. 하지만 멀티미디어 데이터는 텍스트 데이터와 달리 얻을 수 있는 데이터가 정확하지 않고 또한 시스템에서 표현되는 데이터의 저차원(low-level)의 표현법과 사용자가 인식하는 고차원(high-level)의 개념(concept)은 상당한 차이를 나타내게 된다. 즉 시스템 상에서 벡터들로 표현된 영상 데이터들이 벡터스페이스 상에서는 가깝지만 실제 사용자는 유사하지 않다고 인식하는 문제점이 발생한다. 이를 의미적 간극(semantic-gap) 문제라고 부른다. 이런 의미적 간극 문제로 인해 영상검색 결과는 좋지 않은 성능을 보이게 된다. 이를 해결하기 위해 사용자의 피드백 정보를 이용하여 질의를 수정하는 적합성 피드백 기법이 널리 사용되고 있다. 하지만 기존의 적합성 피드백은 사용자의 관심영역(region-of-interest, 이하 ROI)를 고려하지 않아 적합한(relevant) 영역의 모든 영역들이 새로운 질의 점을 계산하는 과정에서 사용된다. 시스템은 그 스스로 사용자 관심영역을 알지 못하기 때문에 적합성 피드백을 영상수준(image-level)으로 진행하기 때문이다. 이 논문에서는 복잡한 위성영상 영역 검색에서 관심영역을 사용자가 직접 선택하도록 유도하여 더욱 정확한 질의 점을 계산하여 정확도를 높이는 사용자 관심영역 적합성 피드백 방법을 제시한다. 또한 사용자가 선택하지 않은 부정확한 영상 정보를 이용하여 정확도를 향상시키는 프루닝 기법도 함께 제시한다. 실험을 통하여 사용자 관심영역 적합성 피드백의 우수성과 함께 제안한 프루닝 기법의 효율성도 함께 보여준다.

무제약 필기 숫자를 인식하기 위한 다수 인식기를 결합하는 의존관계 기반의 프레임워크 (Dependency-based Framework of Combining Multiple Experts for Recognizing Unconstrained Handwritten Numerals)

  • 강희중;이성환
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제27권8호
    • /
    • pp.855-863
    • /
    • 2000
  • K개의 인식기로부터 관찰된 K개 결정을 결합하는 결합 방법론 중의 하나인 BKS (Behavior-Knowledge Space) 방법은 아무런 가정 없이 이들 결정을 결합하지만, 관찰된 K개 결정을 저장하고 관리하려면 이론적으로 기하학적인 저장 공간을 만들어야 한다. 즉, K개의 인식기 결정을 결합하기 위하여 (K+1)차 확률 분포를 필요로 하는데, 작은 K라 할지라도 그 확률 분포를 저장하거나 평가하는 것이 어렵다는 것은 이미 잘 알려져 있다. 그러한 문제점을 극복하기 위해서는 고차 확률 분포를 몇 개의 구성 분포로 나누고, 이들 구성 분포의 곱(product)으로 고차 확률 분포를 근사시켜야 한다. 그러한 이전 방법 중의 하나는 그 확률 분포에 조건부 독립 가정을 적용하는 것이고, 다른 방법으로는 [1]에서와 같이 그 확률 분포를 단지 트리 의존관계 또는 2차 구성 분포의 곱으로 근사하는 것이다. 본 논문에서는, 구성 분포의 곱으로 근사하는 방법에서, 2차 이상의 고차 구성 분포까지 고려하여 (K+1)차 확률 분포를 d차 ($1{\le}d{\le}K$) 의존관계에 의한 최적의 곱으로 근사하고, 베이지안 방법과 그 곱을 기반으로 다수 인식기의 결정을 결합하는 의존관계 기반의 프레임워크를 제안한다. 이 프레임워크는 표준 CENPARMI 데이타베이스로 실험되어 평가되었다.

  • PDF

동적 특성의 시각화를 수행하는 새로운 패턴변환 기법에 의한 온라인 서명인식 기술 (Online Signature Verification by Visualization of Dynamic Characteristics using New Pattern Transform Technique)

  • 지수영;이재연;오원근;김창헌
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제32권7호
    • /
    • pp.663-673
    • /
    • 2005
  • 본 논문에서는 서명패턴에 내재되어 있는 동적인 특성을 패턴변환을 이용하여 시각화 함으로써 위조서명에 대한 안정성을 향상시킨 새로운 온라인 서명인증 알고리즘을 제안한다. 제안하는 첫 번째 패턴변환방식인 속도 평활화(Speed Equalization)는 서명과정의 시간적인 특성을 효율적으로 모델링하기 위하여, 주어진 서명의 시계열 패턴을 선 속도가 일정하도록 재구성함으로써 변환된 패턴을 생성한다 한편 두 번째 패턴변환방식인 속도변환(Velocity Transform)은 주어진 서명패턴을 수평/수직 속도 평면으로 매핑 함으로써 변환된 패턴을 생성한다. 이러한 변환을 통하여 원래의 서명과정에서의 동적인 특성이 변환된 도메인에서는 변환된 패턴의 모양에 반영되게 되므로, 변환된 패턴에 대한 형체분석(Shape Analysis) 을 통하여 효율적으로 동적인 특성에 대한 분석이 이루어진다. 본 논문에서 제안하는 모델의 장점은 변환된 패턴들이 본래의 서명패턴과 동일한 형태로 표현된다는 점이다. 따라서 기존의 많은 연구를 통하여 제안되어 은 대부분의 서명인식 알고리즘을 변환된 패턴에도 그대로 적용할 수 있다는 장점을 가진다. 271명의 6770개의 서명패턴으로 이루어 진 데이타베이스를 대상으로 한 실험을 통하여 본 논문에서 제안된 방식을 사용한 경우, 1.17$\%$의 EER(Equal Error Rate)를 보여 제안된 변환을 사용하지 않은 경우의 1.93$\%$와 비교하여 성능이 현격하게 향상되었음을 보였다. 특히 위조서명에 대한 실험에서는 이 차이가 더욱 현저하여 본 논문에서 제안된 방식이 위조서명을 거부하는데 유용함을 보였다.

PMS : 다단계 저장장치를 고려한 효율적인 선반입 정책 (PMS : Prefetching Strategy for Multi-level Storage System)

  • 이규형;이효정;노삼혁
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제36권1호
    • /
    • pp.26-32
    • /
    • 2009
  • 저장장치를 다단계로 구성하여 효율적으로 많은 사용자의 요청을 동시에 처리하는 다단계 저장장치의 활용은 점차 늘어나고 있다. 저장 장치가 다단계로 발전하여, 매우 많은 데이타를 효과적으로 처리할 수 있게 되었으나, 디스크에 접근하기 위한 단계가 늘어남으로써 성능이 저하되는 문제가 발생한다. 현재까지는 메모리와 프로세스에 비해 느린 디스크 접근 속도를 완충하기 위해 선반입 정책이 매우 효과적이었다. 그러나 기존의 선반입 기법은 대부분 다단계로 구성된 저장장치는 고려하지 않기 때문에 다단계 저장장치에서 기존의 선반입 기법을 사용할 경우 큰 성능향상을 기대 할 수 없다. 본 연구에서는 네트워크로 연결된 다단계 저장장치에서 상위 레벨의 선반입 기법에 의존하지 않는, 넓은 용도로 사용할 수 있는, Prefetching Strategy for Multi-level Storage system(PMS)라 칭하는 하위 레벨 선반입 기법을 제안하였다. 이는 시스템의 사용자, 어플리케이션 혹은 상위 시스템과 독립적으로 동작하기 때문에 단지 하위 시스템의 선반입 정책으로 적용함으로써 쉽게 높은 성능을 사용할 수 있다. 또한 PMS 정책의 성능을 측정하기 위해 본 연구에서는 실제 시스템을 정교하게 흉내 내는 시뮬레이터를 개발하여 널리 쓰이는 두가지 트레이스를 이용한 서로 다른 32가지의 실험을 하였고, 기존의 선반입 정책을 하위 레벨에 적용한 시스템에 비해 PMS 정책을 하위 레벨에 적용할 경우, 모든 경우에서 성능향상을 확인 할 수 있었고, 최대 35%, 평균 16.56%의 평균 응답시간이 좋아짐을 보였다.

A Comparative Study on the Influence of Creation Shared Value Activities on Continuous Use Intention in Korean-Chinese Library Big Data Service: Focusing on Brand Quality and Social Resistance

  • Dong, JingWen
    • 한국컴퓨터정보학회논문지
    • /
    • 제24권10호
    • /
    • pp.129-137
    • /
    • 2019
  • 본 연구를 통해 중국과 한국에 있는 도서관의 CSV활동이 브랜드 자산, 사회적 자리에 영향을 미치는지 또한, 브랜드 자산, 사회적 자리가 지속사용의도에 영향을 미치는지, 마지마으로 중국과 한국 집단에 따라 각 변수의 영향관계 차이가 있는지를 검토하고자 한다. 본 연구의 목적을 달성하기 위하여 한국과 중국 도서관의 빅 데이터 공유 서비스를 사용해본 적이 있는 사용자를 대상으로 설문지를 사용하였다. 연구의 참여자들에게 각 250부 총 500부의 설문지를 배포하였으며, 460부가 최종분석에 이용되었다. 설문조사를 통해 수집된 데이타는 통계프로그램 SPSS22과 AMOS22을 사용하여 빈도분석, 신뢰도분석, 확인적 요인분석, 구조방정식 모델 등으로 분석하였다. 본 연구의 실증분석을 통해 확인된 연구결과는 다음과 같다. 첫째, 도서관 빅 데이터의 CSV활동이 브랜드 자산과 사회적 자리에 유의한 정(+)의 영향을 미친다. 둘째, 브랜드 자산과 사회적 자리가 지속적 사용의도에 유의한 정(+)의 영향을 미친다. 셋째, 한국과 중국 도서관의 CSV활동의 영향력이 부분적으로 차이가 있는 것으로 나타났다. 결론 및 토론 부분을 통하여 본 연구의 이론적 시사점, 실무적 시사점과 연구의 한계와 향후 방향에 대한 심도 있는 논의를 제시했다.