• 제목/요약/키워드: 데이터 분석론

검색결과 1,370건 처리시간 0.036초

멀티채널 기반 드라마 동영상 의미 분절화를 위한 비모수 베이지안 방법 (Nonparametric Bayesian Approach for Multichannel based Semantic Segmentation of TV Dramas)

  • 석호식;이바도;장병탁
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2012년도 한국컴퓨터종합학술대회논문집 Vol.39 No.1(B)
    • /
    • pp.474-476
    • /
    • 2012
  • 본 논문에서는 드라마 동영상의 의미 분절화(Semantic segmentation)를 위한 멀티 채널 기반 비모수적 베이지만 방법론을 소개한다. 기존 방법론은 매우 한정적인 특징만을 이용하여 분절화를 시도하거나 이미지 채널이나 오디오 채널과 같은 단일 채널에서만 유효한 방법론을 이용하여 데이터 분석을 시도하였기에, TV 드라마와 같이 예측할 수 없는 변화를 보여주는 스트림 데이터에 적용하기에는 어려움이 많았다. 이와 같은 단점을 극복하기 위해 우리는 주어진 동영상을 단일 모달리티의 채널로 분할한 후 각 채널 별로 분절화를 시도하고 각 채널의 분절 결과를 동적으로 결합하여 주어진 동영상에서의 의미 분절화를 근사하는 방법을 개발하였다. 제안 방법은 실제 TV 동영상의 의미 분절화에 적용되었으며 인간 평가자에 의한 의미 변화 구간과의 비교를 통해 그 성능을 확인하였다.

DEVS 형식론을 이용한 동적 스케쥴링 승강기 시뮬레이터의 구현 (Simulation of a Dynamic Scheduling Elevator System using the DEVS formalism)

  • 권성환
    • 한국시뮬레이션학회:학술대회논문집
    • /
    • 한국시뮬레이션학회 1999년도 추계학술대회 논문집
    • /
    • pp.163-168
    • /
    • 1999
  • 본 논문에서는 다수의 승강기들이 서로 협력하여 운영되는 대형 고층 빌딩의 승강기 시스템에 대해서 DEVS 형식론을 이용하여 모델링하고 시뮬레이션한다. 다수의 독립적으로 운영되는 승강기로 이루어진 기존의 승강기 시스템과는 달리, 제안된 시스템에서는 사용자의 요구에 따라 승강기의 스케쥴이 생성, 변경, 삭제되는 동적 스케쥴링 기능을 갖도록 하였다. 제안된 시스템은 승강기 시스템을 나타내는 ELEVATOR 모델과 시뮬레이션 수행에 필요한 실험장치인 EF 모델로 구성된다. ELEVATOR 모델은 빌딩을 나타내는 BUILD 모델, 승강기를 나타내는 ELEV 모델과 각 승가기의 스케쥴을 다이나믹하게 제어하는 SCHED 모델로 구성된다. EF 모델은 실험용 데이터를 생성하는 GENR 모델, 이동하는 승객의 데이터를 추적하고 결과를 수집하는 TRANSD 모델로 구성된다. 모델링된 시스템의 시뮬레이션을 위해 DEVSim++를 이용하여 구현하였다. DEVSim++는 DEVS 형식론을 C++로 구현한 것이다. 시뮬레이션을 통하여 제안된 시스템의 효율, 수행 시간을 기존의 승강기 시스템과 비교, 분석하였다.

  • PDF

이벤트 스테이트 모델링(Event &State Modeling) 기법을 활용한 HMI(Human- Machine Interface) 제품 디자인 및 응용 사례 연구

  • 배석훈
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 2002년도 추계학술발표논문집
    • /
    • pp.482-486
    • /
    • 2002
  • 본 논문에서는 기능성 보유 제품에 대한 사용자의 편의성과 효율성을 배려한 인터페이스 제작 기술 고찰의 일환으로 이벤트 스테이트 모델링(Event& State Modeling) 기법을 활용한 HMI (Human -Machine Interface) 모델링의 방법론을 소개하고자 한다. 이벤트 드리븐 형식으로 생성하는 모델 방법론, 스테이트를 기반으로 생성하는 모델링 방법론, 이 두 가지의 장점을 병합하여 개발된 PlayMo라는 저작도구의 이벤트 스테이트 모델 방법론을 분석하고 이를 기반으로 제품 기능 구현의 사실도(fidelity)가 어느 정도까지 가능한지를 제시하고자 한다. 이와 더불어 한 제품의 외관 디자인, 설계 및 정량적 유저 인터페이스(UI:User Interface) 측정의 방법을 사례를 중심으로 소개하고자 한다. 또한 이벤트 스테이트 모델링 방식으로 구성된 컨텐츠를 활용하여 인터랙션과 멀티미디어요소가 강화된 기존의 방식과는 차별화 된 전자 카탈로그, 전자 매뉴얼, 트러블 슈팅 등의 다양한 컨텐츠 활용방안을 제시하여 제품 기획 생산에서 분석 검증 및 마케팅활동, 고객 지원에 이르는 일련의 제품 생산 주기에 따른 데이터 활용 방안을 실제활용 사례를 중심으로 고찰하고자 한다.

  • PDF

Support Vector Machine의 입력데이터 오류에 대한 Robustness분석 (Robustness Analysis of Support Vector Machines against Errors in Input Data)

  • 이상근;장병탁
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2005년도 한국컴퓨터종합학술대회 논문집 Vol.32 No.1 (B)
    • /
    • pp.715-717
    • /
    • 2005
  • Support vector machine(SVM)은 최근 각광받는 기계학습 방법 중 하나로서, kernel function 이라는 사상(mapping)을 이용하여 입력 공간의 벡터를 classification이 용이한 특징 (feature) 공간의 벡터로 변환하는 것을 근간으로 한다. SVM은 이러한 특징 공간에서 두 클래스를 구분 짓는 hyperplane을 일련의 최적화 방법론을 사용하여 찾아내며, 주어진 문제가 convex problem 인 경우 항상 global optimal solution 을 보장하는 등의 장점을 지닌다. 한편 bioinformatics 연구에서 주로 사용되는 데이터는 측정 오류 등 일련의 오류를 포함하고 있으며, 이러한 오류는 기계학습 방법론이 어떤 decision boundary를 찾아내는가에 영향을 끼치게 된다. 특히 SVM의 경우 이러한 오류는 특징 공간 벡터간의 관계를 나타내는 Gram matrix를 변화로 나타나게 된다. 본 연구에서는 입력 공간에 오류가 발생할 때 그것이 SVM 의 decision boundary를 어떻게 변화시키는가를 대표적인 두 가지 kernel function, 즉 linear kernel과 Gaussian kernel에 대해 분석하였다. Wisconsin대학의 유방암(breast cancer) 데이터에 대해 실험한 결과, 데이터의 오류에 따른 SVM 의 classification 성능 변화 양상을 관찰하여 커널의 종류에 따라 SVM이 어떠한 특성을 보이는가를 밝혀낼 수 있었다. 또 흥미롭게도 어떤 조건 하에서는 오류가 크더라도 오히려 SVM 의 성능이 향상되는 것을 발견했는데, 이것은 바꾸어 생각하면 Gram matrix 의 일부를 변경하여 SVM 의 성능 향상을 꾀할 수 있음을 나타낸다.

  • PDF

XGBoost 기반 상수도관망 센서 위치 최적화 (Optimal Sensor Location in Water Distribution Network using XGBoost Model)

  • 장혜운;정동휘
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2023년도 학술발표회
    • /
    • pp.217-217
    • /
    • 2023
  • 상수도관망은 사용자에게 고품질의 물을 안정적으로 공급하는 것을 목적으로 하며, 이를 평가하기 위한 지표 중 하나로 압력을 활용한다. 최근 스마트 센서의 설치가 확장됨에 따라 기계학습기법을 이용한 실시간 데이터 기반의 분석이 활발하다. 따라서 어디에서 데이터를 수집하느냐에 대한 센서 위치 결정이 중요하다. 본 연구는 eXtreme Gradient Boosting(XGBoost) 모델을 활용하여 대규모 상수도관망 내 센서 위치를 최적화하는 방법론을 제안한다. XGBoost 모델은 여러 의사결정 나무(decision tree)를 활용하는 앙상블(ensemble) 모델이며, 오차에 따른 가중치를 부여하여 성능을 향상시키는 부스팅(boosting) 방식을 이용한다. 이는 분산 및 병렬 처리가 가능해 메모리리소스를 최적으로 사용하고, 학습 속도가 빠르며 결측치에 대한 전처리 과정을 모델 내에 포함하고 있다는 장점이 있다. 모델 구현을 위한 독립 변수 결정을 위해 압력 데이터의 변동성 및 평균압력 값을 고려하여 상수도관망을 대표하는 중요 절점(critical node)를 선정한다. 중요 절점의 압력 값을 예측하는 XGBoost 모델을 구축하고 모델의 성능과 요인 중요도(feature importance) 값을 고려하여 센서의 최적 위치를 선정한다. 이러한 방법론을 기반으로 상수도관망의 특성에 따른 경향성을 파악하기 위해 다양한 형태(예를 들어, 망형, 가지형)와 구성 절점의 수를 변화시키며 결과를 분석한다. 본 연구에서 구축한 XGBoost 모델은 추가적인 전처리 과정을 최소화하며 대규모 관망에 간편하게 사용할 수 있어 추후 다양한 입출력 데이터의 조합을 통해 센서 위치 외에도 상수도관망에서의 성능 최적화에 활용할 수 있을 것으로 기대한다.

  • PDF

한국 소프트웨어 기술혁신의 구조 변동

  • 최용진
    • 한국기술혁신학회:학술대회논문집
    • /
    • 한국기술혁신학회 2017년도 춘계학술대회 논문집
    • /
    • pp.619-619
    • /
    • 2017
  • 현대사회의 제품생산과 기업활동에서 소프트웨어의 중요성과 그 가치가 날로 높아져 가는 가운데 소프트웨어 기술혁신은 과거 소프트웨어 산업 영역에 국한되었던 비교적 작은 구조에서 이제는 다양한 산업 영역에서 다발적으로 일어나는 보다 넓은 구조로 변모하고 있다. 이 연구에서는 한국 출원인이 포함된 약 270만 건의 특허 메타데이터와 기업정보 데이터를 활용한 패널데이터를 구축하여 한국 산업계 전반에 걸쳐 일어나고 있는 소프트웨어 기술혁신의 구조 변동 현상을 밝혀내고, 이를 토대로 정부의 소프트웨어 산업 정책에 관한 함의를 도출하고자 한다. 이 연구는 다음의 네 부분으로 구성이 된다. 첫째, 최근 여러 분야에서 일어나고 있는 소프트웨어와 타 산업 간의 융합 현상과 이에 대한 이론적 논의를 전개한다. 둘째, 연구에 활용 할 데이터와 실증분석 방법론에 관하여 논의한다. 셋째, 패널분석을 기초로 한 실증분석을 수행하고, 그 결과를 제시한다. 넷째, 한국정부의 소프트웨어 산업 정책을 살펴보고, 이를 바탕으로 실증분석 결과가 지니는 함의에 관하여 논의한다.

  • PDF

소셜미디어 데이터를 활용한 중앙정부와 지방정부 간 지하공간의 주요 이슈 고찰 (Analysis of Issues on Underground Space between Central and Local Governments Utilizing Social Media Data)

  • 최해옥;백성준
    • 지적과 국토정보
    • /
    • 제46권1호
    • /
    • pp.75-86
    • /
    • 2016
  • 본 연구는 중앙정부와 지방정부 간 지하공간에 관한 주요 이슈를 파악하기 위해 소셜미디어 데이터를 활용하였다. 또한 이를 빅데이터 분석방법론을 통해 분석하였다. 연구방법론으로 사회네트워크분석의 키워드 네트워크 방법을 사용하였고 트위터를 통해 얻어진 텍스트 데이터를 텍스트마이닝 기법을 사용하여 분석하였다. 특히 지하공간은 2014년 잠실 싱크홀 사건 이후 사회적으로 관심을 가지고 있는 이슈로서 키워드 네트워크 분석을 통해 계량적으로 분석을 시도하였다. 네트워크의 속성을 파악하기 위해 중심성 지수, 그룹밀도 분석을 통해 지하공간과 관련된 이슈를 파악하였다. 이러한 분석 결과 중앙정부의 정책 관련 항목은 지자체 정책과 관련이 있음을 확인하였다. 중앙정부는 예방차원에서 특별법을 바탕으로 예방체계를 구축하여 지자체가 지하공간에 관련된 문제에 대해 대응 관리하도록 법에 근거한 예방체계를 구축하고 있다. 이와 같은 결과는 앞으로 중앙 정부가 연구관련 분야를 강화함으로써 지하공간 관련 안전대책을 구축하는 데 법과 기술이 서로 협력하여 발전해야 함을 시사해 준다.

데이터 엔지니어링 방법론을 기반으로한 네트워크 트래픽 분석 시스템 (Network Traffic Analysis System Based on Data Engineering Methodology)

  • 한영신;김태규;정재은;정찬기;이칠기
    • 한국시뮬레이션학회논문지
    • /
    • 제18권1호
    • /
    • pp.27-34
    • /
    • 2009
  • 현재 네트워크 사용자 특히 인터넷 사용자 증가 속도는 가히 기하급수적이라 할 수 있다. 더불어 질 높은 서비스에 대한 요구가 제기되고 있는데 이것은 필연적으로 트래픽의 폭증을 가져오고 있다. 따라서 네트워크 트래픽의 효율적 분석 관리는 과거에 비해 더욱 중요한 사항으로 대두되고 있다. SES를 이용한 네트워크 분석은 네트워크 관리자들에게 쉽고, 효율적으로 트래픽데이터를 접근이 가능하다. 따라서 본 연구의 목적은 대용량의 네트워크 트래픽 데이터 효과적으로 처리하기 위해 최적화된 네트워크 트래픽 시스템을 구현하기 위하여 데이터 엔지니어링 방법론인 SES를 이용하여 네트워크 패킷의 정보 구조를 설계한후 DEVS를 이용하여 분석하는 시스템을 구현하고자 한다.

수량-수질 연계 관리를 위한 온톨로지 기반 데이터베이스 메타데이터에 관한 연구 (Ontology-based multi-domain metadata for joint management of water quantity and quality)

  • 오정선
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2022년도 학술발표회
    • /
    • pp.456-456
    • /
    • 2022
  • 최근 정부에서 국내 물관리일원화를 추진함에 따라 수자원에 대한 양적, 질적, 파생적 기능의 통합적 관리를 위한 기술적 기반의 필요성이 제기되고 있다. 지금까지 국내에서는 하천, 호소 등 수자원에 대한 수질관리와 수량관리가 별도로 이루어지다보니, 수질 및 수량에 대해 관측지점, 관측시점 등이 모두 다른 실정이다. 상호 간 영향이 뚜렷한 수량 및 수질을 연계하여 관리하기 위해서는 수체 내 동일 지점에 대한 관측데이터 관리가 우선적으로 필요하다. 그러려면 수량-수질 연계 관리에 필요한 데이터 항목 및 관계 등의 설계가 중요하다. 즉, 데이터를 단순히 모아놓는 것이 아닌 효과적인 관리를 위한 빅데이터 큐레이션이 필요하다. 따라서 이러한 필요성에 근거하여 본 연구에서는 수량-수질 연계 관리가 가능한 데이터관리시스템을 구축하기 위해 온톨로지 기반 메타데이터를 설계 및 분석하고자 한다. 관계형 데이터베이스 구축을 위한 방법론으로는 먼저 수량 및 수질 도메인의 데이터 항목의 관계성을 분석하고 이를 바탕으로 온톨로지 기반의 메타데이터를 설정한다. 온톨로지를 활용하면 해당 도메인에서 데이터 간 관계성을 보다 분명하게 정의할 수 있다. 데이터를 클래스나 인스턴스에 정의하고, 각 데이터 간 관계를 속성에 정의한다. 또한 수량-수질 데이터 연계 관리 시 고려하여야 할 요소를 분석하여 제시한다. 이를 통해 수량-수질 데이터 연계 관리에 있어 온톨로지 기반 메타데이터의 적용성 및 효율성을 파악할 수 있을 것으로 기대된다.

  • PDF

소스-프리 도메인 적응 연구동향 (A Trend of Source-free Domain Adaptation)

  • 황의원
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2024년도 춘계학술발표대회
    • /
    • pp.888-890
    • /
    • 2024
  • 딥러닝의 발전으로 인공지능의 실세계 응용이 다방면으로 확대되고 있다. 하지만 학습에 사용된 소스 도메인 데이터와 테스트에 사용된 타겟 도메인 데이터 간의 분포 차이로 인해 모델의 성능이 크게 저하될 수 있다. 이를 극복하기 위해 도메인 적응 방법이 제안되었으나, 소스 도메인 데이터에 접근할 수 없는 경우 적용에 한계가 있다. 이에 대응하여 소스 데이터가 필요 없는 소스-프리 도메인 적응 기술과 실시간으로 적응하는 테스트 시간 적응 방법이 연구되고 있다. 본 논문은 최신 소스-프리 도메인 적응 및 테스트 시간 적응 방법의 동향을 파악하고 각 방법론의 기술적 특징을 분석하고자 한다.