• 제목/요약/키워드: Data Scientists

검색결과 3,357건 처리시간 0.026초

주성분 분석을 위한 새로운 EM 알고리듬 (New EM algorithm for Principal Component Analysis)

  • 안종훈;오종훈
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 봄 학술발표논문집 Vol.28 No.1 (B)
    • /
    • pp.529-531
    • /
    • 2001
  • We present an expectation-maximization algorithm for principal component analysis via orthogonalization. The algorithm finds actual principal components, whereas previously proposed EM algorithms can only find principal subspace. New algorithm is simple and more efficient thant probabilistic PCA specially in noiseless cases. Conventional PCA needs computation of inverse of the covariance matrices, which makes the algorithm prohibitively expensive when the dimensions of data space is large. This EM algorithm is very powerful for high dimensional data when only a few principal components are needed.

  • PDF

오류 데이터로부터의 데이터 품질 메트릭의 정립 (Establishing Data Quality Metric from Dirty Data)

  • 김수경;최병주
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 가을 학술발표논문집 Vol.27 No.2 (1)
    • /
    • pp.409-411
    • /
    • 2000
  • 소프트웨어 제품의 품질을 보증하는 일은 매우 중요하며, 국제 표준인 ISO/IEC9126은 소프트웨어 품질 특성 및 측적 메트릭 표준을 제공하고 있다. 이때 ISO/IEC 9126에서는 소프트웨어를 프로그램, 절차, 규칙 및 관련문서로 한정하고 있기 때문에 데이터의 품질에는 적용할 수 없다. 본 논문에서는 데이터 품질 평가 및 제어를 위하여 오류 데이터 형태를 분류하고, 이를 기반으로 데이터 품질 특성을 추출한다. 추출된 데이터 품질 특성을 측정하기 위해, 오류 데이터를 품질 속성으로 하는 데이터 품질 특성을 추출한다. 본 논문에서 제시하는 데이터 품질 메트릭은 지식 공학(knowledge engineering) 시스템이 최종 사용자에게 제공하는 데이터나 지식의 품질 측정 및 제어에 기준이 된다.

  • PDF

정신지체인을 위한 Multimedia 비언어성직업적성검사 시스템 개발 (Development of Reading -Free Vocational Interest Inventory for Mental Retardation)

  • 김남행;심임섭
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1998년도 가을 학술발표논문집 Vol.25 No.2 (2)
    • /
    • pp.688-690
    • /
    • 1998
  • 직업 선택의 과정에 있어 능력, 적성만큼 중요시 해야 할 것은 그 직업에 대해 흥미도이다. 특히 장애인들의 경우 직업을 준비하는 단계에서부터 어느 영역에 직업적 흥미가 있는가를 파악해야 하는 일은 중요하다. Text, Audio/Voice, Image등 멀티미디어 data를 이용, 흥미와 주의 집중을 높혀 직업적 흥미영역에 대한 정확한 data를 얻을 수 있는 시스템 개발이 필요하다.

  • PDF

다채널 뇌파 분류를 위한 주성분 분석 기반 선형동적시스템 (PCA-based Linear Dynamical Systems for Multichannel EEG Classification)

  • Lee, Hyekyoung;Park, Seungjin
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 가을 학술발표논문집 Vol.29 No.2 (2)
    • /
    • pp.232-234
    • /
    • 2002
  • EEG-based brain computer interface (BCI) provides a new communication channel between human brain and computer. The classification of EEG data is an important task in EEG-based BCI. In this paper we present methods which jointly employ principal component analysis (PCA) and linear dynamical system (LDS) modeling for the task of EEG classification. Experimental study for the classification of EEG data during imagination of a left or right hand movement confirms the validity of our proposed methods.

  • PDF

데이터 오류에서 추출한 데이터 품질 특성 (Extraction of Data Quality Characteristics from Dirty Data)

  • 김수경;최병주
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 봄 학술발표논문집 Vol.27 No.1 (A)
    • /
    • pp.549-551
    • /
    • 2000
  • 소프트웨어 제품의 품질을 보증하는 일은 매우 중요하며, 국제표준인 ISO/IEC 9126은 소프트웨어 품질 및 특성 및 측정 메트릭 표준을 제공하고 있다. 이때 ISO/IEC 9126에서는 소프트웨어를 프로그램, 절차, 규칙 및 관련문서로 한정하고 있기 때문에 데이터의 품질에는 적용할 수 없다. 본 논문에서는 데이터 품질 평가 및 제어를 위하여 데이터 오류 형태를 분류하고, 이를 기반으로 데이트 품질 특성 및 부특성을 분류한다. 데이터 품질 특성 분류는 ISO/IEC 9126에 정의한 소프트웨어 품질 특성을 데이터 오류 형태에 대응시켜 추출한다. 본 논문에서 제시하는 데이트 품질특성 분류는 지식 공학(knowledge engineering)시스템이 최종 사용자에게 제공하는 데이터나 지식의 품질 측정 및 제어에 기준이 된다.

  • PDF

Multimedia Data를 위한 병렬 파일 시스템 (Parallel File System for Multimedia Data)

  • 박시용;석창규;박성호;김영주;정기동
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 봄 학술발표논문집 Vol.27 No.1 (A)
    • /
    • pp.600-602
    • /
    • 2000
  • 본 논문에서는 여러 개의 디스크를 클러스트화한 메시지 전송 기반의 병렬 멀티미디어 파일 시스템(PMFS: Parallel Multimedia File System)을 제안하고 설계, 구현하였다. 본 논문에서 구현한 PMFS는 이식성, 유연성 그리고 확장성을 고려한 멀티미디어 데이터를 지원하는 병렬 파일 시스템으로 2계층 분산 클러스트 구조에 적합하다. 그리고 제어 메시지와 TCP를 기반으로 서버들간에 통신을 하고 다양한 방법의 데이터 배치 기법을 제공한다. PMFS의 성능 평가 결과 데이터들이 임의 시작 블록과 DIS배치 기법으로 저장된 경우 가장 좋은 성능을 보였다.

  • PDF

PC와 스마트폰 사이의 데이터 전송을 위한 클립보드 공유 (Sharing a clipboard between a personal computer and a smartphone for data transfer)

  • 여세환;김정선
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2011년도 한국컴퓨터종합학술대회논문집 Vol.38 No.1(D)
    • /
    • pp.79-81
    • /
    • 2011
  • 최신 스마트폰 사용자가 급격하게 늘어남에 따라 PC와 스마트폰을 동시에 사용하는 이용자도 많아지고 있다. 이러한 경우에 글이나 그림을 PC와 스마트폰 data를 주고 받아야 하는 상황이 자주 발생한다. 하지만 데이터를 전송하는 방법이 불편하고 오래 걸린다. 따라서 본 논문에서는 Pc와 스마트폰의 서로의 클립보드를 공유하는 애플리케이션을 설치하여 dat를 쉽고 빠르게 보내는 방법을 제안하고자 한다.

MLE를 이용한 하이브리드 화자 적응 (Hybrid Speaker Adaptation using Maximum-Likelihood Estimation)

  • 표현아;김세현;오영환
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 가을 학술발표논문집 Vol.29 No.2 (2)
    • /
    • pp.268-270
    • /
    • 2002
  • 최근 음성 인식 시스템의 성능 향상을 위해 화자 적응 (speaker adaptation)에 대한 연구가 활발히 진행되고 있다. HMM 기반 인식 시스템의 모델 파라미터를 수정하는 화자 적응의 경우, MAP방법과 MLLR 방법에 대한 연구가 주류를 이루고 있다. 두 방법은 adaptation data의 양에 따라서 서로 다른 성능을 보인다. 본 논문에서는 기존 두 방법을 Maximum-likelihood Estimation(MLE)를 이용하여 화자 적응을 수행하는 방법을 제안한다. 제안한 방법을 KAIST 통신연구실에서 구축한 한국어 도시이름 500단어 인식 시스템에 적용하여 adaptation data의 양에 상관없이 항상 높은 성능을 나타냈으며, 기존의 방법에 대해서 최고 4.37%의 인식률 향상을 보였다.

  • PDF

데이터 웨어하우스에서 계층화 구조를 이용한 시간 데이터의 지원 (Supporting temporal data using the layered architecture in a Data Warehouse)

  • 신영옥;백두권;류근호
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1998년도 가을 학술발표논문집 Vol.25 No.2 (1)
    • /
    • pp.389-391
    • /
    • 1998
  • 데이터 웨어하우스에서는 시간에 따라 변화되는 데이터를 관리함으로써 좀더 정확하게 요약화된 정보를 제공할 수 있다. 거의 모든 데이터 웨어하우스는 원시 데이터로 관계형 데이터베이스를 사용하지만, 관계형 데이터베이스는 시간 데이터에 대해 실제적인 지원을 하지 않는다. 그러므로 시간 변이 데이터에 대한 정확한 정보를 얻기가 어렵다. 본 논문에서는 이러한 시간 변이 데이터의 지원이 가능한 시간지원 데이터 웨어하우스를 설계하고자 한다. 이를 위해, 기존의 데이터 웨어하우스에서 원시 데이터로 사용하는 관계형 데이터베이스에 시간지원질의 처리 계층을 결합하는 방법을 보이고, 시간지원 데이터의 간격 시간에 대한 요약화 방법으로 시간지원 집계 트리 전략을 소개한다.

자료구조 및 알고리즘의 시각화를 위한 컴포넌트 (Component for Animation on Data Structure and Visualization on Algorithm)

  • 송병욱;민수정;김상욱
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 가을 학술발표논문집 Vol.27 No.2 (2)
    • /
    • pp.284-286
    • /
    • 2000
  • 본 논문에서는 컴퓨터 교육을 위한 자료구조나 알고리즘의 특성을 이해시키기 위한 시각적인 애니메이션을 지원하는 ADVA(Animation on Data Structure and Visualization on Algorithm)의 개발에 사용된 컴포넌트를 제시하고 이의 구조와 기능을 설명한다. 이 컴포넌트는 각 자료 구조와 알고리즘의 시각 표현에서 요구되는 공통된 기능들을 지원하는 객체이다. 이는 재사용성을 증가시켜 ADVA의 제작을 용이하게 하고 표현의 통일성을 높여서 향상된 학습 효과를 얻을 수 있다.

  • PDF