• 제목/요약/키워드: 대용량 분류

검색결과 243건 처리시간 0.028초

유니버샬 데이터 압축의 최근의 연구동향 (Recent Trends of Universal Data Compression)

  • 박지환;진용옥
    • 한국통신학회논문지
    • /
    • 제16권10호
    • /
    • pp.901-913
    • /
    • 1991
  • 텍스트 데이터 중심의 컴퓨터 통신의 활성화와 멀티 미디어의 등장에 따른 영상 데이터의 추급은 대용량의 기억공간과 전송시간을 요구하게 되어 데이터 압축의 중요성이 더욱 크게 되었다. 정보원의 사전 지식을 전체로 하지 않고도 효율적인 압축을 달성하는 유니버샬 부호는 동일 알고리즘으로 다양한 데이터에 적용할수 있는 만능성을 갖는 적응성이 뛰어난 방식으로 최근 주목되고 있다. 이 논문에서는 유니버샬 부호의 기본원리와 분류를 통한 실현 알고\ulcorner\ulcorner\ulcorner六\ulcorner대하여 알아보고 그 응용을 중심으로 한 최근의 연구활동에 관하여 기술한다.

  • PDF

성능 향상을 위한 데이터 모델링 방법 (Data Modeling Methods for Performance Enhancement)

  • 김수연;이상호;서의호
    • 지능정보연구
    • /
    • 제4권2호
    • /
    • pp.85-102
    • /
    • 1998
  • 현재의 시스템 개발 프로젝트에서 대부분의 기업은 관계형 데이터베이스를 목표 환경으로 채택하고 있지만 설계자들은 기존의 파일 시스템이나 계층형 데이터베이스의 설계 방식을 관계형 데이터베이스 설계 시에도 그대로 적용하려는 경향이 있다. 또한 모델링 시 시스템 특성과는 무관한 업무 중심의 엔티티 관계도를 작성함으로써 구현 시에 모델을 상당 부분 변경하거나 추가해야 하는 오버헤드가 발생하기도 한다. 관계형 데이터베이스의 경우 구조를 어떻게 설계하느냐에 따라 효율의 차이가 크게 나타나므로 성능 향상을 위한 데이터 모델링 기법이 중요한 이슈로 등장하게 되었다. 본 논문에서는 관계형 데이터베이스 성능과 관련하여 이미 연구되고 실험된 내용을 여러 문헌과 자료를 참고하여 조사하였다. 성능 항상을 위한 모델링 기법들을 테이블, 릴레이션쉽, 인덱스 등의 객체별로 분류하여 정리하였고, 조사된 내용 중에서 몇 가지를 선택하여 Oracle DBMS 환경에서 실제로 실험을 실시하였다. 대용량 테이블에 대한 질의를 수행하여 소요되는 시간을 측정하고 그 결과를 분석하였다. 실험을 통해 검증된 결과를 토대로 제안되는 모델링 방법을 제시한다.

  • PDF

자율학습의 PCA를 이용한 얼굴인식 (Face Recognition by Using Principal Component Analysis of Unsupervised Learning)

  • 조용현;차주희
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2004년도 추계학술발표논문집(상)
    • /
    • pp.583-586
    • /
    • 2004
  • 본 논문에서는 자율학습의 속성을 가지는 주요성분분석을 이용한 얼굴인식 기법을 제안하였다. 이는 대용량의 입력 데이터를 통계적으로 독립인 특징들의 집합으로 변환시켜 중복신호를 제거하는 특성을 가지는 주요성분분석의 우수한 속성을 이용한 것이다. 제안된 기법을 Yale 얼굴영상 데이터베이스로부터 선택된 20개의 $320{\ast}243$ 픽셀의 영상을 대상으로 시뮬레이션한 결과, 주요성분의 개수에 따른 압축성능과 city-block, Euclidian, 그리고 negative angle(cosine)의 거리척도에 따른 인식에서의 분류성능에서 우수한 성능이 있음을 확인할 수 있었다.

  • PDF

Peer-to-Peer 환경에서 중복된 데이타의 갱신 전파 기법 (Update Propagation of Replicated Data in a Peer-to-Peer Environment)

  • 최민영;조행래
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2005년도 한국컴퓨터종합학술대회 논문집 Vol.32 No.1 (B)
    • /
    • pp.13-15
    • /
    • 2005
  • P2P(Peer-to-Peer) 시스템은 대용량의 데이타를 공유하는데 유용하며, 네트워크 구조에 따라 중앙 집중형, 구조적 분산형, 그리고 비구조적 분산형으로 분류된다. 이 중 Gnutella와 같은 비구조적 분산형 P2P 시스템은 확장성과 신뢰성 측면에서 장점을 갖지만, 참여하는 노드의 수가 증가함에 따라 원하는 자원을 액세스하는 비용도 증가하는 문제를 가진다. 데이터 중복을 이용해 이러한 문제를 해결할 경우 중복된 데이타들의 일관성 유지를 위한 기법이 필요하다. 본 논문에서는 특정 노드가 갱신한 데이타를 중복된 사본을 저장하고 있는 다른 노드에 전파하기 위한 하이브리드 push/pull 기반의 갱신 전파 기법을 제안한다.

  • PDF

대용량 분석 시스템을 이용한 교통 연구 검색 방법론에 관한 연구 (A Study on Traffic Research Retrieval Method using Large Capacity Analysis System)

  • 배진아;윤청
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2018년도 추계학술발표대회
    • /
    • pp.577-580
    • /
    • 2018
  • 지난 몇 년간 우리는 소셜 검색에 몰두하여 연관검색 및 소비자의 만족을 위해 빅데이터 분석을 하였다. 최근에는 빅데이터 분석이라는 흐름에 맞춰 기업 및 기관별 본연의 정보를 통합하여 효율적인 검색을 할 수 있도록 하는 솔루션을 대거 도입하고 있다. 또한 기업 및 기관에서 가지고 있는 정보는 기존 비정형 데이터로 방대하여 기존의 방법이나 도구로 수집 및 저장 분석이 어려운 실정이다. 이에 공공기관 및 민간기업 등에서는 키워드 중심의 다양한 검색엔진을 개발하거나 도입하고 있으며, 정보 분류의 확대, 메타데이터의 활용, 태그정보의 제공, 개인 맞춤형 서비스 등 고객의 만족도를 제고하기 위한 다양한 방법을 시도하고 있다. 본 연구에서는 기관의 교통 연구와 관련한 일련의 작업 중 행정문서, 연구정보, 유관기관 게시물 등의 통합 빅데이터를 가지고 검색시스템을 구현하였다. 이와 더불어 사용자 사전 및 동의어 사전을 통한 검색 키워드를 데이터베이스에 저장하여 검색 효율성을 제고하는 방안을 제시한다.

영상과 비디오로부터의 가상 시점 영상 생성 기술

  • 백형선;박인규
    • 방송과미디어
    • /
    • 제26권4호
    • /
    • pp.11-22
    • /
    • 2021
  • 실감형 미디어를 구성하기 위해서는 다시점 영상 또는 비디오들로 구성된 대용량의 콘텐츠가 필수적이다. 이러한 콘텐츠는 다량의 카메라들을 목적에 따라 배치하여 획득하므로 영상 구성의 복잡성과 콘텐츠의 크기가 급격히 커진다는 문제점을 갖고 있다. 3D 미디어 환경에서 카메라의 개수를 최소화하면서도 목적에 맞게 다양한 시점을 제공할 수 있는 가상시점 영상 생성은 핵심적인 기술이다. 본 기고문에서는 다시점 영상과 비디오로부터 학습 기반의 가상 시점 영상 생성 연구들에 대해 체계적인 조사를 통해 그 결과를 다음과 같이 제시한다. 첫째, 가상 시점 영상 생성에 대한 배경 개념을 정의한다. 둘째, 제안하는 분류 방식에 따라 기존의 제안된 방법들을 상세하게 분석한다. 셋째, 가상 시점 영상 생성에 주로 사용되는 관련 데이터셋을 조사한다. 마지막으로는 각 연구들이 갖고 있는 특징들을 분석하고, 정량적, 정성적 평가 결과를 비교한다.

다수 형태소 분석 결과를 활용한 표준 말뭉치 반자동 구축 (Korean Linguistic GS Set Semi-Automatic Construction using Multiple POS taggers)

  • 김태영;류법모;김한샘;오효정
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2019년도 제31회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.481-484
    • /
    • 2019
  • 최근 한국어 정보처리를 위한 대용량 언어분석 표준 말뭉치(GS:Gold Standard Set)를 구축하고 이를 공유·확산하기 위한 국가차원의 지원이 이뤄지고 있다. 본 연구는 이러한 사업의 일환으로, 현재 국내에서 개발된 다양한 한국어 언어분석 모듈을 활용하여 공통 정답셋을 구축하기 위한 방법론을 제시하고자 한다. 특히, 대량의 학습셋을 구축하기 위해 다수의 모듈(N-modules)로부터 제시된 후보 정답을 참조, 오류 형태를 분류하여 주요 유형을 반자동으로 보정함으로써 수작업을 최소화하였다. 본 연구에서는 우선 첫 단계인 형태소 분석 모듈 적용 결과를 토대로 표준 말뭉치를 구축한 결과에 대해 논하고자 한다.

  • PDF

메타 러닝과 방법론 연구 동향 (A Survey on Methodology of Meta-Learning)

  • 지훈;이연준
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2023년도 춘계학술발표대회
    • /
    • pp.665-666
    • /
    • 2023
  • 딥러닝은 인간이 탐지하기 어려운 데이터의 특징 및 패턴을 인지하고, 이들을 학습하여 데이터를 분류 및 예측할 수 있는 기술이다. 그러나 딥러닝 모델을 잘 학습시키기 위해서는 고품질의 대용량 데이터와 이들을 처리할 수 있는 방대한 컴퓨터 자원이 요구되는 것이 일반적이다. 따라서 소량의 데이터만이 존재하는 분야나 컴퓨터 자원이 한정되어 있는 상황에서는 딥러닝을 적용하기 어렵다. 본 논문에서는, 소량의 데이터로도 모델을 자신들의 태스크에 맞게 최적화시킬 수 있는 메타러닝에 대해 소개하고, 메타 러닝 기법들의 방향에 따른 Metric-Based, Model-Based 및 Optimization 기반 모델들에 대해 소개하고, 앞으로 나아가야 할 연구 방향에 대해 제시한다.

SOM을 적용한 선택적 샘플링에 관한 연구 (A Study on Selective Sampling using SOM)

  • 김만선;양형정;김정식;김선희
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2007년도 추계학술발표대회
    • /
    • pp.38-41
    • /
    • 2007
  • 데이타 마이닝을 위하여 수집된 대용량의 데이타를 여과 없이 기계학습에 적용하는 것은 많은 시간과 비용이 요구될 뿐만 아니라 저장 공간면에서도 비효율적이다. 선별적 샘플링은 이러한 상황에서 매우 효율적으로 적용할 수 있도록 원본 데이타의 특성을 가능한 반영하여 새로운 훈련 데이타를 생성하는 방법이다. 본 연구에서는 신경망의 하나인 SOM을 적용한 선별적 샘플링을 수행하는데 있어서 여러 가지 선택 문제를 효과적으로 해결하기 위한 실험을 수행한다. 실험 결과로는 두 가지 결과를 얻었다. 1) 충분한 맵 사이즈를 선택해야 학습 데이타의 함축적인 특성을 잘 반영한다, 2) 선택적 샘플링을 위한 유닛선택 방법에서는 의미없는 유닛을 제거함으로서 분류 성능향상을 얻을 수 있다.

Unity 3D 엔진을 활용한 강우레이더 자료 시각화 프로토타입 개발 (Development of the Visualization Prototype of Radar Rainfall Data Using the Unity 3D Engine)

  • 최형욱;강수명;김경준;김동영;정윤재
    • 한국지리정보학회지
    • /
    • 제18권4호
    • /
    • pp.131-144
    • /
    • 2015
  • 본 연구에서는 Unity 3D를 활용한 강우레이더 관측정보 시각화 시스템 프로토타입 구축에 관 해 서술하였다. 레이더 정보의 효율적 가시화를 통한 사용자 정보제공을 위해서는 지형정보와의 융합이 필수적이다. 하지만 방대한 양의 레이더 관측정보와 대용량 지형정보를 매쉬업하여 서비스 하는 것은 데이터 처리에 있어 과부하가 발생하여 서비스 수준이 낮아지는 경향이 있다. 특히 위 성영상, DEM 등을 활용한 3차원 지형정보는 그 자체만으로도 대용량 정보로 분류되고 있어서 신 속한 서비스 구현을 위해 비교적 용량이 가벼운 2차원 정보를 활용하는 것이 일반적이다. 본 연구 는 이러한 부분을 개선하고자 최근 모바일 게임분야에서 활발히 활용중인 Unity 3D 엔진을 사용 하였다. 또한, 대용량 위성이미지 분할기법, 이미지 텍스쳐 Layer 매쉬업 기법 등을 고안하여 3차 원 지형기반으로 서비스 할 수 있는 시각화 시스템 프로토타입을 구축하였다. 본 프로토타입 구축 을 통해 향후 전 국토에 분포된 기상관측 레이더 네트워크망 데이터를 입체적 지형 기반의 직관적 정보로 제공함으로써 강우와 관련된 방재업무 분야에 효율적 활용이 가능할 것으로 기대한다.