• 제목/요약/키워드: 대용량 분류

검색결과 243건 처리시간 0.043초

대용량 경로데이터 분류에 기반한 경험적 최선 경로 추천 (Recommendation of Best Empirical Route Based on Classification of Large Trajectory Data)

  • 이계형;조영훈;이태호;박희민
    • 정보과학회 컴퓨팅의 실제 논문지
    • /
    • 제21권2호
    • /
    • pp.101-108
    • /
    • 2015
  • 위치를 수집할 수 있는 모바일 기기의 확산에 따라 다양한 위치기반서비스들이 개발되어 사용되고 있다. 본 논문에서는 위치기반서비스가 일반화됨에 따라 수집되고 저장되는 경로 데이터의 양이 기하급수적으로 커지고 결국 빅데이터가 될 것이기 때문에 수집된 대용량 경로데이터에서 최선 경로를 찾아 추천해주는 시스템을 제안한다. 대용량 경로 데이터에서 실제 운행 시간 등의 정보를 바탕으로 기존 내비게이션보다 좋은 경로를 추천할 수 있게 된다. 대용량 경로 데이터 처리를 위해 하둡 맵리듀스를 이용해서 분류하고 분류된 경로를 데이터베이스에 저장하여 사용자의 요청에 빠르게 반응할 수 있도록 하였다. 사용자의 요청에 지도상의 최단 경로가 아닌 수집된 경로 기록을 바탕으로 최선 경로를 찾게 되는 것이다. 구현된 전체 시스템은 1) 실제 경로를 수집하기 위한 안드로이드 응용프로그램, 2) 하둡 맵리듀스를 이용해 수집된 경로를 미리 분류해 놓기 위한 분류 엔진, 3) 사용자의 출발지-도착지 요청에 따라 분류된 경로에서 최선 경로를 찾아 사용자에게 돌려주는 웹서버와 안드로이드 클라이언트 서비스 시스템이다. 실제운행 실험을 제안한 방법과 시스템이 실효성이 있음을 보인다.

어휘정보와 명사의미정보를 이용한 사용자 질의문장 분석 (Question Analysis using Lexico Information and Noun Semantic Information)

  • 정규철;서영훈
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2003년도 추계종합학술대회 논문집
    • /
    • pp.185-189
    • /
    • 2003
  • 고성능의 질의 응답 시스템을 구현하기 위해서는 질의 유형 분류기의 성능이 중요하다. 본 논문에서는 복잡한 분류규칙이나 대용량의 사전 정보를 이용하지 않고 질의문에서 의문사에 해당하는 어휘들을 이용하여 질의 유형을 결정하고, 의문사 주변에 출현하는 명사들의 의미 정보를 이용하여 세부적인 정답유형을 결정할 수 있는 질의 유형분류기를 제안한다. 의문사에 해당하는 어휘가 생략된 경우는 질의문의 마지막 어절의 의미 정보를 이용하여 질의유형을 분류한다. 의문사 주변의 명사들이 마지막 어절에 출현하는 명사들에 대해 동의어 정보와 접미사 정보를 이용하여 질의 유형 분류의 성능을 향상시킨다. 본 논문에서 제안한 시스템은 질의 유형에 대한 분류는 97.4%의 정확도를 보였다.

  • PDF

탐색공간 최적화를 통한 시그니쳐기반 트래픽 분석 시스템 성능향상 (Performance Improvement of Signature-based Traffic Classification System by Optimizing the Search Space)

  • 박준상;윤성호;김명섭
    • 인터넷정보학회논문지
    • /
    • 제12권3호
    • /
    • pp.89-99
    • /
    • 2011
  • 인터넷에 기반한 응용 프로그램의 종류와 네트워크 대역폭이 증가하면서 페이로드 시그니처 기반 트래픽 분류 시스템에서 처리하는 데이터의 양이 급격하게 증가하고 있다. 대용량 트래픽 데이터에 대한 처리 속도를 향상시키기 위한 방법으로 다양한 패턴 매칭 알고리즘이 제안되고 있다. 하지만 비약적으로 늘어나는 시그니처의 수와 트래픽 양에 비해 패턴 매칭 알고리즘의 성능 향상 속도는 한정적이고, 입력데이터의 특성에 의존적인 성능을 나타낸다. 따라서 본 논문에서는 분류 시스템의 입력 데이터로 제공되는 트래픽 데이터와 시그니처의 탐색 공간을 최적화할 수 있는 분류, 시스템 구조를 제안한다. 또한 제안하는 분류 시스템을 학내 망에서 발생하는 대용량의 트래픽에 실시간으로 적용하여 그 타당성을 증명한다.

생체 신호의 특징 추출 및 SVM을 이용한 분류 (Feature Extraction and Classification using SVM for Biomedical Signal)

  • 김만선;이상용
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 가을 학술발표논문집 Vol.30 No.2 (1)
    • /
    • pp.181-183
    • /
    • 2003
  • 최근 대용량의 데이터베이스로부터 유용한 정보를 발견하고 데이터간에 존재하는 연관성을 탐색하고 분석하는 데이터 마이닝에 관한 많은 연구들이 진행되고 있다. 다양한 생체 신호를 분석하기 위하여 데이터 마이닝 기법을 이용할 수 있다. 본 논문에서는 심전도 신호의 패턴을 분류하기 위하여 신경망 기법을 적용하였다. 최근 패턴분류에 있어서 각광을 받고 있는 SVM 모델은 학습과정에서 얻어진 확률분포를 이용하여 의사결정함수를 추정한 후 이 함수에 따라 새로운 데이터를 이원분류 하는 것으로 분류 문제에 있어서 일반화 기능이 매우 높다. 기존에 많이 이용되던 BP 모델과 비교평가 하였다.

  • PDF

자연어 질의 유형판별과 응답 추출을 위한 어휘 의미체계에 관한 연구 (A Study on Word Semantic Categories for Natural Language Question Type Classification and Answer Extraction)

  • 윤성희
    • 한국산학기술학회:학술대회논문집
    • /
    • 한국산학기술학회 2004년도 추계학술대회
    • /
    • pp.141-144
    • /
    • 2004
  • 질의응답 시스템이 정보검색 시스템과 다른 중요한 점은 질의 처리 과정이며, 자연어 질의 문장에서 사용자의 질의 의도를 파악하여 질의 유형을 분류하는 것이다. 본 논문에서는 질의 주-형을 분류하기 위해 복잡한 분류 규칙이나 대용량의 사전 정보를 이용하지 않고 질의 문장에서 의문사에 해당하는 어휘들을 추출하고 주변에 나타나는 명사들의 의미 정보를 이용하여 세부적인 정답 유형을 결정할 수 있는 질의 유형 분류 방법을 제안한다. 의문사가 생략된 경우의 처리 방법과 동의어 정보와 접미사 정보를 이용하여 질의 유형 분류 성능을 향상시킬 수 있는 방법을 제안한다.

  • PDF

직선 운동형 직류전동기의 분류, 응용사례 및 개발동향

  • 백수현
    • 전기의세계
    • /
    • 제39권9호
    • /
    • pp.12-17
    • /
    • 1990
  • LDM의 분류와 응용 사례를 다루는데 제한된 지면사정 등으로 아쉬운 점이 많이 남는다. LDM의 개발 및 응용은 OA용, 측정 및 미소이동용 기구로서의 소형에서 부터 선박추진용 초전도기, 레일건 등의 특수용도의 대용량에 이르기까지 매우 다양한 형태로서의 진전이 예상된다. 특히, 선진 외국에서의 이 분야에 대한 지대한 관심과 엄청난 연구개발 상황에 비해 국내의 실정이 너무 미약하다는 생각을 하며 이 분야에 대한 흥미와 연구개발의 노력을 아끼지 않는 연구자가 많이 나와야 겠다.

  • PDF

캐시 및 선반입 정책 결정을 위한 액세스 패턴 분류 방법 (A method of access pattern classification for decision of caching and prefetching policies)

  • 석성우;김재열;서대화
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 가을 학술발표논문집 Vol.27 No.2 (3)
    • /
    • pp.38-40
    • /
    • 2000
  • 대용량 데이터 베이스, 멀티미디어 서버, 복잡한 과학 기술계산 등의 대용량의 데이터를 처리해야 하는 응용이 증가하고 있다. 이에 따라 파일 서비스의 속도를 높이기 위한 연구가 다방면에서 진행되고 있다. 파일 서비스 속도를 결정하는 중요한 두 부분 중의 하나인 액세스 시간개선을 위해서 좀더 효율적인 캐시, 선반입을 수행하기 위한 선수작업으로써 액세스 패턴을 실시간으로 분석하여 특징을 추출하고 관리하는 방법을 연구하였다.

  • PDF

지문분류 기술 동향 분석 (Technical Trend Analysis of Fingerprint Classification)

  • 정혜욱;이승
    • 한국콘텐츠학회논문지
    • /
    • 제17권9호
    • /
    • pp.132-144
    • /
    • 2017
  • 대용량 지문 데이터베이스를 사용하는 지문인식 시스템에서 처리 속도와 정확성을 높이기 위해서는 지문을 클래스별로 카테고리화하는 지문분류 기술을 사용해야 한다. 지문분류 방법은 지문 융선으로부터 특징을 추출하고 지문 융선의 흐름과 형상에 따라 정의되어 있는 클래스를 기준으로 학습 및 추론 기법을 이용하여 분류한다. 기존에는 종이에 회전 날인하여 습득된 NIST 데이터베이스를 이용한 연구가 많이 수행되었지만, 지문인식 입력 센서를 이용한 자동화된 시스템이 보편화됨에 따라 FVC에서 공개한 지문 데이터와 같이 센서로부터 입력된 지문 이미지를 이용한 연구가 증가하고 있으며, 최근에는 딥러닝을 이용한 지문분류 방법이 제안되고 있다. 본 논문에서는 지문분류를 위한 특징 추출 및 분류 기술의 동향을 살펴보고 분류성능을 비교한다. 또한 센서 기반 지문 이미지의 다양한 품질을 고려한 지문분류 기술 연구의 필요성에 대하여 정리하고, 딥러닝 기술을 적용한 지문분류 방법을 분석해 봄으로써 지속적으로 사용이 증가되고 있는 대용량 지문 데이터베이스의 분류 기술 연구에 대한 성능향상에 보탬이 되고자 한다.

대용량 문서분류에서의 비선형 주성분 분석을 이용한 특징 추출 (Feature Selection with Non-linear PCA in Text Categorization)

  • 신형주;장병탁;김영택
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1999년도 가을 학술발표논문집 Vol.26 No.2 (2)
    • /
    • pp.146-148
    • /
    • 1999
  • 문서분류의 문제점 중의 하나는 사용하는 데이터의 차원이 매우 크다는 것이다. 그러므로 문서에서 필요한 단어만을 자동적으로 추출하여 문서데이터의 차원을 축소하는 작업이 문서분류에서는 필수적이다. DF(Document Frequency)는 문서의 차원축소의 대표적인 통계적 방법 중 하나인데, 본 논문에서는 문서의 차원축소에 DF와 주성분 분석(PCA)을 비교하여 주성분 분석이 문서의 차원축소에 적합함을 실험적으로 보인다. 그리고 비선형 주성분 분석(nonlinear PCA) 방법 중 locally linear PCA와 kenel PCA를 적용하여 비선형 주성분 분석을 이용하여 문서의 차원을 줄이는 것이 선형 주성분 분석을 이용하는 것 보다 문서분류에 더 적합함을 실험적으로 보인다.

  • PDF

대용량 데이터를 처리하기 위한 TFP-tree 기반의 점진적 빈발 패턴 마이닝 기법 (TFP-tree based Incremental Frequent Patterns mining Method for Handling Large Data Set)

  • 이종범;;신진호;류근호
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2009년도 추계학술발표대회
    • /
    • pp.761-762
    • /
    • 2009
  • 이 논문에서는 점진적 마이닝 기법을 사용하여 대용량 전력 사용량 데이터로부터 빈발 패턴들을 찾아내고, 빈발 패턴들을 기반으로 하여 분류 작업을 효과적으로 완성하는데 목적을 두고 있다. 이를 위하여 본 논문에서는 TFP-tree를 기반으로 하는 점진적 빈발 패턴 마이닝 기법 및 분류 알고리즘에 대해서 설명한다.