• 제목/요약/키워드: 속성분류

검색결과 863건 처리시간 0.023초

하둡 환경에 적합한 클러스터 그룹 기반 속성 정보를 이용한 빅 데이터 관리 기법 (Big Data Management Scheme using Property Information based on Cluster Group in adopt to Hadoop Environment)

  • 한군희;정윤수
    • 디지털융복합연구
    • /
    • 제13권9호
    • /
    • pp.235-242
    • /
    • 2015
  • 소셜 네트워크 기술이 발달하면서 빅 데이터 서비스에 대한 관심이 증가하고 있다. 그러나, 중앙 서버가 아닌 분산 서버에 저장된 데이터를 손쉽게 검색 및 추출하기 위한 기술은 부족한 실정이다. 본 논문에서는 빅 데이터 서비스를 제공하는 컨텐츠 서버와 관리 서버에서 사용자가 원하는 정보의 처리시간을 최소화하기 위한 빅 데이터 관리 기법을 제안하다. 제안 기법은 빅 데이터의 종류, 기능, 특성에 따라 데이터를 그룹으로 분류한 후 분류된 그룹내 데이터를 속성정보와 연계하여 해쉬체인에 적용한다. 또한, 분산 서버에 저장된 데이터를 최단 시간에 추출하기 위해서 데이터 인덱스 정보(DII, Data Index Information)를 그룹화하여 데이터에 부여된 다중의 속성 정보를 분류하여 데이터의 처리 속도를 향상시킨다. 실험 결과, 클러스터 그룹 수에 따른 데이터의 평균 검색 시간은 평균 14.6% 향상되었고, 키워드 수에 따른 데이터 처리시간은 평균 13% 단축되었다.

러프 소속 함수를 이용한 수치 속성의 이산화와 근사 추론 (Discretization of Numerical Attributes and Approximate Reasoning by using Rough Membership Function))

  • 권은아;김홍기
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제28권4호
    • /
    • pp.545-557
    • /
    • 2001
  • 본 논문에서는 저장 데이타베이스의 정보 시스템을 정제하여 이해 가능한 정보로 전환하고 새로운 객체를 근사 추론할 수 있도록 하기 위해 러프 소속 함수 값의 개념을 도입한 계층적 근사 분류 알 고리즘을 제안한다. 제안하는 알고리즘은 근사 추론의 한 방법인 퍼지 추론 방법의 언어적 불확실성을 속 성의 퍼지 소속 함수 값으로 나타내고 조건 속성의 소속 함수 값의 합성에 의해 근사 추론하는 방법을 이용하였으며 퍼지 소속 함수 값 대신에 러프 소속 함수 값을 이용하도록 제안하였다. 이는 퍼지 소속 함 수 값을 이용하여 괴지 규칙을 생성하는 과정을 생략할 수 있는 장점이 있다. 또한 정보 시스템 내의 속 성 중에서 수치 속성에 대한 이산화 방법을 연구하고 이것 또한 러프 소속 함수 값과 정보이론의 무질서 도의 개념을 이용한 수치 속성의 이산화를 제안하였다. 제안된 알고리즘을 이용하여 패턴 분류 문제에 교 준적으로 사용되는 IRIS 데이타에 대한 실험결과96%~98% 분류율을 나타냈으며 다른 실험 데이타에서 도 기존 알고리즘과 비교하여 수치 이산화나 근사 추론 모두 우수함을 보였다.

  • PDF

퍼지 규칙기반 분류시스템에서 퍼지 분할의 선택방법 (Selection Method of Fuzzy Partitions in Fuzzy Rule-Based Classification Systems)

  • 손창식;정환묵;권순학
    • 한국지능시스템학회논문지
    • /
    • 제18권3호
    • /
    • pp.360-366
    • /
    • 2008
  • 퍼지 규칙기반 분류 시스템에서 초기의 퍼지 분할은 주어진 데이터가 가진 속성들의 도메인을 고려함으로서 결정되어지고, 최적의 분류 경계면은 초기에 정의된 퍼지 분할의 파라미터들을 조정함으로서 찾을 수 있다. 본 논문에서는 학습과정들을 사용하지 않고 패턴분류의 성능을 최대화하기 위해 통계적 정보에 기반을 둔 퍼지 분할의 선택방법을 제안한다. 제안된 방법에서 통계적 정보는 주어진 수치적인 데이터로부터 각 입력 속성의 '불확실성 영역', 즉 패턴분류문제에서 분류 경계면이 결정되는 영역을 추출하기 위해 사용되었다. 또한 통계적인 정보에 의해서 생성된 퍼지 분할구간에 대응하는 후보 규칙들을 추출하기 위한 방법과 그 후보 규칙들 간의 커플링 문제를 최소화하기 위한 방법도 추가적으로 논의하였다. 실험에서는 제안된 방법의 효용성을 보이기 위해 IRIS와 New Thyroid Cancer 데이터를 사용한 기존 패턴분류 방법들과의 분류 정확성을 비교하였고, 그 결과들로부터 제안된 방법이 기존의 방법들보다 더 좋은 분류 정확성을 제공함을 확인할 수 있었다.

한국어 품사 분류에 대한 제안 (Study on the parts-of-speech in Korean)

  • 서민정
    • 한국인지과학회:학술대회논문집
    • /
    • 한국인지과학회 2002년도 춘계학술대회
    • /
    • pp.76-81
    • /
    • 2002
  • 인터넷의 발달 등으로 많은 정보들이 문서화되기도 하고 그런 정보들이 공유되고 있는 지금, 언어학이나 전산학의 요구를 함께 충족시킬 수 있는 문법 모델 개발의 필요성이 극대화되고 있다. 이 글은 한국어 품사 분류에 대해서 국어학과 전산학에서의 처리 방법과 결과를 검토하고 정리하여 우리말의 특성을 잘 설명하면서도 국어를 전산 처리하는데도 도움을 줄 수 있는 품사분류를 제안하는데 그 목적이 있다. 한국어의 특성을 고려하여 음운, 형태, 통 어, 의미 정보를 함께 처리할 수 있는 어휘부 중심의 문법인 HPSG의 모형을 도입하여 한국어 품사 분류를 정보 전달에 기반을 두어 자질 체계와 통합 연산을 핵심으로 기술하려고 한다. 문법기술은 주로 자질 구조를 속성과 값의 행렬인 AVM(attribute-value matrices)으로 제시할 것이다.

  • PDF

스마트카의 Kano 품질속성 분석에 관한 탐색적 연구 (Analysis of Kano's Quality Attributes for Smart Car: An Exploratory Study)

  • 변대호
    • 서비스연구
    • /
    • 제6권2호
    • /
    • pp.83-97
    • /
    • 2016
  • 스마트카는 편의성, 안전성, 사용자경험을 극대화시킨 차로 기존 자동차에 비해 복잡하고 많은 기능을 갖기 때문에 가격이 비싸진다. 본 논문의 목적은 스마트카가 갖는 여러 기능 가운데 Kano 품질속성 관점에서 소비자들이 원하는 필수기능을 도출한다. 실증적 분석 결과, 품질속성은 매력적 품질속성과 무관심 품질속성으로 분류되었다. 일반적으로 스마트카의 목적이 안전성과 사용자 경험을 극대화하는 것이지만 소비자들은 편의성에 더 높은 가치를 두었다. 이러한 연구결과는 향후 스마트카 설계에서 중요한 시사점을 제공할 것이다. 본 연구의 활용방안으로 카노품질 속성 관점에서 스마트카를 선정하는 계층적분석과정 모델을 제안한다.

러프-신경망과 $\chi$2 검정에 의한 효율적인 의사결정지원 시스템 (Efficient Decision Making Support System by Rough-Neural Network and $\chi$2)

  • 정환묵;피수영;최경옥
    • 한국정보처리학회논문지
    • /
    • 제6권8호
    • /
    • pp.2106-2112
    • /
    • 1999
  • 의사결정에 있어 정보란 의사결정자가 의사결정을 하는데 사용하도록 의미 있고 유용한 형태로 처리된 데이터이다. 이러한 정보들에 있어서 불필요한 속성들을 제거하여 처리함으로써 의사결정의 효율을 높일 수 있다. 러프 집합 이론은 불필요한 속성을 제거하고 분류화 하는데 뛰어난 능력을 가지고 있으나 속성 감축시 속성 수와 튜플 수에 따라 복잡한 계산을 요구한다. 따라서 속성들 사이의 상호연관성을 나타내는 척도로서, 두 변수간의 독립성에 관한 검정방법인 $\chi$2와 러프 집합의 종속성을 이용하여 속성들을 감축하고 이를 신경망의 입력 유니트로 사용하므로써 기존의 모든 속성을 입력으로 하여 신경망을 구성하는 것보다 간단하며 학습효율의 향상 및 정확한 의사결정을 지원할 수 있다.

  • PDF

인쇄 문서 영상의 단어 단위 속성 인식 (Recognition of Word-level Attributed in Machine-printed Document Images)

  • 곽희규;김수형
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제28권5호
    • /
    • pp.412-421
    • /
    • 2001
  • 본 논문은 문서 영상에 존재하는 개별 단어들에 대한 속성정보 추출 방법을 제안한다. 단어 단위의 속성 인식은 단어 영상 매칭의 정확도 및 속도 개선, OCR 시스템에서 인식률 향상, 문서의 재생산 등 다양한 응용 가치를 찾을 수 있으며, 메타정보(meta-information) 추출을 통해 영상 검색(image retrieval)이나 요약(summary) 생성 등에 활용할 수 있다. 제안하는 시스템에서 고려하는 단어 영상의 속성은 언어의 종류(한글, 영문), 스타일(볼드, 이탤릭, 보통, 밑줄), 문자 크기(10, 12, 14 포인트), 문자 개수 (한글: 2, 3, 4, 5, 영문: 4, 5, 6, 7, 8, 9, 10), 서체(명조, 고딕)의 다섯 가지 정보이다. 속성 인식을 위한 특징은, 언어 종류 인식에 2개, 스타일 인식에 3개, 문자 크기와 개수는 각각 1개, 한글 서체 인식은 1개, 영문 서체 인식은 2개를 사용한다. 분류기는 신경망, 2차형 판별함수(QDF), 선형 판별함수(LDF)를 계층적으로 구성한다. 다섯 가지 속성이 조합된 26,400개의 단어 영상을 사용한 실험을 통해, 제안된 방법이 소수의 특징만으로도 우수한 속성 인식 성능을 보임을 입증하였다.

  • PDF

디지털 게임 플레이어의 주관성 연구: 게임 분류 속성을 중심으로 (Subjectivity Study for Digital Game Players: Based on Game Classification Factors)

  • 이혜정;민애홍
    • 한국콘텐츠학회논문지
    • /
    • 제19권3호
    • /
    • pp.275-287
    • /
    • 2019
  • 게임을 플레이하는 사람들의 범주가 더 넓고 다양해졌고, 새로운 속성들이 게임에 반영되고 있다. 이러한 변화에 따라 지금의 플레이어들이 게임을 어떻게 인식하고 분류하는지 이해하고 파악하는 것이 필요하다. 본 연구에서는 게임 플레이어 30명을 P표본으로 선정하여 디지털 게임 분류 요소에 대한 Q표본 29개를 기반으로 Q방법론을 수행하였다. QUANL 프로그램으로 분석한 결과, 총 3개의 유형이 구분되었다. 첫 번째 유형은 외부적인 관점에서 보이는 게임 구성요소를 중요한 분류 기준으로 인식하고 있어 '물리적 환경중심 플레이어'로 명명하였다. 두 번째 유형은 게임 내부에 존재하는 구성요소들이 게임을 분류하는 중요한 기준이라고 인식하기에 '콘텐츠 중심 플레이어'로 명명하였다. 세 번째 유형은 게임을 분류하는 데에 있어 게임 플레이어 자신의 주관적 느낌과 생각을 중요하게 인식하고 있어 '감성 경험 중심 플레이어'로 명명하였다. 본 연구는 지금의 게임 플레이어들이 실제 게임을 어떻게 인식하고 분류하는지, 그 유형과 특성을 프레임워크로 분류했다는 점에서 의의가 있다.

품질속성을 고려한 소프트웨어 아키텍처 패턴의 정의 (Definition of Architecture Patterns regarding Quality Attributes)

  • 궁상환
    • 한국산학기술학회논문지
    • /
    • 제8권1호
    • /
    • pp.82-95
    • /
    • 2007
  • 본 논문은 소프트웨어의 아키텍처 설계에서 많이 활용될 수 있는 아키텍처 패턴들을 분류하고 명세화하는 방법을 주제로 한다. 이를 위해 먼저 아키텍처 패턴의 활용과 관련한 개선된 아키텍처 개발방법론을 제시하고, 이러한 방법론을 지원하기 위한 패턴의 분류와 정의방법을 제안한다. 패턴은 추상화 레벨이나 응용 도메인에 따라 매우 다양하기 때문에, 여러 가지 각도에서의 분류체계를 제시하여 향후 분류 및 저장된 아키텍처 패턴을 쉽게 검색하고 활용할 수 있도록 고려하였다. 또한 패턴의 표현이 다양하여 패턴의 이해가 용이하지 못한 점을 고려하여 패턴의 추상화 개념을 도입하고, 패턴간의 관계를 정의하는 방법을 제시하여 패턴들의 핵심적인 구조와 역할에 대한 이해를 돕고자 하였다 아울러, 아키텍처 패턴을 선정할 때의 중요한 고려사항이 되는 품질속성도 기존의 범용적인 개념에서 아키텍처 지향적인 개념으로 확장이 가능하도록 하여 각각의 아키텍처 패턴을 정의할 때 보다 명확한 아키텍처의 품질에 대한 명세가 함께 설명되도록 하였다.

  • PDF

Travel mode classification method based on travel track information

  • Kim, Hye-jin
    • 한국컴퓨터정보학회논문지
    • /
    • 제26권12호
    • /
    • pp.133-142
    • /
    • 2021
  • 이동 패턴 인식은 사용자 궤적 질의, 사용자 행동 예측, 사용자 위치에 기초한 흥미요소 추천, 사용자 개인 정보 보호 및 지자체 교통 계획과 같은 여러 측면에서 널리 사용된다. 현재 인식 정확도는 응용 요건을 충족할 수 없기 때문에 이동 패턴 인식 연구는 궤적 데이터 연구의 초점이라 할 수 있다. GPS 내비게이션 기술과 지능형 모바일 기기의 대중화로 많은 사용자 모바일 데이터 정보를 얻을 수 있고, 이를 바탕으로 많은 의미 있는 연구가 이루어질 수 있다. 현재의 이동 패턴 연구 방법에서 궤적의 특징 추출은 궤도의 기본 속성(속도, 각도, 가속도 등)으로 제한된다. 본 논문에서 순열 엔트로피는 궤적 분류 연구에 참여하기 위한 궤적의 고유값으로 사용되었으며 시계열의 복잡성을 측정하기 위한 속성으로도 사용되었다. 속도 순열 엔트로피와 각도 순열 엔트로피가 이동 패턴 분류에 참여하기 위한 궤적의 특성으로 사용되었으며, 본 논문에서 사용된 순열 엔트로피를 기반으로 한 속성 분류의 정확도는 81.47%에 달했다.