• 제목/요약/키워드: 속성데이터

검색결과 1,594건 처리시간 0.028초

GHSOM을 이용한 대용량 데이터 처리의 군집화 방법 (A Clustering Method using GHSOM for Processing Large Data)

  • 김만선;이상용
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2002년도 추계학술발표논문집 (상)
    • /
    • pp.393-396
    • /
    • 2002
  • 최근 대용량의 데이터베이스로부터 유용한 정보를 발견하고 데이터간에 존재하는 연관성을 탐색하고 분석하는 데이터 마이닝에 관한 많은 연구들이 진행되고 있다. 실제 응용분야에선 수집된 데이터는 시간이 지날수록 데이터의 양이 늘어나게 되고, 중복되는 속성과 잡음을 갖게 되어 마이닝 기법을 이용하는데 많은 시간과 비용이 소요된다. 또한 어느 속성이 중요한지 알 수 없어 중요한 속성이 중요하지 않은 속성에 의해 왜곡되거나 제대로 분석되지 않을 수 있다. 본 연구는 이러한 문제점들을 해결하기 위해 GHSOM을 이용한 계층적 신경망 군집화 방법을 제안한다. 제안하는 방법은 비리 군집의 개수를 정해줄 필요가 없고, 다양한 레벨의 군집들을 얻을 수 있는 계층적 군집화를 이루어낸다는 장점을 갖는다. 본 논문에서는 신경망 GHSOM의 구조와 특성에 대해 간략히 살펴보고 시스템 처리과정에 대해 설명한다.

  • PDF

속성기반 암호기술

  • 박광용;송유진
    • 정보보호학회지
    • /
    • 제20권2호
    • /
    • pp.85-92
    • /
    • 2010
  • 인터넷상에서 각종 민감한 데이터들이 공유 유통되어지는 가운데 외부공격자나 내부사용자의 관리 미흡으로 인해 데이터 유출문제가 발생되고 있다. 이를 안전하게 관리하기 암호방식으로 본 논문에서는 ID기반 암호의 확장된 개념의 속성 기반 암호방식에 대해 검토한다. 그리고 속성기반 프록시 재암호화 방식도 함께 검토 하였다.

사용자 프로파일 구축을 위한 TDIDT기반 관심단어 추출기법 (Attribute extract method based TDIDT for construction of user profile)

  • 이선미;박영택
    • 한국지능정보시스템학회:학술대회논문집
    • /
    • 한국지능정보시스템학회 2002년도 추계정기학술대회
    • /
    • pp.321-327
    • /
    • 2002
  • 본 논문은 기존의 귀납적 결정 트리 방식에서의 문제점 개선을 통한 사용자 관심 프로파일 구축을 목적으로 한다. 특히 사용자 관심 프로파일의 정확도 향상을 위한 속성 선택에 대한 연구에 초점을 맞추고 있다. 사용자의 관심, 비관심 문서를 대상으로 사용자 관심 키워드를 생성하고 이를 바탕으로 초기 문서들을 재표현한다. 재표현된 문서를 입력 집합으로 하여 기계학습을 진행한다. 본 논문의 의사 결정 트리 생성 알고리즘은 입력 집합을 클래스별로 가장 잘 나누는 속성을 선택하여 노드를 구성하는 면에서는 기존의 알고리즘과 같다. 그러나 기존의 의사 결정 트리 알고리즘에서는 hill-climbing.방식을 사용함으로써 사용자의 관심을 나타내는 중요한 단어가 사용자 관심 프로파일에서 숨겨질 경우가 발생한다. 이를 최소화하기 위해 특징 추출을 통해 선택된 속성을 그대로 학습의 입력 데이터로 사용하는 것이 아니라 입력데이터를 가장 잘 나누는 속성과 그 다음 속성을 대상으로 disjunctive 연산을 통해 새로운 속성을 생성하여 이것을 속성 집합에 포함시키고 이를 학습의 입력 데이터로 이용한다. 이와 같이 disjunctive operator를 이용하여 새로운 속성을 의사 결정 트리 형성 시 이용하면 사용자의 중요한 관심을 포함하는 의미 있는(semantic) 사용자 관심 프로파일 구축이 가능해지고, 사용자 관심 프로파일을 기반으로 사용자가 관심 있는 문서를 제공할 수 있는 개인화 서비스를 제공한다.

  • PDF

데이터세트 유형 전자기록의 필수보존속성 연구 (A Study on Significant Properties for Dataset Type Preservation Format)

  • 이정은;양동민
    • 한국비블리아학회지
    • /
    • 제34권4호
    • /
    • pp.259-283
    • /
    • 2023
  • 본 연구는 이제까지의 전자기록 장기보존 정책이 문서유형 위주의 전자기록에 치중한 점과 다양한 행정정보시스템을 통해 생산되는 문서유형 이외의 전자기록 장기보존에 관한 문제 인식에서 시작되었다. 빅데이터 시대의 도래로 데이터 관리에 관한 관심이 높아지는 시점에서, 데이터세트를 장기적으로 보존하기 위한 고유기준 마련이 필요하다. 전자기록의 보존포맷은 해당 유형 전자기록의 고유기준에 의해 선정되며, 이 고유기준은 전자기록 유형에 따른 필수보존속성을 기준으로 마련된다. 이에 본 연구는 데이터세트 유형의 보존포맷선정 고유기준 마련에 앞서 데이터세트 유형의 전자기록에 관한 필수보존속성을 도출하는데 목적이 있다. 이를 위해 미국 NARA와 국가기록원이 수행한 R&D 연구결과를 비교·분석하였다. 연구의 결과로 데이터베이스형 필수보존속성 9개와 구조화데이터형 필수보존속성 7개를 도출하였다.

확장된 표현을 이용하는 분류 알고리즘 (A Classification Algorithm using Extended Representation)

  • 이종찬
    • 한국융합학회논문지
    • /
    • 제8권2호
    • /
    • pp.27-33
    • /
    • 2017
  • 인터넷을 통해 사용자에게 클라우드 컴퓨팅 서비스를 효율적으로 제공하기 위해서는 데이터 센터에 가상화와 분산 컴퓨팅 기술을 기반으로 하여 IT 자원을 구성해야 한다. 본 논문은 폭넓은 분야에서 새로운 훈련 데이터가 언제라도 추가될 수 있고, 또한 언제라도 훈련 데이터에 새로운 속성이 추가될 수 있다는 문제에 특별히 초점을 맞춘다. 이러한 경우, 기존 속성 집합들을 가지는 훈련 데이터로 생성된 규칙은 쓸모없게 된다. 더구나 새롭게 추가된 데이터나 속성을 가지는 새로운 데이터는 기존 규칙과 결합될 수 없다. 본 논문은 이와 같은 경우를 자연스럽게 처리할 수 있는 보다 진보된 새 추론 엔진을 제안한다. 이 방법에서 기존의 데이터로 부터 생성된 규칙은 개선된 규칙을 생성하기 위한 새로운 데이터 집합과 결합될 수 있다.

하이퍼 그래프 기반 Temporal RDF 모델링 기법 (A Hypergraph-based Modeling for Temporal RDF)

  • 이태휘;임동혁
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2015년도 춘계학술발표대회
    • /
    • pp.694-696
    • /
    • 2015
  • RDF 데이터에 대한 시간 속성에 대한 연구는 트리플의 속성에 시간을 부여하는 방법이 많이 사용되고 있다. 하지만 트리플마다 시간 속성을 부여하는 방법은 저장 및 관리 측면에서 비효율적이다. 본 논문에서는 하이퍼그래프 기반의 RDF 시간 속성 모델링 방법을 제안한다. 하나의 트리플마다 시간 속성을 부여하는 것이 아닌 여러 재의 트리플을 하나의 하이퍼 간선으로 연결하여 시간 속성을 부여하는 방법으로 기존 방법보다 RDF 데이터가 가지는 의미에 적합하며 직관적으로 이해하기가 쉽다. 또한 시간 속성 RDF에서 지원해야 하는 시간 관계를 하이퍼그래프의 여러 속성을 이용하여 처리할 수 있는 장점을 가지게 된다.

유전자 선택을 위해 속성 삭제에 기반을 둔 최적화된 분류기 설계 (A Design of an Optimized Classifier based on Feature Elimination for Gene Selection)

  • 이병관;박석규;유슬리나 티파니
    • 한국정보전자통신기술학회논문지
    • /
    • 제8권5호
    • /
    • pp.384-393
    • /
    • 2015
  • 본 논문은 두 가지 속성 삭제 방법인 ReliefF와 SVM-REF를 조합하여 유전자 선택을 위한 속성 삭제에 기반을 둔 최적화된 분류법(OCFE)을 제안한다. ReliefF 알고리즘은 데이터의 중요도에 따라 데이터 순위를 매기고 필터(filter) 속성 선택 알고리즘이다. SVM-RFE 알고리즘은 속성의 가중치 기반으로 데이터 순위를 매기고 데이터를 감싸는 래퍼(wrapper) 속성 선택 알고리즘이다. 이러한 두 가지 기법을 조합함으로써, 우리는 SVM-RFE는 0.3096779이고 OCFE는 0.3016138으로 에러율 평균이 좀 더 낮게 나타났다. 또한, 제안된 기법은 SVM-RFE가 69%이고 OCFE는 70%으로 좀 더 정확한 것으로 나타났다.

MySQL 데이터베이스에서 데이터 속성에 따른 적절한 암호화 기법의 적용에 관한 연구 (Study on adoption of suitable encryption scheme according to data properties on MySQL Database)

  • 신영호;류재철
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2010년도 한국컴퓨터종합학술대회논문집 Vol.37 No.1(D)
    • /
    • pp.77-80
    • /
    • 2010
  • 최근 개인정보 및 민감한 데이터에 대한 불법적인 접근 및 유출로 인하여 사회적 문제를 야기하고, 이에 따른 경제적인 파급효과와 함께 개인정보 및 민감한 데이터에 대한 보안에 대한 관심이 더욱 증가하고 있다. 또한 법령상으로도 개인의 주민등록번호, 계좌번호, 패스워드 등 개인정보가 포함된 DB에 대하여 데이터를 암호화하여 저장, 관리하도록 규정하고있다. 본 논문에서 공개 데이터베이스인 MySQL에서 이러한 개인정보 및 민감한 데이터에 대한 암호화를 통하여 데이터를 저장, 관리하는데 있어서 데이터의 속성에 따라 적절한 암호화 기법을 사용함으로써 암호화를 통한 데이터보호와 함께 속도 등의 성능상의 오버헤드와 운영, 관리상의 효율을 높이기 위하여 지원하는 암호화 기법에 대하여 알아보고, 암호화 기법별로 성능을 시험하여 데이터의 속성에 따른 최적의 암호화 방식의 적용에 대한 방안을 제시한다.

  • PDF

iSTORM에서의 공간 객체-관계 데이터 모델 (Spatial Object-Relational Data Model in iSTORM)

  • 박경현;남광우;박성희;류근호
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 봄 학술발표논문집 Vol.27 No.1 (B)
    • /
    • pp.24-26
    • /
    • 2000
  • 공간 데이터는 복합적인 속성들의 조합으로 이루어지며 연산 또한 복합적이라는 점에서 일반 데이터와 다른 특성을 갖는다. 따라서 공간 데이터는 일반 속성 데이터와 구별되는 파일이나 별도의 저장 구조를 사용하여 관리되어야 한다. 이것은 비공간 데이터와 공간 데이터간의 상호 동기화 문제와 트랜잭션의 처리 등에서 많은 문제점을 발생시키며 이를 해결하기 위해서는 공간 데이터와 비공간 데이터를 단일 데이터베이스화하여야 한다. 이 논문에서는 이러한 단일화된 데이터베이스 시스템을 지원하기 이한 공간 객체-관계 데이터 모델을 정의하고 이 모델을 구현하기 위한 타입 저장 방법들에 대해 기술한다.

  • PDF

분기한정 동적 스카이라인 질의 기법의 I/O 최적성 분석 및 실험 평가 (I/O Optimality and Performance Analysis of Branch and Bound Dynamic Skyline Query)

  • 최우성;현경석;김자연;정순영;김종완
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2015년도 춘계학술발표대회
    • /
    • pp.741-744
    • /
    • 2015
  • 최근 소셜 미디어를 이용한 대량의 데이터로부터 사용자의 의사결정을 지원하기위한 맞춤형 데이터 추천 서비스가 관심을 받고 있으며 사용자의 선호도에 근접한 데이터 추천기법으로 스카이라인 질의가 연구되어왔다. 그러나 기존의 스카이라인 질의는 데이터의 정적속성(위도, 경도, 가격 등)만을 기준으로 모든 사용자에게 동일한 데이터를 반환하기 때문에 맞춤형 데이터를 추천하기 어렵다. 본 논문에서는 사용자의 기호에 대한 정밀도를 높이기 위해 정적속성에서 동적속성(계산속성)을 유도하는 분기한정 동적 스카이라인 질의 기법(Branch and Bound Dynamic Skyline, BBDS)을 구현하였다. 시뮬레이션에서는 대규모 데이터 및 다양한 분포에 따른 실험을 수행한 결과 BBDS가 기존 기법에 비해 데이터 탐색과 추천에 있어서 향상된 성능을 나타내는 것으로 평가되었다.