• 제목/요약/키워드: 패턴 파일

검색결과 392건 처리시간 0.031초

기대치-최대화 군집 알고리즘과 출현 패턴 마이닝을 이용한 전력 소비 패턴 분석 (Power Consumption Patterns Analysis Using Expectation-Maximization Clustering Algorithm and Emerging Pattern Mining)

  • 박진형;이헌규;신진호;류근호;김희석
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2008년도 추계학술발표대회
    • /
    • pp.261-264
    • /
    • 2008
  • 전력 회사의 효율적인 운용과 전력 시장에서의 경쟁을 위하여 고객의 전력 소비 패턴 분석 및 정확한 예측이 이루어져야 한다. 이를 위해서 이 논문에서는 원격 검침 시스템에 의한 전국의 고압 고객 데이터를 대상으로 고객의 전력 소비 패턴을 정확히 예측할 수 있는 마이닝 기법을 제안하였다. 먼저, 국내 계약종별 고객 특성에 맞는 부하 패턴의 정확한 구별을 위한 9가지의 특징 벡터를 추출하였고, 기대치-최대화 군집화 알고리즘을 사용하여 고객의 34개 대표 부하프로파일을 생성하였다. 마지막으로 추출된 특징 벡터로부터 각 대표 프로파일에 대한 출현 패턴 기반의 분류 모델을 구성하여 고객의 전력 소비 패턴을 분류하였다. 국내 원격 검침 시스템에 의해 측정된 총 3,895명의 고압 고객 데이터에 대한 실험 결과 약 91%의 분류 정확성을 보였다.

File System에 따른 SQLite3 모바일 데이터베이스의 갱신 성능 비교 (Modification Performance Comparison of SQLite3 Mobile Databases for File Systems)

  • 최진오
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2019년도 춘계학술대회
    • /
    • pp.508-509
    • /
    • 2019
  • 모바일 환경에서 데이터베이스 엔진 사용이 보편화되고 있으며 모바일에 적합한 데이터베이스 엔진 개발과 발표가 뒤따르고 있다. 모바일 데이터베이스는 대부분 플래시 메모리로 구성한 다양한 파일시스템에서 관리된다. 이 논문에서는 대표적인 모바일 데이터베이스인 SQLite3의 파일 시스템별 갱신 성능을 테스트한다. 그래서 각 파일 시스템별 특성을 파악하고 비교하기 위한 시스템을 구현하고 성능 실험을 실시한다. 실험 결과로부터 각 데이터베이스 갱신 패턴에 따른 파일 시스템별 장단점을 분석할 수 있다.

  • PDF

P2P 영화파일공유 이용자의 영화소비패턴 분석 (Analyzing cinematic consumption patterns of the p2p users)

  • 이선희;최수영
    • 한국HCI학회:학술대회논문집
    • /
    • 한국HCI학회 2007년도 학술대회 2부
    • /
    • pp.728-736
    • /
    • 2007
  • P2P 파일공유는 1999년 처음 등장한 이래 저작권 침해로 디지털 콘텐츠 시장을 파괴하는 '해적'으로 간주 되어왔다. 하지만 최근 들어 P2P 시장의 산업적 가능성을 새롭게 주목하는 움직임이 나타나고 있다. 아울러 학계에서는 P2P의 경제적 영향력을 공급자 편향의 시각이 아닌 소비자 측면을 포함한 균형적 관점으로 바라보기 시작했다. 본 연구 역시 균형적 관점에서 P2P를 바라보려는 접근법의 일환으로, P2P 영화파일 공유 이용자들의 영화소비패턴을 실증적으로 살펴보고자 하였다. 실제 P2P 영화파일 공유 이용자들에 대한 설문결과, 이용자들은 단일한 영화소비성향을 가지고 있지 않았으며 다운로드와 극장 관람빈도가 모두 높은 이른바 '얼리어답터'형과 다운로드를 극장관람의 대체재로 여기는 소위 '해적'형이 공존하고 있었다. 이 중 그간 산업계에서 우려하던 해적형의 비율은 10% 정도로 낮았고, 대부분의 P2P 이용자들은 오히려 일반 극장 관람객보다 더 적극적으로 극장소비를 하는 사람들로 영화산업에 긍정적인 기여를 하는 것으로 밝혀졌다. 이러한 소비자 분석결과는 향후 본격화되고 있는 P2P 다운로드 유료화 시장에 대한 전망을 밝게 하는 것으로, 현재 유료화에 있어 가장 중시해야 할 것은 불법 무료 다운로드에 대한 경계가 아니라, 소비자 편의적인 시스템의 개발임을 시사한다.

  • PDF

저차원공간으로의 매핑에 기반한 DNA서열 요소 및 유전자 발현 패턴간 관련성 분석 (Linking DNA Sequence Motifs with Gene Expression Patterns Based on a Low-Dimensional Mapping)

  • 이종우;장병탁
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2005년도 한국컴퓨터종합학술대회 논문집 Vol.32 No.1 (B)
    • /
    • pp.235-237
    • /
    • 2005
  • 마이크로 어레이(micro array)로 표현되는 유전자 발현 패턴(gene expression pattern)들과 해당 유전자의 upstream에 위치한 DNA 서열 요소(motif)들은 유전자 발현에 밀접한 관련을 맺고 있는데 이들간의 매핑관계를 알아내는 것은 생물전산학 분야에서 중요한 문제 중 하나이다. 본 고에서는 유전자 발현 패턴 데이터와 해당 DNA에 포함된 것으로 알려진 모티프 프로파일에 대해 대응분석(correspondence analysis)을 수행하고 2차원 평면에 매핑하여 특정 유전자 발현과 밀접하게 관련된다고 여겨지는 후보 모티프를 시각적으로 직관적으로 동정하는 방법을 제시한다. 또한 유전자 발현 패턴은 일정한 길이로 나누어 가능한 모든 패턴에 대해 클러스터링을 행하여 이에 대한 인덱스로 데이터를 표현하여 패턴의 인식성과 발현 순차성을 높이는 반면 복잡도를 줄이도록 하였다. 실험에서 두가지 형태의 모티프 프로파일과 효모 Saccharomyces cerevisiae 포자형성 데이터 집합에 대하여 대응 분석을 통한 시각화된 결과를 이용해 유전자 발현과 깊게 관련되는 것으로 알려진 모티프들이 대응 유전자 발현과의 상관성이 잘 동정되고 있음을 알 수가 있다.

  • PDF

Hadoop Distribute file system에서 Small file을 효과적으로 처리하기 위한 파일 병합 기법 연구 (A File Merging Scheme for Efficient Handling of Small Files in Hadoop Distributed File System)

  • 박종창;윤희용
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2013년도 추계학술발표대회
    • /
    • pp.15-17
    • /
    • 2013
  • HDFS(Hadoop Distribute File System)는 대용량 파일 처리를 목적으로 설계 되었으며 현재 이상적인 분산 파일 시스템으로 각광 받고 있다. 이러한 HDFS는 기존 분산파일 시스템과 많은 유사성을 가지고 있으나, Fault Tolerance를 제공하고, 데이터 엑세스 패턴을 스트리밍 방식으로 지원하여 대용량 파일을 효율적으로 저장할 수 있다는 차별성을 가지고 있다. 하지만 실제 HDFS 데이터 집합에는 Small file이 차지하는 비중이 상당히 높으며, 이러한 다수의 Small file 은 데이터 처리에 있어 높은 비용을 초래할 뿐 아니라 Master Node 의 파일 처리 및 메모리 성능에 악영향을 미친다. 따라서 본 논문에서는 HDFS에서 Small file 이 미치는 영향을 분석하고 이러한 문제점을 해결 할 수 있는 로컬 인덱스 파일기반의 파일 병합 기법을 제안한다.

활동기반 접근법에 의한 활동패턴의 맥락적 정보분석과 프로파일 (An Activity-Based Analysis of Contextual Information of Activity Patterns and Profiles)

  • 조창현
    • 대한교통학회지
    • /
    • 제25권6호
    • /
    • pp.171-183
    • /
    • 2007
  • 도시교통 수요는 활동 수행으로부터 유발된다. 개인의 활동 의사결정에 의한 일상활동의 개인 간 총합은 집합적 공간행동으로 관찰되며, 활동간 서로 다른 공간의 극복을 위해 유발된 통행은 활동 간의 구조적인 상호연쇄관계에 의해 그 구체적 형태를 부여받는다. 개인의 하루 일상을 통한 시공간적 의사결정 및 사회적 실행과 사회 공간적 환경간의 상호작용을 탐구하는 활동기반접근법은 도시민의 일상과 통행을 분석하는데 중요한 이론 틀을 제공한다. 이 연구는 도시민의 일상활동을 활동기반접근법에 근거하여 대표적인 유형으로 분류하고, 분류된 유형의 프로파일과 관련 있는 활동 주체 특성과 활동 당시의 상황 특성을 분석하였다. 분석 결과 도시민의 일상활동은 소수의 대표적 활동패턴 집단으로 분류 가능하며, 각 집단의 특성은 다차원 프로파일에 의해 유의하게 요약되었다. 또한 각각의 프로파일은 서로 다른 사회경제적, 상황적 특성과 상관되어 있음을 확인하였다. 연구는 도시민의 일상활동 원리를 밝힘으로써, 도시교통 정책수단에 대한 도시민의 개별 반응 양식과 그 집합적 행동을 예측하기 위한 이론적 기초를 제공한다.

YARA 속도 개선을 위한 새로운 S/W 구조설계 (A New S/W Architecture for YARA Speed Enhancement)

  • 김창훈
    • 한국통신학회논문지
    • /
    • 제41권12호
    • /
    • pp.1858-1860
    • /
    • 2016
  • 논문에서는 YARA의 스캐닝 스레드 알고리즘을 개선하여 다수의 룰 파일 패턴 매칭을 수행할 수 있는 새로운 소프트웨어 구조를 제안한다. 제안하는 방식은 기존의 YARA에 비해 매칭을 위한 룰 파일의 메모리 적재 횟수를 감소시킨다. 따라서 제안된 구조를 적용할 경우 메모리 사용량은 룰 파일의 개수에 비례하여 증가하지만 패턴 매칭 수행에 따른 시간을 감소시킬 수 있다.

유비쿼터스 컴퓨팅 환경에서 상황적응형 자가구성 시스템의 설계와 구현 (A Design and Implementation of Context-Adaptive Self-Configuration System in Ubiquitous Computing Environment)

  • 이승화;오제환;이은석
    • 한국지능정보시스템학회:학술대회논문집
    • /
    • 한국지능정보시스템학회 2004년도 추계학술대회
    • /
    • pp.233-241
    • /
    • 2004
  • 본 논문에서는 분산된 관리대상의 시스템자원과 사용자정보, 사용패턴을 Context로 수집하여, 구성(Configuration)을 수행하는 적응형 자가관리시스템을 제안한다. 본 시스템은 기존에 수동으로 이루어지던 Configuration 작업들 (Install, Reconfiguration, Update)을 자율적으로 수행하여, 사용자의 시스템관리에 대한 부담을 줄여주게 되며, 많은 비용과 오류를 감소시켜준다. 본 시스템은 수집된 Context 정보를 기반으로 사용자의 환경에 맞는 구성요소를 선택하여 설치하게 되며, 사용자의 기존 애플리케이션의 환경설정과 사용패턴을 기반으로, 보다 개인화된 설정을 해준다. 설정 이후에는 사용자의 행동을 암시적 피드백으로 받아, 이를 학습하고 유사한 상황이 다시 발생할 경우, 이를 다음 행동에 반영한다. 그리고 기존에 중앙서버로부터 일률적으로 관련파일을 전송하고 관리하는 중앙집중배포방식의 여러 문제점에 대응하기 위해 Peer-to-Peer 방식으로 파일을 카피하고, 이를 통해 중앙서버의 과부하를 줄이는 동시에 빠른 파일의 배포가 가능하도록 하였다. 본 시스템의 평가를 위해 프로토타입을 구현하여, 기존 수동 Configuration작업, MS-IBM과 같은 관련시스템과의 비교를 수행하였으며, 기능적 측면과 작업에 소요되는 시간에 대한 비교결과를 통해 본 시스템의 유효성을 증명하였다.

  • PDF

문서파일 내의 개인정보탐색 및 암·복호화 시스템 (A System for Personal Information Detection Encrypt/Discryption)

  • 김백엽;이주희;최경주
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2014년도 추계학술발표대회
    • /
    • pp.479-481
    • /
    • 2014
  • 개인정보보호법의 개정안이 1년간의 계도 기간을 거쳐 2014년 8월 7일에 시행되었다. 개인정보 보호법은 개인정보보호에 관한 법률이 포함하고 있으며 크게 관리적인 보호조치와 기술적 보호 조치로 구분된다. 본 시스템은 기술적인 보호조치에 해당하며, 개인정보가 포함된 문서를 탐지 및 암 복호화 한다. 개인 정보를 보호하는 방법에 있어서 개인정보에 해당하는 패턴을 정의하고, 상기 패턴을 참조하여 컴퓨터에 저장된 파일에 개인정보가 포함되어 있는가를 검색하며, 정보보호를 위한 암 복호화 동작을 수행하는 정보보호단계를 제공함으로써, 개인정보가 포함되어 있는 파일의 외부 유출을 차단할 수 있을 것으로 기대된다.

인터넷 비즈니스 기반의 고객관계관리(CRM)을 위한 웹 로그 분석에 관한 연구 (A Study on Web-log Analysis for CRM based on Internet Business)

  • 김재형;노효원;김남호;정정화
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2000년도 제13회 춘계학술대회 및 임시총회 학술발표 논문집
    • /
    • pp.10-15
    • /
    • 2000
  • 개별화 웹 마케팅은 본질적으로 고객지향의 패러다임이다. 즉, 개별 고객의 특수한 니즈를 개별적으로 파악해서 각각의 고객에게 차별화된 서비스를 제공하는 것이 그 핵심이다. 웹 서버의 로그파일에 데이터마이닝의 연관규칙 기술을 이용하게 되면 고객행동 패턴의 파악 및 예측을 위한 기법으로 활용할 수 있다. 본 연구에서는 웹 사용자의 교차 판매를 위한 원투원 마케팅에 필요한 접근패턴을 분석하고자 하며, 이는 웹서버 로그파일 분석을 통하여 이루어진다. 분석하고자 하는 웹서버 로그파일은 기존의 데이터웨어하우스의 원천 데이터들과는 다르게 비정형적인 데이터 구조를 가지고있다. 이들 비정형 데이터 처리와 교차판매 지원을 위한 데이터마이닝 모델링, 이를 통한 원투원 마케팅 모델 제시, 그리고 이의 활용이 고객관계관리(CRM)에 미치는 효과를 제시한다.

  • PDF