• Title/Summary/Keyword: 분산 패턴

Search Result 488, Processing Time 0.026 seconds

Clustering Algorithm using the DFP-Tree based on the MapReduce (맵리듀스 기반 DFP-Tree를 이용한 클러스터링 알고리즘)

  • Seo, Young-Won;Kim, Chang-soo
    • Journal of Internet Computing and Services
    • /
    • v.16 no.6
    • /
    • pp.23-30
    • /
    • 2015
  • As BigData is issued, many applications that operate based on the results of data analysis have been developed, typically applications are products recommend service of e-commerce application service system, search service on the search engine service and friend list recommend system of social network service. In this paper, we suggests a decision frequent pattern tree that is combined the origin frequent pattern tree that is mining similar pattern to appear in the data set of the existing data mining techniques and decision tree based on the theory of computer science. The decision frequent pattern tree algorithm improves about problem of frequent pattern tree that have to make some a lot's pattern so it is to hard to analyze about data. We also proposes to model for a Mapredue framework that is a programming model to help to operate in distributed environment.

Ontology Matching Patterns for Supporing Interoperability among Knowledge Management Systems on Semantic Distributed Environment (시맨틱 분산 환경에서의 지식 관리 시스템 상호운용성 지원을 위한 온톨로지 매칭 패턴에 대한 연구)

  • Jung, Jason J.
    • Proceedings of the Korean Institute of Information and Commucation Sciences Conference
    • /
    • 2011.05a
    • /
    • pp.97-99
    • /
    • 2011
  • As interoperability between systems in distributed environment has been important, it has been possible for various organizations to share resources and exchange relevant information. However, semantic heterogeneity between the systems and organizations causes the problem of making their interoperability impossible. Thereby, in this paper, we propose an ontology matching-based knowledge management system which can automatically discover semantic correspondences between ontologies. Moreover, even though there have been many existing ontology matchers, it is still difficult to directly apply them to the proposed system. To deal with the problems, we want to discover matching patterns (MP) which they discover from two given ontologies.

  • PDF

A Hot-Data Replication Scheme Based on Data Access Patterns for Enhancing Processing Speed of MapReduce (맵-리듀스의 처리 속도 향상을 위한 데이터 접근 패턴에 따른 핫-데이터 복제 기법)

  • Son, Ingook;Ryu, Eunkyung;Park, Junho;Bok, Kyoungsoo;Yoo, Jaesoo
    • The Journal of the Korea Contents Association
    • /
    • v.13 no.11
    • /
    • pp.21-27
    • /
    • 2013
  • In recently years, with the growth of social media and the development of mobile devices, the data have been significantly increased. Hadoop has been widely utilized as a typical distributed storage and processing framework. The tasks in Mapreduce based on the Hadoop distributed file system are allocated to the map as close as possible by considering the data locality. However, there are data being requested frequently according to the data analysis tasks of Mapreduce. In this paper, we propose a hot-data replication mechanism to improve the processing speed of Mapreduce according to data access patterns. The proposed scheme reduces the task processing time and improves the data locality using the replica optimization algorithm on the high access frequency of hot data. It is shown through performance evaluation that the proposed scheme outperforms the existing scheme in terms of the load of access frequency.

A Study on Component Modeling Tool based on Design Pattern (디자인 패턴 기반의 컴포넌트 모델링도구에 관한 연구)

  • Seo, Young-Jun;Song, Young-Jae
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2001.10a
    • /
    • pp.437-440
    • /
    • 2001
  • 현재 소프트웨어 개발 생산성과 품질을 개선하기 위해 컴포넌트 재사용에 관한 연구가 활발히 이루어지고 있으며, 특히 분산 개발 환경에서 팀 개발의 생산성을 향상시키기 위한 컴포넌트 재사용 방법이 연구되고 있다. 그러나, 이들 컴포넌트들을 효과적으로 개발, 공유, 관리하기 위한 방안이 부족한 상황이다. 따라서, 본 논문에서는 컴포넌트의 재사용성을 최대화하기 위하여 반복적 설계 문제를 해결하기 위한 구조를 갖고 있는 디자인 패턴을 대상으로 하는 공유 가능한 디자인 패턴 기반의 컴포넌트 개발 시스템을 제안하였다. 본 논문에서 제안하는 DPCM(Design Pattern Component Modeling) 도구는 추상적인 디자인 패턴 구조와 구체적인 컴포넌트 구조를 저장하기 위해 각각 별도의 Library를 구축한다. 그리고, 두 Library 사이에는 패턴 구조를 특정 애플리케이션에 적합하게 구체화하는 과정을 시각적으로 모델링 하며, 구체적인 구현 코드와 함께 COM 사양의 컴포넌트로 변환한다. 본 논문에서는 개발자들이 애플리케이션 개발에 필요한 컴포넌트를 제공 받을 수 있는 디자인 패턴 기반의 소프트웨어 컴포넌트 개발 도구의 방향을 제시하였다.

  • PDF

The Development of Web-based Workload Generator for a Distributed File System (분산 파일 시스템을 위한 웹기반 워크로드 생성기 개발)

  • Kim, Dong-Oh;Cha, Myung-Hoon;Kim, Hong-Yeon;Kim, Young-Kyun;Kim, Sung-Yub
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2014.11a
    • /
    • pp.99-101
    • /
    • 2014
  • 다양한 응용 분야에서 대량의 데이타 저장이 빈번해 짐에 따라 분산 파일 시스템에 대한 효용성이 커지고 있으며, 이로 인해 수많은 분산 파일 시스템이 개발되고 있다. 이러한, 분산 파일 시스템의 효율성을 검증할 수 있는 방법에 대한 필요성이 커지고 있다. 또한, SSD와 같은 우수한 성능을 가지는 장치를 사용하는 분산 파일 시스템에서는 SSD와 같은 장치의 효율성을 보기 위한 복잡한 워크로드를 생성 하여 시험할 수 있어야 한다. 하지만 기존의 입출력 시험 도구에서는 복잡한 상황을 시험하는 것이 매우 어렵다. 따라서, 본 논문에서는 필요에 따라 파일의 분포에 따라 다른 입출력 패턴을 가지는 여러 부하 상황을 생성이 가능하며, 웹을 통해 손쉽게 시험할 수 있는 분산 파일 시스템을 위한 웹기반 워크로드 생성기를 개발하였다.

A Study on Optimal Output Neuron Allocation of LVQ Neural Network using Variance Estimation (분산추정에 의한 LVQ 신경회로망의 최적 출력뉴런 분할에 관한 연구)

  • 정준원;조성원
    • Proceedings of the Korean Institute of Intelligent Systems Conference
    • /
    • 1996.10a
    • /
    • pp.239-242
    • /
    • 1996
  • 본 논문에서는 BP(Back Propagation)에 비해서 빠른 학습시간과 다른 경쟁학습 신경회로망 알고리즘에 비해서 비교적 우수한 성능으로 패턴인식 등에 많이 이용되고 있는 LVQ(Learning Vector Quantization) 알고리즘의 성능을 향상시키기 위한 방법을 논의하고자 한다. 일반적으로 LVQ는 음(negative)의 학습을 하기 때문에 초기 가중치가 제대로 설정되지 않으면 발산할 수 있다는 단점이 있으며, 경쟁학습 계열의 신경망이기 때문에 출력 층의 뉴런 수에 따라 성능에 큰 영향을 받는다고 알려져 있다.[1]. 지도학습 형태를 지닌 LVQ의 경우에 학습패턴이 n개의 클래스를 가지고, 각 클래스 별로 학습패턴의 수가 같은 경우에 일반적으로 전체 출력뉴런에 대해서 (출력뉴런수/n)개의 뉴런을 각 클래스의 목표(desired) 클러스터로 할당하여 학습을 수행하는데, 본 논문에서는 각 클래스에 동일한 수의 출력뉴런을 할당하지 않고, 학습데이터에서 각 클래스의 분산을 추정하여 각 클래스의 분산을 추정분산에 비례하게 목표 출력뉴런을 할당하고, 초기 가중치도 추정분산에 비례하게 각 클래스의 초기 임의 위치 입력백터를 사용하여 학습을 수행하는 방법을 제안한다. 본 논문에서 제안하는 방법은 분류하고자 하는 데이터에 대해서 필요한 최적의 출력뉴런 수를 찾는 것이 아니라 이미 결정되어 있는 출력뉴런 수에 대해서 각 클래스에 할당할 출력 뉴런 수를 데이터의 추정분산에 의해서 결정하는 것으로, 추정분산이 크면 상대적으로 많은 출력 뉴런을 할당하고 작으면 상대적으로 적은 출력뉴런을 할당하고 초기 가중치도 마찬가지 방법으로 결정하며, 이렇게 하면 정해진 출력뉴런 개수 안에서 각 클래스 별로 분류의 어려움에 따라서 출력뉴런을 할당하기 때문에 미학습 뉴런이 줄어들게 되어 성능의 향상을 기대할 수 있으며, 실험적으로 제안된 방법이 더 나은 성능을 보임을 확인했다.initially they expected a more practical program about planting than programs that teach community design. Many people are active in their own towns to create better environments and communities. The network system "Alpha Green-Net" is functional to support graduates of the course. In the future these educational programs for citizens will becomes very important. Other cities are starting to have their own progrms, but they are still very short term. "Alpha Green-Net" is in the process of growing. Many members are very keen to develop their own abilities. In the future these NPOs should become independent. To help these NPOs become independent and active the educational programs should consider and teach about how to do this more in the future.단하였는데 그 결과, 좌측 촉각엽에서 제4형의 신경연접이 퇴행성 변화를 나타내었다. 그러므로 촉각의 지각신경세포는 뇌의 같은 족 촉각엽에 뻗어와 제4형 신경연접을 형성한다고 결론되었다.$/ 값이 210 $\mu\textrm{g}$/$m\ell$로서 효과적인 저해 활성을 나타내었다 따라서, 본 연구에서 빈

  • PDF

Design and Implementation of Distributed Pair Programming System based on IDE (IDE 기반의 분산 페어 프로그래밍 시스템의 설계 및 구현)

  • Park, Ji-Hoon;Lee, Kyung-Hwan
    • The KIPS Transactions:PartD
    • /
    • v.11D no.6
    • /
    • pp.1301-1310
    • /
    • 2004
  • In distributed office, the pairs can program together using a distributed pair programming system. Many CSCW tools featuring remote screen sharing function have insufficient usability, accessibility to introduce many developers to distributed pair programming. In this paper, we suggest a distributed pair programming system based on IDE, which many developers will accept and use easily. We have do#eloped a user scenario and GUI of the system, making distributed pair programming easier and designed with high extensibility by adapting design patterns and implemented in Java language. Our findings will be of significant help to developers dealing with implementation of distributed pair programming function into some commercial IDE.

Sequential Pattern Mining with Optimization Calling MapReduce Function on MapReduce Framework (맵리듀스 프레임웍 상에서 맵리듀스 함수 호출을 최적화하는 순차 패턴 마이닝 기법)

  • Kim, Jin-Hyun;Shim, Kyu-Seok
    • The KIPS Transactions:PartD
    • /
    • v.18D no.2
    • /
    • pp.81-88
    • /
    • 2011
  • Sequential pattern mining that determines frequent patterns appearing in a given set of sequences is an important data mining problem with broad applications. For example, sequential pattern mining can find the web access patterns, customer's purchase patterns and DNA sequences related with specific disease. In this paper, we develop the sequential pattern mining algorithms using MapReduce framework. Our algorithms distribute input data to several machines and find frequent sequential patterns in parallel. With synthetic data sets, we did a comprehensive performance study with varying various parameters. Our experimental results show that linear speed up can be achieved through our algorithms with increasing the number of used machines.

다중 워크플로우 충돌패턴에 관한 연구

  • Kim, Bo-Yeon;Park, Jin-Su
    • 한국경영정보학회:학술대회논문집
    • /
    • 2007.11a
    • /
    • pp.322-327
    • /
    • 2007
  • 최근 기업 환경이 복잡해지고 분산화 되어감에 따라 각 기업간의 그리고 부서 및 지점간의 프로세스 상호운용 및 협력이 중요한 이슈로 떠오르고 있다. 이러한 시점에서 기업간 비즈니스 프로세스와 메시지 등을 교류할 수 있는 상호운용성이 기업들에게 필수적인 요소로 고려되고 있다. 지금까지 많은 기술자와 연구자들에 의해 기업간 워크플로우 상호운용성을 해결할 수 있는 기술적인 노력이 꾸준히 이루어져 왔다. 기술적 문제의 해결도 중요하지만 이보다 우선적으로 해결되어야 될 것은 비즈니스 프로세스 상호운용성에 대한 개념적 모델링과 정확한 분석이다. 본 논문에서는 기존의 워크플로우 패턴들에 대한 연구들을 정리해 보여 줄 뿐만 아니라, 여러 기업간 비즈니스 프로세스가 상호운용될 시 충돌을 유발시킬 수 있는 패턴들을 제시할 것이다. 이러한 패턴들에 관한 연구는 여러 기업들이 복잡한 비즈니스 프로세스를 문제없이 효율적으로 상호운용할 수 있도록 도움을 주는 기본적인 정보가 될 것이다.

  • PDF

Pattern Classification using Closest Decision Method in k Nearest Neighbor Prototypes (k 근방 원형상에서 최근방 결정법에 의한 패턴식별)

  • Kim, Eung-Kyeu;Lee, Soo-Jong
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2008.06c
    • /
    • pp.456-461
    • /
    • 2008
  • 클래스별 원형상(prototype)의 분포가 선형분리 불가능하고 동시에 분산이 서로 다르고 희박한 분포의 원형상에 있어서 입력패턴에 대한 고정밀도의 식별을 행하기 위해 클래스별 최근방 원형상과 그 k 근방 원형상에 있어서 노름(norm) 평균에 기초한 최근방 결정법에 의한 패턴식별방법을 제안한다. 제안하는 방법의 유효성을 평가하기위해 인공적인 패턴과 실제 패턴에 대해 일반적인 k-NN법, 매해라노비스 거리(maharanobis distance), CAP, kCAP, SVM의 각각에 기초한 방법과 제안하는 방법을 적용하여 식별률에 의한 평가를 행하였다. 그 결과 특히, 원형상의 분포가 희박한 경우 제안하는 방법이 다른 방법들에 비해 높은 식별률을 나타냈다.

  • PDF