• 제목/요약/키워드: 클러스터링 문제

검색결과 429건 처리시간 0.04초

제품군의 재사용 가능한 클론 코드의 메소드 경로 통일을 위한 코드 클러스터링 방법 (A Code Clustering Technique for Unifying Method Full Path of Reusable Cloned Code Sets of a Product Family)

  • 김태영;이지현;김은미
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제12권1호
    • /
    • pp.1-18
    • /
    • 2023
  • 유사한 소프트웨어는 기존 산출물을 복제하고 수정하는 클론-앤-오운(clone-and-own, CAO) 방법으로 개발되곤 한다. 그러나 클론-앤-오운 방법은 복제된 제품의 수가 늘면서 유지보수를 어렵게 만들기 때문에 나쁜 프랙티스로 간주된다. 소프트웨어 제품라인 공학은 체계적인 재사용을 통해 소프트웨어 제품군을 개발하는 방법으로 클론-앤-오운 방법의 문제를 해결할 수 있다. CAO 방식으로 개발되어 온 제품패밀리를 제품라인 공학으로 마이그레이션하는 작업은 여러 소프트웨어 제품에서 클로닝된 부분들을 찾아 통합하고 재사용 가능한 자산으로 구축하는 것으로부터 시작된다. 그러나 클로닝이 디렉토리부터 코드 라인까지 다양한 수준에서 발생하고 그 과정에서 이들의 구조에 변경이 일어날 수 있어 단순하게 클로닝을 찾아내는 것만으로는 고품질의 제품라인 코드베이스를 구축하기 어렵다. 성공적인 마이그레이션을 위해서는 소스 코드들 사이의 클로닝 관계를 찾는 것 이외에도 소스 코드들의 파일 경로와 클래스 이름, 메소드 시그니처 등의 동일성을 확보는 작업이 선행되어야 한다. 이에 본 연구는 CAO 기반으로 개발된 제품들로부터 마이그레이션 대상 제품들을 선정한 후 제품들에 흩어져 있는 유사 코드 집합을 검출하여 메소드 경로의 통일이 필요한 대상을 식별하는 클러스터링 방법을 제안한다. 제안 방법의 효과를 보이기 위해 CAO 방식으로 진화해온 ApoGames 제품군에 제안 방법을 적용하여 실험을 진행하였다. 그 결과, 전처리 없이 수행된 파일의 상대 경로 기반 클러스터링 방법의 평균 정밀도는 0.91이며 식별된 공통 클러스터의 개수는 0개인 반면에 이 논문에서 제안하는 전처리와 함께 수행된 메소드 시그니처 기반 클러스터링 방법의 평균 정밀도는 0.98로 개선되었으며 식별된 공통 클러스터는 최대 15개까지 증가하였다.

리눅스 클러스터 파일 시스템을 위한 통신모듈의 설계 및 구현 (Design and Implementation of The Communication Module for a Linux Cluster File System)

  • 박의수;유찬곤;손호신;최현호;김형식;유관종
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 봄 학술발표논문집 Vol.29 No.1 (A)
    • /
    • pp.649-651
    • /
    • 2002
  • 클러스터 파일 시스템은 기존의 클러스터링 기술을 파일 시스템에 적용하여, 각 노드 단위로 파일 시스템을 구성할 때 발생되는 저장 공간과 대역폭의 제약문제를 극복하기 위한 방법이다. 클러스터 파일 시스템은 하나의 원본 파일을 여러 노드에 나누어 저장하므로, 효율적인 노드간 데이터 통신을 필요로 하며, 노드 내부에서도 클러스터 파일 시스템과 어플리케이션과의 전용 데이터 교환 메커니즘을 지원해야 한다. 본 논문에서는 클러스터 파일 시스템이 안정적이고 효율적인 방법으로 멀티미디어 데이터를 분산 저장하기 위하여 필요한 통신 모듈을 설계 및 구현한다.

  • PDF

비트코인 익명화 기술 연구 동향

  • 홍영기;허준범
    • 정보보호학회지
    • /
    • 제28권3호
    • /
    • pp.11-17
    • /
    • 2018
  • 세계적 열풍의 중심인 비트코인에는 많은 이슈가 발생하고 있다. 특히 비트코인의 익명성은 사회적으로 중요한 문제이다. 비트코인이 익명성을 보장하지 못할 경우 거래내역이 공개되어 프라이버시가 노출될 수 있다. 반대로 비트코인이 익명성을 보장할 경우 마약 거래, 자금 세탁, 랜섬웨어 공격 등의 각종 범죄가 발생할 수 있다. 이밖에도 다양한 상황에 적절한 대처를 하기 위해서는 비트코인 기술에 대한 정리와 이해가 필요하다. 본 논문에서는 비트코인의 익명성을 약화시키는 클러스터링 기술과, 비트코인의 익명성을 강화시키는 믹싱 프로토콜 기술에 대한 연구 흐름을 정리하였다.

병렬 파일 시스템에서 이중 캐쉬 구조 (Dual-Cache Scheme in Parallel File System)

  • 장원영;김재열;서대화
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2001년도 추계학술발표논문집 (상)
    • /
    • pp.271-274
    • /
    • 2001
  • 프로세스와 디스크 입출력 속도를 비교해보면, 디스크 입출력의 속도가 휠씬 더 느리다. 따라서 디스크 입출력은 현재의 컴퓨팅 환경에서 병목현상이 되고있다. PFSL(Parallel File System for Linux)은 이런 문제를 해결하기 위한 클러스터링 환경의 병렬 파일 시스템이다. PFSL은 리눅스 머신 상에서 POSIX 스레드 라이브러리를 이용하여 멀티 스레드로 수행된다. 이 논문에서는 PFSL의 성능을 개선하기 위해 클러스터 환경의 작업 부하에 적합하도록 설계한 이중 캐쉬 구조를 소개하고자 한다.

  • PDF

전자상거래에 적용 가능한 고객분류기 (A Customer Classifier for EC Mall)

  • 김선철;이준욱;이용준;류근호
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1999년도 가을 학술발표논문집 Vol.26 No.2 (1)
    • /
    • pp.138-140
    • /
    • 1999
  • 분류기법은 과거데이터를 분석하여 새로운 데이터에 대한 예측에 사용되며, 결정트리 알고리즘을 많이 사용한다. 따라서, 이 기법은 전자상거래에서 DB 마케팅을 위해 데이터베이스에 저장되어 있는 고객데이터를 분석하여 암시적인 고객들의 행위규칙을 찾고, 예측하기 위하여 사용할 수 있다. 기존의 분류알고리즘들은 전자상거래에서 일반적인 연속형 고객데이터를 처리하는데는 많은 문제점을 가지고 있다. 이러한 문제를 해결하기 위하여 연속형 데이터를 범주형 데이터로 변환하는 알고리즘을 구현하였다. 이 논문은 전자상거래에 적용하기 위한 고객분류기로서 ID3 알고리즘에 1차원 클러스터링알고리즘을 결합하여 사용한다.

  • PDF

점진적 알고리즘을 이용한 웹 문서 클러스터링 시스템의 설계 및 구현 (Design and implementation of web document clustering system using on incremental algorithm)

  • 황태호;손기락
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1999년도 가을 학술발표논문집 Vol.26 No.2 (1)
    • /
    • pp.207-209
    • /
    • 1999
  • 클러스터 분석은 관측의 대상이 되는 집합에 맞는 분류 구조를 생성하는데 이용되는 통계학적인 기술이다. 정보검색 응용에서 전형적으로 발견되는 높은 차원을 가진 많은 데이터 집합을 클러스터하기 위하여, 많은 공간과 시간이 필요하다. SLINK 알고리즘은 O(n2)의 시간과 O(n)의 공간의 성능을 갖으며 점진성을 반영할 수 있는 알고리즘이다. SLINK알고리즘을 이용하여 검색 엔진의 검색결과에 온라인으로 클러스터 분류를 수행하는 시스템을 구현하였다. 구현된 시스템은 상대적으로 높은 정확도와 각 클러스터를 저장하고 표현하는데 있어서의 장점을 제공하며, 상대적으로 느린 수행 속도는 온라인으로 문서들이 다운로드 되는 속도가 느리므로 문제가 되지 않음을 알 수 있었다.

  • PDF

RESTful 웹 서비스를 위한 온톨로지 자동 구축 기법 (Automatic Building Ontology Techniques for RESTful Web Services)

  • 이용주
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2011년도 춘계학술발표대회
    • /
    • pp.1415-1418
    • /
    • 2011
  • 최근 웹상에 이용 가능한 RESTful 웹 서비스들의 수가 급격하게 증가됨에 따라 사용자들이 적합한 웹 서비스를 찾는 것은 매우 중요한 이슈로 대두되었다. 그러나 기존의 키워드 기반 검색 방법은 나쁜 재현율과 나쁜 정확률 때문에 문제가 많다. 본 논문에서는 매개변수 클러스터링 기법에 패턴 분석 기법을 추가한 하나의 새로운 시맨틱 온톨로지 구축 방법을 제안한다. 이를 통해 온톨로지를 자동 구축하여 시맨틱 정보의 주석처리 부담을 줄일 수 있고, 보다 효율적인 웹 서비스 검색을 지원한다.

HCM 클러스터링 알고리즘 기반 비퍼지 추론 시스템의 비선형 특성 (Nonlinear Characteristics of Non-Fuzzy Inference Systems Based on HCM Clustering Algorithm)

  • 박건준;이동윤
    • 한국산학기술학회논문지
    • /
    • 제13권11호
    • /
    • pp.5379-5388
    • /
    • 2012
  • 비선형 공정에 대한 퍼지 모델링에서, 퍼지 규칙은 일반적으로 입력 변수 선택, 공간 분할 수 및 소속 함수에 의해 형성된다. 비선형 공정에 대한 퍼지 규칙의 생성은 차원이 증가할수록 규칙의 수가 지수적으로 증가하는 문제를 가지고 있다. 이를 해결하기 위해, 입력 공간의 퍼지 분할에 의한 퍼지 규칙을 생성함으로써 복잡한 비선형 공정을 모델링 할 수 있다. 따라서 본 논문에서는 HCM 클러스터링 알고리즘을 이용하여 입력 공간을 분산 형태로 분할함으로써 비퍼지 추론 시스템의 규칙을 생성한다. 규칙의 전반부 파라미터는 HCM 클러스터링 알고리즘에 의한 소속행렬로 결정된다. 규칙의 후반부는 다항식 함수의 형태로 표현되며, 각 규칙의 후반부 파라미터들은 표준 최소자승법에 의해 동정된다. 마지막으로, 비선형 공정으로는 널리 이용되는 데이터를 이용하여 비선형 특성 및 성능을 평가한다. 본 실험을 통해 고차원의 비선형 시스템은 매우 적은 수의 규칙을 가지고 모델링할 수 있었다.

WSN에서 에너지 효율적인 클러스터링 기법 (An Energy Efficient Clustering Scheme for WSNs)

  • 정길수;이원석;송창영
    • 전자공학회논문지
    • /
    • 제50권4호
    • /
    • pp.252-258
    • /
    • 2013
  • WSN (Wireless sensor network)은 에너지 제한적인 네트워크이기에 노드의 에너지 효율성이 중요한 문제이다. 라운드 단위로 동작하는 클러스터링은 노드의 먼 거리 통신을 피할 수 있기에 네트워크 수명을 증가시키는 효율적인 방법이며 그 성능은 라운드 시간에 좌우된다. 짧은 라운드 시간은 잦은 클러스터 재구성을 발생시키고 반면 긴 라운드 시간은 클러스터 헤드의 에너지 소비를 증가시킨다. 그래서 현존하는 클러스터링 기법들은 네트워크 초기 변수들을 기반으로 적절한 라운드 시간을 결정한다. 하지만 무선 센서 네트워크는 운용 특성 상 노드가 추가될 수도 혹은 사라질 수도 있는 동적인 네트워크이기에 네트워크 전체 수명에 대해 네트워크 구성 초기 파라미터를 계속 적용하는 것은 적절치 못하다. 본 논문에서는 현재 필드에 살아있는 노드의 수를 기반으로 라운드 시간을 계산하는 방법을 제안하여 노드 수가 변화할 수 있는 동적인 네트워크에 적응하도록 하였다. 성능 분석 결과 기존에 비해 노드의 에너지 소비량이 감소하였으며 수신되는 데이터 손실도 감소함을 확인하였다.

RESTful 웹 서비스에서 시맨틱 온톨로지를 구축하기 위한 클러스터링 및 패턴 분석 기법 (Clustering and Pattern Analysis for Building Semantic Ontologies in RESTful Web Services)

  • 이용주
    • 인터넷정보학회논문지
    • /
    • 제12권4호
    • /
    • pp.119-133
    • /
    • 2011
  • 웹 2.0의 등장과 함께 RESTful 웹 서비스의 활용이 전통적인 SOAP 기반 웹 서비스에 비해 크게 증가되고 있다. 최근 웹상에 이용 가능한 RESTful 웹 서비스들의 수가 급격하게 증가됨에 따라 사용자들이 적합한 웹 서비스를 찾는 것은 매우 중요한 이슈로 대두되었다. 그러나 기존의 키워드 기반 검색 방법은 나쁜 재현율과 나쁜 정확률 때문에 문제가 많다. 본 논문에서는 연관규칙 기반 클러스터링 기법에 패턴 기반 시맨틱 분석 기법을 추가한 하나의 새로운 시맨틱 온톨로지 구축 방법을 제안한다. 이를 통해 온톨로지를 자동 구축하여 시맨틱 정보의 주석처리 부담을 줄일 수 있고, 보다 효율적인 웹 서비스 검색을 지원한다. 본 논문에서 제안된 방법은 ProgrammableWeb 사이트로부터 168개의 RESTful 웹 서비스를 다운로드 받아 실험 분석을 수행한 결과, 기존의 키워드 기반 검색 방법에 비해 재현율과 정확률 두 측면에서 각각 35%, 18%의 성능 향상을 보였다.