• 제목/요약/키워드: Commit Message

검색결과 13건 처리시간 0.023초

커밋 히스토리에 기반한 버그 및 커밋 연결 기법 (A Technique to Link Bug and Commit Report based on Commit History)

  • 채영재;이은주
    • 정보과학회 컴퓨팅의 실제 논문지
    • /
    • 제22권5호
    • /
    • pp.235-239
    • /
    • 2016
  • 커밋-버그 링크는 커밋히스토리(commit history)와 버그 리포트(bug report) 간의 연결(Link)을 뜻한다. 커밋-버그 링크는 소프트웨어 유지보수와 결함 예측, 버그 추적 시스템(Bug Tracking System)에 이용이 되며, 특히 결함 예측 측면에서는 성능면에서의 기반이 된다. 일반적으로 링크를 자동으로 연결하는 방식은 텍스트 유사도(text similarity)나 시간 간격(time interval), 키워드(keyword) 등을 통해서 추출하였다. 하지만 기존 방식은 커밋히스토리(commit history)의 질적인 부분에 의존적이기 때문에 다수의 링크를 놓치게 된다는 단점이 존재한다. 본 논문에서는 커밋히스토리의 메시지(message)부분에만 의존하지 않고, 버그리포트에서 연결된 커밋히스토리의 파일간의 유사도를 이용하여 링크를 연결할 수 있는 방식을 제안하고 실험을 통하여 본 기법의 적용성을 보인다.

Implementation of Git's Commit Message Complex Classification Model for Software Maintenance

  • Choi, Ji-Hoon;Kim, Joon-Yong;Park, Seong-Hyun
    • 한국컴퓨터정보학회논문지
    • /
    • 제27권11호
    • /
    • pp.131-138
    • /
    • 2022
  • Git의 커밋 메시지는 프로젝트 생명주기와 밀접한 연관성을 지니고 있으며, 이러한 특성에 의해 프로젝트 운영 활동의 위험요소와 프로젝트 현황 등을 파악하여 비용 절감과 작업효율 개선 등에 큰 기여를 할 수 있다. 이와 관련한 분야 중 커밋 메시지를 소프트웨어 유지관리의 유형으로 분류하는 많은 연구가 있으며 연구 중 최대 정확도는 87%다. 본 논문에서는 커밋 분류 모델을 이용한 솔루션 등의 활용을 목적으로 진행 하였고 기존에 발표된 모델들보다 정확도를 높여 모델의 신뢰성을 높이기 위해 여러 모델을 조합한 복합 분류 모델을 설계하고 구현하였다. 본문은 자동화 레이블링 및 소스 변경 내용을 추출하여 데이터셋을 구성하고 디스틸 버트(DistilBERT) 모델을 이용하여 학습시켰다. 검증결과 기존 연구에서 보고된 최대 87%보다 8%가 향상된 95%의 F1 점수 값을 얻어 신뢰성을 확보하였다. 본 연구 결과를 이용하면 모델의 신뢰성을 높이고 이를 이용해 소프트웨어 및 프로젝트관리 등의 솔루션에 적용이 가능할 것으로 기대된다.

봉쇄문제를 축소한 비봉쇄 이단계 완료규약 (Non-Blocking Two Phase Commit Protocol Reducing the Blocking Problem)

  • 안인순;김경창
    • 정보처리학회논문지D
    • /
    • 제8D권5호
    • /
    • pp.523-532
    • /
    • 2001
  • 원자성 완료규약 분산트랜잭션을 규약에 참여하는 사이트에 일관되게 종료할 수 있게 한다. 사이트 나 통신의 고장에도 불구하고 참여자들이 트랜잭션을 정확하게 종료할 수 있다면 이것은 봉쇄문제를 제거한 규약이라 한다. 2PC 규약은 봉쇄 규약으로 유명하고, 반면에 3PC 규약은 봉쇄문제를 해결한 규약으로 알려졌다. 본 논문에서 제안된 봉쇄 해결 규약보다 봉쇄문제를 축소한 NB-2PC 규약을 제안한다. NB-2-PC 규약은 2PC 규약과 3PC규약을 변형한 규약이다. NB-2PC 규약은 선출단계에서 참여자들이 조정자에게 Prepare 메세지를 받으면, 조정자와 여러 참여자들에게 응답 메세지를 보낸다. 참여자들은 결정 메세지를 기다리다 조정자의 고장으로 인해 봉쇄 문제가 발생하면 Prepare 메세지를 보낸 참여자들 중에서 새로운 조정자를 선출한다. 참여자는 종료규약을 수행하여 봉쇄문제를 줄인다. 본 논문에서는 NB-2PC 규약의 기본적인 구조와 종료규약, 새로운 조정자 선출 방법을 제안한다. 또한 실험을 통하여 NB-2PC 규약이 3PC 규약보다 완료규약 수행시간이 우수하다는 것을 보인다.

  • PDF

GPT를 이용한 Git의 커밋메시지 분류모델 제안 (Proposal of Git's commit message classification model using GPT)

  • 최지훈;김재웅;이윤열;채의근;서현호
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2023년도 제68차 하계학술대회논문집 31권2호
    • /
    • pp.81-83
    • /
    • 2023
  • GIT의 커밋 메시지를 소프트웨어 유지보수 활동 세 가지로 분류하는 연구를 분석하고 정확도를 높일 수 있는 모델들을 분석하였고 관련 모델 중 커밋메시지와 변경된 소스를 같이 활용하는 연구들은 변경된 소스를 분석하기 위해 도구들을 대부분 활용하는데 대부분 특정 언어만 분류할 수 있는 한계가 있다. 본 논문에서는 소스 변경 데이터를 추출할 때 언어의 제약을 없애기 위해 GPT를 이용해 변경된 소스의 요약을 추출하는 과정을 추가함으로써 언어 제약의 한계를 극복할 수 있는 개선된 모델에 관한 연구를 진행하였다. 향후 본 연구 모델의 구현 및 검증을 진행하고 이를 이용해 프로젝트 진행에 활용할 수 있는 솔루션 개발 연구까지 확정해 나갈 예정이다.

  • PDF

Implementation of Git's Commit Message Classification Model Using GPT-Linked Source Change Data

  • Ji-Hoon Choi;Jae-Woong Kim;Seong-Hyun Park
    • 한국컴퓨터정보학회논문지
    • /
    • 제28권10호
    • /
    • pp.123-132
    • /
    • 2023
  • Git의 커밋 메시지는 프로젝트 진행 혹은 운영 과정에서 소스가 변경되는 이력을 관리한다. 이러한 이력 데이터를 활용하면 프로젝트 리스크와 프로젝트 현황을 파악할 수 있어 비용 절감과 시간 효율개선을 높일 수 있다. 이와 관련된 많은 연구가 진행되고 있고 이러한 연구 분야 중 커밋 메시지를 소프트웨어 유지관리의 유형으로 분류하는 연구가 있다. 발표된 연구 중 최대 분류 정확도는 95%로 보고되어 있다. 본 논문에서는 커밋 분류 모델을 이용한 솔루션 등의 활용을 목적으로 연구를 시작했고, 기존 연구 중 정확도가 가장 높은 모델이 JAVA 언어로 작성된 프로그램에만 적용할 수 있는 제약을 없애기 위한 연구를 수행하였다. 이를 위해 GPT를 이용해서 소스 변경 데이터를 자연어로 표준화하는 단계를 추가 설계하고 구현하였다. 본문은 Git에서 커밋 메시지와 소스 변경 데이터를 추출하고, GPT로 소스 변경 데이터를 표준화하는 과정과 디스틸버트(DistilBERT) 모델을 이용한 학습 과정을 설명한다. 검증 결과 91%의 정확도를 측정하였다. 제안하는 모델은 정확도를 확보하고 특정 프로그램에 종속되지 않고 분류할 수 있는 모델을 구현 및 검증하였다. 향후 Bard를 이용한 분류 모델 연구와 제안한 분류 모델을 이용해 프로젝트에 도움이 되는 관리 도구 모델에 관해 연구할 계획이다.

이동 트랜잭션의 완료율 향상을 위한 다중버전 타임스탬프 순서화 스케줄링 기법 (A Multiversion Timestamp Order Scheduling Method for Improving Commit Ratio of Mobile Transactions)

  • 김치연;황부현
    • 한국정보처리학회논문지
    • /
    • 제6권5호
    • /
    • pp.1143-1152
    • /
    • 1999
  • A Mobile computing environment is a new paradigm which provides users with the access to information irrespective of users' location. A transaction scheduling method for the mobile computing environment must be designed so that database consistency is maintained with considering the limited performance of mobile hosts and the narrow bandwidth of a wireless network. The scheduling method using a lock has some problems: the high message overhead between a server and a mobile host for maintaining a lock and the high abort ratio of the mobile transactions owing to violating the serializability when a mobile host uses a cache. So, in this paper, we propose an efficient transaction management method using timestamp to resolve these problems. The proposed method is used in the environment under which a mobile host uses a cache having two versions for each cached data item and a server maintains several versions for each data item. So, even though a mobile transaction is executed during several broadcasting interval, can be committed. As a result, the proposed method can improve the commit ratio of the mobile transactions by maintaining multiversion for each data item and does not require the additional message exchange to schedule transactions by using timestamp.

  • PDF

효율적인 S/W 유지관리를 위한 Git의 커밋메시지 복합 분류모델 제안 (Proposal of Git's Commit Message Complex Classification Model for Efficient S/W Maintenance)

  • 최지훈;김재웅;이윤열;채의근;김준용
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2022년도 제66차 하계학술대회논문집 30권2호
    • /
    • pp.123-125
    • /
    • 2022
  • Git의 커밋 메시지는 프로젝트가 진행되면서 발생하는 각종 이슈 및 코드의 변경이력을 저장하고 관리하고 있기 때문에 소프트웨어 유지관리와 프로젝트의 생명주기와 밀접한 연관성을 갖고 있다. 이러한 Git의 커밋 메시지에 대한 정확한 분석 결과는 소프트웨어 개발 및 유지관리 활동 시, 시간과 비용의 효율적인 관리에 많은 영향을 끼치고 있다. 이에 대한 기존 연구로 Git에서 발생하는 커밋 메시지를 소프트웨어 유지관리의 세 가지 형태로 분류하고 매핑하여 정확한 분석을 시도하려는 연구가 진행되었으나, 최대 87%의 정확도를 제시한 연구 결과가 있었다. 이러한 연구들은 정확도가 낮아 실제 프로젝트의 개발 및 유지관리에 적용하기에는 위험성과 어려움이 있는 현실이다. 본 논문에서는 커밋 메시지 분류에 대한 선행 연구 조사를 통해 각 연구들의 프로세스와 특징을 추출하였고, 이를 이용한 분류 정확도를 높일 수 있는 커밋 복합 분류 모델에 대해 제안한다.

  • PDF

메타 그룹을 이용한 신뢰성 있는 멀티캐스트 프로토콜의 설계 및 분석 (Design and Analysis of Reliable Multicast Protocol using Meta-Groups)

  • 이동춘;김배현;송주석
    • 한국통신학회논문지
    • /
    • 제25권1A호
    • /
    • pp.104-113
    • /
    • 2000
  • 본 연구는 전파트리 기반으로 하여 중첩된 그룹의 멤버를 고려한 메타-그룹(MG)을 노드로 하여 멀티캐스트 트리를 구성하여 트리의 깊이가 작아지고, 순서화를 이루기가 쉬워 지게 하며, 메타-그룹에 대표 수신자의 역할을 하는 Designated Manager(DM)을 두어 송신자를 대신하여 DM이 속한 메타-그룹의 멤버들에 대한 ACK 처리와 재전송을 담당하는 멀티캐스트 프로토콜을 설계한다. 시뮬레이션 분석을 통해서 송신자의 ACK 처리를 분산시키고, Commit delay를 줄이고 송신자의 overhead를 줄일 수 있어서, 기존의 프로토콜보다 우수한 성능을 보였다.

  • PDF

분산 환경에서 장기 트랜잭션의 효율적인 처리 방안 (Efficient Method of Processing Long-term Transactions for Distributed Environment)

  • 정지호;엄기환
    • 한국정보통신학회논문지
    • /
    • 제7권7호
    • /
    • pp.1498-1508
    • /
    • 2003
  • 기업은 내부의 정보체계를 프로세스나 워크플로우 중심으로 통합함으로써 고객의 요구가 달성되기까지의 과정과 시간을 최소화하고 고객의 가치를 극대화하여 기업의 시장 경쟁력을 확보하려고 한다. 그러한 통합 노력은 ERP, CORBA, DCOM둥 패키지 또는 동기식의 강력한 결합(Synchronous & Tightly-Coupled)방식에서 시작하여, 인터넷 기술의 발전으로SCM(Supply Chain Management), CRM(Customer Relationship Management), e-Business, B2B(Business-to-Business)둥이 확대됨으로써 이 기종의 다양한 플랫폼을 가진 기업간에 효율적인 통합이 가능토록 MOM(Message-Oriented Middleware)을 기반으로 한 비동기식의 유연한 결합(Asynchronous & Loosely-Coupled)방식인EAI(Enterprise Application Integration)나 웹서비스(Web Services)로 발전하고 있다. 하나의 프로세스는 기업의 목적달성을 위한 하나의 장기 트랜잭션으로 간주될 수 있다. 동기식 결합보다는 비동기식 결합 방식에서 트랜잭션의 효율적인 관리가 더욱 중요한 데, 본 고에서는 기존의 2-Phase Commit(2PC) 방식보다 트랜잭션의 효과적인 모니터링과 처리자원 낭비를 감소시킬 수 있는 방법으로써 “Classify Phase”를 추가한 3PC Protocol를 제시하고 기존의 처리 방식과 비교하여 개선된 부분을 확인해본다.

이동 컴퓨팅 환경에서 갱신가능 메시지를 이용한 캐쉬 일과성 유지 정책 (A Strategy using Updatable Message for Retaining the Cache Consistency in the Mobile Computing Environment)

  • 박성배;황부현
    • 한국정보처리학회논문지
    • /
    • 제4권7호
    • /
    • pp.1694-1705
    • /
    • 1997
  • 미래의 이동 컴퓨팅 환경에서는 휴대 가능한 랩탑 등의 이동호스트가 무선 통신 채널을 통하여 데이타베이스에 접근하는 것이 일반화될 것이다. 이동호스트는 무선 통신의 낮은 대역폭으로 인한 문제를 해결하기 위하여 자주 사용하는 데이타를 캐쉬하며, 캐쉬 데이타의 정확성을 위항 캐쉬 일관성을 유지하여야 한다. 캐쉬 일관성은 이동호스트의 무제한적인 이동과 이동호스트 지원 서버와의 빈번한 통신 단절로 인하여 위배될 수 있다. 따라서 이동호스트를 효율적으로 지원하는 캐쉬 일관성 유지 정책이 요구된다. 본 논문에서는 2단계 완료 프로토콜을 지원하는 중복 데이타베이스의 이동 컴퓨팅 환경에서 갱신가능 메시지를 이용한 정책을 제안한다. 이 정책은 이동호스트가 다른 셀로 이동할 때 캐쉬 일관성이 위배되는 문제를 해결하기 위하여 갱신가능 메시지를 사용한다. 갱신가능 메시지의 이용은 수신하지 못한 무효화 메시지의 갱신 데이타만을 찾아 다시 캐쉬하도록 지원한다. 결과적으로 제안된 정책은 임의의 데이타 변경만으로 모든 캐쉬 데이타의 제거없이 캐쉬 일관성을 유지하기 때문에 대역폭을 효율적으로 사용하는 장점을 지닌다.

  • PDF