• 제목/요약/키워드: Source file identification

검색결과 8건 처리시간 0.009초

Semantic Similarity-Based Contributable Task Identification for New Participating Developers

  • Kim, Jungil;Choi, Geunho;Lee, Eunjoo
    • Journal of information and communication convergence engineering
    • /
    • 제16권4호
    • /
    • pp.228-234
    • /
    • 2018
  • In software development, the quality of a product often depends on whether its developers can rapidly find and contribute to the proper tasks. Currently, the word data of projects to which newcomers have previously contributed are mainly utilized to find appropriate source files in an ongoing project. However, because of the vocabulary gap between software projects, the accuracy of source file identification based on information retrieval is not guaranteed. In this paper, we propose a novel source file identification method to reduce the vocabulary gap between software projects. The proposed method employs DBPedia Spotlight to identify proper source files based on semantic similarity between source files of software projects. In an experiment based on the Spring Framework project, we evaluate the accuracy of the proposed method in the identification of contributable source files. The experimental results show that the proposed approach can achieve better accuracy than the existing method based on comparison of word vocabularies.

Snort와 Suricata의 탐지 기능과 성능에 대한 비교 연구 (A Comparative Study on Function and Performance of Snort and Suricata)

  • 정명기;안성진;박원형
    • 융합보안논문지
    • /
    • 제14권5호
    • /
    • pp.3-8
    • /
    • 2014
  • 본 논문에서는 널리 사용되는 침입 탐지 시스템인 Snort와 Suricata에 대해서 탐지 기능 측면과 성능 측면을 비교해 보고자 하였다. 구체적으로 Snort와 비교해보았을 때 Suricata에는 추가된 탐지 기능과 새로 도입된 멀티 스레딩이 패킷 처리 속도에 가져다 준 변화에 대해 분석해보고자 하였다. 그 결과, Suricata에는 기존의 Snort에서는 존재하지 않았던 Protocol Identification과 HTTP Normalizer & Parser, 그리고 File Identification 기능이 추가되었다는 점을 발견할 수 있었다. 또한, 양적 처리 성능 측면에서도 Suricata의 경우 작동하는 CPU Core의 개수가 늘어날수록 Snort와의 처리성능(PPS, Packets Per Second)의 차이가 벌어지는 것으로 나타났다. 따라서 이러한 점을 볼 때, Suricata는 양적/질적측면에서 모두 Snort보다 개선된 것으로 나타났기 때문에 Snort의 대안으로 사용되기에 적절하다는 결론을 내릴 수 있었다.

Crowdsourcing Identification of License Violations

  • Lee, Sanghoon;German, Daniel M.;Hwang, Seung-won;Kim, Sunghun
    • Journal of Computing Science and Engineering
    • /
    • 제9권4호
    • /
    • pp.190-203
    • /
    • 2015
  • Free and open source software (FOSS) has created a large pool of source codes that can be easily copied to create new applications. However, a copy should preserve copyright notice and license of the original file unless the license explicitly permits such a change. Through software evolution, it is challenging to keep original licenses or choose proper licenses. As a result, there are many potential license violations. Despite the fact that violations can have high impact on protecting copyright, identification of violations is highly complex. It relies on manual inspections by experts. However, such inspection cannot be scaled up with open source software released daily worldwide. To make this process scalable, we propose the following two methods: use machine-based algorithms to narrow down the potential violations; and guide non-experts to manually inspect violations. Using the first method, we found 219 projects (76.6%) with potential violations. Using the second method, we show that the accuracy of crowds is comparable to that of experts. Our techniques might help developers identify potential violations, understand the causes, and resolve these violations.

오픈소스 소프트웨어 라이선스 파일 식별 기술 (Measurement for License Identification of Open Source Software)

  • 윤호영;조용준;정병옥;신동명
    • 한국소프트웨어감정평가학회 논문지
    • /
    • 제12권2호
    • /
    • pp.1-8
    • /
    • 2016
  • 본 논문은 오픈소스 소프트웨어의 배포과정에서 라이선스 정보가 누락, 훼손, 변경, 충돌됨에 따라 발생하는 무의적인 저작권 침해를 미연에 방지하고자 라이선스 파일을 추출/식별하는 기술을 연구하였다. 라이선스 파일이 갖는 특성을 파악하기 위해 n-gram과 TF-IDF 기법을 활용하여 322개의 라이선스 내용을 분석하였고, 이를 활용하여 패키지 내에서 라이선스 파일을 추출하였다. 추출한 라이선스는 코사인 측정법을 통해 확보한 라이선스간의 유사도를 산정하여 라이선스 정보를 식별하였다.

음원을 이용한 멀티미디어 휴대용 단말장치 판별 (Hand-held Multimedia Device Identification Based on Audio Source)

  • 이명환;장태웅;문창배;김병만;오득환
    • 한국산업정보학회논문지
    • /
    • 제19권2호
    • /
    • pp.73-83
    • /
    • 2014
  • 다양한 오디오 편집 기술이 개발됨으로써 오디오 데이터의 변경이 보다 쉬워지고 그 결과로 위변조 같은 다양한 사회 문제가 발생하고 있다. 현재 이런 문제를 해결하기 위해 디지털 포렌식 기술이 활발히 연구되어지고 있다. 본 논문에서는 이러한 디지털 포렌식 기술 중의 하나로 모바일 기기를 판별하는 방법을 제안하였다. 제안 방법에서는 사람에게는 들리지 않지만 기기의 디자인과 IC로부터 발생하는 노이즈 특징을 이용한다. 위너필터를 사용하여 기기의 노이즈 음을 추출하고 MIRtoolbox를 이용하여 특징들을 추출한 후 이를 다층 신경망에 학습시켜 기기를 판별한다. 총 6개의 모바일 기기를 사용하였으며 5-fold test를 통하여 99.9%의 판별 성능을 보였다. 또한 UCC 사이트에 업로드 된 데이터에서도 노이즈 음을 통한 판별이 가능한지 실험을 진행하였으며 99.8%의 판별 성능을 보였다.

스마트폰으로 촬영된 동영상의 출처 식별에 대한 연구 (A Study on Identification of the Source of Videos Recorded by Smartphones)

  • 김현승;최종현;이상진
    • 정보보호학회논문지
    • /
    • 제26권4호
    • /
    • pp.885-894
    • /
    • 2016
  • 스마트폰이 널리 보급됨에 따라 누구나 쉽게 사진과 동영상을 촬영하고 배포할 수 있는 시대가 되었다. 개인이 스마트폰으로 촬영한 동영상은 중요한 수사 단서나 증거로 활용되고 이때 동영상이 특정 스마트폰으로 촬영되었음을 입증해야 하는 상황이 발생한다. 이를 위해 기존 연구들에서 제시한 다양한 방식의 fingerprint 기법을 활용할 수 있다. 하지만 fingerprint 기법을 사용한 결과의 신빙성을 보강해야 하거나 그 기법을 활용할 수 없는 상황들이 존재한다. 따라서 fingerprint 기법의 사용 이전에 스마트폰 포렌식 조사가 선행되어야 하고, 동영상 파일의 메타데이터 정보를 정리한 데이터베이스를 구축할 필요가 있다. 본 논문에서는 동영상 촬영이 스마트폰에 남기는 아티팩트와 상기한 데이터베이스에 대해 설명하고자 한다.

An Accurate Log Object Recognition Technique

  • Jiho, Ju;Byungchul, Tak
    • 한국컴퓨터정보학회논문지
    • /
    • 제28권2호
    • /
    • pp.89-97
    • /
    • 2023
  • 본 논문에서는 로그 분석을 어렵게 하는 요인을 제안하고 이후 분석에 도움을 주는 로그 내 다양한 객체 인식 기법을 설계한다. 오늘날의 IT 시스템에서 로그는 다수의 고급 AI 분석 기술의 핵심적인 원천 데이터이다. 로그에는 유용한 정보가 많이 포함되어 있지만 로그는 본질적으로 반구조화되어 있기 때문에 로그 내 유용 정보에 기술을 직접적으로 적용시키기 어렵다. 로그 분석을 방해하는 요소는 file path, identifier, json 등 다양한 객체이다. 이러한 객체에 대한 BERT기반의 패턴 인식 알고리즘을 설계하고 객체 인식을 수행한다. 본 실험에서 정의한 패턴 인식 알고리즘은 객체의 정의, GROK 패턴, 그리고 정규 표현식에 기반한다. 기존에 알려진 패턴과 정규 표현식을 기반으로 한 간단한 패턴 매칭이 효과적이지 않다는 것을 확인할 수 있었다. 그 결과 기존 패턴과 정규 표현식만을 사용하는 것보다 훨씬 나은 정확도를 보여준다. 또한, BERT 모델의 경우 인식 객체 이외의 객체를 분류하는 정확도가 99%에 달하는 것을 확인할 수 있다.

디지털 카메라의 렌즈 왜곡 보정에 사용된 보간 패턴 추출을 통한 카메라 식별 방법 (Digital Camera Identification Based on Interpolation Pattern Used Lens Distortion Correction)

  • 황민구;김동민;하동환
    • 인터넷정보학회논문지
    • /
    • 제13권3호
    • /
    • pp.49-59
    • /
    • 2012
  • 촬영된 카메라의 기초 정보를 담고 있는 EXIF 파일을 편집 프로그램들을 통해 삭제 또는 변형하게 되어 우리 주변에서 출처를 알 수 없는 이미지들이 상당수 존재하게 되었다. 이와 같은 문제점은 디지털 이미지의 출처를 왜곡하여 공공기관에서 사건의 분석 및 감정에 혼선을 줄 수 있다. 특히 증거의 출처를 명시하는 법정 기관에 출처가 삭제, 변형된 EXIF 파일을 가진 디지털 사진은 객관적 증거의 역할을 할 수 없다. 본 논문은 이와 같은 문제를 해결하기 위한 연구로써 촬영에 사용된 카메라의 신원을 추적하는 데 목적이 있다. 이를 위해 본 논문은 디지털카메라 이미지 프로세싱에서 사용하는 렌즈 왜곡 보정 알고리즘을 주목하였다. 렌즈 왜곡 보정은 맵핑 알고리즘을 이용하며 이 때 위신호 인공물(Aliasing artifact)와 복원 인공물(Reconstruction artifact)의 발생을 제거하기 위한 보간 알고리즘을 사용한다. 여기서 보간은 맵핑의 패턴과 유사한 형태로 나타나며 이 보간의 흔적을 찾는 것이 연구의 핵심이다. 본 논문에서는 맵핑에 사용된 보간 패턴을 검출하기 위해 미니멈 필터(Minimum Filter)를 이용한 검출 알고리즘을 제안하였다. 보간이 발생한 영역과 그렇지 않은 영역을 분류하여 두 영역에 동일한 미니멈 필터를 적용한다. 이를 DFT를 통해 각 영역간의 주파수 특성이 어떻게 나타나는지 확인하였다. 이 결과를 바탕으로 두 영역간의 차분값을 활용하여 최종 검출 맵으로 구현하였다.