• 제목/요약/키워드: Data Fragment Classification

검색결과 6건 처리시간 0.02초

Evaluation of the classification method using ancestry SNP markers for ethnic group

  • Lee, Hyo Jung;Hong, Sun Pyo;Lee, Soong Deok;Rhee, Hwan seok;Lee, Ji Hyun;Jeong, Su Jin;Lee, Jae Won
    • Communications for Statistical Applications and Methods
    • /
    • 제26권1호
    • /
    • pp.1-9
    • /
    • 2019
  • Various probabilistic methods have been proposed for using interpopulation allele frequency differences to infer the ethnic group of a DNA specimen. The selection of the statistical method is critical because the accuracy of the statistical classification results vary. For the ancestry classification, we proposed a new ancestry evaluation method that estimate the combined ethnicity index as well as compared its performance with various classical classification methods using two real data sets. We selected 13 SNPs that are useful for the inference of ethnic origin. These single nucleotide polymorphisms (SNPs) were analyzed by restriction fragment mass polymorphism assay and followed by classification among ethnic groups. We genotyped 400 individuals from four ethnic groups (100 African-American, 100 Caucasian, 100 Korean, and 100 Mexican-American) for 13 SNPs and allele frequencies that differed among the four ethnic groups. Additionally, we applied our new method to HapMap SNP genotypes for 1,011 samples from 4 populations (African, European, East Asian, and Central-South Asian). Our proposed method yielded the highest accuracy among statistical classification methods. Our ethnic group classification system based on the analysis of ancestry informative SNP markers can provide a useful statistical tool to identify ethnic groups.

The Concept and Application Methods of Intelligent Content

  • Yoon Yong-Bae;Chae Song-Hwa;Kim Won-Il
    • International Journal of Contents
    • /
    • 제2권3호
    • /
    • pp.1-5
    • /
    • 2006
  • Intelligent Content is defined as detailed information or fragment of content which contains a semantic data structure. This semantic structure makes possible to do various intelligent operations. There are wide range of content-oriented applications such as classification, retrieval, extraction, translation, presentation and question-answering. The concept of Intelligent Content is applied to various fields like MPEG and Semantic Web. In this paper, we discuss the several important researches of Intelligent Content and how to apply this conception to these fields.

  • PDF

Comparison of RAPD, AFLP, and EF -1 α Sequences for the Phylogenetic Analysis of Fusarium oxysporum and Its formae speciales in Korea

  • Park, Jae-Min;Kim, Gi-Young;Lee, Song-Jin;Kim, Mun-Ok;Huh, Man-Kyu;Lee, Tae-Ho;Lee, Jae-Dong
    • Mycobiology
    • /
    • 제34권2호
    • /
    • pp.45-55
    • /
    • 2006
  • Although Fursarium oxysporum causes diseases in economically important plant hosts, identification of F. oxysporum formae speciales has been difficult due to confusing phenotypic classification systems. To resolve these complexity, we evaluated genetic relationship of nine formae speciales of F. oxysporum with random amplified polymorphic DNA (RAPD), amplified fragment length polymorphism (AFLP), and translation elongation factor-l alpha ($EF-1{\alpha}$) gene. In addition, the correlation between mycotoxin content of fusaric acid and isolates based on molecular marker data was evaluated using the modified Mantel's test. According to these result, these fusaric acid-producing strains could not identify clearly, and independent of geographic locations and host specificities. However, in the identification of F. oxysporum formae speciales, especially, AFLP analysis showed a higher discriminatory power than that of a the RAPD and $EF-1{\alpha}$ analyses, all three techniques were able to detect genetic variability among F. oxysporum formae speciales in this study.

바이트 평균의 Gray-Scale화를 통한 Signature가 존재하지 않는 멀티미디어 데이터 조각 파일 타입 분류 연구 (Classification of Non-Signature Multimedia Data Fragment File Types With Byte Averaging Gray-Scale)

  • 윤현호;김재헌;조현수;원종은;김견우;조재현
    • 정보보호학회논문지
    • /
    • 제30권2호
    • /
    • pp.189-196
    • /
    • 2020
  • 일반적으로 시그니처와 파일 메타정보가 없는 파편화된 파일은 복구가 어렵다. 특히 멀티미디어 파일은 파편화 가능성이 크고 높은 엔트로피를 가지고 있으므로 현재 시그니처 기반의 카빙으로는 복구하는 것이 거의 불가능하다. 이러한 문제를 해결하기 위해 파편화된 파일에 대한 연구가 진행되고 있지만 멀티미디어 파일에 대한 연구는 부족한 실정이다. 본 논문은 시그니처(Signature)와 파일 메타정보가 없는 파편화된 멀티미디어 파일의 타입을 분류하는 연구이다. 파일 타입에 따라 특정 바이트 값의 빈도 차이를 통해 각 파일 타입의 특징값을 추출하며, 그에 맞는 Gray-Scale 테이블을 설계하고 CNN(Convolutional Neural Networks) 모델을 이용하여 JPG, PNG, H.264, WAV 총 4가지 멀티미디어의 파일 타입을 분류하는 방법을 제시한다. 본 논문을 통해 시그니처와 파일 메타정보가 없는 파편화된 파일 타입의 분류 연구를 촉진하여 다양한 파일의 복구 가능성을 높일 수 있을 것으로 기대된다.

RAPD, ISSR과 PCR-RFLP를 이용한 한국산 제비꽃속(Viola)의 종간 유연관계 (Interspecific relationships of Korean Viola based on RAPD, ISSR and PCR-RFLP analyses)

  • 유기억;이우철;권오근
    • 식물분류학회지
    • /
    • 제34권1호
    • /
    • pp.43-61
    • /
    • 2004
  • 한국산 제비꽃속 32분류군과 일본산 2집단 등 총 34집단에 대한 유연관계를 알아보기 위하여 RAPD(randomly amplified polymorphic DNA), ISSR(inter simple sequence repeat) 및 PCR-RFLP(restriction fragment length polymorphism) 분석을 실시하였다. RAPD 분석에서는 40개의 primer 중 6개가 분류군 전체에서 반응을 보였고 이로부터 총 70개(98.6%)의 다형화 밴드를 얻었으며, ISSR 분석에서는 4개의 primer로 부터 28개(96.6%)의 다형화밴드를 얻었다. 엽록체 DNA의 non-coding부분을 이용한 PCR-RFLP 분석에서는 반응이 일어난 4지역에서 증폭된 약 6.78 kb의 DNA 각각에 대하여 15가지 제한효소를 처리한 결과 총 80개의 restriction site를 얻었으며 그중 16 site는 polymorphic하게 나타나 20%의 다형화를 보였다. 본 연구에서 다룬 3가지 형질에 의한 유집분석 결과 각각의 형질에 의해서는 서로 일치하지 않는 유집형태를 보였지만 3가지 형질을 통합한 결과는 진정제비꽃절(sect. Nomimium)내 아절과 계열간 구분이 명확하게 나타났으며 무경종과 유경종도 구별이 가능하여 외부형태형질에 의한 기존의 분류체계와 일치하였다. 그러나 노랑제비꽃절(sect. Chamaemelanium)은 진정제비꽃절과 독립적인 군을 형성하지 않고 진정제비꽃절 내 무경종그룹인 Patellares아절과 Vaginatae아절 사이에 위치하여 나타났다. 형태적인 변이가 매우 심한 분류군으로 알려진 태백제비꽃군(V. albida complex)은 Patellares아절 내에서 하나의 군으로 유집되어 Pinnatae계열로 처리하는 것이 타당할 것으로 생각된다. 본 연구에서 사용한 3가지 형질 중 RAPD 분석방법은 ISSR과 PCR-RFLP 분석보다 제비꽃속의 종간 유연관계를 밝히는데 더 유용한 것으로 판단된다.

CNN과 GRU를 활용한 파일 유형 식별 및 분류 (File Type Identification Using CNN and GRU)

  • 성민규;손태식
    • Journal of Platform Technology
    • /
    • 제12권2호
    • /
    • pp.12-22
    • /
    • 2024
  • 현대 사회에서의 디지털 데이터의 빠른 증가로 디지털 포렌식이 핵심적인 역할을 하고 있으며, 파일 유형 식별은 그 중에서 중요한 부분 중 하나이다. 파일 유형을 빠르고 정확하게 식별하기 위해서 인공지능을 사용한 파일 유형 식별 모델 개발 연구가 진행되고 있다. 그러나 기존 연구들은 일부 국내 점유율이 높은 파일을 식별할 수 없어, 국내에서 사용하기에 부족함이 있다. 따라서 본 논문에서는 CNN과 GRU를 활용한 더욱 정확하고 강력한 파일 유형 식별 모델을 제안한다. 기존 방법의 한계를 극복하기 위해 제안한 모델은 FFT-75 데이터셋에서 가장 우수한 성능을 보이며, 국내에서 높은 점유율을 가지는 HWP, ALZ, EGG와 같은 파일 유형도 효과적으로 식별할 수 있다. 제안한 모델과 세 개의 기존 연구 모델(CNN-CO, FiFTy, CNN-LSTM)을 서로 비교하여 모델 성능을 검증하였다. 최종적으로 CNN과 GRU 기반의 파일 유형 식별 및 분류 모델은 512바이트 파일 조각에서 68.2%의 정확도를, 4096바이트 파일 조각에서는 81.4%의 정확도를 달성하였다.

  • PDF