• 제목/요약/키워드: Sequence Classification

검색결과 401건 처리시간 0.022초

재발량 분석을 이용한 음향 상황 인지 (Acoustic scene classification using recurrence quantification analysis)

  • 박상욱;최우현;고한석
    • 한국음향학회지
    • /
    • 제35권1호
    • /
    • pp.42-48
    • /
    • 2016
  • 동일한 장소에서도 매우 다양한 음향이 발생하고, 서로 다른 장소에서도 유사한 음향이 발생하기 때문에 훈련 데이터가 적거나, 훈련 단계에서 일부 음향만 고려된 경우 음향 상황 인지 성능을 보장할 수 없다. 이러한 문제점을 해결하기 위한 방법으로 Bag of Words (BOW) 기반 히스토그램 특징이 소개되었다. 하지만 BOW 기반 히스토그램 특징은 일정 시간동안 발생한 음향의 분포를 이용하기 때문에 음향이 발생한 순차적인 정보는 고려할 수 없다. 음향 상황 인지에서 일정 시간 동안 발생한 음향의 주기성과 지속성은 상황을 인지하는데 중요한 정보가 될 수 있다. 따라서 본 논문에서는 재발량 분석을 이용하여 주기성과 지속성에 대한 특징을 추출하였다. 인식 실험에서 재발량 분석을 통해 추출된 특징을 함께 사용한 경우 기존 방법들 보다 향상된 성능을 확인했다.

단어의 의미와 문맥을 고려한 순환신경망 기반의 문서 분류 (Document Classification using Recurrent Neural Network with Word Sense and Contexts)

  • 주종민;김남훈;양형정;박혁로
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제7권7호
    • /
    • pp.259-266
    • /
    • 2018
  • 본 논문에서는 단어의 순서와 문맥을 고려하는 특징을 추출하여 순환신경망(Recurrent Neural Network)으로 문서를 분류하는 방법을 제안한다. 단어의 의미를 고려한 word2vec 방법으로 문서내의 단어를 벡터로 표현하고, 문맥을 고려하기 위해 doc2vec으로 입력하여 문서의 특징을 추출한다. 문서분류 방법으로 이전 노드의 출력을 다음 노드의 입력으로 포함하는 RNN 분류기를 사용한다. RNN 분류기는 신경망 분류기 중에서도 시퀀스 데이터에 적합하기 때문에 문서 분류에 좋은 성능을 보인다. RNN에서도 그라디언트가 소실되는 문제를 해결해주고 계산속도가 빠른 GRU(Gated Recurrent Unit) 모델을 사용한다. 실험 데이터로 한글 문서 집합 1개와 영어 문서 집합 2개를 사용하였고 실험 결과 GRU 기반 문서 분류기가 CNN 기반 문서 분류기 대비 약 3.5%의 성능 향상을 보였다.

다수의 특징과 이진 분류 트리를 이용한 장면 전환 검출 (Shot Change Detection Using Multiple Features and Binary Decision Tree)

  • 홍승범;백중환
    • 한국통신학회논문지
    • /
    • 제28권5C호
    • /
    • pp.514-522
    • /
    • 2003
  • 본 논문에서는 다수의 특징과 이진 분류 트리를 이용하여 장면 전환점(shot change)을 검출하는 향상된 방식을 제안한다. 기존의 장면 전환점 검출 방식에서는 인접한 프레임간에 단일 특징과 고정된 임계값을 주로 사용하였다. 하지만, 비디오 시퀀스 내의 장면 전환점에서는 인접한 프레임간의 내용(content)인 컬러, 모양, 배경 혹은 질감 등이 동시에 변화한다. 따라서 본 논문에서는 단일 특징보다는 상호 보완 관계를 갖는 다수의 특징을 이용하여 장면 전환점을 효율적으로 검출한다. 그리고 장면 전환점의 분류를 위해서는 이진 분류 트리(binary classification tree)를 이용한다. 이 분류 결과에 따라 장면 전환점 검출에 사용될 중요한 특징들을 선별하고, 각 특징들의 최적 임계값을 구한다. 또한, 분류 성능을 확인하기 위해 교차검증(cross-validation)과 드롭 케이스(drop-case)를 수행하였다. 실험 결과, 제안된 기법이 단일 특징들만을 사용한 기존의 방법들 보다 El(Evaluated Index, 성능평가지수)에서 평균 2%의 성능이 향상됨을 알 수 있었다.

DBN을 이용한 다중 방위 데이터 기반 능동소나 표적 식별 (Multiaspect-based Active Sonar Target Classification Using Deep Belief Network)

  • 김동욱;배건성;석종원
    • 한국정보통신학회논문지
    • /
    • 제22권3호
    • /
    • pp.418-424
    • /
    • 2018
  • 수중 표적 탐지 및 식별은 군사 및 비군사적으로 중요한 문제이다. 최근 패턴인식 분야에서 딥러닝 기술이 발전되면서 많은 성능개선 결과가 발표되고 있다. 그중 DBN(Deep Belief Network)기법은 DNN(Deep Neural Network)을 사전 훈련하는데 사용되어 좋은 성능을 보여주고 있다. 본 논문에서는 능동 소나를 이용한 수중 표적의 식별 문제에 DBN을 사용하여 실험을 진행하고, 그 결과를 비교하였다. 표적신호는 3차원 하이라이트 모델을 사용하여 합성된 능동 소나 신호를 사용하였고, 특징추출 방법으로는 FrFT(Fractional Fourier Transform) 기반의 특징추출을 사용하였다. 단일 센서, 즉, 단일 방위 데이터 기반의 실험에서 DBN을 이용한 식별 결과는 기존의 BPNN(Back Propagation Neural Network)에 비해 약 3.83 % 향상되었다. 또한, 다중 방위 기반의 식별 실험에서는 관측열의 개수가 3을 초과하면 95% 이상의 성능을 얻을 수 있었다.

Compromised extraction sockets: a new classification and prevalence involving both soft and hard tissue loss

  • Kim, Jung-Ju;Amara, Heithem Ben;Chung, Inna;Koo, Ki-Tae
    • Journal of Periodontal and Implant Science
    • /
    • 제51권2호
    • /
    • pp.100-113
    • /
    • 2021
  • Purpose: Previous studies have solely focused on fresh extraction sockets, whereas in clinical settings, alveolar sockets are commonly associated with chronic inflammation. Because the extent of tissue destruction varies depending on the origin and the severity of inflammation, infected alveolar sockets may display various configurations of their remaining soft and hard tissues following tooth extraction. The aim of this study was to classify infected alveolar sockets and to provide the appropriate treatment approaches. Methods: A proposed classification of extraction sockets with chronic inflammation was developed based upon the morphology of the bone defect and soft tissue at the time of tooth extraction. The prevalence of each type of the suggested classification was determined retrospectively in a cohort of patients who underwent, between 2011 and 2015, immediate bone grafting procedures (ridge preservation/augmentation) after tooth extractions at Seoul National University Dental Hospital. Results: The extraction sockets were classified into 5 types: type I, type II, type III, type IV (A & B), and type V. In this system, the severity of bone and soft tissue breakdown increases from type I to type V, while the reconstruction potential and treatment predictability decrease according to the same sequence of socket types. The retrospective screening of the included extraction sites revealed that most of the sockets assigned to ridge preservation displayed features of type IV (86.87%). Conclusions: The present article classified different types of commonly observed infected sockets based on diverse levels of ridge destruction. Type IV sockets, featuring an advanced breakdown of alveolar bone, appear to be more frequent than the other socket types.

Structural SVM을 이용한 백과사전 문서 내 생략 문장성분 복원 (Restoring Omitted Sentence Constituents in Encyclopedia Documents Using Structural SVM)

  • 황민국;김영태;나동열;임수종;김현기
    • 지능정보연구
    • /
    • 제21권2호
    • /
    • pp.131-150
    • /
    • 2015
  • 영어와 달리 한국어나 일본어 문장의 경우 용언의 필수격을 채우는 명사구가 생략되는 무형대용어 현상이 빈번하다. 특히 백과사전이나 위키피디아의 문서에서 표제어로 채울 수 있는 격의 경우 그 격이 문장에서 더 쉽게 생략된다. 정보검색, 질의응답 시스템 등 주요 지능형 응용시스템들은 백과사전류의 문서에서 주요한 정보를 추출하여 수집하여야 한다. 그러나 이러한 명사구 생략 현상으로 인해 양질의 정보추출이 어렵다. 본 논문에서는 백과사전 종류 문서에서 생략된 명사구 즉 무형대용어를 복원하는 시스템의 개발을 다루었다. 우리 시스템이 다루는 문제는 자연어처리의 무형대용어 해결 문제와 거의 유사하나, 우리 문제의 경우 문서의 일부가 아닌 표제어도 복원에 이용할 수 있다는 점이 다르다. 무형대용어 복원을 위해서는 먼저 무형대용어의 탐지 즉 문서 내에서 명사구 생략이 일어난 곳을 찾는 작업을 수행한다. 그 다음 무형대용어의 선행어 탐색 즉 무형대용어의 복원에 사용될 명사구를 문서 내에서 찾는 작업을 수행한다. 문서 내에서 선행어를 발견하지 못하면 표제어를 이용한 복원을 시도해 본다. 우리 방법의 특징은 복원에 사용된 문장성분을 찾기 위해 Structural SVM을 사용하는 것이다. 문서 내에서 생략이 일어난 위치보다 앞에 나온 명사구들에 대해 Structural SVM에 의한 시퀀스 레이블링(sequence labeling) 작업을 시행하여 복원에 이용 가능한 명사구인 선행어를 찾아내어 이를 이용하여 복원 작업을 수행한다. 우리 시스템의 성능은 F1 = 68.58로 측정되었으며 이는 의미정보의 이용 없이 달성한 점을 감안하면 높은 수준으로 평가된다.

Characterization of the Bovine Endogenous Retrovirus β3 Genome

  • Xiao, Rui;Kim, Juhyun;Choi, Hojun;Park, Kwangha;Lee, Hoontaek;Park, Chankyu
    • Molecules and Cells
    • /
    • 제25권1호
    • /
    • pp.142-147
    • /
    • 2008
  • We recently used degenerate PCR and locus-specific PCR methods to identify the endogenous retroviruses (ERV) in the bovine genome. Using the ovine ERV classification system, the bovine ERVs (BERVs) could be classified into four families. Here, we searched the most recently released bovine genome database with the partial nucleotide sequence of the pro/pol region of the BERV ${\beta}3$ family. This allowed us to obtain and analyze the complete genome of BERV ${\beta}3$. The BERV ${\beta}3$ genome is 7666 nucleotides long and has the typical retroviral organization, namely, 5'-long terminal repeat (LTR)-gag-pro-pol-env-LTR-3'. The deduced open reading frames for gag, pro, pol and env of BERV ${\beta}3$ en- code 507, 271, 879 and 603 amino acids, respectively. BERV ${\beta}3$ showed little amino acid similarity to other betaretroviruses. Phylogenetic analysis showed that it clusters with HERV-K. This is the first report describing the genetic structure and sequence of an entire BERV.

Analysis of Expressed Sequence Tags from the Wood-Decaying Fungus Fomitopsis palustris and Identification of Potential Genes Involved in the Decay Process

  • Karim, Nurul;Shibuya, Hajime;Kikuchi, Taisei
    • Journal of Microbiology and Biotechnology
    • /
    • 제21권4호
    • /
    • pp.347-358
    • /
    • 2011
  • Fomitopsis palustris, a brown-rot basidiomycete, causes the most destructive type of decay in wooden structures. In spite of its great economic importance, very little information is available at the molecular level regarding its complex decay process. To address this, we generated over 3,000 expressed sequence tags (ESTs) from a cDNA library constructed from F. palustris. Clustering of 3,095 high-quality ESTs resulted in a set of 1,403 putative unigenes comprising 485 contigs and 918 singlets. Homology searches based on BlastX analysis revealed that 78% of the F. palustris unigenes had a significant match to proteins deposited in the nonredundant databases. A subset of F. palustris unigenes showed similarity to the carbohydrateactive enzymes (CAZymes), including a range of glycosyl hydrolase (GH) family proteins. Some of these CAZyme-encoded genes were previously undescribed for F. palustris but predicted to have potential roles in biodegradation of wood. Among them, we identified and characterized a gene (FpCel45A) encoding the GH family 45 endoglucanase. Moreover, we also provided functional classification of 473 (34%) of F. palustris unigenes using the Gene Ontology hierarchy. The annotated EST data sets and related analysis may be useful in providing an initial insight into the genetic background of F. palustris.

운동심상 EEG 패턴분석을 위한 HSA 기반의 HMM 최적화 방법 (HSA-based HMM Optimization Method for Analyzing EEG Pattern of Motor Imagery)

  • 고광은;심귀보
    • 제어로봇시스템학회논문지
    • /
    • 제17권8호
    • /
    • pp.747-752
    • /
    • 2011
  • HMMs (Hidden Markov Models) are widely used for biological signal, such as EEG (electroencephalogram) sequence, analysis because of their ability to incorporate sequential information in their structure. A recent trends of research are going after the biological interpretable HMMs, and we need to control the complexity of the HMM so that it has good generalization performance. So, an automatic means of optimizing the structure of HMMs would be highly desirable. In this paper, we described a procedure of classification of motor imagery EEG signals using HMM. The motor imagery related EEG signals recorded from subjects performing left, right hand and foots motor imagery. And the proposed a method that was focus on the validation of the HSA (Harmony Search Algorithm) based optimization for HMM. Harmony search algorithm is sufficiently adaptable to allow incorporation of other techniques. A HMM training strategy using HSA is proposed, and it is tested on finding optimized structure for the pattern recognition of EEG sequence. The proposed HSA-HMM can performs global searching without initial parameter setting, local optima, and solution divergence.

Expressed Sequence Tag Analysis of Antarctic Hairgrass Deschampsia antarctica from King George Island, Antarctica

  • Lee, Hyoungseok;Cho, Hyun Hee;Kim, Il-Chan;Yim, Joung Han;Lee, Hong Kum;Lee, Yoo Kyung
    • Molecules and Cells
    • /
    • 제25권2호
    • /
    • pp.258-264
    • /
    • 2008
  • Deschampsia antarctica is the only monocot that thrives in the tough conditions of the Antarctic region. It is an invaluable resource for the identification of genes associated with tolerance to various environmental pressures. In order to identify genes that are differentially regulated between greenhouse-grown and Antarctic field-grown plants, we initiated a detailed gene expression analysis. Antarctic plants were collected and greenhouse plants served as controls. Two different cDNA libraries were constructed with these plants. A total of 2,112 cDNA clones was sequenced and grouped into 1,199 unigene clusters consisting of 243 consensus and 956 singleton sequences. Using similarity searches against several public databases, we constructed a functional classification of the ESTs into categories such as genes related to responses to stimuli, as well as photosynthesis and metabolism. Real-time PCR analysis of various stress responsive genes revealed different patterns of regulation in the different environments, suggesting that these genes are involved in responses to specific environmental factors.