• 제목/요약/키워드: Sequence Classification

검색결과 400건 처리시간 0.028초

A New Method to Find Bars

  • Lee, Yun Hee;Ann, Hong Bae;Park, Myeong-Gu
    • 천문학회보
    • /
    • 제39권1호
    • /
    • pp.40.1-40.1
    • /
    • 2014
  • We have classified barred galaxies for 418 RC3 sample galaxies within z < 0.01 from SDSS DR7 using the visual inspection, ellipse fitting method and Fourier analysis. We found the bar fraction to be ~60%, 43% and 70% for each method and that the ellipse fitting method tends to miss the bar when a large bulge hides the transition from bar to disk in early spirals. We also confirmed that the Fourier analysis cannot distinguish between a bar and spiral arm structure. These systematic difficulties may have produced the long-time controversy about bar fraction dependence on Hubble sequence, mass and color. We designed a new method to fine bars by analyzing the ratio map of bar strength in polar coordinates, which yields the bar fraction of ~27% and ~32% for SAB and SB, respectively. The consistency with visual inspection reaches around 70%, and roughly 90% of visual strong bar are classified as SAB and SB in our classification. Although our method also has a weakness that a large bulge lowers the value of bar strength, the missing bar fraction in early spirals is reduced to the level of ~1/4 compared to the ellipse fitting method. Our method can make up for the demerits of the previous automatic classifications and provide a quantitative bar classification that agrees with visual classification.

  • PDF

CNN을 이용한 발화 주제 다중 분류 (Multi-labeled Domain Detection Using CNN)

  • 최경호;김경덕;김용희;강인호
    • 한국어정보학회:학술대회논문집
    • /
    • 한국어정보학회 2017년도 제29회 한글및한국어정보처리학술대회
    • /
    • pp.56-59
    • /
    • 2017
  • CNN(Convolutional Neural Network)을 이용하여 발화 주제 다중 분류 task를 multi-labeling 방법과, cluster 방법을 이용하여 수행하고, 각 방법론에 MSE(Mean Square Error), softmax cross-entropy, sigmoid cross-entropy를 적용하여 성능을 평가하였다. Network는 음절 단위로 tokenize하고, 품사정보를 각 token의 추가한 sequence와, Naver DB를 통하여 얻은 named entity 정보를 입력으로 사용한다. 실험결과 cluster 방법으로 문제를 변형하고, sigmoid를 output layer의 activation function으로 사용하고 cross entropy cost function을 이용하여 network를 학습시켰을 때 F1 0.9873으로 가장 좋은 성능을 보였다.

  • PDF

GROTHENDIECK GROUP FOR SEQUENCES

  • Yu, Xuan
    • 대한수학회지
    • /
    • 제59권1호
    • /
    • pp.171-192
    • /
    • 2022
  • For any category with a distinguished collection of sequences, such as n-exangulated category, category of N-complexes and category of precomplexes, we consider its Grothendieck group and similar results of Bergh-Thaule for n-angulated categories [1] are proven. A classification result of dense complete subcategories is given and we give a formal definition of K-groups for these categories following Grayson's algebraic approach of K-theory for exact categories [4].

영구치의 치근발육과 맹출시기의 분류에 관한 연구 (A Study on the Classification of the Stage of Root Development and Crown Eruption for Permanent Teeth)

  • 김재창;한경수
    • Journal of Oral Medicine and Pain
    • /
    • 제24권1호
    • /
    • pp.95-106
    • /
    • 1999
  • This study was performed to investigate the age distribution with tooth calcification and degree of eruption of permanent teeth. For the study, healthy 184 patients from 5 to 19 years old without any previous serious dental treatment were randomly selected, and intraoral standard films and dental casts were taken for evaluation of stage of calcification and degree of eruption, respectively. Tooth calcification of 13 stages, designed by the author based on the Nolla's classification and eruption level of 4 or 5 degree was used. Data were processed by SAS/Stat program and the obtained results were as follows; 1. The age of root completed with open apex in lower posterior teeth were 13.8 years for first premolar, 14.0 years for second premolar, 10.5 years for first molar, and 14.2 years for second molar. There were no significant difference between right and left side. 2. As for the sequence of eruption, first molar was the first teeth erupted in upper arch, while central incisor was the first teeth in lower arch. In general, eruption of lower teeth were slightly earlier than the corresponding teeth of upper arch. 3. There were no difference of age of the same stage of development between Nolla's and the author's classification. From the results, the author's classification can be used for estimation of age with more finely in age of 8 to 15 years old. 4. Multiple regression equations for age with Nolla's(Ns) and the author's(Ks) classification of tooth calcification, and degree of eruption(DE) were as follow; Age(by #34) = 7.55 + 0.76Ks34 + 0.80DE34 - 0.72Ns34 Age(by #35) = 7.10 + 0.81Ks35 + 0.6IDE35 Age(by #37) = 6.61 + 0.82Ks37 + 0.5IDE37. Age(by #44) = 7.02 + 0.62Ks44 + 0.82DE44 Age(by #45) = 8.04 + 0.93Ks45 + 0.64DE45 - 0.89Ns45 Age(by #47) = 6.40 + 0.86Ks47 + 0.56DE47.

  • PDF

통계 시그니쳐 기반의 응용 트래픽 분류 (Statistic Signature based Application Traffic Classification)

  • 박진완;윤성호;박준상;이상우;김명섭
    • 한국통신학회논문지
    • /
    • 제34권11B호
    • /
    • pp.1234-1244
    • /
    • 2009
  • 오늘날의 네트워크에서는 다양한 응용의 등장으로 인해 트래픽이 복잡 다양해지고 있다. 이러한 상황 속에서 트래픽의 응용 별 분류에 대한 중요성은 날이 갈수록 증가하고 있다. 트래픽의 응용 별 분류에 대한 요구에 따라 기존에도 많은 연구가 이루어졌었다. 포트 기반의 분류, 페이로드 기반의 분류, 머신러닝 기반의 분류 방법들이 제안되었는데 아직 트래픽을 완벽하게 분류해내는 방법론은 개발되지 않은 실정이다. 최근 연구 중에는 플로우의 통계 정보를 이용한 방법론이 많이 연구되고 있다. 본 논문에서는 통계 시그니쳐를 통한 응용 트래픽 분류 방법론을 제안하고자 한다. 플로우 중 첫 N개의 패킷의 페이로드 크기와 방향을 이용하여 통계 시그니쳐를 생성하고, 이를 이용하여 응용 트래픽을 분류한다. 그리고 검증 시스템을 통해 본 분류 방법론이 높은 정확도의 분류 방법론이라는 것을 보인다.

목적 지향 대화를 위한 효율적 질의 의도 분석에 관한 연구 (Effective Text Question Analysis for Goal-oriented Dialogue)

  • 김학동;고명현;임헌영;이유림;지민규;김원일
    • 방송공학회논문지
    • /
    • 제24권1호
    • /
    • pp.48-57
    • /
    • 2019
  • 본 연구는 목적 지향 대화 시스템 내에서 단일 한국어 텍스트 형식의 질문으로부터 질의자의 의도를 파악하는 것을 목적으로 한다. 목적 지향 대화 시스템은 텍스트 또는 음성을 통한 사용자의 특수한 요구를 만족시켜주는 대화 시스템을 의미한다. 의도 분석 과정은 답변 생성에 앞서 사용자의 질의 의도를 파악하는 단계로, 목적 지향 대화 시스템 전체의 성능에 큰 영향을 준다. 생활화학제품이라는 특정 분야에 제안 모델을 사용하였고, 해당 분야와 관련된 한국어 텍스트 데이터를 이용하였다. 특정 분야에 독립적이며 범용적인 의도를 의미하는 화행과, 특정 분야에 종속적인 의도를 의미하는 개념열로 나누어 분석한다. 화행과 개념열을 분석하기 위하여 단어 임베딩 모델, 합성곱 신경망을 이용한 분류 방법을 제안한다. 단어 임베딩 모델을 통하여 단어의 의미정보를 추상화하고, 추상화된 단어의 의미정보를 기반으로 합성곱 신경망을 통하여 개념열 및 화행 분류를 수행한다.

공간과 시간적 특징 융합 기반 유해 비디오 분류에 관한 연구 (Using the fusion of spatial and temporal features for malicious video classification)

  • 전재현;김세민;한승완;노용만
    • 정보처리학회논문지B
    • /
    • 제18B권6호
    • /
    • pp.365-374
    • /
    • 2011
  • 최근 인터넷, IPTV/SMART TV, 소셜 네트워크 (social network)와 같은 정보 유통 채널의 다양화로 유해 비디오 분류 및 차단 기술 연구에 대한 요구가 높아가고 있으나, 현재까지는 비디오에 대한 유해성을 판단하는 연구는 부족한 실정이다. 기존 유해 이미지 분류 연구에서는 이미지에서의 피부 영역의 비율이나 Bag of Visual Words (BoVW)와 같은 공간적 특징들 (spatial features)을 이용하고 있다. 그러나, 비디오에서는 공간적 특징 이외에도 모션 반복성 특징이나 시간적 상관성 (temporal correlation)과 같은 시간적 특징들 (temporal features)을 추가적으로 이용하여 유해성을 판단할 수 있다. 기존의 유해 비디오 분류 연구에서는 공간적 특징과 시간적 특징들에서 하나의 특징만을 사용하거나 두 개의 특징들을 단순히 결정 단계에서 데이터 융합하여 사용하고 있다. 일반적으로 결정 단계 데이터 융합 방법은 특징 단계 데이터 융합 방법보다 높은 성능을 가지지 못한다. 본 논문에서는 기존의 유해 비디오 분류 연구에서 사용되고 있는 공간적 특징과 시간적 특징들을 특징 단계 융합 방법을 이용하여 융합하여 유해 비디오를 분류하는 방법을 제안한다. 실험에서는 사용되는 특징이 늘어남에 따른 분류 성능 변화와 데이터 융합 방법의 변화에 따른 분류 성능 변화를 보였다. 공간적 특징만을 이용하였을 때에는 92.25%의 유해 비디오 분류 성능을 보이는데 반해, 모션 반복성 특징을 이용하고 특징 단계 데이터 융합 방법을 이용하게 되면 96%의 향상된 분류 성능을 보였다.

잣나무(Pinus koraiensis)의 cDNA library 제작 및 EST 분석 (Construction of a full-length cDNA library from Pinus koraiensis and analysis of EST dataset)

  • 김준기;임수빈;최선희;이종석;노승문;임용표
    • 농업과학연구
    • /
    • 제38권1호
    • /
    • pp.11-16
    • /
    • 2011
  • In this study, we report the generation and analysis of a total of 1,211 expressed sequence tags (ESTs) from Pinus koraiensis. A cDNA library was generated from the young leaf tissue and a total of 1,211 cDNA were partially sequenced. EST and unigene sequence quality were determined by computational filtering, manual review, and BLAST analyses. In all, 857 ESTs were acquired after the removal of the vector sequence and filtering over a minimum length 50 nucleotides. A total of 411 unigene, consisting of 89 contigs and 322 singletons, was identified after assembling. Also, we identified 77 new microsatellite-containing sequences from the unigenes and classified the structure according to their repeat unit. According to homology search with BLASTX against the NCBI database, 63.1% of ESTs were homologous with known function and 22.2% of ESTs were matched with putative or unknown function. The remaining 14.6% of ESTs showed no significant similarity to any protein sequences found in the public database. Gene ontology (GO) classification showed that the most abundant GO terms were transport, nucleotide binding, plastid, in terms biological process, molecular function and cellular component, respectively. The sequence data will be used to characterize potential roles of new genes in Pinus and provided for the useful tools as a genetic resource.

구매의도 생성 순서와 구매실현 순서의 역전 현상을 감안한 확장된 순차분석 방법론 (An Investigation on Expanding Traditional Sequential Analysis Method by Considering the Reversion of Purchase Realization Order)

  • 김민석;김남규
    • 한국정보시스템학회지:정보시스템연구
    • /
    • 제22권3호
    • /
    • pp.25-42
    • /
    • 2013
  • Recently various kinds of Information Technology services are created and the quantities of the data flow are increase rapidly. Not only that, but the data patterns that we deal with also slowly becoming diversity. As a result, the demand of discover the meaningful knowledge/information through the various mining analysis such as linkage analysis, sequencing analysis, classification and prediction, has been steadily increasing. However, solving the business problems using data mining analysis does not always concerning, one of the major causes of these limitations is there are some analyzed data can't accurately reflect the real world phenomenon. For example, although the time gap of purchasing the two products is very short, by using the traditional sequencing analysis, the precedence relationship of the two products is clearly reflected. But in the real world, with the very short time interval, the precedence relationship of the two purchases might not be defined. What was worse, the sequence of the purchase intention and the sequence of the purchase realization of the two products might be mutually be reversed. Therefore, in this study, an expanded sequencing analysis methodology has been proposed in order to reflect this situation. In this proposed methodology, the purchases that being made in a very short time interval among the purchase order which might not important will be notice, and the analysis which included the original sequence and reversed sequence will be used to extend the analysis of the data. Also, to some extent a very short time interval can be defined as the time interval, so an experiment were carried out to determine the varying based on the time interval for the actual data.