• 제목/요약/키워드: Bayesian methodology

검색결과 137건 처리시간 0.03초

다중 레이블 분류의 정확도 향상을 위한 스킵 연결 오토인코더 기반 레이블 임베딩 방법론 (Label Embedding for Improving Classification Accuracy UsingAutoEncoderwithSkip-Connections)

  • 김무성;김남규
    • 지능정보연구
    • /
    • 제27권3호
    • /
    • pp.175-197
    • /
    • 2021
  • 최근 딥 러닝 기술의 발전으로 뉴스, 블로그 등 다양한 문서에 포함된 텍스트 분석에 딥 러닝 기술을 활용하는 연구가 활발하게 수행되고 있다. 다양한 텍스트 분석 응용 가운데, 텍스트 분류는 학계와 업계에서 가장 많이 활용되는 대표적인 기술이다. 텍스트 분류의 활용 예로는 정답 레이블이 하나만 존재하는 이진 클래스 분류와 다중 클래스 분류, 그리고 정답 레이블이 여러 개 존재하는 다중 레이블 분류 등이 있다. 특히, 다중 레이블 분류는 여러 개의 정답 레이블이 존재한다는 특성 때문에 일반적인 분류와는 상이한 학습 방법이 요구된다. 또한, 다중 레이블 분류 문제는 레이블과 클래스의 개수가 증가할수록 예측의 난이도가 상승한다는 측면에서 데이터 과학 분야의 난제로 여겨지고 있다. 따라서 이를 해결하기 위해 다수의 레이블을 압축한 후 압축된 레이블을 예측하고, 예측된 압축 레이블을 원래 레이블로 복원하는 레이블 임베딩이 많이 활용되고 있다. 대표적으로 딥 러닝 모델인 오토인코더 기반 레이블 임베딩이 이러한 목적으로 사용되고 있지만, 이러한 기법은 클래스의 수가 무수히 많은 고차원 레이블 공간을 저차원 잠재 레이블 공간으로 압축할 때 많은 정보 손실을 야기한다는 한계가 있다. 이에 본 연구에서는 오토인코더의 인코더와 디코더 각각에 스킵 연결을 추가하여, 고차원 레이블 공간의 압축 과정에서 정보 손실을 최소화할 수 있는 레이블 임베딩 방법을 제안한다. 또한 학술연구정보서비스인 'RISS'에서 수집한 학술논문 4,675건에 대해 각 논문의 초록으로부터 해당 논문의 다중 키워드를 예측하는 실험을 수행한 결과, 제안 방법론이 기존의 일반 오토인코더 기반 레이블 임베딩 기법에 비해 정확도, 정밀도, 재현율, 그리고 F1 점수 등 모든 측면에서 우수한 성능을 나타냄을 확인하였다.

실내 및 실외 위치 기반 사용자 상황인식과 시각화를 위한 사용자 인터페이스 개발 (User Context Recognition Based on Indoor and Outdoor Location and Development of User Interface for Visualization)

  • 노현용;오세원;이진형;박창현;황금성;조성배
    • 한국HCI학회:학술대회논문집
    • /
    • 한국HCI학회 2009년도 학술대회
    • /
    • pp.84-89
    • /
    • 2009
  • 핸드폰, PMP, MP3 플레이어 등으로 대표되는 개인 모바일 장치는 빠르게 발전하고 있다. 이런 모바일 환경의 발전은 사용자의 일상을 이해하고자 하는 라이프로그 연구를 활성화하고 있다. 즉, 모바일 장치의 다양한 센서들을 활용하여 개인의 일상을 기록한 라이프로그는 복잡한 일상에 대한 기억 보조 도구로 사용가능하기에 현재 활발히 연구되고 있다. 본 논문에서는 GPS에 의한 실외 위치뿐만 아니라 무선랜에 의한 실내 위치를 고려하여 상황을 추론하고 시각화하는 방법을 제시한다. 실내에서 GPS가 제대로 동작하지 않더라도 무선랜을 기반으로 한 실내 위치 추정을 통해 위치 정보를 획득하고 상황 인식 성능을 향상시켰다. 또한, 지도 인터페이스 및 블로그를 기반으로 하는 시각화 방법을 개발하였다. 실험에서는 모바일 장비를 가지고 실제 데이터를 수집한 뒤 제안하는 방법을 통해 상황을 인식하고 시각화 서비스를 제공하는 성능을 평가하였다.

  • PDF

Estimation of genetic relationships between growth curve parameters in Guilan sheep

  • Hossein-Zadeh, Navid Ghavi
    • Journal of Animal Science and Technology
    • /
    • 제57권5호
    • /
    • pp.19.1-19.6
    • /
    • 2015
  • The objective of this study was to estimate variance components and genetic parameters for growth curve parameters in Guilan sheep. Studied traits were parameters of Brody growth model which included A (asymptotic mature weight), B (initial animal weight) and K (maturation rate). The data set and pedigree information used in this study were obtained from the Agricultural Organization of Guilan province (Rasht, Iran) and comprised 8647 growth curve records of lambs from birth to 240 days of age during 1994 to 2014. Marginal posterior distributions of parameters and variance components were estimated using TM program. The Gibbs sampler was run 300000 rounds and the first 60000 rounds were discarded as a burn-in period. Posterior mean estimates of direct heritabilities for A, B and K were 0.39, 0.23 and 0.039, respectively. Estimates of direct genetic correlation between growth curve parameters were 0.57, 0.03 and -0.01 between A-B, A-K and B-K, respectively. Estimates of direct genetic trends for A, B and K were positive and their corresponding values were $0.014{\pm}0.003$ (P < 0.001), $0.0012{\pm}0.0009$ (P > 0.05) and $0.000002{\pm}0.0001$ (P > 0.05), respectively. Residual correlations between growth curve parameters varied form -0.52 (between A-K) to 0.48 (between A-B). Also, phenotypic correlations between growth curve parameters varied form -0.49 (between A-K) to 0.47 (between A-B). The results of this study indicated that improvement of growth curve parameters of Guilan sheep seems feasible in selection programs. It is worthwhile to develop a selection strategy to obtain an appropriate shape of growth curve through changing genetically the parameters of growth model.

Human Error Probability Assessment During Maintenance Activities of Marine Systems

  • Islam, Rabiul;Khan, Faisal;Abbassi, Rouzbeh;Garaniya, Vikram
    • Safety and Health at Work
    • /
    • 제9권1호
    • /
    • pp.42-52
    • /
    • 2018
  • Background: Maintenance operations on-board ships are highly demanding. Maintenance operations are intensive activities requiring high man-machine interactions in challenging and evolving conditions. The evolving conditions are weather conditions, workplace temperature, ship motion, noise and vibration, and workload and stress. For example, extreme weather condition affects seafarers' performance, increasing the chances of error, and, consequently, can cause injuries or fatalities to personnel. An effective human error probability model is required to better manage maintenance on-board ships. The developed model would assist in developing and maintaining effective risk management protocols. Thus, the objective of this study is to develop a human error probability model considering various internal and external factors affecting seafarers' performance. Methods: The human error probability model is developed using probability theory applied to Bayesian network. The model is tested using the data received through the developed questionnaire survey of >200 experienced seafarers with >5 years of experience. The model developed in this study is used to find out the reliability of human performance on particular maintenance activities. Results: The developed methodology is tested on the maintenance of marine engine's cooling water pump for engine department and anchor windlass for deck department. In the considered case studies, human error probabilities are estimated in various scenarios and the results are compared between the scenarios and the different seafarer categories. The results of the case studies for both departments are also compared. Conclusion: The developed model is effective in assessing human error probabilities. These probabilities would get dynamically updated as and when new information is available on changes in either internal (i.e., training, experience, and fatigue) or external (i.e., environmental and operational conditions such as weather conditions, workplace temperature, ship motion, noise and vibration, and workload and stress) factors.

Reliability of microarray analysis for studying periodontitis: low consistency in 2 periodontitis cohort data sets from different platforms and an integrative meta-analysis

  • Jeon, Yoon-Seon;Shivakumar, Manu;Kim, Dokyoon;Kim, Chang-Sung;Lee, Jung-Seok
    • Journal of Periodontal and Implant Science
    • /
    • 제51권1호
    • /
    • pp.18-29
    • /
    • 2021
  • Purpose: The aim of this study was to compare the characteristic expression patterns of advanced periodontitis in 2 cohort data sets analyzed using different microarray platforms, and to identify differentially expressed genes (DEGs) through a meta-analysis of both data sets. Methods: Twenty-two patients for cohort 1 and 40 patients for cohort 2 were recruited with the same inclusion criteria. The 2 cohort groups were analyzed using different platforms: Illumina and Agilent. A meta-analysis was performed to increase reliability by removing statistical differences between platforms. An integrative meta-analysis based on an empirical Bayesian methodology (ComBat) was conducted. DEGs for the integrated data sets were identified using the limma package to adjust for age, sex, and platform and compared with the results for cohorts 1 and 2. Clustering and pathway analyses were also performed. Results: This study detected 557 and 246 DEGs in cohorts 1 and 2, respectively, with 146 and 42 significantly enriched gene ontology (GO) terms. Overlapping between cohorts 1 and 2 was present in 59 DEGs and 18 GO terms. However, only 6 genes from the top 30 enriched DEGs overlapped, and there were no overlapping GO terms in the top 30 enriched pathways. The integrative meta-analysis detected 34 DEGs, of which 10 overlapped in all the integrated data sets of cohorts 1 and 2. Conclusions: The characteristic expression pattern differed between periodontitis and the healthy periodontium, but the consistency between the data sets from different cohorts and metadata was too low to suggest specific biomarkers for identifying periodontitis.

가축 유전체정보 활용 종축 유전능력 평가 연구 - 표지인자 효과 추정 모의실험 (Study on Genetic Evaluation using Genomic Information in Animal Breeding - Simulation Study for Estimation of Marker Effects)

  • 조충일;이득환
    • Journal of Animal Science and Technology
    • /
    • 제53권1호
    • /
    • pp.1-6
    • /
    • 2011
  • 연구는 유전체분석에 대해 모의실험한 연구로써 Reference Population (RP)이 구성되었을 때, 표현형 자료가 없고 유전체자료만 있는 Juven 1 또는 Juven 2 세대에 대해 유전평가의 정확도에 대해 알아보고자 연구를 실시하였다. 모의실험의 가정으로 염색체는 1개이며 염색체길이는 100cM로 가정하였다. 초기의 유효집단의 수는 100두의 다형성이 없는 초기집단에서 유전자 효과가 없는 표지인자(Marker)를 0.1cM 및 0.5cM 간격으로 균등하게 단일 염기 돌연변이에 의한 다형성을 발생시켰고 유전자 효과가 있는 QTL 좌위는 Marker와 동수의 비율로 임의위치를 지정하여 돌연변이에 의한 변이성을 생성하였으며 이때 유전자 효과는 Gamma 분포함수(scale=1.66, shape=0.4)에서 생성하였다. 배우자(gamete) 형성과정에서 Haldane의 가정하에 유전자 재조합을 생성하였으며 돌연변이 발생율은 Marker 및 QTL 좌위에서 $2.5{\times}10^{-3}$$2.5{\times}10^{-5}$의 확률로 발생시켜 1000세대까지 세대번식을 유지하였다. 이 후 1001세대부터 1004세대까지 세대당 2000두의 자손을 생성하였으며 이 때 유전력을 0.1 및 0.5의 가정하에 1001~1002 세대에서 표현형 자료를 생성하였고, 1003~1004세대는 오직 유전체자료만 생성하였다. Bayesian 방법을 이용하여 개체별 육종가를 추정하였으며 표지인자간 거리(0.1cM, 0.5cM), 유전력(0.1, 0.5) 및 반형매 집단크기(20두, 4두)에 따라 참육종가와 추정 육종가간의 상관으로 표현되는 육종가 정확도에 대해 비교한 결과 1003세 대에서 표지인자간 거리가 0.1cM 및 0.5cM일 때 육종가의 정확도는 각각 0.87, 0.81였고, 유전력이 0.1 및 0.5 일 때 각각 0.87, 0.94로 추정되었으며, 반형매 집단의 크기가 20두 일 때 0.87, 4두 일 때 0.84로 추정되었다. 위의 결과로 미루어 보아 다량의 SNP 표지정보 및 반형매 집단의 크기가 클수록 즉, 혈연계수가 높은 집단일 때 육종가의 정확도는 높게 나타났다. 유전체선발의 활용시 비교적 높은 정확도로써 조기선발이 가능하며 이로 인한 세대간격을 단축시킬 수 있어 개량의 효율을 높일 수 있을 것으로 사료된다. 반면에 유전체선발은 분석비용이 비싸며, 지속적인 유전체 선발시 특정유전자 선호로 인한 유전적 부동(Genetic Drift) 현상이 발생될 수 있기 때문에 지속적인 SNP 발굴에 대한 노력이 필요한(Meuwissen 2003) 단점이 있으나 한우 또는 젖소와 같은 대가축과 같이 세대간격이 긴 가축에서 유전체선발 할 경우 조기선발로 인한 세대간격 단축과 유전평가의 높은 정확도(0.8이상)로 인해 개량의 효율을 극대화 할 수 있을 것으로 사료된다.

신뢰도에 근거한 말뚝의 지지력 평가 (Reliability Based Pile Bearing Capacity Evaluation)

  • 이인모;조국환;이정학
    • 한국지반공학회지:지반
    • /
    • 제11권1호
    • /
    • pp.9-22
    • /
    • 1995
  • 본 연구의 목적은 신뢰도해석에 근거한 말뚝의 여러가지 지지력 예측방법들의 안전율을 제시하는데 있다. 각 지지력 결정방법들은 여러가지 불착실성을 포함하고 있으며, 이러한 오차를 고려하기 위해 말뚝재하시험에 의해 측정된 지지력과 예측된 지지력과의 비를 분포함수로 표현할 수 있다. 이 분포함수를 이용하여 파괴확률이 10-3이하가 될 수 있는 말뚝지지력의 안전율을 산정할 수 있다. Bayes' 이론의 적용은 정역학적 지지력 공식을 Prior Distribution으로 가정하고 동역학적 지지력 공식 및 WEAP, PDA를 이용해 산정된 지지력의 분포를 Likelihood Distribution으로 가정하여 적용함으로써 많은 불확실성을 줄일 수 있게 된다. 본 연구결과에서 보면 동역학적 지지력 공식의 안전율은 대략 7.4 정도로 S.P.T.를 이용해 산정된 지지력과 함께 불확실성이 크며, 파동방정식을 이용한 지지력 결정방법인 PDA에 의해 산정된 지지력의 안전율은 약 2.7정도로 가장 신뢰도가 높음을 알 수 있다. 또한 Bayes' 이론을 적용하여 본 결과 안전율을 줄일 수 있었으며 말뚝의 지지력 산정시 이의 응용은 최적설계의 관점에서 많은 도움을 줄 수 있을 것이다.

  • PDF