• Title/Summary/Keyword: Label power-set

검색결과 7건 처리시간 0.026초

레이블 멱집합 분류와 다중클래스 확률추정을 사용한 단백질 세포내 위치 예측 (Prediction of Protein Subcellular Localization using Label Power-set Classification and Multi-class Probability Estimates)

  • 지상문
    • 한국정보통신학회논문지
    • /
    • 제18권10호
    • /
    • pp.2562-2570
    • /
    • 2014
  • 단백질의 기능을 유추할 수 있는 중요한 정보중의 하나는 단백질이 존재하는 세포내 위치이다. 최근에는 하나의 단백질이 동시에 존재하는 여러 세포내 위치를 예측하는 연구가 활발하다. 본 논문에서는 단백질이 존재하는 세포내의 다중위치를 예측하기 위해서 레이블 멱집합 방법을 개선한다. 레이블 멱집합 방법으로 분류한 다중위치들을 예측 확률에 따라 결합하여 최종적인 다중레이블로 분류한다. 각 다중위치에 대한 정확한 확률적 기여를 구하기 위하여 쌍별 비교와 오류정정 출력코드를 사용한 다중클래스 확률추정 방법을 적용하였다. 단백질 세포내 위치 예측 실험에 제안한 방법을 적용하여 성능이 향상됨을 보였다.

다중레이블 조합을 사용한 단백질 세포내 위치 예측 (Multi-Label Combination for Prediction of Protein Subcellular Localization)

  • 지상문
    • 한국정보통신학회논문지
    • /
    • 제18권7호
    • /
    • pp.1749-1756
    • /
    • 2014
  • 단백질이 존재하는 세포내 위치에 대한 지식은 단백질의 기능과 관련된 중요한 정보이다. 본 논문은 개선된 레이블 멱집합 다중레이블 분류방법을 제안하여 단백질이 존재하는 세포내의 다중 위치를 예측한다. 다중레이블 분류 방법 중에서 레이블 멱집합 방법은 특정 생물학적 기능을 수행하는 단백질의 세포내 위치간의 연관 관계를 효과적으로 모델링할 수 있다. 본 논문은 다중레이블을 다른 다중레이블들의 선형조합으로 나타낼 때의 조합가중치를 제약조건이 있는 최적화를 통하여 구하고, 이를 사용하여 여러 다중레이블의 예측 확률들을 조합하여 최종적인 예측을 수행한다. 인간 단백질 자료에 대한 실험에서 제안한 방법이 다른 단백질 세포내 위치 예측 방법에 비하여 높은 성능을 보였다. 이는 제안한 방법이 레이블 멱집합 방법에서 사용되는 다중레이블들내에 존재하는 중복 정보를 이용하여 다중 레이블의 예측확률을 성공적으로 강화할 수 있기 때문이다.

단백질의 세포내 위치 예측을 위한 다중레이블 분류 방법의 성능 비교 (A Performance Comparison of Multi-Label Classification Methods for Protein Subcellular Localization Prediction)

  • 지상문
    • 한국정보통신학회논문지
    • /
    • 제18권4호
    • /
    • pp.992-999
    • /
    • 2014
  • 단백질이 존재하는 세포내의 다중 위치를 정확하게 예측하기 위하여 다중레이블 학습 방법을 광범위하게 비교한다. 이를 위하여 다중레이블 분류의 접근 방법인 알고리즘 적응, 문제 변환, 메타 학습의 여러 방법을 비교 평가한다. 다양한 관점에서 다중레이블 분류 방법의 특성을 평가하기 위하여 12가지 평가 척도를 사용하였고, 최적의 성능을 보이는 방법을 찾기 위하여 새로운 요약 척도를 사용하였다. 비교 실험 결과, 흔하지 않은 다중레이블 집합을 가지치기 하는 멱집합 방법과, 관련 레이블들을 추가된 특징으로 나타내는 분류기-체인 방법의 성능이 높았다. 또한, 이들 방법들로 구성된 여러 개의 분류기를 조합하면 더욱 성능이 향상되었다. 즉, 세포내 위치간의 연관관계를 사용하는 것이 예측에 효과적인데, 특정 생물학적 기능을 수행하는 단백질의 세포내 위치들의 관계는 독립적이지 않고 서로 관련되어 있기 때문이라 판단된다.

New Feature Selection Method for Text Categorization

  • Wang, Xingfeng;Kim, Hee-Cheol
    • Journal of information and communication convergence engineering
    • /
    • 제15권1호
    • /
    • pp.53-61
    • /
    • 2017
  • The preferred feature selection methods for text classification are filter-based. In a common filter-based feature selection scheme, unique scores are assigned to features; then, these features are sorted according to their scores. The last step is to add the top-N features to the feature set. In this paper, we propose an improved global feature selection scheme wherein its last step is modified to obtain a more representative feature set. The proposed method aims to improve the classification performance of global feature selection methods by creating a feature set representing all classes almost equally. For this purpose, a local feature selection method is used in the proposed method to label features according to their discriminative power on classes; these labels are used while producing the feature sets. Experimental results obtained using the well-known 20 Newsgroups and Reuters-21578 datasets with the k-nearest neighbor algorithm and a support vector machine indicate that the proposed method improves the classification performance in terms of a widely known metric ($F_1$).

제조업체 Private Labels 도입의 선행요인 : 전략적 시장관리 관점을 중심으로 (Antecedents of Manufacturer's Private Label Program Engagement : A Focus on Strategic Market Management Perspective)

  • 임채운;이호택
    • 한국유통학회지:유통연구
    • /
    • 제17권1호
    • /
    • pp.65-86
    • /
    • 2012
  • 우리나라에 유통업체상표(Private Label)가 도입된 지 10년이 넘었음에도 불구하고 유통업체 상표에 대한 대부분의 연구는 소비자 관점에서 진행되어져 왔다. 본 연구는 유통업체상표를 소비자 관점이 아닌 제조업체의 관점에서 바라본 연구로, 제조업체의 유통업체상표 생산에 영향을 미치는 내외부적 요인들에 대해서 자원기반이론과 S-C-P Paradigm의 통합적인 연구모형인 전략적 시장관리 관점을 제시하였다. 연구결과를 보면, 제조업체의 마케팅 역량이 높을수록 전체 매출에서 유통업체상표가 차지하는 매출이 적은 것으로 나타났으며, 마케팅 역량에는 제조업체 브랜드명성, 마케팅 투자, 제품포트폴리오 등이 영향을 미치는 것으로 나타났다. 또한 제조업체의 마케팅 역량과 유통업체 상표 생산 간의 관계에는 제조업체의 경쟁강도가 조절효과를 미치는 것으로 나타났는데, 이는 일반적으로 마케팅 역량이 높은(낮은) 기업일수록 전체 매출에서 유통업체상표가 차지하는 비율이 낮지만(높지만), 이러한 기업들 중 경쟁강도를 낮게 지각하는 제조업체의 전체매출 중 유통업체상표가 차지하는 매출은 경쟁강도를 높게 지각하는 제조업체들에 비해 상대적으로 높게 나타났다. 이러한 연구결과를 바탕으로, 본 연구는 유통업체상표 생산에 대한 이론 및 실무적인 시사점을 제시하고 있다.

  • PDF

머신러닝 기법을 활용한 논 순용수량 예측 (Prediction of Net Irrigation Water Requirement in paddy field Based on Machine Learning)

  • 김수진;배승종;장민원
    • 농촌계획
    • /
    • 제28권4호
    • /
    • pp.105-117
    • /
    • 2022
  • This study tested SVM(support vector machine), RF(random forest), and ANN(artificial neural network) machine-learning models that can predict net irrigation water requirements in paddy fields. For the Jeonju and Jeongeup meteorological stations, the net irrigation water requirement was calculated using K-HAS from 1981 to 2021 and set as the label. For each algorithm, twelve models were constructed based on cumulative precipitation, precipitation, crop evapotranspiration, and month. Compared to the CE model, the R2 of the CEP model was higher, and MAE, RMSE, and MSE were lower. Comprehensively considering learning performance and learning time, it is judged that the RF algorithm has the best usability and predictive power of five-days is better than three-days. The results of this study are expected to provide the scientific information necessary for the decision-making of on-site water managers is expected to be possible through the connection with weather forecast data. In the future, if the actual amount of irrigation and supply are measured, it is necessary to develop a learning model that reflects this.

진입-진출 요금을 반영한 수도권 도시철도망의 일반화 K-경로탐색 (Generalized K Path Searching in Seoul Metropolitan Railway Network Considering Entry-Exit Toll)

  • 이미영
    • 한국ITS학회 논문지
    • /
    • 제21권6호
    • /
    • pp.1-20
    • /
    • 2022
  • 도로교통망과 대중교통망에서 요금을 부과하는 기본방식은 진입-진출요금체계이다. 진입-진출요금체계는 HI-PASS 및 대중교통카드를 이용하는 단말기를 통과하는 방식으로 적용된다. 한편 진입-진출요금을 고려해서 경로를 탐색하는 문제는 경로의 열거를 포함하는 비가산성문제를 포함하고 있다. 이는 모든 경로를 열거해서 최적해를 도출하는 NP-완전문제로 알려져 있다. 지금까지 진입-진출요금에 대한 해법은 도로망을 대상으로 네트워크를 변형하는 기법이 제안되었으며 교통카드가 일반화된 대중교통망과 같이 환승, 다수단, 복수단말기와 같이 네트워크확장이 요구되는 상황에서는 검토되지 않았다. 본 연구는 교통카드단말기로 구성된 대중교통망에 대하여 링크표지를 도입해서 네트워크확장을 우회하면서 One-to-One K-경로탐색을 통해 경로를 열거함으로서 최적해를 선정하는 방안을 마련하였다. 본 연구에서 제안하는 방법은 비교적 적은 경로집합을 구성하기 때문에 컴퓨팅 파워의 부담없이 최적해를 도출하는 것이 가능하며, 경로간 민감도를 비교하기 용이한 측면에서 보다 일반화된 최적경로해법으로 활용이 가능하다.