• 제목/요약/키워드: Over-fitting

검색결과 347건 처리시간 0.026초

다성분 해저면 탄성파 탐사자료에 대한 음향파 완전파형역산 전략 (Acoustic Full-waveform Inversion Strategy for Multi-component Ocean-bottom Cable Data)

  • 황종하;오주원;이진형;민동주;정희철;송영수
    • 지구물리와물리탐사
    • /
    • 제23권1호
    • /
    • pp.38-49
    • /
    • 2020
  • 음향파 완전파형역산은 탄성파 탐사를 통해 얻은 관측자료와 음향파 모델링자료를 맞춤으로써 지층의 속도모델을 고해상도로 구축하는 최적화 과정이다. 기존의 스트리머를 이용한 해양 탄성파 탐사 자료에 대한 음향파 완전파형역산에서는 압력자료만을 활용하여 P파 속도모델을 구축한다. 그러나 최근 다성분 해저면 탄성파 탐사기술의 발달로 다성분자료의 취득 사례가 늘고 있으며, 이에 따라 해양에서 얻어지는 다성분 자료를 활용한 음향파 완전파형역산 기법에 대한 연구가 필요하다. 이 연구에서는 수평 및 수직 입자가속도 자료를 활용한 효과적인 음향파 완전파형역산 전략을 제시하고자 한다. 이를 위해, 우선 음향파 모델링으로 제작된 압력 및 입자가속도 자료와 민감도커널을 분석하여 파형역산 과정에서 각 자료의 성분별 특성을 관찰하였다. 압력 자료에 함께 나타났던 직접파, 다이빙파 및 반사파가 수직 및 수평 입자가속도 자료에서 파동의 진행방향에 따라 분리되어 나타나는 것을 확인하였으며, 수평 입자가속도 자료는 상부의 장파장구조를, 수직 입자가속도 자료는 하부의 장파장구조와 전체 영역에서의 단파장구조를 구축하는 데 효과적임을 확인할 수 있었다. 이러한 분석 결과를 바탕으로 입자가속도 자료만을 활용해 음향파 완전파형역산을 수행하는 순차적 자료 활용전략을 제시하며, 압력자료를 얻지 못하였거나 품질이 낮은 경우에도 입자가속도 자료를 활용하는 음향파 완전파형역산을 통해 양호한 P파 속도모델을 구축할 수 있을 것으로 기대된다.

공간가중 포아송 회귀모형을 이용한 고병원성 조류인플루엔자 발생에 영향을 미치는 결정인자의 공간이질성 분석 (Application of a Geographically Weighted Poisson Regression Analysis to Explore Spatial Varying Relationship Between Highly Pathogenic Avian Influenza Incidence and Associated Determinants)

  • 최성현;박선일
    • 한국임상수의학회지
    • /
    • 제36권1호
    • /
    • pp.7-14
    • /
    • 2019
  • In South Korea, six large outbreaks of highly pathogenic avian influenza (HPAI) have occurred since the first confirmation in 2003 from chickens. For the past 15 years, HPAI outbreaks have become an annual phenomenon throughout the country and has extended to wider regions, across rural and urban environments. An understanding of the spatial epidemiology of HPAI occurrence is essential in assessing and managing the risk of the infection; however, local spatial variations of relationship between HPAI incidences in Korea and related risk factors have rarely been derived. This study examined whether spatial heterogeneity exists in this relationship, using a geographically weighted Poisson regression (GWPR) model. The outcome variable was the number of HPAI-positive farms at 252 Si-Gun-Gu (administrative boundaries in Korea) level notified to government authority during the period from January 2014 to April 2016. This response variable was regressed to a set of sociodemographic and topographic predictors, including the number of wild birds infected with HPAI virus, the number of wintering birds and their species migrated into Korea, the movement frequency of vehicles carrying animals, the volume of manure treated per day, the number of livestock farms, and mean elevation. Both global and local modeling techniques were employed to fit the model. From 2014 to 2016, a total of 403 HPAI-positive farms were reported with high incidence especially in western coastal regions, ranging from 0 to 74. The results of this study show that local model (adjusted R-square = 0.801, AIC = 954.5) has great advantages over corresponding global model (adjusted R-square = 0.408, AIC = 2323.1) in terms of model fitting and performance. The relationship between HPAI incidence in Korea and seven predictors under consideration were significantly spatially non-stationary, contrary to assumptions in the global model. The comparison between global Poisson and GWPR results indicated that a place-specific spatial analysis not only fit the data better, but also provided insights into understanding the non-stationarity of the associations between the HPAI and associated determinants. We demonstrated that an empirically derived GWPR model has the potential to serve as a useful tool for assessing spatially varying characteristics of HPAI incidences for a given local area and predicting the risk area of HPAI occurrence. Considering the prominent burden of HPAI this study provides more insights into spatial targeting of enhanced surveillance and control strategies in high-risk regions against HPAI outbreaks.

계량서지적 분석에서 지적구조 매핑을 위한 링크 삭감 알고리즘의 적합도 측정 (Measuring the Goodness of Fit of Link Reduction Algorithms for Mapping Intellectual Structures in Bibliometric Analysis)

  • 이재윤
    • 정보관리학회지
    • /
    • 제39권2호
    • /
    • pp.233-254
    • /
    • 2022
  • 지적구조 분석을 위해 가중 네트워크를 시각화해야 하는 경우에 패스파인더 네트워크와 같은 링크 삭감 알고리즘이 널리 사용되고 있다. 이 연구에서는 네트워크 시각화를 위한 링크 삭감 알고리즘의 적합도를 측정하기 위한 지표로 NetRSQ를 제안하였다. NetRSQ는 개체간 연관성 데이터와 생성된 네트워크에서의 경로 길이 사이의 순위 상관도에 기반하여 네트워크의 적합도를 측정한다. NetRSQ의 타당성을 확인하기 위해서 몇 가지 네트워크 생성 방식에 대해 정성적으로 평가를 했었던 선행 연구의 데이터를 대상으로 시험적으로 NetRSQ를 측정해보았다. 그 결과 품질이 좋게 평가된 네트워크일수록 NetRSQ가 높게 측정됨을 확인하였다. 40가지 계량서지적 데이터에 대해서 4가지 링크 삭감 알고리즘을 적용한 결과에 대해서 NetRSQ로 품질을 측정하는 실험을 수행한 결과, 특정 알고리즘의 네트워크 표현 결과가 항상 좋은 품질을 보이는 것은 아니며, 반대로 항상 나쁜 품질을 보이는 것도 아님을 알 수 있었다. 따라서 이 연구에서 제안한 NetRSQ는 생성된 계량서지적 네트워크의 품질을 측정하여 최적의 기법을 선택하는 근거로 활용될 수 있을 것이다.

창업초기투자 촉진을 위한 한국형 SAFE 활성화 방안에 대한 연구 (Policy of Surging Investment to Early Startups Via Boosting up SAFE in Korea)

  • 박진;양영석
    • 벤처창업연구
    • /
    • 제17권6호
    • /
    • pp.1-12
    • /
    • 2022
  • 본 논문은 국내 창업초기 투자활성화를 위해 도입된 SAFE 투자방식이 창업초기투자의 대표적 투자형태로 활성화되며 시장에 안착하는데 필요한 정책적 방안을 제시하는데 목적을 두었다. 특히, SAFE와 컨버터블 노트 방식과의 비교를 통해 SAFE가 컨버터블 노트에 비해 창업초기기업에 대한 투자 활성화에 보다 적합한 측면이 있음을 분석하였다. 또한, 본 연구는 SAFE 관련 선행연구들이 SAFE 활성화의 가장 중요한 문제로 SAFE의 법률적 지위확보문제, 세제관련문제 그리고 후속투자 유치 실패 및 만기불확실성 문제를 주요 쟁점으로 다루고 있는 점을 참조하여 한국형 SAFE 활성화의 정책적 대안을 제시하였다. 첫째, SAFE 회계처리 관련, 선행연구들을 참조로 SAFE의 부채와 자본으로서 처리방안의 대안을 제시하며, 특히 SAFE 도입을 주도하는 벤처투자법의 내용을 토대로 SAFE를 자본으로 처리하는 방법에 대한 대안을 제시하였다. 둘째, 세제지원 관련, 현재 개정이 추진되고 있는 벤처기업 인증제도를 토대로, SAFE 투자가 벤처기업인증을 위한 투자로 인정되어야 SAFE 투자관련 세제지원 문제를 해결하는 방안임을 제시하였다. 셋째, 후속투자 유치 실패 관련, 해외주요사례 벤치마킹 연구들을 토대로, SAFE의 한국형 계약방식 즉, 계약조항 문구를 만들 때 후속투자유치 실패에 대한 안전장치와 만기일 및 그 이후에 대한 이벤트 협상 등의 내용을 담는 수정문구를 반영하는 방법으로 문제해결 방안을 제안하였다. 본 논문은 SAFE 투자가 국내 창업초기 투자방식으로 활성화되기 위한 방식으로 이 제도의 도입 법적근거인 벤처투자법과 제도의 주무부서인 중소벤처기업부의 보다 강한 역할을 중심으로 제안하였다. 이를 통해 본 논문은 기존 선행연구들의 내용을 보다 정책실행적인 관점에서 문제 해결 실행대안을 제시하였다.

현대여성(現代女性)의 의복의식(衣服意識)에 관한 조사(調査) 연구(硏究) - 서울 지역(地域)의 양복(洋服) 착용자(着用者)를 중심(中心)으로 -

  • 이희명
    • 복식
    • /
    • 제2권
    • /
    • pp.73-88
    • /
    • 1978
  • This article is an attempt to explain, at least in part, the contemporary Korean women's consciousness of Western Dreasses. As time changes, the role of clothing undergoes varisous transitions, while values and ways of life are constantly in change. It is, therefore, proper and appropriate to recognize as among the major aspects of social psychology such phenomenon as interests, understanding of clothing, the choice of a dress, and attitudes toward clothing, etc. The purpose of this study is to discover problems concerning and their clothing and their solutions, by means of a surveying approach. The method of research used is based upon questionares distributed to parents of first-year pupils in elementary schools and to female clerks working in offices, covering the period from August through October, 1976. The number of the questionares distrubuted totalled 600, and 526 were returned to the research to be utilized for analysis. The contents of the survey included such things as values concerning clothing, kinds of clothing and their practical use, the selection of clothing and the method of purchase, fashions, etc. The classification of aquisition are self-made clothing, clothing made to order and ready-made materials. It is composed of 25 items, including affirmative reasons as well as negative ones. The processing of the material returned was made by using the computer, and based upon classifications such as ages, monthly income, occupations; thus diagraming the result in percentages. The conclusion made and the improvements proposed are as follows: 1. The values of clothing were placed on the expression of the wearer's personality (32.7) and on eauty(28. 6%). The lower age group places is stress upon the expression of personality, while the higher age group stresses beauty. About 50% of wearers are contented with their clothing, their clothing, the rest of whom them indicating their dissatisfaction with what they wear. As to designs at the time of selection, about 46% indicated their preference of personal expression, 31.8% on usefulness. In selecting material, practicality is emphasized; in selecting patterns, single color is preferred. In short, personal expression and esthetic values are primary, with consideration of practicality in mind. 2. The classification of clothing according to their uses indicates the highest numbers in normal wear (home wears) and clothings to be worn outside home. As to evening dresses, (party dress) only one or two articles were checked by many, and no such article was clamed to be possessed by most. The highest ratio of wearing was shown in the case of home wear (47.3%) and clothing to be worn outside the home, which is 55.8%. The budget for one article of clothing was greatest in the case of home wear, and clothing worn outside the home. Many used both kinds of articles for the same purpose. It is desirable, therefore, that the kinds of clothing should be varied according to the purpose for which they are worn, and that clothing appropriate for that purpose should be worn. 3. The motivation for purchasing clothing was highly chosen in the item of seasonal change, which was 55.7%; Clothing deliberately made was indicated by 45.2%. In the mothods of purchasing clothing, clothing made to order and ready-made was indicated by 44.4%, which is the highest; Clothing made to order was 25.4%, and self-sewing was 1.1%, which is the lowest. (1) In the case of self-sewing, "I like it but it is very hard," was checked by 43.6%; "It is so difficult that I cannot wear such clothing" was checked by 13.3%. From these, we can conclude that the questionees are willing to make clothing by themselves, but techniques involved in sewing and at her problems involved in the skill are complicated but when those problems are eliminated there is a possibility for practice. The response checked by questionees concerning the self-sewing was, "It's economical", which is a clear indication that many questionees are positive for self-sewing. It is generally believed that ready-made clothing is cheaper, but it is not necessarily so. In consideration of the quality of clothing, self-sewing is a necessity, and it is desirable that it should be encouraged. (3) Problems involved in ready-made clothing, such as designs, skills, size (fitting) should be eliminated. When these problems are scientifically gotten rid of, it is possible that affirmative returns will be expected. Affirmative responses such as "Ready-made clothing is economical," "You can select there on the spot," are good signs that many women expect to wear ready-made clothing. It is in this sense that the prospect for ready-made clothing is brighter when much development for ready-made clothing is on the way. 4. Much concern for fashion are checked in such item of questions as "Fashionable clothing in the show window," "Clothes worn by women." The first item was checked by 50.1 %, and the second was checked by 48.6%. The reason for following fashion is "Because many people wear them," which was indicated by 30.4%. The reason for not following fashion is "It is too expensive," which was checked by 29.6%. The 26.2% of the answers indicated that "Fashionable clothing is devoid of personality," The influences of fashion over the development of fashion over the development of clothing are two-fold: Esthetic and active. It is not to be deniable that people follow fashion more or less. 1978.9>

  • PDF

Dimethylnitrosamine 유발 급성 간 손상 흰쥐에서 $^{99m}-Lactosylated$ Serum Albumin을 이용한 간 기능의 평가 (Evaluation of Liver Function Using $^{99m}-Lactosylated$ Serum Albumin Liver Scintigraphy in Rat with Acute Hepatic Injury Induced by Dimethylnitrosamine)

  • 정신영;서명랑;유정아;배진호;안병철;황재석;정재민;하정희;이규보;이재태
    • 대한핵의학회지
    • /
    • 제37권6호
    • /
    • pp.418-427
    • /
    • 2003
  • 목적: $^{99m}-lactosylated$ serum albumin ($^{99m}Tc-LSA$)은 간세포에 특이적으로 결합하는 간수용체 영상용 방사성의약품으로 새로이 합성되었다. 간섬유화를 유발하는 dimethylnitrosamine (DMN)을 투여한 간 손상 흰쥐 모델에서 $^{99m}Tc-LSA$의 역동학적인 간섭취를 조사하고 간효소치의 변화와 조직학적 소견을 비교하여, LSA의 간섭취가 간기능의 변화를 반영하는지를 연구하였다. 대상 및 방법: SD계 흰쥐에 DMN를 27 mg/kg으로 복강 내 주사하여 급성 간손상을 유도하고 대조군과 비교하였다. DMN을 주사한 흰쥐를 3일(DMN-3), 8일(DMN-8), 21일(DMN-21)에 $^{99m}Tc-LSA$ (1,665 mg/kg) 29 MBq를 정맥 주사하여, 30분 동안 동적 영상을 획득하고 간과 심장부위에 관심영역을 설정하여 간과 심장부위의 시간방사능 곡선을 얻었다. 간기능 평가를 위해 시간방사능 곡선을 이용하여 간섭취지수와 혈중제거지수를 구하였고 곡선 최적화를 시행하였다. DMN 투여군과 대조군의 간효소치의 변화와 간조직의 광학현미경 소견을 비교하였다. 결과: 대조군에서는 $^{99m}Tc-LSA$가 빠르게 간에 섭취되고 혈중에서 제거되었으나 DMN을 처리한 군에서는 간섭취가 낮았다. 간섭취지수의 비교에서 대조군에 비해 DMN 처리군에서 유의하게 간섭취지수가 낮았다(DMN-3: 0.842, BMN-8: 0.898, DMN-21: 0.91, 대조군: 0.96, p<0.05). 혈중제거지수의 비교에서도 대조군에 비해 DMN 처리군에서 혈중제거지수가 유의하게 높았다(DMN-3: 0.731, DMN-8: 0.654, DMN-21: 0.604, 대조군: 0.473, p<0.05). 비선형 회귀분석에서 $R_2$값은 0.9이상으로 좋은 일치를 보였고, 대조군에서 K값이 DMN처리군에 비해 크고 (DMN-3: 0.28, DMN-8: 0.41, DMN-21: 0.46, 대조군: 0.97, p<0.05), $T_{1/2}$값은 작았다(DMN-3: 2.5, DMN-8: 1.7, DMN-21: 1.5, 대조군: 0.7, p<0.05). 간효소치의 변화는 DMN-3군에서는 대조군에 비해 상승하였으나 DMN-8, DMN-21군에서는 간효소치의 상승이 관찰되지 않았다. 간조직 소견의 경우 DMN-3군에서 중심정맥 주위에 괴사가 관찰되었으나 DMN-8군, DMN-21군에서는 미약한 정도의 염증세포 침윤만이 관찰되었다. 결론: $^{99m}Tc-LSA$ 간신티그래피의 간섭취 정도는 간손상과 반비례하였으며 간섭취의 변화는 조직학적 손상이 심한 정도와 간손상후 회복되는 과정을 반영하여 주었다. $^{99m}Tc-LSA$ 간신티그래피가 간손상을 평가하고 간손상후 회복되는 과정을 추적하는 간수용체 영상용 방사성 의약품으로 사용될 수 있을 것으로 생각된다.

작물분류에서 기계학습 및 딥러닝 알고리즘의 분류 성능 평가: 하이퍼파라미터와 훈련자료 크기의 영향 분석 (Performance Evaluation of Machine Learning and Deep Learning Algorithms in Crop Classification: Impact of Hyper-parameters and Training Sample Size)

  • 김예슬;곽근호;이경도;나상일;박찬원;박노욱
    • 대한원격탐사학회지
    • /
    • 제34권5호
    • /
    • pp.811-827
    • /
    • 2018
  • 본 연구의 목적은 다중시기 원격탐사 자료를 이용한 작물분류에서 기계학습 알고리즘과 딥러닝 알고리즘의 비교에 있다. 이를 위해 전라남도 해남군과 미국 Illinois 주의 작물 재배지를 대상으로 기계학습 알고리즘과 딥러닝 알고리즘에 대해 (1) 하이퍼파라미터와 (2) 훈련자료의 크기에 따른 영향을 비교 분석하였다. 비교 실험에는 기계학습 알고리즘으로 support vector machine(SVM)을 적용하고 딥러닝 알고리즘으로 convolutional neural network(CNN)를 적용하였다. 특히 CNN에서 2차원의 공간정보를 고려하는 2D-CNN과 시간차원을 확장한 구조의 3D-CNN을 적용하였다. 비교 실험 결과, 다양한 하이퍼파라미터를 고려해야 하는 CNN의 경우 SVM과 다르게 두 지역에서 정의된 하이퍼파라미터 값이 유사한 것으로 나타났다. 이러한 결과를 바탕으로 모델 최적화에 많은 시간이 소요되지만 최적화된 CNN 모델을 다른 지역으로 확장할 수 있는 전이학습의 적용 가능성이 높을 것으로 판단된다. 다음 훈련자료 크기에 따른 비교 실험 결과, SVM 보다 CNN에서 훈련자료 크기의 영향이 큰 것으로 나타났는데 특히 다양한 공간특성을 갖는 Illinois 주에서 이러한 경향이 두드러지게 나타났다. 또한 Illinois 주에서 3D-CNN의 분류 성능이 저하되는 것으로 나타났는데, 이는 모델 복잡도가 증가하면서 과적합의 영향이 발생한 것으로 판단된다. 즉 모델의 훈련 정확도는 높지만 다양한 공간특성이나 입력 자료의 잡음 효과 등으로 오히려 분류 성능이 저하된 것으로 나타났다. 이러한 결과는 대상 지역의 공간특성을 고려해 적절한 분류 알고리즘을 선택해야 하는 것을 의미한다. 또한 CNN에서 특히, 3D-CNN에서 일정 수준의 분류 성능을 담보하기 위해 다량의 훈련자료 수집이 필요하다는 것을 의미한다.

연결정보가 없는 3차원 점으로부터 차이분할메쉬 직접 복원 (Direct Reconstruction of Displaced Subdivision Mesh from Unorganized 3D Points)

  • 정원기;김창헌
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제29권6호
    • /
    • pp.307-317
    • /
    • 2002
  • 본 논문은 연결정보가 없는 3차원 점으로부터 차이분할메쉬를 직접 생성하는 새로운 메쉬 복원 알고리즘을 제안한다. 차이분할메쉬는 표현해야 하는 각 정점을 1차원 상수 차이 값으로 표현하는 메쉬로써 저장해야하는 데이타양을 획기적으로 줄이면서 분할메쉬의 장점인 분할연결성을 가지므로 다단계 표현이 가능한 새로운 메쉬 표현법이지만 차이분할메쉬를 생성하는 기존의 방법은 레인지 데이타로부터 복원된 비정형 메쉬로부터 차이분할메쉬로의 변환을 거쳐야 하는 문제점이 있다. 제안 알고리즘은 비정형 메쉬로부터의 메쉬 변환과정이 필요 없이 연결정보가 없는 레인지 데이타로부터 차이값에 기반한 분할메쉬를 매쉬 복원과정에서 직접 생성해 낼 수 있다. 기본 아이디어는 연결정보가 없는 점 데이타만을 이용하여 이에 근사한 파라메트릭 도메인을 생성한 후 도메인 상의 각 정점의 법선 벡터 방향으로 세부 표면 정보를 샘플링 하는 것이다. 이를 위하여 우리는 분할곡면 근사기법을 적용한 파라매트릭 도메인 생성기법을 적용하여 입력 점 데이타에 최대한 근사하는 기본메쉬를 생성하며, 연결정보가 없는 점 데이타로부터 세부 표면정보를 올바르게 샘플링 하기 위한 법선벡터와 교차하는 유효한 삼각형 판정기준을 제시한다. 또한 기존 메쉬 복원 기법에서 사용되던 전역 에너지 최적화 방법 대신 입력 데이타를 고려한 지역적 라플라시안 평활화를 이용하여 고품질의 메쉬를 빠르게 복원할 수 있다. 이렇게 복원된 차이분할메쉬는 적은 데이터로 자세한 표현이 가능해져 메쉬 간략화나 압축 등의 후처리 과정이 필요 없으며. 분할연결성을 이용한 다단계 애니메이션등의 다양한 응용분야에 활용 가능하다.6으로 남녀학생 모두 총 열량에 대한 지질의 섭취비율이 높았다. 인, 비타민 B$_1$, B$_{6}$, E를 제외한 칼슘, 철, 아연, 비타민 A, B$_2$, C, 나이아신, 엽산 등 대부분의 미량 영양소 섭취량은 권장량에 미치지 못하였다. 혈청 COT, GPT는 남학생이 여학생보다 각 항목에서 유의하게 높았고, 혈청 총 콜레스테롤, 중성지질, HDL-콜레스테롤, LDL-콜레스테롤은 남녀학생 간에 유의한 차이가 없었다. 적혈구지수의 경우 적혈구수, 헤모글로빈, 헤마토크릿, MCHC가 남학생이 여학생보다 유의하게 높았다. 체중, 체질량지수, 비만지수는 모두 수축기 혈압과 유의한 정의 상관관계를 보였고(p<0.01, p<0.05, p<0.05), 체지방률은 영양지식과 유의한 부의 상관관계를 보였다(p<0.05). 비만도와 영양소 섭취량과의 관계에서 체중, 체질량지수, 비만지수는 콜레스테롤 섭취량과(p<0.01, p<0.05, p<0.05) 각각 유의한 정의 상관관계를 보였다. 비만도와 혈액성상과의 관계에서 체중은HDL-콜레스테롤과 유의한 부의 상관관계를(p<0.05), 적혈구수, 헤모글로빈, 헤마토크릿과는 유의한 정의 상관관계를(각 p<0.05) 보였다. 체질량지수와 비만지수는 각각 HDL-콜레스테롤과는 부의 (각 P<0.05), 적혈구수와는 정의(각 p<0.05) 상관관계를 보였다. 허리엉덩이둘레비는 혈청 GPT, glucose, MCV와 각각 유의한 정의 상관관계를 보였다(각 p<0.05). 이상의 연구결과를 종합할 때 남녀 비만 중학생 모두 총 열량 섭취량 중 지질로

다양한 다분류 SVM을 적용한 기업채권평가 (Corporate Bond Rating Using Various Multiclass Support Vector Machines)

  • 안현철;김경재
    • Asia pacific journal of information systems
    • /
    • 제19권2호
    • /
    • pp.157-178
    • /
    • 2009
  • Corporate credit rating is a very important factor in the market for corporate debt. Information concerning corporate operations is often disseminated to market participants through the changes in credit ratings that are published by professional rating agencies, such as Standard and Poor's (S&P) and Moody's Investor Service. Since these agencies generally require a large fee for the service, and the periodically provided ratings sometimes do not reflect the default risk of the company at the time, it may be advantageous for bond-market participants to be able to classify credit ratings before the agencies actually publish them. As a result, it is very important for companies (especially, financial companies) to develop a proper model of credit rating. From a technical perspective, the credit rating constitutes a typical, multiclass, classification problem because rating agencies generally have ten or more categories of ratings. For example, S&P's ratings range from AAA for the highest-quality bonds to D for the lowest-quality bonds. The professional rating agencies emphasize the importance of analysts' subjective judgments in the determination of credit ratings. However, in practice, a mathematical model that uses the financial variables of companies plays an important role in determining credit ratings, since it is convenient to apply and cost efficient. These financial variables include the ratios that represent a company's leverage status, liquidity status, and profitability status. Several statistical and artificial intelligence (AI) techniques have been applied as tools for predicting credit ratings. Among them, artificial neural networks are most prevalent in the area of finance because of their broad applicability to many business problems and their preeminent ability to adapt. However, artificial neural networks also have many defects, including the difficulty in determining the values of the control parameters and the number of processing elements in the layer as well as the risk of over-fitting. Of late, because of their robustness and high accuracy, support vector machines (SVMs) have become popular as a solution for problems with generating accurate prediction. An SVM's solution may be globally optimal because SVMs seek to minimize structural risk. On the other hand, artificial neural network models may tend to find locally optimal solutions because they seek to minimize empirical risk. In addition, no parameters need to be tuned in SVMs, barring the upper bound for non-separable cases in linear SVMs. Since SVMs were originally devised for binary classification, however they are not intrinsically geared for multiclass classifications as in credit ratings. Thus, researchers have tried to extend the original SVM to multiclass classification. Hitherto, a variety of techniques to extend standard SVMs to multiclass SVMs (MSVMs) has been proposed in the literature Only a few types of MSVM are, however, tested using prior studies that apply MSVMs to credit ratings studies. In this study, we examined six different techniques of MSVMs: (1) One-Against-One, (2) One-Against-AIL (3) DAGSVM, (4) ECOC, (5) Method of Weston and Watkins, and (6) Method of Crammer and Singer. In addition, we examined the prediction accuracy of some modified version of conventional MSVM techniques. To find the most appropriate technique of MSVMs for corporate bond rating, we applied all the techniques of MSVMs to a real-world case of credit rating in Korea. The best application is in corporate bond rating, which is the most frequently studied area of credit rating for specific debt issues or other financial obligations. For our study the research data were collected from National Information and Credit Evaluation, Inc., a major bond-rating company in Korea. The data set is comprised of the bond-ratings for the year 2002 and various financial variables for 1,295 companies from the manufacturing industry in Korea. We compared the results of these techniques with one another, and with those of traditional methods for credit ratings, such as multiple discriminant analysis (MDA), multinomial logistic regression (MLOGIT), and artificial neural networks (ANNs). As a result, we found that DAGSVM with an ordered list was the best approach for the prediction of bond rating. In addition, we found that the modified version of ECOC approach can yield higher prediction accuracy for the cases showing clear patterns.

Analysis of Cancer Incidence in Zhejiang Cancer Registry in China during 2000 to 2009

  • Du, Ling-Bin;Li, Hui-Zhang;Wang, Xiang-Hui;Zhu, Chen;Liu, Qing-Min;Li, Qi-Long;Li, Xue-Qin;Shen, Yong-Zhou;Zhang, Xin-Pei;Ying, Jiang-Wei;Yu, Chuan-Ding;Mao, Wei-Min
    • Asian Pacific Journal of Cancer Prevention
    • /
    • 제15권14호
    • /
    • pp.5839-5843
    • /
    • 2014
  • Objective: The Zhejiang Provincial Cancer Prevention and Control Office collected cancer registration data during 2000 to 2009 from 6 cancer registries in Zhejiang province of China in order to analyze the cancer incidence. Methods: Descriptive analysis included cancer incidence stratified by sex, age and cancer site group. The proportions and cumulative rates of 10 common cancers in different groups were also calculated. Chinese population census in 1982 and Segi's population were used for calculating age-standardized incidence rates. The log-linear model was used for fitting to calculate the incidence trends. Results: The 6 cancer registries in Zhejiang province in China covered a total of 60,087,888 person-years during 2000 to 2009 (males 30,445,904, females 29,641,984). The total number of new cancer cases were 163,104 (males 92,982, females 70,122). The morphology verified cases accounted for 69.7%, and the new cases verified only by information from death certification accounted for 1.23%. The crude incidence rate in Zhejiang cancer registration areas was $271.5/10^5$ during 2000 to 2009 (male $305.41/10^5$, female $236.58/10^5$), age-standardized incidence rates by Chinese standard population (ASIRC) and by world standard population (ASIRW) were $147.1/10^5$ and $188.2/10^5$, the cumulative incidence rate (aged from 0 to 74) being 21.7%. The crude incidence rate was $209.6/10^5$ in 2000, and it increased to $320.20/10^5$ in 2009 (52.8%), with an annual percent change (APC) of 4.51% (95% confidence interval, 3.25%-5.79%). Age-specific incidence rate of 80-84 age group was achieved at the highest point of the incidence curve. Overall with different age groups, the cancer incidences differed, the incidence of liver cancer being highest in 15-44 age group in males; the incidence of breast cancer was the highest in 15-64 age group in females; the incidences of lung cancer were the highest in both males and females over the age of 65 years. Conclusions: Lung cancer, digestive system malignancies and breast cancer are the most common cancers in Zhejiang province in China requiring an especial focus. The incidences of thyroid cancer, prostate cancer, cervical cancer and lymphoma have increased rapidly. Prevention and control measures should be implemented for these cancers.