• 제목/요약/키워드: Relation Classification

검색결과 495건 처리시간 0.028초

현행 지목제도의 문제점에 대한 개선방안 도출에 관한 연구 - 지목의 설정과 변경 사례를 중심으로 - (A study on the Derivation of Improvement Method for the Problems of the Current Land Category System - Focused on Land Category Classification and Conversion Cases -)

  • 최대집;신만중
    • 지적과 국토정보
    • /
    • 제52권2호
    • /
    • pp.67-80
    • /
    • 2022
  • 본 연구는 지속적으로 제기되어온 실제 토지이용현황과 지적공부상 지목 불일치에 대하여 지적소 관청인 시·군·구청의 행정적·관리적 입장에서의 법률적 한계와 토지소유자 등 민원인의 입장에서 지목제도의 현실적인 문제점을 살펴보고 이를 해결할 수 있는 방안을 도출해보고자 하였다. 본 연구에서는 지적공부를 등록·관리하는 법령에서 토지의 용도에 따라 지목을 어떻게 구분하고 있는지와 토지의 용도와 이용을 제한하는 법률에 대하여 알아보고 이들 법률에 의하여 지적공부상 지목과 현실에서의 사실 지목이 불일치하는 상황이 어떻게 발생하는지 살펴보고, 지목의 통폐합과 세분화를 통한 지목체계 개편방안과 지목제도 운영에 있어서 지목설정 단일화와 지목변경 대상을 최소화하는 방안을 제시하고 토지소유자 등 국민의 재산권행사 제한을 최소화 할 수 있도록 법률 개선방향을 제시하였다.

머신러닝 기반의 뷰티 커머스 고객 세그먼트 분류 및 활용 방안: 언택트 서비스 중심으로 (A Study of the Beauty Commerce Customer Segment Classification and Application based on Machine Learning: Focusing on Untact Service)

  • 윤상혁;최윤진;이소현;김희웅
    • 경영정보학연구
    • /
    • 제22권4호
    • /
    • pp.75-92
    • /
    • 2020
  • 인구 및 세대 구조가 변화면서 점차 대면 관계를 꺼리는 고객의 태도 변화가 정보기술의 발달과 스마트폰의 확산으로 더욱 커지고 있다. 이는 정보기술에 익숙해진 현대 고객들의 소비패턴인 효율성 및 신속성과도 부합되는 것으로, 오프라인 망 중심의 유통회사들이 판매 및 서비스 방식을 언택트로 전환하려는 움직임이 활발해지고 있다. 최근 다양한 분야에서 언택트 서비스가 활성화되고 있지만, 뷰티 제품의 경우 고객의 피부타입 및 상태에 따라 제품 선택이 쉽지 않으므로 비대면을 통해 제품을 추천하기가 쉽지 않다. 이와 관련하여 온라인 뷰티 분야에서 제품 추천을 위한 추천시스템 개발 및 추천 관련 연구들이 수행되었지만, 대부분이 설문조사 방법이나 소셜 데이터를 이용하여 추천 알고리즘을 개발한 연구들이었다. 즉, 고객의 피부타입이나 제품 선호도 등의 실제 사용자 정보를 기반으로 세그먼트를 분류한 연구는 부족하였다. 그리하여, 본 연구에서는 뷰티 분야에서의 언택트 서비스 중의 하나인 모바일 애플리케이션의 고객 정보와 검색 로그 데이터를 기반으로 머신러닝 기법의 K-prototypes 알고리즘을 이용하여 고객 세그먼트를 새롭게 분류하고, 이를 기반으로 언택트 마케팅 전략 방안을 제안한다. 본 연구는 머신러닝 기법을 이용하여 새롭게 고객 세그먼트를 분류함으로써 관련 기존 문헌의 범위를 확장하였다. 더불어, 언택트 서비스라는 새로운 소비 트렌드를 반영하여 고객 세그먼트를 분류하고, 이를 기반으로 뷰티 분야의 언택트 서비스에 활용할 수 있는 구체적인 방안을 제시했다는 실무적 의의가 있다.

송이생산지 보전 및 복원을 위한 소나무군락의 식생구조 분석 - 강원도 양양군 송이발생지역을 중심으로 - (Vegetation Structure of Pinus densiflora Community for Conservation and Restoration of Tricholoma matsutake - Pine Mushroom Appearance Area in Yangyang-gun, Kangwon-do -)

  • 김정호;최송현;조우;성찬용
    • 한국환경생태학회지
    • /
    • 제26권5호
    • /
    • pp.730-740
    • /
    • 2012
  • 본 연구는 도로건설이 송이생산지에 미치는 영향을 최소화하기 위해 강원도 양양군내 신설 예정인 고속도로 건설지 주변의 송이생산 소나무군락의 식생구조를 분석하여 보전 및 복원의 기초자료로 활용하고자 하였다. 고속도로 건설예정지의 영향권과 송이생산량을 고려하여 도로 주변에 총 20개 조사구를 설정하여 Classification기법중의 하나인 TWINSPAN을 이용하여 군락을 분리한 결과, 소나무군락(군락 I, II), 소나무-굴참나무군락(군락 III), 소나무-낙엽활엽수군락(군락 IV)의 4개 군락으로 최종 분리되었다. 군락별 종다양도는 $1.7353{\pm}0.0341{\sim}1.9079{\pm}0.2471$의 범위이었으며 종수는 평균 $9.2{\pm}2.8$, 교목층 출현 평균개체수는 $9.6{\pm}5.0$개체이었다. 식생밀도는 $100m^2$당 4~29주(평균 9.55주), 평균상대공간지수는 35%이하이었으며 평균수령은 $38{\pm}8.34$년생이었으며 토양은 $A_0$층의 깊이가 4~6cm, 토양산도는 4.70~5.63(평균 5.29) 송이 생육에 적정한 수준이었다. 송이는 소나무와 공생의 관계로 소나무군락의 식생구조와 매우 밀접한 관계를 가지고 있으므로 생태적 관리방안으로 적정밀도 조절, 아교목층과 관목층의 밀도조절, 교목층 낙엽활엽수의 제거 등을 제안하였다. 향후 도로건설시 송이생산지역내 관통도로를 최소화하고 송이생산지내 및 인근지역을 관통할 경우 숲내부 천이 및 식생구조 변화가 발생하지 않도록 생태적 관리 및 복원조치가 필요할 것이다.

한국 토종오리의 개체 식별 및 품종 구분을 위한 Microsatellite 마커 탐색 (Investigation of Microsatellite Markers for Traceability and Individual Discrimination of Korean Native Ducks)

  • 서동원;술타나;최누리;김연수;진실;허강녕;진선덕;이준헌
    • 한국가금학회지
    • /
    • 제42권1호
    • /
    • pp.1-8
    • /
    • 2015
  • 최근, 한국의 소비자들이 건강에 대한 관심이 증가하면서 단일불포화 지방산이 풍부해 건강에 긍정적인 영향을 줄 수 있는 오리고기의 수요가 급격하게 증가하고 있다. 하지만 대부분의 종 오리는 수입에 의존하고 있는 실정이기 때문에, 토종오리의 개발 및 보급이 필요한 실정이며, 이는 종자주권의 확립 및 농가 소득 증대에도 매우 필요한 일이라 할 수 있다. 따라서 본 연구에서는 24개의 microsatellite 마커를 확보하였으며, 이들 마커의 대립유전자수는 1~16개, 이형접합도는 0~0.865, 다형성은 0~0.841로 확인되었다. 이들 마커를 이용하여 임의 집단에서 동일개체 출현빈도를 계산한 결과는 임의 집단 $1.64{\times}10^{-16}$, 전형매 집단 $2.60{\times}10^{-7}$, 반형매 집단 $1.30{\times}10^{-12}$으로 높은 개체식별률과 친자확인도를 확인할 수 있었다. 하지만 이들 마커를 이용한 계통분석 결과, 토종오리와 실용오리 집단을 정확하게 구분하기에는 어려운 것으로 확인되었다. 따라서 추가연구를 통해 토종오리의 순종화 및 더 정확한 토종오리와 실용오리 집단 구분이 가능한 마커 개발이 필요할 것으로 사료된다.

Variation of Hospital Costs and Product Heterogeneity

  • Shin, Young-Soo
    • Journal of Preventive Medicine and Public Health
    • /
    • 제11권1호
    • /
    • pp.123-127
    • /
    • 1978
  • The major objective of this research is to identify those hospital characteristics that best explain cost variation among hospitals and to formulate linear models that can predict hospital costs. Specific emphasis is placed on hospital output, that is, the identification of diagnosis related patient groups (DRGs) which are medically meaningful and demonstrate similar patterns of hospital resource consumption. A casemix index is developed based on the DRGs identified. Considering the common problems encountered in previous hospital cost research, the following study requirements are estab-lished for fulfilling the objectives of this research: 1. Selection of hospitals that exercise similar medical and fiscal practices. 2. Identification of an appropriate data collection mechanism in which demographic and medical characteristics of individual patients as well as accurate and comparable cost information can be derived. 3. Development of a patient classification system in which all the patients treated in hospitals are able to be split into mutually exclusive categories with consistent and stable patterns of resource consumption. 4. Development of a cost finding mechanism through which patient groups' costs can be made comparable across hospitals. A data set of Medicare patients prepared by the Social Security Administration was selected for the study analysis. The data set contained 27,229 record abstracts of Medicare patients discharged from all but one short-term general hospital in Connecticut during the period from January 1, 1971, to December 31, 1972. Each record abstract contained demographic and diagnostic information, as well as charges for specific medical services received. The 'AUT-OGRP System' was used to generate 198 DRGs in which the entire range of Medicare patients were split into mutually exclusive categories, each of which shows a consistent and stable pattern of resource consumption. The 'Departmental Method' was used to generate cost information for the groups of Medicare patients that would be comparable across hospitals. To fulfill the study objectives, an extensive analysis was conducted in the following areas: 1. Analysis of DRGs: in which the level of resource use of each DRG was determined, the length of stay or death rate of each DRG in relation to resource use was characterized, and underlying patterns of the relationships among DRG costs were explained. 2. Exploration of resource use profiles of hospitals; in which the magnitude of differences in the resource uses or death rates incurred in the treatment of Medicare patients among the study hospitals was explored. 3. Casemix analysis; in which four types of casemix-related indices were generated, and the significance of these indices in the explanation of hospital costs was examined. 4. Formulation of linear models to predict hospital costs of Medicare patients; in which nine independent variables (i. e., casemix index, hospital size, complexity of service, teaching activity, location, casemix-adjusted death. rate index, occupancy rate, and casemix-adjusted length of stay index) were used for determining factors in hospital costs. Results from the study analysis indicated that: 1. The system of 198 DRGs for Medicare patient classification was demonstrated not only as a strong tool for determining the pattern of hospital resource utilization of Medicare patients, but also for categorizing patients by their severity of illness. 2. The wei틴fed mean total case cost (TOTC) of the study hospitals for Medicare patients during the study years was $11,27.02 with a standard deviation of $117.20. The hospital with the highest average TOTC ($1538.15) was 2.08 times more expensive than the hospital with the lowest average TOTC ($743.45). The weighted mean per diem total cost (DTOC) of the study hospitals for Medicare patients during the sutdy years was $107.98 with a standard deviation of $15.18. The hospital with the highest average DTOC ($147.23) was 1.87 times more expensive than the hospital with the lowest average DTOC ($78.49). 3. The linear models for each of the six types of hospital costs were formulated using the casemix index and the eight other hospital variables as the determinants. These models explained variance to the extent of 68.7 percent of total case cost (TOTC), 63.5 percent of room and board cost (RMC), 66.2 percent of total ancillary service cost (TANC), 66.3 percent of per diem total cost (DTOC), 56.9 percent of per diem room and board cost (DRMC), and 65.5 percent of per diem ancillary service cost (DTANC). The casemix index alone explained approximately one half of interhospital cost variation: 59.1 percent for TOTC and 44.3 percent for DTOC. Thsee results demonstrate that the casemix index is the most importand determinant of interhospital cost variation Future research and policy implications in regard to the results of this study is envisioned in the following three areas: 1. Utilization of casemix related indices in the Medicare data systems. 2. Refinement of data for hospital cost evaluation. 3. Development of a system for reimbursement and cost control in hospitals.

  • PDF

전황함량과 순산발생능력의 상관관계를 통한 잠재특이산성토양 기준 설정 (The Potential Acid Sulfate Soils Criteria by the Relation between Total-Sulfur and Net Acid Generation)

  • 문용희;장용선;현병근;손연규;박찬원;송관철
    • 한국토양비료학회지
    • /
    • 제45권6호
    • /
    • pp.904-909
    • /
    • 2012
  • 황철석 (Pyrite, FeS2)을 함유한 잠재특이산성토는 강하류 삼각지 토양, 간척지 등의 해성토뿐만 아니라, 영일만과 같은 융기해성토 지대, 내륙의 선상지하단 유기물이 많은 암흑색 토층이 있을 때에 존재하는 수가 있다. 또한 안산암 지역의 열수작용에 의해 생성되어 암맥을 따라 형성된 황철석이 광산개발이나 도로건설로 절취사면에서 노출되어 산화되면 매우 강한 산성을 띠는 특이산성토층을 형성하여 주변농경지에 피해를 주고 있다. 현재 잠재특이산성토양의 판정은 현장에서는 과산화수소로 반응 시 수증기발생 정도로 판단하거나 실내실험에서는 전황 (Total-S)성분의 함량으로 판단한다. 하지만 이들 방법은 시군농업기술센터 및 현장 진단 시 적용이 용이하지 않다. 산발생 능력평가 중 순산 발생능력실험 (Net Acid Generation, NAG pH)은 대상지역의 산성발생 가능성에 대한 예측을 정량적 계산으로 가능하다. 순산발생능력실험을 이용하여 전황함량과 NAG pH와의 상호관계를 통해 특이산성토양 판정을 제안하기 위해 화산기원의 잠재특이산성 토양과 사양질 토양을 일정비율로 혼합된 토양과 특이산성토양인 김해통과 해척통 토양에 대해 실험을 수행하였다. 전황의 함량이 0.75% 이상인 시료의 NAG pH가 2.5이며 0.75-0.50%의 중간 특이산성토양은 NAG pH 3.0으로 측정되었다. 그리고 전황 함량이 0.5-15% 약한 특이산성 토양은 NAG pH 3.8로 측정되었다. 따라서 순산발생량은 NAG pH를 이용하여 토양 내 황철석을 모두 산화시키고 pH를 측정하여 pH 3.8이하인 토양은 특이산성토양으로 구분하는 것이 타당할 것으로 판단되었다.

스키와 스노우 보드에서 헬멧의 착용이 경추부 손상에 미치는 영향 (The influence of wearing helmet and cervical spine injury in skiers and snowboarders)

  • 김성훈;김태균;전근철;황재선
    • 대한정형외과스포츠의학회지
    • /
    • 제10권2호
    • /
    • pp.94-99
    • /
    • 2011
  • 목적: 겨울철 스포츠로서 스키와 스노우 보드를 즐기는 인구가 점차 증가하여 대중화 되고 있다. 안전 장비에 대한 인식도 발전하여 스키나 스노우 보드에서 헬멧의 착용도 늘었고, 이 영향으로 두부나 안면부 손상의 비율은 감소하였다. 그러나 헬멧의 착용이 경추부 손상에 어떠한 영향을 미치는 지에 대하여 아직 잘 알려지지 않았다. 따라서 이에 대한 연구를 통하여 경추부손상의 감소를 위한 효과적인 보호장비의 개발에 도움이 되고자 조사하였다. 대상 및 방법: 2009년 12월부터 2010년 3월까지, 2010년 12월부터 2011년 3월까지 2시즌 동안 국내 대형 리조트에서 스키 및 스노우 보드 손상으로 의무 시설에 내원한 환자 14,538명 중 경추부 손상으로 내원한 658명을 대상으로 하였으며, 남자 432명, 여자 226명이 내원하였고, 상급자 273명 초급자 385명 이었다. 이들을 대상으로 헬멧을 착용 한 군과 착용하지 않은 군으로 나누어 경추 손상 비율, 수상 기전, 손상의 정도 및 진단된 질환에 대하여 조사하였다. 각각의 군은 SPSS 12.0(SPSS Inc., Chicago, IL, USA)를 사용하여 통계학적으로 처리 하였다. 결과: 스키 손상으로 인한 환자는 312명, 스노우 보드 손상은 346명 이었으며, 헬멧을 착용한 수상자는 스키 143명, 스노우 보드 140명 이었다. 각 질환 별 분류는 단순 염좌 292명, 타박상 359명, 경추부 골절 6명, 탈구 1명이며, 수상 원인 별 분류에서 대인 충돌 287명, 대물 충돌 212명, 혼자서 넘어진 경우 108명, 낙상 39명, 기타 12명으로 나타났다. 헬멧을 쓴 경우 스키 78명/스노우 보드 70명에서 단순 염좌 였고, 스키 64명/스노우 보드 68명에서 타박상으로 나타났으며, 스키 1명/ 스노우 보드 2명에서 경추부의 골절이나 탈구가 발생하였다. 헬멧을 쓴 경우 헬멧을 착용하지 않은 경우에 비하여 경추부 염좌의 빈도는 통계학적으로 유의하게 높았으며(p<0.001), 헬멧을 착용하지 않은 경우 헬멧을 착용한 경우에 비하여 좌상의 빈도가 유의하게 높았다(p<0.05). 그러나 골절, 탈구에서는 헬멧을 쓴 경우와 그렇지 않은 경우를 비교하였을 때 수상빈도의 유의한 증가는 관찰되지 않았다(p>0.05). 결론: 본 연구에서 헬멧이 스키와 스노우 보드에서 공히 추가적인 경추 손상의 발생과 심각도를 증가시키지 않았고, 대인 손상시에 헬멧의 사용은 경추부 염좌의 빈도가 통계학적으로 유의하게 증가되었으나 좌상의 빈도는 감소하였다. 그러나 추가적인 생체 역학적 연구가 필요 할 것으로 사료된다.

  • PDF

수술실 간호인력의 수요측정 및 간호제공량분석 - 수술대기시간과 수술시간을 중심으로 - (A Study of Nursing Manpower Requirements based on the Nursing Times spent in Operating Room of an University Hospital)

  • 윤계숙
    • 한국보건간호학회지
    • /
    • 제1권1호
    • /
    • pp.45-61
    • /
    • 1987
  • This Study was an attempt to estimate the optimum numbers of Operating Room Nursing Manpower by measuring the amount of service hours required by the patients in Operating Room in relation to the service amount actually provided by the nurses. The major concern of this study was placed on the measurement of Nursing Service Requirements by using the Operating Room (O. R) Patient Acuity System recently developed by M. M. Hart to classify the O. R. patients into four groups according to the degree of the complexity of operative procedure and some other elements which increase nursing activities in respect of patient care; Acuity IV group is the one requires nursing services most, on the other hand Acuity I requires least. nu sing The objectives of this study were as follows; 1. To analyze functions of the nursing personnel in O. R. by time unit and to estimate the average time a nurse can activate for productive functions. 2. To measure the actual amount of nursing times provided by nurses to the surgical patients. 3. To develop a patient classification system in order to measure the amount of Nursing services required by the patients. 4. To calculate an appropriate number of nursing manpower to meet the needs of the patients. In order to conduct the research both selected nurses and patients in 'S' University Hospital were Studied by utilizing the O. R. Patient Acuity System as well as the Classification Chart developed by Association of Operating Room Nurses (A. O. R. N) as a means of classifying functions of O. R. nurses. That is; Functions of the 10 selected O. R. nurses observed during the period of June 30 to July 4, 1986, whereas the amount of nursing services required by or provided to the 974 patients who had received surgeries during the period of June 9 to July 4, 1986. The results of this study were as follows; 1) The actual working hours per a nurse averaged 6.7 hours a day. 2) Each nurse's daily routine schedule consists of $71.4\%$ for Technical Functions, $16.1\%$ for Nonprodective Functions, $6.6\%$ for Assessment and Evaluation, $3.9\%$ for Overseeing and Supervision and the rest $2.0\%$ for Patient Preparation respectively. 3) Preoperative waiting time per a patient was 24.1 minutes on the average; for the first case was 10.7 minutes, whereas for the following cases was 32.0 minutes. 4) Total Operation time for the 974 patients during the period of observation for this study amounted to 2759.6 hours, weekly hour was equivalent to 689.9 hours, Whereas daily operation time averaged 130 hours. Meanwhile the average operation time per patient was 2.8 hours ; for the case of Acuity IV was 5.6 hours, 5. 1 hours for the case of Acuity III, 2.3 hours for Acuity II and 1.1 hours for Acuity I. 5) According to the O. R. Patient Acuity System, $64.5\%$ of the whole patients belonged to Acuity II, $23.7\%$ to Acuity III, 11. $3\%$ to Acuity IV and $0.7\%$ to Acuity I respectively. 6) Required amount of nursing times based on the preoperative waiting time and operation time was 7167.8 person hours, which showed that $5.5\%$ of them needed for preoperative nursing care, whereas the rest $94.5\%$ for intraoperative nursing care. In terms of the O. R. Patient Acuity System, $49.7\%$ of total nursing service requirements was needed for Acuity II patients, $27.4\%$ for Acuity III patients, $17.2\%$ for Acuity IV patients and $0.2\%$ for Acuity I patients. 7) The rate of the nursing services provided against the required nursing times was about $81.4\%$ on the average; some departments, like those of Plastic Surgery, Otolaryngology and Ophthalmology whose patients mostly belonged to Acuity II recorded hegher provision rate than average, whereas other departments of Thoracic Surgery. Neurosurgery and Orthopedic Surgery whose patients belonged to Acuity III and Acuity IV as well as Acuity II recorded lower provision rate than average. 8) Subsequently, required numbers of nursing manpower was 10.7 nurses additionally. Based on the above findings the following recommendations will be made; 1) this study recommends, develops. and adopts an accurate and realistic O. R. Patient Acuity System which can help measure the nursing service requirements objectively to elicit the rationales of allocation of nursing personnels. 2) this study proposes storongly place nurses who take the role of preoperative nursing care exclusively for the waiting patients in O. R. and shortening their waiting time by close communication between the designated O. R. and the ward.

  • PDF

TWINSPAN 및 DCCA에 의한 한반도(韓半島) 주목림(林)의 군락(群落)과 환경(環境)의 상관관계(相關關係) 분석(分析) (The Analysis of Vegetation-Environment Relationship of the Taxus cuspidata Forests by TWINSPAN and DCCA)

  • 신현철;이강영;송호경
    • 한국산림과학회지
    • /
    • 제87권4호
    • /
    • pp.535-542
    • /
    • 1998
  • 한반도(韓半島) 고산지대(高山地帶)에 자생(自生)하는 주목림에 대한 군락(群落)과 환경(環境)과의 상관관계(相關關係)를 구명(究明)하기 위하여 중요치(重要値)와 TWINSPAN 및 DCCA 방법(方法)에 의하여 분석(分析)을 하였던 바, 그 결과(結果)를 요약(要約)하면 다음과 같다. 주목의 지역별(地域別), 층위별(層位別) 중요치(重要値)는 상층(上層)에서 대부분 100이상 높게 나타났으나 지리산(智異山), 한라산(漢拏山) 지역은 비교적 낮게 나타났으며, 중층(中層)은 상층(上層)에 비하여 낮은 값이었고 지리산(智異山) 지역(地域)에서는 전혀 출현(出現)되지 않았다. 하층(下層)에서는 한라산(漢拏山), 오대산(五帶山), 소백산(小白山) 지역(地域)에서만 출현(出現)하였으며 중요치(重要値)도 10 내외(內外)로 낮은 값이었다. TWINSPAN에 의한 군락(群落) 분류(分類)는 주목 - 털야광나무, 주목 - 분비나무, 주목 - 구상나무, 주목 - 고로쇠나무, 주목 - 둥근잎참빗살나무 등(等) 5개 그룹으로 나누어졌다. 분류(分類)된 5개(個) 그룹과 환경요인(環境要因)들과의 관계(關係)를 보면 주목 - 구상나무 군락(群落)은 해발고(海拔高)가 다른 군락(群落)들 보다 상대적으로 높은 산정(山頂)의 동향(東向)에 주로 분포(分布)하고 있고, 주목 - 고로쇠나무 군락(群落)과 주목 - 분비나무 군락(群落)은 해발고(海拔高)가 다른 군락(群落)들 보다 상대적으로 낮은 산복부에 주로 분포하고 있으며, 주목-둥근잎참빗살나무 군락은 해발고가 상대적으로 높은 산정(山頂)의 북(北) 동향(東向)에, 주목 - 털야광나무 군락(群落)은 해발고(海拔高)가 중간(中間)정도인 능선부(稜線部)의 남(南) 서향(西向)에 분포(分布)하는 것으로 나타났다. 군락(群落)과 환경요인(環境要因)과의 관계(關係)는 제1축에서 방위(方位), 지형(地形), 해발고(海拔高)가 제2축에서는 해발고(海拔高), 경사도(傾斜度) 등(等)과 상관관계(相關關係)가 있는 것으로 나타났다.

  • PDF

데이터마이닝 기법을 활용한 대학수학능력시험 영어영역 정답률 예측 및 주요 요인 분석 (Prediction of Correct Answer Rate and Identification of Significant Factors for CSAT English Test Based on Data Mining Techniques)

  • 박희진;장경애;이윤호;김우제;강필성
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제4권11호
    • /
    • pp.509-520
    • /
    • 2015
  • 대학수학능력시험(수능)은 고등학교 3년간의 학업 성취도를 측정하는 대표적인 평가 도구로서 대한민국 대학 입시에 있어 매우 중요한 역할을 하는 시험이다. 응시생들의 학업 성취도를 효과적으로 평가하기 위해서는 수능의 난이도가 적절하게 조절되어야 하나 지금까지는 수능 난이도의 편차가 매우 크게 나타나 매 입시연도마다 여러 가지 문제점을 야기해왔다. 본 연구에서는 전문가의 판단에 의존한 기존 방식에서 벗어나 지금까지 시행된 모의고사 및 실제 시험을 통해 축적된 자료를 바탕으로 데이터마이닝 기법을 적용하여 영어영역 문제의 난이도를 예측하는 모델을 구축하고 난이도 예측에 영향을 미치는 요소를 판별하고자 한다. 이를 위해 각 문항의 특성을 판별할 수 있는 여러 지표와 함께 지문, 문제, 답안 등에 나타난 단어들의 특징을 토픽 모델링(topic modeling) 기법을 이용하여 정량화하고 이를 바탕으로 선형회귀분석 및 의사결정나무 기법을 이용하여 각 문항의 난이도를 예측하는 모델을 구축하였다. 구축된 예측 모델을 실제 문제에 적용한 결과 난이도의 상/하 구분에 대한 예측 정확도는 90% 수준으로 나타났으며, 실제 정답률 대비 오차 비율은 약 16% 이내인 것으로 나타났다. 또한 배점 및 문제 유형이 문제의 난이도에 큰 영향을 미치며 지문이 특정 주제에 관련된 경우에도 난이도에 영향을 미치는 것을 확인하였다. 본 연구에서 제시된 방법론을 이용하여 영어영역 각 문제들에 대한 기대 정답률의 범위를 추정할 수 있으며 이를 종합하여 영어영역 전체 문제에 대한 정답률 예측을 통해 적절한 난이도의 문제를 출제하는 데 기여할 수 있을 것으로 기대한다.