• 제목/요약/키워드: Construction Performance

검색결과 8,022건 처리시간 0.035초

인터넷 검색기록 분석을 통한 쇼핑의도 포함 키워드 자동 추출 기법 (A Methodology for Extracting Shopping-Related Keywords by Analyzing Internet Navigation Patterns)

  • 김민규;김남규;정인환
    • 지능정보연구
    • /
    • 제20권2호
    • /
    • pp.123-136
    • /
    • 2014
  • 최근 온라인 및 다양한 스마트 기기의 사용이 확산됨에 따라 온라인을 통한 쇼핑구매가 더욱 활성화 되었다. 때문에 인터넷 쇼핑몰들은 쇼핑에 관심이 있는 잠재 고객들에게 한 번이라도 더 자사의 링크를 노출시키기 위해 키워드에 비용을 지불할 용의가 있으며, 이러한 추세는 검색 광고 시장의 광고비를 증가시키는 원인을 제공하였다. 이 때 키워드의 가치는 대체로 검색어의 빈도수에 기반을 두어 산정된다. 하지만 포털 사이트에서 검색어로 자주 입력되는 모든 단어가 쇼핑과 관련이 있는 것은 아니며, 이들 키워드 중에는 빈도수는 높지만 쇼핑몰 관점에서는 별로 수익과 관련이 없는 키워드도 다수 존재한다. 그렇기 때문에 특정 키워드가 사용자들에게 많이 노출된다고 해서, 이를 통해 구매가 이루어질 것을 기대하여 해당 키워드에 많은 광고비를 지급하는 것은 매우 비효율적인 방식이다. 따라서 포털 사이트의 빈발 검색어 중 쇼핑몰 관점에서 중요한 키워드를 추출하는 작업이 별도로 요구되며, 이 과정을 빠르고 효과적으로 수행하기 위한 자동화 방법론에 대한 수요가 증가하고 있다. 본 연구에서는 이러한 수요에 부응하기 위해 포털 사이트에 입력된 키워드 중 쇼핑의도를 포함하고 있을 가능성이 높을 것으로 추정되는 키워드만을 자동으로 추출하는 방안을 제시하고, 구체적으로는 전체 검색어 중 검색결과 페이지에서 쇼핑과 관련 된 페이지로 이동한 검색어만을 추출하여 순위를 집계하고, 이 순위를 전체 검색 키워드의 순위와 비교하였다. 국내 최대의 검색 포털인 'N'사에서 이루어진 검색 약 390만 건에 대한 실험결과, 제안 방법론에 의해 추천된 쇼핑의도 포함 키워드가 단순 빈도수 기반의 키워드에 비해 정확도, 재현율, F-Score의 모든 측면에서 상대적으로 우수한 성능을 보이는 것으로 나타남을 확인할 수 있었다.

SVM을 이용한 시스템트레이딩전략의 선택모형 (Selection Model of System Trading Strategies using SVM)

  • 박성철;김선웅;최흥식
    • 지능정보연구
    • /
    • 제20권2호
    • /
    • pp.59-71
    • /
    • 2014
  • KOSPI200 선물 트레이딩을 위해 업계에서는 여러 전략으로 포트폴리오를 구성해서 운용한다. 동일한 전략 모음을 갖고 있더라도 포트폴리오를 어떻게 구성하느냐에 따라 수익은 크게 차이가 난다. 시장 상황에 맞는 전략들로 포트폴리오를 구성하는 것은 오랜 경험과 탁월한 노하우가 있어야하는 어려운 작업이다. 본 논문에서는 SVM을 활용하여 쉽고 빠르게 적절한 전략 포트폴리오를 구성하는 방법을 제시하였다. 본 논문에서 제안한 시스템의 성과는 벤치마킹의 성과와 비교하여 2배 이상의 수익을 내는 것을 확인하였다. 1990.01.03~2011.11.04 동안의 KOSPI200 데이터 중 이전 80%의 데이터로 학습을 하고 최근 20%의 데이터로 성능을 시험하였다. 각 전략별로 선택여부를 판별하는 SVM모델을 만들고 그 결과를 바탕으로 포트폴리오를 구성하였다. 벤치마킹을 위해 KOSPI200 선물을 2계약 매수한 경우의 수익, 시험 시작 직전 30일간 최고 수익을 낸 2개 전략의 수익, 실제 최고 수익을 낸 전략 2개를 보유했을 때의 수익과 비교하였다. 매매 비용을 반영하지 않을 때는 벤치마킹은 132.2~510.37pt의 수익을 냈고, 본 시스템은 1072.36~1140.91pt의 수익을 보여주었다. 그리고 거래비용을 감안하면 벤치마킹은 130.44~502.41pt의 수익을 냈고, 본 시스템은 706.22pt~768.95pt의 수익을 나타내었다. 본 논문은 기계학습을 통한 전략 포트폴리오를 구성하는 방안이 유의미하며 실전에 활용할 수 있음을 보여주었다. 이를 바탕으로 여러 전략과 다양한 시장에 적용해서 안정성을 검증하면 견고한 상용 솔루션으로 발전시킬 수 있을 것이다. 그리고 자금관리 기법을 더 반영한다면 수익을 더욱 크게 향상시킬 수 있을 것이다.

데이터마이닝을 이용한 허위거래 예측 모형: 농산물 도매시장 사례 (Detection of Phantom Transaction using Data Mining: The Case of Agricultural Product Wholesale Market)

  • 이선아;장남식
    • 지능정보연구
    • /
    • 제21권1호
    • /
    • pp.161-177
    • /
    • 2015
  • 정보기술의 빠른 진화, 빅데이터의 등장, 분석기법의 고도화 등으로 인해 다량의 데이터로부터 의미있는 정보를 추출하는 데이터마이닝을 다양한 영역에 활용하고자 하는 시도들이 활발히 진행되고 있다. 그 중의 한 분야가 농산물 유통영역인데, 농산물에 대한 지속적인 수요 증가와 전자경매의 활성화 등으로 수도권 농산물 도매시장에서만도 연간 수천만건 이상의 거래가 이루어 진다. 그러나 급속한 거래량 증가와 더불어 과거로부터 관행적으로 이루어지고 있는 부정거래도 함께 증가하고 있는데 거래참가자들 사이의 결탁에 의해 발생하는 농산물 도매시장의 부정거래는 점차 지능화되는 추세이며, 이들을 감지하고 적발하기가 매우 어려운 실정이다. 이로 인해 농산물 유통환경의 공정거래 질서는 침해되고 시장에 대한 신뢰는 훼손되곤 한다. 따라서 거래투명성을 제고하고 유통비리를 구조적으로 개선하기 위한 과학적이고 자동화된 부정탐지시스템의 필요성이 어느 때보다도 절실히 요구되는 상황이다. 본 연구에서는 데이터마이닝의 의사결정나무를 이용하여 실제 발생하지 않은 거래를 실물 없이 거래한 것처럼 조작하여 대금을 정산하는 행위인 허위거래를 탐지하는 모형을 제시하였다. 이를 위해 실제 농산물 도매시장의 데이터를 수집하였고, 데이터의 정제 및 표준화 등의 선행작업을 수행하였다. 또한 변수 간의 상관관계 및 분포도 분석 등을 통해 데이터의 특성을 파악한 후 예측모형을 구축하여 허위거래와 정상거래를 분류하는 패턴을 도출하였으며, 최종적으로 시험용 데이터를 이용하여 모형을 평가하는 단계를 거쳐 결과의 적합성을 확인하였다. 향후 데이터마이닝을 이용한 부정탐지 모형을 허위거래뿐만 아니라 낙찰부정, 경매조작 등과 같이 다양화되는 부정거래에 적용하게 되면 보다 지대한 효과를 거둘 수 있으리라 사료된다.

프랜차이즈 기업의 지식경영 전략 : 파리바게뜨 사례를 중심으로 (Knowledge Management Strategy of a Franchise Business : The Case of a Paris Baguette Bakery)

  • 조준상;김보영
    • 유통과학연구
    • /
    • 제10권6호
    • /
    • pp.39-53
    • /
    • 2012
  • 기업에 경쟁우위를 가져다주는 많은 자원들 중에서 특히 지식(knowledge)은 생산 활동을 위해 다른 자원을 변화시키거나 확보할 수 있도록 만드는 중요한 자원으로 알려져 있다. 이러한 조직 내 지식은 다양한 형태로 존재하고, 다양한 장소나 개인에게 산재해 있기 때문에, 이를 통합하고 체계적으로 활용하기 위한 기업의 전사적 관리 활동이 필요하다. 특히 지식관리시스템(KMS: knowledge management systems)은 조직 내 지식을 창조하고, 공유하고, 적절히 사용함으로써 지식관리 프로세스를 지원하고 조직이 가진 지식자원의 가치를 극대화하여 기업의 학습조직화와 성과 증진을 이끌 수 있다. 이에 본 연구는 국내 대표적인 프랜차이즈 기업인 파리바게뜨의 성공적인 지식관리시스템운영 사례를 분석하여 프랜차이즈 기업들의 지식경영을 강화 및 지식관리시스템(KMS) 구축과 개선을 위한 구체적인 시사점을 제안하고자 하였다. 결과적으로 최고경영층의 관심과 지원, 능동적인 지식 공유와 활용을 위한 학습조직 문화, 네트워크 활성화를 통한 지식의 변환, 정보기술, 지식경영의 내재화를 위한 촉진제도와 보상이라는 5가지 주요 요인이 프랜차이즈 기업의 지식관리시스템의 성공적 운영을 위해 반드시 고려되어야 하는 요인임을 밝혀낼 수 있었다.

  • PDF

내부충진을 통한 벨크로 보강재의 성능향상에 대한 실험적 연구 (Experimental Study on the Performance Improvement of Velcro Reinforcement through Internal Filling)

  • 정영석;권민호;김진섭;남광식
    • 대한토목학회논문집
    • /
    • 제41권4호
    • /
    • pp.347-355
    • /
    • 2021
  • 다층 구조물의 경우 1층이 연약한 경우 지진 시 1층에 변형이 집중되어 기둥 부재에 심각한 손상이 발생하거나 파괴되어 구조물이 붕괴하는 사례가 발생하게 된다. 국내의 경우 포항지진 당시 필로티 구조물의 손상사례를 예로 들 수 있다. 2016년 국립재난 안전연구원의 "국내 비내진 건축물의 내진보강공법 조사 및 소요비용 분석 연구"에 따르면 민간 철근콘크리트조 건축물 중 주택의 내진화 비율은 38.3 %고, 그 중 2층 구조물 7.1 %에서 6층 96.3 % 그 외 99.4 %로 2~5층 구조물의 경우 내진비율이 50 %이하로 저조한 것으로 보고하였다. 이에 정부는 지원사업을 통해서 내진화율을 개선코자 하고있으나, 종래의 보강법은 여전히 시공비용이 고가이고 긴급시공이 어려운 단점이 있다. 따라서 본 연구에서는 2014년 국토교통부의 연구사업을 통해서 개발된 저렴하고 긴급시공이 가능한 벨크로를 사용한 내진보강법의 성능을 개선하고자 벨크로와 콘크리트 기둥 사이에 고발포의 경질 우레탄 내부 충진을 통해서 벨크로의 초기긴장력을 도입하고, 이를 통해서 콘크리트 구속효과에 따른 벨크로의 연성보강성능 개선을 목표로 이를 평가하기 위한 실험을 수행하였다. 시험체의 최대 연성도를 통한 평가에서 벨크로 내진 보강재의 최대 연성도 증진 효과를 재확인할 수 있었다. 에너지 소산 능력을 통한 평가에서는 VELCRO1 대비 VELCRO2 눈에 띄는 개선을 보인 반면, VELCRO1와 VELCRO2 시험체의 최대 연성도는 큰 차이를 보이지 않았다. 결과적으로 충진재가 사용된 VELCRO2 시험체에서 에너지 소산 능력은 크게 증진되었으나, 최대 연성도 평가에서 최대변위(∆max)의 증가가 크지 않은 것을 확인하였다. 따라서 내부 충진재 재료의 개선과 균일한 충진재 시공을 개선의 필요성이 확인되었다.

제철소 적용을 위한 저온형 금속지지체 탈질 코팅촉매 최적화 연구 (An Optimization Study on a Low-temperature De-NOx Catalyst Coated on Metallic Monolith for Steel Plant Applications)

  • 이철호;최재형;김명수;서병한;강철희;임동하
    • 청정기술
    • /
    • 제27권4호
    • /
    • pp.332-340
    • /
    • 2021
  • 최근 사업장 질소산화물(NOx) 배출허용기준 강화(2019년 1월 적용)에 따라 다량 배출사업장에서 배출되는 질소산화물을 배출허용기준 이하로 만족하기 위한 노력이 필요하다. 대표적인 질소산화물 저감 방법으로 선택적 촉매 환원법(selective catalytic reduction, SCR)을 주로 사용하고 있으며, 일반적으로 세라믹 허니컴(ceramic honeycomb) 촉매를 사용하고 있다. 본 연구에서는 높은 열적 안정성과 기계적 강도를 가지는 금속지지체 탈질 코팅촉매를 적용하여 제철소에서 배출되는 질소산화물를 저감하기 위한 연구를 수행하였다. 금속지지체 코팅촉매는 최적화된 촉매슬러리(catalyst slurry) 코팅방법을 통해 제조하였고, 내마모 시험과 굽힙 시험을 통해 코팅된 촉매가 균일하고 강건하게 부착되어 있음을 확인하였다. 금속지지체가 가지는 우수한 열전도 특성으로 인해 저온영역(200 ~ 250 ℃)에서 세라믹 허니컴 촉매보다도 우수한 탈질효율을 보였다. 또한 경제적인 촉매 설계를 위해 금속지지체 표면 상에 코팅되는 촉매의 최적 코팅량을 확인하였다. 이러한 연구결과를 바탕으로 제철소 배기가스 모사환경에서 상용급 금속지지체 코팅촉매에 대한 준파일럿 탈질 성능평가를 수행하였고, 저온영역(220 ℃)에서도 배출허용기준치(60 ppm 이하)을 만족하는 우수한 성능을 나타내었다. 따라서 물리화학적 특성이 우수한 금속지지체 코팅촉매가 최소량의 촉매 사용으로도 우수한 탈질 성능을 나타내었으며, 넓은 비표면적을 가지는 고밀도 금속지지체 적용을 통해 배연 탈질 촉매 반응기의 콤팩트화 및 소형화가 가능하였다. 이러한 결과를 바탕으로, 본 연구에서 사용된 금속지지체 코팅촉매는 제철소뿐만 아니라 화력발전, 소각장, 선박, 건설기계 등 다양한 산업 분야에 적용할 수 있는 새로운 형태의 촉매가 될 것이다.

민간공원 특례사업 추진 대상지 이용객의 중요도-만족도 인식에 관한 연구 - 의정부 직동근린공원을 대상으로 - (Research on the Importance-Satisfaction Perception of Users of Private-Initiated Park Development Project - Focused on Jikdong Neighborhood Parks in Uijeongbu City -)

  • 김종호;김건우
    • 한국조경학회지
    • /
    • 제50권4호
    • /
    • pp.63-76
    • /
    • 2022
  • 본 연구는 장기미집행 도시공원의 대응수단으로 진행된 민간공원 특례사업 중 첫 시행 및 완료된 의정부 직동근린공원을 대상으로 이용객의 공원이용현황과 중요도 및 만족도 분석을 통해 인식을 비교하고자 수행하였다. 특례사업 추진계획에 따른 대상지 아파트 거주민과 비거주민을 그룹으로 분류하였으며, 공원이용현황과 IPA 분석을 위해 중요도 및 만족도 설문을 수행하였다. 먼저 민간공원 특례사업 추진 시 발생하고 있는 입지적 특성 측면에서 현황분석을 통해 확인한 결과, 연구대상지는 산지형 대상지들과 달리 평지형에 가까운 입지 형태를 보여 이용객들의 경관성에 대한 만족도가 높은 것으로 나타났다. 둘째, 특례사업지 내 아파트 거주민들은 접근성이 용이하여 이용도가 비거주민에 비해 상대적으로 높은 것으로 나타났다. 셋째, IPA 분석 및 전략수립을 통해 항목별 인식차이를 확인하였다. 거주민은 I사분면에 시설 및 서비스에서 화장실 설치가 우선순위로 나타났으며, 비거주민은 주차시설과 휴식시설이 화장실 설치보다 우선순위가 높은 것으로 확인되었다. II사분면에서는 전반적으로 거주민과 유사하게 나타났으나 공원까지의 거리는 만족도의 수준이 낮아 III사분면에 위치하였다. 본 연구에서 거주민과 비거주민 간의 인식차이는 추후 공원을 관리하는데 있어 접근적, 시설적 문제점들을 야기할 수 있으므로 조성 후에 거주민들의 인식차이를 고려한 관리전략을 수립을 통해 개선할 수 있는 방안모색이 필요할 것으로 사료된다. 또한, 본 연구결과를 통해 공원조성 목적과 공원의 유형선정, 유형별 계획 및 관리지표의 선정이 특례사업의 추진에 있어 공원조성 계획 시 중요할 것으로 판단되었다.

Field Studios of In-situ Aerobic Cometabolism of Chlorinated Aliphatic Hydrocarbons

  • Semprini, Lewts
    • 한국지하수토양환경학회:학술대회논문집
    • /
    • 한국지하수토양환경학회 2004년도 총회 및 춘계학술발표회
    • /
    • pp.3-4
    • /
    • 2004
  • Results will be presented from two field studies that evaluated the in-situ treatment of chlorinated aliphatic hydrocarbons (CAHs) using aerobic cometabolism. In the first study, a cometabolic air sparging (CAS) demonstration was conducted at McClellan Air Force Base (AFB), California, to treat chlorinated aliphatic hydrocarbons (CAHs) in groundwater using propane as the cometabolic substrate. A propane-biostimulated zone was sparged with a propane/air mixture and a control zone was sparged with air alone. Propane-utilizers were effectively stimulated in the saturated zone with repeated intermediate sparging of propane and air. Propane delivery, however, was not uniform, with propane mainly observed in down-gradient observation wells. Trichloroethene (TCE), cis-1, 2-dichloroethene (c-DCE), and dissolved oxygen (DO) concentration levels decreased in proportion with propane usage, with c-DCE decreasing more rapidly than TCE. The more rapid removal of c-DCE indicated biotransformation and not just physical removal by stripping. Propane utilization rates and rates of CAH removal slowed after three to four months of repeated propane additions, which coincided with tile depletion of nitrogen (as nitrate). Ammonia was then added to the propane/air mixture as a nitrogen source. After a six-month period between propane additions, rapid propane-utilization was observed. Nitrate was present due to groundwater flow into the treatment zone and/or by the oxidation of tile previously injected ammonia. In the propane-stimulated zone, c-DCE concentrations decreased below tile detection limit (1 $\mu$g/L), and TCE concentrations ranged from less than 5 $\mu$g/L to 30 $\mu$g/L, representing removals of 90 to 97%. In the air sparged control zone, TCE was removed at only two monitoring locations nearest the sparge-well, to concentrations of 15 $\mu$g/L and 60 $\mu$g/L. The responses indicate that stripping as well as biological treatment were responsible for the removal of contaminants in the biostimulated zone, with biostimulation enhancing removals to lower contaminant levels. As part of that study bacterial population shifts that occurred in the groundwater during CAS and air sparging control were evaluated by length heterogeneity polymerase chain reaction (LH-PCR) fragment analysis. The results showed that an organism(5) that had a fragment size of 385 base pairs (385 bp) was positively correlated with propane removal rates. The 385 bp fragment consisted of up to 83% of the total fragments in the analysis when propane removal rates peaked. A 16S rRNA clone library made from the bacteria sampled in propane sparged groundwater included clones of a TM7 division bacterium that had a 385bp LH-PCR fragment; no other bacterial species with this fragment size were detected. Both propane removal rates and the 385bp LH-PCR fragment decreased as nitrate levels in the groundwater decreased. In the second study the potential for bioaugmentation of a butane culture was evaluated in a series of field tests conducted at the Moffett Field Air Station in California. A butane-utilizing mixed culture that was effective in transforming 1, 1-dichloroethene (1, 1-DCE), 1, 1, 1-trichloroethane (1, 1, 1-TCA), and 1, 1-dichloroethane (1, 1-DCA) was added to the saturated zone at the test site. This mixture of contaminants was evaluated since they are often present as together as the result of 1, 1, 1-TCA contamination and the abiotic and biotic transformation of 1, 1, 1-TCA to 1, 1-DCE and 1, 1-DCA. Model simulations were performed prior to the initiation of the field study. The simulations were performed with a transport code that included processes for in-situ cometabolism, including microbial growth and decay, substrate and oxygen utilization, and the cometabolism of dual contaminants (1, 1-DCE and 1, 1, 1-TCA). Based on the results of detailed kinetic studies with the culture, cometabolic transformation kinetics were incorporated that butane mixed-inhibition on 1, 1-DCE and 1, 1, 1-TCA transformation, and competitive inhibition of 1, 1-DCE and 1, 1, 1-TCA on butane utilization. A transformation capacity term was also included in the model formation that results in cell loss due to contaminant transformation. Parameters for the model simulations were determined independently in kinetic studies with the butane-utilizing culture and through batch microcosm tests with groundwater and aquifer solids from the field test zone with the butane-utilizing culture added. In microcosm tests, the model simulated well the repetitive utilization of butane and cometabolism of 1.1, 1-TCA and 1, 1-DCE, as well as the transformation of 1, 1-DCE as it was repeatedly transformed at increased aqueous concentrations. Model simulations were then performed under the transport conditions of the field test to explore the effects of the bioaugmentation dose and the response of the system to tile biostimulation with alternating pulses of dissolved butane and oxygen in the presence of 1, 1-DCE (50 $\mu$g/L) and 1, 1, 1-TCA (250 $\mu$g/L). A uniform aquifer bioaugmentation dose of 0.5 mg/L of cells resulted in complete utilization of the butane 2-meters downgradient of the injection well within 200-hrs of bioaugmentation and butane addition. 1, 1-DCE was much more rapidly transformed than 1, 1, 1-TCA, and efficient 1, 1, 1-TCA removal occurred only after 1, 1-DCE and butane were decreased in concentration. The simulations demonstrated the strong inhibition of both 1, 1-DCE and butane on 1, 1, 1-TCA transformation, and the more rapid 1, 1-DCE transformation kinetics. Results of tile field demonstration indicated that bioaugmentation was successfully implemented; however it was difficult to maintain effective treatment for long periods of time (50 days or more). The demonstration showed that the bioaugmented experimental leg effectively transformed 1, 1-DCE and 1, 1-DCA, and was somewhat effective in transforming 1, 1, 1-TCA. The indigenous experimental leg treated in the same way as the bioaugmented leg was much less effective in treating the contaminant mixture. The best operating performance was achieved in the bioaugmented leg with about over 90%, 80%, 60 % removal for 1, 1-DCE, 1, 1-DCA, and 1, 1, 1-TCA, respectively. Molecular methods were used to track and enumerate the bioaugmented culture in the test zone. Real Time PCR analysis was used to on enumerate the bioaugmented culture. The results show higher numbers of the bioaugmented microorganisms were present in the treatment zone groundwater when the contaminants were being effective transformed. A decrease in these numbers was associated with a reduction in treatment performance. The results of the field tests indicated that although bioaugmentation can be successfully implemented, competition for the growth substrate (butane) by the indigenous microorganisms likely lead to the decrease in long-term performance.

  • PDF

불균형 데이터 집합의 분류를 위한 하이브리드 SVM 모델 (A Hybrid SVM Classifier for Imbalanced Data Sets)

  • 이재식;권종구
    • 지능정보연구
    • /
    • 제19권2호
    • /
    • pp.125-140
    • /
    • 2013
  • 어떤 클래스에 속한 레코드의 개수가 다른 클래스들에 속한 레코드의 개수보다 매우 많은 경우에, 이 데이터 집합을 '불균형 데이터 집합'이라고 한다. 데이터 분류에 사용되는 많은 기법들은 이러한 불균형 데이터에 대해서 저조한 성능을 보인다. 어떤 기법의 성능을 평가할 때에 적중률뿐만 아니라, 민감도와 특이도도 함께 측정하여야 한다. 고객의 이탈을 예측하는 문제에서 '유지' 레코드가 다수 클래스를 차지하고, '이탈' 레코드는 소수 클래스를 차지한다. 민감도는 실제로 '유지'인 레코드를 '유지'로 예측하는 비율이고, 특이도는 실제로 '이탈'인 레코드를 '이탈'로 예측하는 비율이다. 많은 데이터 마이닝 기법들이 불균형 데이터에 대해서 저조한 성능을 보이는 것은 바로 소수 클래스의 적중률인 특이도가 낮기 때문이다. 불균형 데이터 집합에 대처하는 과거 연구 중에는 소수 클래스를 Oversampling하여 균형 데이터 집합을 생성한 후에 데이터 마이닝 기법을 적용한 연구들이 있다. 이렇게 균형 데이터 집합을 생성하여 예측을 수행하면, 특이도는 다소 향상시킬 수 있으나 그 대신 민감도가 하락하게 된다. 본 연구에서는 민감도는 유지하면서 특이도를 향상시키는 모델을 개발하였다. 개발된 모델은 Support Vector Machine (SVM), 인공신경망(ANN) 그리고 의사결정나무 기법 등으로 구성된 하이브리드 모델로서, Hybrid SVM Model이라고 명명하였다. 구축과정 및 예측과정은 다음과 같다. 원래의 불균형 데이터 집합으로 SVM_I Model과 ANN_I Model을 구축한다. 불균형 데이터 집합으로부터 Oversampling을 하여 균형 데이터 집합을 생성하고, 이것으로 SVM_B Model을 구축한다. SVM_I Model은 민감도에서 우수하고, SVM_B Model은 특이도에서 우수하다. 입력 레코드에 대해서 SVM_I와 SVM_B가 동일한 예측치를 도출하면 그것을 최종 해로 결정한다. SVM_I와 SVM_B가 상이한 예측치를 도출한 레코드에 대해서는 ANN과 의사결정나무의 도움으로 판별 과정을 거쳐서 최종 해를 결정한다. 상이한 예측치를 도출한 레코드에 대해서는, ANN_I의 출력값을 입력속성으로, 실제 이탈 여부를 목표 속성으로 설정하여 의사결정나무 모델을 구축한다. 그 결과 다음과 같은 2개의 판별규칙을 얻었다. 'IF ANN_I output value < 0.285, THEN Final Solution = Retention' 그리고 'IF ANN_I output value ${\geq}0.285$, THEN Final Solution = Churn'이다. 제시되어 있는 규칙의 Threshold 값인 0.285는 본 연구에서 사용한 데이터에 최적화되어 도출된 값이다. 본 연구에서 제시하는 것은 Hybrid SVM Model의 구조이지 특정한 Threshold 값이 아니기 때문에 이 Threshold 값은 대상 데이터에 따라서 얼마든지 변할 수 있다. Hybrid SVM Model의 성능을 UCI Machine Learning Repository에서 제공하는 Churn 데이터 집합을 사용하여 평가하였다. Hybrid SVM Model의 적중률은 91.08%로서 SVM_I Model이나 SVM_B Model의 적중률보다 높았다. Hybrid SVM Model의 민감도는 95.02%이었고, 특이도는 69.24%이었다. SVM_I Model의 민감도는 94.65%이었고, SVM_B Model의 특이도는 67.00%이었다. 그러므로 본 연구에서 개발한 Hybrid SVM Model이 SVM_I Model의 민감도 수준은 유지하면서 SVM_B Model의 특이도보다는 향상된 성능을 보였다.

러프집합분석을 이용한 매매시점 결정 (Rough Set Analysis for Stock Market Timing)

  • 허진영;김경재;한인구
    • 지능정보연구
    • /
    • 제16권3호
    • /
    • pp.77-97
    • /
    • 2010
  • 매매시점결정은 금융시장에서 초과수익을 얻기 위해 사용되는 투자전략이다. 일반적으로, 매매시점 결정은 거래를 통한 초과수익을 얻기 위해 언제 매매할 것인지를 결정하는 것을 의미한다. 몇몇 연구자들은 러프집합분석이 매매시점결정에 적합한 도구라고 주장하였는데, 그 이유는 이 분석방법이 통제함수를 이용하여 시장의 패턴이 불확실할 때에는 거래를 위한 신호를 생성하지 않는다는 점 때문이었다. 러프집합은 분석을 위해 범주형 데이터만을 이용하므로, 분석에 사용되는 데이터는 연속형의 수치값을 이산화하여야 한다. 이산화란 연속형 수치값의 범주화 구간을 결정하기 위한 적절한 "경계값"을 찾는 것이다. 각각의 구간 내에서의 모든 값은 같은 값으로 변환된다. 일반적으로, 러프집합 분석에서의 데이터 이산화 방법은 등분위 이산화, 전문가 지식에 의한 이산화, 최소 엔트로피 기준 이산화, Na$\ddot{i}$ve and Boolean reasoning 이산화 등의 네 가지로 구분된다. 등분위 이산화는 구간의 수를 고정하고 각 변수의 히스토그램을 확인한 후, 각각의 구간에 같은 숫자의 표본이 배정되도록 경계값을 결정한다. 전문가 지식에 의한 이산화는 전문가와의 인터뷰 또는 선행연구 조사를 통해 얻어진 해당 분야 전문가의 지식에 따라 경계값을 정한다. 최소 엔트로피 기준 이산화는 각 범주의 엔트로피 측정값이 최적화 되도록 각 변수의 값을 재귀분할 하는 방식으로 알고리즘을 진행한다. Na$\ddot{i}$ve and Boolean reasoning 이산화는 Na$\ddot{i}$ve scaling 후에 그로 인해 분할된 범주값을 Boolean reasoning 방법으로 종속변수 값에 대해 최적화된 이산화 경계값을 구하는 방법이다. 비록 러프집합분석이 매매시점결정에 유망할 것으로 판단되지만, 러프집합분석을 이용한 거래를 통한 성과에 미치는 여러 이산화 방법의 효과에 대한 연구는 거의 이루어지지 않았다. 본 연구에서는 러프집합분석을 이용한 주식시장 매매시점결정 모형을 구성함에 있어서 다양한 이산화 방법론을 비교할 것이다. 연구에 사용된 데이터는 1996년 5월부터 1998년 10월까지의 KOSPI 200데이터이다. KOSPI 200은 한국 주식시장에서 최초의 파생상품인 KOSPI 200 선물의 기저 지수이다. KOSPI 200은 제조업, 건설업, 통신업, 전기와 가스업, 유통과 서비스업, 금융업 등에서 유동성과 해당 산업 내의 위상 등을 기준으로 선택된 200개 주식으로 구성된 시장가치 가중지수이다. 표본의 총 개수는 660거래일이다. 또한, 본 연구에서는 유명한 기술적 지표를 독립변수로 사용한다. 실험 결과, 학습용 표본에서는 Na$\ddot{i}$ve and Boolean reasoning 이산화 방법이 가장 수익성이 높았으나, 검증용 표본에서는 전문가 지식에 의한 이산화가 가장 수익성이 높은 방법이었다. 또한, 전문가 지식에 의한 이산화가 학습용과 검증용 데이터 모두에서 안정적인 성과를 나타내었다. 본 연구에서는 러프집합분석과 의사결정 나무분석의 비교도 수행하였으며, 의사결정나무분석은 C4.5를 이용하였다. 실험결과, 전문가 지식에 의한 이산화를 이용한 러프집합분석이 C4.5보다 수익성이 높은 매매규칙을 생성하는 것으로 나타났다.