• 제목/요약/키워드: Optimal value function

검색결과 532건 처리시간 0.042초

운영연구(OR)의 도서관응용 -그 몇가지 잠재적응용분야에 대하여- (The Application of Operations Research to Librarianship : Some Research Directions)

  • 최성진
    • 한국문헌정보학회지
    • /
    • 제4권
    • /
    • pp.43-71
    • /
    • 1975
  • Operations research has developed rapidly since its origins in World War II. Practitioners of O. R. have contributed to almost every aspect of government and business. More recently, a number of operations researchers have turned their attention to library and information systems, and the author believes that significant research has resulted. It is the purpose of this essay to introduce the library audience to some of these accomplishments, to present some of the author's hypotheses on the subject of library management to which he belives O. R. has great potential, and to suggest some future research directions. Some problem areas in librianship where O. R. may play a part have been discussed and are summarized below. (1) Library location. It is usually necessary to make balance between accessibility and cost In location problems. Many mathematical methods are available for identifying the optimal locations once the balance between these two criteria has been decided. The major difficulties lie in relating cost to size and in taking future change into account when discriminating possible solutions. (2) Planning new facilities. Standard approaches to using mathematical models for simple investment decisions are well established. If the problem is one of choosing the most economical way of achieving a certain objective, one may compare th althenatives by using one of the discounted cash flow techniques. In other situations it may be necessary to use of cost-benefit approach. (3) Allocating library resources. In order to allocate the resources to best advantage the librarian needs to know how the effectiveness of the services he offers depends on the way he puts his resources. The O. R. approach to the problems is to construct a model representing effectiveness as a mathematical function of levels of different inputs(e.g., numbers of people in different jobs, acquisitions of different types, physical resources). (4) Long term planning. Resource allocation problems are generally concerned with up to one and a half years ahead. The longer term certainly offers both greater freedom of action and greater uncertainty. Thus it is difficult to generalize about long term planning problems. In other fields, however, O. R. has made a significant contribution to long range planning and it is likely to have one to make in librarianship as well. (5) Public relations. It is generally accepted that actual and potential users are too ignorant both of the range of library services provided and of how to make use of them. How should services be brought to the attention of potential users? The answer seems to lie in obtaining empirical evidence by controlled experiments in which a group of libraries participated. (6) Acquisition policy. In comparing alternative policies for acquisition of materials one needs to know the implications of each service which depends on the stock. Second is the relative importance to be ascribed to each service for each class of user. By reducing the level of the first, formal models will allow the librarian to concentrate his attention upon the value judgements which will be necessary for the second. (7) Loan policy. The approach to choosing between loan policies is much the same as the previous approach. (8) Manpower planning. For large library systems one should consider constructing models which will permit the skills necessary in the future with predictions of the skills that will be available, so as to allow informed decisions. (9) Management information system for libraries. A great deal of data can be available in libraries as a by-product of all recording activities. It is particularly tempting when procedures are computerized to make summary statistics available as a management information system. The values of information to particular decisions that may have to be taken future is best assessed in terms of a model of the relevant problem. (10) Management gaming. One of the most common uses of a management game is as a means of developing staff's to take decisions. The value of such exercises depends upon the validity of the computerized model. If the model were sufficiently simple to take the form of a mathematical equation, decision-makers would probably able to learn adequately from a graph. More complex situations require simulation models. (11) Diagnostics tools. Libraries are sufficiently complex systems that it would be useful to have available simple means of telling whether performance could be regarded as satisfactory which, if it could not, would also provide pointers to what was wrong. (12) Data banks. It would appear to be worth considering establishing a bank for certain types of data. It certain items on questionnaires were to take a standard form, a greater pool of data would de available for various analysis. (13) Effectiveness measures. The meaning of a library performance measure is not readily interpreted. Each measure must itself be assessed in relation to the corresponding measures for earlier periods of time and a standard measure that may be a corresponding measure in another library, the 'norm', the 'best practice', or user expectations.

  • PDF

심실중격결손을 동반하지 않은 대혈관전위증 환자에서 동맥 전환술의 결과 및 위험인자 분석에 관한 연구 (Risk Factors Analysis and Results of the Arterial Switch Operation for Transposition of the Great Arteries with Intact Ventricular Septum)

  • 김용진;오삼세;이정렬;노준량;서경필
    • Journal of Chest Surgery
    • /
    • 제32권2호
    • /
    • pp.108-118
    • /
    • 1999
  • 배경: 동맥전환술의 위험인자와 장기 성적을 알아보고자 후향적 연구를 시행하였다. 대상 및 방법: 1988년 1월부터 1996년 12월까지 심실중격이 온전한 대혈관전위증으로 인해 동맥전환술을 시행 받은 58명의 환자를 대상으로 동맥전환술에 따른 조기 및 만기성적에 대하여 후향적 평가를 시행하였다. 술전 처치로 36례(62.1%)에서 풍선심방절개술을 시행하였으며, 32례(51.7%)에서 PGE1을 사용하였고, 좌우심실의 압력비가 평균 0.53$\pm$0.11이었던 6례(10.3%)의 환아에서는 먼저 폐동맥밴딩을 시행하였다. 결과: 수술당시의 평균연령은 24$\pm$26일(범위 1-137일)이었고 수술당시 평균체중은 3.5$\pm$0.8 kg(범위 1.8~6.1 kg)였다. 전체 조기사망율은 24.1%(14/58)였으며, 최근 3년간의 조기사망율은 8.3%(2/24)였다. 사망과 관련된 위험인자 분석에서는 수술 시행 년도가 유일한 위험인자로 나타났다(p-value < 0.01). 조기 사망한 14례 중 8례는 급성심근부전으로 사망하였으며 주된 원인은 관상동맥부전이었다. 44명의 술후 생존자들을 대상으로 2개월에서 8년까지 평균 36$\pm$27개월 동안 추적관찰을 시행하였으며, 대혈관과 관상동맥의 문합부위, 심실기능, 반월판막의 폐쇄부전, 심박동 이상 등에 중점을 두고 연속적인 비관혈적 검사 및 술후 5개월과 32개월 사이에 모두 21례의 심도자술을 시행하였다. 만기 사망한 경우는 5례(11.4%)였으며 사망원인은 관상동맥의 만기 협착 1례, 흡인 2례, 만성 종격동염 1례, 진행성 대동맥판막폐쇄부전과 심부전 1례 등이었다. 혈류역학적으로 가장 흔한 이상은 폐동맥상부의 협착이었고, 폐동맥협착과 대동맥협착을 보였던 몇몇 경우에 있어서는 점차 협착정도가 진행하는 경우도 관찰되었으나 이로 인한 재수술은 없었다. 9례에서 대동맥판막폐쇄부전 소견을보였으며 7례에서는 그 정도가 가벼웠으나 2례에서는 중정도의 폐쇄부전을 보였고 다소 진행하는 경우도 있었다. 수술전후로 심근허혈의 증거가 없었던 2례에서 관상동맥의 폐쇄가 확인되었다. 나머지 생존자들은 동성박동과 정상적인 좌심기능을 유지한 채 양호한 경과를 보이고 있으며 생명표법에 근거한 8년 생존률은 68.8%였다. 결론: 심실중격이 온전한 대혈관전위증에서 해부학적 교정술은 우선적인 수술방법으로 여겨지나 추후 지속적인 추적관찰이 필요할 것으로 사료된다.

  • PDF

자율적 피드백 기반 웹 서비스 선정을 위한 품질 브로커 아키텍처의 설계 및 구현 (Design and Implementation of Quality Broker Architecture to Web Service Selection based on Autonomic Feedback)

  • 서영준;송영재
    • 정보처리학회논문지D
    • /
    • 제15D권2호
    • /
    • pp.223-234
    • /
    • 2008
  • 최근 웹 서비스 분야는 기업내외의 효율적인 통합 환경을 제공해 주면서 웹 서비스의 도입을 원하는 업체가 증가하고 있다. 또한 웹 서비스가 발전하면서 새로운 비즈니스 모델이 등장하고, 웹 서비스로 인해 국내 기업 환경 및 e-비즈니스 환경이 변화하고 있다. 유사한 기능을 제공하는 웹 서비스가 증가함에 따라 사용자의 요구에 가장 적합한 서비스를 찾는 방법이 더욱 중요시 되고 있다. 많은 유사한 웹 서비스들 가운데 하나를 선택해야 할 때, 서비스 사용자는 일반적으로 웹 서비스의 품질 정보를 필요로 하게 된다. 그러나 웹 서비스의 광고 QoS 정보는 항상 신뢰성이 있지는 않다는 문제점이 있다. 서비스 제공자가 더 많은 사용자들을 끌어들이기 위해 부정확한 QoS 정보를 게시하거나, 게시된 QoS 정보가 오래 되었을 수도 있다. 따라서 현재의 사용자들이 웹 서비스로부터 받는 QoS를 평가하고 이러한 평가를 공유하는 중개자의 존재는 새로운 사용자들에게 가치 있는 정보를 제공할 수 있다. 본 논문에서는 서비스 사용자의 입장에서 사용자가 원하는 최적의 품질을 제공하는 서비스를 찾도록 도와주는 에이전트 기반 품질 브로커 아키텍처를 제안한다. 동적으로 웹 서비스를 선정하는 아키텍처를 사용자에 제공함으로서 사용자의 품질 요구 변경 문제를 해결할 수 있다. 즉 사용자는 품질 브로커 서버에 연결된 UDDI 브라우저를 통해 최적의 품질 척도를 제공하는 서비스를 검색할 수 있다. 또한 각 서비스의 품질척도 값 결정에는 사용자 개입이 최대한 배제된다. 기존 선정 아키텍처에서는 사용자의 주관적 서비스 등급 선정으로 객관적 평가가 어려웠으나, 에이전트가 사용자 위치에서 모니터링 한 바인딩 정보를 통한 품질 척도 값 결정으로 객관성을 확보할 수 있다. 즉, 제공자들이 제공하지 못하는 서비스의 QoS 정보를 사용자측 에이전트들의 피드백으로 인한 QoS 정보 공유로 해결하고자 한다.

소프트웨어 개발 프로젝트 성능의 최적화를 위한 Opportunity Tree 모델 설계 (Opportunity Tree Framework Design For Optimization of Software Development Project Performance)

  • 송기원;이경환
    • 정보처리학회논문지D
    • /
    • 제12D권3호
    • /
    • pp.417-428
    • /
    • 2005
  • 오늘날 IT 조직들은 시장확보와 재정이득 측면에서 비전을 가지고 프로젝트를 수행한다. QCD관점에서 그 수god능력을 향상시켜 나가는 것이 비전을 실현하는 목표이다. 따라서 조직들은 이러한 목표를 달성하기 위해 프로세스 개선을 통해 QCD관점의 목표를 달성하고자 많은 노력을 하고 있는 실정이다. TBM, Ford, GE와 같은 대형 회사들도 컴퓨터에 의한 업무개선 효과보다는 IT를 이용한 비즈니스 프로세스 리엔지니어링을 통해 80퍼센트 이상의 성과를 거두고 있다. 그러나, 목표달성을 위해서는 프로젝트를 수행한 데이터를 수집하고 분석하여 관리해야 하지만 소프트웨어의 비가시성 특성으로 인한 정량적인 측정이 어려운 것이 사실이며 이로 인해 프로세스 변경으로 인한 효과와 효율을 가시적인 확인하기 힘들고 효과적인 프로세스 개선전략을 도출하기 어렵다. 본 논문에서는 조직의 외부적인 효과와 내부적인 효율(품질, 납기일, 공정, 재사용)에 초점을 맞추어 프로젝트 성능을 측정하고 분석한다. 측정된 프로젝트 성능 점수를 기반으로 프로젝트 성능의 최적화를 위한 OT(Opportunity Tree) 모델을 설계하였다. 설계 과정으로서 먼저 프로젝트에서 공통적인 요소(Meta data)를 도출하여 정량적 GQM(Goal-Question-Metric) 설문서에 의해서 분석한다. 정량적 GQM 설문서로부터 얻은 데이터를 가지고, 프로젝트 성능 모델을 설계하고 조직의 영역별 성능 점수를 계산한다. 계산된 영역별 성능 점수와 모든 스테이크 홀더들(조직의 최고 경영자(CEO), 중간 관리자, 개발자, 투자가, 고객)로부터 받아낸 비전 가중치를 통합하여 보정된 값을 구한다. 이를 통해 개선을 위한 경로(Route for Improvement)를 제시하고 최적화된 개선 방법을 제공한다. 기존 소프트웨어 프로세스 개선 방법은 '프로세스 구분'에큰 뛰어난 효과를 보였으나, 프로세스를 프로젝트에 대응시켜서 전략을 수립하고 조직적으로 관리하는 구조적 기능이 미비하였다. 이러한 문제점에 대하여 본 논문에서 제시한 OT 모델은 해결책을 제시해 주고 있다. OT 모델의 효과는 조직의 목표에 맞게 최적화된 개선 방법을 제공하는 것이고, 제공된 방법을 사용하여 수행할 경우 프로젝트를 개선할 때 생기는 리스크를 감소시킬 수 있다는 점이다. 또한, 정성적인 설문서를 통해 모든 스테이크 홀더들에게 중요도를 입력받아 계산되었으므로, 개선 방법에 대한 만족도를 높여 줄 수 있다. OT 활용에 의해서 품질, 납기, 공정, 재사용을 조정하여 시장 확장과 재무성과를 최적화시킬 수 있다.

유효체적 방법과 임상분석을 통한 방사선에 의한 정상 폐조직의 부작용 확률에 관한 연구 (The Study of Normal Tissue Complication Probability(NTCP) for Radiation Pneumonitis by Effective Volume Method)

  • 안승도;최은경;이병용;장혜숙
    • Radiation Oncology Journal
    • /
    • 제15권3호
    • /
    • pp.243-249
    • /
    • 1997
  • 목적 : 방사선에 대한 정상 폐조직의 부작용에 관한 확률은 폐암의 방사선 치료에 있어서 중요한 지표가 됨에도 닥구하호 잘 알려져 있지 안다. 더구나 표적 부위와는 달리 정상 폐조직의 방사선량 분포는 매우 불균일하므로, 대표 선량값을 찾아 내는 것조차 어렵다 본 연구에서는 Dose Volume Histogram(DVH)과 유효체적방법(Effective Volume Method)을 통하여 정상 폐조직의 선량을 정량화하고 정상 폐조직 부작용 확률(Normal Tlssue Complication Probability, NTCP)을 구하여 임상결과와 비교하므로서 이 방법이 치료 결과를 예측할 수 있는 주요 지표로서 가능할 수 있는지에 대하여 살펴 보고자 하였다. 대상 및 방법 : 1993년 8월부터 1994년 12월까지 비세포성 폐암으로 방사선과 복합항암약물요법을 병행하여 치료받은 환자 중에서 36명을 무작위 추출하여, DVH 분석을 통한 정상 폐조직의 NTCP를 구하였다. 36명의 환자는 Mitomycin C, Vlnblastlne, Clsplatln을 사용한 2회의 복합항암 약물요법과 동시에 다분할 방사선추료(120cBy11x, bld)를 6480c0y까지 병행 치료하였다. 각 환자의 치료전 CT scan을 사용하여 우측폐, 좌측폐 그리고 전체폐 각각의 DVH를 구하였다. Kutcher등의 Effective Volume Method로 Nonuniform Histogram을 Uniform Histogram으로 변환시켰고, $TD_{50}$은 Emaml 등의 자료에 의거하여, Lyman 공식을 이용하여 NTCP를 구하였다. 방사선 폐렴의 Grade는 SWOG의 Toxlcity Criteria에 따랐다. 결과 : 대상환자 36명중 6명이 Grade 1, 2명이 Grade II의 방사선 폐렴이 발생하였다. 부작용이 발생한 환자군의 NTCP와 발생하지 않은 환자군의 NTCP는 전체폐를 대상으로 28.4와 23.4, 병소 부위의 폐를 대상으로 66.0과 26.4로 통계적으로 유의할 만한 차이를 보였으나 치료 전후에 시행한 폐기능 검사 소견에서는 두 군 사이에서 통계학적으로 유의한 차이를 찾지 못하였다. 결론 : 부작용이 있는 관과 부작용이 없는 군의 NTCP는 통계적인 유의한 차이가 있었으며 NTCP와 임상적인 부작용 확률은 정량적으로 일치하였다. 그러나 NTCP는 순수하게 방사선의 효과만을 고려하고 있으나 본 연구에서는 항암약물요법을 병용하였다는것과 다분할(Hyperfractionaltion) 방사선 치료에 의한 방사선 생물학적 변화에 대한 고려가 필요할 것으로 생각된다. 본연구결과 유효체적 방법을 이용한 NTCP는 향후 입체조형 치료에서의 선량증가(Dose escalation) 가능성에 대한 부작용 예측 지표로 활용할 수 있을 것으로 생각된다.

  • PDF

항온과 변온조건에서 복숭아혹진딧물의 발육비교 및 온도 발육모형 (Comparison of Development times of Myzus persicae (Hemiptera:Aphididae) between the Constant and Variable Temperatures and its Temperature-dependent Development Models)

  • 김도익;최덕수;고숙주;강범용;박창규;김선곤;박종대;김상수
    • 한국응용곤충학회지
    • /
    • 제51권4호
    • /
    • pp.431-438
    • /
    • 2012
  • 복숭아혹진딧물(Myzus persicae)의 온도에 따른 발육시험을 실내 15, 18, 21, 24, 27, $30^{\circ}C$의 6개 항온, 광주기 14L:10D, 상대습도 50~60% 조건과 고추 비닐하우스에서 3월 23일부터 8월 20일까지 6회 접종하여 수행하였다. 실내사망률은 저온에서는 1~2령충의 사망률이 높았고 온도가 증가할수록 3~4령충의 사망률이 높았으며 고온에서는 66.7%까지 높아졌다. 실내와 포장조건 모두 온도가 증가할수록 발육기간이 짧아지는 경향을 보였으며 포장조건 8월 접종에서 6.03일로 가장 짧았다. 온도와 발육률과의 관계를 보기 위해 선형 및 3개의 비선형 모형(Briere 1, Lactin 2, Logan 6)을 이용하여 분석한 결과, 선형모형을 이용하여 전체약충의 발육영점온도는 $3.0^{\circ}C$였으며 발육유효적산온도는 111.1DD 였다. 3가지 비선형 모형중 Logan-6 모형이 전약충, 후약충 전체약충 단계에서 AIC와 BIC 값이 가장 적어 온도와 발육율과의 관계를 잘 설명하였으며, 발육단계별 발육완료분포는 3-parameter Weibull 함수를 사용하였으며 전약충, 후약충, 전체약충에서 $r^2$ 값이 0.95~0.97로 높은 값을 보여 양호한 모형 적합성을 보였으며 정식시기별 성충 발생 예측치와 포장 조사치가 일치하여 방제적기 추정에 유용하게 사용할 수 있을 것이다.

실내 항온과 온실 변온조건에서 목화진딧물의 온도 발육비교 (Comparison of Temperature-dependent Development Model of Aphis gossypii (Hemiptera: Aphididae) under Constant Temperature and Fluctuating Temperature)

  • 김도익;고숙주;최덕수;강범용;박창규;김선곤;박종대;김상수
    • 한국응용곤충학회지
    • /
    • 제51권4호
    • /
    • pp.421-429
    • /
    • 2012
  • 목화진딧물 (Aphis gossypii)의 온도에 따른 발육시험을 실내 15, 18, 21, 24, 27, $30^{\circ}C$의 6개 항온, 광주기 14L:10D, 상대습도 50~60% 조건과 오이 비닐하우스에서 3월 23일부터 8월 20일까지 6회 접종하여 수행하였다. 실내사망률은 저온에서는 2~3령충의 사망률이 높았고 온도가 증가할수록 3~4령충의 사망률이 높았으며 고온에서 전체 사망률이 높았다. 전체 약충의 발육기간은 실내에서 $15^{\circ}C$에서 12.2일로 가장 짧았으며 변온의 $28.5^{\circ}C$에서 4.09일로 가장 짧았다. 온도와 발육율과의 관계를 보기위해 선형 및 3개의 비선형 모형(Briere 1, Lactin 2, Logan 6)을 이용하여 분석한 결과, 선형모형을 이용하여 전체약충의 발육영점온도는 $6.8^{\circ}C$였으며 발육유효적산온도는 각각 111.1DD였다. 3가지 비선형 모형중 Logan-6 모형이 전약충, 후약충 전체약충 단계에서 AIC와 BIC 값이 가장 적어 온도와 발육율과의 관계를 잘 설명하였으며, 발육단계별 발육완료분포는 3-parameter Weibull 함수를 사용하였으며 전약충, 후약충, 전체약충에서 $r^2$값이 0.88~0.91로 높은 값을 보여 양호한 모형 적합성을 보였으며 정식시기별 성충 발생 예측치와 포장 조사치가 일치하여 방제적기 추정에 유용하게 사용할 수 있을 것이다.

지자체 사이버 공간 안전을 위한 금융사기 탐지 텍스트 마이닝 방법 (Financial Fraud Detection using Text Mining Analysis against Municipal Cybercriminality)

  • 최석재;이중원;권오병
    • 지능정보연구
    • /
    • 제23권3호
    • /
    • pp.119-138
    • /
    • 2017
  • 최근 SNS는 개인의 의사소통뿐 아니라 마케팅의 중요한 채널로도 자리매김하고 있다. 그러나 사이버 범죄 역시 정보와 통신 기술의 발달에 따라 진화하여 불법 광고가 SNS에 다량으로 배포되고 있다. 그 결과 개인정보를 빼앗기거나 금전적인 손해가 빈번하게 일어난다. 본 연구에서는 SNS로 전달되는 홍보글인 비정형 데이터를 분석하여 어떤 글이 금융사기(예: 불법 대부업 및 불법 방문판매)와 관련된 글인지를 분석하는 방법론을 제안하였다. 불법 홍보글 학습 데이터를 만드는 과정과, 데이터의 특성을 고려하여 입력 데이터를 구성하는 방안, 그리고 판별 알고리즘의 선택과 추출할 정보 대상의 선정 등이 프레임워크의 주요 구성 요소이다. 본 연구의 방법은 실제로 모 지방자치단체의 금융사기 방지 프로그램의 파일럿 테스트에 활용되었으며, 실제 데이터를 가지고 분석한 결과 금융사기 글을 판정하는 정확도가 사람들에 의하여 판정하는 것이나 키워드 추출법(Term Frequency), MLE 등에 비하여 월등함을 검증하였다.

경제력집중(經濟力集中) : 기본시각(基本視角)과 정책방향(政策方向) (The Concentration of Economic Power in Korea)

  • 이규억
    • KDI Journal of Economic Policy
    • /
    • 제12권1호
    • /
    • pp.31-68
    • /
    • 1990
  • 경제력집중(經濟力集中)은 경제적(經濟的) 자원(資源)과 수단(手段)의 상당부분이 소수의 경독주체(經瀆主體)에 집중되어 이들이 자원배분(資源配分)의 흐름에 큰 영향을 미칠 수 있는 상태를 말한다. 그러므로 경제력집중(經濟力集中)은 본질상 자유시장기구(自由市場機構)의 생리와는 부합하지 않지만 자본주의(資本主義)의 역사로 볼 때 그것이 바로 자유경쟁(自由競爭)의 소산이라는 측면도 있다는 점이 문제가 된다. 구미(歐美)와 일본(日本) 등에 있어서 자본주의체제(資本主義體制)의 진화궤적(進化軌跡)은 이 문제가 어떻게 전개되는가에 따라 결정되어 왔다. 우리나라에서의 경제역집중(經濟力集中)은 다수의 독(獨) 과점적(寡占的) 대기업(大企業)들이 소유관계(所有關係)로 결합되어 있는 기업집단(企業集團) 즉 소위 재벌(財閥)의 문제로 집약될 수 있다. 우리나라의 기업집단(企業集團)의 성장은 시장기구(市場機構)의 작동결과에 기인한 면도 있지만 고도경제성장기(高度經濟成長期)의 정부정책(政府政策)에 의하여 촉진된 것도 부인할 수 없다. 기업집단(企業集團)에 의한 경제력집중(經濟力集中)은 과거 우리나라의 정치(政治) 경제(經濟) 사회(社會)가 거쳐온 진화과정(進化過程)을 집약적으로 나타내는 것 이다. 그러므로 우리나라에서 민주주의(民主主義)와 자본주의(資本主義)의 이념(理念)과 질서(秩序)에 대한 국민적(國民的) 합의(合意)를 모색하려는 현시점에서 경제력집중(經濟力集中)을 객관적으로 인식하여 효율(效率)과 형평(衡平)을 조화하는 적절한 대응방향을 모색 하는 것은 매우 긴요한 과제이다.

  • PDF

클라우드 환경에서 MongoDB 기반의 비정형 로그 처리 시스템 설계 및 구현 (Design and Implementation of MongoDB-based Unstructured Log Processing System over Cloud Computing Environment)

  • 김명진;한승호;최운;이한구
    • 인터넷정보학회논문지
    • /
    • 제14권6호
    • /
    • pp.71-84
    • /
    • 2013
  • 컴퓨터 시스템 운용 간에 발생하는 많은 정보들이 기록되는 로그데이터는 컴퓨터 시스템 운용 점검, 프로세스의 최적화, 사용자 최적화 맞춤형 제공 등 다방면으로 활용되고 있다. 본 논문에서는 다양한 종류의 로그데이터들 중에서 은행에서 발생하는 대용량의 로그데이터를 처리하기 위한 클라우드 환경 하에서의 MongoDB 기반 비정형 로그 처리시스템을 제안한다. 은행업무간 발생하는 대부분의 로그데이터는 고객의 업무처리 프로세스 간에 발생하며, 고객 업무 프로세스 처리에 따른 로그데이터를 수집, 저장, 분류, 분석하기 위해서는 별도로 로그데이터를 처리하는 시스템을 구축해야만 한다. 하지만 기존 컴퓨팅환경 하에서는 폭발적으로 증가하는 대용량 비정형 로그데이터 처리를 위한 유연한 스토리지 확장성 기능, 저장된 비정형 로그데이터를 분류, 분석 처리할 수 있는 기능을 구현하기가 매우 어렵다. 이에 따라 본 논문에서는 클라우드 컴퓨팅 기술을 도입하여 기존 컴퓨팅 인프라 환경의 분석 도구 및 관리체계에서 처리하기 어려웠던 비정형 로그데이터를 처리하기 위한 클라우드 환경기반의 로그데이터 처리시스템을 제안하고 구현하였다. 제안한 본 시스템은 IaaS(Infrastructure as a Service) 클라우드 환경을 도입하여 컴퓨팅 자원의 유연한 확장성을 제공하며 실제로, 로그데이터가 장기간 축적되거나 급격하게 증가하는 상황에서 스토리지, 메모리 등의 자원을 신속성 있고 유연하게 확장을 할 수 있는 기능을 포함한다. 또한, 축적된 비정형 로그데이터의 실시간 분석이 요구되어질 때 기존의 분석도구의 처리한계를 극복하기 위해 본 시스템은 하둡 (Hadoop) 기반의 분석모듈을 도입함으로써 대용량의 로그데이터를 빠르고 신뢰성 있게 병렬 분산 처리할 수 있는 기능을 제공한다. 게다가, HDFS(Hadoop Distributed File System)을 도입함으로써 축적된 로그데이터를 블록단위로 복제본을 생성하여 저장관리하기 때문에 본 시스템은 시스템 장애와 같은 상황에서 시스템이 멈추지 않고 작동할 수 있는 자동복구 기능을 제공한다. 마지막으로, 본 시스템은 NoSQL 기반의 MongoDB를 이용하여 분산 데이터베이스를 구축함으로써 효율적으로 비정형로그데이터를 처리하는 기능을 제공한다. MySQL과 같은 관계형 데이터베이스는 복잡한 스키마 구조를 가지고 있기 때문에 비정형 로그데이터를 처리하기에 적합하지 않은 구조를 가지고 있다. 또한, 관계형 데이터베이스의 엄격한 스키마 구조는 장기간 데이터가 축적되거나, 데이터가 급격하게 증가할 때 저장된 데이터를 분할하여 여러 노드에 분산시키는 노드 확장이 어렵다는 문제점을 가지고 있다. NoSQL은 관계형 데이터베이스에서 제공하는 복잡한 연산을 지원하지는 않지만 데이터가 빠르게 증가할 때 노드 분산을 통한 데이터베이스 확장이 매우 용이하며 비정형 데이터를 처리하는데 매우 적합한 구조를 가지고 있는 비관계형 데이터베이스이다. NoSQL의 데이터 모델은 주로 키-값(Key-Value), 컬럼지향(Column-oriented), 문서지향(Document-Oriented)형태로 구분되며, 제안한 시스템은 스키마 구조가 자유로운 문서지향(Document-Oriented) 데이터 모델의 대표 격인 MongoDB를 도입하였다. 본 시스템에 MongoDB를 도입한 이유는 유연한 스키마 구조에 따른 비정형 로그데이터 처리의 용이성뿐만 아니라, 급격한 데이터 증가에 따른 유연한 노드 확장, 스토리지 확장을 자동적으로 수행하는 오토샤딩 (AutoSharding) 기능을 제공하기 때문이다. 본 논문에서 제안하는 시스템은 크게 로그 수집기 모듈, 로그 그래프생성 모듈, MongoDB 모듈, Hadoop기반 분석 모듈, MySQL 모듈로 구성되어져 있다. 로그 수집기 모듈은 각 은행에서 고객의 업무 프로세스 시작부터 종료 시점까지 발생하는 로그데이터가 클라우드 서버로 전송될 때 로그데이터 종류에 따라 데이터를 수집하고 분류하여 MongoDB 모듈과 MySQL 모듈로 분배하는 기능을 수행한다. 로그 그래프생성 모듈은 수집된 로그데이터를 분석시점, 분석종류에 따라 MongoDB 모듈, Hadoop기반 분석 모듈, MySQL 모듈에 의해서 분석되어진 결과를 사용자에게 웹 인터페이스 형태로 제공하는 역할을 한다. 실시간적 로그데이터분석이 필요한 로그데이터는 MySQL 모듈로 저장이 되어 로그 그래프생성 모듈을 통하여 실시간 로그데이터 정보를 제공한다. 실시간 분석이 아닌 단위시간당 누적된 로그데이터의 경우 MongoDB 모듈에 저장이 되고, 다양한 분석사항에 따라 사용자에게 그래프화해서 제공된다. MongoDB 모듈에 누적된 로그데이터는 Hadoop기반 분석모듈을 통해서 병렬 분산 처리 작업이 수행된다. 성능 평가를 위하여 로그데이터 삽입, 쿼리 성능에 대해서 MySQL만을 적용한 로그데이터 처리시스템과 제안한 시스템을 비교 평가하였으며 그 성능의 우수성을 검증하였다. 또한, MongoDB의 청크 크기별 로그데이터 삽입 성능평가를 통해 최적화된 청크 크기를 확인하였다.