• 제목/요약/키워드: Complex task

검색결과 579건 처리시간 0.025초

교통사고 데이터의 마이닝을 위한 연관규칙 학습기법과 서브그룹 발견기법의 비교 (Comparison of Association Rule Learning and Subgroup Discovery for Mining Traffic Accident Data)

  • 김정민;류광렬
    • 지능정보연구
    • /
    • 제21권4호
    • /
    • pp.1-16
    • /
    • 2015
  • 교통사고의 원인을 규명하고 미래의 사고를 방지하기 위한 노력의 일환으로 데이터 마이닝 기법을 이용한 교통 데이터 분석의 연구가 이루어지고 있다. 하지만 기존의 교통 데이터를 이용한 마이닝 연구들은 학습된 결과를 사람이 이해하기 어려워 분석에 많은 노력이 필요하다는 문제가 있었다. 본 논문에서는 많은 속성들로 표현된 교통사고 데이터로부터 유용한 패턴을 발견하기 위해 규칙 학습 기반의 데이터 마이닝 기법인 연관규칙 학습기법과 서브그룹 발견기법을 적용하였다. 연관규칙 학습기법은 비지도 학습 기법의 하나로 데이터 내에서 동시에 많이 등장하는 아이템(item)들을 찾아 규칙의 형태로 가공해 주며, 서브그룹 발견기법은 사용자가 지정한 대상 속성이 결론부에 나타나는 규칙을 학습하는 지도학습 기반 기법으로 일반성과 흥미도가 높은 규칙을 학습한다. 규칙 학습 시 사용자의 의도를 반영하기 위해서는 하나 이상의 관심 속성들을 조합한 합성 속성을 만들어 규칙을 학습할 수 있다. 규칙이 도출되고 나면 후처리 과정을 통해 중복된 규칙을 제거하고 유사한 규칙을 일반화하여 규칙들을 더 단순하고 이해하기 쉬운 형태로 가공한다. 교통사고 데이터를 대상으로 두 기법을 적용한 결과 대상 속성을 지정하지 않고 연관규칙 학습기법을 적용하는 경우 사용자가 쉽게 알기 어려운 속성 사이의 숨겨진 관계를 발견할 수 있었으며, 대상 속성을 지정하여 연관규칙 학습기법과 서브그룹 발견기법을 적용하는 경우 파라미터 조정에 많은 노력을 기울여야 하는 연관규칙 학습기법에 비해 서브그룹 발견기법이 흥미로운 규칙들을 더 쉽게 찾을 수 있음을 확인하였다.

FPS게임 구성요소의 중요도 분석방법에 관한 연구 1 -델파이기법을 이용한 독립요소의 계층설계와 검증을 중심으로- (The Study on the Priority of First Person Shooter game Elements using Delphi Methodology)

  • 배혜진;김석태
    • 디자인학연구
    • /
    • 제20권3호
    • /
    • pp.61-72
    • /
    • 2007
  • 1960년대 MIT에서 제작된 최초의 게임 Space War를 시작으로 짧은 기간 동안 게임산업은 급속도로 성장하고 방대해지면서 최근 발표된 게임들은 총합적 디자인의 결정체라고 봐도 무방하리만큼 콘텐츠를 이루는 구성요소가 무수히 많아졌다. 결국 게임을 개발함에 있어서 고려해야할 요소도 기하급수적으로 증가하여, 예산 및 인력, 시간투입 등에 대한 계획도 매우 복잡해질 수밖에 없다. 그러므로 성공적인 게임개발을 위해서는 게임을 구성하는 요소를 추출하고 각 요소별 중요도를 산출하여, 향후 개발되는 게임을 사전에 평가할 수 있는 방법이 무엇보다 절실하다. 이러한 기획은 진행과정에서 무수한 의사결정을 요구하게 되고, 의사결정 작업은 다수인자에 대한 문제, 요소들을 정량화시키기 어려운 불확실성의 문제, 결과가 지향하는 복잡한 다목적의 문제, 다수의 의사결정간의 혼선, 의사결정과정에 이르는 다단계의 우선순위 결정문제 등으로 인한 많은 어려움이 있다. 본 연구는 이러한 문제들을 총합적으로 해결하며, 불확실한 데이터를 정량화시켜 논리적이고 합리적인 대안을 제시할 수 있도록 계층화의사결정법을 제시하고자 하며, 현재 게임시장을 주도하고 있는 FPS게임을 대상으로 분석을 시도하였다. AHP분석에서 가장 중요한 것은 분석하고자 하는 대상의 요소들을 객관적으로 정확하게 분류하고 이를 계층화시키는 것과 요소간의 쌍대비교를 통한 중요도 추출이다. 본 연구는 이러한 요소추출과 요소간 중요도 산출 및 대안의 선정 2부분으로 구성되며, 그 중에서 본 논문은 델파이기법에 의한 FPS게임의 객관적 요소추출 및 계층화를 중심으로 하고 있다.

  • PDF

PLS 경로모형을 이용한 IT 조직의 BSC 성공요인간의 인과관계 분석 (A PLS Path Modeling Approach on the Cause-and-Effect Relationships among BSC Critical Success Factors for IT Organizations)

  • 이정훈;신택수;임종호
    • Asia pacific journal of information systems
    • /
    • 제17권4호
    • /
    • pp.207-228
    • /
    • 2007
  • Measuring Information Technology(IT) organizations' activities have been limited to mainly measure financial indicators for a long time. However, according to the multifarious functions of Information System, a number of researches have been done for the new trends on measurement methodologies that come with financial measurement as well as new measurement methods. Especially, the researches on IT Balanced Scorecard(BSC), concept from BSC measuring IT activities have been done as well in recent years. BSC provides more advantages than only integration of non-financial measures in a performance measurement system. The core of BSC rests on the cause-and-effect relationships between measures to allow prediction of value chain performance measures to allow prediction of value chain performance measures, communication, and realization of the corporate strategy and incentive controlled actions. More recently, BSC proponents have focused on the need to tie measures together into a causal chain of performance, and to test the validity of these hypothesized effects to guide the development of strategy. Kaplan and Norton[2001] argue that one of the primary benefits of the balanced scorecard is its use in gauging the success of strategy. Norreklit[2000] insist that the cause-and-effect chain is central to the balanced scorecard. The cause-and-effect chain is also central to the IT BSC. However, prior researches on relationship between information system and enterprise strategies as well as connection between various IT performance measurement indicators are not so much studied. Ittner et al.[2003] report that 77% of all surveyed companies with an implemented BSC place no or only little interest on soundly modeled cause-and-effect relationships despite of the importance of cause-and-effect chains as an integral part of BSC. This shortcoming can be explained with one theoretical and one practical reason[Blumenberg and Hinz, 2006]. From a theoretical point of view, causalities within the BSC method and their application are only vaguely described by Kaplan and Norton. From a practical consideration, modeling corporate causalities is a complex task due to tedious data acquisition and following reliability maintenance. However, cause-and effect relationships are an essential part of BSCs because they differentiate performance measurement systems like BSCs from simple key performance indicator(KPI) lists. KPI lists present an ad-hoc collection of measures to managers but do not allow for a comprehensive view on corporate performance. Instead, performance measurement system like BSCs tries to model the relationships of the underlying value chain in cause-and-effect relationships. Therefore, to overcome the deficiencies of causal modeling in IT BSC, sound and robust causal modeling approaches are required in theory as well as in practice for offering a solution. The propose of this study is to suggest critical success factors(CSFs) and KPIs for measuring performance for IT organizations and empirically validate the casual relationships between those CSFs. For this purpose, we define four perspectives of BSC for IT organizations according to Van Grembergen's study[2000] as follows. The Future Orientation perspective represents the human and technology resources needed by IT to deliver its services. The Operational Excellence perspective represents the IT processes employed to develop and deliver the applications. The User Orientation perspective represents the user evaluation of IT. The Business Contribution perspective captures the business value of the IT investments. Each of these perspectives has to be translated into corresponding metrics and measures that assess the current situations. This study suggests 12 CSFs for IT BSC based on the previous IT BSC's studies and COBIT 4.1. These CSFs consist of 51 KPIs. We defines the cause-and-effect relationships among BSC CSFs for IT Organizations as follows. The Future Orientation perspective will have positive effects on the Operational Excellence perspective. Then the Operational Excellence perspective will have positive effects on the User Orientation perspective. Finally, the User Orientation perspective will have positive effects on the Business Contribution perspective. This research tests the validity of these hypothesized casual effects and the sub-hypothesized causal relationships. For the purpose, we used the Partial Least Squares approach to Structural Equation Modeling(or PLS Path Modeling) for analyzing multiple IT BSC CSFs. The PLS path modeling has special abilities that make it more appropriate than other techniques, such as multiple regression and LISREL, when analyzing small sample sizes. Recently the use of PLS path modeling has been gaining interests and use among IS researchers in recent years because of its ability to model latent constructs under conditions of nonormality and with small to medium sample sizes(Chin et al., 2003). The empirical results of our study using PLS path modeling show that the casual effects in IT BSC significantly exist partially in our hypotheses.

중규모 기상 모델을 이용한 안개 사례의 초기장 및 자료동화 민감도 분석 (The Sensitivity Analyses of Initial Condition and Data Assimilation for a Fog Event using the Mesoscale Meteorological Model)

  • 강미선;임윤규;조창범;김규랑;박준상;김백조
    • 한국지구과학회지
    • /
    • 제36권6호
    • /
    • pp.567-579
    • /
    • 2015
  • 중규모 기상 모델을 이용하여 안개와 같은 미세규모 국지현상을 정확히 재현하는 것은 매우 어려운 실정이다. 특히, 수치모델의 초기 입력 자료의 불확도는 수치모델의 예측 정확도에 결정적인 영향을 미치기 때문에 이를 보완하기 위한 자료동화 과정이 요구되어진다. 본 연구에서는 WRF (Weather Research and Forecasting) 모델을 이용하여 낙동강 지역에서 발생한 여름철 안개사례 재현실험을 대상으로 중규모 기상 모델의 한계를 검증하였다. 중규모 기상 모델에서 초기 및 경계장으로 사용되는 KLAPS (Korea Local Analysis and Prediction System)와 LDAPS (Local Data Assimilation and Prediction System) 분석장 자료를 이용하여 수치모델 모의 정확도 민감도 분석을 수행하였다. 또한 AWS (Automatic Weather System) 자료를 이용한 자료동화(Four-Dimensional Data Assimilation)에 의한 수치모델의 정확도 개선 정도를 평가하였다. 초기 및 경계장 민감도 분석 결과에서 LDAPS 자료를 입력 자료로 사용한 경우가 KLAPS 자료 보다 기온과 이슬점온도, 상대습도에서 높은 정확도를 보였고, 풍속은 더 낮은 수준을 나타내었다. 특히, 상대습도에서 LDAPS의 경우는 RMSE (Root Mean Square Error)가 15.9%, KLAPS는 35.6%의 수준을 보여 그 차이가 매우 크게 나타났다. 또한 자료동화를 통하여 기온, 풍속, 상대습도의 RMSE가 각각 $0.3^{\circ}C$, $0.2ms^{-1}$, 2.2% 수준으로 개선되었다.

상황인식 기반 지능형 최적 경로계획 (Intelligent Optimal Route Planning Based on Context Awareness)

  • 이현정;장용식
    • Asia pacific journal of information systems
    • /
    • 제19권2호
    • /
    • pp.117-137
    • /
    • 2009
  • Recently, intelligent traffic information systems have enabled people to forecast traffic conditions before hitting the road. These convenient systems operate on the basis of data reflecting current road and traffic conditions as well as distance-based data between locations. Thanks to the rapid development of ubiquitous computing, tremendous context data have become readily available making vehicle route planning easier than ever. Previous research in relation to optimization of vehicle route planning merely focused on finding the optimal distance between locations. Contexts reflecting the road and traffic conditions were then not seriously treated as a way to resolve the optimal routing problems based on distance-based route planning, because this kind of information does not have much significant impact on traffic routing until a a complex traffic situation arises. Further, it was also not easy to take into full account the traffic contexts for resolving optimal routing problems because predicting the dynamic traffic situations was regarded a daunting task. However, with rapid increase in traffic complexity the importance of developing contexts reflecting data related to moving costs has emerged. Hence, this research proposes a framework designed to resolve an optimal route planning problem by taking full account of additional moving cost such as road traffic cost and weather cost, among others. Recent technological development particularly in the ubiquitous computing environment has facilitated the collection of such data. This framework is based on the contexts of time, traffic, and environment, which addresses the following issues. First, we clarify and classify the diverse contexts that affect a vehicle's velocity and estimates the optimization of moving cost based on dynamic programming that accounts for the context cost according to the variance of contexts. Second, the velocity reduction rate is applied to find the optimal route (shortest path) using the context data on the current traffic condition. The velocity reduction rate infers to the degree of possible velocity including moving vehicles' considerable road and traffic contexts, indicating the statistical or experimental data. Knowledge generated in this papercan be referenced by several organizations which deal with road and traffic data. Third, in experimentation, we evaluate the effectiveness of the proposed context-based optimal route (shortest path) between locations by comparing it to the previously used distance-based shortest path. A vehicles' optimal route might change due to its diverse velocity caused by unexpected but potential dynamic situations depending on the road condition. This study includes such context variables as 'road congestion', 'work', 'accident', and 'weather' which can alter the traffic condition. The contexts can affect moving vehicle's velocity on the road. Since these context variables except for 'weather' are related to road conditions, relevant data were provided by the Korea Expressway Corporation. The 'weather'-related data were attained from the Korea Meteorological Administration. The aware contexts are classified contexts causing reduction of vehicles' velocity which determines the velocity reduction rate. To find the optimal route (shortest path), we introduced the velocity reduction rate in the context for calculating a vehicle's velocity reflecting composite contexts when one event synchronizes with another. We then proposed a context-based optimal route (shortest path) algorithm based on the dynamic programming. The algorithm is composed of three steps. In the first initialization step, departure and destination locations are given, and the path step is initialized as 0. In the second step, moving costs including composite contexts into account between locations on path are estimated using the velocity reduction rate by context as increasing path steps. In the third step, the optimal route (shortest path) is retrieved through back-tracking. In the provided research model, we designed a framework to account for context awareness, moving cost estimation (taking both composite and single contexts into account), and optimal route (shortest path) algorithm (based on dynamic programming). Through illustrative experimentation using the Wilcoxon signed rank test, we proved that context-based route planning is much more effective than distance-based route planning., In addition, we found that the optimal solution (shortest paths) through the distance-based route planning might not be optimized in real situation because road condition is very dynamic and unpredictable while affecting most vehicles' moving costs. For further study, while more information is needed for a more accurate estimation of moving vehicles' costs, this study still stands viable in the applications to reduce moving costs by effective route planning. For instance, it could be applied to deliverers' decision making to enhance their decision satisfaction when they meet unpredictable dynamic situations in moving vehicles on the road. Overall, we conclude that taking into account the contexts as a part of costs is a meaningful and sensible approach to in resolving the optimal route problem.

계층적 행위 스크립트 표현을 통한 아바타-객체 행위 제어를 위한 인터페이스 기법 (An Interface Technique for Avatar-Object Behavior Control using Layered Behavior Script Representation)

  • 최승혁;김재경;임순범;최윤철
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제33권9호
    • /
    • pp.751-775
    • /
    • 2006
  • 본 논문에서는 아바타의 행위(Avatar Behavior)를 상위 레벨 명령어(High-Level Behavior)들로 이루어진 스크립트로 제어하는 기법을 제안한다. 아바타 행위를 추상화 정도에 따라 구분하고 이를 표준화된 계층적 스크립트(Layered Script)로 정의 함으로써 사용자는 스크립트를 재사용할 수 있고 행위의 추상화 조절이 가능하다. 또한 가상 환경이 복잡해짐에 따라 아바타 행위도 다양하게 늘어날 뿐 아니라 아바타-객체 상호작용 처리 역시 복잡해지고 있다. 이러한 문제점을 해결하기 위해 아바타와 객체간의 상호작용을 위한 객체 모델을 제안하여 아바타와 객체간 벌어지는 행위들을 객체 안에 분산시켜 표현함으로써 객체지향 방식으로 아바타 행위를 유연하게 제어할 수 있도록 설계하였다. 이를 위해 제안 객체 모델에서는 객체의 상태에 따라 사용 가능한 행위가 결정되는 컨텍스트 메뉴(context menu) 인터페이스와 동작 생성 모델을 정의하였다. 또한 사용자는 기존의 2D 혹은 텍스트기반 스크립트 작성기법을 벗어나 제안된 3D 인터페이스 기법을 통하여 실시간으로 아바타의 행위 스크립트를 작성 및 재생 할 수 있다. 본 연구에서는 제안 기법의 활용을 위해 프레젠테이션 도메인 환경의 시스템을 구축하고 아바타-객체 행위제어 및 스크립트 생성 기법을 적용하였다. 본 논문에서는 아바타의 행위(Avatar Behavior)를 일종의 상위 레벨 명령어(Hi8h-Level TaskBehavior)들로 이루어진 스크립트로 제어하는 기법을 제시한다제안한다. 아바타 행위를 추상화 정도에 따라 구분하고 이를 표준화된 계층적 스크립트(Multi-LeveiLayered Script)로 정의 함으로써 사용자는 쉽게 스크립트를 재사용할 수 있고 행위의 추상화 정도도 쉽게 조절이 가능하다. 또한 또한 아바타와 객체간의 상호작용을 위한 객체 모델을 제시한다. 가상 환경이 복잡해짐에 따라 아바타 행위도 다양하게 늘어날 뿐 아니라 아바타-객체 상호작용 처리 역시 복잡해지고 있다. 이러한 문제점을 해결하기 위해 아바타와 객체간의 상호작용을 위한 객체 모델을 제안하여 아바타와 객체간 벌어지는 모든 행위들을 객체 안에 분산시켜 저장표현함으로써 객체지향 방식으로 아바타 행위를 유연하게 제어객체의 수와 무관하게 상호작용을 처리할 수 있도록 설계하였다. 이를 위해 또한 복잡해진 제안 객체 모델에서는 객체의 상태에 따라 사용 가능한 행위가 결정되는 가상 환경을 위해 새로운 인터페이스로 컨텍스트 메뉴(context menu) 인터페이스와 동작 생성 모델을 제시한다. 정의하였다. 객체 모델에서 객체의 상태 정보와 행위 정보를 분석해 아바타가 할 수 있는 행위를 컨텍스트 메뉴로 제공하기 때문에 사용자는 가상 환경의 상태에 상관 없이 직관적으로 명령을 줄 수 있다. 또한 사용자는 기존의 2D 혹은 텍스트기반 스크립트 작성기법을 벗어나 사용자는 제안된 3D 인터페이스 기법을 통하여 실시간으로 아바타의 행위 스크립트를 작성 및 재생 할 수 있다. 본 논문에서 제시한 시스템은 기존의 아바타 중심적인 제어를 객체에 분산함으로써 효율적이고 직관적인 명령을 내릴 수 있고 또한 손쉬운 시나리오 생성을 가능하게 하였다. 본 연구에서는 제안 기법의 활용을 위해 프리젠테이션 도메인 환경의 시스템을 구축하고 아바타-객체 행위제어 및 스크립트 생성 기법을 적용하였다.

국토환경지리정보 고도화 전략 연구 - 국토환경성평가지도, 생태자연도, 토지피복지도를 중심으로 - (A Study on Advancing Strategy for National Environmental Geographic Informations - Focused on the National Environmental Assessment Map, Ecological Map and Land Cover Map -)

  • 이종수
    • 환경정책연구
    • /
    • 제6권2호
    • /
    • pp.97-122
    • /
    • 2007
  • 환경부는 2006년에 국토환경성평가지도, 생태자연도, 토지피복지도 등 전국단위 국토환경지리정보 구축을 완료하였다. 이제는 국토환경지리정보의 복합적인 특성을 감안한 고도화 전략이 필요한 시점이다. 이에 본 연구에서는 국토환경지리정보 여건분석과 정보화 추세를 반영하여 국토환경지리정보의 고도화 전략을 수립하였다. 국토환경지리정보는 2차 자료 특성과 단위 업무별 또는 단위 부서별로 분산되어 관리되는 특성이 있다. 이에 따라 국토환경지리정보에 기반한 정책수립 지원과 복합적인 정보가 필요한 수요자들의 요구를 충족시켜 주기 위해서는 행정업무처리 위주의 정보체계에서 의사결정지원 중심으로 정보체계를 전환하여야 한다. 이에 본 연구에서는 국토환경지리정보 고도화의 비전을 "국토환경지리정보 고도화를 통한 지속가능한 국토관리체계 구현"으로 설정하였다. 비전을 달성하기 위한 목표로는 지식기반의 전략적 지리정보 구축, 고객중심의 투명한 정보공개 기반 마련, 확장 통합형 국토환경지리정보 구축, 국토환경지리정보에 기반한 환경행정 실현, 국토환경지리정보 활용도 극대화 효율적 국토환경관리 업무프로세스 지원으로 설정하였다. 비전과 목표를 달성하기 위한 실행방안으로 정보의 신뢰성을 검증할 수 있는 품질관리프로그램의 개발, 환경정보 통합제공체계 구축, 정보수집, 시스템 구축, 시스템 활용, 시스템 관리측면에서 법제도 정비방안, 업무프로세스, 인력 및 조직, 법 제도, 정보기술 부문의 운영관리 방안을 제시하였다. 본 연구는 그동안 국토환경지리정보의 양적 팽창 위주에서 진일보하여 질적인 신뢰성을 확보할 수 있는 정책적 전환계기로 활용될 수 있다. 그러나 본 연구에서 도출한 고도화 전략이 모든 국토환경지리정보와 환경행정 현황을 반영하였다고는 할 수 없다. 따라서 향후에 본 연구에서 도출한 결과를 실제 환경행정에 적용하기 위해서는 국토환경지리정보에 대한 체계적인 범주화, 관련자 면담 등을 포함한 보다 본격적인 논의가 필요하다.

  • PDF

지식베이스 구축을 위한 한국어 위키피디아의 학습 기반 지식추출 방법론 및 플랫폼 연구 (Knowledge Extraction Methodology and Framework from Wikipedia Articles for Construction of Knowledge-Base)

  • 김재헌;이명진
    • 지능정보연구
    • /
    • 제25권1호
    • /
    • pp.43-61
    • /
    • 2019
  • 최근 4차 산업혁명과 함께 인공지능 기술에 대한 연구가 활발히 진행되고 있으며, 이전의 그 어느 때보다도 기술의 발전이 빠르게 진행되고 있는 추세이다. 이러한 인공지능 환경에서 양질의 지식베이스는 인공지능 기술의 향상 및 사용자 경험을 높이기 위한 기반 기술로써 중요한 역할을 하고 있다. 특히 최근에는 인공지능 스피커를 통한 질의응답과 같은 서비스의 기반 지식으로 활용되고 있다. 하지만 지식베이스를 구축하는 것은 사람의 많은 노력을 요하며, 이로 인해 지식을 구축하는데 많은 시간과 비용이 소모된다. 이러한 문제를 해결하기 위해 본 연구에서는 기계학습을 이용하여 지식베이스의 구조에 따라 학습을 수행하고, 이를 통해 자연어 문서로부터 지식을 추출하여 지식화하는 방법에 대해 제안하고자 한다. 이러한 방법의 적절성을 보이기 위해 DBpedia 온톨로지의 구조를 기반으로 학습을 수행하여 지식을 구축할 것이다. 즉, DBpedia의 온톨로지 구조에 따라 위키피디아 문서에 기술되어 있는 인포박스를 이용하여 학습을 수행하고 이를 바탕으로 자연어 텍스트로부터 지식을 추출하여 온톨로지화하기 위한 방법론을 제안하고자 한다. 학습을 바탕으로 지식을 추출하기 위한 과정은 문서 분류, 적합 문장 분류, 그리고 지식 추출 및 지식베이스 변환의 과정으로 이루어진다. 이와 같은 방법론에 따라 실제 지식 추출을 위한 플랫폼을 구축하였으며, 실험을 통해 본 연구에서 제안하고자 하는 방법론이 지식을 확장하는데 있어 유용하게 활용될 수 있음을 증명하였다. 이러한 방법을 통해 구축된 지식은 향후 지식베이스를 기반으로 한 인공지능을 위해 활용될 수 있을 것으로 판단된다.

과거 합격자 시맨틱 데이터베이스를 활용한 디지털 인문학 연구 (Digital Humanities, and Applications of the "Successful Exam Passers List")

  • 이재옥
    • 동양고전연구
    • /
    • 제70호
    • /
    • pp.303-345
    • /
    • 2018
  • 이 논문은 조선시대 과거급제자 명단인 방목의 디지털화 작업이 한 개인의 사회적 배경과 혈통에 대한 정보를 알려주는 것을 뛰어넘어, 양반 사이의 다양한 관계망을 파악하는 자료로서 어떻게 이용할 수 있는지를 보여주는 것이다. 디지털 인문학에서 조선시대 과거 합격자의 명단인 방목은 대단히 흥미로운 자료다. 이 자료를 기반으로 조선시대 사회상을 엿볼 수 있다. 한국학중앙연구원은 방목의 각종 데이터를 XML 문서로 만들어 데이터베이스를 구축 운영하고 있어, 필요한 항목을 추출하고 다양한 통계 자료를 만들 수 있다. 또 방목 데이터와 족보 데이터를 연결한다면 혼인 관계와 지역 연고, 당파 등 한 개인과 지역 사회에 대한 중층적인 스토리텔링을 구현할 수도 있다. 이미 한국학중앙연구원에서는 2005년부터 현재까지 문과방목 무과방목 사마방목 잡과방목의 디지털화를 완료하였다. 이 작업의 결과는 현재 '한국역대인물 종합정보시스템'에서 이용할 수 있다. 조선시대 다양한 과거급제자의 명단을 망라한 이 작업으로 조선시대 지배엘리트로부터 전문직 중인의 명단을 확보할 수 있게 되었다. 그럼에도 아직 이 작업결과를 통해 의미 있는 활용들이 일어나지 못하고 있다. 이 논문은 낱낱이 흩어져 있는 개인 정보들을 디지털 인문학이라는 학문적 접근을 통해 개인의 생애와 그 개인이 몸담은 사회의 심층을 들여다보는 창구로서 어떻게 활용할 수 있는지를 제시하고자 한다. 그래프 데이터베이스에 방목 데이터를 입력하면 급제자가 노드(node)가 되고 각 노드간 친족 관계와 혼인 관계를 시각적으로 살펴 볼 수 있다. 급제자들 상호 간의 인적 관계뿐만 아니라 여기에 족보 데이터를 추가하면 다양한 혼인 관계를 바탕으로 조선시대 문벌 가문의 단초를 한 눈에 알 수 있다.

BERT 기반 감성분석을 이용한 추천시스템 (Recommender system using BERT sentiment analysis)

  • 박호연;김경재
    • 지능정보연구
    • /
    • 제27권2호
    • /
    • pp.1-15
    • /
    • 2021
  • 추천시스템은 사용자의 기호를 파악하여 물품 구매 결정을 도와주는 역할을 할 뿐만 아니라, 비즈니스 전략의 관점에서도 중요한 역할을 하기에 많은 기업과 기관에서 관심을 갖고 있다. 최근에는 다양한 추천시스템 연구 중에서도 NLP와 딥러닝 등을 결합한 하이브리드 추천시스템 연구가 증가하고 있다. NLP를 이용한 감성분석은 사용자 리뷰 데이터가 증가함에 따라 2000년대 중반부터 활용되기 시작하였지만, 기계학습 기반 텍스트 분류를 통해서는 텍스트의 특성을 완전히 고려하기 어렵기 때문에 리뷰의 정보를 식별하기 어려운 단점을 갖고 있다. 본 연구에서는 기계학습의 단점을 보완하기 위하여 BERT 기반 감성분석을 활용한 추천시스템을 제안하고자 한다. 비교 모형은 Naive-CF(collaborative filtering), SVD(singular value decomposition)-CF, MF(matrix factorization)-CF, BPR-MF(Bayesian personalized ranking matrix factorization)-CF, LSTM, CNN-LSTM, GRU(Gated Recurrent Units)를 기반으로 하는 추천 모형이며, 실제 데이터에 대한 분석 결과, BERT를 기반으로 하는 추천시스템의 성과가 가장 우수한 것으로 나타났다.