• 제목/요약/키워드: second order accuracy

검색결과 562건 처리시간 0.031초

경영분석지표와 의사결정나무기법을 이용한 유상증자 예측모형 개발 (Development of Predictive Models for Rights Issues Using Financial Analysis Indices and Decision Tree Technique)

  • 김명균;조윤호
    • 지능정보연구
    • /
    • 제18권4호
    • /
    • pp.59-77
    • /
    • 2012
  • 기업의 성장성, 수익성, 안정성, 활동성, 생산성 등에 대한 다양한 분석이 은행, 신용평가기관, 투자자 등 많은 이해관계자에 의해 실시되고 있고, 이에 대한 다양한 경영분석 지표들 또한 정기적으로 발표되고 있다. 본 연구에서는 이러한 경영분석 지표를 이용하여 어떤 기업이 가까운 미래에 유상증자를 실시하는지를 데이터마이닝을 통해 예측하고자 한다. 본 연구를 통해 어떠한 지표가 유상증자 여부를 예측하는데 도움이 되는가를 살펴 볼 것이며, 그 지표들을 이용하여 예측할 경우 그 예측의 정확도가 어느 정도인지를 분석하고자 한다. 특히 1997년 IMF 금융위기 전후로 유상증자를 결정하는 변수들이 변화하는지, 그리고 예측의 정확성에 분명한 차이가 존재하는지 분석한다. 또한 유상증자 실시 시기를 경영분석 지표 발표 후 1년 내, 1~2년 내, 2~3년 내로 나누어 예측 시기에 따라 예측의 정확성과 결정 변수들의 차이가 존재하는지도 분석한다. 658개의 유가증권상장법인의 경영분석 데이터를 이용하여 실증 분석한 결과, IMF 이후의 유상증자 예측모형이 IMF 이전의 예측모형에 비해 예측 정확도가 높았고, 학습용 데이터의 예측 정확도와 검증용 데이터의 예측 정확도 차이도 IMF 이후가 낮게 나타났다. 이러한 결과는 IMF 이후 재무자료의 정확도가 높아졌고, 기업에게 유상증자의 목적이 더욱 명확해졌다고 해석될 수 있다. 또한 예측기간이 단기인 경우 경영분석 지표 중 안전성에 관련된 지표들의 중요성이 부각되었고, 장기인 경우에는 수익성과 안전성뿐만 아니라 활동성과 생산성 관련지표도 유상증자를 예측하는 데 중요한 것으로 파악되었다. 그리고 모든 예측모형에서 산업코드가 유상증자를 예측하는 중요변수로 포함되었는데 이는 산업별로 서로 다른 유상증자 유형이 존재한다는 점을 시사한다. 본 연구는 투자자나 재무담당자가 유상증자 여부를 장단기 시점에서 예측하고자 할 때 어떠한 경영분석지표를 고려하여 분석하는 것이 바람직한지에 대한 지침을 제공하는데 그 의의가 있다.

뉴럴 텐서 네트워크 기반 주식 개별종목 지식개체명 추출 방법에 관한 연구 (A Study on Knowledge Entity Extraction Method for Individual Stocks Based on Neural Tensor Network)

  • 양윤석;이현준;오경주
    • 지능정보연구
    • /
    • 제25권2호
    • /
    • pp.25-38
    • /
    • 2019
  • 정보화 시대의 넘쳐나는 콘텐츠들 속에서 사용자의 관심과 요구에 맞는 양질의 정보를 선별해내는 과정은 세대를 거듭할수록 더욱 중요해지고 있다. 정보의 홍수 속에서 사용자의 정보 요구를 단순한 문자열로 인식하지 않고, 의미적으로 파악하여 검색결과에 사용자 의도를 더 정확하게 반영하고자 하는 노력이 이루어지고 있다. 구글이나 마이크로소프트와 같은 대형 IT 기업들도 시멘틱 기술을 기반으로 사용자에게 만족도와 편의성을 제공하는 검색엔진 및 지식기반기술의 개발에 집중하고 있다. 특히 금융 분야는 끊임없이 방대한 새로운 정보가 발생하며 초기의 정보일수록 큰 가치를 지녀 텍스트 데이터 분석과 관련된 연구의 효용성과 발전 가능성이 기대되는 분야 중 하나이다. 따라서, 본 연구는 주식 관련 정보검색의 시멘틱 성능을 향상시키기 위해 주식 개별종목을 대상으로 뉴럴 텐서 네트워크를 활용한 지식 개체명 추출과 이에 대한 성능평가를 시도하고자 한다. 뉴럴 텐서 네트워크 관련 기존 주요 연구들이 추론을 통해 지식 개체명들 사이의 관계 탐색을 주로 목표로 하였다면, 본 연구는 주식 개별종목과 관련이 있는 지식 개체명 자체의 추출을 주목적으로 한다. 기존 관련 연구의 문제점들을 해결하고 모형의 실효성과 현실성을 높이기 위한 다양한 데이터 처리 방법이 모형설계 과정에서 적용되며, 객관적인 성능 평가를 위한 실증 분석 결과와 분석 내용을 제시한다. 2017년 5월 30일부터 2018년 5월 21일 사이에 발생한 전문가 리포트를 대상으로 실증 분석을 진행한 결과, 제시된 모형을 통해 추출된 개체명들은 개별종목이 이름을 약 69% 정확도로 예측하였다. 이러한 결과는 본 연구에서 제시하는 모형의 활용 가능성을 보여주고 있으며, 후속 연구와 모형 개선을 통한 성과의 제고가 가능하다는 것을 의미한다. 마지막으로 종목명 예측 테스트를 통해 본 연구에서 제시한 학습 방법이 새로운 텍스트 정보를 의미적으로 접근하여 관련주식 종목과 매칭시키는 목적으로 사용될 수 있는 가능성을 확인하였다.

M&W 파동 패턴과 유전자 알고리즘을 이용한 주식 매매 시스템 개발 (Development of a Stock Trading System Using M & W Wave Patterns and Genetic Algorithms)

  • 양훈석;김선웅;최흥식
    • 지능정보연구
    • /
    • 제25권1호
    • /
    • pp.63-83
    • /
    • 2019
  • 투자자들은 기업의 내재가치 분석, 기술적 보조지표 분석 등 복잡한 분석보다 차트(chart)에 나타난 그래프(graph)의 모양으로 매매 시점을 찾는 직관적인 방법을 더 선호하는 편이다. 하지만 패턴(pattern) 분석 기법은 IT 구현의 난이도 때문에 사용자들의 요구에 비해 전산화가 덜 된 분야로 여겨진다. 최근에는 인공지능(artificial intelligence, AI) 분야에서 신경망을 비롯한 다양한 기계학습(machine learning) 기법을 사용하여 주가의 패턴을 연구하는 사례가 많아졌다. 특히 IT 기술의 발전으로 방대한 차트 데이터를 분석하여 주가 예측력이 높은 패턴을 발굴하는 것이 예전보다 쉬워졌다. 지금까지의 성과로 볼 때 가격의 단기 예측력은 높아졌지만, 장기 예측력은 한계가 있어서 장기 투자보다 단타 매매에서 활용되는 수준이다. 이외에 과거 기술력으로 인식하지 못했던 패턴을 기계적으로 정확하게 찾아내는 데 초점을 맞춘 연구도 있지만 찾아진 패턴이 매매에 적합한지 아닌지는 별개의 문제이기 때문에 실용적인 부분에서 취약할 수 있다. 본 연구는 주가 예측력이 있는 패턴을 찾으려는 기존 연구 방법과 달리 패턴들을 먼저 정의해 놓고 확률기반으로 선택해서 매매하는 방법을 제안한다. 5개의 전환점으로 정의한 Merrill(1980)의 M&W 파동 패턴은 32가지의 패턴으로 시장 국면 대부분을 설명할 수 있다. 전환점만으로 패턴을 분류하기 때문에 패턴 인식의 정확도를 높이기 위해 드는 비용을 줄일 수 있다. 32개 패턴으로 만들 수 있는 조합의 수는 전수 테스트가 불가능한 수준이다. 그래서 최적화 문제와 관련한 연구들에서 가장 많이 사용되고 있는 인공지능 알고리즘(algorithm) 중 하나인 유전자 알고리즘(genetic algorithm, GA)을 이용하였다. 그리고 미래의 주가가 과거를 반영한다 해도 같게 움직이지 않기 때문에 전진 분석(walk-forward analysis, WFA)방법을 적용하여 과최적화(overfitting)의 실수를 줄이도록 하였다. 20종목씩 6개의 포트폴리오(portfolio)를 구성하여 테스트해 본 결과에 따르면 패턴 매매에서 가격 변동성이 어느 정도 수반되어야 하며 패턴이 진행 중일 때보다 패턴이 완성된 후에 진입, 청산하는 것이 효과적임을 확인하였다.

계층적 Level-of-Detail 표현을 이용한 해마의 국부적인 형상 분석 (Local Shape Analysis of the Hippocampus using Hierarchical Level-of-Detail Representations)

  • 김정식;최수미;최유주;김명희
    • 정보처리학회논문지A
    • /
    • 제11A권7호
    • /
    • pp.555-562
    • /
    • 2004
  • 뇌의 하부 구조인 해마의 전역적 부피 감소와 국부적 형상 변화는 정신의학적 질환에 깊게 관련되어 있다. 해마 구조에 관한 형상 분석 연구는 크게 해마 형상 표현 모델을 구축하고, 이러한 형상 표현으로부터 형상 유사성을 계산하는 과정으로 구성된다. 본 논문에서는 메쉬, 복셀, 골격 데이터를 포함하는 복합적인 옥트리 기반의 형상 표현을 이용하여 해마의 형상을 분석하기 위한 새로운 방법을 제시한다. 우선 해마에 관한 MRI 데이터를 입력으로 받아, 마칭큐브 알고리즘을 사용하여 다해상도 메쉬 모델을 구축한다. 이렇게 구성된 다각형 모델은 깊이맵 기반의 복셀화 방법을 이용하여 중간 단계의 이진 복셀 데이터로 변환된다. 그리고 변환된 복셀 데이터로부터 슬라이스 기반의 골격화 방법에 의하여 해마의 3차원 골격을 추출한다. 그런 후에 옥트리 기반의 다해상도 형상 표현을 얻기위해 해마의 메쉬, 복셀, 골격 데이터를 계층적으로 공간 분할하여 저장하고, 광선 추적 기반의 메쉬 샘플링 방법을 적용하여 샘플 메쉬 데이터를 추출한다. 최종적으로, 형상간 유사성 측정을 위하여 추출된 골격으로부터 방사되는 광선들과 충돌되는 각 샘플 메쉬 쌍에 대하여 $L_2$과 하우스도르프 거리를 계산하고 인터랙티브한 국부적 형상 분석을 지원하기 위하여 마우스 피킹 인터페이스를 채택한다. 이것은 형상의 국부적 변화에 대하여 다양한 해상도에 기반한 형상 분석을 가능하게 한다. 본 논문에서는 실험을 통하여, 제시한 형상 분석 방법이 회전과 스케일 등의 변환에 강인하고, 특히 형상의 국부적 변화 정도를 정확도를 유지하면서 빠르게 평가하는데에 효과적임을 확인하였다. 경로의 수신 신호가 완전 동기 된 수신 신호임을 확인하였다.omonas aeruginosa PA01과 $82\%$로 가장 높은 유사성을 보였고 Pseudomonas arvilla C-1와는 $71\%,$ Pseudomonas putida KT2440과는 $59\%,$ 그리고 Pseudomonas sp. CA10과는 $53\%$의 상동성이 각각 존재하는 것으로 확인하였다.)을 가지고 있음이 확인되었다. 사람에 직접적인 유해성을 가지고 있는 지 확인하기 위해 사람 방광 유래의 T-24세포와 장내 표피 유래의 Caco-2세포에 대한 부착능을 시험하였을 때, 16균주$(42.1\%)$가 T-24방광 세포에, 그리고 17균주$(44.7\%)$가 Caco-2장세포에 대해 강한 부착능을 나타내었다. 특히 11균주$(28.9\%)$는 두 세포 모두에 강한 부착능을 가지고 있었다. Filter mating method를 수행하여 이들 균주들의 독소 생산 유전자와 항생제 내성 유전자가 사람에서 분리된 균주로 전달되는 것을 확인할 수 있었다. 본 실험의 결과는 설사 중상을 나타내는 돼지로부터 분리된 용혈성 E. coli의 독성과 세포 부착능력, 그리고 항생제 내성간의 상호 연관성을 보여주지 않았으나 동물 분리 세균의 항생제 내성과 독소 생산 능력이 유전자 전달을 통해서 뿐만 아니라 세균의 직접 접촉에 의해서도 인체로 전달될 수 있는 것을 보여주는 것이다.다. 본 연구를 토대로 장시간의 체외순환에서는 신장기능을 대표하는 수치들에도

계절 변화의 원인에 관한 초등학생의 멘탈 모델 변화 과정 분석 (Analysis of Changes in Elementary Students' Mental Models about the Causes of the Seasonal Change)

  • 김순미;양일호;임성만
    • 한국과학교육학회지
    • /
    • 제33권5호
    • /
    • pp.893-910
    • /
    • 2013
  • 이 연구의 목적은 계절 변화의 원인에 대한 초등학생의 멘탈 모델의 변화 과정을 파악하는 것이다. 미시 발생적 연구 방법을 사용하여 총 8회기 동안 초등학교 6학년생 8명에게 계절 변화의 원인을 그림과 글, 사고 발성을 통해 설명하게 함으로써 멘탈 모델의 변화를 파악하였다. 연구 진행 시 연구 참여자의 언어적, 행동적 요소 및 면담 내용을 모두 비디오 녹화하였으며, 연구자의 현장 관찰 기록지와 학생이 작성한 멘탈 모델 기록지 등 다각적 자료를 함께 수집하였다. 수집한 결과를 통합하여 프로토콜을 작성하고, 이를 반복적으로 읽으며 귀납적으로 범주화하였다. 연구 결과는 다음과 같다. 첫째, 계절 변화의 원인에 대한 학습자의 멘탈 모델은 회기 내 및 회기 간에 걸쳐 개인마다 다양한 경로로 변화하였으며, 다양한 변화를 일으킨 학습자의 멘탈 모델이 과학적 모델에 더 근접하였다. 또한 자전이나 공전처럼, 계절의 변화와 관련된 선행 지식이 바르게 정착된 학생들은 새로운 정보에 기초하여 과학적 개념과 일치하는 멘탈 모델을 형성하였다. 반면에, 선행 지식이 바르게 정착되지 않은 경우에는 변형된 멘탈 모델에서 벗어나지 못하였다. 둘째, 멘탈 모델이 변화하는 데에는 학습자의 선행지식과 경험 및 정보, 선행 지식의 정확성, 새로운 지식과 기존 멘탈 모델 사이의 불일치 해결, 모형 조작을 통한 멘탈 모델 활성화, 그림으로 그려보기와 같은 요인들이 영향을 미쳤다. 교사는 학습자의 과학적 개념 형성을 위하여 그들에게 다양한 멘탈 모델을 구성할 수 있는 경험을 충분히 제공하고, 기존 멘탈 모델과 불일치하는 새로운 수업자료 제시를 통해 학습자가 의문을 느끼게 하고, 이를 해결하도록 할 필요가 있다.

랜드마크 코너 추출을 적용한 모바일 카메라 기반 위치결정 기법 (Mobile Camera-Based Positioning Method by Applying Landmark Corner Extraction)

  • 이유진;윤완상;이수암
    • 대한원격탐사학회지
    • /
    • 제39권6_1호
    • /
    • pp.1309-1320
    • /
    • 2023
  • 모바일 기기의 기술 발전과 대중화는 어디서든 사용자의 위치를 확인할 수 있으며 인터넷을 사용할 수 있도록 발전되었다. 그러나 실내의 경우 인터넷은 끊김없이 사용할 수 있지만 global positioning system (GPS) 기능은 활용하기 어렵다. 실내 공공장소인 백화점, 박물관, 컨퍼런스장, 학교, 터널 등 GPS가 수신되지 않는 음영 지역에서 실시간 위치정보 제공의 필요성이 증가하고 있다. 이에 따라 최근의 실내 측위 기술은 랜드마크 데이터베이스를 구축하기 위해 light detection and ranging (LiDAR) 장비를 기반으로 연구가 증가하고 있다. 본 연구에서는 랜드마크 데이터베이스 구축의 접근성에 초점을 두어 모바일 기기를 기반으로 랜드마크를 촬영한 단일 이미지와 사전에 구축된 랜드마크 데이터베이스 정보를 이용하여 사용자의 위치를 추정하는 기법을 개발하고자 하였다. 첫 번째로, 랜드마크 데이터베이스를 구축하였다. 랜드마크를 촬영한 모바일 이미지만으로 사용자 위치를 추정하기 위해서는 모바일 이미지에서 랜드마크 검출이 필수적이고, 검출된 랜드마크에서 고정적인 성격을 가진 지점의 지상좌표 취득이 필수적이다. 두 번째 단계에서는 bag of words (BoW) 영상 검색 기술을 적용해 랜드마크 데이터베이스 중 모바일 이미지가 촬영한 랜드마크를 유사한 4위까지 검색하였다. 세 번째 단계에서는 scale invariant feature transform (SIFT) 특징점 추출 기법과 Homography random sample consensus (RANSAC)을 통해 검색된 4개의 후보 랜드마크들 중 가장 유사한 하나의 랜드마크를 선정하였고, 이때 임계값 설정을 통해 정합점 수를 기반으로 한 차례 더 필터링을 수행하였다. 네 번째 단계에서는 대응된 랜드마크와 모바일 이미지간의 Homography 행렬을 통해 랜드마크 이미지를 모바일 이미지에 투사하여 랜드마크의 영역과 코너(외곽선)점을 검출하였다. 마지막으로, 위치추정 기법을 통해 사용자의 위치를 추정하였다. 해당 기술의 성능을 분석한 결과, 랜드마크 검색 성능은 약 86%로 측정되었다. 위치추정 결과와 사용자의 실제 지상좌표를 비교한 결과, 약 0.56 m의 수평 위치 정확도를 갖는 것이 확인되어 별도의 고가 장비 없이 랜드마크 데이터베이스를 구축하여 모바일 영상으로 사용자 위치 추정이 가능한 것을 확인하였다.

이물 객체 탐지 성능 개선을 위한 딥러닝 네트워크 기반 저품질 영상 개선 기법 개발 (Development of deep learning network based low-quality image enhancement techniques for improving foreign object detection performance)

  • 엄기열;민병석
    • 인터넷정보학회논문지
    • /
    • 제25권1호
    • /
    • pp.99-107
    • /
    • 2024
  • 경제성장과 산업 발전에 따라 반도체 제품부터 SMT 제품, 전기 배터리 제품에 이르기 까지 많은 전자통신 부품들의 제조과정에서 발생하는 철, 알루미늄, 플라스틱 등의 이물질로 인해 제품이 제대로 동작하지 않거나, 전기 배터리의 경우 화재를 발생하는 문제까지 심각한 문제로 이어질 가능성이 있다. 이러한 문제를 해결하기 위해 초음파나 X-ray를 이용한 비파괴 방법으로 제품 내부에 이물질이 있는지 판단하여 문제의 발생을 차단하고 있으나, X-ray 영상을 취득하여 이물질이 있는지 판정하는 데에도 여러 한계점이 존재한다. 특히. 크기가 작거나 밀도가 낮은 이물질들은 X-Ray장비로 촬영을 하여도 보이지 않는 문제점이 있고, 잡음 등으로 인해 이물들이 잘 안 보이는 경우가 있으며, 특히 높은 생산성을 가지기 위해서는 빠른 검사속도가 필요한데, 이 경우 X-ray 촬영시간이 짧아지게 되면 신호 대비 잡음비율(SNR)이 낮아지면서 이물 탐지 성능이 크게 저하되는 문제를 가진다. 따라서, 본 논문에서는 저화질로 인해 이물질을 탐지하기 어려운 한계를 극복하기 위한 5단계 방안을 제안한다. 첫번째로, Global 히스토그램 최적화를 통해 X-Ray영상의 대비를 향상시키고, 두 번째로 고주파 영역 신호의 구분력을 강화하기 위하여 Local contrast기법을 적용하며, 세 번째로 Edge 선명도 향상을 위해 Unsharp masking을 통해 경계선을 강화하여 객체가 잘 구분되도록 한다, 네 번째로, 잡음 제거 및 영상향상을 위해 Resdual Dense Block(RDB)의 초고해상화 방법을 제안하며, 마지막으로 Yolov5 알고리즘을 이용하여 이물질을 학습한 후 탐지한다. 본 연구에서 제안하는 방식을 이용하여 실험한 결과, 저밀도 영상 대비 정밀도 등의 평가기준에서 10%이상의 성능이 향상된다.

U-마켓에서의 사용자 정보보호를 위한 매장 추천방법 (A Store Recommendation Procedure in Ubiquitous Market for User Privacy)

  • 김재경;채경희;구자철
    • Asia pacific journal of information systems
    • /
    • 제18권3호
    • /
    • pp.123-145
    • /
    • 2008
  • Recently, as the information communication technology develops, the discussion regarding the ubiquitous environment is occurring in diverse perspectives. Ubiquitous environment is an environment that could transfer data through networks regardless of the physical space, virtual space, time or location. In order to realize the ubiquitous environment, the Pervasive Sensing technology that enables the recognition of users' data without the border between physical and virtual space is required. In addition, the latest and diversified technologies such as Context-Awareness technology are necessary to construct the context around the user by sharing the data accessed through the Pervasive Sensing technology and linkage technology that is to prevent information loss through the wired, wireless networking and database. Especially, Pervasive Sensing technology is taken as an essential technology that enables user oriented services by recognizing the needs of the users even before the users inquire. There are lots of characteristics of ubiquitous environment through the technologies mentioned above such as ubiquity, abundance of data, mutuality, high information density, individualization and customization. Among them, information density directs the accessible amount and quality of the information and it is stored in bulk with ensured quality through Pervasive Sensing technology. Using this, in the companies, the personalized contents(or information) providing became possible for a target customer. Most of all, there are an increasing number of researches with respect to recommender systems that provide what customers need even when the customers do not explicitly ask something for their needs. Recommender systems are well renowned for its affirmative effect that enlarges the selling opportunities and reduces the searching cost of customers since it finds and provides information according to the customers' traits and preference in advance, in a commerce environment. Recommender systems have proved its usability through several methodologies and experiments conducted upon many different fields from the mid-1990s. Most of the researches related with the recommender systems until now take the products or information of internet or mobile context as its object, but there is not enough research concerned with recommending adequate store to customers in a ubiquitous environment. It is possible to track customers' behaviors in a ubiquitous environment, the same way it is implemented in an online market space even when customers are purchasing in an offline marketplace. Unlike existing internet space, in ubiquitous environment, the interest toward the stores is increasing that provides information according to the traffic line of the customers. In other words, the same product can be purchased in several different stores and the preferred store can be different from the customers by personal preference such as traffic line between stores, location, atmosphere, quality, and price. Krulwich(1997) has developed Lifestyle Finder which recommends a product and a store by using the demographical information and purchasing information generated in the internet commerce. Also, Fano(1998) has created a Shopper's Eye which is an information proving system. The information regarding the closest store from the customers' present location is shown when the customer has sent a to-buy list, Sadeh(2003) developed MyCampus that recommends appropriate information and a store in accordance with the schedule saved in a customers' mobile. Moreover, Keegan and O'Hare(2004) came up with EasiShop that provides the suitable tore information including price, after service, and accessibility after analyzing the to-buy list and the current location of customers. However, Krulwich(1997) does not indicate the characteristics of physical space based on the online commerce context and Keegan and O'Hare(2004) only provides information about store related to a product, while Fano(1998) does not fully consider the relationship between the preference toward the stores and the store itself. The most recent research by Sedah(2003), experimented on campus by suggesting recommender systems that reflect situation and preference information besides the characteristics of the physical space. Yet, there is a potential problem since the researches are based on location and preference information of customers which is connected to the invasion of privacy. The primary beginning point of controversy is an invasion of privacy and individual information in a ubiquitous environment according to researches conducted by Al-Muhtadi(2002), Beresford and Stajano(2003), and Ren(2006). Additionally, individuals want to be left anonymous to protect their own personal information, mentioned in Srivastava(2000). Therefore, in this paper, we suggest a methodology to recommend stores in U-market on the basis of ubiquitous environment not using personal information in order to protect individual information and privacy. The main idea behind our suggested methodology is based on Feature Matrices model (FM model, Shahabi and Banaei-Kashani, 2003) that uses clusters of customers' similar transaction data, which is similar to the Collaborative Filtering. However unlike Collaborative Filtering, this methodology overcomes the problems of personal information and privacy since it is not aware of the customer, exactly who they are, The methodology is compared with single trait model(vector model) such as visitor logs, while looking at the actual improvements of the recommendation when the context information is used. It is not easy to find real U-market data, so we experimented with factual data from a real department store with context information. The recommendation procedure of U-market proposed in this paper is divided into four major phases. First phase is collecting and preprocessing data for analysis of shopping patterns of customers. The traits of shopping patterns are expressed as feature matrices of N dimension. On second phase, the similar shopping patterns are grouped into clusters and the representative pattern of each cluster is derived. The distance between shopping patterns is calculated by Projected Pure Euclidean Distance (Shahabi and Banaei-Kashani, 2003). Third phase finds a representative pattern that is similar to a target customer, and at the same time, the shopping information of the customer is traced and saved dynamically. Fourth, the next store is recommended based on the physical distance between stores of representative patterns and the present location of target customer. In this research, we have evaluated the accuracy of recommendation method based on a factual data derived from a department store. There are technological difficulties of tracking on a real-time basis so we extracted purchasing related information and we added on context information on each transaction. As a result, recommendation based on FM model that applies purchasing and context information is more stable and accurate compared to that of vector model. Additionally, we could find more precise recommendation result as more shopping information is accumulated. Realistically, because of the limitation of ubiquitous environment realization, we were not able to reflect on all different kinds of context but more explicit analysis is expected to be attainable in the future after practical system is embodied.

텍스트 마이닝 기법을 적용한 뉴스 데이터에서의 사건 네트워크 구축 (Construction of Event Networks from Large News Data Using Text Mining Techniques)

  • 이민철;김혜진
    • 지능정보연구
    • /
    • 제24권1호
    • /
    • pp.183-203
    • /
    • 2018
  • 전통적으로 신문 매체는 국내외에서 발생하는 사건들을 살피는 데에 가장 적합한 매체이다. 최근에는 정보통신 기술의 발달로 온라인 뉴스 매체가 다양하게 등장하면서 주변에서 일어나는 사건들에 대한 보도가 크게 증가하였고, 이것은 독자들에게 많은 양의 정보를 보다 빠르고 편리하게 접할 기회를 제공함과 동시에 감당할 수 없는 많은 양의 정보소비라는 문제점도 제공하고 있다. 본 연구에서는 방대한 양의 뉴스기사로부터 데이터를 추출하여 주요 사건을 감지하고, 사건들 간의 관련성을 판단하여 사건 네트워크를 구축함으로써 독자들에게 현시적이고 요약적인 사건정보를 제공하는 기법을 제안하는 것을 목적으로 한다. 이를 위해 2016년 3월에서 2017년 3월까지의 한국 정치 및 사회 기사를 수집하였고, 전처리과정에서 NPMI와 Word2Vec 기법을 활용하여 고유명사 및 합성명사와 이형동의어 추출의 정확성을 높였다. 그리고 LDA 토픽 모델링을 실시하여 날짜별로 주제 분포를 계산하고 주제 분포의 최고점을 찾아 사건을 탐지하는 데 사용하였다. 또한 사건 네트워크를 구축하기 위해 탐지된 사건들 간의 관련성을 측정을 위하여 두 사건이 같은 뉴스 기사에 동시에 등장할수록 서로 더 연관이 있을 것이라는 가정을 바탕으로 코사인 유사도를 확장하여 관련성 점수를 계산하는데 사용하였다. 최종적으로 각 사건은 각의 정점으로, 그리고 사건 간의 관련성 점수는 정점들을 잇는 간선으로 설정하여 사건 네트워크를 구축하였다. 본 연구에서 제시한 사건 네트워크는 1년간 한국에서 발생했던 정치 및 사회 분야의 주요 사건들이 시간 순으로 정렬되었고, 이와 동시에 특정 사건이 어떤 사건과 관련이 있는지 파악하는데 도움을 주었다. 또한 일련의 사건들의 시발점이 되는 사건이 무엇이었는가도 확인이 가능하였다. 본 연구는 텍스트 전처리 과정에서 다양한 텍스트 마이닝 기법과 새로이 주목받고 있는 Word2vec 기법을 적용하여 봄으로써 기존의 한글 텍스트 분석에서 어려움을 겪고 있었던 고유명사 및 합성명사 추출과 이형동의어의 정확도를 높였다는 것에서 학문적 의의를 찾을 수 있다. 그리고, LDA 토픽 모델링을 활용하기에 방대한 양의 데이터를 쉽게 분석 가능하다는 것과 기존의 사건 탐지에서는 파악하기 어려웠던 사건 간 관련성을 주제 동시출현을 통해 파악할 수 있다는 점에서 기존의 사건 탐지 방법과 차별화된다.

전시장 참관객의 계획되지 않은 방문행동에 있어서 부스추천시스템의 영향에 대한 연구 (A Study on the Effect of Booth Recommendation System on Exhibition Visitors Unplanned Visit Behavior)

  • 정남호;김재경
    • 지능정보연구
    • /
    • 제17권4호
    • /
    • pp.175-191
    • /
    • 2011
  • 국가신성장동력으로MICE(Meeting, Incentive travel, Convention, Exhibition) 산업이각광받으면서국내전시산업에 대한 관심이 드높아 지고 있다. 이에 따라 국내 전시산업(domestic exhibition industry)도 미국이나 유럽과 같이 전시성과를 향상시키기 위한 다양한 연구가 진행 중이다. 그 중에서도 전시환경이나 전시기법 등에 따라 관람효과가 다르기 때문에 지능형 정보기술을 이용하여 전시장에 방문한 참관객의 참관패턴을 분석하여 참관객을 이해하고 더 나아가 참여업체 간의 연관관계 도출 및 전시회의 성과를 높이고자 하는 연구들이 진행되고 있다. 그런데, 이러한 기존의 부스추천시스템과 관련된 연구를 살펴보면 시스템적인 관점에서 추천의 정확성만을 논하고 있을 뿐 추천을 통한 참관객의 행동이나 인식의 변화에 대해서는 충분히 논의하고 있지 못하다. 부스추천시스템(Booth Recommendation System)은 참관객의 부스방문 정보를 바탕으로 참관객에게 적절한 부스를 추천하기 때문에 참관객은 사전에 계획하지 않은 전시장을 방문하게 될 수 있다. 이 때 참관객은 계획하지 않은 방문행동을 통해서 만족할 수도 있지만 추천과 정이 번거롭다거나 자유롭게 참관을 하는데 방해가 된다고 생각할 수 있다. 이 경우 참관객의 자유로운 관람보다 오히려 더 좋지 않은 성과를 낼 수 있다. 따라서 부스 추천시스템을 전시장에 적용하기 위해서는 시스템의 성과에 미치는 영향요인이 무엇인지 전반적으로 검토하고, 부스추천시스템이 참관객의 계획되지 않은 방문행동에 미치는 영향에 대해 면밀히 검토해야 한다. 이에 본 연구에서는 부스추천시스템의 성과에 영향을 미치는 요인이 무엇인지 이론과 기존문헌을 통해 살펴보고자 하였다. 또한, 참관객의 지각된 부스추천시스템의 성과가 참관객의 계획되지 않은 행동에 대한 만족도와 부스추천시스템의 재사용의도에 어떤 영향을 미치는지 살펴보고자 하였다. 이러한 연구목적을 달성하기 위한 이론적 프레임워크로 본 연구는 계획되지 않은 행동이론(Unplanned Behavior Theory)을 도입하였다. 계획되지 않은 행동(unplanned behavior)이란 "소비자들이 사전에 계획하지 되지 않은 채 실행된 어떤 행동"으로 정의할 수 있다. 소비자들의 계획되지 않은 행동은 그 동안 마케팅 등 다양한 분야에서 연구되어 왔다. 특히, 마케팅에서는 계획되지 않은 행동 중 계획되지 않은 구매(unplanned purchasing)에 많은 관심을 두어 왔는데 이 개념은 종종 충동적 구매(impulsive purchasing)와 혼동되어 사용되곤 하였다. 그런데, 충동적 구매가 갑자기 무엇인가 구매를 해야하는 강하고 지속적인 충동(urge)이라고 본다면 계획되지 않은 구매는 구매의사결정의 시점이 상점에 들어가기 전이 아닌 상점 내에서 수행된다는 점이 다르다. 즉, 모든 충동적 구매는 비계획적이나, 모든 계획되지 않은 구매가 충동적인 구매는 아니다. 그런데, 왜 소비자들은 계획되지 않은 행동을 하는가? 이에 대해서는 학자들에 따라 여러 가지 의견이 있으나 소비자가 사전에 철저한 계획을 수립하지 않고 따라서 중간에 계획을 변화시킬만한 유연성(flexibility)이 있기 때문이라는 점에 일관된 의견을 보인다. 즉, 계획되지 않은 행동을 하는데 많은 비용이 소요된다면 소비자들은 사전에 수립한 계획을 변경하기 어렵게 될 것이기 때문이다. 본 연구에서 살펴보고자 하는 전시장 역시 참관객들은 방문하기 전에 전시장이 어떤 프로그램으로 구성되어 있는지 살펴보고, 어떤 부스를 방문할지를 사전에 계획하게 된다. 그 이유는 참관객들이 전시장 방문에 투입할 수 있는 시간은 한정되어 있는 반면에 전시회는 대규모의 다양한 부스로 운영되기 때문에 참관객들이 모든 부스를 참관한다는 것이 현실적으로 불가능하기 때문이다. 따라서 본 연구에서 제시하는 부스추천시스템이 참관객이 선호할 만한 부스를 추천하게 되면 참관객은 자신의 계획을 변화시켜서 부스추천시스템이 추천한 부스를 방문하게 된다. 이러한 방문행동은 소비자가 상점을 방문하거나, 관광객이 관광지에서 계획하지 않은 행동을 하는 것과 유사한 측면에서 이해가 가능하며 특히 최근 여행소비자들이 정보기기의 영향으로 계획되지 않은 행동을 하는 경우가 부쩍 증가한 추세와 동일한 맥락에서 이해가 가능하다. 이에 다음과 같은 연구모형을 설정하였다. 이 연구모형은 참관객이 지각한 부스추천시스템의 성과(performance)를 매개변수로 하고 있는데 이 성과에 영향을 미치는 요인으로 부스추천시스템에 대한 신뢰(trust), 전시장 참관객의 지식수준 (knowledge level), 부스 추천시스템의 기대된 개인화 (expected personalization) 그리고 부스추천시스템의 자유위협(threat to freedom)을 영향요인으로 파악하였다. 또한, 지각된 부스추천시스템 성과와 계획되지 않은 행동에 대한 참관객의 만족도와 향후 부스추천시스템의 재사용의도간의 인과관계도 파악하고자 하였다. 이 때 부스추천시스템에대한신뢰는권한(competence), 자선(benevolence), 그리고진실(integrity)의2차요인(2nd order factor)으로구성하고, 나머지 요인들은 1차 요인으로 구성하였다. 이를 검증하기 위해 2011 DMC Culture Open 행사에서 부스추천시스템을 테스트하기 위하여 시스템을 개발하고, 101명의 참관객을 대상으로 실증조사를 하여 분석하였다. 분석결과 첫째, 부스추천시스템에 있어서 참관객의 신뢰가 가장 중요한 요소이며 실제 해당 부스추천시스템을 이용한 참관객들은 신뢰를 통해 부스추천시스템이 성과 있다고 인식하였다. 둘째, 참관객의 지식수준 역시 부스추천시스템의 성과에 유의한 영향을 미쳤는데 이는 추천의 성과가 전시장에 대한 사전적 이해가 필요함을 의미한다. 즉, 전시장에 대한 이해가 높은 참관객이 부스추천시스템의 유용성을 더 잘 파악하는 것으로 나타났다. 셋째, 기대된 개인화 수준은 성과에 유의한 영향을 미치지 못했는데 이는 기존 연구와 다른 결과로 본 연구에 사용된 부스추천시스템이 충분히 개인화 서비스를 제공하지 못했기 때문이라고 판단된다. 넷째, 부스추천시스템의 추천정보는 개인의 자유를 위협하거나 제한한다고 느끼지 않음으로 충분히 유용한 가치를 갖는다고 할 수 있다. 끝으로 부스정보시스템의 높은 성과는 참관객들의 계획되지 않은 행동에 대한 높은 만족도와 향후에도 부스추천시스템을 재사용할 의도를 만드는 것으로 나타났다. 이와 같이 본 연구는 부스추천시스템이 야기하는 참관객의 계획되지 않은 부스방문행동에 미치는 영향력을 분석하기 위해 계획되지 않은 행동이론을 중심으로 실증자료를 이용하여 분석하고, 이를 통해 향후 부스추천시스템의 구축 및 설계에 유용한 시사점을 도출할 수 있었다. 향후에는 보다 정교한 설문구성과 측정대상을 이용하여 추가적인 검토가 필요할 것으로 기대된다.