• 제목/요약/키워드: clustering modeling

검색결과 257건 처리시간 0.024초

사회연결망분석과 인공신경망을 이용한 추천시스템 성능 예측 (Predicting the Performance of Recommender Systems through Social Network Analysis and Artificial Neural Network)

  • 조윤호;김인환
    • 지능정보연구
    • /
    • 제16권4호
    • /
    • pp.159-172
    • /
    • 2010
  • 협업필터링 추천은 다양한 분야에서 활용되고 있지만 트랜잭션 데이터의 성격에 따라 추천 성능에 현저한 차이를 보이고 있다. 기존 연구에서는 이러한 추천 성능의 차이가 나타나는 이유에 대한 설명을 구체적으로 제시하지 못하고 있고 이에 따라 추천 성능의 예측 또한 연구된 바가 없다. 본 연구는 사회네트워크분석과 인공신경망 모형을 이용하여 협업필터링 추천시스템의 성능을 예측하고자 한다. 본 연구의 목적을 달성하기 위해 국내 백화점의 트랜잭션 데이터를 기반으로 형성되는 고객간 사회 네트워크의 구조적 지표를 측정한 후 이를 기반으로 인공신경망 모형을 구축하고 검증한다. 본 연구는 협업필터링 추천 성능을 예측할 수 있는 새로운 모형을 제시하였다는 점에서 그 의의가 있으며 이를 통해 기업들의 협업필터링 추천시스템 도입에 대한 의사결정에 도움을 줄 수 있을 것으로 기대된다.

MANET에서 장치의 이동성을 고려한 클러스터 기반 P2P 알고리즘 (Cluster-based P2P scheme considering node mobility in MANET)

  • 우혁;이동준
    • 한국항행학회논문지
    • /
    • 제15권6호
    • /
    • pp.1015-1024
    • /
    • 2011
  • 최근 애드혹 네트워크에서의 모바일 P2P에 대한 관심이 높아지고 있다. 비록 유선 네트워크에서 P2P 알고리즘에 대한 많은 연구가 있었지만, 기존 P2P 프로토콜들은 장치의 이동성을 고려하지 않아 모바일 애드혹 네트워크(MANET, Mobile Ad-hoc Network)에 적합하지 않다. 본 연구에서는 애드혹 네트워크에서 장치의 이동성을 고려하여 클러스터 기반의 새로운 P2P 프로토콜을 제안한다. 기존의 클러스터 기반의 P2P 알고리즘에서 각 클러스터는 슈퍼피어와 슈퍼피어에 자신이 갖고 있는 파일 목록을 등록한 피어들로 구성된다. 이동성이 높은 피어들은 클러스터 간에 자주 핸드오프가 발생하고, 이로 인하여 슈퍼피어에 파일 목록을 등록하기 위한 트래픽이 많이 발생한다. 제안하는 알고리즘에서 이동성이 낮은 피어들은 기존의 클러스터 기반 P2P의 피어들과 동일하게 동작하고, 이동성이 높은 피어들은 다르게 동작한다. 즉 이동성이 높은 피어들은 새로운 클러스터에 참여시, 자신의 존재를 슈퍼피어에게 알리지만 파일 목록을 등록하지는 않으며 파일을 찾고자 할 때 우선 슈퍼피어에 등록된 파일 목록을 검색하고 만약 찾지 못하였을 경우 검색 메시지를 클러스터 내에 전파(broadcast)한다. 본 논문에서 제안 알고리즘을 수학적으로 모델링하고 P2P 트래픽과 라우팅 트래픽에 대한 분석과 최적화를 수행하였고 수학적 모델링 결과에서 제안 알고리즘의 성능이 기존의 클러스터 기반 P2P 알고리즘과 Gnutella 알고리즘에 비해 비슷하거나 더 좋음을 보였다.

주택가격이 센서스에 기반한 박탈지수의 대안이 될 수 있는가?: 다수준 모델에 기반한 평가 (Can Housing Prices Be an Alternative to a Census-based Deprivation Index? An Evaluation Based on Multilevel Modeling)

  • 손철;나카야 토모키
    • 지적과 국토정보
    • /
    • 제48권2호
    • /
    • pp.197-211
    • /
    • 2018
  • 본 연구에서는 건강에 대한 공간적 연구에서 통상적으로 사용되는 센서스에 기반한 지역 박탈지수의 대안으로 지역 주택가격이 사용될 수 있는지 평가하였다. 평가를 위해 개인을 1수준으로, 수도권의 보건소 구역을 2수준으로 하는 다수준 로지스틱 모델이 추정되었다. 다수준 모델에는 개인의 점심식사후 칫솔질과 치간실 사용을 설명하기 위한 개인수준의 변수들과 보건소 구역을 대표하는 사회적 박탈지수 및 지역주택가격 수준이 포함되었다. 추정된 모델들의 설명력은 Akaike Information Criterion (AIC)와 Bayesian Information Criterion (BIC)를 이용하여 평가되었다. 모델의 추정결과는 사회적 박탈지수 및 지역 주택가격이 모두 개인의 치아관리 행동을 설명하는 데 기여하나 지역 주택가격을 사용한 모델의 AIC 및 BIC가 통상적인 센서스 기반 지역 박탈지수를 사용한 경우 보다 낮은 것을 보여 주었다. 본 연구결과는 센서스에 기반한 박탈지수를 생성하는 데 사용된 센서스 변수가 시점의 차이 등의 이유로 적절하지 않을 경우 지역 주택가격이 지역의 사회경제적 수준을 대표하기 위해 대안적으로 사용될 수 있음을 보여준다.

점진적 기계학습 기반의 레이더 위협체 역추정 모델 생성 및 갱신 (Managing the Reverse Extrapolation Model of Radar Threats Based Upon an Incremental Machine Learning Technique)

  • 김철표;노상욱
    • 한국차세대컴퓨팅학회논문지
    • /
    • 제13권4호
    • /
    • pp.29-39
    • /
    • 2017
  • 다양한 전자전 상황에서 단위 위협체에 대하여 전자전 모델링과 시뮬레이션을 수행할 수 있는 통합 전자전 시뮬레이터의 개발 필요성이 대두되고 있다. 본 논문에서는 전자전 상황에서 전자정보 수집신호의 변수를 기반으로 전자파 신호를 발산하는 레이더 위협을 역추정하기 위한 시뮬레이션 시스템의 구성요소를 분석하고, 역추정 모델을 점진적으로 유지할 수 있는 방법을 제안한다. 또한, 실험을 통하여 점진적 역추정 모델 갱신 기법의 유효성 및 개별 역추정 결과의 통합 기법을 평가한다. 개별 역추정 모델의 생성을 위하여 의사결정트리, 베이지안 분류기, 인공신경망 및 유클리디안 거리 측정방식과 코사인 유사도 측정방식을 활용하는 군집화 알고리즘을 이용하였다. 첫 번째 실험에서 레이더 위협체에 대한 역추정 모델을 구축하기 위한 위협 예제의 크기를 점진적으로 증가시키면 역추정 모델의 정확도는 향상되었으며, 이러한 과정이 반복되면 역추정 모델에 대한 정확도는 일정한 값으로 수렴하였다. 두 번째 실험에서는 개별 역추정 모델의 결과를 통합하기 위하여 투표, 가중투표 및 뎀스터-쉐이퍼 알고리즘을 이용하였으며, 역추정 모델의 통합 결과는 뎀스터-쉐이퍼 알고리즘에 의한 역추정 정확도가 가장 좋은 성능을 보였다.

감염병 확산에 따른 레스토랑 선택속성 변화 분석: 텍스트마이닝 기법 적용 (Analysis of Changes in Restaurant Attributes According to the Spread of Infectious Diseases: Application of Text Mining Techniques)

  • 유준일;이은지;구철모
    • 경영정보학연구
    • /
    • 제25권4호
    • /
    • pp.89-112
    • /
    • 2023
  • 2020년 3월, 코로나바이러스 팬데믹으로 선포되면서, 다양한 방역 조치가 취해져 왔다. 이에 따라, 관광 및 환대 산업 내의 많은 변화들이 야기되었다. 특히 레스토랑 산업에서는 비대면 서비스 및 좌석 간 거리두기 등 방역 지침이 시행되었다. 전통적으로 레스토랑 선택속성에 대한 연구는 분위기, 서비스 품질, 음식의 품질을 포함한 3가지 속성의 중요성이 강조해 온 데 반해, 코로나19 이후 레스토랑 이용자를 대상으로 레스토랑 선택속성을 탐색한 연구는 미비한 실정이다. 이에 따라, 본 연구에서는 코로나19라는 환대 산업 내의 환경적 변화에 대한 이해에 기반하여, 국내 온라인 리뷰 데이터 상에서 새로운 레스토랑 경험적 속성을 확인하기 위한 탐색적인 접근을 시도하였다. 본 연구는 서울 을지로 지역에 위치한 일반음식점 및 휴게음식점 475개로 네이버 플레이스에 등록된 총 31,115개의 온라인 리뷰를 분석 단위로 고려하였다. 분석 방법은 단어 빈도와 역문서 빈도의 곱으로 산출된 TF-IDF와 잠재적 토픽들을 추출하는 확률적 모델 알고리즘인 LDA 토픽모델링 기법을 통해 온라인 리뷰 내에서 단어들의 군집화를 통해 레스토랑 선택속성을 재분류하고자 하였다. 분석 결과, 분위기, 서비스 품질, 음식 품질과 함께 코로나19 이후 레스토랑의 새로운 속성으로 "감염병 예방"요인이 도출되었다. 본 연구는 기존 레스토랑 선택속성에서 제시하는 세 가지 속성들을 범주화하고, 나아가 새로운 속성을 제시하였다는 점에서 기존 레스토랑 선택속성 문헌을 확장하여 학술적 의의가 있다. 나아가, 분석 결과에 기반하여 레스토랑 운영의 측면 및 정책적 관점에서의 실무적 제언을 시도하였다.

머신러닝을 이용한 오디오북 플랫폼 기반의 웹케어 모형 구축에 관한 연구 (A Study on Developing a Web Care Model for Audiobook Platforms Using Machine Learning)

  • 정다훈;이민혁;이태원
    • 경영정보학연구
    • /
    • 제26권1호
    • /
    • pp.337-353
    • /
    • 2024
  • 본 연구는 소비자 리뷰와 관리자 답변 간의 관계를 조사하여 소비자 리뷰를 효율적으로 관리하기 위한 웹케어의 필요성을 탐색하는데 목적이 있다. 효과적인 웹케어를 위한 방법론을 제안하고 오디오북 플랫폼 기반의 머신러닝을 이용한 웹케어 모형을 구축하고자 한다. 본 연구에서는 오디오북 플랫폼 4개를 선정하여 소비자 리뷰와 관리자 답변에 대한 데이터 수집 및 전처리 과정을 거쳐 토픽모델링, 주제불일치성, DBSCAN을 활용하고, 다양한 머신러닝 기법을 적용하여 분석을 시행하였다. 실험 결과 관리자 답변의 군집화 및 소비자 리뷰에 대한 답변 예측에서 유의미한 결과를 도출하였으며, 자원의 제한과 비용을 고려한 효율적인 방법론을 제안하였다. 본 연구는 머신러닝을 통해 웹케어 모형을 구축했다는 점에서 학술적인 시사점을 제공하며, 기업의 제한된 비용과 인력을 고려하여 웹케어 모형이라는 효율적인 방법론을 제시함으로써 실무적인 시사점을 지닌다. 본 연구에서 제안된 웹케어 모델은 개별화된 답변과 표준화된 관리자 답변을 제공하여 소비자 참여 및 유용한 정보 제공을 위한 전략적인 기초 자료로 활용될 수 있을 것이다.

데이터 마이닝의 범죄수사 적용 가능성 (Usefulness of Data Mining in Criminal Investigation)

  • 김준우;손중권;이상한
    • 대한수사과학회지
    • /
    • 제1권2호
    • /
    • pp.5-19
    • /
    • 2006
  • 데이터 마이닝은 컴퓨터와 정보처리의 발전으로 각기 다른 차원에서 다량으로 수집되는 데이터 속에서 숨은 의미나 패턴을 발견하는 유용한 기법이다. 의사결정나무, 신경망 모형, 규칙 귀납, K-평균 군집화, 시각화 등의 데이터 마이닝 개별 기법들은 산재해 있는 데이터에서 연관성을 분석하고, 이를 분류함으로써 일반화된 개념을 정의하고, 새로운 지식을 추론함으로써 실제 생활에 적용 가능한 예측을 가능하게 한다. 따라서 현재 데이터 마이닝은 기업의 마케팅 분야, 금융기관의 고객 분석, 통신 회사의 고객 이탈 방지 등에서 유용하게 활용되고 있다. 우리가 접해야 하는 정보의 양이 늘어나는 것은 범죄 수사에 있어서도 마찬가지 현상이다. 범죄와 범죄자에 대한 데이터는 축적되어 가지만 정작 개별 사안에 있어서는 중요한 데이터가 접근조차 되지 않고 있으며, 많은 데이터 속에서 이것이 내포하고 있는 숨은 의미를 지나치게 되는 경우도 많다. 본 연구에서는 선행 연구와 사례 적용을 통해 데이터 마이닝의 범죄 수사 적용 가능성과 한계점을 살펴보고자 하였다. 미제 사건으로 남는 경우가 많은 절도나 사기 같은 습관적 상습 범죄의 경우 데이터 마이닝의 분류, 군집화 기능을 활용 한다면 향후 여죄 추적에 효율적으로 활용될 수 있음을 파악할 수 있었고, 특히 다양한 문제에 적용 가능하고, 잡음에 대한 견고성이 있음에도 예측의 정확성을 지니고 있는 신경망 모형의 경우 패턴 인식을 통하여 범죄자 프로파일링이나 화상 자료 대비 시스템 구축에 충분히 활용될 것으로 생각한다. 특히 보험 사기 사례 적용에서 살펴본 바와 같이 마약, 테러와 같은 조직적 범죄수사나 자금세탁과 같은 금융 추적 수사의 경우 해당 자료의 방대함과 모호성으로 인해 수사를 하는 데 많은 어려움이 있지만 이러한 데이터 마이닝 가시화 기법을 적절히 활용한다면 전체적인 윤곽을 파악하는 데 매우 유용하며, 효율적인 수사가 가능함을 확인할 수 있었다. 그러나 데이터 마이닝은 예측 모델이므로 오류를 내재하고 있다는 점에서 수사 기관의 데이터 마이닝 접근은 조심스러워야 하며, 정보 독점화 현상과 개인 사생활 보호라는 측면에서 각 수사기관은 해당 법률에 정한 범위 내에서 해당 사건별로 데이터를 수집하고 이를 통합, 재구성하여 활용하는 측면으로 적용되어야 할 것이다. 또한 각 수사기관별로는 자신의 보유하고 있는 데이터에 대해 다차원 처리가 가능하도록 데이터베이스 시스템을 구축하여 데이터 마이닝이 적용 가능한 환경을 구축하도록 하여야 할 것이다. 아직은 논의의 초기 단계이므로 효과가 크게 부각되지는 않았지만 지금까지 제시한 문제에 대한 연구가 계속 이루어진다면 인권중심, 증거중심의 수사 개념을 바탕으로 적법절차에 의한 수사 활동을 요구받는 시대에 새로운 대안으로 자리 잡을 것이며, 수사의 과학화에 기여할 것으로 전망한다.

  • PDF