• 제목/요약/키워드: 데이터 분석론

검색결과 1,383건 처리시간 0.029초

대규모 로그를 사용한 유저 행동모델 분석 방법론 (The Analysis Framework for User Behavior Model using Massive Transaction Log Data)

  • 이종서;김성국
    • 한국빅데이터학회지
    • /
    • 제1권2호
    • /
    • pp.1-8
    • /
    • 2016
  • 사용자로그는 많은 숨겨진 정보를 포함하고 있지만 데이터 정형화가 이루어지지 않았고, 데이터 크기도 너무 방대하여 처리하기 까다로워서 아직 밝혀져야 할 부분들을 많이 내포하고 있다. 특히 행동마다의 모든 시간정보를 포함하고 있어서 이를 응용하여 많은 부분을 밝혀낼 수 있다. 하지만 로그데이터 자체를 바로 분석으로 사용할 수는 없다. 유저 행동 모델 분석을 위해서는 별도의 프레임워크를 통한 변환과정들이 필요하다. 이 때문에 유저 행동모델 분석 프레임워크를 먼저 파악을 하고 데이터에 접근해야 한다. 이 논문에서는, 우리는 유저 행동모델을 효과적으로 분석하기 위한 프레임워크 모델을 제안한다. 본 모델은 대규모 데이터를 빨리 처리하기 위한 분산환경에서의 MapReduce 프로세스와 유저별 행동분석을 위한 데이터 구조 설계에 대한 부분을 포함한다. 또한 실제 온라인 서비스 로그의 구조를 바탕으로 어떤 방식으로 MapReduce를 처리하고 어떤 방식으로 유저행동모델을 분석을 위해 데이터 구조를 어떤식으로 변형할지 설명하고, 이를 통해 어떤 방식의 모델 분석으로 이어질지에 대해 상세히 설명한다. 이를 통해 대규모 로그 처리방법과 분석모델 설계에 대한 기초를 다질 수 있을 것이다.

  • PDF

조영증강 초음파 동영상에서 병변 탐색을 위한 ROI 추출기법 (ROI Extraction Method for Lesion Detection in Contrast-Enhanced Ultrasonography)

  • 곽성훈;강지현;이혜민;김호준
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2013년도 추계학술발표대회
    • /
    • pp.1312-1314
    • /
    • 2013
  • 본 연구에서는 조영증강 의료 초음파 영상에서 효과적인 병변 탐색을 위한 방법론을 고찰한다. 병변 영상을 포함하는 ROI 추출을 위하여 조영효과의 전이 형태에 대한 단계 분할 기법과 동적 프로젝션 데이터의 분석 기법을 제안한다. 프레임간 유사도 척도의 분석을 통하여 비정상 프레임을 제거한 후 조영제의 도달시간(AT: Arrival Time)과 확산구간을 추출하여 탐색 대상 데이터의 양을 감소시킨다. 대상구간에서 초음파 영상의 수평방향 및 수직방향 프로젝션 데이터에 대한 동적 특성을 분석함으로써 후보영역을 추출하며 마이크로 버블의 추출, 조영효과의 증가속도 및 비율 등의 요소를 고려하여 ROI 를 선별하고 그 형태를 재조정한다. 부수적으로, 대상영역에서의 각 픽셀정보에 대하여 명도변화곡선(TIC) 특성분석을 통하여 영상을 재구성하고 병변영상의 형태와 윤곽선을 추출하게 된다.

텍스트 마이닝 기반의 이슈 관련 R&D 키워드 패키징 방법론 (Methodology for Issue-related R&D Keywords Packaging Using Text Mining)

  • 현윤진;윌리엄;김남규
    • 인터넷정보학회논문지
    • /
    • 제16권2호
    • /
    • pp.57-66
    • /
    • 2015
  • 빅데이터 기술에 대한 관심이 급증함에 따라, 소셜 미디어를 통해 유통되는 방대한 양의 비정형 데이터를 분석하고자 하는 시도가 활발히 이루어지고 있다. 이에 따라서 텍스트 형태의 비정형 데이터 분석을 통해 의미 있는 정보를 찾고자 하는 시도가 비즈니스 영역뿐 아니라, 정치, 경제, 문화 등 다양한 영역에서 이루어지고 있다. 특히 최근에는 여러 현안 및 이슈들을 발굴하여 이를 의사결정에 활용하고자 하는 시도가 활발히 이루어지고 있다. 이처럼 빅데이터 분석을 통해 국가현안이나 이슈를 발굴하고자 하는 시도가 꾸준히 이루어져왔음에도 불구하고, 국가현안 및 이슈로부터 이와 관련된 R&D 문서를 효율적으로 제공하는 방안은 마련되지 않고있다. 이는 사용자들이 인식하는 현안 키워드와 실제 사용되는 R&D 키워드 사이의 이질성이 존재하기 때문이다. 따라서 현안 및 R&D키워드간의 이질성을 극복하기 위한 중간 장치가 필요하며, 이 중간 장치를 통해 각 현안 키워드와 R&D 키워드간에 적절한 대응이 이루어져야 한다. 이를 위해 본 연구에서는 (1) 현안 키워드 추출을 위한 하이브리드 방법론, (2) 현안 대응 R&D 정보 패키징 방법론, 그리고 (3) R&D 관점에서의 연관 현안 네트워크 구축 방법론의 총 세 가지 방법론을 제안한다. 제안하는 방법론은 텍스트 마이닝, 소셜네트워크 분석, 그리고 연관 규칙 마이닝 등의 데이터 분석 기법들을 활용하여 수행하였으며, 그 결과, (1)에 의한 키워드 보강률은 42.8%로 나타났으며, (2)의 경우, 현안 키워드와 R&D 키워드간 다수의 연관 규칙이 나타났다. (3)의 경우는 현재 진행 중에 있으며, 향후 가시적 성과를 낼 수 있을 것으로 예상된다.

고객 구매행태의 지속적 변화 파악을 위한 재귀적 변화발견 방법 (A Recursive Procedure for Mining Continuous Change of Customer Purchase Behavior)

  • 김재경;채경희;최주철;송희석;조영빈
    • 경영정보학연구
    • /
    • 제8권2호
    • /
    • pp.119-138
    • /
    • 2006
  • 데이터 마이닝의 연관성규칙 분석 기법(Association Rule Mining)은 현실문제에의 많은 활용에도 불구하고 시간의 흐름에 대한 변화 파악 및 분석에서는 한계를 가지고 있다. 본 연구에서는 기존의 두 시점에서의 고객 행위 변화 파악 기법을 재귀적 방법을 통하여 다시점으로 확장하여 분석할 수 있는 방법론을 제시한다. 즉, 본 연구에서는 연관성규칙의 패턴 및 변화의 추세를 장기간에 걸쳐 지속적으로 관찰함으로써, 고객의 일시적인 변화보다는 지속적인 행위 변화를 관찰할 수 있도록 하는 방법론을 구성한다. 방법론을 검증하기 위해 L백화점의 4년간의 구매관련 데이터를 분석하여 그 결과를 제시하고 있다.

트래픽 수집지점에서 발생하는 TCP패킷중복 및 역전문제 해결 방법 (A Method to Resolve TCP Packet Out-of-order and Retransmission Problem at the Traffic Collection Point)

  • 이수강;안현민;김명섭
    • 한국통신학회논문지
    • /
    • 제39B권6호
    • /
    • pp.350-359
    • /
    • 2014
  • 최근 급격한 인터넷의 발전으로 효율적인 네트워크관리를 위해 응용 트래픽 데이터 분석의 중요성이 강조되고 있다. 네트워크 관리를 위해 관리자는 트래픽 데이터를 각각 어떠한 응용에서 발생 하였는지 탐지할 수 있어야 한다. 응용을 탐지하기 위한 방법들 중 하나인 통계정보 트래픽 분류방법을 사용하여 트래픽을 분류할 수 있지만, 이러한 통계정보를 그대로 사용하여 분류하기에는 트래픽 수집지점에서 발생하는 패킷 역전, 재전송에 의한 패킷 중복과 같은 문제점들이 있다. 본 논문에서는 응용에서 발생된 트래픽의 탐지 및 분석률 향상을 위해 패킷 역전 문제와 재전송에 의한 패킷 중복 문제를 탐지하고 개선하는 방법론을 제안하였다. 이렇게 제안한 개선 방법론을 실제 트래픽 분석 시스템에 적용시킴으로써 응용별 바이트 기준 최대 4%의 탐지 및 분석률 향상을 보였다. 이는 제안한 방법론이 실제 트래픽 망에 부담을 줄 수 있는 heavy 플로우의 분석에 기여함을 확인하였다.

국내 케이블 방송 사업자들의 빅데이터 활용 방안 및 고려 사항 (Big-data Utilization and Considerations of Local cable TV operators)

  • 정원구
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2014년도 추계학술대회
    • /
    • pp.59-62
    • /
    • 2014
  • 다양한 센서를 내장한 스마트기기가 보급되면서 개인의 활동부터 환경 상태까지 광범위한 미시 데이터의 수집이 가능해졌고, 또한 데이터 저장매체의 가격과 통신비용이 급격히 하락하고 있으며, 컴퓨터의 연산능력과 데이터 분석 방법론도 눈부시게 성장하는 중이다. 이러한 데이터 처리 기술의 발전과 함께 빅데이터에 대한 사회적 인식의 제고가 맞물리며 빅데이터 시장이 빠르게 성숙하고 있다. 이에 따라 국내 외 대다수의 기업들이 빅데이터 기술을 도입 검토 중에 있으며, 특히 글로벌 콘텐츠(방송, 음악, 도서 등) 기업들의 맞춤형 추천 서비스 성공 사례들로 인해 빅데이터 기술이 콘텐츠 산업 업계의 차세대 먹거리로 주목을 받고 있다. 이에 본 논문은 국내 케이블 방송 사업자들이 빅데이터 기술을 접목한 차별화된 서비스 제공을 통해 고객에게 새롭고 차별화된 가치를 제공할 수 있는 서비스 방안에 대해서 연구하였다.

  • PDF

격자 기반의 통계정보 표현을 위한 데이터 변환 방법 (A Data Transformation Method for Visualizing the Statistical Information based on the Grid)

  • 김문수;이지영
    • Spatial Information Research
    • /
    • 제23권5호
    • /
    • pp.31-40
    • /
    • 2015
  • 본 논문에서는 다양한 형태로 존재하는 통계정보를 일정한 모양과 크기를 갖는 격자로 표현하기 위해 필요한 데이터 변환 방법론에 대하여 제시한다. 격자는 기존 통계지도 서비스에서 활용하고 있는 통계공간단위인 행정구역과 집계구와 비교하였을 때 모양과 크기가 일정하여 통계정보를 객관적으로 파악할 수 있게 하며, 지도 축척 변화에 유연하게 적용될 수 있는 특징이 있다. 한편, 기존 통계지도 서비스에서는 면 보간법을 활용하여 통계공간단위로 변환하고 있는데, 이것을 다양한 형태로 존재하는 통계정보에 적용시키기 위해서는 추가적인 프로세스가 필요하다. 이에 따라, 본 논문에서는 다양한 형태로 존재하는 통계정보의 격자 변환을 위해 1)지오코딩을 통한 공간데이터로의 변환, 2)공간 관계 정의를 통한 위치정보 변환, 3)데이터 척도를 고려한 속성정보 변환을 수행하는 방법론을 정리하였다. 제시한 방법론은 서울시 A지역의 인구 밀도 통계정보를 격자로 변환하기 위해 적용하였다. 특히, 동일한 통계정보를 표현하는 참조데이터가 서로 다르더라도 유사한 격자 표현이 가능해야 함을 검증하기 위해 공간 자기상관성을 통해 분석하였다. 그 결과, 집계구와 건물을 통해 표현되는 인구 밀도를 각각 격자로 변환하였을 때, 두 데이터 모두 유사한 격자 분포를 표현함을 파악할 수 있었다. 이러한 결과를 통해 본 연구에서 제안하는 방법론은 일관된 결과를 표현할 수 있음을 확인하였다.

지식재산 정보를 이용한 전술데이터링크 기술동향 분석방법 연구 (A Study on the Analysis Method of Technology Trend on Tactical Data Link Using Intellectual Property Information)

  • 노기섭
    • 문화기술의 융합
    • /
    • 제7권1호
    • /
    • pp.539-544
    • /
    • 2021
  • 전술데이터링크는 전장상황 인식 능력을 향상하기 위한 군용 데이터 네트워크이다. 한국군은 전술데이터링크 성능개량상업을 추진하고 있다. 전술데이터링크는 다양한 플랫폼, 센서 데이터 및 지휘통제 체계와의 연동이 필수적이므로 연관 기술분야에 대한 연구가 필요하다. 그러나 전술데이터링크는 군 운영 특성상 다양한 기술정보가 공개되지 않고 있다. 본 논문에서는 전술데이터링크의 기술동향을 파악하기 위하여 지식재산 정보를 활용한 데이터기반 자동화 분석 방법론을 제안한다. 본 논문에서는 지식재산 관련 데이터를 자동으로 수집하고 전처리하며, 시계열에 따라 분석한다. 추가적으로 특허 기술정보의 기관별 현황을 종합하고 핵심 연구자를 네트워크 분석을 통한 식별 과정을 제시하고 각각의 결과를 제시하였다.

Co-word분석법을이용한기업수준의기술지도:작성방법과활용전략

  • 김혜리;박용태
    • 한국경영과학회:학술대회논문집
    • /
    • 대한산업공학회/한국경영과학회 2004년도 춘계공동학술대회 논문집
    • /
    • pp.370-373
    • /
    • 2004
  • 특허 데이터 정보는 경쟁자 모니터링, 기술 평가, R&D 포트폴리오 관리 등 전략적 계획의 여러 목적으로 사용되고 있다. 특정 분야의 기술 구조를 시각화하기 위한 방법론으로 특허를 사용한 기술 지도를 2차원상에 표현하는 co-word 분석법이 이용되고 있으나, 이 방법론을 적용하여 기업이 가진 특허를 지도로 시각화하고 분석을 시도한 연구는 없었으며 특허 포트폴리오는 전체 기술을 시각화하는 데 많은 한계를 가지고 있다. 본 연구에서는 특정 기업의 일부 분야 특허에 대하여 co-word matrix를 작성하고 기술을 클러스터링하여 다차원 축적 기법(Muitidimensional Scaling)으로 기술 지도를 작성하였다. 또한, 두 경쟁기업의 기술지도를 비교하여 기업간의 cross-licensing 가능 영역을 보이고 시간 흐름에 따른 기업 기술의 동적 분석 등 다양한 분석방법을 제시하였다.

  • PDF

인간 신뢰도 분석 시스템 구축에 관한 연구 (A Study for the development of Human Reliability Analysis Supporting System)

  • 김승환
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2005년도 가을 학술발표논문집 Vol.32 No.2 (2)
    • /
    • pp.133-135
    • /
    • 2005
  • 원자력발전소의 정량적 위험성 평가를 위해서 확률론적 안정성 평가 기법이 이용되고 있다. 확률론적 안전성 평가를 수행하기 위해서는 여러 가지 분야의 다양한 신뢰도 데이터가 필요한데, 이를 위한 각종의 신뢰도 자료 중에 인간의 지각 행위 및 수행 행위로부터 발생하는 인적 오류 확률은 그 특성상 실질적이 오류 확률을 얻기가 매우 어렵다. 그래서 인적 오류 확률을 구하기 위해서는 인간 신뢰도 분석분야의 전문가들이 제안한 인간 신뢰도 분석 방법을 이용하여 인적 오류 확률을 추정한다. 한국 원자력 연구소에서는 이를 위해 인간의 지각 및 수행 행위에서 야기되는 인간 오류 사건을 관리하고 인적 오류 확률을 추정하기 위한 인간 신뢰도 분석 시스템을 개발하고 있다. 본 연구에서는 인간 신뢰도 분석 시스템의 개발 과정 및 데이터베이스 설계 그리고 입출력 시스템의 설계에 관하여 기술하였다.

  • PDF