• 제목/요약/키워드: 빅데이터분석기법

검색결과 586건 처리시간 0.034초

빅데이터를 활용한 직업관련 분석 및 시각화 (Job-related analysis and visualization using big data distributed processing system)

  • 최동철;최낙진;김민석;박준욱;이준동
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2020년도 제62차 하계학술대회논문집 28권2호
    • /
    • pp.249-251
    • /
    • 2020
  • 본 논문에서는 코로나바이러스감염증19 사태가 국내 취업시장에 어떠한 영향을 미쳤는지에 대해 알아보기 위하여 빅데이터를 활용한 직업 관련 분석 및 시각화를 수행하였다. 빅데이터를 위한 기본 자료는 통계청 자료와 워크넷 Open API를 활용하였으며, 빅데이터 처리 과정을 거쳐 결과값을 예측을 시도하였다. 2020년도 워크넷 Open API를 통해 고용수와 통계청 자료를 통해 비교 분석 및 시각화를 실시하였고, 08년~20년 취업자수를 통해 시계열 분석 및 예측을 진행해 앞으로의 횡보를 예상해보았다. 분석한 결과 19년, 20년도를 비교 분석했을 때에는 크게 차이가 나지 않았다. 추가적으로 시계열 분석기법을 활용해 보았을 때 매년 고용수는 전체적으로 증가하고 4월에는 감소, 7월에는 증가하는 추세가 나왔다. 코로나바이러스감염증19 사태로 인해 공공기관과 언택트 시대에 따른 화상회의나 재택근무로 인해 운수·통신 취업률은 상승한다는 결과값이 도출되었고, 자영업이나 서비스 직업 등은 다른 직종에 비해 큰 감소를 보여줬으나 국가 경제 활성화에 따른 고용수는 점차 증가할 것이라 예측된다.

  • PDF

중소병원에서의 빅데이터 분석을 위한 분산 노드 관리 방안 (Management of Distributed Nodes for Big Data Analysis in Small-and-Medium Sized Hospital)

  • 류우석
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2016년도 춘계학술대회
    • /
    • pp.376-377
    • /
    • 2016
  • 빅데이터 분석을 위한 분산 데이터 처리 기술인 하둡 프레임워크의 성능은 데이터를 저장하고 맵리듀스를 수행하는 분산 노드 각각의 성능 및 네트워크의 성능 등의 요소에 영향을 받는다. 본 논문에서는 기존 하둡에서의 분산 노드 관리 기법을 분석하고, 중소병원의 전산 시스템 환경을 고려하여 중소규모의 병원에서 하둡을 도입하기 위해 필요한 분산 노드 관리 기법을 제시한다.

  • PDF

공공데이터를 활용한 노인교통사고 발생유형 분석연구 (Analysis of Elderly Traffic Accidents Using Public Data)

  • 이정원;이충호
    • 산업융합연구
    • /
    • 제17권4호
    • /
    • pp.53-58
    • /
    • 2019
  • 교통약자인 노인 교통사고율을 줄이기 위하여 교통사고분석시스템과 통계청의 데이터를 수집하고 분석하는 것이 중요하다. 특히 노인 인구가 많이 거주하는 지역과 노인 교통사고가 자주 발생하는 지역에 해당하는 데이터 분석은 더욱 중요하다. 본 논문은 부여군 내의 노인이 많이 거주하는 지역에서 특정한 기간에 발생한 노인 교통사고 데이터를 빅데이터 분석기법으로 시각화 하고 분석하였다. 본 연구의 분석결과로 생성된 노인 교통사고 사고유형, 사고 다발지역, 노인 위치 자료 등은 노인 교통사고를 감소시키기 위한 개선책 및 관련 의사결정에 유용하게 활용될 수 있다.

Customer Segmentation in the Insurance Industry: Present and Future

  • 염경민;유병준;이재환
    • 한국벤처창업학회:학술대회논문집
    • /
    • 한국벤처창업학회 2022년도 춘계학술대회
    • /
    • pp.153-155
    • /
    • 2022
  • 고객을 세분화하여 맞춤화된 서비스를 제공하는 것은 고객 관계 관리에 있어 중요하다. 빅데이터 분석 기법과 기계 학습 등을 활용한 분석 기법의 발전은 더욱 세밀한 고객 세분화를 가능케 했다. 하지만 새로운 분석 기법을 기업에서 효과적으로 적용하는 것은 여러 어려움이 존재한다. 본 연구는 특히 국내 보험 산업에서 데이터 분석 기법을 활용해 더욱 향상된 고객 세분화를 수행할 수 있는 방법에 대해 논의한다. 이를 위하여 실제 보험 설계사와의 심층 인터뷰를 통해 국내 보험 회사의 현상을 파악하고, 이를 기반으로 보험 산업에서 활용할 수 있는 가이드라인을 제시하고자 한다.

  • PDF

식품 수입 절차에서의 효율적 의사결정을 위한 데이터 전처리 기술에 관한 연구 (Research on Data Preprocessing Techniques for Efficient Decision-Making in Food Import Procedures)

  • 박재형;송용욱;강주영
    • 한국빅데이터학회지
    • /
    • 제8권1호
    • /
    • pp.61-71
    • /
    • 2023
  • 데이터 기반 의사결정 방법론, 고도화된 빅데이터 처리 기법의 발달로 데이터를 처리하는 방법에 대한 정보의 수요가 늘어나고 있다. 데이터를 활용하는 거의 모든 작업과 연구에서 데이터 전처리 과정이 포함되나, 이러한 과정은 주장하고자 하는 내용이나 결과물을 도출하기 위한 수단으로써 언급될 뿐 실질적인 과정에 대해서 자세하게 설명하고 있는 연구는 부족하였다. 실질적인 분석 기법을 활용하기 이전의 단계로 간단하게 언급되는 경우가 많아 데이터 처리에 대한 인사이트를 획득하기 어려운 경우가 많았다. 따라서 이 연구에서는, raw data에서부터 데이터를 처리하는 과정, 즉 데이터 처리 파이프라인에 대해서 자세하게 작성하고자 하였다. 특히 수입식품 수입 절차에 대한 설명을 구체화함으로써 해당 상황에서 데이터의 필드들이 어떻게 해석될 수 있고 어떠한 필드들을 왜 활용하게 되었는지에 대한 상황과 관련 도메인 지식을 공유하면서 흐름을 기술하고자 하였다.

디지털 뉴딜을 위한 빅데이터 기반 물수급 분석 기법 개발 (Development of big data-based water supply and demand analysis technique for digital new deal)

  • 김장경;문수진;남우성;강신욱;권현한
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2021년도 학술발표회
    • /
    • pp.76-76
    • /
    • 2021
  • 물정보 중 가뭄 정보가 상대적으로 부족한 원인은 무엇을 가뭄으로 볼 것인지 정의하기 어렵기 때문이다. 특히 우리나라와 같이 댐 및 저수지, 광역상수도 등 수자원시스템 네트워크를 기반으로 물공급이 이루어지는 경우, 개별 요소만을 고려한 기존 가뭄모니터링 및 전망은 현실적이지 못하며, 가뭄 위험도 관리 측면에서도 부족한 부분이 있다. 가뭄 현상의 경우 기상학적 영향인 강수의 부족이 가장 큰 요소로 기여하지만 실질적으로 국민에 필요한 양보다 적은 양의 물이 공급될 때 국민들은 가뭄을 체감한다. 이러한 점을 보완하기 위하여 지역별로 사용하는 수원 및 물수급 시설 등을 세분화하고, 실적기반 분석을 통해 분석대상 지역의 가뭄을 정확히 판단하기 위한 합리적인 물수급 분석 모형 개발이 필요하다. 즉, 공간분석단위를 표준유역 단위 이하의 취방류 시설물을 기준으로 구성하고, 이들 시설물의 운영정보와 수문기상 빅데이터를 연계한 물순환 모형을 구현함으로써 댐, 저수지, 하천 등 다양한 수원을 가지는 유역 내 가용 수자원량을 준실시간 개념으로 평가하는 시스템의 개발이 필요하다. 본 연구에서는 하천을 중심으로 물수급 관련 수요·공급 시설의 위치를 절점으로 부여하고 연결하는 물수급 네트워크 알고리즘을 통해 빅데이터 기반 물수급 분석 모형을 개발하였다. 주요 모니터링 지점 및 모든 이수 시설의 위치를 유역분석 기법을 통하여 점(point), 선(line), 면(shape)으로 구성된 지형공간정보의 위상(topology) 관계를 설정하여 물수급 분석의 계산순서를 선정하고, 시계열 DB를 입력하여 지점별 물수급 분석 결과를 도출하였다. 권역별 주요 수위-유량관측소 1:1 Nash 계수를 검증한 결과 저유량에서 0.8 이상의 높은 재현 성능을 보이는 것으로 나타났다. 이에 따라 본 연구에서 개발된 물수급 분석 모형은 향후 물관련 이슈 지역의 용수공급능력 평가 및 수자원장기종합계획 등 다양한 수자원 정책평가에 활용될 것으로 기대된다.

  • PDF

빅데이터 분석을 위한 임상 및 바이오 정보 통합 데이터베이스의 설계 (Design of an Integrated Database of Clinical and Bio Information for Big Data Analysis)

  • 임종태;류은경;김기연;김천중;윤수용;박선용;노연우;육미선;정지원;최기태;유석종;유재수
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2014년도 추계 종합학술대회 논문집
    • /
    • pp.299-300
    • /
    • 2014
  • 생명과학분야에서는 생명현상을 이해하기 위해 신호 전달 네트워크에 대한 연구가 진행되고 있다. 하지만 신호전달 네트워크와 임상 정보를 결합하여 질병관점에서 신호 전달 네트워크를 통합하고 결합하는 관점의 연구가 부족하다. 따라서 본 논문에서는 빅데이터 기술을 활용하여 임상 및 신호전달 정보를 연계 분석할 수 있는 시스템을 구축하고자 빅데이터 분석을 위한 임상 및 바이오 정보 통합 데이터베이스를 설계한다. 설계한 임상 및 바이오 정보 통합 데이터베이스는 빅데이터 분석 기술을 적용한 확장 분석 기법 및 통합 분석 시스템 개발에 활용할 수 있다.

  • PDF

빅데이터 및 고성능컴퓨팅 프레임워크를 활용한 유전체 데이터 전처리 과정의 병렬화 (Parallelization of Genome Sequence Data Pre-Processing on Big Data and HPC Framework)

  • 변은규;곽재혁;문지협
    • 정보처리학회논문지:컴퓨터 및 통신 시스템
    • /
    • 제8권10호
    • /
    • pp.231-238
    • /
    • 2019
  • 차세대 염기 서열 분석법이 생성한 유전체 원시 데이터를 기존의 방식대로 하나의 서버에서 분석하기 위해서는 데이터 크기에 따라 수십 시간이 필요할 수 있다. 그러나 응급 환자의 진단처럼 수 시간 내에 결과를 알아야 하는 상황이 존재하기 때문에 단일 유전체 분석의 성능을 향상시킬 필요가 있다. 본 연구에서는 빅데이터 기술의 병렬화 기법과 고속의 네트워크로 연결되고 병렬파일시스템을 공유하는 고성능컴퓨팅 클러스터를 적극적으로 활용하여 분석 시간을 크게 단축시킬 수 있는 유전체 데이터 분석의 전처리 프로세스의 병렬화 방법을 제안한다. 분석 데이터의 신뢰성을 위해 기존의 검증된 분석 도구 및 알고리즘을 새로운 환경에 맞게 병렬화 하는 전략을 선택하였다. 프로세스의 병렬화, 데이터의 분배 및 병렬 병합 기법을 개발하였고 실험을 통해 성능 향상을 확인하였다.

빅데이터 프로젝트의 위험요인 식별과 우선순위 분석 (Risk Factors Identification and Priority Analysis of Bigdata Project)

  • 김승희
    • 한국인터넷방송통신학회논문지
    • /
    • 제19권2호
    • /
    • pp.25-40
    • /
    • 2019
  • 최근 많은 기업들이 대용량의 빅데이터 분석을 통하여 신사업을 발굴하거나 경영 및 기술 전략의 전환에 앞서 명시적인 근거를 마련하기 위하여 빅데이터 분석 및 활용을 위한 프로젝트를 수행하고 있다. 그러나 다수의 빅데이터 프로젝트가 정해진 기한 내에 종료를 못하여 실패하고 있음이 국내외적 문제로 대두되고 있다. 이는 공학적 관점에서 빅데이터 프로젝트의 위험 관리를 위한 지식 기반이 매우 미흡한 현 상황과 무관하지 않다. 따라서 본 논문에서는 빅데이터 구축 및 활용 프로젝트의 위험 요인을 분석하고, 중요도가 높은 위험 요인들을 도출한다. 이를 위해 문헌 연구로부터 프로젝트 위험 요인을 추출하고 친화도 기법을 통해 그룹화한 후 전문가 설문을 통해 중요도가 높은 위험 요인을 도출한다. 도출된 요인들을 대상으로 요인분석을 통해 빅데이터 프로젝트의 위험요인 분류표를 도출한다. 본 연구는 빅데이터 프로젝트에 대한 위험 식별, 위험 평가, 위험 분석을 위한 가장 기초가 되는 통제 지표의 개발이라는 데 큰 의미가 있으며, 향후 빅데이터 프로젝트와 관련된 효율적인 위험 관리의 이론적 근거를 제공함으로써 성공적인 빅데이터 프로젝트를 견인하는데 기초자료로써 크게 기여할 것으로 사료된다.

빅데이터 분석기법을 활용한 숙박업체 운영 개선 방안에 대한 연구 (A Study on Improvement of Pension Operation and Management using Big Data Analysis Techniques)

  • 윤선희
    • 문화기술의 융합
    • /
    • 제7권4호
    • /
    • pp.815-821
    • /
    • 2021
  • 빅데이터의 장점은 인터넷상의 대량의 데이터를 수집하여 가치 있는 데이터를 정제하여 사용하는 것이다. 즉, 비정형 데이터를 사용자가 필요한 관점에서 분석하여 활용할 수 있도록 가공하는 것이다. 본 논문은 실생활에 밀접하게 적용되어 마케팅에 활용할 수 있는 비정형 데이터를 기반으로 하며 실험 대상은 서울에서 한 시간 거리의 수도권에 있는 숙박업체를 모델로 하여 빅데이터를 사용자가 필요한 관점에서 분석하여 매출 증대, 비용 감소 및 수익률 증가 등의 효과를 나타낸 실험으로 소셜네트워크 등의 빅데이터를 분석하는 과정에서 입력되는 데이터가 숙박 정보로써 활용할 수 있는 데이터인지를 판별하여 필터링하는 시스템을 제안하여 숙박률의 향상 및 공실률을 감소시킬 수 있는 마케팅 전략을 구축하고자 한다.