• 제목/요약/키워드: 빅데이터 분석학

검색결과 632건 처리시간 0.024초

수산과학 빅데이터 플랫폼 구축과 메타 데이터 관리방안 (Fishery R&D Big Data Platform and Metadata Management Strategy)

  • 김재성;최영진;한명수;황재동;조완섭
    • 한국빅데이터학회지
    • /
    • 제4권2호
    • /
    • pp.93-103
    • /
    • 2019
  • 본 논문에서는 수산과학 R&D 정보의 빅데이터 플랫폼 구축과 메타 데이터 관리기법에 관해 소개한다. 빅데이터 플랫폼에서는 다양한 유형의 수산과학 R&D 정보를 수집하여 통합 연계하고, 이를 데이터 레이크 형태로 구축하는 방안을 제시한다. 수산과학 분야에서 수집, 축적되고 있는 기존의 데이터와 함께 위성영상 데이터, 연구보고서 등 비정형 빅데이터까지 수집하여 다양한 분석을 지원하는 빅데이터 플랫폼의 구축방안을 제시한다. 다음으로 데이터 추출과 전처리 및 저장 과정에서 메타 데이터를 수집하고 관리함으로써 수산과학 빅데이터의 체계적인 관리가 가능하도록 한다. 빅데이터 플랫폼 구축과 함께 메타 데이터를 표준양식으로 구축함으로써 데이터의 수집, 저장, 활용 및 유통 등 데이터 수명주기 전반에 걸쳐 체계적이고도 지속적인 빅데이터 관리 방안을 제시하는데 의의가 있다.

  • PDF

머신러닝을 이용한 빅데이터 도메인 자동 판별에 관한 연구 (A Study of Big Data Domain Automatic Classification Using Machine Learning)

  • 공성원;황덕열
    • 한국빅데이터학회지
    • /
    • 제3권2호
    • /
    • pp.11-18
    • /
    • 2018
  • 본 연구는 빅데이터 품질 진단의 핵심 요소인 도메인 기반 품질 진단을 위한 도메인 자동 판별에 관한 연구다. 빅데이터의 가치와 활용도의 증가와 4차 산업혁명의 대두로, 법률, 의료, 금융 등 IT와 융합된 다양한 분야에서 빅데이터를 활용하여 새로운 가치를 창출하려는 노력을 진행중이다. 하지만, 신뢰도가 낮은 데이터에 기반한 분석은 과정과 결과 모두에서 치명적인 문제를 발생하며, 분석 결과에 따른 판단 또한 신뢰하기 어려워 진다. 이처럼 신뢰도가 높은 데이터의 필요성 또한 증가하였지만, 데이터의 품질 확보에 대한 연구와 그에 대한 결과는 미비하다. 본 연구는 데이터 품질 향상을 위한 진단 평가의 핵심적 요소인 도메인 기반 품질 진단에서, 수작업으로 진행되었던 도메인 판별 작업을 머신러닝을 이용하여 자동화 함으로써, 작업시간을 단축하는 것을 목표로 한다. 데이터 베이스에 저장된, 도메인이 판별되어 있는 데이터의 특성에 관한 정보들을 추출하여 변수화하고, 이를 머신러닝을 이용하여 도메인 판별을 자동화 한다. 이를 빅데이터 품질 진단에 활용하고, 품질 향상에 기여하도록 한다.

식용곤충 연구 메타 분석 (A Meta Analysis of the Edible Insects)

  • 유옥경;진찬용;남수태;이현창
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2018년도 추계학술대회
    • /
    • pp.182-183
    • /
    • 2018
  • 빅데이터 분석은 데이터베이스에 잘 정리된 정형 데이터뿐만 아니라 인터넷, 소셜 네트워크 서비스, 모바일 환경에서 생성되는 웹 문서, 이메일, 소셜 데이터 등 비정형 데이터를 효과적으로 분석하는 기술을 말한다. 대부분의 빅데이터 분석 기술 방법들은 기존 통계학과 전산학에서 사용되던 데이터 마이닝, 기계 학습, 자연 언어 처리, 패턴 인식 등이 이에 해당된다. 본 연구에서는 빅데이터 분석도구인 소셜 메트릭스를 활용 식용곤충에 대한 메타분석을 진행하였다.

  • PDF

모바일 통신 빅데이터 기반 항공교통이용자 O/D 추출 알고리즘 연구 (Algorithm Development for Extract O/D of Air Passenger via Mobile Telecommunication Bigdata)

  • 조범철;권기훈
    • 한국빅데이터학회지
    • /
    • 제8권2호
    • /
    • pp.1-13
    • /
    • 2023
  • 현행 항공교통이용자 분석은 주로 통계적인 분석이 주류를 이루고 있으나, 이동경로, 지역별 이용자 수, 공항접근 소요시간 등 세부적인 사항에 대한 분석이 어렵다는 한계가 있다. 한편 빅데이터 기술 발전과 데이터3법 개정에 따라 빅데이터 기반 교통분석이 활성화되고 있으며, 모바일 통신 데이터는 휴대전화 단말기의 위치를 상세하게 파악할 수 있어 교통분석을 위한 좋은 분석자료가 될 수 있다. 이에 본 연구에서는 기존 항공교통이용자 분석방법의 한계를 극복하기 위해 이동경로 전체를 분석할 수 있는 모바일 통신 데이터를 기반의 교통이용자 O/D(Origin/Destination) 추출 알고리즘을 제시한다. 본 연구에서 제시하는 알고리즘은 각 공항에 공항신호탐지 구역을 설정하고, 해당 구역의 기지국 접속이력을 토대로 항공교통이용자를 추출하고 해당 이용자의 출발지-도착지 경로상의 기지국 접속 데이터를 토대로 이동경로를 추정하는 것이다. 본 연구에서는 2019년 1~12월의 기간을 대상으로 모든 국내 공항에 대하여 국내/국제선 이용자에 대해 O/D를 추출하였다. 또한 추출된 데이터의 검증을 위해 모바일 통신데이터 기반 항공교통 이용자 O/D 데이터와 항공통계데이터에 대해 상관성 분석을 수행하였다. 이를 통해 총량에는 차이가 있으나(국내선 4.1, 국제선 4.6) 상관성 0.99로 상관성이 높아 활용 가능할 것으로 판단되었다. 본 연구에서 제시한 알고리즘은 기존과 다르게 항공교통이용자의 이동행태, 지역별/연령별 비율 등 폭넓고 상세한 분석을 가능하게 하며, 향후 공항관련 정책 마련이나 지역별 시장분석 등 다양한 분야에서 활용할 수 있다.

제주시의 지속가능한 여행 활성화를 위한 지역화폐 '탐나는전' 가맹점의 리뷰 데이터 분석 (Analysis of Review Data of 'Tamna' Franchisees to Promote Sustainable Travel in Jeju City)

  • 백세희;김세형;배미란;강주영
    • 한국빅데이터학회지
    • /
    • 제7권2호
    • /
    • pp.113-128
    • /
    • 2022
  • 코로나19 이후 '지속가능한 관광'에 대한 관심이 커지면서 '지속가능한 관광'을 하고자 하는 관광객 또한 증가하였다. 그러나, '지속가능한 관광'을 할 수 있는 프로그램과 방법 등이 구체적이지 않다는 문제점이 있다. 또한, 대부분의 '지속가능한 관광'의 관심사가 '환경' 및 '탄소중립' 등에 초점을 맞추고 있어 지역사회에 공헌할 수 있는 프로그램이나 정책들이 많지 않다. 따라서 본 연구에서는 '지속가능한 관광'을 활성화하기 위하여 뉴스 데이터와 리뷰 데이터를 분석하였다. 우선, 본 연구에서는 뉴스 빅데이터 분석을 통해 지속가능한 여행의 주요한 주제들을 도출하였다. 이를 통해 지속가능한 여행의 정책적 주제 및 사건들을 분석한다. 지속가능한 여행과 관련된 뉴스 빅데이터를 분석하여 아직까지 한국에서 지속가능한 여행이 활성화되지 못한 이유들을 분석하고 이를 해결할 수 있는 방안으로 지역사회가 직접 혜택을 볼 수 있는 방안을 도출하고자 한다. 최종적으로, 제주시의 지속가능한 여행 활성화를 위하여 제주 지역화폐인 '탐나는전' 가맹점의 이용자 리뷰 데이터를 분석하고 지역사회와 공생할 수 있는 방안을 제안한다.

그래프 구조를 갖는 서지 빅데이터의 효율적인 온라인 탐색 및 분석을 지원하는 그래픽 인터페이스 개발 (Developing Graphic Interface for Efficient Online Searching and Analysis of Graph-Structured Bibliographic Big Data)

  • 유영석;박범준;조선화;이수안;김진호
    • 한국빅데이터학회지
    • /
    • 제5권1호
    • /
    • pp.77-88
    • /
    • 2020
  • 최근 다양한 실세계의 복잡한 관계를 그래프의 형태로 구성하고 분석하는 다양한 연구들이 진행되고 있다. 특히 DBLP와 같은 컴퓨터 분야 문헌 데이터 시스템은 논문의 저자, 그리고 논문과 논문들이 서로 인용 관계로 표현되는 대표적인 그래프 데이터이다. 그래프 데이터는 저장 구조 및 표현이 매우 복잡하므로, 문헌 빅데이터의 검색과 분석, 그리고 시각화는 매우 어려운 작업이다. 본 논문에서는 문헌 빅데이터를 그래프의 형태로 시각화한 그래픽 사용자 인터페이스 도구, 즉 EEUM을 개발하였다. EEUM은 그래프 데이터를 시각적으로 표시하여 연결된 그래프 구조에 따라 문헌 데이터를 브라우징 하는 기능을 제공하며, 문헌 빅데이터에 대한 검색 및 관리, 분석이 가능하도록 구현하였다. 또한 EEUM을 DBLP가 제공하는 문헌 그래프 빅데이터에 적용하여 편리하게 검색, 탐색 및 분석하는 할 수 있음을 시연한다. EEUM을 이용하여 모든 연구 분야에서 영향력 있는 저자나 논문을 쉽게 찾을 수 있으며, 여러 저자와 논문 사이의 모든 관계를 한 눈에 볼 수 있는 등 복잡한 문헌 그래프 빅데이터의 검색 및 분석 도구로 편리하게 사용할 수 있다.

핀테크와 빅데이터 기술에 대한 리뷰 (Review of Fintech and Bigdata Technology)

  • 최기우
    • 한국빅데이터학회지
    • /
    • 제1권1호
    • /
    • pp.77-84
    • /
    • 2016
  • 최근 이슈가 되고 있는 핀테크 산업의 종류 및 특징에 대해 알아본다. 이를 통해 핀테크 산업의 본질은 플랫폼 사업이라는 것과 시장선점에 있다는 사실을 확인한다. 아울러 핀테크 산업이 성공하기 위해서는 기존 금융서비스보다 단가를 낮추기 위한 방안이 필요하고 이에 대한 해결책은 바로 빅데이터 활용 및 빅데이터 분석임을 인식 한다. 마지막으로 기존 금융권과 신생 핀테크 업체들 간의 상생을 위한 협력만이 우리나라 핀테크가 나아가야할 방향임을 제언한다.

  • PDF

패키징(Packaging) 분야에서의 빅데이터(Big data) 적용방안 연구 (Study on Application of Big Data in Packaging)

  • 강욱건;고의석;심원철;이학래;김재능
    • 한국포장학회지
    • /
    • 제23권3호
    • /
    • pp.201-209
    • /
    • 2017
  • 패키징 분야도 4차 산업혁명에 발 맞춰 IoT (Internet of Things), 빅데이터, 클라우드 및 소비자 기반 기술 등이 적용되어 스마트 패키징이 등장하고 있다. 정책, 예측, 마케팅, 디자인 등 다양한 분야에서 빅데이터 분석이 활용되고 있지만 패키징 분야에서의 연구는 아직 초보적 수준이다. 따라서 본 연구는 빅데이터를 패키징 분야에 적용하기 위해 선행연구과 관련서적을 통해 빅데이터의 정의와 연구에서 활용되는 데이터 수집, 저장, 분석방법을 정리하였고 패키징 분야에 적용할 수 있는 분석방법을 제시하였다. 오늘날 패키징 분야는 마케팅적 요소를 요구받고 있기 때문에 패키징에 대한 소비자의 인식을 파악할 필요가 있으며 빅데이터의 근원이 되는 5가지 데이터 중 사유데이터(private data)와 커뮤니티 데이터(community data)를 활용하여 소비자와 제품 간의 상호작용 분석하는데 활용하고자 한다. 패키징은 소비자의 관심을 끌기 위한 전략전인 도구로 사용되며 소비자의 구매위험을 줄이는 수단이 되기 때문에 패키징에 대한 소비자의 인식을 분석할 필요가 있다. 본 연구에서는 제품 개선을 위한 문제점 도출 과정에서 의미연결망 분석(Semantic Network Analysis)과 텍스트마이닝(Text mining)을 활용하여 제품을 구성하는 다양한 요소들을 파악하고 패키징 요소의 빈도분석을 거쳐 패키징의 영향력을 확인하는 방안과 저관여 제품을 대상으로 텍스트 마이닝(Text mining)과 오피니언 마이닝(Opinion Mining), 소셜 네트워크 분석(Social Network Analysis)을 통해 패키징에 대한 감정분석을 하여 동일한 제품군에서 소비자가 선호하는 패키징을 도출하는 방안을 제시하였다. 패키징은 제품을 구성하는 많은 요소들 중 하나이기 때문에 패키징이라는 단일 요소의 영향력을 파악하기란 쉽지 않지만 본 연구는 빅데이터를 활용하여 패키징에 대한 소비자의 인식과 감정을 분석하고 제품에서 패키징이 소비자에게 미치는 영향력을 분석할 수 있는 방안을 제시한 데 의의가 있다.

빅데이터 분석을 통한 천만 관객 영화 예측 모델 (A Model of Predictive Movie 10 Million Spectators through Big Data Analysis)

  • 우종필;이응환
    • 한국빅데이터학회지
    • /
    • 제3권1호
    • /
    • pp.63-71
    • /
    • 2018
  • 최근 5년(2013~2017년) 연속 영화 총 관객 수가 2억 명이 넘는 국내 영화 산업에서 천만 관객을 돌파한 한국 영화 간에는 어떤 요인이 영향을 미쳤는지 분석해 보았다. 일반적으로 천만 관객 돌파에 영향을 주는 요인으로는 스크린 수와 평점을 중요하게 보는 시각이 많았다. 본 연구에서는 스크린 수, 평점을 포함하고 추가적으로 4가지 요인을 설정하여 가설을 수립하고 빅데이터 분석을 통해 천만 관객 돌파 유무와의 상관관계를 분석했다. 이를 통해 천만 관객 돌파 예측 정확도는 91%, 누적 관객 수 예측 정확도는 99.4%까지 맞추는 유의미한 결과를 얻었다.

의료기관 빅데이터 품질관리의 필요성과 사례 분석 (The Necessity and Case Analysis of Bigdata Quality Control in Medical Institution)

  • 최혜린;이승원;김영아;이종호;고홍;김현창
    • 한국빅데이터학회지
    • /
    • 제2권2호
    • /
    • pp.67-74
    • /
    • 2017
  • 빅데이터의 활용은 사회 전 분야에서 중요한 역할을 하고 있으며, 특히 보건의료분야에서는 국민의 생명과 건강을 다루기 때문에 빅데이터의 역할이 더욱 중요하다. 하지만 의료 빅데이터의 품질관리에 대한 관심과 인식은 현저히 떨어지는 실정이다. 저 품질 의료 빅데이터는 국가적 손실과 국민의 건강 저해를 야기시키므로 의료 빅데이터의 품질관리가 필요하다. 이에 국내외 의료 빅데이터 품질관리 사례 및 가이드라인에 대하여 문헌 조사하여 국내 의료 빅데이터 품질관리에 대한 방향성을 제시하고자 한다. 또한, 국내 한 대형 의료기관의 의료 빅데이터 품질관리 사례로 Y의료원의 '빅데이터 품질관리 TFT' 활동과 데이터 관련 업무종사자 대상 설문조사 결과를 소개하고자 한다.

  • PDF