• 제목/요약/키워드: Unstructed data analysis

검색결과 3건 처리시간 0.018초

SNS상의 비정형 빅데이터로부터 감성정보 추출 기법 (An Extraction Method of Sentiment Infromation from Unstructed Big Data on SNS)

  • 백봉현;하일규;안병철
    • 한국멀티미디어학회논문지
    • /
    • 제17권6호
    • /
    • pp.671-680
    • /
    • 2014
  • Recently, with the remarkable increase of social network services, it is necessary to extract interesting information from lots of data about various individual opinions and preferences on SNS(Social Network Service). The sentiment information can be applied to various fields of society such as politics, public opinions, economics, personal services and entertainments. To extract sentiment information, it is necessary to use processing techniques that store a large amount of SNS data, extract meaningful data from them, and search the sentiment information. This paper proposes an efficient method to extract sentiment information from various unstructured big data on social networks using HDFS(Hadoop Distributed File System) platform and MapReduce functions. In experiments, the proposed method collects and stacks data steadily as the number of data is increased. When the proposed functions are applied to sentiment analysis, the system keeps load balancing and the analysis results are very close to the results of manual work.

감성분석을 위한 병렬적 HDFS와 맵리듀스 함수 (A Parallel HDFS and MapReduce Functions for Emotion Analysis)

  • 백봉현;류윤규
    • 한국정보컨버전스학회논문지
    • /
    • 제7권2호
    • /
    • pp.49-57
    • /
    • 2014
  • 최근 대량의 SNS(Social Network Service) 데이터로부터 유용한 정보를 추출하고 사용자의 진의 정보를 평가하기 위한 오피니언 마이닝(opinion mning)이 소개되고 있다. 오피니언 마이닝은 대량의 SNS 데이터로부터 빠른 기간 내에 데이터를 수집하고 분석하여 목적에 적합한 정보를 추출하는 효율적인 기법이 필요하다. SNS에서 발생되는 다양한 비정형 데이터로부터 감성정보를 추출하기 위해, 본 논문에서는 하둡(Hadoop) 시스템 기반의 병렬적 HDFS(Hadoop Distributed File System)와 맵리듀스(MapReduce) 기반 감성분석 함수를 제안한다. 실험결과로 제안한 시스템과 함수는 데이터 수집과 적재시간에 대해 O(n)보다 빠르게 처리하며, 메모리와 CPU 자원에 대해 안정적인 부하분산이 이루어지는 것을 확인하였다.

  • PDF

다차원 분석방법을 활용한 중소규모 공동주택 건축심의 의견의 경향과 비정형 데이터로서의 특성분석 (Multidimensional Analysis of Unstructured Data and Trends in Architectural Review Opinions of Small and Medium-Sized Apartment Projects )

  • 김진희;황태언;김재식;허영기
    • 한국건설관리학회논문집
    • /
    • 제24권6호
    • /
    • pp.74-80
    • /
    • 2023
  • 본 연구는 국내 1인 가구수가 증가함에 따라 중소규모 공동주택에 대한 정책적 관심이 높아지는 가운데, 해당 사업 유형의 사업주들이 대비하기 가장 어려운 리스크로 건축심의가 지적되고 있다. 본 연구는 B도시의 25개 중소규모 공동주택 프로젝트에 대해 다차원 분석방법을 적용하여 건축심의 의견의 경향과 비정형데이터로서 건축심의 의견의 특성을 분석하였다. 대응분석 및 MDS 분석을 실시한 결과, 선행연구와 동일하게 B도시의 건축심의 의견은 주로 상위분류에서 '구조'와 '계획'에 관련된 키워드가 주를 이루었다. 즉, 모든 키워드의 출현빈도수 대비 각 상위분류의 빈도수의 합은, 선행연구의 직접분류결과는 '구조' 40%, '계획' 27%이며, 본 연구의 분석결과는 '구조' 44%, '계획' 39%인 것으로 나타났다. MDS모델의 적합도는 34.4%로 비교적 낮은 편이나, 대응분석을 통해 확인한 결과 건축심의의 비정형적 자료의 특성에 기인한 것으로 확인하였다. 또한, 본 연구에서 분석한 건축심의 의견과 같은 비정형적 데이터는 심의위원의 주관과 지자체별 양식에 따라 다양한 데이터의 조합과 출현이 이루어지며, 주로 언급되는 단어와 전혀 다른 키워드가 등장할 수 있어 첨도가 낮고 왜도가 높은 확률분포적 특성을 파악할 수 있었다. 본 연구는 일부 한계점이 있으나, 비정형 데이터로서 건축심의 의견의 특징을 도출해내었으며 추후 세부분석을 위한 기초 연구로서 활용 될 수 있을 것이다.