• 제목/요약/키워드: Public Big data

검색결과 703건 처리시간 0.033초

빅데이터 환경에서 텍스트마이닝 기법을 활용한 공공문서 분류체계의 적용사례 연구 (Case Study on Public Document Classification System That Utilizes Text-Mining Technique in BigData Environment)

  • 심장섭;이강욱
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2015년도 추계학술대회
    • /
    • pp.1085-1089
    • /
    • 2015
  • 과거의 텍스트마이닝기법은 텍스트 자체의 복잡성과 텍스트 내에 산재한 변수의 자유도 때문에 분석 알고리즘을 구현하는데 어려움이 있었다. 의미 있는 정보를 얻기 위하여 어렵게 알고리즘을 구현했다고 하더라도, 기계적으로 텍스트 분석에 소요되는 시간이 텍스트를 사람이 직접 읽어 분석 하는 것보다 많은 시간이 요구 되었다. 그러나 최근 하드웨어와 분석 알고리즘의 발전과 함께 빅데이터라는 기술이 등장하였으며, 앞에서 설명한 제약사항을 극복할 수 있게 되었고, 텍스트마이닝을 통한 분석이 현실세계에서 그 가치를 충분히 인정받고 있다. 만약, 텍스트의 탐색 수준에서 벗어나 마이닝을 통하여 분석이 가능하다면 텍스트 분석에 소비되는 인적, 물적 자원의 비용을 절감할 수 있기 때문에 공공분야에서 절실히 요구되는 창조적인 일에 더 많은 자원을 효과적으로 활용할 수 있을 것이다. 이에 본 논문에서는 인적 자원이 수작업으로 하는 공공분야 문서 분류의 결과값과 빅데이터 환경에서 텍스트마이닝기반의 문서내 단어 빈도수(TF-IDF)와 문서간 코사인 유사도(Cosine Similarity)를 활용한 공공분야 문서분류의 결과값을 비교하여 평가한다.

  • PDF

A Trend Analysis of Floral Products and Services Using Big Data of Social Networking Services

  • Park, Sin Young;Oh, Wook
    • 인간식물환경학회지
    • /
    • 제22권5호
    • /
    • pp.455-466
    • /
    • 2019
  • This study was carried out to analyze trends in floral products and services through the big data analysis of various social networking services (SNSs) and then to provide objective marketing directions for the floricultural industry. To analyze the big data of SNSs, we used four analytical methods: Cotton Trend (Social Matrix), Naver Big Data Lab, Instagram Big Data Analysis, and YouTube Big Data Analysis. The results of the big data analysis showed that SNS users paid positive attention to flower one-day classes that can satisfy their needs for direct experiences. Consumers of floral products and services had their favorite designs in mind and purchased floral products very actively. The demand for flower items such as bouquets, wreaths, flower baskets, large bouquets, orchids, flower boxes, wedding bouquets, and potted plants was very high, and cut flowers such as roses, tulips, and freesia were most popular as of June 1, 2019. By gender of consumers, females (68%) purchased more flower products through SNSs than males (32%). Consumers preferred mobile devices (90%) for online access compared to personal computers (PCs; 10%) and frequently searched flower-related words from February to May for the past three years from 2016 to 2018. In the aspect of design, they preferred natural style to formal style. In conclusion, future marketing activities in the floricultural industry need to be focused on social networks based on the results of big data analysis of popular SNSs. Florists need to provide consumers with the floricultural products and services that meet the trends and to blend them with their own sensitivity. It is also needed to select SNS media suitable for each gender and age group and to apply effective marketing methods to each target.

이용자를 위한 공공도서관 빅데이터 플랫폼 구축 방안 연구 - 문화프로그램 및 커뮤니티 서비스 정보를 중심으로 - (Big Data Platform for Public Library Users: Focusing on the Cultural Programs and Community Service)

  • 윤소영
    • 한국비블리아학회지
    • /
    • 제33권3호
    • /
    • pp.347-370
    • /
    • 2022
  • 공공도서관 웹사이트를 통해 제공되는 도서관 프로그램 정보는 대부분 비정형 데이터로 서지정보와 같이 체계적으로 생산하고 활용할 수 없어 기존의 도서관 빅데이터 연구나 사례에서 충분히 활용하지 못하고 있으며 웹사이트 개편이나 담당자 변경 시 사라질 위험도 있다. 이 연구에서는 비정형으로 생산되는 공공도서관 문화프로그램 및 커뮤니티 서비스 데이터를 수집, 분석하여 서지데이터와 연계하여 활용할 수 있는 데이터 스키마를 개발하고, 공공도서관 문화프로그램과 커뮤니티 서비스 데이터의 공유 및 활용, 그리고 문화프로그램 기획자인 사서간의 정보 채널로서 역할을 할 수 있는 도서관 빅데이터 플랫폼 구축안을 제시하였다. 이를 통해 서지데이터에 문화프로그램과 커뮤니티 서비스 정보를 연계함으로써 장서 기반 서비스를 확충할 수 있고 도서관 웹사이트에 게재되는 도서관 프로그램 데이터를 도서관 빅데이터 플랫폼으로 통합 관리함으로써 업무의 연속성을 확보하고, 개별 도서관의 특화된 서비스 이력을 체계적으로 관리·보존할 수 있다.

Cloud Computing Platforms for Big Data Adoption and Analytics

  • Hussain, Mohammad Jabed;Alsadie, Deafallah
    • International Journal of Computer Science & Network Security
    • /
    • 제22권2호
    • /
    • pp.290-296
    • /
    • 2022
  • Big Data is a data analysis technology empowered by late advances in innovations and engineering. In any case, big data involves a colossal responsibility of equipment and handling assets, making reception expenses of big data innovation restrictive to little and medium estimated organizations. Cloud computing offers the guarantee of big data execution to little and medium measured organizations. Big Data preparing is performed through a programming worldview known as MapReduce. Normally, execution of the MapReduce worldview requires organized joined stockpiling and equal preparing. The computing needs of MapReduce writing computer programs are frequently past what little and medium measured business can submit. Cloud computing is on-request network admittance to computing assets, given by an external element. Normal arrangement models for cloud computing incorporate platform as a service (PaaS), software as a service (SaaS), framework as a service (IaaS), and equipment as a service (HaaS).

빅데이터교육 현장에서 범용적으로 활용 가능한 공공데이터 모듈화 연구 (A study on modularization of public data that can be used universally in the field of big data education)

  • 최수연;박종열
    • 문화기술의 융합
    • /
    • 제9권1호
    • /
    • pp.655-661
    • /
    • 2023
  • 4차 산업혁명의 중요한 요소인 빅데이터는 공공기관과 지자체에서 공공데이터를 적극 개방하고 있다. 공공데이터 포털에서 모두가 편리하게 데이터를 검색하고 연관 데이터를 확인 할 수 있지만, ICT관련 분야에 있는 사람들만 공공데이터를 활용하고 있는 실정이다. 공공기관이 보유하고 있는 데이터를 시민에게 개방은 하고 있지만, 누구나 쉽게 공공데이터를 활용하여 응용 프로그램을 개발하기에는 어려운 상황이다. 본 논문은 공공데이터 포털에서 오픈API 형식으로 제공되는 데이터가 XML과 JSON 형식이다. 우리는 본 연구에서 XML형식의 공공데이터를 GUI 인터페이스에 연동하여 손쉽게 프로그램 개발이 가능한 부분으로 모듈화 하는 방법이다. 필요한 공공데이터를 기반으로 모바일 프로그램을 쉽게 개발하는 방안을 제시하여, 공공데이터 활용을 활성화 하는 방안을 제안한다.

개인정보보호법에 기반한 빅데이터 활용 방안 연구 (A study on Utilization of Big Data Based on the Personal Information Protection Act)

  • 김병철
    • 디지털융복합연구
    • /
    • 제12권12호
    • /
    • pp.87-92
    • /
    • 2014
  • 최근 대규모 데이터 처리와 다양한 형태의 데이터 처리 기술이 진화함에 따라 사회문제 진단 및 현안 해결 도구로써 빅데이터의 잠재력에 주목하고 있다. 동시에 빅데이터의 위험요소로 프라이버시 문제가 강력하게 제기되고 있기도 하다. 빅데이터의 적극적인 활용과 프라이버시 문제는 서로 상충되는 관례로써 본 논문에서는 이와 관련한 당면한 문제점을 지적하고, 해외 선진국의 사례분석을 통해 우리나라의 개인정보보호에 기반한 빅데이터 활용방안을 제안하고자 한다.

체르노프 페이스를 사용한 광역자치단체 공공도서관 운영 및 이용 분석 (Analysis of Public Library Operations and Uses of 16 Metropolitan Local Governments of Korea by Using the Chernoff Face Method)

  • 김영석
    • 한국문헌정보학회지
    • /
    • 제51권1호
    • /
    • pp.271-287
    • /
    • 2017
  • 본 연구는 체르노프 페이스 방법을 사용하여 우리나라 16개 광역자치단체의 공공도서관 운영 및 이용을 분석하는데 그 목적이 있다. 체르노프 페이스를 사용한 본 연구는 문헌정보학 분야에서는 처음으로 시도되었다. 설문조사 결과에 근거하여 얼굴의 어떤 부위로 어떤 데이터를 표현할 것인가를 결정하였다. 분석 결과 8개 조사 대상 분야에서 거의 모든 영역에 걸쳐 대체로 광역자치도가 광역시보다 도서관 운영 및 이용에서 우수하였다. 즉, 광역자치도는 광역시보다 더 많은 도서관을 운영하고 있고, 더 많은 장서를 가지고 있고, 더 많은 예산과 직원을 투입하고 있다. 그리고 이러한 운영 결과는 더 많은 이용자들의 도서관 자료실 이용과 자료 대출로 이어진 것으로 보인다.

빅데이터 분석을 활용한 기금지원 체육시설 활성화 방안 (A study of the vitalization strategy for public sports facility through big-data)

  • 김미옥;고진수;노승철;정재훈
    • 디지털융복합연구
    • /
    • 제15권2호
    • /
    • pp.527-535
    • /
    • 2017
  • 운동을 통한 건강증진에 대한 관심이 증가하면서 공공체육시설에 대한 수요는 꾸준히 증가하고 있다. 그러나 공공체육시설의 공급 계획에 비해 운영과 관리에 대한 연구는 부족한 상황이다. 이와 같은 맥락에서 본 연구는 국민체육진흥기금지원 체육시설 사업인 국민체육센터와 개방형체육관에 대한 빅데이터 분석을 통해 시설 활성화 방안을 모색하였다. 2015년 1년 간 뉴스, 블로그, 까페 등 인터넷 문서를 분석한 결과 국민체육센터와 개방형 체육관은 유사한 이용행태를 보이면서도 다른 수요를 갖고 있는 것으로 나타났다. 두 시설 모두 주민의 체육장소로 이용되고 있으나 국민체육시설이 좀 더 전문적인 프로그램을 보이는 반면 개방형 체육관은 생활체육공간으로 이용되는 차이를 보였다. 한편 두 시설 모두 운동 이외 산책, 소풍 등 휴식을 목적으로 방문하는 비율이 높아 시설 활성화를 위해서는 편의시설 확충과 다양한 기능의 복합이 필요할 것으로 보인다.

공문서의 기계가독형(Machine Readable) 전환 방법 제언 (Suggestions on how to convert official documents to Machine Readable)

  • 임진희
    • 기록학연구
    • /
    • 제67호
    • /
    • pp.99-138
    • /
    • 2021
  • 빅데이터 시대에 정형데이터 뿐만 아니라 비정형데이터를 분석하는 것이 중요한 과제로 대두되고 있다. 정부기관이 생산하는 공문서도 텍스트 기반의 대형 비정형데이터로 빅데이터 분석의 대상이 된다. 기관 내부의 업무효율, 지식관리, 기록관리 등의 관점에서 공문서 빅데이터를 분석하여 유용한 시사점을 도출해 나가야 할 것이다. 그러나, 현재 공공기관이 보유 중인 공문서의 상당수가 개방포맷이 아니어서 빅데이터 분석을 하려면 비트스트림에서 텍스트를 추출하는 전처리 과정이 요구된다. 또한, 문서파일 내에 맥락 메타데이터가 충분히 저장되어 있지 못하여 품질 높은 분석을 하려면 별도의 메타데이터 확보 노력이 필요하다. 결론적으로 현재의 공문서는 기계가독(machine readable) 수준이 낮아 빅데이터 분석에 비용이 많이 들게 된다. 이 연구에서는 향후 공문서가 기계가독 수준을 높이기 위해서는 공문서의 개방포맷화, 기안문 서식의 표준태그화, 자기 기술(self-descriptive) 메타데이터 확보, 문서 텍스트 태깅 등이 선행될 필요가 있다는 점을 제안한다. 첫째, 문서가 스스로를 설명하기 위해 추가되어야 하는 메타데이터 항목들을 제시하고 이 메타데이터들이 기계가독형이 되도록 문서파일에 저장하는 방법을 제안한다. 둘째, 문서 내용 분석 시 자연어 처리에만 의존하지 않고 행정 맥락에 따라 중요한 키워드를 미리 국제표준 태그로 마킹하여 기계가독형이 되도록 하는 방안을 제안한다.

Public Opinion on Lockdown (PSBB) Policy in Overcoming COVID-19 Pandemic in Indonesia: Analysis Based on Big Data Twitter

  • Suratnoaji, Catur;Nurhadi, Nurhadi;Arianto, Irwan Dwi
    • Asian Journal for Public Opinion Research
    • /
    • 제8권3호
    • /
    • pp.393-406
    • /
    • 2020
  • The discourse on the lockdown in Indonesia is getting stronger due to the increasing number of positive cases of the coronavirus and the death rate. As of August 12, 2020, the confirmed number of COVID-19 cases in Indonesia reached 130,718. There were 85,798 victims who have recovered and 5,903 who have died. Data show a significant increase in cases of COVID-19 every day. For this reason, there needs to be an evaluation of the government policy of the Republic of Indonesia in dealing with the COVID-19 pandemic in Indonesia. An evaluation of policies for handling the pandemic must include public opinion to determine any weaknesses of this policy. The development of public opinion about the lockdown policy can be understood through social media. During the COVID-19 pandemic, measuring public opinion through traditional methods (surveys) was difficult. For this reason, we utilized big data on social media as research data. The main purpose of this study is to understand public opinion on the lockdown policy in overcoming the COVID-19 pandemic in Indonesia. The things observed included: volume of Twitter users, top influencers, top tweets, and communication networks between Twitter users. For the methodological development of future public opinion research, the researchers outline the obstacles faced in researching public opinion based on big data from Twitter. The research results show that the lockdown policy is an interesting issue, as evidenced by the number of active users (79,502) forming 133,209 networks. Posts about the lockdown on Twitter continued to increase after the implementation of the lockdown policy on April 10, 2020. The lockdown policy has caused various reactions, seen from the word analysis showing 14.8% positive sentiment, 17.5% negative, and 67.67% non-categorized words. Sources of information who have played the roles of top influencers regarding the lockdown policy include: Jokowi (the president of the Republic of Indonesia), online media, television media, government departments, and governors. Based on the analysis of the network structure, it shows that Jokowi has a central role in controlling the lockdown policy. Several challenges were found in this study: 1) choosing keywords for downloading data, 2) categorizing words containing public opinion sentiment, and 3) determining the sample size.