• 제목/요약/키워드: 뉴스 데이터 분석

검색결과 393건 처리시간 0.029초

한국어 폐쇄자막을 이용한 지식기반 비디오 검색 시스템 (Knowledge-based Video Retrieval System Using Korean Closed-caption)

  • 조정원;정승도;최병욱
    • 전자공학회논문지CI
    • /
    • 제41권3호
    • /
    • pp.115-124
    • /
    • 2004
  • 저 수준의 특징정보를 사용하는 내용기반 검색만으로 지능형 정보검색을 위한 사용자의 개념적인 요구에 부합하는 검색결과를 제공하기 어렵다. 일반적으로 비디오 데이터에는 동영상 정보와 함께 음성, 음향 등의 오디오 정보와 폐쇄자막 등의 정보가 포함되어 있다. 지식기반 비디오 검색은 그러한 다양한 정보를 사용하여 자동색인을 수행하고 색인 데이터베이스를 구축한다. 이로써 사용자는 보다 개념적인 검색 요구에 부합하는 검색 결과를 얻을 수 있다. 본 논문에서는 비디오 내의 한국어 폐쇄자막을 이용한 지식기반 비디오 검색 시스템을 제안한다. 한국어 폐쇄자막은 형태소 분석 수준에서 자동색인되며, 색인 데이터베이스를 이용하여 키워드 질의를 통해 비디오를 검색할 수 있다. 실험에서 한국어 속기시스템으로 제작된 폐쇄자막이 포함된 뉴스비디오에 적용하여, 제안하는 방법이 사용자의 보다 의미 있는 개념적인 요구에 부합하는 검색 결과를 얻을 수 있음을 확인하였다.

뉴스데이터의 LDA 토픽 분석을 통한 장수군 농촌지역 활성화 사업의 특징 - 관광·생활 키워드를 중심으로 - (Features of the Rural Revitalization Projects in Jang-su County Using LDA Topic Analysis of News Data - Focused on Keyword of Tourism and Livelihood -)

  • 김용진;손용훈
    • 농촌계획
    • /
    • 제24권4호
    • /
    • pp.69-80
    • /
    • 2018
  • In this study, we typified the project for revitalizing the rural area through text analysis using news data, and analyzed the main direction and characteristics of the project. In order to examine the factors emphasized among the issues related to the revitalization of rural areas, we used news data related to 'tourism' and 'livelihood', which are the main keyword of the project to promote rural areas. In the analysis, text mining techniques were used. Topic modeling was conducted on LDA techniques for major projects in 'tourism' and 'livelihood' keyword. Based on this, this study typified the projects that are carried out for the activation of rural areas by topic. As a result of the analysis, it was fount that the topics included in the project were distributed in 11 sub-types(Tourism Promotion, Regional Specialization, Local Festival, Development of Regional Scale, Urban and Rural Exchange, Agricultural Support, Community Forest Management, Improve the Settlement Environment, General Welfare Service, Low Class Support, Others). The characteristics of the rural revitalization projects were examined, and it was confirmed that domestic projects were carried out by tourism-oriented projects. To summarize, the government is making projects to revitalize rural areas through related ministries. Within the structure where the project is spreading to the region, a lot of projects are being carried out. It is understood that the tourism and welfare oriented projects are being carried out in the revitalization project of the domestic rural area. Therefore, in order to achieve the goal of rural revitalization, it is believed that it will be effective to carry out a balanced project to improve the settlement environment of the residents.

IoT 센서를 활용한 미세먼지 분석 기술 개발 (Development of Fine Dust Analysis Technology using IoT Sensor)

  • 신동진;이진;허민희;황승연;이용수;김정준
    • 한국인터넷방송통신학회논문지
    • /
    • 제21권1호
    • /
    • pp.121-129
    • /
    • 2021
  • 최근 중국에서 발생하는 황사와 더불어 국내에서는 뉴스 등 미디어를 통해 미세먼지가 큰 화제가 되고 있다. 외부에서 발생하는 미세먼지도 있지만, 외부 미세먼지가 내부로 유입되면서 공기 청정기 제품의 구입율이 높아지고 있다. 공기 청정기는 내부에 필터를 사용하고 있으며, 센서를 통해 필터의 교체 유무를 LED 알람을 통해 사용자에게 알려준다. 하지만, 현재 필터율이 얼마나 감소하였는지 측정하고, 작동하는 송풍기의 압력을 결정해주는 제품은 없는 상태이다. 따라서 본 논문에서는 IoT 기기인 아두이노와 미세먼지 센서, 차압 센서를 활용하여 데이터를 직접 생성하고, 측정된 미세먼지와 압력 값을 계산하여 필터율에 따라 필터가 얼마나 노화되었는지 확인할 수 있는 프로그램을 파이썬 프로그래밍을 이용하여 개발하였다.

온라인 뉴스를 이용한 기업평판 구성요인 탐색 및 지수 개발 연구 : 감성분석과 AHP적용 (Exploration of Constituent Factors for Corporate Reputation and Development of Index Using Online News : Sentiment Analysis and AHP Application)

  • 이병현;최일영;이정재;김재경;강현모
    • 한국IT서비스학회지
    • /
    • 제19권6호
    • /
    • pp.145-159
    • /
    • 2020
  • Because of the recent development of information and communication technology, companies are exposed to various media such as blogs, social media, and YouTube. In particular, exposed news affects the company's reputation. So, while positive news can improve corporate value, negative news can lead to financial losses for the company. In this study, we redefine corporate reputation as social responsibility, vision and leadership, financial performance, products and services through existing literature, and conducted an AHP survey with a total of four components to calculate the weight of each factor. As a result of the calculation, the proportion of financial performance was the highest at 0.41, and products and services, vision and leadership, and social responsibility were the lowest. In addition, in order to measure the reputation of a company, it is classified as a component that defines online news using the LDA technique. In addition, through sentiment analysis, an index for each corporate reputation factor was derived, and the reputation index was calculated by combining it with the AHP analysis result, and Spearman ranking correlation analysis was performed to secure the validity of the research results. Therefore, the significance of this study is that the definition and importance of the constituent factors can contribute to the future planning and development direction of the company, and also contribute to the derivation of the corporate reputation index. This study is significant in that a new analysis methodology that applied AHP analysis results to sentiment analysis was suggested.

언론은 인공지능(AI)을 어떻게 다루는가?: 뉴스 빅데이터를 통한 한국과 미국의 보도 경향 분석 (How Does the Media Deal with Artificial Intelligence?: Analyzing Articles in Korea and the US through Big Data Analysis)

  • 박종화;김민성;김정환
    • 한국정보시스템학회지:정보시스템연구
    • /
    • 제31권1호
    • /
    • pp.175-195
    • /
    • 2022
  • Purpose The purpose of this study is to examine news articles and analyze trends and key agendas related to artificial intelligence(AI). In particular, this study tried to compare the reporting behaviors of Korea and the United States, which is considered to be a leader in the field of AI. Design/methodology/approach This study analyzed news articles using a big data method. Specifically, main agendas of the two countries were derived and compared through the keyword frequency analysis, topic modeling, and language network analysis. Findings As a result of the keyword analysis, the introduction of AI and related services were reported importantly in Korea. In the US, the war of hegemony led by giant IT companies were widely covered in the media. The main topics in Korean media were 'Strategy in the 4th Industrial Revolution Era', 'Building a Digital Platform', 'Cultivating Future human resources', 'Building AI applications', 'Introduction of Chatbot Services', 'Launching AI Speaker', and 'Alphago Match'. The main topics of US media coverage were 'The Bright and Dark Sides of Future Technology', 'The War of Technology Hegemony', 'The Future of Mobility', 'AI and Daily Life', 'Social Media and Fake News', and 'The Emergence of Robots and the Future of Jobs'. The keywords with high centrality in Korea were 'release', 'service', 'base', 'robot', 'era', and 'Baduk or Go'. In the US, they were 'Google', 'Amazon', 'Facebook', 'China', 'Car', and 'Robot'.

뉴스데이터를 활용한 국내 복합재난 발생 동향분석 (Trend Analysis of Complex Disasters in South Korea Using News Data)

  • 신은혜;김도우;장성록
    • 한국안전학회지
    • /
    • 제38권6호
    • /
    • pp.50-59
    • /
    • 2023
  • As the diversity of disasters continues to increase, the concept of "complex disasters" has gained prominence in various policies and studies related to disaster management. However, there has been a certain limitation in the availability of the systematic statistics or data in advancing policies and research initiatives related to complex disasters. This study aims to analyze the macro-level characteristics of the complex disasters that have occurred domestically utilizing a 30-year span of a news data. Initially, we categorize the complex disasters into the three types: "Natural disaster-Natural disaster", "Natural disaster-Social disaster", and "Social disaster-Social disaster". As a result, the "natural diaster-social disaster" type is the most prevalent. It is noted that "natual disaster-natural disaster" type has increased significantly in recent 10 years (2011-2020). In terms of specific disaster types, "Storm and Flood", "Collapse", "Traffic Accident", "National Infrastructure Paralysis", and "Fire⋅Explosion" occur the most in conjunction with other disasters in a complex manner. It has been observed that the types of disasters co-ocuuring with others have become more diverse over time. Parcicularly, in recent 10 years (2011-2020), in addition to the aforementioned five types, "Heat Wave", "Heavy Snowfall⋅Cold Wave", "Earthquake", "Chemical Accident", "Infectious Disease", "Forest Fire", "Air Pollution", "Drought", and "Landslide" have been notable for their frequent co-occurrence with other disasters. These findings through the statistical analysis of the complex disasters using long-term news data are expected to serve as crucial data for future policy development and research on complex disaster management.

온라인 콘텐츠 구독 서비스 이용에 대한 연구: 디지털 리터러시, 제품 구매 성향, 성격 유형, 이용 경험을 중심으로 (A Study on the Utilization of Online Contents Subscription Services : Focusing on Digital Literacy, Purchase Tendencies, Personality Types, and Contents Consumption Experience)

  • 임지안;성욱준
    • 정보화정책
    • /
    • 제31권2호
    • /
    • pp.105-132
    • /
    • 2024
  • 본 연구는 온라인 콘텐츠 구독 서비스 이용에 영향을 미치는 요인을 알아보기 위한 실증 연구이다. 온라인 콘텐츠 구독 서비스가 일상생활과 밀접한 다양한 분야로 확대되고 있는 상황에서 이용자의 어떠한 특성이 온라인 구독 서비스 이용에 영향을 미치는지 알아보고자 한다. 본 연구에서는 종속변수를 현재 구독하고 있는 온라인 콘텐츠 구독 서비스 개수로 설정하였고, 독립변수를 과시적 제품 구매 성향, 성격 유형, 온라인 콘텐츠 이용 경험 여부, 디지털 리터러시로 설정하였다. 또한, 통제변수로는 인구사회학적 특성(성별, 연령, 최종학력, 개인 월평균 소득, 가구원 수)과 디지털 기기(휴대폰, 태블릿, 데스크탑, 노트북, TV) 보유여부를 설정하였다. 본 연구에서는 정보통신정책연구원(KISDI)의 2022년 한국미디어패널조사 데이터를 활용하여 토빗(Tobit) 회귀분석을 실시하였다. 연구결과, 디지털 리터러시, 성격유형 중 조화성과 친화성, 온라인 콘텐츠 이용 경험은 온라인 콘텐츠 구독 서비스 이용에 유의미한 영향을 미치는 것으로 나타났다. 그러나 이용자의 과시적 제품 구매 성향과 성격유형 중 개방성과 외향성은 온라인 콘텐츠 구독 서비스 이용에 유의미한 영향을 미치지 않았다. 구체적으로 온라인 뉴스/잡지/E-book, 음악, 교육동영상 콘텐츠의 이용 경험과 디지털 리터러시는 온라인 구독 서비스 이용에 긍정적인 영향을 미치는 것으로 나타났으며, 온라인 게임 콘텐츠 이용 경험과 성격유형 중 친화성과 조화성은 부정적인 영향을 미치는 것으로 나타났다.

CNN-LSTM 조합모델을 이용한 영화리뷰 감성분석 (Sentiment Analysis of Movie Review Using Integrated CNN-LSTM Mode)

  • 박호연;김경재
    • 지능정보연구
    • /
    • 제25권4호
    • /
    • pp.141-154
    • /
    • 2019
  • 인터넷 기술과 소셜 미디어의 빠른 성장으로 인하여, 구조화되지 않은 문서 표현도 다양한 응용 프로그램에 사용할 수 있게 마이닝 기술이 발전되었다. 그 중 감성분석은 제품이나 서비스에 내재된 사용자의 감성을 탐지할 수 있는 분석방법이기 때문에 지난 몇 년 동안 많은 관심을 받아왔다. 감성분석에서는 주로 텍스트 데이터를 이용하여 사람들의 감성을 사전 정의된 긍정 및 부정의 범주를 할당하여 분석하며, 이때 사전 정의된 레이블을 이용하기 때문에 다양한 방향으로 연구가 진행되고 있다. 초기의 감성분석 연구에서는 쇼핑몰 상품의 리뷰 중심으로 진행되었지만, 최근에는 블로그, 뉴스기사, 날씨 예보, 영화 리뷰, SNS, 주식시장의 동향 등 다양한 분야에 적용되고 있다. 많은 선행연구들이 진행되어 왔으나 대부분 전통적인 단일 기계학습기법에 의존한 감성분류를 시도하였기에 분류 정확도 면에서 한계점이 있었다. 본 연구에서는 전통적인 기계학습기법 대신 대용량 데이터의 처리에 우수한 성능을 보이는 딥러닝 기법과 딥러닝 중 CNN과 LSTM의 조합모델을 이용하여 감성분석의 분류 정확도를 개선하고자 한다. 본 연구에서는 대표적인 영화 리뷰 데이터셋인 IMDB의 리뷰 데이터 셋을 이용하여, 감성분석의 극성분석을 긍정 및 부정으로 범주를 분류하고, 딥러닝과 제안하는 조합모델을 활용하여 극성분석의 예측 정확도를 개선하는 것을 목적으로 한다. 이 과정에서 여러 매개 변수가 존재하기 때문에 그 수치와 정밀도의 관계에 대해 고찰하여 최적의 조합을 찾아 정확도 등 감성분석의 성능 개선을 시도한다. 연구 결과, 딥러닝 기반의 분류 모형이 좋은 분류성과를 보였으며, 특히 본 연구에서 제안하는 CNN-LSTM 조합모델의 성과가 가장 우수한 것으로 나타났다.

빅데이터 분석을 활용한 웰에이징 요인에 관한 연구 : 신문기사를 중심으로 (A Study on the Factors of Well-aging through Big Data Analysis : Focusing on Newspaper Articles)

  • 이종형;강경희;김용하;임효남;구진희;김광환
    • 한국산학기술학회논문지
    • /
    • 제22권5호
    • /
    • pp.354-360
    • /
    • 2021
  • 사람들은 개인의 삶의 만족을 위하여 일과 삶의 균형을 맞추며 건강하고 행복하게 살아가는 것을 희망하고 있다. 따라서 걱정 없이 행복하고 건강하게 나이가 들어가는 것을 의미하는 웰에이징(well-aging)에 대한 관심이 높아지고 있다. 본 연구는 웰에이징 관련 신문기사를 분석하여 웰에이징과 연관된 요인들을 파악하고자 하였다. 파이썬(Python) 기반의 웹 크롤링(web crawling)을 활용하여 2020년 11월까지 포탈 사이트 다음(daum)의 뉴스 서비스에 게재된 1,199편의 기사를 수집하였으며, 이중 연구 주제에 일치하는 기사 374편을 연구대상으로 선정하였다. 텍스트마이닝의 빈도분석 결과, '노인', '건강', '피부', '웰에이징', '제품', '사람', '노화', '여성', '국내', '은퇴' 등의 순서로 상위 10개의 키워드가 중요하게 파악되었다. 또한 출현 빈도가 높은 45개의 중요 키워드를 기반으로 사회 네트워크 분석을 수행한 결과 '피부-주름', '피부-노화', '노인-건강'이 강한 연결 관계를 나타났다. CONCOR 분석을 수행한 결과 45개의 중요 키워드들은 '삶과 행복', '질병과 죽음', '영양과 운동', '힐링', '헬스산업', '노화와 안티에이징', '건강', '노인서비스'의 8개 군집으로 구성되어, 신문기사들을 기반으로 나타나는 웰에이징과 관련된 요인들을 유추할 수 있었다.

부산항 항만안전 주요 이슈 동향에 관한 연구 (A Study on Trends of Key Issues in Port Safety at Busan Port)

  • 이정민;하도연;김주혜
    • 한국항해항만학회지
    • /
    • 제48권1호
    • /
    • pp.34-48
    • /
    • 2024
  • 글로벌 공급망에 예측 불가능한 위험성이 확산되면서 세계의존도가 높은 항만물류산업의 위험부담이 높아지고 있다. 이에 본 연구에서는 기초적인 연구로 국내 항만의 안전성에 위험을 주는 다양한 이슈들을 알아보고자 하였다. 이를 위해 부산항의 항만안전과 관련된 뉴스 기사 데이터를 활용하여 LDA토픽모델링 분석과 시계열 선형회귀분석을 진행하였고 부산항 항만안전 주요 이슈들의 변화와 그 동향을 파악하였다. 본 연구의 분석 결과는 다음과 같다. 지난 30년동안 부산항 항만안전과 관련된 주요 이슈는 총 9개이며 이들을 5년 주기의 시기별로 살펴본 결과, 지난 30년 동안 해상안전 이슈, 수입화물 검역 안전 이슈, 노조파업 관련 이슈, 자연재해 관련 이슈가 지속해서 등장했다. 부산항 항만안전 주요 이슈는 주로 예측 불가능한 성격이 큰 사회환경적 유형과 자연현상적 유형으로 글로벌 불확실성의 영향을 많이 받고 있음을 알 수 있었다. 따라서 분석 결과로 도출된 항만안전 주요 이슈들을 위주로 부산항 항만안전 강화를 위한 정책을 체계적으로 수립할 필요가 있으며 예측 불가능한 위험상황을 대비한 부산항 항만안전 회복탄력성을 강화할 필요가 있다. 끝으로 다양하게 변화하는 사회적 여건에 맞춰 항만안전 강화를 도모할 수 있는 선진적인 연구 활동이 필요할 것이다.