• 제목/요약/키워드: news data

검색결과 888건 처리시간 0.024초

생성 AI기반 뉴스 감성 분석과 부동산 가격 예측: LSTM과 VAR모델의 적용 (Sentiment Analysis of News Based on Generative AI and Real Estate Price Prediction: Application of LSTM and VAR Models)

  • 김수아;권미주;김현희
    • 정보처리학회 논문지
    • /
    • 제13권5호
    • /
    • pp.209-216
    • /
    • 2024
  • 부동산 시장은 다양한 요인에 의해 가격이 결정되며 거시경제 변수뿐 만 아니라 뉴스 기사, SNS 등 다양한 텍스트 데이터의 영향을 받는다. 특히 뉴스 기사는 국민들이 느끼는 경제 심리를 반영하고 있으므로 부동산 매매 가격 예측에 있어 중요한 요인이다. 본 연구에서는 뉴스 기사를 감성 분석하여 그 결과를 뉴스 감성 지수로 점수화 한 후 부동산 가격 예측 모델에 적용하였다. 먼저 기사 본문을 요약 후 요약된 내용을 바탕으로 생성 AI를 활용하여 긍정, 부정, 중립으로 분류한 다음 총 점수를 산출하였고 이를 부동산 가격 예측 모델에 적용하였다. 부동산 가격 예측 모델로는 Multi-head attention LSTM 모델과 Vector Auto Regression 모델을 사용하였다. 제안하는 뉴스 감성 지수를 적용하지 않은 LSTM 예측 모델은 1개월, 2개월, 3개월 예측에서 각각 0.60, 0.872, 1.117의 Root Mean Square Error (RMSE)을 보였으며, 뉴스 감성 지수를 적용한 LSTM 예측 모델은 각각 0.40, 0.724, 1.03의 RMSE값을 나타낸다. 또한 뉴스 감성 지수를 적용하지 않은 Vector Auto Regression 예측 모델은 1개월, 2개월, 3개월 예측에서 각각 1.6484, 0.6254, 0.9220, 뉴스 감성 지수를 적용한 Vector Auto Regression 예측 모델은 각각 1.1315, 0.3413, 1.6227의 RMSE 값을 나타낸다. 앞선 아파트 매매가격지수 예측 모델을 통해 사회/경제적 동향을 반영한 부동산 시장 가격 변동을 예측할 수 있을 것으로 보인다.

주가지수 방향성 예측을 위한 주제지향 감성사전 구축 방안 (Predicting the Direction of the Stock Index by Using a Domain-Specific Sentiment Dictionary)

  • 유은지;김유신;김남규;정승렬
    • 지능정보연구
    • /
    • 제19권1호
    • /
    • pp.95-110
    • /
    • 2013
  • 최근 다양한 소셜미디어를 통해 생성되는 비정형 데이터의 양은 빠른 속도로 증가하고 있으며, 이를 저장, 가공, 분석하기 위한 도구의 개발도 이에 맞추어 활발하게 이루어지고 있다. 이러한 환경에서 다양한 분석도구를 통해 텍스트 데이터를 분석함으로써, 기존의 정형 데이터 분석을 통해 해결하지 못했던 이슈들을 해결하기 위한 많은 시도가 이루어지고 있다. 특히 트위터나 페이스북을 통해 실시간에 근접하게 생산되는 글들과 수많은 인터넷 사이트에 게시되는 다양한 주제의 글들은, 방대한 양의 텍스트 분석을 통해 많은 사람들의 의견을 추출하고 이를 통해 향후 수익 창출에 기여할 수 있는 새로운 통찰을 발굴하기 위한 움직임에 동기를 부여하고 있다. 뉴스 데이터에 대한 오피니언 마이닝을 통해 주가지수 등락 예측 모델을 제안한 최근의 연구는 이러한 시도의 대표적 예라고 할 수 있다. 우리가 여러 매체를 통해 매일 접하는 뉴스 역시 대표적인 비정형 데이터 중의 하나이다. 이러한 비정형 텍스트 데이터를 분석하는 오피니언 마이닝 또는 감성 분석은 제품, 서비스, 조직, 이슈, 그리고 이들의 여러 속성에 대한 사람들의 의견, 감성, 평가, 태도, 감정 등을 분석하는 일련의 과정을 의미한다. 이러한 오피니언 마이닝을 다루는 많은 연구는, 각 어휘별로 긍정/부정의 극성을 규정해 놓은 감성사전을 사용하며, 한 문장 또는 문서에 나타난 어휘들의 극성 분포에 따라 해당 문장 또는 문서의 극성을 산출하는 방식을 채택한다. 하지만 특정 어휘의 극성은 한 가지로 고유하게 정해져 있지 않으며, 분석의 목적에 따라 그 극성이 상이하게 나타날 수도 있다. 본 연구는 특정 어휘의 극성은 한 가지로 고유하게 정해져 있지 않으며, 분석의 목적에 따라 그 극성이 상이하게 나타날 수도 있다는 인식에서 출발한다. 동일한 어휘의 극성이 해석하는 사람의 입장에 따라 또는 분석 목적에 따라 서로 상이하게 해석되는 현상은 지금까지 다루어지지 않은 어려운 이슈로 알려져 있다. 구체적으로는 주가지수의 상승이라는 한정된 주제에 대해 각 관련 어휘가 갖는 극성을 판별하여 주가지수 상승 예측을 위한 감성사전을 구축하고, 이를 기반으로 한 뉴스 분석을 통해 주가지수의 상승을 예측한 결과를 보이고자 한다.

해외 출국에 영향을 미치는 온라인 미디어 효과 분석: 아시아 5개국을 중심으로 (Analyzing the Effect of Online media on Overseas Travels: A Case study of Asian 5 countries)

  • 이혜인;문현실;김재경
    • 지능정보연구
    • /
    • 제24권1호
    • /
    • pp.53-74
    • /
    • 2018
  • 해외 시장 의존형 경제구조를 지닌 우리나라에서 관광산업은 국가경제에 중요한 산업으로 이를 육성하기 위해 정확한 관광 수요 예측이 필요하다. 그에 따라 많은 연구들이 출국 수요를 예측하기 위해 노력해왔으며 출국수요에 영향을 미치는 요인에 대해 다각도로 연구가 이루어져 왔다. 특히 정보기술의 발전으로 최근에는 출국자들의 출국지 선택 등 관광객의 의사결정에 온라인 뉴스, 소셜 네트워크 서비스 등의 온라인 미디어가 많은 영향을 끼치고 있다. 이에 본 연구는 온라인 미디어가 발생시키는 구전 효과가 출국 수요에 미치는 영향을 살펴보고 그 영향 관계를 규명하고자 하였다. 온라인 미디어는 쉽게 접근이 가능하고 공유가 활발하다는 측면에서 구전 효과가 발생되어 사용자들의 의사결정에 영향을 주고 있다. 이를 위해 본 연구에서는 온라인 미디어를 공적 미디어인 뉴스와 사적 미디어인 블로그로 구분하였으며 실제 아시아 5개국의 출국자 수에 이들 미디어가 미치는 영향 관계를 패널 모형을 통해 분석하였다. 그 결과, 온라인 뉴스의 구전 효과는 출국자 수에 부정적인 영향을 미치지만 블로그의 경우 긍정적 영향 관계를 보였다. 따라서 향후 출국 수요 예측에 있어 온라인 미디어의 구전 효과를 반영해야 하며 이는 미디어의 종류에 따라 차별적으로 적용해야 함을 시사한다. 또한 각 국가별로 온라인 미디어의 특성에 따라 미치는 영향 관계가 차이가 있음을 분석하였다. 즉, 출국 국가에 따라 온라인 미디어의 영향력이 다름에 따라 국가별로 차별적인 예측 및 관리 모형이 필요하다. 본 연구 결과를 통해 관광산업종사자들의 국가와 미디어별 온라인 미디어 기반의 마케팅 전략 수립에 도움을 줄 수 있으리라 기대된다.

제주시의 지속가능한 여행 활성화를 위한 지역화폐 '탐나는전' 가맹점의 리뷰 데이터 분석 (Analysis of Review Data of 'Tamna' Franchisees to Promote Sustainable Travel in Jeju City)

  • 백세희;김세형;배미란;강주영
    • 한국빅데이터학회지
    • /
    • 제7권2호
    • /
    • pp.113-128
    • /
    • 2022
  • 코로나19 이후 '지속가능한 관광'에 대한 관심이 커지면서 '지속가능한 관광'을 하고자 하는 관광객 또한 증가하였다. 그러나, '지속가능한 관광'을 할 수 있는 프로그램과 방법 등이 구체적이지 않다는 문제점이 있다. 또한, 대부분의 '지속가능한 관광'의 관심사가 '환경' 및 '탄소중립' 등에 초점을 맞추고 있어 지역사회에 공헌할 수 있는 프로그램이나 정책들이 많지 않다. 따라서 본 연구에서는 '지속가능한 관광'을 활성화하기 위하여 뉴스 데이터와 리뷰 데이터를 분석하였다. 우선, 본 연구에서는 뉴스 빅데이터 분석을 통해 지속가능한 여행의 주요한 주제들을 도출하였다. 이를 통해 지속가능한 여행의 정책적 주제 및 사건들을 분석한다. 지속가능한 여행과 관련된 뉴스 빅데이터를 분석하여 아직까지 한국에서 지속가능한 여행이 활성화되지 못한 이유들을 분석하고 이를 해결할 수 있는 방안으로 지역사회가 직접 혜택을 볼 수 있는 방안을 도출하고자 한다. 최종적으로, 제주시의 지속가능한 여행 활성화를 위하여 제주 지역화폐인 '탐나는전' 가맹점의 이용자 리뷰 데이터를 분석하고 지역사회와 공생할 수 있는 방안을 제안한다.

GPS 연동 IS-95C 멀티미디어 단말기 구현 (Implementation of IS-95C Multimedia Terminal using GPS)

  • 하재승
    • 한국컴퓨터산업학회논문지
    • /
    • 제2권8호
    • /
    • pp.1133-1138
    • /
    • 2001
  • 본 논문에서는 CDMA이동통신망을 이용하여 뉴스속보, 일기예보 , 스포츠 뉴스 , 문화계 소식 등의 생활정보를 제공하고 동영상/정지영상/자막광고 등을 표출하는 멀티미디어단말기를 구현하였다. GPS 위성을 이용하여 역사나 정류장 안내를 자동화함으로써 대중교통 운전자의 운행 안정성을 제고함은 물론 승객에게 유용한 정보의 제공을 도모할 수 있도록 하였다. 또한 CDMA2000 1×(IS-95C)이동통신망을 통한 실시간 동영상 전송을 실험하였으며, 시스템과 각 모듈을 제어하는 스케줄러를 개발하여 열차와 버스에서 성능 테스트를 하였다. 차량환경에서 높은 신뢰도를 갖도록 설계된 임베디드 프로세서 시스템은 높은 안정성을 보였으며, 이동체에서의 고속 데이터 통신은 IS-95C 통신망에서 약 74Kbps를 나타내었다.

  • PDF

뉴스앵커의 착용의상 색채를 통해 본 방송국 이미지 분석 - KBS, MBC, SBS 방송국 비교- (The Analysis of Broadcasting Station's Image expressed in Wearing Dress Color of News Anchors - Comparison among KBS, MBC, and SBS -)

  • 박진영;이은숙
    • 한국의류산업학회지
    • /
    • 제14권2호
    • /
    • pp.165-172
    • /
    • 2012
  • The purpose of this study was to examine and analyze broadcasting station's image expressed in wearing dress color of male and female news anchors. The data were collected from replay video news(n=180) provided in each station's website during 2005-2010 year. The results were as follows. First, in the case of the male anchor, KBS was focused on the quiet and classic image and the gentle image. MBC was focused on the vital and urban image. SBS was focused on the dynamic and young image. Second, in the case of the female anchor, KBS was focused on the neat, soft, and feminine in S/S season, on the other hand the loud and flamboyant image in F/W season. MBC was focused on the vital and urban image like image of a male anchor. SBS was focused on the private image of a female anchor than broadcasting station's image. Through the results of this study, the image of the individual and companies can be symbolized by the color of dress.

동적 색인 스토리지 및 통합 검색 서비스 개발 (Dynamic index storage and integrated searching service development)

  • 이왕우;이석형;최호섭;윤화묵;김종환;허윤영
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2007년도 추계 종합학술대회 논문집
    • /
    • pp.346-349
    • /
    • 2007
  • 본 논문은 웹뉴스 및 리뷰 검색 서비스를 위해 만든 통합 검색 시스템을 소개한다. 검색 서비스를 위한 데이터 수집을 위해서 특정 사이트에서 수집한 뉴스와 리뷰 문서로부터 제목, 날짜, 저자, 본문처럼 특정한 영역의 데이터만 추출하는 XSLTRobot을 만들었다. XSLTRobot은 원하는 부분의 데이터만 추출하기 위해 XSLT 기술을 이용한다. 여러가지 검색 데이터 형식에 적합한 통합 검색엔진과 통합 검색엔진의 스토리지 모듈중 하나인 동적 색인 저장소(Dynamic Index Storage)를 소개한다. 동적 색인 저장소는 뉴스 데이터처럼 색인의 업데이트가 빨라야 하는 환경에 이용된다. 본 논문에서 제시하는 동적 색인 저장소는 대량의 실시간 업데이트 문서를 처리하지 않기 때문에 검색성능에 초점을 맞춰서 설계하였다.

  • PDF

Emerging Gender Issues in Korean Online Media: A Temporal Semantic Network Analysis Approach

  • Lee, Young-Joo;Park, Ji-Young
    • Journal of Contemporary Eastern Asia
    • /
    • 제18권2호
    • /
    • pp.118-141
    • /
    • 2019
  • In South Korea, as awareness of gender equality increased since the 1990s, policies for gender equality and social awareness of equality have been established. Until recently, however, the gap between men and women in social and economic activities has not reached the globally desired level and led to social conflict throughout the country. In this study, we analyze the content of online news comments to understand the public perception of gender equality and the details of gender conflict and to grasp the emergence and diffusion process of emerging issues on gender equality. We collected text data from the online news that included the word 'gender equality' posted from January 2012 to June 2017 and also collected comments on each selected news item. Through text mining and the temporal semantic network analysis, we tracked the changes in discourse on gender equality and conflict. Results revealed that gender conflicts are increasing in the online media, and the focus of conflict is shifting from 'position and role inequality' to 'opportunity inequality'.

Relative Clauses in a Modern Diachronic Corpus of Singapore English

  • Lee, Kit Mun
    • 아시아태평양코퍼스연구
    • /
    • 제1권1호
    • /
    • pp.31-60
    • /
    • 2020
  • This paper investigates changes in relativization in Singapore English broadsheet newspapers from 1993 to 2016. One of the first diachronic studies in Singapore English (SgE), it also explores corresponding data from the diachronic Siena-Bologna (SiBol) news corpus. As SgE is in the endonormative stabilization phase in Schneider's (2007) Dynamic Model of postcolonial Englishes, divergence from British English (BrE) is to be expected. In this study, the dataset is a new Singapore English Newspaper (SEN) corpus compiled from local news articles in 1993, 2005 and 2016, and the corpus tool employed is Sketch Engine. The results reveal changes in relativization practices in SEN over the given period, many of which occur in a similar pattern as those identified in SiBol, albeit at varying rates of change. Most significant of these include a sharp decline in the which relativizer in restrictive relative clauses with non-animate antecedents, complemented by a rise in that. The change has been so rapid that although which relative clauses were more common than that clauses in 1993, that has subsequently overtaken which for both the corpora. One shift in SEN that is different from SiBol is the increase in frequency of non-restrictive relative clauses in SgE. The likely motivators for the changes in the two varieties are identified as colloquialization, densification and prescriptivism. The effect each of these factors could have had on the varieties are discussed, as well as the implications that the findings have on our understanding of the evolutionary status of SgE as a postcolonial variety.

유비쿼터스 환경을 위한 RSS 뉴스 채널 컨텐츠의 개인화 모바일 서비스 기법 (A Personalized Mobile Service Method of RSS News Channel Contents for Ubiquitous Environment)

  • 한승현;류동엽;임영환
    • 정보처리학회논문지D
    • /
    • 제14D권4호
    • /
    • pp.427-434
    • /
    • 2007
  • 무선단말기는 유비쿼터스 환경을 위한 최적의 장치지만 무선단말기를 이용한 인터넷 서비스는 데스크 탑 환경에 비해 제한적이다. 따라서 본 연구에서는 컨텐츠 기반의 개인화를 이용한 무선 인터넷 서비스 방법에 대해 제안한다. 기존의 웹사이트의 뉴스기사 검색에서 제공하는 RSS와 연계된 웹 컨텐츠에서 빠르게 데이터를 획득하고, 개인화 기법을 적용하여 수많은 뉴스 채널에서 빠르고 쉽게 선호하는 컨텐츠를 이용할 수 있다. 제안 방법을 사용함으로써 컨텐츠 제작비용을 줄일 수 있으며 사용자들의 선호도에 대응하는 개인화된 모바일 웹 뉴스 컨텐츠를 제공할 수 있다.