• Title/Summary/Keyword: news data

Search Result 888, Processing Time 0.038 seconds

키워드 분석을 이용한 개인화 모바일 웹 뉴스 컨텐츠 생성에 관한 연구 (A Study on Personalized Mobile Web News Contents Creation using Keyword Analysis)

  • 한승현;임영환
    • 한국컴퓨터정보학회논문지
    • /
    • 제12권3호
    • /
    • pp.277-285
    • /
    • 2007
  • 본 연구에서는 웹 뉴스 채널 컨텐츠의 키워드 분석을 이용한 개인화된 모바일 웹 컨텐츠 생성 방법에 대해 제안한다. 기존의 웹 사이트의 뉴스기사 검색에서 제공하는 RSS와 연계된 웹 컨텐츠에서 빠르게 데이터를 획득하고, 키워드 분석을 통한 개인화 기법을 적용하여 컨텐츠를 필터링한다. 제안한 방법을 사용함으로써 수많은 뉴스 채널에서 보다 빠르고 쉽게 모바일용 웹 컨텐츠를 생성할 수 있어 컨텐츠 제작비용을 줄일 수 있다. 또한 키워드 분석을 이용하여 무선 인터넷 사용자들의 보다 세밀한 관심영역에 대응할 수 있으며 컨텐츠 필터링과 컨텐츠 접근에 대한 만족도를 향상시킬 수 있다.

  • PDF

대여 한복에 대한 연구 - 2006년과 2016년 시장과 소비자 변화를 중심으로 - (A study on the rental Hanbok - Focusing on the market and consumer changes between 2006 and 2016 -)

  • 심준영
    • 복식문화연구
    • /
    • 제25권3호
    • /
    • pp.405-418
    • /
    • 2017
  • The purpose of this study is to investigate changes in the rental Hanbok market and consumer during the past 10 years. This study was done by analyzing internet news about rental Hanbok and in-depth interview. The results provide basic data that can be used to understand the rental Hanbok market. Results showed the followings: First, the rental Hanbok market has expanded and consists of two types of rental Hanbok; ceremonial and experiential. The experiential Hanbok is new but a big part in rental Hanbok market. It is not existed until 2007 but it accounted for more than 60% of internet news about rental Hanbok in 2016. Second, there is a significant difference in consumer behavior between the two types of rental Hanbok. Ceremonial Hanbok showed consistent consumer behavior between 2006 and 2016. Consumer want to get benefits such as TPO(occasion suitability), economy, exhibition, trendy and exceptionality through renting Hanbok. On the other hand, experiential Hanbok, consumers are motivated by having unique, conformity and sharing memories. Based on these results, different sets of information reveal the unique features of the two types of rental Hanbok. And also needed to develop new designs and marketing strategies for them.

Speaker Tracking Using Eigendecomposition and an Index Tree of Reference Models

  • Moattar, Mohammad Hossein;Homayounpour, Mohammad Mehdi
    • ETRI Journal
    • /
    • 제33권5호
    • /
    • pp.741-751
    • /
    • 2011
  • This paper focuses on online speaker tracking for telephone conversations and broadcast news. Since the online applicability imposes some limitations on the tracking strategy, such as data insufficiency, a reliable approach should be applied to compensate for this shortage. In this framework, a set of reference speaker models are used as side information to facilitate online tracking. To improve the indexing accuracy, adaptation approaches in eigenvoice decomposition space are proposed in this paper. We believe that the eigenvoice adaptation techniques would help to embed the speaker space in the models and hence enrich the generality of the selected speaker models. Also, an index structure of the reference models is proposed to speed up the search in the model space. The proposed framework is evaluated on 2002 Rich Transcription Broadcast News and Conversational Telephone Speech corpus as well as a synthetic dataset. The indexing errors of the proposed framework on telephone conversations, broadcast news, and synthetic dataset are 8.77%, 9.36%, and 12.4%, respectively. Using the index tree structure approach, the run time of the proposed framework is improved by 22%.

AWS를 활용한 분산 웹 크롤러 기반 가스 안전 이슈 분석 (Issue Analysis on Gas Safety Based on a Distributed Web Crawler Using Amazon Web Services)

  • 김용영;김용기;김대식;김미혜
    • 디지털융복합연구
    • /
    • 제16권12호
    • /
    • pp.317-325
    • /
    • 2018
  • 새로운 경제적 가치를 창출하고 국가경쟁력을 강화할 목적으로 세계 각국의 정부와 주요 민간 기업들은 빅데이터에 지속적인 관심과 과감한 투자를 하고 있다. 뉴스와 같이 객관적인 데이터를 수집하기 위해서, 데이터 무결성 및 품질의 확보는 전제되어야 한다. 포털 뉴스와 같이 객관적이고 방대한 데이터를 바탕으로 의사결정이나 트렌드 분석을 하고자 하는 연구자나 실무자의 경우, 기존 크롤러 방식을 이용할 경우 데이터 수집 자체가 차단되는 문제점이 발생한다. 본 연구에서는 Amazon Web Services (AWS)에서 제공하는 클라우드 서비스 플랫폼을 이용하여 기존 크롤러 방식의 문제점을 해결하여 웹 데이터를 수집하는 방법을 구현하였다. 또한 이를 바탕으로 국민의 안전과 직결되는 가스 안전 관련 기사를 수집하여 가스 안전과 관련된 이슈를 분석하였다. 본 연구를 통해 가스 안전을 확보하기 위해 5가지 분류, 즉 사고/발생, 예방, 유지/관리, 정부/정책, 그리고 대상 등을 기준으로 가스 안전을 위한 전략이 수립되고, 체계적으로 운영되어야 함으로 확인하였다.

유저 모델과 실시간 뉴스 스트림을 사용한 트윗 개체 링킹 (Entity Linking For Tweets Using User Model and Real-time News Stream)

  • 정소윤;박영민;강상우;서정연
    • 인지과학
    • /
    • 제26권4호
    • /
    • pp.435-452
    • /
    • 2015
  • 최근 개체 링킹에 대한 연구들은 지식 베이스를 외부 자원으로 사용하여 실세계의 지식과 의미적인 관련도를 통해 중의성을 해소하는데 중점을 두고 있다. 지식 베이스를 사용한 개체 링킹은 신문기사나 블로그 포스트 등에서는 좋은 성능을 보이지만, 마이크로블로그에서는 짧은 텍스트 길이와 지식 베이스에 존재하지 않는 주제를 다루는 특성 때문에 비교적 낮은 성능을 보인다. 본 논문에서는 140자가 되지 않는 짧은 텍스트 내에서 실시간으로 빠르게 정보를 공유하는 특성을 가지는 마이크로블로그에서 나타나는 개체명의 중의성을 해소하는 방법을 제안한다. 제안하는 방법은 지식 베이스만 사용하는 개체 링킹의 한계를 극복하기 위해 마이크로블로그 사용자 기록과 뉴스 기사를 이용하고, 지식 베이스에 존재하는 특정 엔트리로 개체 링킹을 수행한다. 본 논문에서는 개체명을 포함하는 한국어 트윗을 추출하여 데이터를 구축하였다. 성능 평가는 정확도 지표(시스템이 정답으로 판정한 데이터 개수/전체 데이터 개수)를 사용하였으며, 제안하는 시스템은 구축한 데이터에서 기존 지식 베이스만 사용한 개체 링킹 시스템보다 높은 67.7%의 정확도를 나타내었다.

빅데이터를 통해 본 한국사회의 미래: 언론사 뉴스기사와 사회과학 학술논문의 '미래사회' 관련 키워드 분석 (Forecasting the Future Korean Society: A Big Data Analysis on 'Future Society'-related Keywords in News Articles and Academic Papers)

  • 김문조;이왕원;이혜수;서병조
    • 정보화정책
    • /
    • 제25권4호
    • /
    • pp.37-64
    • /
    • 2018
  • 본 연구는 빅데이터 분석을 통해 한국사회의 미래를 예견해보고자 한 것이다. 이러한 목적을 위해 일차적으로 국내 127개 주요 언론사의 뉴스기사(매체지) 및 사회과학 우수학술지 논문초록(학술지) DB에서 '미래사회' 관련 텍스트를 선정한 후, 해당 기사의 제목 및 논문 키워드로부터 주제어를 추출하였다. 추출한 핵심 주제어의 출현 빈도, 연도별 추세 및 주제어/연관어 연결망구조에 의거해 한국사회의 미래적 관심사를 탐지한 결과, 매체지의 미래 관심사는 '경제', '정치', '과학기술', 학술지의 그것은 '심리', '직무', '문화' 관련 사항들이 주축을 이루고 있음이 확인되었다. 여기에 $J{\ddot{u}}rgen$ Habermas의 '체계와 생활세계(system and life-world)' 개념틀을 적용하면, 매체지와 학술지의 미래 관심은 각기 '체계' 및 '생활세계' 범주에 집중되어 있다는 결론에 이르게 된다. 이 같은 미래 관심사의 분화 양상에 착안해 사회적 도전 과제들을 상이한 여건이나 가치들 간의 불일치의 소산으로 인식하는 '부조화론(mismatch theory)'을 미래연구를 위한 대안적 패러다임으로 제시함으로써, 절대적 혹은 상대적 빈곤 문제에 천착해 온 미래사회의 인식 수준을 한 단계 높이고자 한다.

텍스트마이닝을 활용한 "잊힐 권리"의 토픽 분석 (Topic Analysis of the "Right to be Forgotten" Using Text Mining)

  • 이소현;구본진
    • 정보관리학회지
    • /
    • 제39권2호
    • /
    • pp.275-298
    • /
    • 2022
  • 본 연구는 잊힐 권리와 관련한 뉴스 기사와 학술지 게재 논문을 대상으로 텍스트마이닝 분석을 활용해 각 문서 내에 나타난 논점과 특성을 살펴보았다. 분석을 위해 '잊힐 권리'와 '잊혀질 권리' 키워드를 검색어로 하여 2010년부터 2020년까지의 데이터를 수집하였다. 수집된 데이터를 대상으로 키워드 분석과 토픽모델링 분석을 수행한 결과, 지난 10년간 뉴스 기사와 학술지 논문에서 다루어진 쟁점은 크게 다르지 않으며, 접근방법 또한 유사한 것으로 나타났다. 다만 뉴스 기사와 학술지 논문 간 비교를 통해 이들 간 공통적으로 나타나는 쟁점과 부분적인 쟁점의 차이가 있음을 확인하였다. 따라서 본 연구에서 도출된 쟁점을 중심으로 기록관리학 분야에서도 적극적인 논의가 이루어져야 할 필요가 있으며, 공통적인 쟁점들을 우선적으로 고려하되, 쟁점상 이견이 존재하는 경우, 이를 다각적으로 논의하는 것이 필요하다고 볼 수 있다. 본 연구는 국내 기록관리학계에서 잊힐 권리와 관련된 논의가 이루어지고 있지 않은 현재의 상황에서 기록관리학 분야에서 잊힐 권리의 의미와 향후 발생할 수 있는 이슈를 도출해볼 수 있었다는데 의의가 있으며, 본 연구의 결과를 중심으로 기록관리학 분야에서 잊힐 권리에 대한 다양한 논의가 이루어지기를 기대한다.

토픽모델링을 이용한 한국 인터넷 뉴스의 간호사 관련 기사 분석: COVID-19 유행시기를 중점으로 (A topic modeling analysis for Korean online newspapers: Focusing on the social perceptions of nurses during the COVID-19 epidemic period)

  • 장수정;박선아;손예동
    • 한국간호교육학회지
    • /
    • 제28권4호
    • /
    • pp.444-455
    • /
    • 2022
  • Purpose: This study explored the meaning of the social perceptions of nurses in online news articles during the coronavirus disease 2019 (COVID-19) pandemic. Methods: A total of 339 nurse-related articles published in Korean online newspapers from January 1 to December 31, 2020, were extracted by entering various combinations of OR and AND with the four words "Corona," "COVID," "Nursing," and "Nurse" as search keywords using BIGKinds, a news database provided by the Korea Press Foundation. The collected data were analyzed with a keyword network analysis and topic modeling using NetMiner 4. Results: The top keywords extracted from the nurse-related news articles were, in the following order, "metropolitan area," "protective clothing," "government," "task," and "admission." Four topics representing keywords were identified: "encouragement for dedicated nurses," "poor work environment," "front-line nurses working with obligation during the COVID-19 pandemic," and "nurses' efforts to prevent the spread of COVID-19." Conclusion: The media's attention to the dedication of nurses, the shortage of nursing resources, and the need for government support is encouraging in that it forms the public opinion necessary to lead to substantial improvements in treating nurses. The nursing community should actively promote policy proposals to improve treatment toward nurses by utilizing the net function of the media and proactively seek and apply strategies to improve the image of nurses working in various fields.

R기반 빅데이터 분석기법을 활용한 상수도시스템 누수사고 분석 (Water leakage accident analysis of water supply networks using big data analysis technique)

  • 홍성진;유도근
    • 한국수자원학회논문집
    • /
    • 제55권spc1호
    • /
    • pp.1261-1270
    • /
    • 2022
  • 본 연구의 목적은 사람들이 쉽게 접할 수 있는 포털의 뉴스 검색 결과를 활용하여 쉽게 접근, 활용하지 못하는 상수도 누수 관련 정보를 모아 분석하는 것이다. 상수도 시스템의 누수사고 빅데이터 뉴스의 추출을 위한 웹크롤링 기법을 적용하고 정확한 누수사고 뉴스를 획득하고자 알고리즘을 절차화하여 제시하였다. 또한 추출된 누수사고 기사에서 발생일시, 피해영향, 발생지점, 피해원인, 피해시설 등과 같은 추가적인 정보의 획득이 가능하도록 상수도 누수사고 정보 분석에 적합한 데이터 분석 기법을 개발하였으며 그에 따른 적용결과를 제시하였다. 본 연구에서 제안한 빅데이터 기반 누수 분석을 통한 가치 추출은 기존의 상수도통계 결과와 비교를 통한 유의미한 가치를 추출하는 데 1차적 목표가 있으며, 이와 같은 분석 결과를 활용하여 향후 누수 사고 대응에 있어 소비자의 반응에 효과적으로 대응하거나 서비스 수준을 결정하는데 활용할 수 있다. 즉, 이와 같은 분석결과의 제시를 통해 사고와 같은 정보를 대중에 조금더 알려야하는 필요성을 제시하고, 사고 발생시 빠른 대처가 가능할 수 있는 전파 및 대응 체계를 마련하는데 연계활용할 수 있다.

텍스트마이닝을 활용한 대전시 공공도서관 이용자의 인식과 경험 연구 - SNS와 온라인 뉴스 기사를 중심으로 - (A Study on the Perception and Experience of Daejeon Public Library Users Using Text Mining: Focusing on SNS and Online News Articles)

  • 최지원;곽승진
    • 한국문헌정보학회지
    • /
    • 제58권2호
    • /
    • pp.363-384
    • /
    • 2024
  • 본 연구는 텍스트마이닝 기법을 중심으로 빅데이터 분석을 활용하여 대전시 공공도서관에 대한 이용자의 인식과 경험을 살펴보고자 수행되었다. 이를 위하여 첫째, 소셜미디어에 나타난 이용후기 데이터를 수집하여 대전시 공공도서관에 대한 이용자들의 전반적인 인식과 평가를 탐색하였다. 둘째, 온라인 뉴스 기사 분석을 통해 사회적으로 논의되고 있는 현안을 파악하였다. 분석 결과, 첫째로 어린이 동반 이용자 비중의 높다는 것과 다음으로 LDA 분석을 통한 토픽이 '문화행사/프로그램', '자료 이용', '물리적 환경 및 시설', '도서관 서비스'의 네 가지 분류로 나타난다는 것, 마지막으로 뉴스기사 데이터에 도서관 및 복합문화공간 추가 건립과 도서관 협력 체계 구축에 대한 키워드가 핵심적으로 등장한다는 것을 확인하였다. 이를 바탕으로 지역 균형을 고려한 공공도서관 건립과 육아 및 보육 기관과의 업무협약을 통한 사회적 육아공동체 네트워크 조성을 제안하였다. 본 연구를 활용하여 대전시 공공도서관의 정책적·사회적 흐름을 알아보고 지역사회 수요를 반영하는 공공도서관 운영을 데이터에 기반하여 실행할 수 있기를 기대한다.