• 제목/요약/키워드: 뉴스기사

검색결과 505건 처리시간 0.028초

4차 산업혁명의 시사적 교육을 위한 e-NIE 및 Edmodo 콘텐츠 활용 (Contents Application of e-NIE and Edmodo for Industry 4.0 Education)

  • 장희선
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2018년도 춘계 종합학술대회 논문집
    • /
    • pp.369-370
    • /
    • 2018
  • 본 논문에서는 대학의 교양 및 전공 수업에서 4차 산업혁명의 시사적 내용을 이해하기 위하여 최신 ICT 기술, 서비스, 산업 등과 관련된 뉴스 및 신문 기사를 활용한 교육 모델을 제시한다. 교육 모델에서는 다양한 뉴스 신문 기사를 서로 비교하면서 보기 위하여 e-NIE(electronic news in education)와 전 세계 교육용 SNS인 Edmodo 콘텐츠 활용 방법을 소개한다. 수강생들을 실험집단으로 설정하여 수강 전과 후의 정성적 효과를 분석한 결과, 대학에서의 뉴스 신문 활용 강좌의 필요성에 대하여 크게 동감하였다(5점 척도의 점수가 14.9% 향상).

  • PDF

준 지도 학습과 커리큘럼 학습을 이용한 유사 기사 추천 모델 (Semi-supervised GPT2 for News Article Recommendation with Curriculum Learning)

  • 서재형;오동석;어수경;박성진;임희석
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2020년도 제32회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.495-500
    • /
    • 2020
  • 뉴스 기사는 반드시 객관적이고 넓은 시각으로 정보를 전달하지 않는다. 따라서 뉴스 기사를 기존의 추천 시스템과 같이 개인의 관심사나 사적 정보를 바탕으로 선별적으로 추천하는 것은 바람직하지 않다. 본 논문에서는 최대한 객관적으로 다양한 시각에서 비슷한 사건과 인물에 대해서 판단할 수 있도록 유사도 기반의 기사 추천 모델을 제시한다. 길이가 긴 문서 사이의 유사도를 측정하기 위해 GPT2 [1]언어 모델을 활용했다. 이 과정에서 단방향 디코더 모델인 GPT2 [1]의 단점을 추가 학습으로 개선했으며, 저장 공간의 효율과 핵심 문단 추출을 위해 BM25 [2]함수를 사용했다. 그리고 준 지도 학습 [3]을 통해 유사도 레이블링이 되어있지 않은 최신 뉴스 기사에 대해서도 자가 학습을 진행했으며, 이와 함께 길이가 긴 문단에 대해서도 효과적으로 학습할 수 있도록 문장 길이를 기준으로 3개의 단계로 나누어진 커리큘럼 학습 [4]방식을 적용했다.

  • PDF

복수의 신문기사 자동요약에 관한 실험적 연구 (An Experimental Study on Automatic Summarization of Multiple News Articles)

  • 김용광;정영미
    • 정보관리학회지
    • /
    • 제23권1호
    • /
    • pp.83-98
    • /
    • 2006
  • 이 연구에서는 복수의 신문기사를 자동으로 요약하기 위해 문장의 의미범주를 활용한 템플리트 기반 요약 기법을 제시하였다. 먼저 학습과정에서 사건/사고 관련 신문기사의 요약문에 포함할 핵심 정보의 의미범주를 식별한 다음 템플리트를 구성하는 각 슬롯의 단서어를 선정한다. 자동요약 과정에서는 입력되는 복수의 뉴스기사들을 사건/사고 별로 범주화한 후 각 기사로부터 주요 문장을 추출하여 템플리트의 각 슬롯을 채운다. 마지막으로 문장을 단문으로 분리하여 템플리트의 내용을 수정한 후 이로부터 요약문을 작성한다. 자동 생성된 요약문을 평가한 결과 요약 정확률과 요약 재현율은 각각 0.541과 0.581로 나타났고, 요약문장 중복률은 0.116으로 나타났다.

Latent Dirichlet Allocation 기법을 활용한 해외건설시장 뉴스기사의 토픽 모델링(Topic Modeling) (Topic Modeling of News Article about International Construction Market Using Latent Dirichlet Allocation)

  • 문성현;정세환;지석호
    • 대한토목학회논문집
    • /
    • 제38권4호
    • /
    • pp.595-599
    • /
    • 2018
  • 해외건설 프로젝트를 기획하고 수행하는 과정에서 현지 시장의 상황을 신속하고 정확하게 파악하는 것은 수익성 창출에 매우 큰 영향을 미친다. 뉴스기사 데이터는 정치, 경제, 사회 등 다양한 관한 정보를 담고 있기 때문에 시장의 상황을 파악하는 데 사용할 수 있는 좋은 데이터이다. 텍스트의 형태로 존재하는 대량의 뉴스기사 데이터로부터 정보를 추출하고 내용을 요약하는 과정에서 인력, 비용, 시간의 소모를 줄이기 위해 텍스트마이닝 기술이 필요하다. 본 연구에서는 뉴스기사에 다양한 주제가 공존한다는 특성으로 인해 발생하는 정보 추출의 한계를 극복하기 위해 잠재 디리클레 할당(Latent Dirichlet Allocation) 방법론을 사용하여 토픽 모델링을 수행했다. 문서 집단에 존재하는 주제의 개수가 10개라고 가정했을 때, 이용자들의 편의 증진을 위한 프로젝트(2번 주제)와 아프리카 지역의 빈곤 문제를 해결하기 위한 민간 차원의 지원(4번 주제) 등의 주제 집단이 존재하는 것을 확인했다. 이와 같이 문서 집단의 주제를 구분함으로써 더욱 의미있는 정보를 추출하고, 요약 결과의 활용성을 높일 수 있다.

뉴스기사의 연관 단어 텍스트 마이닝을 이용한 스타의 분야별 기여도순위 비교기법 (Ranking Contribution of Star in Each Domain Using Association Text Mining News Articles on the Web)

  • 강윤정;윤재열;임지연;김응모
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2011년도 추계학술발표대회
    • /
    • pp.1191-1194
    • /
    • 2011
  • 스타의 대중에 대한 인기가 브랜드의 이미지 제고와 상업적 영향을 끄는 마케팅 전략을 스타 마케팅이라고 한다. 오늘날의 스타는 방송, 연예활동뿐만 아니라 스포츠, 정치활동, 사회기여활동 등 다양한 분야에서 활약하며 스타의 이미지는 그 활약상에 영향을 받는다. 스타의 이미지는 브랜드 및 기업의 이미지로 직결되므로 그에 대한 사전분석은 마케팅에서 중요한 요소이다. 그래서 일반적으로 스타들이 활약하는 도메인을 분류하여서 그 스타에 대해서 검색을 하였을 때 어떤 분야에서 활약하고 기여를 하는지 그 기여도를 도메인에 따라 랭킹을 매기는 방법을 제안한다. 뉴스기사에서 텍스트 마이닝 기술을 이용하여 스타의 이름과 활동 도메인들에 대해서 관련단어를 빈도에 따라 추출한다. 그리고 관련된 단어들을 이용하여 스타에 대한 뉴스 중 각 도메인과 관련된 기사들을 카운트하며 도메인에 대해서 긍정 혹은 부정적인 보도내용일 경우에는 극성을 부여하여 그 가중치를 달리한다. 빈도 및 극성을 고려한 점수화에 의해 스타가 기여하는 분야에 대한 순위를 매긴다.

20세기 하반기의 미 신문 1면 보도에 대한 다양성 분석: 뉴스 토픽과 정보원의 분포를 중심으로 (Topic and Source Diversity of the Front Page in the New York Times, Chicago Tribune and the Los Angeles Times from 1950 to 2000)

  • 심훈
    • 한국언론정보학보
    • /
    • 제30권
    • /
    • pp.175-201
    • /
    • 2005
  • 본 논문은 '다양성'이라는 규범적 가치에 입각해 뉴스 기사 선별 및 취재 경로와 관련한 미 신문의 뉴스 제작 방식에는 어떤 변화가 진행돼 왔는지를 통시적으로 살펴보고 있다. 이에 따라 본고에서는 '뉴스 토픽'과 '정보원' 등 두 가지 분야에서 지난 50년간 뉴욕 타임스와 시카고 트리뷴, 로스앤젤레스 타임스 등 3대 유력 일간지의 1면 기사를 분석, 연대기적인 가치 변화를 추적해 보았다. 데이터 분석 결과, 지난 반세기 동안 미 신문에서 정부 및 정치권에 대한 정보원의 의존도는 지속적으로 줄어들고 있는 반면, 기업/산업체발 정보원의 등장은 점차 빈번해 지고 있는 것으로 나타났다. 이와 함께, 뉴스 주제의 분포에 있어서는 사건, 사고 기사의 감소와 군사, 안보기사의 퇴조 속에, 경제, 건강, 교육 등과 같은 주제가 점차 활발하게 다뤄지고 있는 것으로 조사됐다. 그러나 전통적인 비인기 주제였던 빈곤, 노동, 소수자, 사회 갈등 등과 같은 토픽들은 시대를 거듭해도 제자리를 맴돌거나 오히려 줄어들고 있는 것으로 나타났다.

  • PDF

Comparative Analysis of News Articles related to Airlines and Staff the Previous Corona19(2019) and After Corona19(2020)

  • Kim, Jeong-O;Kwon, Choong-Hoon
    • 한국컴퓨터정보학회논문지
    • /
    • 제25권7호
    • /
    • pp.167-173
    • /
    • 2020
  • 본 연구는 코로나19의 세계적 대유행(Pandemic)으로 인하여 세계경제가 다양한 문제에 직면하는 상황에서 항공사와 종사원에대한 기사들은 코로나19이전과 이후에 어떤 변화를 나타내고 있는지 시기적인 분석을 통한 언론사뉴스 기사건수와 트렌드를 분석해보고자 하는 것이다. 이를 위해 한국 언론진흥재단(Korea Press Foundation) 빅카인즈(Bigkinds) 뉴스 분석 서비스를 이용하여 코로나19 이전과 이후 항공사와 종사원에 관련된 기사건수와 트렌드를 분석하여 시각화하였다. 이를 위해 2019년 1월1일에서 5월 31일까지 그리고 2020년 1월 1일에서 5월 31일까지 빅카인즈 서비스 시스템을 통해 추출하였다. 분석 결과 코로나19 이전 과 이후에 기사건수는 항공관련이벤트가 발생한 경우 폭발적으로 증가하였다. 그리고 구조조정관련 뉴스로 트렌드의 변화가 일어나고 있음을 확인할 수 있었다. 코로나19의 영향에 따른 항공 산업의 위기 극복을 위해 정부 및 항공사의 적극적인 노력이 필요할 것이다. 본 연구 결과는 코로나19 이전과 이후 뉴스기사와 관련된 건수와 트렌드를 분석하여 향후 항공사 및 종사원에게 닥칠 수 있는 영향에 대한 전략 수립에 필요한 실무적 시사점을 제시하였다는 점에서 의의를 갖는다.

네이버 뉴스스탠드의 신문지면에 대한 비교분석 -10개 종속형 온라인 신문의 홈페이지를 중심으로 (An Analysis on the Newspaper's Layout of the News Stand in NAVER -Focusing on the Websites of 10 dependent Online Newspapers)

  • 박광순
    • 디지털융복합연구
    • /
    • 제16권9호
    • /
    • pp.365-374
    • /
    • 2018
  • 본 연구는 네이버 뉴스스탠드의 10개 종합일간지 홈페이지에 대한 분석을 통해 온라인 신문의 지면구성 요소와 각 신문의 지면구성은 어떻게 차별화되고 있는가를 파악하기 위해 실시되었다. 자료 수집은 두 차례에 걸쳐 실시되었으며, 분석 방법은 일원분산분석(One-Way ANOVA) 기법을 이용하였다. 분석 내용은 시각적 이미지 유형, 사진기사와 제목기사 수, 메인기사 이미지의 크기다. 분석결과 종이신문과 차별화되는 오디오, 동영상, 카드, 슬라이드 형식의 뉴스기사 비율이 매우 낮았으며, 그래픽 소스를 이용한 뉴스기사도 극소수에 불과했다. 그러나 전체적인 면에서 네이버 뉴스스탠드의 신문들은 다양한 편집기법을 이용하여 지면의 차별화를 꾀하고 있었다. 본 연구의 의의는 신문의 뉴스소비 촉진을 위한 편집방향에 기초적인 단서를 제공할 수 있을 것이다. 뉴미디어 기술에 의한 미디어 생태계가 빠르게 재형성되고 있는 가운데 신문지면은 어떻게 변화되는가에 대한 지속적인 연구가 필요할 것이다.

분산 처리 환경에서의 기계학습 기반의 뉴스 기사 빅 데이터 분석 (News Article Big Data Analysis based on Machine Learning in Distributed Processing Environments)

  • 오희빈;이정청;김경섭
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2017년도 추계학술발표대회
    • /
    • pp.59-62
    • /
    • 2017
  • 본 논문에서는 텍스트 형태의 빅 데이터를 분산처리 환경에서 기계학습을 이용하여 분석하고 유의미한 데이터를 만들어내는 시스템에 대해 다루었다. 빅 데이터의 한 종류인 뉴스 기사 빅 데이터를 분산 시스템 환경(Spark) 내에서 기계 학습(Word2Vec)을 이용하여 뉴스 기사의 키워드 간의 연관도를 분석하는 분산 처리 시스템을 설계 및 구현하였고, 사용자가 입력한 검색어와 연관된 키워드들을 한눈에 파악하기 쉽게 만드는 시각화 시스템을 설계하였다.

온라인 뉴스 기사 헤드라인의 논조에 따른 댓글 양상 (Comments Complexion by Argument's Tone of Online News Headline)

  • 서기열;권가진
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2018년도 추계학술발표대회
    • /
    • pp.869-872
    • /
    • 2018
  • 온라인 뉴스 소비의 확산과 함께 댓글은 여론 형성에 큰 역할을 담당한다. 그러나 아직 댓글에 영향을 미치는 형식 요소에 대한 실증 데이터 기반의 연구는 미흡하다. 본 연구는 이의 시작으로 온라인 뉴스 기사 소비의 두 가지 중요 요소 즉, 헤드라인과 댓글의 관계에 대해 다루고자 한다. 이를 위해, 헤드라인의 논조 유무에 따른 댓글의 논쟁 활성화 정도 차를 확인하고자 댓글의 수와 길이를 분석하였다. '이세돌, 알파고 바둑대결', '최저임금', '북미회담' 기사로 총 537건의 해드라인과 약 85만개의 댓글을 수집하였다. 그 결과 논쟁 활성화 측면에서 논조가 있는 헤드라인일때 댓글의 수가 많고 길이가 길어 논쟁이 더 활발한 것을 할 수 있었다. 또, 댓글의 논쟁 주제도 차이가 있어 헤드라인의 논조가 있는 경우에 의견이나 감정을 표출하는 토픽이 더 많았다. 본 연구는 실증 데이터를 통해, 헤드라인의 논조 유무가 댓글의 논쟁의 활성화 정도와 주제에 영향을 주는 요소임을 밝힘으로써 댓글 소비에 대한 새로운 관점을 제시하고, 헤드라인의 형식 요소의 연구의 중요성을 확인한 데 그 의의가 있다.