• 제목/요약/키워드: 빅 이슈

검색결과 303건 처리시간 0.028초

지능 정보검색 서비스를 위한 실시간검색어 변화량 평가 (Evaluating real-time search query variation for intelligent information retrieval service)

  • 정민영
    • 디지털융복합연구
    • /
    • 제16권12호
    • /
    • pp.335-342
    • /
    • 2018
  • 포털 사이트의 핵심 서비스인 검색서비스는 입력되는 검색어 중에서 짧은 순간에 급상승하는 검색어를 대상으로 순간 검색빈도가 높은 것을 기준으로 순위별로 제시하는 것이므로 일정기간 동안 관심도가 높은 검색어를 곧바로 알려주기는 힘들다. 따라서 이를 극복하고 검색어 변화에 대한 향상된 분석결과가 나오게 하여 보다 지능적인 정보검색 서비스를 제공하기 위한 노력이 필요하다. 이를 위하여 본 논문에서는 실시간검색어의 관심도와 지속도, 그리고 주목도를 측정할 수 있는 기준을 제시한다. 그리고 그 기준에 맞추어 일정기간 동안 시간, 일간, 주간, 월간 실시간검색어에 대한 변화의 측정과 집계를 하고 이를 통해 관심도가 높은 이슈, 관심이 길게 지속된 이슈, 변화가능성이 커서 앞으로 주목해야 할 이슈를 평가한다.

기간별 이슈 매핑을 통한 이슈 생명주기 분석 방법론 (Analyzing the Issue Life Cycle by Mapping Inter-Period Issues)

  • 임명수;김남규
    • 지능정보연구
    • /
    • 제20권4호
    • /
    • pp.25-41
    • /
    • 2014
  • 최근 스마트 기기를 통해 소셜미디어에 참여하는 사용자가 급격히 증가하고 있다. 이에 따라 빅데이터 분석에 대한 관심이 높아지고 있으며 최근 포털 사이트에서 검색어로 자주 입력되거나 다양한 소셜미디어에서 자주 언급되는 단어에 대한 분석을 통해 사회적 이슈를 파악하기 위한 시도가 이루어 지고 있다. 이처럼 다량의 텍스트를 통해 도출된 사회적 이슈의 기간별 추이를 비교하는 분석을 이슈 트래킹이라 한다. 하지만 기존의 이슈 트래킹은 두 가지 한계를 가지고 있다. 첫째, 전통적 방식의 이슈 트래킹은 전체 기간의 문서에 대해 일괄 토픽 분석을 실시하고 각 토픽의 기간별 분포를 파악하는 방식으로 이루어지므로, 새로운 기간의 문서가 추가되었을 때 추가된 문서에 대해서만 분석을 추가 실시하는 것이 아니라 전체 기간의 문서에 대한 분석을 다시 실시해야 한다는 실용성 측면의 한계를 갖고 있다. 둘째, 이슈는 끊임 없이 생성되고 소멸될 뿐 아니라, 때로는 하나의 이슈가 둘 이상의 이슈로 분화하고 둘 이상의 이슈가 하나로 통합되기도 한다. 즉, 이슈는 생성, 변화(병합, 분화), 그리고 소멸의 생명주기를 갖게 되는데, 전통적 이슈 트래킹은 이러한 이슈의 가변성을 다루지 않았다는 한계를 갖는다. 본 연구에서는 이러한 한계를 극복하기 위해 대상 기간 전체의 문서를 한꺼번에 분석하는 방식이 아닌 세부 기간별 문서에 대해 독립적인 분석을 수행하고 이를 통합할 수 있는 방안을 제시하였으며, 이를 통해 새로운 이슈가 생성되고 변화하며 소멸되는 전체 과정을 규명하였다. 또한 실제 인터넷 뉴스에 대해 제안 방법론을 적용함으로써, 제안 방법론의 실무 적용 가능성을 분석하였다.

빅데이터를 활용한 안전분야 트렌드 분석 : 가짜뉴스(fake news)를 중심으로 (An Analysis of Trends on the Safety Area Utilizing Big Data : Focused on Fake News)

  • 주성빈
    • 융합보안논문지
    • /
    • 제17권5호
    • /
    • pp.111-119
    • /
    • 2017
  • 2017년 3월 기준, 가짜 뉴스로 인한 폐해는 대체로 정치적 이슈에 집중되어 있다. 국외에서 가짜뉴스 문제는 2016년 미국 대선에서 크게 화제가 된 적이 있고 독일, 프랑스 등 선거를 앞둔 국가들에서도 새로운 정치사회적 문제로 등장하였다. 국내에서는 대통령 탄핵소추 및 탄핵 인용, 조기 대선 등 정치적 이슈와 맞물려 이슈 및 언급량이 집중되고 있다. 이러한 현상은, 최근 다양한 형태의 기사 생성방법 및 정보의 공유방식과 연계되어, 정치적 쟁점과 관련된 가짜 뉴스뿐만 아니라 안전 이슈(safety & security issue)와 관련된 가짜 뉴스의 생산, 확산에 이르고 있고, 결과적으로 국민들에게 상당한 혼란을 야기할 수 있는 정보로 변질될 가능성이 농후하다. 따라서 이러한 문제인식은 관련된 실태분석과 효과적인 대응방안을 고민하는 것은 현 시점에서 중요함을 의미한다. 따라서 이 연구는 가짜 뉴스가 안전 분야에 어떠한 형태로 생성되고 있고, 관련 분야에 어떻게 영향을 미치는가를 확인하는 것이 주요 목적이다. 이를 위해 실시간으로 발생하는 수많은 데이터 속에서 이슈 진단 분석 전망 관리를 위한 정확하고 유의미한 분석을 하고자 하였다. 그 결과, 우리나라에서 언급되고 있는 가짜뉴스는 정치적 이슈뿐만 아니라 안전 이슈와 관련되어 지속적으로 생성되고 있고, 국외에서 발생하는 일반적 형태와는 차이를 보이고 있음을 알 수 있다.

디지털 전환의 미래사회 위험이슈 및 정책적 대응 방향: 인공지능을 중심으로 (A Study on Risk Issues and Policy for Future Society of Digital Transformation: Focusing on Artificial Intelligence)

  • 구본진
    • 기술혁신연구
    • /
    • 제30권1호
    • /
    • pp.1-20
    • /
    • 2022
  • 디지털 전환(digital transformation)은 디짓화(digitisation)와 디지털화(digitalisation)의 경제적 및 사회적 효과를 의미한다. 디지털 전환은 경제/사회 발전 및 삶의 편의성을 향상시키는 유용한 도구로 작용하지만 부정적 영향(개인정보 오남용, 윤리문제 야기, 사회적 격차 심화 등)을 미칠 수도 있는 양면성을 보유하고 있다. 한편 정부는 산업 경쟁력 및 기술 패권 확보 등을 위하여 디지털 전환 촉진정책은 적극적으로 추진하고 있는 반면, 디지털 전환 관련 위험이슈에 대한 이해와 이를 방지할 수 있는 정책 추진에는 상대적으로 소극적인 상황이다. 이에 본 연구는 디지털 전환이 초래할 수 있는 미래사회 위험이슈를 Embedded Topic Modeling 방법론 기반의 언론기사 빅데이터 정량분석으로 체계화 및 구체화하고, 정책적 대응 방향을 제시하였다. 이를 위하여 먼저 주요국의 디지털 전환 역기능 세부 이슈들을 규명하였다. 다음으로 디지털 전환의 핵심 기술인 인공지능을 중심으로 주요국과 한국의 디지털 전환 역기능 세부이슈를 구체화하고, 비교분석하였다. 아울러 분석결과들을 종합하여 향후 정부의 디지털 전환 역기능 대응 정책 수립 방향을 제시하였다. 분석 결과에 근거한 정책적 함의는 다음과 같다. 첫째, 디지털 전환의 역기능은 기술 분야에만 한정되어 나타나지 않고 국가안보 및 사회 전반에 영향을 미치기 때문에 정부는 디지털 전환의 순기능 촉진뿐만 아니라 역기능 대응을 위한 정책도 마련해야 한다. 둘째, 디지털 전환의 미래사회 위험 세부이슈들은 국가에 따라 상이하게 나타나므로 정부는 국가적/사회적 맥락을 고려하여 디지털 전환 역기능 대응 정책을 수립해야 한다. 마지막으로 정부는 이해관계자들의 혼선을 최소화할 수 있도록 디지털 전환 역기능 대응 정책의 큰 방향을 설정하고, 실효성 있는 정책 수단을 마련해야 한다.

네이버 스마트스토어에 대한 빅데이터 분석 및 소상공인 온라인쇼핑몰 지속성장 방안 제안 (Big data analysis on NAVER Smart Store and Proposal for Sustainable Growth Plan for Small Business Online Shopping Mall)

  • 장현문;김선주;김채운;서지일;이경호
    • 한국빅데이터학회지
    • /
    • 제7권2호
    • /
    • pp.153-172
    • /
    • 2022
  • 온라인 쇼핑은 디지털전환(Digital transformation) 수요 및 COVID-19 대유행에 따른 사회적 거리두기 이슈 등에 해결책으로 도소매 서비스 분야의 선두에서 전체 시장을 변화시키고 빠르게 성장해왔다. 온라인 쇼핑 산업의 중심에서 다수를 이루고 있는 소상공인도 이러한 문제를 극복하고 지속적인 성장을 위하여, 정책의 변화 및 시장 동향 정보를 수집하여 마케팅 등 영업 활동에 활용하고 있으나, 한정된 자원과 경쟁 여건에서 본연의 사업에 더욱 밀착된 객관적이고 정제된 정보를 또한 필요로 하고 있다. 이에 본 논문에서는 디지털 전환의 핵심 기술인 빅데이터 정보 수집 및 분석을 통하여 대표적인 온라인 쇼핑몰인 네이버 스마트스토어의 상품 분류, 판매 동향, 소비자 선호도 및 리뷰 정보에서 핵심 변수를 선정하여, 등급별 영향도 및 경쟁자 비교 분석 및 온라인 쇼핑몰 사업 지속성 평가에 활용하는 방안을 마련하여 제안하고자 한다. 빅데이터 기반으로 소상공인이 경쟁자 또는 우수사업자를 벤치마킹하고, 시장의 트렌드 및 소비자 성향을 확인할 수 있다면, 본인의 영업 수준 및 위치를 명확하게 인식하고, 더욱 높은 경쟁력을 확보하기 위하여 자발적으로 노력할 것이다. 아울러 온라인 쇼핑몰 사업자의 지속 가능한 성장을 지표로 확인할 수 있다면, 한 단계 향상된 측정 방안을 보유하게 되므로 더욱 효율적인 정책의 수립 및 리스크관리를 기대할 수 있을 것이다.

실제 사례 기반 비정형 데이터를 활용한 기업의 부실징후 예측에 관한 효용성 연구 (Unstructured Data based a Study of Effectiveness about Prediction of Corporate Bankruptcy with a Real Case)

  • 진훈;홍정표;이강호;주동원
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2018년도 제30회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.487-492
    • /
    • 2018
  • 4차산업 혁명의 여파로 국내에서는 다양한 분야에 인공지능과 빅데이터 기술을 활용하여 이전에 시행 중인 다양한 서비스 분야에 기술적 접목과 보완을 시도하고 있다. 특히 금융권에서 자금을 빌린 기업들을 대상으로 여신 안정성을 확보하고 선제적인 대응을 위해 온라인 뉴스기사들과 SNS 데이터 등을 이용하여 부실가능성을 예측하고 실제 업무에 도입하려는 시도들이 국내 주요 은행들을 중심으로 활발히 진행 중이다. 우리는 국내의 국책은행에서 수행한 비정형 데이터 기반의 기업의 부실징후 예측 시스템 개발 과정에서 시도된 다양한 분석 방법과 결과 그리고 과정 중에 발생한 문제점들에 관해 기술하고 관련 이슈들에 관하여 다룬다. 결과적으로 본 논문은 레이블이 없는 대량의 기사들에 레이블을 달기 위한 자동 태거(tagger) 개발과 뉴스 기사 예측 결과로부터 부실 가능성을 예측하기 위한 모델 및 성능 면에서 기사 예측 정확도 92%(AUC 0.96) 및 부실 가능성 기업 예측에서도 정형 데이터 분석결과에 견줄만한 성과를 이루었고 이에 관해 보고한다.

  • PDF

미세먼지 자료에서의 결측치 대체 방법 비교 (Comparision of Missing Imputaion Methods In fine dust data)

  • 김연진;박헌진
    • 한국빅데이터학회지
    • /
    • 제4권2호
    • /
    • pp.105-114
    • /
    • 2019
  • 자료 분석에 있어서 결측치 대체는 큰 이슈중 하나이다. 결측치의 발생을 무시하고 분석을 진행하게 되면, bias가 발생하여 그에 따른 추정치에 대해 잘못된 결과를 줄 수 있다. 이 논문에서는 미세먼지자료에서 발생한 결측치를 적절한 대체 방법을 찾아 적용하자 한다. 이를 통해 시계열 자료에서 발생한 결측치를 R을 기반으로 한MICE, MissForest 등의 기존 방법과 시계열 기반 모델을 사용하여 여러 가지 상황에 대한 시뮬레이션을 설정해 비교해 밝히고자 하였다. 이 결과에 대해 각각을 변수 별로 비교하였을때 ImputeTS 패키지를 이용한 auto arima 모델의 kalman filter를 적용한 모형과 MissForest 모형이 미세먼지자료 결측치 대체에서는 좋은 결과를 주는 것으로 판단되었다.

  • PDF

콘텐츠의 공급자와 소비자로 이루어진 UGC 플랫폼의 초기 활성화 방안에 대한 탐색적 연구 : 시스템다이내믹스를 이용한 초기 스타트업의 UGC 플랫폼을 중심으로 (An Exploratory Study on the Initial Activation Strategy of UGC Platform with Contents Provider and Consumer)

  • 정지웅;이경상;이준기
    • 한국빅데이터학회지
    • /
    • 제3권1호
    • /
    • pp.83-94
    • /
    • 2018
  • 본 연구의 목적은 플랫폼 비즈니스 모델의 초기 활성화 문제점인 Chicken & Egg Problem 이슈를 짚어보고자 한다. 이를 위해 인터뷰 기반의 탐색적 연구를 수행하여 UGC 플랫폼의 초기 활성화 방안에 대해 각 요인들의 인과관계와 영향을 분석하였다. 본연구의 결과를 통해 전략적 시행착오의 오류를 최소화하는데 기여하고자하며 또한, 투자자 측면의 UGC 스타트업에 투자함에 있어 피투자기업의 마일스톤상 현재 위치를 알 수 있도록 해 객관적인 투자의사 결정을 할 수 있는데 실무적 시사점을 제공할 수 있을 것으로 기대한다.

HTCondor 클러스터를 위한 동적 자원 스케줄링 (Dynamic Resource Scheduling for HTCondor Cluster)

  • 이정하;염재근;정기문;조혜영;정대용
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2015년도 추계학술발표대회
    • /
    • pp.250-252
    • /
    • 2015
  • 다양한 분야에서 활발히 연구되는 빅 데이터와 최근 이슈가 되고 있는 딥러닝(Deep-learning) 등은 컴퓨터공학 분야뿐만 아니라 다양한 분야와 접목하여 이에 대한 관심이 증가하고 있다. 대규모 클러스터를 통하여 빅데이터와 딥러닝 같은 계산 집약적인(computational-intensive) 작업을 빠르게 처리할 수 있다. 하지만 대규모 클러스터의 잦은 유휴상태는 클러스터의 활용률은 매우 낮아지게 한다. 본 논문에서는 작업 실행 시간 개선과 클러스터 활용 효율성을 향상시키는 HTCondor 클러스터를 위한 동적 자원 스케줄링 기법을 제안한다. 동적으로 자원 할당을 위해 가상머신으로 HTCondor 클러스터 환경을 구성하였으며, 가상머신의 관리를 위해 OpenStack을 사용하였다. OpenStack기반 HTCondor 클러스터 환경에서 HTCondor Python API와 OpenStack Python API를 사용하여 우리가 제안하는 동적 자원 스케줄링 기법을 구현하였으며, 실험을 통해 제안하는 기법의 성능 및 실현 가능성을 확인하였다.

디지털 트윈을 위한 빅데이터 기반 물수급 분석 기법 개발 (Development of big data-based water supply and demand analysis technique for digital twin)

  • 김장경;문수진;여인희;김태정;남우성
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2022년도 학술발표회
    • /
    • pp.224-224
    • /
    • 2022
  • 물부족, 수질오염, 조류발생 등 효율적 물관리를 위해서는 물정보 통합이 필요하지만 부처별/목적별로 개별 생산·관리되어 물관리 현안에 효과적으로 대응하기 어려운 실정이다. 물관리 현안 대응 의사결정을 위해서는 현재 상황에 대한 정확한 인식과 장래(1,3개월) 수자원 상황을 고려한 예측·분석체계 구축 필요하며, 이를 위해서는 수원별 가용수량, 지역별 물사용량 및 회귀수량 등 지자체, 유역, 하천을 연계한 실제 물이용 정보 기반의 물배분 현황 분석체계 구축이 필요하다. 본 연구에서는 물수급 관련 수요·공급 시설의 위치를 연결하는 물수급 분석 알고리즘 개발을 통해 지형공간정보의 위상(topology) 관계를 설정하여 물수급 분석의 계산순서를 선정하고, 시계열 DB를 입력하여 전국 약 40만개 이상의 일단위 물수급 분석 정보생산체계를 구축하였다. 본 연구에서 개발된 물수급 분석 모형은 향후 물관련 이슈 지역의 용수공급능력 평가 및 디지털트윈 등 다양한 수자원 정책평가에 활용될 것으로 기대된다.

  • PDF