• 제목/요약/키워드: 빅 이슈

검색결과 304건 처리시간 0.021초

통계모형의 정확도에 기반한 비식별화 데이터의 품질 측정 (Data Quality Measurement on a De-identified Data Set Based on Statistical Modeling)

  • 전희주;이현지;연규필;김동례
    • 한국콘텐츠학회논문지
    • /
    • 제19권5호
    • /
    • pp.553-561
    • /
    • 2019
  • 본 연구에서는 개인정보 비식별화 데이터의 통계적 유용성에 대한 품질 측정 방안에 대하여 통계 모형화에 따른 예측 정확도 측면에서 고찰하였다. 4차 산업혁명 시대에서 정보통신기술을 통한 혁신에는 반드시 빅데이터의 효과적인 활용이 필수적이지만, 개인정보 이슈는 적극적인 빅데이터 활용에 제약이 되고 있다. 이를 해결하기 위해 비식별화 가이드라인이 제정되었으며 다양한 개인정보 비식별화 방법이 활용되면서 개인정보의 실질적인 재식별 가능성은 매우 낮아졌다. 반면에 강력한 비식별화는 데이터의 유용성을 떨어뜨리는 부작용이 나타날 수 있다. 그 동안은 재식별 불가능한 비식별화 방법이 연구의 주를 이루어 왔다면 본 연구에서는 대표적인 비식별 방법인 KLT 모형에 의한 비식별화 데이터에 대한 통계적 유용성 측면의 품질 측정에 대하여 연구하였다. 비식별화 데이터에 대한 통계적 예측모형의 정확도에 기반하여 비식별화 된 데이터의 통계적 유용성이 어느 정도 훼손되는지에 대하여 사례분석을 수행하였다. 또한, 비식별 자료에 어느 정도의 비식별화 되지 않은 자료가 추가되어야 예측모형의 정확도를 회복하는 지를 살펴봄으로써 비식별화된 자료의 데이터 유용성 정도에 대한 새로운 측정지표를 제안하였다.

Analysis on Media Reports of the 「Security Services Industry Act」 Using News Big Data -Focusing on the Period from 1990 to 2021-

  • Cho, Cheol-Kyu;Park, Su-Hyeon
    • 한국컴퓨터정보학회논문지
    • /
    • 제27권5호
    • /
    • pp.199-204
    • /
    • 2022
  • 이 연구의 목적은 경비업법에 대한 연구자들의 관점이 아닌 언론보도 빅데이터를 분석하여 경비업법에 대한 이해를 넓히고 다양한 현상들에 대한 의미를 살펴보는데 연구의 목적을 두고 있다. 연구방법은 우리니라의 범죄예방과 사회질서유지의 중요한 주체로써 경비업무의 대한 규정하고 있는 「경비업법」을 키워드로 검색하였다. 자료검색은 빅카인즈에서 제공가능한 1990년부터 2021년까지로 하였다. 또한 자료검색 기간동안의 구체적인 분석을 위해 정착기(1976~2001), 성장기-양적(2002~2012), 성장기-질적(2013~2021)로 구분하여 분석하였다 연구결과에 따른 경비업법의 언론보도 인식은 시대의 흐름에 따라 민간경비의 사회적 역할 및 중요성은 계속 강조되고 있다고 볼 수 있다. 그에 따른 민간경비의 시장성은 앞으로도 다양한 산업군과 결합되어 국민의 생명과 재산을 보호하는데 큰 역할을 할 것으로 판단된다. 하지만 경찰과 더불어 치안서비스를 제공하는 민간경비산업은 법적 규제 및 불법적인 문제들로 야기되는 다양한 사회적 이슈로 인해 민간경비산업의 발전을 저해하는 요소로 부각될 수 있기 때문에 거기에 따른 책임 및 역할을 더욱더 강화시킬 필요성이 제기된다.

텍스트마이닝 기법을 활용한 허위·과장광고 관련 기사의 트렌드 분석(1990-2019) (Analyzing the Trend of False·Exaggerated Advertisement Keywords Using Text-mining Methodology (1990-2019))

  • 김도희;김민정
    • 한국콘텐츠학회논문지
    • /
    • 제21권4호
    • /
    • pp.38-49
    • /
    • 2021
  • 본 연구는 텍스트마이닝 기법을 사용하여 1990년부터 2019년까지 5,141건의 신문기사에서 '허위·과장광고' 용어의 트렌드를 분석하였다. 우선 전체 신문기사를 대상으로 빈도 분석을 통해 허위·과장광고의 최빈 키워드와 추출된 키워드 간의 맥락을 확인하고자 하였다. 다음으로 허위·과장광고가 어떻게 변화해왔는지에 대해 고찰하기 위해 10년 단위로 기사를 분리하여 빈도 분석을 수행하였고, 연도별 최빈 키워드를 주제로 한학술논문 수와 비교하여 해당 시기에 이슈가 된 키워드가 연구로까지 이어진 경향성을 파악하였다. 마지막으로 토픽모델링 분석을 통해 토픽 내 세부 키워드를 바탕으로 허위·과장광고의 동향을 제시하였다. 연구 결과, 특정 시점에 이슈가 되었던 주제가 최빈 키워드로 추출되었고 시대별 키워드 트렌드는 사회적, 환경적 요인과 연관되어 변화함을 확인하였다. 본 연구는 소비자들이 부당광고에 대한 배경지식을 함양함으로써 현명한 소비를 이어 나갈 수 있도록 도움을 주는 데 의의가 있다. 더욱이 핵심 키워드 추출을 통해 위법행위를 저지른 기업 및 관련 종사자들에게 광고의 참된 목적을 제시하고, 시사점을 전달할 수 있을 것이라 기대한다.

촛불 집회와 태극기 집회를 둘러싼 정국 인식: 온라인 뉴스 댓글에 대한 빅데이터 분석 (The Political Recognition Surrounding Candlelight Rally and Taegeukgi Rally: A Big Data Analytics on Online News Comments)

  • 김찬우;정병기
    • 예술인문사회 융합 멀티미디어 논문지
    • /
    • 제8권6호
    • /
    • pp.875-885
    • /
    • 2018
  • 본 연구는 2016년 10월 24일부터 2017년 3월 19일까지 촛불 집회 기간 포털사이트 정치 섹션에 등록된 촛불 집회와 태극기 집회 관련 뉴스의 댓글을 대상으로 주요 이슈를 개체명 인식기를 이용해 분석하여 두 집회에 대한 정국 인식을 살펴보았다. 주요 분석 항목은 탄핵의 책임 소재, 정국 해결의 주체와 방법, 그 외 주요 이슈를 중심으로 분석하였다. 분석 결과, 촛불 집회 기사의 댓글에서는 탄핵지지와 정권 부역자의 법적 처벌에 대해 집중하고 있었으며, 탄핵 후 차기 대선을 통한 정국 해결을 주장했다. 태극기 집회 기사의 댓글에서는 정권 유지를 위한 탄핵 기각에 대해 집중하고 있었고, 헌법재판소의 탄핵 기각을 주장하였다. 이를 통해 볼 때, 촛불 집회나 태극기 집회의 각 입장을 지지했던 집단들 간의 갈등은 대선 이후 적어도 당분간(박근혜 재판 기간) 지속할 것으로 보인다. 이 갈등은 탄핵과 정권 교체 후 청산과 새 정치를 추구하는 입장과 박근혜 대통령 재판에 영향을 미치려는 입장의 대립으로 전개될 것이다. 따라서 이후 정국에서는 사회 통합을 위한 노력이 필요하다.

인공지능 기술/서비스 기반의 개인정보 보호 모델에 대한 연구 (A study on Model of Personal Information Protection based on Artificial Intelligence Technology or Service)

  • 이원태;강장묵
    • 한국인터넷방송통신학회논문지
    • /
    • 제16권4호
    • /
    • pp.1-6
    • /
    • 2016
  • 인공지능은 빅데이터 분석 기술에서 보다 인간적인 기술로 진화하고 있다. 인공지능은 사물인터넷의 센싱 기술로 말미암아 인간의 오감보다 더 정교한 감각 기관을 가질 것으로 예측된다. 그리고 인공지능은 클라우드 네트워크 기술로 언제 어디서나 인터넷에 접속하여 컴퓨팅 자원을 지원받을 수 있을 것이다. 이처럼 인공지능은 최신 기술들의 총아로 발전 중에 있다. 이와 동시에 인공지능에 대한 불안과 미래 시대에 대한 암울한 전망도 높아지고 있다. 대부분의 기술 디스토피아적 미래상은 현상을 객관적으로 조망하는 관조적 시야를 잃어버렸을 때 발생한다. 또한 이러힌 비관론은 기술 발전의 미래상을 인간 의지의 주관적 미래상으로 전환시킬 능력과 자신감의 부재를 반영하기도 하다. 이 글은 인공지능 기술과 서비스의 발달에 따른 대량해고와 실업, 기계에 의한 인류 종말 등 일반적 주제를 다루기보다는 가까운 지금 일어나고 있는 개인정보보호 침해의 이슈를 다루고자 한다. 더 나아가 이 논문은 개인정보보호를 보장하면서 인공지능 산업을 발전시킬 수 있는 도덕적/법제도적 모델에 대해서도 고찰하였다.

비대면 채널에서의 음성분석을 통한 언어폭력 유형 탐색 (Exploring Types of Verbal Violence Through Speech Analysis on Non-facing Channels)

  • 김종선;안성진
    • 컴퓨터교육학회논문지
    • /
    • 제23권3호
    • /
    • pp.71-79
    • /
    • 2020
  • 이 연구는 비대면 채널에서의 언어폭력이 사회적으로 이슈가 되고 있고 감정노동자들의 업무처리 상황에서 발생하는 언어폭력의 실제 사례들은 무엇이 있는가를 전문가심층면접을 통해 조사하였다. 그리고 실제 통화내용에서 언어폭력의 분포를 음성분석(SA)이라는 새로운 빅데이터 기술을 통해 확인하였다. 연구 결과 첫째 비대면 채널을 통해 일어나는 통화에서 언어폭력은 인격모독, 폭언/욕설, 무리한 요구, (성)희롱과 위협/협박으로 분류된다. 둘째 음성분석을 이용하여 이들 범주 중 가장 높은 빈도를 나타내고 있는 것은 인격모독과 폭언/욕설이었으며 인격모독에서는 하대/반말이 가장 높은 비율을 차지하고 있으며 폭언/욕설에서는 일반적 욕설의 비중이 가장 높았다. 특히 전체 언어폭력 사례에서 일반적 욕설이 차지하는 비율이 가장 높았다. 이 연구를 통해 비대면 채널 상황에서 발생하는 언어폭력의 유형을 정리하였으며 감정노동자들에게 있어서 언어적 스트레스가 직무에 어떠한 영향을 끼치는가에 대한 연구의 필요성을 시사하였다.

결정트리 기반의 기계학습을 이용한 동적 데이터에 대한 재익명화기법 (Re-anonymization Technique for Dynamic Data Using Decision Tree Based Machine Learning)

  • 김영기;홍충선
    • 정보과학회 논문지
    • /
    • 제44권1호
    • /
    • pp.21-26
    • /
    • 2017
  • 사물인터넷, 클라우드 컴퓨팅, 빅데이터 등 새로운 기술의 도입으로 처리하는 데이터의 종류와 양이 증가하면서, 개인의 민감한 정보가 유출되는 것에 대한 보안이슈가 더욱 중요시되고 있다. 민감정보를 보호하기 위한 방법으로 데이터에 포함된 개인정보를 공개 또는 배포하기 전에 일부를 삭제하거나 알아볼 수 없는 형태로 변환하는 익명화기법을 사용한다. 그러나 준식별자의 일반화 수준을 계층화하여 익명화를 수행하는 기존의 방법은 데이터 테이블의 레코드가 추가 또는 삭제되어 k-익명성을 만족하지 못하는 경우에 더 높은 일반화 수준을 필요로 한다. 이와 같은 과정으로 인한 정보의 손실이 불가피하며 이는 데이터의 유용성을 저해하는 요소이다. 따라서 본 논문에서는 결정트리 기반의 기계학습을 적용하여 기존의 익명화방법의 정보손실을 최소화하여 데이터의 유용성을 향상시키는 익명화기법을 제안한다

웹크롤러의 수집주기 최적화 (Refresh Cycle Optimization for Web Crawlers)

  • 조완섭;이정은;최치환
    • 한국콘텐츠학회논문지
    • /
    • 제13권6호
    • /
    • pp.30-39
    • /
    • 2013
  • 웹 크롤러는 서버의 부담을 최소화하면서도 최신의 데이터를 웹사이트로부터 수집하고 유지해야 한다. 빅데이터 시대와 같이 데이터가 폭발적으로 증가하는 시대에 데이터 소스로부터 자주 모든 데이터를 추출하는 것은 서버에 심각한 부담을 주게 된다. 무선통신 기술과 다양한 스마트 기기들의 확산으로 정보가 급속도로 생성되고 있으며, 어디에서나 어느 시간이나 지속적으로 생성 및 변경되고 있다. 웹크롤러는 이러한 상황을 감안하여 최신의 정보를 적은 오버헤드로 유지해 나가는 것이 중요한 이슈로 부각되고 있다. 본 논문에서는 웹사이트의 변경사항을 체크할 수 있는 효과적인 방안과 웹사이트의 수집 주기를 동적으로 변경함으로써 적은 비용으로 최신성을 유지할 수 있는 방안을 제시한다. 핵심 아이디어는 과거 히스토리로부터 웹사이트 변경이 집중되는 시간을 파악하여 웹수집 주기를 결정하는데 반영한다는 점이다. 논문에서는 특정 웹사이트의 데이터를 추출하는 Java 크롤러를 개발하고, 제안된 방식과 기존 방식의 유용성을 비교하였다. 제안된 기법을 사용하면 정적인 방식보다 서버 오버헤드를 절반정도(46.2%)로 줄이면서도 최신성을 더욱 높게 보장할 수 있게 된다.

벡터화 기술을 이용한 대규모 MIMO 시스템의 간단한 Toeplitz 채널 행렬 분해 (A Simple Toeplitz Channel Matrix Decomposition with Vectorization Technique for Large scaled MIMO System)

  • 박주용;모하마드 아부 하니프;김정수;송상섭;이문호
    • 전자공학회논문지
    • /
    • 제51권9호
    • /
    • pp.21-29
    • /
    • 2014
  • 오늘날 수많은 사용자와 제한된 메모리 공간 때문에 빅 데이터(big data)를 위한 메모리 공간 문제가 중요한 이슈로 부상하고 있다. 대규모 MIMO 시스템에서 Toeplitz 채널은 전력효율 문제뿐아니라 성능 개선에 커다란 역할을 할 수 있다. 본 논문에서는 행렬 벡터화(vectorization)에 기반한 Toeplitz 채널 분해를 제안하고, 이때 대규모 MIMO 시스템을 위한 채널에 Toeplitz 행렬을 사용하며, 또 Toeplitz Jackrt행렬이 푸리에 고속 변환(FFT)처럼 Cooley-Tukey sparse 행렬로 분해됨을 보인다.

델파이 기법을 활용한 미래주거예측 (Prediction for Future Housing using Delphi Technique)

  • 안세윤;주한나;김소연
    • 한국콘텐츠학회논문지
    • /
    • 제20권3호
    • /
    • pp.209-222
    • /
    • 2020
  • 본 논문은 주거의 미래변화를 전망하고 대응방안을 연구하기 위한 목적으로, 델파이 기법을 통해 주거의 미래를 예측하였다. 먼저, 미래주거 예측 시기를 구분하고, 대상을 주거형태, 주거공간, 주거수요, 건축기술변화로 설정하였으며, 대상에 미치는 Impact Factor를 조사, 분석 하였다. 결과는 ① 사회적, 가치적 관점이 주거형태, 공간, 수요변화에 미치는 영향이 클 것이며, 정치적 관점의 영향은 적을 것으로 예측하였다. ② 형태적 측면에서 고층빌딩에 다운사이징 주택 수요 증가, 기술적 측면에서 빅데이터를 활용한 원격의료지원 서비스와 홈케어 실현 가능성이 높게 예측하였다. 그에 따라 ③ IoT가 미래주거변화에 미치는 영향이 클 것으로 예측하였으며, ④ 공유경제에 의한 코하우징, 그와 관련된 법 제정, 고층, 고밀 주택 보급으로 유지관리를 위한 서비스, 거주자 맞춤형 주거지원 혹은 임대차 시장 선진화, 건축기술 발전으로 미래형 주거확산 등이 전망된다.