• 제목/요약/키워드: Processing System

검색결과 22,438건 처리시간 0.051초

온라인 과학 기사 텍스트 마이닝을 통해 분석한 에너지 용어 사용의 맥락 (Analyzing Different Contexts for Energy Terms through Text Mining of Online Science News Articles)

  • 오치영;강남화
    • 과학교육연구지
    • /
    • 제45권3호
    • /
    • pp.292-303
    • /
    • 2021
  • 본 연구에서는 일상생활에서 에너지 용어가 사용되는 맥락을 알아보기 위하여 온라인 과학 기사를 수집하여 언어 네트워크, 토픽 모델링 분석 기법을 활용해 에너지 관련 기사에 사용된 용어의 빈도, 용어 네트워크, 기사의 주제를 분석하였다. 분석에 사용된 자료는 2018.3.1.부터 1년간의 온라인 과학 분야의 기사 중 에너지를 검색어로 하여 10개의 국내 중앙지에서 검색 및 선정된 2,171편이다. 이 기사들을 자연어 처리하여 51,224개의 문장과 507,901개의 단어로 데이터를 구성하였다. R 프로그램을 활용하여 용어 빈도수 분석 및 언어 네트워크 분석을 실시하였고, 에너지 용어 사용의 맥락 탐색을 위해 구조적 토픽 모델링 분석을 적용해 기사의 주제를 도출하였다. 기사에 사용된 용어 중 빈도수가 유난히 높은 용어는 기술, 연구, 개발로 새로운 소식을 알리는 기사의 특성을 반영한 것으로 나타났다. 한편, 기사 2편당 한 번 이상의 빈도로 사용되는 용어에는 산업 관련 용어(산업, 제품, 시스템, 생산, 시장)와 '전기', '환경'과 같이 에너지 관련 용어로 충분히 기대되는 용어들이 있었다. 한편, 에너지 관련 과학 수업에서 자주 사용되는 '태양', '열', '온도', '발전'도 빈도수 상위에 속하는 용어로 드러났다. 용어 네트워크 분석에서는 산업 및 기술과 관련된 용어와 기초과학 및 연구 관련 용어들이 약한 강도이지만 서로 군집을 이루는 것을 확인하였다. 한편, 에너지와 쌍을 이루는 용어의 분석에서는 '에너지 효율'을 비롯해 '에너지 절감', '에너지 소비' 등과 같이 에너지의 사용에 관한 용어들이 다수를 이루고 그 사용 빈도가 가장 높았다. 에너지 용어가 사용되는 맥락은 16개의 주제를 분류한 4가지 영역으로 '첨단산업', '산업', '기초과학', '환경 및 건강'으로 나타났다. 에너지 사용 관련 용어가 상당히 많이 사용된다는 결과는 에너지 수업의 시작점으로 에너지 저급화 개념의 도입이 효과적일 수 있음을 시사한다. 또한, 첨단산업이나 환경 및 건강의 맥락을 에너지 학습에 도입할 필요성도 보여준다. 본 연구에서 드러난 16개 주제에서 보이는 다양한 에너지 용어가 사용되는 맥락을 재구성해 에너지 관련 수업에 활용한다면 학생들이 학교에서의 에너지 학습과 일상적 상황을 통합적으로 인식하는 데 도움이 될 것이다.

근로자의 학업욕구 열망이 대학교육 참여에 미치는 영향에 관한 연구 (A Study on the Influence of Workers' Aspiration for Academic Needs on Participation in University Education)

  • 이지훈;문복현
    • 한국엔터테인먼트산업학회논문지
    • /
    • 제15권3호
    • /
    • pp.231-241
    • /
    • 2021
  • 본 연구는 근로자의 학업 열망이 대학교육 참여에 미치는 연구를 통해 대학교 관계자들에게 신입생유치 및 맞춤 교육을 위한 전략과 시사점을 제시하고자 하였다. 따라서 선행자료들을 분석하여 변수들을 도출하였고, 변수들 간의 인과관계 설정과 질문지를 개발하였다. 조사 대상은 대학교육 참여에 관심 있는 근로자 331명을 대상으로 대인면접법으로 자료 수집을 하였다. 수집된 자료는 데이터화를 하였고, 신뢰성 및 타당성 검증과 빈도분석을 실시하였다. 마지막으로 구조 방정식 모형의 적합도와 각 개념에 대한 인과관계를 검증하였다. 따라서 검증결과 본 연구의 시사점은 다음과 같다. 첫째, 대학 관계자들은 대학교육을 통해 적성에 맞는 직업군으로 전환한 경험자와의 멘토·멘티 제도를 통해 동기부여를 해야 할 것이다. 또한 미래를 위해 지속적인 자기계발을 할 수 있도록 프로그램을 개발하고 보급해야 할 것이다. 이를 위해 전문가와의 상담을 통해 본인의 적성과 장점을 파악할 수 있도록 지원해야 할 것이다. 둘째, 대학 관계자들은 추천을 통해 입학을 한 근로자들이 직업전환을 이룬 사례와 정보를 입학 예정자가 알 수 있도록 홍보를 강화해야 할 것이다. 또한 자기 계발을 할 수 있는 대학교육 프로그램을 개발하고 '공모전' 등을 통해 다양한 아이디어를 수용하고 재가공을 통해 근로자에게 대학교육에 대한 정확한 정보를 제공해야 할 것이다. 셋째, 대학 관계자들은 대학교육을 통해 직업전환과 자기계발이라는 두 마리의 토끼를 잡을 수 있다는 프로그램을 근로자에게 제공해야 한다. 즉, 대학 입학시 해외 선진 기업 견학, 다양한 자격증 취득, 블루칼라·화이트칼라의 부서 간 이동, 이직 기회 획득 등 다양한 정보제공과 졸업 선배들의 성공 사례들을 제공함으로써 근로자들의 학습 동기 유발을 자극시켜야 할 것이다. 넷째, 대학 관계자들은 직업전환을 위해서는 대학교육에 참여하여 체계적인 교육과 사회 환경의 흐름 등을 교육받음으로써 한층 더 발전할 수 있는 곳이 대학이라는 것과 이와 관련된 대학교육 프로그램을 적극적으로 홍보해야 할 것이다. 마지막으로 대학 관계자들은 근로자가 대학교육 참여시 자기계발을 할 수 있다는 인식이 발생하도록 근로자와의 상담 및 홍보를 실시해야 할 것이고, 근로자들의 수요조사 및 분석을 통해 자기계발을 위해 필요한 사항들이 무엇인지 파악하여 이에 대한 대응방안들을 마련해야 할 것이다.

전문어의 범용 공간 매핑을 위한 비선형 벡터 정렬 방법론 (Nonlinear Vector Alignment Methodology for Mapping Domain-Specific Terminology into General Space)

  • 김준우;윤병호;김남규
    • 지능정보연구
    • /
    • 제28권2호
    • /
    • pp.127-146
    • /
    • 2022
  • 최근 워드 임베딩이 딥러닝 기반 자연어 처리를 다루는 다양한 업무에서 우수한 성능을 나타내면서, 단어, 문장, 그리고 문서 임베딩의 고도화 및 활용에 대한 연구가 활발하게 이루어지고 있다. 예를 들어 교차 언어 전이는 서로 다른 언어 간의 의미적 교환을 가능하게 하는 분야로, 임베딩 모델의 발전과 동시에 성장하고 있다. 또한 핵심 기술인 벡터 정렬(Vector Alignment)은 임베딩 기반 다양한 분석에 적용될 수 있다는 기대에 힘입어 학계의 관심이 더욱 높아지고 있다. 특히 벡터 정렬은 최근 수요가 높아지고 있는 분야간 매핑, 즉 대용량의 범용 문서로 학습된 사전학습 언어모델의 공간에 R&D, 의료, 법률 등 전문 분야의 어휘를 매핑하거나 이들 전문 분야간의 어휘를 매핑하기 위한 실마리를 제공할 수 있을 것으로 기대된다. 하지만 학계에서 주로 연구되어 온 선형 기반 벡터 정렬은 기본적으로 통계적 선형성을 가정하기 때문에, 본질적으로 상이한 형태의 벡터 공간을 기하학적으로 유사한 것으로 간주하는 가정으로 인해 정렬 과정에서 필연적인 왜곡을 야기한다는 한계를 갖는다. 본 연구에서는 이러한 한계를 극복하기 위해 데이터의 비선형성을 효과적으로 학습하는 딥러닝 기반 벡터 정렬 방법론을 제안한다. 제안 방법론은 서로 다른 공간에서 벡터로 표현된 전문어 임베딩을 범용어 임베딩 공간에 정렬하는 스킵연결 오토인코더와 회귀 모델의 순차별 학습으로 구성되며, 학습된 두 모델의 추론을 통해 전문 어휘를 범용어 공간에 정렬할 수 있다. 제안 방법론의 성능을 검증하기 위해 2011년부터 2020년까지 수행된 국가 R&D 과제 중 '보건의료' 분야의 문서 총 77,578건에 대한 실험을 수행한 결과, 제안 방법론이 기존의 선형 벡터 정렬에 비해 코사인 유사도 측면에서 우수한 성능을 나타냄을 확인하였다.

수면의 질을 측정하기 위한 안대형 생체신호 측정기기 개발 (Development of an Eye Patch-Type Biosignal Measuring Device to Measure Sleep Quality)

  • 안창선;임재관;정봉수;김영주
    • 정보처리학회논문지:컴퓨터 및 통신 시스템
    • /
    • 제12권5호
    • /
    • pp.171-180
    • /
    • 2023
  • 우리나라 3대 수면 질환으로는 코골이, 수면무호흡증, 불면증이 있다. 수면 부족은 만병의 근원이며 수면 부족으로 인한 질병은 심혈관계 질환, 인지장애, 비만, 당뇨, 대장염, 전립선암에 이르기까지 다양하게 나타난다. 수면 관리 중요성을 인식한 정부도 2018년 7월부터 수면다원검사를 국민건강보험 혜택을 적용해서 작은 부담으로 검사를 받아볼 수 있도록 하고 있다. 그럼에도 불구하고 불면증 환자는 시간적·공간적·경제적 부담감을 해소하고 일상생활 속에서 수면의 질을 관리할 필요가 있다. 이러한 문제를 해결하기 위해서 본 논문에서는 병원이 아닌 일상생활 속에서 수면관리에 활용할 수 있는 안대형 생체신호 측정기기를 개발하였다. 측정기기에서는 6개 생체신호(안구동작, 뒤척임, 체온, 산소포화도, 심박수, 오디오)를 측정할 수 있다. 사용되는 센서로는 안구동작, 뒤척임은 자이로스코프센서(MPU9250, InvenSense, 미국)가 사용되었다. 센서값 입력 범위는 258~460°/sec 단위로 조정되며, 입력 범위값 내에서 작동상태를 확인하였다. 체온, 산소포화도, 심박수는 센서(MAX30102, Analog Devices, 미국)를 사용하였다. 체온은 30~45℃ 작동상태를 확인했으며, 산소포화도 사용범위는 미사용상태는 0%이고 사용상태는 20~90%의 작동상태를 확인하였다. 심박수의 범위는 40~180 bpm에서 작동상태를 확인하였다. 오디오 신호는 센서(AMM2742-T-R, PUIaudio, 미국)를 통해서 생체신호를 측정하며 감도는 -42±1 dB이며 주파수 범위는 20~20 kHz에서의 작동상태를 확인하였다. 시스템 구성은 생체신호 측정기기와 데이터수집 장치로 PC 및 모바일 애플리케이션으로 구성되었다. 측정된 데이터는 모바일과 PC로 수집되며 수집된 데이터는 수면의 단계를 판단하고 수면 유도와 수면장애에 대한 사전 선별기능을 진행할 수 있는 기초자료로 사용될 수 있다. 앞으로 간편하게 가정에서 불면증 환자들에게 수면의 질을 측정할 수 있게 되어 불면증 환자들의 치료에 도움이 될 것으로 예상한다.

라이프케어의 피부미용 NCS기반 자격 L3수준의 교육 중요도 연구 (An Importance Analysis on the NCS-Based Skin Care Qualification L3 Level of Education in Life Care)

  • 박채영;박정연
    • 한국엔터테인먼트산업학회논문지
    • /
    • 제13권5호
    • /
    • pp.263-271
    • /
    • 2019
  • 최근 교육훈련기관과 산업체의 수요에 필요한 지식이 불일치하는 인력 미스매치(miss match)의 현상은 신입 직원의 재교육과 취업을 위한 사교육 비용 증가로 전이되어 결과적으로는 개인의 직무수행 능력 저하와 취업 역량 저조는 물론 국가 차원에서도 경제적, 물질적 낭비의 원인이 되고 있다. 이러한 문제점을 보완하기 위해 실무에서 바로 활용이 가능하고 산업체에서 추구하는 인재양성을 목표로 국가에서 지정하는 직무 능력의 표준점을 구한 국가직무능력표준(NCS: National Competency Standards)이 개발되었으며, 이러한 시대적 흐름과 맞물려 NCS를 기반 한 자격제도까지 등장하게 되었다. 따라서 본 연구는 교육기관에서 NCS와 NCS기반 자격에서 제시하고 있는 수준에 맞춰 학교급별로 교육과정을 편성 운영하고 있는 현 시점에서 NCS기반 자격에서 제시하고 있는 수준의 전반적인 점검을 위하여 피부미용 분야 NCS기반 자격 중 피부관리 L3수준의 능력단위와 능력단위 요소의 중요도 및 우선순위를 도출하였으며, 이를 통해 산업계에서 요구하는 직무 수준별 전문인력 양성에 필요한 교육과정 개발의 기초자료로 제공하고자 시도되었다. 본 연구는 현장 전문가집단, 교육 전문가집단으로 구성하였으며, L3수준의 능력단위와 능력단위 요소에 대한 요구분석을 위해 AHP 설문 기법을 실시하였다. 또한 AHP 분석을 위한 통계처리는 데이터 코딩(data coding)과 데이터 크리닝(data cleaning) 과정을 거쳐, SPSS(Statistical Package for Social Science) ver. 21.0 통계 패키지 프로그램과 AHP전용 솔루션인 Expert Choice 2000을 활용하였다. 그 결과 현장 전문가집단, 교육 전문가집단의 의견이 부분적으로 차이를 보였다. 이는 전문적인 능력을 갖춘 현장맞춤형 인재 양성을 목표로 변화하고 있는 현 시점에서, 교육훈련기관과 산업현장의 불일치를 해소해야함을 시사하고 있으며, 해결 방안으로는 산업현장에서 요구하는 인재상과 접목시켜 산업현장의 직무와 교육기관의 표준화된 교육이라 할 수 있다.

원격탐사 기법 적용을 통한 대청호 상류 유입 부유쓰레기 조사 및 현존량 추정 연구 (Application of Remote Sensing Techniques to Survey and Estimate the Standing-Stock of Floating Debris in the Upper Daecheong Lake)

  • 김영민;장선웅 ;김흥민;김탁영;박수호
    • 대한원격탐사학회지
    • /
    • 제39권5_1호
    • /
    • pp.589-597
    • /
    • 2023
  • 집중호우 시 육상으로부터 다량으로 유입된 부유쓰레기는 사회, 경제적 및 환경적으로 악영향을 주고 있으나 집적 구역과 발생량에 대한 모니터링 체계는 미흡한 실정이다. 본 연구에서는 중부권 최대 상수원인 대청호를 대상으로 집중호우 시기에 하천 내로 유입되는 부유쓰레기의 효율적인 모니터링 방안과 현존량을 추정하기 위해 원격탐사 기법 적용 방안을 제안하였다. 대청호 수역에서 발생하는 부유쓰레기의 실태 조사를 위해 저궤도 위성통신 단말기가 탑재된 위치 추적 부이를 활용하여 이동 경로와 거동 특성을 파악하였으며, 드론 영상을 활용하여 부유쓰레기의 잠재적 집적 구역과 현존량을 추정하고자 하였다. 위치 추적 부이는 3일간 누적강우량이 200-300 mm 이상 증가하는 시기에 빠르게 이동하였다. 가장 긴 이동거리를 나타낸 호탄교의 경우 하루동안 약 72.8 km를 이동하였고 이때 최대 이동속도는 5.71 km/h를 나타냈다. 집중호우 이후 드론 영상을 활용하여 부유쓰레기의 현존량을 산출한 결과, 658.8-9,165.4 ton을 나타냈으며, 석호리 수역에서 가장 많이 발생하였다. 본 연구에서는 위치 추적 부이와 드론 영상을 통해 부유쓰레기 주요 집적 우심 구간을 파악할 수 있었으며, 전통적인 모니터링 방안보다 기동성, 신속성이 우수한 원격탐사 기반 모니터링 방법은 향후 집중호우 시기에 다량으로 유입되는 부유쓰레기의 수거, 처리 부담 비용을 절감하는데 기여할 수 있을 것으로 판단된다.

창업교육이 성인학습자의 창업의지와 창업행동에 미치는 영향: 자기효능감 매개효과를 중심으로 (The Impact of Entrepreneurship Education on Entrepreneurial Intentions and Entrepreneurial Behavior of Continuing Education Enrolled Students in University: Focusing on the Mediating Effect of Self-efficacy)

  • 유소영;양영석;김명숙
    • 벤처창업연구
    • /
    • 제18권1호
    • /
    • pp.107-124
    • /
    • 2023
  • 4차 산업혁명시대가 현대사회에 도래함에 따라 시대변화에 능동적으로 대처하고, 현재의 삶의 위기를 극복하기 위하여 직업전환을 꾀하거나 자기개발 및 노후 준비를 위한 성인학습자들의 창업에 대한 관심이 계속해서 증대되고 있다. 정부와 대학 등 여러 기관에서는 창업에 관심이 많아진 성인학습자들을 위하여 창업을 적극적으로 장려하는 정책을 추진하고 있다. 그러나, 제2차 대학 창업교육 5개년 계획(안)에 따르면 실습형 강좌보다 이론 중심의 창업교육이 대부분이며, 창업 이후의 고도화 교육지원 역량이 부족한 상황(교육부, 2018)이다. 성인학습자에게 창업교육 및 창업 환경 조성이 미흡하다는 문제점이 대두되어 창업교육이 성인학습자의 창업의지와 창업행동에 미치는 영향 관계에서 자기효능감의 효과를 실증적으로 규명하는 것이 본 연구의 목적이다. 연구대상은 성인학습자를 대상으로 2022년 9월부터 10월까지 온라인 설문조사를 실시였고, 총 207부가 수집되었다. 척도의 신뢰성을 검증하기 위하여 크론바흐 알파계수(Cronbach's α)를 산출하여 분석하고 측정하였다. 가설검증은 다중회귀분석 통계분석 방법을 사용하였고 SPSS 22.0 통계처리 프로그램을 이용하였다. 연구 결과, 첫째, 자기효능감은 창업교육에 유의한 영향을 미치는 것으로 나타났다. 둘째, 창업교육은 성인학습자의 창업의지에 유의한 영향을 미치는 것으로 나타났다. 셋째, 창업교육은 성인학습자의 창업행동에 유의한 영향을 미치는 것으로 나타났다. 넷째, 자기효능감은 성인학습자의 창업의지에 유의한 영향을 미치는 것으로 나타났다. 다섯째, 자기효능감은 성인학습자의 창업행동에 유의한 영향을 미치는 것으로 나타났다. 여섯째, 창업교육과 성인학습자의 창업의지 간의 관계에서 자기효능감은 매개 효과를 갖는 것으로 나타났다. 일곱째, 창업교육과 성인학습자의 창업행동 간의 관계에서 자기효능감은 완전매개 효과를 갖는 것으로 나타났다. 성인학습자들의 특성을 고려하여 다양한 교육방식 등을 적용하는 것이 필요함을 확인하였고 따라서 성인학습자들에게 본인들의 현장경험을 기반한 국내·외 창업 사례나 벤처기업 등의 경영관리의 전반적인 내용에 대해 실무적으로 학습하는 프로그램 또는 성인학습자들이 직접 창업을 구성하고 구상한 내용에 맞는 사업계획서를 작성하여 그 내용을 발표하고 토의하는 방식 등의 전문적인 창업교육을 위하여 지속적 개발이 필요하다는 시사점을 도출하였다. 또한, 창업교육을 통해 성인학습자들이 실제로 창업행동을 할 수 있도록 창업의지를 제고시키고 자기효능감을 심어주어 그들의 자기개발 또는 제2의 삶을 설계 할 수 있도록 지원체계를 만들어야 할 것이다.

  • PDF

함수율(含水率)이 옥수수립(粒)의 압축특성(壓縮特性)에 미치는 영향(影響) (The Effect of Moisture Content on the Compressive Properties of Korean Corn Kernel)

  • 이한만;김성래
    • 농업과학연구
    • /
    • 제13권1호
    • /
    • pp.113-122
    • /
    • 1986
  • 옥수수 수확(收穫)의 기계화(機械化) 사업(事業)을 촉진(促進)시키기 위(爲)하여, 옥수수립(粒)의 제반압축특성(諸般壓縮特性)을 규명(糾明)하며 모든 기계화(機械化) 작업도정(作業過程)에서 손상율(損傷率)이 최소(最小)로 되는 기계(機械)의 설계자료(設計資料)를 얻고자 함수율(含水率)이 옥수수립(粒)의 압축특성(壓縮特性)에 미치는 영향(影響)을 구명(究明)하기 위(爲)하여 국내재배(國內栽培)한 3품종(品種)의 옥수수를 공시재료(供試材料)로 압축방향(壓縮方向)은 평면(平面), 측면(側面), 직립(直立)의 3 수준(水準), 함수율(含水率)은 약(約) 13, 17, 21, 25%(w.b)의 4수준(水準)으로 하고 재하속도(載荷速度) 1.125mm/min의 준(準) 정하량(靜荷重)에서 Straingage system을 이용(利用), 평판축시험(平板縮試驗)을 실시(實施)하여 옥수수의 강복점(降伏點) 및 파괴점(破壞點)에 대(對)한 압축응력(壓縮應力), 변형(變形), 에너지 및 강성계수(剛性係數)를 측정(測定), 분석(分析)하였으며 그 결과(結果)를 요약(要約)하면 다음과 같다. 1. 옥수수의 함수율(含水率)이 약(約)12.5~24.5%(w.b)의 범위(範圍)일 때 평면위치(平面位置)의 강복하중(降伏荷重)은 13.63~26.73kg, 최대압축강도(最大壓縮强度)는 21.55~47.65kg 으로 함수율(含水率)이 약(約) 17% 일 때 최소(最小), 약(約) 21% 일 때 최대(最大)였으며, 측면(側面) 강복하중(降伏重荷)은 13.58~6.70kg 이었고, 측면(側面)의 최대압축강도(最大壓縮强度) 16.42~7.82kg은 직립(直立)의 최대압축강도(最大壓縮强度)인 18.55~9.05kg 보다 약간 작게 나타났다. 2. 함수율(含水率)이 약(約) 12.5~24.5%의 범위(範圍)에서, 강복변형(降伏變形)은 0.43~1.37mm, 파괴변형(破壞變形)은 0.70~2.66mm로 함수율(含水率)에 비례(比例) 변형(變形)하였으며 함수율(含水率)이 높을수록 변형율(變形率)도 증가(增加)하였다. 3. 옥수수의 함수율(含水率)이 약(約) 12.5~24.5%일 때, 탄성(彈性)에너지는 $2.60{\sim}8.57kg{\cdot}mm$, 인성에너지는 $6.41{\sim}34.36.kg{\cdot}mm$로 함수율(含水率)이 증가(增加)할수록 측면(側面)의 인성에너지는 증가(增加)하였고, 직립(直立)의 경우에 감소(減少)하여 22~23%의 함수율(含水率) 구간(區間)에서 측면(側面)과 직립(直立)에 압축(壓縮)에 관(關)한 인성에너지의 값은 동일(同一)하였다. 4. 강성계수(剛性系數)는 함수율(含水率)의 증가(增加)에 따라 감소(減少)하였고, 측면(側面)의 32.07~5.86kg/mm 보다 평면압축(平面壓縮)에서 42.12~18.68kg/mm로 컸으며 수원(水原)19호(號)가 부여계통(扶餘系統)보다 크게 나타났다. 5. 옥수수는 평면(平面)에 관(關)한 압축특성(壓縮特性)이 각종(各種) 기계(機械) 설계(設計)의 자료(資料)로 가장 중요(重要)하며, 함수율(含水率)이 약(約) 12.5~17%(w.b)일 때 최소(最少)의 분쇄(粉碎)에너지가 소요(所要)되며, 약(約) 19~24%(w.b)의 함수율(含水率)에서 옥수수를 조작(操作)할 때 곡립손상(穀粒損傷)을 감소(減少)시킬 수 있을 것으로 사료(思料)된다.

  • PDF

텍스트 마이닝 기법을 적용한 뉴스 데이터에서의 사건 네트워크 구축 (Construction of Event Networks from Large News Data Using Text Mining Techniques)

  • 이민철;김혜진
    • 지능정보연구
    • /
    • 제24권1호
    • /
    • pp.183-203
    • /
    • 2018
  • 전통적으로 신문 매체는 국내외에서 발생하는 사건들을 살피는 데에 가장 적합한 매체이다. 최근에는 정보통신 기술의 발달로 온라인 뉴스 매체가 다양하게 등장하면서 주변에서 일어나는 사건들에 대한 보도가 크게 증가하였고, 이것은 독자들에게 많은 양의 정보를 보다 빠르고 편리하게 접할 기회를 제공함과 동시에 감당할 수 없는 많은 양의 정보소비라는 문제점도 제공하고 있다. 본 연구에서는 방대한 양의 뉴스기사로부터 데이터를 추출하여 주요 사건을 감지하고, 사건들 간의 관련성을 판단하여 사건 네트워크를 구축함으로써 독자들에게 현시적이고 요약적인 사건정보를 제공하는 기법을 제안하는 것을 목적으로 한다. 이를 위해 2016년 3월에서 2017년 3월까지의 한국 정치 및 사회 기사를 수집하였고, 전처리과정에서 NPMI와 Word2Vec 기법을 활용하여 고유명사 및 합성명사와 이형동의어 추출의 정확성을 높였다. 그리고 LDA 토픽 모델링을 실시하여 날짜별로 주제 분포를 계산하고 주제 분포의 최고점을 찾아 사건을 탐지하는 데 사용하였다. 또한 사건 네트워크를 구축하기 위해 탐지된 사건들 간의 관련성을 측정을 위하여 두 사건이 같은 뉴스 기사에 동시에 등장할수록 서로 더 연관이 있을 것이라는 가정을 바탕으로 코사인 유사도를 확장하여 관련성 점수를 계산하는데 사용하였다. 최종적으로 각 사건은 각의 정점으로, 그리고 사건 간의 관련성 점수는 정점들을 잇는 간선으로 설정하여 사건 네트워크를 구축하였다. 본 연구에서 제시한 사건 네트워크는 1년간 한국에서 발생했던 정치 및 사회 분야의 주요 사건들이 시간 순으로 정렬되었고, 이와 동시에 특정 사건이 어떤 사건과 관련이 있는지 파악하는데 도움을 주었다. 또한 일련의 사건들의 시발점이 되는 사건이 무엇이었는가도 확인이 가능하였다. 본 연구는 텍스트 전처리 과정에서 다양한 텍스트 마이닝 기법과 새로이 주목받고 있는 Word2vec 기법을 적용하여 봄으로써 기존의 한글 텍스트 분석에서 어려움을 겪고 있었던 고유명사 및 합성명사 추출과 이형동의어의 정확도를 높였다는 것에서 학문적 의의를 찾을 수 있다. 그리고, LDA 토픽 모델링을 활용하기에 방대한 양의 데이터를 쉽게 분석 가능하다는 것과 기존의 사건 탐지에서는 파악하기 어려웠던 사건 간 관련성을 주제 동시출현을 통해 파악할 수 있다는 점에서 기존의 사건 탐지 방법과 차별화된다.

지식 공유의 파레토 비율 및 불평등 정도와 가상 지식 협업: 위키피디아 행위 데이터 분석 (Pareto Ratio and Inequality Level of Knowledge Sharing in Virtual Knowledge Collaboration: Analysis of Behaviors on Wikipedia)

  • 박현정;신경식
    • 지능정보연구
    • /
    • 제20권3호
    • /
    • pp.19-43
    • /
    • 2014
  • 전체 결과의 80%가 전체 원인의 20%에 의해 일어난다는 파레토 법칙(Pareto principle)은 상위 20%의 핵심 고객에 대한 우선적인 마케팅을 비롯하여 기업 경영의 많은 부분에서 적용되어 왔다. 파레토 법칙과는 대조적으로, 80%의 사소한 다수가 20%의 핵심적인 소수보다 우월한 가치를 창출한다는 롱테일 법칙(Long Tail theory)은 ICT(Information and Communication Technology)의 발전과 함께 새로운 경영 패러다임으로 주목 받아오고 있다. 본 연구의 목적은 경영 현장에서 양대 흐름을 형성해온 이러한 법칙들이 변화무쌍한 글로벌 가상화 환경에서 기업의 핵심적인 성공 요인이라고 할 수 있는 가상 지식 협업에는 어떻게 관련되는지를 규명하는 것이다. 이를 위해, 대표적인 가상 지식 협업 커뮤니티인 위키피디아에서 품질 최상위 등급인 피쳐드 아티클(Featured Article) 레벨로 승급된 2,978개의 아티클에 대한 협업 행위를 분석하였다. 즉, 각 아티클 그룹에서 편집 횟수 기준 상위 20%에 속하는 참여자들의 총 편집 횟수가 전체 편집 횟수에서 차지하는 비율인 파레토 비율(Pareto ratio)이 지식 협업 효율성과 어떤 관계를 가지고 있는지를 도출하였다. 그리고, 이러한 연구를 편집 참여를 통한 지식 공유에 대한 전체적인 불평등 정도를 나타내는 지니 계수(Gini coefficient)의 영향 및 그룹의 작업 특성을 반영하도록 확장하였다. 결과적으로, 지식 공유의 파레토 비율과 지니 계수가 증가하면 지식 협업 효율성도 높아지지만, 이러한 변수들이 일정 수준 이상으로 증가하면 오히려 지식 협업 효율성이 낮아지는 역 U자(inverted U-shaped) 관계가 있음을 확인하였다. 그리고, 이러한 관계는 인지적 노력을 상대적으로 더 많이 요구하는 학문적인 특성의 작업에서 더 민감하게 작용하는 것으로 보인다.