• 제목/요약/키워드: keyword-based analysis

검색결과 629건 처리시간 0.028초

소셜미디어에 나타난 풍력발전시설의 경관 인식 연구 (A Study on the Landscape Cognition of Wind Power Plant in Social Media)

  • 우경숙;서주환
    • 한국조경학회지
    • /
    • 제50권5호
    • /
    • pp.69-79
    • /
    • 2022
  • 본 연구는 최근 신재생에너지원으로 관광, 여행 등의 목적을 가지며 관광자원의 역할을 할 수 있는 풍력발전시설의 경관 인식을 파악하였다. 이에 지역별로 방문객이 경험한 풍력발전시설의 경관과 관련된 소셜미디어 데이터를 분석하였다. 분석 결과, 풍력발전시설의 경관을 인식할 때 연구대상지에서 공통적으로 풍력발전시설의 규모, 조망점과 풍력발전시설 간의 거리, 조망점에서 풍력발전시설을 볼 때 시각적 개방성, 풍력발전시설이 위치하고 있는 지형에 따라 달라지는 것을 알 수 있다. 또한, 풍력발전시설의 선호는 풍력발전시설의 형태와 주변경관을 파악할 수 있는 장소인 평지나 바다에 설치되어 있는 곳을 더 좋은 경관이라고 인식하고 있다. 특이한 점으로 경관에 대한 부정적인 키워드는 강원도 태백 가덕산, 태백 매봉산, 태기산과 경상도 경주 풍력발전시설에서 나타났다. 부정적인 키워드는 풍력발전시설을 가까이 조망했을 때 조망각이 높아 느껴지는 압도적인 크기와 산의 능선이 함께 보이는 경관에서 심리적 위압감을 느끼고 있음을 알 수 있다. 반면, 평지나 바다가 보이는 경관의 풍력발전시설에서는 긍정적인 경관 형용사가 도출되어 방문객은 경관의 스카이라인이 산 능선과 겹쳐서 보이거나 너무 가까이에서 풍력발전시설을 바라볼 때보다 평지나 바다에서 경관의 시각량이 충분히 확보될 때 그 장소를 대표할 만한 상징적인 요소라고 인식하고 있음을 알 수 있다. 본 연구는 풍력발전시설을 경험한 방문객의 의견을 토대로 경관 인식을 분석하였다. 그러나 풍력발전시설은 설치되는 권역별로 경관특성이 다르고, 시점, 관찰자 등 변수가 많아 연구결과를 일반화시키기 어려운 한계가 있다. 최근 풍력발전시설 조성 시 발생하는 경관훼손이 주요 이슈가 되고 있고, 국내에는 풍력발전시설의 경관을 평가할 수 있는 방법이 미흡하다. 이에 풍력발전시설의 경관을 평가할 시 풍력발전시설의 규모, 풍력발전시설이 설치된 지역 고유의 자연적 특성, 풍력발전시설과 조망점과의 거리가 중요한 구성요소로 나타난 것은 주목할 사항이라 판단된다. 또한, 풍력시설은 보전해야 할 자연환경에 설치되는 시설로 추후 경관적 관점에서 풍력발전시설과 주변 환경을 바라보는 경관의 연구가 필요하다.

인구통계특성 기반 디지털 마케팅을 위한 클릭스트림 빅데이터 마이닝 (Clickstream Big Data Mining for Demographics based Digital Marketing)

  • 박지애;조윤호
    • 지능정보연구
    • /
    • 제22권3호
    • /
    • pp.143-163
    • /
    • 2016
  • 인구통계학적 정보는 디지털 마케팅의 핵심이라 할 수 있는 인터넷 사용자에 대한 타겟 마케팅 및 개인화된 광고를 위해 고려되는 가장 기초적이고 중요한 정보이다. 하지만 인터넷 사용자의 온라인 활동은 익명으로 행해지는 경우가 많기 때문에 인구통계특성 정보를 수집하는 것은 쉬운 일이 아니다. 정기적인 설문 조사를 통해 사용자들의 인구통계특성 정보를 수집할 수도 있지만 많은 비용이 들며 허위 기재 등과 같은 위험성이 존재한다. 특히, 모바일 환경에서는 대부분의 사용자들이 익명으로 활동하기 때문에 인구통계특성 정보를 수집하는 것은 더욱 더 어려워지고 있다. 반면, 인터넷 사용자의 온라인 활동을 기록한 클릭스트림 데이터는 해당 사용자의 인구통계학적 정보에 활용될 수 있다. 특히, 인터넷 사용자의 온라인 행위 특성 중 하나인 페이지뷰는 인구통계학적 정보 예측에 있어서 중요한 요인이 된다. 본 연구에서는 기존 선행 연구를 토대로 클릭스트림 데이터 분석을 통해 인터넷 사용자의 온라인 행위 특성을 추출하고 이를 해당 사용자의 인구통계학적 정보 예측에 사용한다. 또한, 1)의사결정나무를 이용한 변수 축소, 2)주성분분석을 활용한 차원축소, 3)군집분석을 활용한 변수축소의 방법을 제안하고 실험에 적용함으로써 많은 설명변수를 이용하여 예측 모델 생성 시 발생하는 차원의 저주와 과적합 문제를 해결하고 예측 모델의 정확도를 높이고자 하였다. 실험 결과, 범주의 수가 많은 다분형 종속변수에 대한 예측 모델은 모든 설명변수를 사용하여 예측 모델을 생성했을 때보다 본 연구에서 제안한 방법론들을 적용했을 때 예측 모델에 대한 정확도가 향상됨을 알 수 있었다. 본 연구는 클릭스트림 분석을 통해 추출된 인터넷 사용자의 온라인 행위는 해당 사용자의 인구통계학적 정보 예측에 활용 가능하며, 예측된 익명의 인터넷 사용자들에 대한 인구통계학적 정보를 디지털 마케팅에 활용 할 수 있다는데 의의가 있다. 또한, 제안 방법론들을 통해 어느 종속변수에 대해 어떤 방법론들이 예측 모델의 정확도를 개선하는지 확인하였다. 이는 추후 클릭스트림 분석을 활용하여 인구통계학적 정보를 예측할 때, 본 연구에서 제안한 방법론을 사용하여 보다 높은 정확도를 가지는 예측 모델을 생성 할 수 있다는데 의의가 있다.

국내 프로축구 팬들의 유니폼 소비 분석: 손흥민의 토트넘 홋스퍼 FC 이적 전후 비교 (Analysis of Football Fans' Uniform Consumption: Before and After Son Heung-Min's Transfer to Tottenham Hotspur FC)

  • 최영현;이규혜
    • 지능정보연구
    • /
    • 제26권3호
    • /
    • pp.91-108
    • /
    • 2020
  • 박지성 선수의 2005년 맨체스터 유나이티드 FC 입단 이후로, 국내에서 프로축구 유니폼 시장이 본격적으로 성장하기 시작했다. 이후, 국내 선수들의 해외 리그에서 활약이 계속되면서 국내에서도 잉글랜드 프리미어리그에 대한 대중의 관심이 지속되고 있다. 이러한 시점에서 본 연구는 국내 프로축구 팬들의 유니폼 소비에 전반적인 소비자 인식을 알아보고, 선수의 영입에 따른 소비자 인식 변화를 비교하고자 했다. EPL의 토트넘에서 활동하고 있는 손흥민 선수의 영입 전후를 중심으로 소셜 미디어에 나타난 프로축구 팬들의 소비자 인식과 구매 요인을 알아보았다. 'EPL 유니폼'을 키워드로, 국내 포털사이트와 소셜 미디어의 게시글을 수집하고, 텍스트 마이닝, SNA, 회귀분석을 사용하여 분석했다. 연구 결과, 첫째, 선수의 소속 팀, 실적, 포지션과 구단의 실적, 순위, 리그의 우승 여부가 프로축구 유니폼의 구매와 탐색에 있어 주요 요인으로 확인되었다. 가격, 디자인, 사이즈, 로고 등과 같은 항목보다 유니폼의 형태, 마킹, 정품 여부, 스폰서와 더 중요하게 작용하고 있었다. 둘째, 구조적 등위성 분석과 군집분석을 통해 국내 프로축구 팬들 사이에서 유니폼과 관련되어 언급되고 있는 주요 주제를 알아본 결과, EPL에 소속된 구단과 유명 선수들이 가장 핵심적인 주제로 나타났다. 셋째, 프로축구 유니폼에 대한 시기별 주제는 월드컵과 EPL 리그에 대한 관심에서 EPL에서 활동하는 다양한 국내외 선수들에 대한 관심으로, 2015년 이후에는 유니폼 자체에 대한 것으로 주제가 변화했다. 이를 통해, 선수들의 이적에 따라 선수가 소속된 해당 구단의 유니폼이 관심을 받고 있음을 알 수 있었다. 넷째, 남녀 소비자 모두 손흥민에 대한 관심이 증가함에 따라서 토트넘이 소속된 리그인 EPL에 대한 관심도 증가하는 것으로 나타났다. 여성의 경우 손흥민에 대한 관심이 증가함에 따라 축구 유니폼에 대해서도 관심을 가지는 것으로 나타난 반면, 남성의 경우 손흥민 선수에 대한 관심과 축구 유니폼에 대한 관심 사이의 관계가 유의하게 나타나지 않았다. 각 구단은 선수와 구단의 성적과 이미지 관리, 스폰서 브랜드 관리에 집중하고, 선수의 이적이 결정되면 선수의 자국에 해당 물량의 공급을 늘리며, 인기를 끌고 있는 선수의 등번호가 부착된 유니폼의 경우에는 여성을 위한 다양한 사이즈를 제공해야 할 필요가 있다.

디스포지티프 영화의 다양한 가능성 (Various Possibilities of Dispositif Film)

  • 김채희
    • 트랜스-
    • /
    • 제3권
    • /
    • pp.55-86
    • /
    • 2017
  • 본 논문은 포스트 시네마 시대가 도래함에 따라 영화 매체에 대한 재사유와 동시대 영화들의 특정한 경향들을 포섭할 수 있는 개념이 필요하다는 자각에서 출발했다. 최근, 새롭게 등장한 도전적이면서 변화무쌍한 실험적인 영화들은 고전적인 미장센과 몽타주 분석만으로 접근하기 힘든 미학을 선보인다. 고전적 개념 틀로 분석하기가 곤혹스러운 영화들을 본고에서는 에이드리언 마틴이 제시한 디스포지티프 논의를 수용해서 고찰했다. 디스포지티프적 움직임은 디지털 테크놀로지가 기반이 되는 현대의 미디어 환경 속에서 급격히 늘어나긴 했지만 이 흐름이 어떤 특정한 시대에만 국한된 현상은 아니다. 일부 고전영화에서도 그 움직임이 감지됐으며 1920년대 아방가르드 영화들, 1960년대 모더니즘 영화들 일부에서 디스포지티프 경향은 계속 존재했었다. 영화적 디스포지티프의 명확한 개념화를 위해 본 논문은 오늘날 영화이론에 유입되고 있는 디스포지티프 논의의 근원을 살펴보았다. 하지만 인문학적 차원에서 논의되는 디스포지티프 이론은 분명 영화에서 거론되는 것과는 차이가 있다. 따라서 본고는 마틴의 노고로 가시화된 디스포지티프의 시네마틱한 요소를 부각시키면서 논의를 진행했다. 푸코가 정초한 디스포지티프의 기본적 의미는 이질적인 요소들로 구성된 장치의 배치와 배열이다. 때로는 이질적인 요소들의 앙상블 그 자체를 가리키기도 한다. 디스포지티프 논의를 촉발시켰던 푸코의 개념을 빌어 디스포지티프 영화를 정의한다면, 고전적 영화의 조건들을 구성하는 이질적 요소들의 재(탈)배치와 배열로 이루어진 새로운 '고안물(constraption)'이라고 할 수 있을 것이다. 어떤 것이 새로운 고안물이 되기 위해서는 그것을 이루는 요소들, 즉 힘들의 배열과 배치에 변화가 일어나야 한다. 당연히 그 요소들은 내적인 요소와 외적인 요소들을 아우른다. 내적인 요소는 주로 영화의 컨벤션에 대한 것이며 외적인 요소는 영화를 둘러싼 정치, 문화, 사회적인 조건과 영화를 가능하게 하는 광학적, 물리적 토대 모두를 포함한다. 영화는 어떤 매체보다도 빠른 속도로 다른 매체와 손쉽게 '네트워킹'하며 새롭게 '고안된' 미학 양식을 만들 수 있다. 상호매체성으로 정의되는 디지털 시대의 두드러진 특징을 디스포지티프 개념으로 바라본다면 영화뿐만 아니라 예술 전반에 걸쳐 발생하는 새로운 흐름들을 이해하는 데 도움이 될 것이다.

  • PDF

간호학생의 응급환자간호 임상실습 온라인 프로그램 개발 및 적용 (Development and Application of an Online Clinical Practicum Program on Emergency Nursing Care for Nursing Students)

  • 김원경;박정민;송지은
    • 한국엔터테인먼트산업학회논문지
    • /
    • 제15권1호
    • /
    • pp.131-142
    • /
    • 2021
  • 코로나 바이러스(COVID-19) 팬데믹으로, 전국의 대학들이 온라인 플랫폼을 사용한 비대면 강의를 시행하고 있다. 따라서 응급환자간호 임상실습 교육에 맞는 온라인 프로그램을 개발하고, 간호학생에게 적용하여 그 효과를 확인해보고자 시도 되였다. 본 연구는 양적자료와 질적자료를 분석한 방법론적 연구로, G광역시 N대학교 성인간호학교수 3인이 G광역시 종합병원 간호부장과 응급실 수간호사들에게 자문을 구하여 학생들의 교과목과 관련된 요구도 조사 후에, 4학년을 대상으로 응급환자간호 임상실습 온라인 프로그램을 ADDIE모형에 따라 개발하였다. 프로그램은 총 4주 동안 진행되었으며, 1주에 영상 4시간, 과제 2가지로 구성하였고, 실시간 쌍방향 화상집담회도 포함되었다. 총 96명 학생 자료가 수집되었으며, SPSS/WIN 22 프로그램으로 분석하였다. 자료 분석결과 교과목 만족도 부분에서 '학습목표 연계성'이 총 6.0만점에 평균 5.58±0.98로 가장 점수가 높았다. 응급간호 학습성취도에서는 'BLS 수행 '이 평균 5.47±0.74로 가장 점수가 높았으며, '낙상예방 간호수행'(5.39±0.77), '응급환자 기록수행'(5.30±0.70), '감염예방 간호수행'(5.27±0.736) 순이었다. '3학년때 시행한 대면임상실습경험과 이번학기 비대면임상실습수업 경험을 비교하여 내가 생각하는 이번학기 수업의 장점은 무엇인가?'에 관한 질적자료를 Keyword로 추출하여 Wordcloud로 제시한 결과 답변을 한 77명의 학생들 중 '간호과정경험'이라고 답한 경우가 13명(16.9%)로 가장 많은 빈도를 나타내었고, '자세한 교수설명'이 10명(13.0%), '사례기반실습'이 9명(11.7%) '시간과 공간의 제약이 없다(Anytime anywhere)'고 답한 경우가 8명(10.4%) 순으로 나타났다. 이에, 개발된 온라인 프로그램을 활용한 응급환자간호 임상실습이 학생들의 교과목 요구도를 반영한 학생들의 학습성취도를 파악하였으며, 대면실습과 비교하여 교과목 만족도가 높게 나타나 개발된 온라인 프로그램을 향후 응급환자간호 임상실습에서 활용 가능할 것으로 생각된다.

HMR 무인매장 서비스 품질 분류에 관한 연구 (Classification of Service Quality for HMR unmanned store business)

  • 이종원
    • 서비스연구
    • /
    • 제13권2호
    • /
    • pp.41-61
    • /
    • 2023
  • 제4차 산업혁명 시대의 보편적 삶의 형태는 비대면이라는 키워드로 요약될 수 있을 것이다. 특히 소비 활동 측면에서도 점차 대면 접촉이 최소화되는 시스템으로 변화하고 있으며, 오프라인 매장에서는 키오스크(kiosk)와 로봇 등을 통한 비접촉 서비스로의 전환이 빠르게 이어지고 있다. 사회 구조 역시 시간의 흐름에 따라 변화되고 있으며 특히 1인 가구 증가와 고령화는 식생활과 연관된 외식산업의 변화에도 영향을 미치고 있다. 가정 내에서 직접 조리하는 노동이 줄어들고, 대체할 수 있는 식품의 이용이 증가하고 있음에 따라 가정간편식 (HMR: Home Meal Replacement)시장이 큰 규모로 성장하였다. 시장의 규모가 커지며 상품을 제공하는 비즈니스의 형태도 다양해졌다. 기술의 발전, 비대면 문화 그리고 기업의 경영 효율성이 맞물리며 최근 무인매장이 확산되고 있는 추세이다. 본 연구에서는 차츰 경쟁이 심화되는 HMR 무인매장의 서비스 품질 속성을 분류하여 고객만족을 기반으로 한 서비스 경영 관리 측면의 시사점을 제공하고자 Kano model을 활용한 서비스 품질 분류 및 Timko의 고객만족계수를 산출하였다. 분석결과 '상품(메뉴) 다양성' 등이 매력적 품질로 분류되었으며, '매장 내부/외부 청결성' 등이 일원적 품질로 분류되었다. 또한 '셀프 계산 과정의 편리성'은 당연적 품질, '매장 내 통행의 편리성' 무관심 품질로 분류되었다. 나아가 만족계수가 가장 높은 요소는 '상품(메뉴)다양성'으로, 불만족계수가 가장 높은 요소는 '셀프 계산과정의 편리성'으로 나타났다. 본 연구의 결과를 통해 HMR 무인매장의 서비스 품질 관리에 있어 우선순위를 도출하고, 이를 통해 관련 비즈니스에서의 전략적 시사점을 제공하고자 한다.

웹검색 트래픽 정보를 활용한 지능형 브랜드 포지셔닝 시스템 : 태블릿 PC 사례를 중심으로 (Intelligent Brand Positioning Visualization System Based on Web Search Traffic Information : Focusing on Tablet PC)

  • 전승표;박도형
    • 지능정보연구
    • /
    • 제19권3호
    • /
    • pp.93-111
    • /
    • 2013
  • 최근 독감 예측이나 부동산가격 예측 등 다양한 분야에서 웹검색 트래픽이나 소셜 네트워크 등의 방대한 고객 데이터를 통해 사회 현상, 소비 트렌드 등을 분석하고자 하는 시도가 증가하고 있다. 최근 구글이나 네이버 등의 인터넷 포털서비스 업체들은 온라인 사용자들의 웹검색 트래픽 정보를 구글 트렌드, 네이버 트렌드 등의 서비스로 공개하고 있는데, 이들이 제공하는 웹검색 트래픽 정보를 기반으로 온라인 사용자들의 정보 검색 행태에 대한 연구들이 학계 업계 등에서 주목받고 있다. 웹검색 정보를 기반으로 사회 현상이나, 소비 동향, 정치 투표 결과 등을 예측해 볼 수 있음을 실증하고 있는 분야는 많은 연구가 수행되고 있지만, 웹검색 트래픽 정보를 이용하여, 소비자의 제품에 대한 중요한 속성 도출 및 소비자의 기대 변화 관측 등의 온라인 사용자 행태에 초점을 맞추어 연구되고 있는 분야는 상대적으로 많은 연구가 수행되고 있지는 않다. 따라서, 본 연구에서는 구글이나 네이버가 제공하는 소비자의 웹검색 트래픽을 활용해서 소비자가 생각하는 제품 포지션을 가시화할 수 있는 방법을 제안한다. 브랜드 간의 관계를 확인하기 위해, 동시 검색 트래픽 정보를 활용하여 네트워크 모델링의 방법을 사용한 시스템을 제안하고 있으며, 이를 통해 소비자들이 제품 간의 유사성을 어떻게 인지하고 형성하며, 새로운 혁신 제품 카테고리 내에서 제품 브랜드들이 소비자의 마음 속에서 어떻게 자리 잡고 있는지의 브랜드 포지셔닝을 확인할 수 있는 방법론을 제안하였다. 또한 이를 태블릿 PC의 사례를 통해서, 미시적인 관점에서 소비자의 마음속에 위치한 태블릿 PC 개별 브랜드들의 위치 및 관계를 보여주었다. 기업은 소비자의 제품에 대한 인식 및 중요 속성 도출을 위해 많은 비용과 시간을 소요하여 소비자 조사를 행하게 되는데, 본 연구의 방법론을 활용하여 소비자의 제품에 대한 인식, 제품간 유사도, 제품에 대한 중요 속성의 변화 등을 일반에게 공개된 검색 트래픽 정보를 활용하여 비교적 쉽고 추가적인 비용 없이 도출할 수 있을 것이다.

법령정보 검색을 위한 생활용어와 법률용어 간의 대응관계 탐색 방법론 (Term Mapping Methodology between Everyday Words and Legal Terms for Law Information Search System)

  • 김지현;이종서;이명진;김우주;홍준석
    • 지능정보연구
    • /
    • 제18권3호
    • /
    • pp.137-152
    • /
    • 2012
  • 인터넷 환경에서 월드 와이드 웹이 등장한 이후 웹을 통해 수많은 웹 페이지들이 생산됨에 따라 사용자가 원하는 정보를 검색하기 위한 다양한 형태의 검색 서비스가 여러 분야에서 개발되어 활용되고 있다. 특히 법령 검색은 사용자가 현재 자신이 처한 상황에 필요한 법령을 검색하여 법령에 대한 지식을 얻기 위한 창구로써 국민의 편의를 제공하기 위해 반드시 필요한 서비스 중 하나이다. 이에 법제처는 2009년부터 국민 누구나 편리하게 법령에 관련된 정보를 검색할 수 있도록 국가의 법령뿐만 아니라 행정규칙이나 판례 등 모든 법령정보를 검색할 수 있는 검색 서비스를 제공하고 있다. 하지만 현재까지의 검색엔진 기술은 기본적으로 사용자가 입력한 질의어를 문서에 포함하고 있는지의 여부에 따라 해당 문서를 검색 결과로 제시한다. 법령 검색 서비스 또한 해당 법령에 등장하는 키워드를 활용하여 사용자에게 검색 결과를 제공해주고 있다. 따라서 법제처의 이런 노력에도 불구하고 법령이 전문가의 시각에서 작성되었기 때문에 법에 익숙하지 않은 일반 사용자는 자신이 필요한 법령을 검색하기 어려운 한계점을 가지고 있다. 이는 일반적으로 법령에 사용되는 용어들과 일반 사용자가 실생활에 사용하는 단어가 서로 상이하기 때문에 단순히 키워드의 단순 매칭 형태의 검색엔진에서는 사용자들이 주로 사용하는 생활용어를 이용해서 원하는 법령을 검색할 수 없다. 본 연구에서는 법률용어에 관한 사전지식이 부족한 일반 사용자가 일상에서 주로 사용되는 생활용어를 이용하여 키워드 기반의 법령정보 검색 사이트에서 정확한 법령정보 검색이 가능하도록 생활용어와 법률용어 간의 대응관계를 탐색하고 이를 이용하여 법령을 검색할 수 있는 방법론을 제안하고자 한다. 우선 생활용어와 법률용어 간의 대응관계를 발견하기 위해 본 논문에서는 사용자들의 집단지성을 활용한다. 이를 위해 사용자들이 블로그의 분류 및 관리, 검색에 활용하기 위해 작성한 태그 정보를 이용하여 질의어인 생활용어와 관련된 태그들을 수집한다. 수집된 태그들은 K-means 군집분석 기법을 통해 태그들을 클러스터링하고, 생활용어와 가장 가까운 법률용어를 찾기 위한 평가 방법을 통해 생활용어에 대응될 수 있는 적절한 법률용어를 선택한다. 선택된 법률용어는 해당 생활용어와 명시적인 관계성이 부여되며, 이러한 생활용어와 법률용어와의 관계는 온톨로지 기반의 시소러스를 기술하기 위한 SKOS를 이용하여 표현된다. 이렇게 구축된 온톨로지는 사용자가 생활용어를 이용하여 검색을 수행할 경우 생활용어에 대응되는 적절한 법률용어를 찾아 법령 검색을 수행하고 그 결과를 사용자에게 제시한다. 본 논문에서 제시하고자 하는 방법론을 통해 법령 및 법률용어에 관련된 사전 지식이 없는 일반 사용자도 편리하고 효율적으로 법령을 검색할 수 있는 서비스를 제공할 것으로 기대한다.

토픽모델링을 활용한 COVID-19 학술 연구 기반 연구 주제 분류에 관한 연구 (A study on the classification of research topics based on COVID-19 academic research using Topic modeling)

  • 유소연;임규건
    • 지능정보연구
    • /
    • 제28권1호
    • /
    • pp.155-174
    • /
    • 2022
  • 2020년 1월부터 2021년 10월 현재까지 COVID-19(치명적인 호흡기 증후군인 코로나바이러스-2)와 관련된 학술 연구가 500,000편 이상 발표되었다. COVID-19와 관련된 논문의 수가 급격하게 증가함에 따라 의료 전문가와 정책 담당자들이 중요한 연구를 신속하게 찾는 것에 시간적·기술적 제약이 따르고 있다. 따라서 본 연구에서는 LDA와 Word2vec 알고리즘을 사용하여 방대한 문헌의 텍스트 자료로부터 유용한 정보를 추출하는 방안을 제시한다. COVID-19와 관련된 논문에서 검색하고자 하는 키워드와 관련된 논문을 추출하고, 이를 대상으로 세부 주제를 파악하였다. 자료는 Kaggle에 있는 CORD-19 데이터 세트를 활용하였는데, COVID-19 전염병에 대응하기 위해 주요 연구 그룹과 백악관이 준비한 무료 학술 자료로서 매주 자료가 업데이트되고 있다. 연구 방법은 크게 두 가지로 나뉜다. 먼저, 47,110편의 학술 논문의 초록을 대상으로 LDA 토픽 모델링과 Word2vec 연관어 분석을 수행한 후, 도출된 토픽 중 'vaccine'과 관련된 논문 4,555편, 'treatment'와 관련된 논문 5,791편을 추출한다. 두 번째로 추출된 논문을 대상으로 LDA, PCA 차원 축소 후 t-SNE 기법을 사용하여 비슷한 주제를 가진 논문을 군집화하고 산점도로 시각화하였다. 전체 논문을 대상으로 찾을 수 없었던 숨겨진 주제를 키워드에 따라 문헌을 분류하여 토픽 모델링을 수행한 결과 세부 주제를 찾을 수 있었다. 본 연구의 목표는 대량의 문헌에서 키워드를 입력하여 특정 정보에 대한 문헌을 분류할 수 있는 방안을 제시하는 것이다. 본 연구의 목표는 의료 전문가와 정책 담당자들의 소중한 시간과 노력을 줄이고, 신속하게 정보를 얻을 수 있는 방법을 제안하는 것이다. 학술 논문의 초록에서 COVID-19와 관련된 토픽을 발견하고, COVID-19에 대한 새로운 연구 방향을 탐구하도록 도움을 주는 기초자료로 활용될 것으로 기대한다.