• 제목/요약/키워드: 텍스트분류

검색결과 680건 처리시간 0.023초

고시조 앤솔로지 편찬 방법 연구 - 자산 안확의 <모범의 고시조>를 중심으로 - (A Study on compiling way of gosijo anthology - Focusing on the classic gosijos(模範의 古時調) wascompiled by Anhwak(安廓) -)

  • 김태웅
    • 한국시조학회지:시조학논총
    • /
    • 제43권
    • /
    • pp.67-94
    • /
    • 2015
  • 이 글은 고시조 앤솔로지 편찬 방법 연구를 위해 이 연구의 필요성과 방법을 제시하였고 이를 위해 1910~2000년대에 이르기까지 53종의 고시조 앤솔로지의 목록화 작업을 진행하였다. 이 글에서 53종의 이르는 모든 고시조 앤솔로지의 편찬 방법을 분석할 수는 없었기에 자산의 <모범의 고시조>를 택해 고시조 앤솔로지 편찬 방법 연구를 진행하였다. 자산의 <모범의 고시조>는 신출 작품이 없는 그것도 단행본이 아닌 잡지의 하나의 소제목으로 이름 붙여진 것이다. 하지만 100수라는 적지 않은 작품수와 모든 작품이 유명씨로 구성되었으며 주제별 분류 방식을 택했다는 점이 고시조 앤솔로지의 역할을 충분히 담당할 수 있다고 생각되기에 이 텍스트를 중점적으로 분석해 보았다. <모범의 고시조>는 몇 가지 측면에서 중요한 의의가 있다고 생각된다. 첫째, 이 고시조 앤솔로지는 평시조만을 수록하고 있으며 모든 작품에 작가가 기록되어 있는 유일한 시조집이라고 할 수 있다. 둘째, 이 고시조 앤솔로지에 수록된 작품들은 대부분이 다수의 가집에 수록되어 있는 인기곡들이다. 100수의 작품을 일일이 "고시조대전"에서 찾아 확인해 본 결과 극히 일부 작품을 제외하고는 대부분의 작품이 20개 이상의 가집에 수록되어 있으며, 40개 이상의 가집에 수록된 작품도 상당수에 이른다. 셋째, 이 고시조 앤솔로지에는 고시조사에서 작가로서 등장하지 않는 박대길, 최서붕, 오희상, 장우벽, 안사필, 안윤기 등이 작가로 등장하는 것이 특징이다. 넷째, 이 고시조 앤솔로지는 자산이 그가 태어나고 자란 우대지역의 특성을 바탕으로 조선 가곡의 근간이 된 우대 가객과 지역성을 드러내고 있다.

  • PDF

텍스트 마이닝을 활용한 미국 노년 소비자와 애완용 로봇 간 상호작용에 대한 분석: Joy For All Companion Pets에 대한 아마존 리뷰를 중심으로 (Text-Mining Analysis on the Interaction between the American Consumers Aged over 60 and Companion Pets Robots: Focused on Amazon Reviews for Joy For All Companion Pets)

  • 정예은;이유림;정재은
    • 디지털융복합연구
    • /
    • 제19권10호
    • /
    • pp.469-489
    • /
    • 2021
  • 본 연구는 정서 지원 애완용 로봇에 대한 소비자의 담론을 살펴보고 키워드를 통해 해당 제품에 대한 노년 소비자의 반응을 파악하고자 아마존 사이트 내 하즈브로(Hasbro)의 Companion Pets 제품 사용에 대한 미국 소비자들의 리뷰를 수집하고, R을 이용하여 단어 빈도분석, 토픽모델링 LDA 분석을 실시하였다. 첫째, 키워드 빈도분석 결과 애완용 로봇의 형태가 실제 동물과 유사한지에 대한 관심이 높은 것으로 나타났다. 둘째, 토픽모델링 결과 5개의 토픽으로 인지, 감정, 행동적 반응이 도출되었으며 이는 긍정 및 부정으로 크게 분류되었다. 셋째, 소비자와 애완용 로봇의 상호작용에 영향을 미치는 사용자, 제품 및 환경적 특성이 확인되었다. 애완용 로봇은 반려동물을 키우기 어려운 사람들이 이를 대체하기 위하여 사용하고, 인지적 어려움이 있는 노년 소비자와 신체적 어려움이 있는 소비자가 이를 이용하는 것으로 나타났다. 본 연구는 코로나19와 같은 팬데믹 상황에서 정서 지원 기능을 수행하는 애완용 로봇에 대하여 이해하고, 소비자의 효용을 극대화하는 서비스를 제공하는데 도움을 줄 것으로 기대한다.

공원 이슈에 대한 주요 언론의 담론변화분석 - 1995년부터 2019년까지 신문 기사를 중심으로 - (Analysis of Changes in Discourse of Major Media on Park Issues - Focusing on Newspaper Articles Published from 1995 to 2019 -)

  • 고하정
    • 한국조경학회지
    • /
    • 제49권5호
    • /
    • pp.46-58
    • /
    • 2021
  • 국내에 근대식 공원이 도입된 이후, 공원은 우리에게 필수적인 존재가 되었다. 민선시기 이후, 공원조성 등 공원을 둘러싼 이슈가 생산되고 언론을 통해 확산되어 담론을 형성하는 과정을 거쳤다. 이에 본 연구는 민선시장 체제인 1995년 이후의 '공원' 관련 이슈를 다룬 국내 중앙지의 보도기사를 수집하여 토픽분석과 의미연결망 분석을 통해 공원에 대한 시계열적 담론 변화 추이를 분석하였다. LDA 토픽모델링 분석결과, 5개의 토픽-도시공원확충(토픽1), 역사문화공원(토픽2), 이용프로그램(토픽3), 동물원 사건사고(토픽4), 공원조성과정갈등(토픽5)-으로 분류되었다. 언론에서 다룬 주요 공원담론은 다음과 같다. 첫째, 공원의 양적 확장에 대한 조성과정과 갈등이 주요 담론으로 다뤄지고 있다. 둘째, 신규 공원 조성시마다 공원명이 신규 단어로 출현하고 이후 지속적으로 언급되면서 담론형성에 한 축을 담당하고 있다. 셋째, 민선시대 공원 관련 언론에서 '주민'은 주요 주체로 '도시', '환경'과 함께 언급되며, 공원의 공공성에 대한 담론을 형성하고 있다. 본 연구는 공원이 언론을 통해 어떻게 해석되는지 담론변화를 살펴보았다는 점에서 의의를 가진다. 추후 본 연구에서 다룬 중앙지 외에 지역지, 전문지 등 다른 매체에 대한 연구를 통해 공원에 대한 다양한 관점의 담론이 다뤄지길 기대한다.

코로나 이전과 이후의 4차 산업혁명과 광고의 뉴스기사 분석 : LDA와 Word2vec을 중심으로 (News Article Analysis of the 4th Industrial Revolution and Advertising before and after COVID-19: Focusing on LDA and Word2vec)

  • 차영란
    • 한국콘텐츠학회논문지
    • /
    • 제21권9호
    • /
    • pp.149-163
    • /
    • 2021
  • 4차 산업혁명이란 인공지능(AI), 사물인터넷(IoT), 로봇기술, 드론, 자율주행과 가상현실(VR) 등 정보통신 기술이 주도하는 차세대 산업혁명을 말하는 것으로, 광고 산업 발전에도 큰 영향을 미쳤다. 그러나 지금 전세계는 코로나 확산 방지를 위하여, 비접촉, 비대면 생활환경으로 급속도로 빠르게 변화하고 있다. 이에 따라 4차 산업혁명과 광고의 역할도 변화하고 있다. 따라서 본 연구에서는 코로나 19 이전과 이후의 4차산업 혁명과 광고의 변화를 살펴보기 위해 빅카인즈를 활용해서 텍스트 분석을 하였다. 코로나 19 이전인 2019년과 코로나 19 이후인 2020년을 비교하였다. LDA토픽 모형 분석과 딥러닝 기법인 Word2vec을 통해 주요 토픽과 문서분류를 하였다. 연구결과 코로나19 이전에는 정책, 콘텐츠, AI 등이 나타났으나, 코로나 이후에는 데이터를 활용한 금융, 광고, 배달 등으로 점차 영역이 확장되며, 더불어 인재양성 교육이 중요한 이슈로 나타난 것을 알 수 있었다. 또한, 코로나 19 이전에는 4차 산업혁명 기술과 관련된 광고를 활용하는 것이 주류를 이루었다면, 코로나 19 이후에는 참여, 협력, 일상 필요 등 좀 더 적극적으로 첨단기술 자체에 대한 교육과 인재양성 등에 대한 키워드가 두드러지게 나타나고 있다. 따라서 이러한 연구결과는 코로나 19 이후에 4차 산업혁명에서 광고의 나아갈 방향을 제시하면서, 이에 필요한 이론적, 실무적으로 적용할 수 있는 다각적인 전략을 제시하는 데 의의가 있다.

소셜빅데이터 수집 및 분석을 위한 아동청소년 학교폭력 온톨로지 개발 (Ontology Development of School Bullying for Social Big Data Collection and Analysis)

  • 한윤선;김하영;송주영;송태민
    • 한국콘텐츠학회논문지
    • /
    • 제19권6호
    • /
    • pp.10-23
    • /
    • 2019
  • 소셜빅데이터는 아동청소년의 학교폭력 현상에 대한 풍부하고 다각적 시각을 제공할 수 있지만, 복잡하고 다양한 비정형 텍스트로 구성되어 있어 자료의 체계적인 수집과 활용이 어렵다. 소셜빅데이터의 수많은 정보 가운데 의미 있는 개념을 추출하고 자료를 효과적으로 수집하기 위해서는 연구주제에 상응하는 핵심용어를 명시하고, 해당 개념 간의 관계를 나타내주는 온톨로지의 역할이 중추적이다. 본 연구는 온톨로지의 개념을 정리하고, 7단계에 걸친 온톨로지 개발 과정을 구체적으로 설명한 후, 학교폭력 소셜빅데이터 수집 및 분석을 위한 온톨로지 구축에 적용하였다. 그 결과, 학교폭력의 대상, 원인, 유형, 장소, 지역, 대응방안 6가지 영역을 중심으로 최상위 계층인 대분류를 구성하고, 중분류 및 소분류 체계를 거쳐 총 2,400여 개의 핵심용어를 도출하였다. 본 연구의 의의는 온톨로지 수집 및 개발과정을 설명하고, 기존의 연구방법과는 다소 차별을 두는 소셜빅데이터를 활용한 연구모형을 학교폭력 연구에 제시하였다는 것이다. 소셜빅데이터 분석의 기초가 되는 온톨로지 개발 연구는 좁게는 학교폭력 대상자들에 대한 이해를 제고시킬 뿐 아니라, 거시적으로는 학교폭력이라는 사회현상을 바라보는 한국사회의 시각에 대한 정보를 제공하는 실천적 함의가 있다.

가상 휴먼 강사의 인간 유사도가 교육 콘텐츠 만족감에 미치는 영향: 체험경제이론을 중심으로 (The Effect of Virtual Human Lecturer's Human Likeness on Educational Content Satisfaction: Focused on the Theory of Experiential Economy)

  • 공리;배수진;권오병
    • 한국콘텐츠학회논문지
    • /
    • 제22권7호
    • /
    • pp.524-539
    • /
    • 2022
  • 생성형 인공지능 기술의 발달로 가상 휴먼 제작이 가능하며, 텍스트 정보만으로도 가상 휴먼에 의한 강의 동영상을 제작할 수 있다. 이로써 가상 휴먼이 교육 콘텐츠의 효율적 작성과 수강자들의 재미와 만족감을 유도할 것으로 기대하고 있다. 그러나 아직 가상 휴먼 기술이 수강자들의 만족감에 이르도록 하는 과정을 본격적으로 실증한 연구는 거의 존재하지 않는다. 따라서, 본 연구의 목적은 가상 휴먼의 가장 주된 특징인 인간 유사도가 인간의 체험 및 만족감에 영향을 미치는지를 실증 분석하는 것이다. 특히 언캐니밸리 이론의 인간 유사도를 시각 및 언어 차원의 유사도로 분류하였으며, 체험경제모델을 이론적 근거로 하여 만족감에 도달하는 과정을 부분 최소 제곱 구조방정식 모형(PLS-SEM)으로 분석해 가설 검정하였다. 본 연구의 대상은 중국의 전문 조사 기관의 직장인 패널을 대상으로 온라인으로 수행했다. 분석 결과 가상 휴먼의 시각적 차원의 인간 유사도 및 언어 차원의 인간 유사도는 모두 체험경제 요소(교육, 오락, 심미, 일탈)에 긍정적인 영향을 주었으며, 이들 체험경제 요소는 모두 만족감에 유의한 영향을 주었다. 본 연구의 결과를 근거로 가상 휴먼에 의한 교육 콘텐츠 설계 시의 유의할 점 등 시사점을 제시하였다.

좌표계산을 통해 동영상의 안면 특징점 분석을 중심으로 한 웹 기반 발표 태도 교정 프로그램 개발 (Development of a Web-based Presentation Attitude Correction Program Centered on Analyzing Facial Features of Videos through Coordinate Calculation)

  • 권기현;안수호;박찬정
    • 한국콘텐츠학회논문지
    • /
    • 제22권2호
    • /
    • pp.10-21
    • /
    • 2022
  • 학생들의 취업을 위한 면접 발표와 회사에서의 프로젝트 결과 발표 등과 같은 형식적인 발표 태도가 개선되려면 동료나 교수자의 관찰에 의한 방법 이외에 자동화된 방법은 드물다. 기존 연구에 따르면, 발표자의 안정적인 발화와 시선 처리가 발표에서의 전달력에 영향을 미친다고 한다. 또한, 본인 발표에 대한 적절한 피드백이 발표자의 발표 역량을 늘이는 효과가 있다는 연구도 있다. 본 연구에서는 이와 같은 교정의 긍정적 측면을 고려하여 대학생들의 잘못된 발표 습관과 태도를 동영상의 안면 분석을 통해 지능적으로 교정해 주는 프로그램을 개발하고 성능을 분석하였다. 개발하는 프로그램은 웹 기반으로 군말 사용 여부를 확인하고 안면 인식과 발표 내용 텍스트화를 통해 개발되었다. 이를 위해 군말 분류 인공지능 모델을 개발하였고, 동영상 객체 추출 후, 좌표에 기반으로 얼굴 특징점을 인식하였다. 이후 4,000개 안면 데이터를 이용해 Teachable Machine에서 안면 인식한 경우와 본 연구의 알고리즘 성능을 비교·분석하였다. 프로그램을 이용해 발표 태도를 자기스스로 교정하여 발표자들에게 도움을 준다.

빅데이터 분석을 활용한 메타버스 플랫폼 연구 동향 분석 (A Study on Research Trends in Metaverse Platform Using Big Data Analysis)

  • 홍진욱;한정완
    • 디지털융복합연구
    • /
    • 제20권5호
    • /
    • pp.627-635
    • /
    • 2022
  • 본 최근 코로나19로 인해 비대면 상황이 장기간 지속화됨에 따라 사회 전반에 걸쳐 IOT, AR, VR, 빅데이터와 같은 4차 산업 혁명의 기반 기술이 메타버스 플랫폼에 전반적으로 영향을 미치고 있다. 이러한 사회, 문화 등 외부 환경의 변화는 학문의 발전에 영향을 미칠 수 있으며, 변화에 대비하여 기존 성과물을 체계적으로 정리하는 일은 매우 중요하다. 한국 교육학술정보원(RISS)에서 키워드에 '메타버스 플랫폼'을 포함하는 자료를 수집하여 빅데이터 분석 중 하나인 텍스트 마이닝 기법을 사용하였다. 수집된 데이터 자료를 워드 클라우드 빈도 분석, 키워드 간 연결강도, 구조등위성 분석을 하여 메타버스 플랫폼 연구 동향을 살펴보았다. 연구결과 워드 클라우드 분석에서는 '활용', '디지털', '기술', '교육' 순으로 키워드가 나타났다. 키워드 간 연결강도(N-gram) 분석 결과 '에듀→테크'의 연결강도가 가장 높게 나타났으며, 워드 연쇄 군집 수의 총 3개의 군집이 도출되었다. 세부 연구영역은 '디지털 기술'을 포함 다섯 영역으로 분류되었다. 종합적으로 고려했을 때 메타버스 플랫폼 분야의 학문적 연구 주제 범위는 그리 넓지 않았으며, 장기 지향적 관점에서 보다 적극적인 연구 주제의 발굴 및 논의가 필요해 보인다.

모바일 간편 결제 서비스 활성화 전략 : 토픽 모델링과 PEST - SWOT 분석 방법론을 기반으로 (Proposal of Promotion Strategy of Mobile Easy Payment Service Using Topic Modeling and PEST-SWOT Analysis)

  • 박성우;김세형;강주영
    • 지능정보연구
    • /
    • 제28권4호
    • /
    • pp.365-385
    • /
    • 2022
  • 간편 결제 서비스는 간편 인증 수단을 이용한 결제 및 송금 서비스이다. 코로나 19로 인해 온라인 거래가 증가하면서 간편 결제 서비스 이용이 증가하고 있다. 이와 함께 네이버페이, 카카오페이, 토스와 같은 전자금융업이 간편 결제 시장의 경쟁 구도를 다각화하고 있다. 해외의 핀테크 기업인 PayPal과 Alibaba는 자국 내 독보적인 점유율을 보유하고 있지만, 국내 간편 결제 시장은 독보적인 점유율을 차지하고 있는 업체가 없어 경쟁이 심화되고 있다. 본 연구에서는 간편 결제 시장 참여자를 전자금융업자, 휴대폰 제조업자, 금융회사로 분류하고, 각 업종의 대표적인 서비스들에 대해 SWOT 분석을 진행하였다. 구글 플레이스토어 실 사용자 후기를 토픽모델링 기법을 사용하여 분석하였고, 긍정 토픽을 강점으로 부정 토픽을 약점으로 활용하였다. 또한, 뉴스 기사를 P(정치), E(경제), S(사회), T(기술)로 나누어 토픽모델링을 진행하여 간편 결제 서비스에 대한 기회와 위협을 도출하였다. 본 연구를 통해 간편 결제 시장 참여자가 자사의 서비스 역량을 확인할 수 있도록 하고, 서비스별로 간편 결제 시장에서 우위를 점할 수 있는 서비스 활성화 전략을 제안하고자 한다.

대한민국 정부의 코로나 19 브리핑을 기반으로 구축된 수어 데이터셋 연구 (Sign Language Dataset Built from S. Korean Government Briefing on COVID-19)

  • 심호현;성호렬;이승재;조현중
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제11권8호
    • /
    • pp.325-330
    • /
    • 2022
  • 본 논문은 한국 수어에 대하여 수어 인식, 수어 번역, 수어 영상 시분할과 같은 수어에 관한 딥러닝 연구를 위한 데이터셋의 수집 및 실험을 진행하였다. 수어 연구를 위한 어려움은 2가지로 볼 수 있다. 첫째, 손의 움직임과 손의 방향, 표정 등의 종합적인 정보를 가지는 수어의 특성에 따른 인식의 어려움이 있다. 둘째, 딥러닝 연구를 진행하기 위한 학습데이터의 절대적 부재이다. 현재 알려진 문장 단위의 한국 수어 데이터셋은 KETI 데이터셋이 유일하다. 해외의 수어 딥러닝 연구를 위한 데이터셋은 Isolated 수어와 Continuous 수어 두 가지로 분류되어 수집되며 시간이 지날수록 더 많은 양의 수어 데이터가 수집되고 있다. 하지만 이러한 해외의 수어 데이터셋도 방대한 데이터셋을 필요로 하는 딥러닝 연구를 위해서는 부족한 상황이다. 본 연구에서는 한국 수어 딥러닝 연구를 진행하기 위한 대규모의 한국어-수어 데이터셋을 수집을 시도하였으며 베이스라인 모델을 이용하여 수어 번역 모델의 성능 평가 실험을 진행하였다. 본 논문을 위해 수집된 데이터셋은 총 11,402개의 영상과 텍스트로 구성되었다. 이를 이용하여 학습을 진행할 베이스라인 모델로는 수어 번역 분야에서 SOTA의 성능을 가지고 있는 TSPNet 모델을 이용하였다. 본 논문의 실험에서 수집된 데이터셋에 대한 특성을 정량적으로 보이고, 베이스라인 모델의 실험 결과로는 BLEU-4 score 3.63을 보였다. 또한, 향후 연구에서 보다 정확하게 데이터셋을 수집할 수 있도록, 한국어-수어 데이터셋 수집에 있어서 고려할 점을 평가 결과에 대한 고찰로 제시한다.