• 제목/요약/키워드: 텍스트 데이터 분석

검색결과 1,111건 처리시간 0.027초

좌표계산을 통해 동영상의 안면 특징점 분석을 중심으로 한 웹 기반 발표 태도 교정 프로그램 개발 (Development of a Web-based Presentation Attitude Correction Program Centered on Analyzing Facial Features of Videos through Coordinate Calculation)

  • 권기현;안수호;박찬정
    • 한국콘텐츠학회논문지
    • /
    • 제22권2호
    • /
    • pp.10-21
    • /
    • 2022
  • 학생들의 취업을 위한 면접 발표와 회사에서의 프로젝트 결과 발표 등과 같은 형식적인 발표 태도가 개선되려면 동료나 교수자의 관찰에 의한 방법 이외에 자동화된 방법은 드물다. 기존 연구에 따르면, 발표자의 안정적인 발화와 시선 처리가 발표에서의 전달력에 영향을 미친다고 한다. 또한, 본인 발표에 대한 적절한 피드백이 발표자의 발표 역량을 늘이는 효과가 있다는 연구도 있다. 본 연구에서는 이와 같은 교정의 긍정적 측면을 고려하여 대학생들의 잘못된 발표 습관과 태도를 동영상의 안면 분석을 통해 지능적으로 교정해 주는 프로그램을 개발하고 성능을 분석하였다. 개발하는 프로그램은 웹 기반으로 군말 사용 여부를 확인하고 안면 인식과 발표 내용 텍스트화를 통해 개발되었다. 이를 위해 군말 분류 인공지능 모델을 개발하였고, 동영상 객체 추출 후, 좌표에 기반으로 얼굴 특징점을 인식하였다. 이후 4,000개 안면 데이터를 이용해 Teachable Machine에서 안면 인식한 경우와 본 연구의 알고리즘 성능을 비교·분석하였다. 프로그램을 이용해 발표 태도를 자기스스로 교정하여 발표자들에게 도움을 준다.

빅데이터 분석을 활용한 웰에이징 요인에 관한 연구 : 신문기사를 중심으로 (A Study on the Factors of Well-aging through Big Data Analysis : Focusing on Newspaper Articles)

  • 이종형;강경희;김용하;임효남;구진희;김광환
    • 한국산학기술학회논문지
    • /
    • 제22권5호
    • /
    • pp.354-360
    • /
    • 2021
  • 사람들은 개인의 삶의 만족을 위하여 일과 삶의 균형을 맞추며 건강하고 행복하게 살아가는 것을 희망하고 있다. 따라서 걱정 없이 행복하고 건강하게 나이가 들어가는 것을 의미하는 웰에이징(well-aging)에 대한 관심이 높아지고 있다. 본 연구는 웰에이징 관련 신문기사를 분석하여 웰에이징과 연관된 요인들을 파악하고자 하였다. 파이썬(Python) 기반의 웹 크롤링(web crawling)을 활용하여 2020년 11월까지 포탈 사이트 다음(daum)의 뉴스 서비스에 게재된 1,199편의 기사를 수집하였으며, 이중 연구 주제에 일치하는 기사 374편을 연구대상으로 선정하였다. 텍스트마이닝의 빈도분석 결과, '노인', '건강', '피부', '웰에이징', '제품', '사람', '노화', '여성', '국내', '은퇴' 등의 순서로 상위 10개의 키워드가 중요하게 파악되었다. 또한 출현 빈도가 높은 45개의 중요 키워드를 기반으로 사회 네트워크 분석을 수행한 결과 '피부-주름', '피부-노화', '노인-건강'이 강한 연결 관계를 나타났다. CONCOR 분석을 수행한 결과 45개의 중요 키워드들은 '삶과 행복', '질병과 죽음', '영양과 운동', '힐링', '헬스산업', '노화와 안티에이징', '건강', '노인서비스'의 8개 군집으로 구성되어, 신문기사들을 기반으로 나타나는 웰에이징과 관련된 요인들을 유추할 수 있었다.

토픽 모델링을 활용한 코로나19 초기 생활체육 이슈 분석 (Trend Analysis of Sports for All-Related Issues in Early Stage of COVID-19 Using Topic Modeling)

  • 정연길;서수민;강현민
    • 지능정보연구
    • /
    • 제28권3호
    • /
    • pp.57-79
    • /
    • 2022
  • 지난 2019년 12월 시작된 코로나19는 정치, 경제, 사회, 문화 등 우리 삶의 전반에 많은 영향을 끼쳐 왔으며, 스포츠, 공연 예술 등의 분야 역시 이로 인해 큰 폭으로 활동이 위축되었다. 스포츠 분야의 경우 참여스포츠를 대표하는 생활체육 분야에서의 변화가 특히 크게 나타났으며, 헬스장, 탁구장, 배드민턴 동호회 등 국민 삶과 밀접한 장소에서의 확진자 발생은 코로나19의 확산에 대한 사회적 공포감을 증폭시키는 원인이 되기도 하였다. 이에 본 연구에서는 코로나19가 최초 확산한 시기의 생활체육 관련 국내 언론 기사를 분석하여, 코로나19 사태로 인해 생활체육 분야에서 어떤 이슈들이 현장에서 등장하고 있으며 어떠한 논의들이 이루어지고 있는지 살펴본다. 구체적으로 본 연구는 국내 대표적인 포털 뉴스 사이트로부터 생활체육과 관련된 코로나19 이슈를 다루고 있는 뉴스 기사를 수집한 후, 이에 대한 토픽 모델링(Topic Modeling) 분석을 통해 코로나19 환경에서의 주요 생활체육 이슈를 파악하였다. 분석을 통해 체육시설 코로나 발생, 체육활동 지원, 생활체육활동 변화 등의 의미있는 이슈를 발견하였으며, 이들 주요 이슈에 대한 워드 클라우드(Wordcloud) 분석을 통해 이슈를 시각적으로 이해하고 시간의 흐름에 따라 이러한 이슈가 변화하는 양상을 확인하였다.

한글 요구사항 기반 결정 테이블로부터 테스트 케이스 생성을 위한 메타모델링 구축화 (Metamodeling Construction for Generating Test Case via Decision Table Based on Korean Requirement Specifications)

  • 장우성;문소영;김영철
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제12권9호
    • /
    • pp.381-386
    • /
    • 2023
  • 기존의 다양한 테스트 케이스 생성에 대한 연구는 모델로부터 테스트 케이스를 추출한다. 하지만 실무의 경우 자연어 요구사항 문장으로부터 테스트 케이스를 생성할 수 있어야 한다. 이를 위해 자연어 문장의 분석하고, 분석 과정 및 결과를 요구공학 영역에 접목하는 연구는 매우 필요하다. 하지만 한국어 문장의 다양성 때문에, 한국어 자연어 요구사항 분석은 어려운 이슈이다. 우리는 한국어 자연어 요구사항으로부터 테스트 케이스 생성 연구 중 하나로써, 자연어 요구사항의 정의 분석, C3Tree 모델의 생성, 원인-결과 그래프의 생성, 결정 테이블의 생성 단계를 통한 테스트 케이스 생성 방법을 연구한다. 본 논문은 중단 단계로써, 메타모델링 변환 기법을 이용하여 C3Tree 모델 기반의 결정 테이블로부터 테스트 케이스 생성 방법을 제안한다. 이 방법은 모델 변환 규칙의 수정을 통해 모델 to 모델, 모델 to 텍스트로의 변환 과정을 제어한다. 모델이 변형되거나, 새로운 모델이 추가되더라도 프로그램 알고리즘의 직접적인 수정 없이 모델 변환 규칙을 유지보수 할 수 있다. 평가 결과, 결정 테이블에 대한 모든 조합이 테스트 케이스로 자동 생성되었다.

ESG 보고서의 텍스트 분석을 이용한 ESG 활동 탐색 -중국 상장 제조 기업을 대상으로- (Exploring ESG Activities Using Text Analysis of ESG Reports -A Case of Chinese Listed Manufacturing Companies-)

  • 진웅철;백승익;손유봉;김향단
    • 서비스연구
    • /
    • 제14권2호
    • /
    • pp.18-36
    • /
    • 2024
  • 본 연구는 글로벌 경제 시장에서 중국의 제조 기업들이 동적역량을 기반으로 어떠한 ESG 활동을 수행하고 있으며 그 활동에는 어떠한 차이가 있는가를 분석하였다. 상하이와 선전 증권 거래소 (Shanghai & Shenzhen Stock Exchange)에서 151개 중국 상장 제조 기업들의 ESG 연례 보고서와 상하이 화정 지표 정보 회사(CSI, China Securities Index Company)의 ESG 지표를 데이터로 사용하였다. 연구 분석에는 TensorFlow-BERT 모델과 코사인 유사도를 사용하여 환경, 사회, 지배구조로 구분된 ESG 키워드를 분류하였고 이를 기반으로 다음 세가지의 연구 질문을 구성하였다. 첫번째는 ESG 점수가 높은 기업(TOP-25)과 낮은 기업(BOT-25)을 구분하여 이 기업들 사이의 ESG 활동에는 어떠한 차이가 있는지를 확인하였으며, 두 번째는 ESG 점수가 높은 기업만을 중심으로 10년간(2010~2019년)의 ESG 활동에는 어떠한 변화가 있는지도 확인하였다. 그 결과 ESG 점수가 높은 기업과 낮은 기업간의 ESG 활동에는 유의한 차이를 보였으며, TOP-25기업의 연도별 활동 변화 추적에서는 ESG 활동의 모든 부분에서 차이를 보이지 않은 것으로 나타났다. 세번째 연구에서는 연도별로 작성된 각 항목별 E, S, G 키워드에 대하여 소셜 네트워크 분석을 진행하였다. 동시발생행렬(Co-occurance matrix) 기법을 통해 기업들의 ESG활동을 4사분면 그래프로 시각화하였으며 이를 바탕으로 ESG활동에 대한 향후 방향을 제시하였다.

부산항 항만안전 주요 이슈 동향에 관한 연구 (A Study on Trends of Key Issues in Port Safety at Busan Port)

  • 이정민;하도연;김주혜
    • 한국항해항만학회지
    • /
    • 제48권1호
    • /
    • pp.34-48
    • /
    • 2024
  • 글로벌 공급망에 예측 불가능한 위험성이 확산되면서 세계의존도가 높은 항만물류산업의 위험부담이 높아지고 있다. 이에 본 연구에서는 기초적인 연구로 국내 항만의 안전성에 위험을 주는 다양한 이슈들을 알아보고자 하였다. 이를 위해 부산항의 항만안전과 관련된 뉴스 기사 데이터를 활용하여 LDA토픽모델링 분석과 시계열 선형회귀분석을 진행하였고 부산항 항만안전 주요 이슈들의 변화와 그 동향을 파악하였다. 본 연구의 분석 결과는 다음과 같다. 지난 30년동안 부산항 항만안전과 관련된 주요 이슈는 총 9개이며 이들을 5년 주기의 시기별로 살펴본 결과, 지난 30년 동안 해상안전 이슈, 수입화물 검역 안전 이슈, 노조파업 관련 이슈, 자연재해 관련 이슈가 지속해서 등장했다. 부산항 항만안전 주요 이슈는 주로 예측 불가능한 성격이 큰 사회환경적 유형과 자연현상적 유형으로 글로벌 불확실성의 영향을 많이 받고 있음을 알 수 있었다. 따라서 분석 결과로 도출된 항만안전 주요 이슈들을 위주로 부산항 항만안전 강화를 위한 정책을 체계적으로 수립할 필요가 있으며 예측 불가능한 위험상황을 대비한 부산항 항만안전 회복탄력성을 강화할 필요가 있다. 끝으로 다양하게 변화하는 사회적 여건에 맞춰 항만안전 강화를 도모할 수 있는 선진적인 연구 활동이 필요할 것이다.

CNN-LSTM 조합모델을 이용한 영화리뷰 감성분석 (Sentiment Analysis of Movie Review Using Integrated CNN-LSTM Mode)

  • 박호연;김경재
    • 지능정보연구
    • /
    • 제25권4호
    • /
    • pp.141-154
    • /
    • 2019
  • 인터넷 기술과 소셜 미디어의 빠른 성장으로 인하여, 구조화되지 않은 문서 표현도 다양한 응용 프로그램에 사용할 수 있게 마이닝 기술이 발전되었다. 그 중 감성분석은 제품이나 서비스에 내재된 사용자의 감성을 탐지할 수 있는 분석방법이기 때문에 지난 몇 년 동안 많은 관심을 받아왔다. 감성분석에서는 주로 텍스트 데이터를 이용하여 사람들의 감성을 사전 정의된 긍정 및 부정의 범주를 할당하여 분석하며, 이때 사전 정의된 레이블을 이용하기 때문에 다양한 방향으로 연구가 진행되고 있다. 초기의 감성분석 연구에서는 쇼핑몰 상품의 리뷰 중심으로 진행되었지만, 최근에는 블로그, 뉴스기사, 날씨 예보, 영화 리뷰, SNS, 주식시장의 동향 등 다양한 분야에 적용되고 있다. 많은 선행연구들이 진행되어 왔으나 대부분 전통적인 단일 기계학습기법에 의존한 감성분류를 시도하였기에 분류 정확도 면에서 한계점이 있었다. 본 연구에서는 전통적인 기계학습기법 대신 대용량 데이터의 처리에 우수한 성능을 보이는 딥러닝 기법과 딥러닝 중 CNN과 LSTM의 조합모델을 이용하여 감성분석의 분류 정확도를 개선하고자 한다. 본 연구에서는 대표적인 영화 리뷰 데이터셋인 IMDB의 리뷰 데이터 셋을 이용하여, 감성분석의 극성분석을 긍정 및 부정으로 범주를 분류하고, 딥러닝과 제안하는 조합모델을 활용하여 극성분석의 예측 정확도를 개선하는 것을 목적으로 한다. 이 과정에서 여러 매개 변수가 존재하기 때문에 그 수치와 정밀도의 관계에 대해 고찰하여 최적의 조합을 찾아 정확도 등 감성분석의 성능 개선을 시도한다. 연구 결과, 딥러닝 기반의 분류 모형이 좋은 분류성과를 보였으며, 특히 본 연구에서 제안하는 CNN-LSTM 조합모델의 성과가 가장 우수한 것으로 나타났다.

국내 ESG 연구동향 탐색: 2012~2021년 진행된 국내 학술연구 중심으로 (Exploring Domestic ESG Research Trends: Focusing on Domestic Research on ESG from 2012 to 2021)

  • 박재현;한향원;김나라
    • 벤처창업연구
    • /
    • 제17권1호
    • /
    • pp.191-211
    • /
    • 2022
  • 글로벌 지속가능성이 큰 기업들의 가치가 높아짐에 따라 ESG가 최대 화두로 주목받고 있다. 이러한 배경에서 전반적인 글로벌 흐름에 맞추어 국내 ESG에 관한 학문 연구도 급속하게 증가하고 있다. 이에 본 연구에서는 국내 ESG 연구 동향을 살펴보기 위해 체계적 문헌 고찰방법론을 활용하여 ESG 연구의 학문적 관심도 변화를 살펴보고 연구의 주요키워드들을 추출하였다. 이를 위해 지난 10년간 연구가 진행된 ESG 학술논문들을 연도별로 수집하고, 핵심주제어와 논문 제목을 활용하여 텍스트마이닝 기법으로 빈도분석을 하였다. 연구결과 첫째, 국내 ESG 학술논문들의 연도별 게재 수를 계랑 서지학 분석의 누적 수로 분석한 결과 해마다 ESG 연구논문들의 게재수가 증가하고 있으며 이를 통해 ESG 이슈에 대한 학문적 관심도의 지속적인 증가를 확인하였다. 둘째, 연구대상 논문들의 핵심주제어와 논문 제목의 빈도분석 결과로 ESG, 기업, 사회, 책임, 경영, 투자, 지속가능의 단어들이 추출되었다. 또한, 해외에서 체계적 문헌고찰로 진행된 연구를 바탕으로 국내외 ESG 주요키워드들이 공통으로 책임, 지속가능, 경영 임을 확인하였다. 그리고 최근 국외 연구에서 제시한 ESG 주요 이슈와 본 연구에서 제시한 ESG 핵심키워드들의 공통요소들을 비교한 결과 과거 연구들과 비교하면 최근 연구의 관심사가 환경임을 확인할 수 있었다. 셋째, 국내 ESG 연구들이 활용한 데이터들은 주로 KEJI 지수, KRX 지수, KCGS ESG 평가지수 등이 있음을 알 수 있었고, 그리고 중소기업을 대상으로 한 연구는 전체 152편 중 총 8편으로 현저하게 부족함을 확인하였다. 본 연구를 통해 ESG 연구 동향과 연구의 증가 폭을 확인할 수 있었으며, 향후 후속 연구자들이 연구주제 및 연구키워드에 대해 구분하고 더욱 다양한 연구주제 선정하는데 기초자료를 제시하였다. 또한, 중소기업 대상 학문 연구는 아직 미흡하거나 부족하여 이에 관한 관심과 연구가 강화될 필요가 있으며, 빠르게 급변하는 시장에서 실무적으로 접목할 수 있는 ESG 실천 지침 등을 고려한 후속 연구가 필요하다.

시간 가중치와 가변형 K-means 기법을 이용한 개인화된 음악 추천 시스템 (A Personalized Music Recommendation System with a Time-weighted Clustering)

  • 김재광;윤태복;김동문;이지형
    • 한국지능시스템학회논문지
    • /
    • 제19권4호
    • /
    • pp.504-510
    • /
    • 2009
  • 근래 들어 개인 적응형 서비스에 대한 관심이 높아지고 있으나 아직 음악에 관련된 서비스는 보편화되어 있지 않다. 그 이유는 음악의 관련 정보를 분석하는 것이 텍스트 기반의 자료에 비해 어렵기 때문이다. 이에 본 논문은 사용자가 선택했던 음악을 분석해서 사용자의 성향을 파악하고 그와 유사한 음악을 추천해주는 시스템을 제안한다. 음악의 속성을 추출하는 방법으로 음파 분석 기법을 사용한다. 음파에서 세 가지의 수치화된 속성을 추출하여 이를 특성 공간에 나타낸다. 이 때 사용자가 선택한 음악이 많이 모여 있는 군집을 분석한다면, 사용자의 취향을 파악할 수 있다. 하지만 몇 개의 군집이 형성될 것인지를 예측하기란 쉽지 않다. 이를 해결하기 위하여 군집의 수를 상황에 따라 유동적으로 변경할 수 있는 가변형 K-means 기법을 제시한다. 이 기법은 군집의 직경 크기를 제한하여, 일정치 이상일 때 군집의 수를 늘리는 방법으로 데이터의 범위를 알고 있을 때 매우 효율적으로 적용할 수 있다. 이 방법을 이용하여 군집의 중심을 찾고 이와 가까운 음악을 추천한다. 또한 사용자의 성향은 꾸준하게 변화하므로 본 논문은 사용자가 근래에 선택한 음악의 반영 비율을 높이고자 무게의 개념을 이용한 시간 가중치 기법을 적용하였다. 그리고 음악의 발매 시기도 고려하여 음악을 추천하는 시스템을 제안한다. 제안 방법의 검증을 위하여 100개의 음악 조각을 통한 실험적 검증을 하였으며 그 결과 제안 방법이 효과적인 것을 보인다.

기술로드맵을 통한 기술기획: 특허인용네트워크의 활용 (Technology Planning through Technology Roadmap: Application of Patent Citation Network)

  • 정유진;윤병운
    • 한국산학기술학회논문지
    • /
    • 제12권11호
    • /
    • pp.5227-5237
    • /
    • 2011
  • 기술로드맵은 기술, 제품, 시장의 관계를 고려하여 기술전략 및 기획을 지원하는 강력한 도구로서 기술 로드맵을 개발하거나 실무에 적용시킨 사례 등과 관련된 연구가 다수 수행되었다. 그러나 대부분의 기술로드맵 연구들은 체계적이고 정량적인 분석보다는 브레인스토밍, 전문가 그룹 활용, 델파이 등과 같은 정성적인 방법에 의존하고 있다. 이러한 한계를 극복하기 위해, 본 연구에서는 대표적인 정량적 분석인 특허분석을 활용하였다. 따라서 본 연구의 목적은 기술수명주기를 고려한 특허인용네트워크를 개발하여 기술로드맵 작성에 적용하고, 이를 통해 유망한 미개발 기술을 기획하는 것이다. 이를 위하여, 우선 특허데이터와 인용정보가 수집되고 이를 바탕으로 특허인용 네트워크가 작성된다. 둘째, 기술수명주기 및 특허출원연도를 고려하여 수명주기에서의 위치를 분석하고, 향후 기술개발기간이 추정된다. 기술진화를 보여주기 위해 하위 세부기술들은 그룹핑되어 상위기술을 설명하고 이는 기술로드맵에 포함되는 노드로서 지칭된다. 마지막으로 기술 층의 각 기술 노드들을 연결 짓고 개발기간을 추정하여 기술로드맵을 작성한다. 이 기술로드맵을 바탕으로 기술기획을 수행하기 위해 텍스트 마이닝을 적용하여 미개발 기술을 제시하고, 향후 개발될 필요가 있는 기술의 특성을 제안한다. 본 연구는 수소저장 기술을 선정하여 앞에서 제시된 방법과 과정을 설명하였다.