• 제목/요약/키워드: 텍스트마이닝분석

검색결과 1,003건 처리시간 0.025초

텍스트 마이닝을 이용한 4차 산업 연구 동향 토픽 모델링 (Topic Modeling on Research Trends of Industry 4.0 Using Text Mining)

  • 조경원;우영운
    • 한국정보통신학회논문지
    • /
    • 제23권7호
    • /
    • pp.764-770
    • /
    • 2019
  • 본 연구에서는 "4차 산업"과 관련된 논문들의 세부 연구 주제를 파악하기 위하여 텍스트 마이닝 기법을 이용하여 논문들을 분석하였다. 이를 위하여 2016년부터 2019년까지 한국학술지인용색인(KCI)에서 "4차 산업"이라는 키워드로 논문을 검색하여 총 685편의 논문을 수집하였다. 논문 수집을 위해서는 Python 기반의 웹 스크랩핑 프로그램을 사용하였으며, 자료 분석을 위해서는 R 언어로 구현된 LDA 알고리즘 기반의 토픽 모델링 기법들을 활용하였다. 수집된 논문들에 대한 Perplexity 분석 결과, 9가지 토픽이 최적으로 결정되었고 수집된 논문들의 9가지 대표 토픽들을 Gibbs 샘플링 방법을 사용하여 추출하였다. 분석 결과, 인공지능, 빅데이터, 사물인터넷, 디지털, 네트워크 등이 상위 주요 기술들로 나타났으며, 산업, 정부, 교육 현장, 일자리 등 4차 산업과 관련한 다양한 분야에서 주요 기술들로 인한 변화에 대한 연구들이 이루어져 왔음을 확인할 수 있었다.

텍스트마이닝을 활용한 농업 R&D 키워드 분석 (A Study on the Analysis of Agricultural R&D Keywords Using Textmining Method)

  • 김지훈;김성섭
    • 한국산학기술학회논문지
    • /
    • 제22권2호
    • /
    • pp.721-732
    • /
    • 2021
  • 본 연구는 농업 R&D의 추세를 살펴보고자 텍스트마이닝 기법을 활용하여 농업 R&D에 해당하는 키워드를 분석하였다. 분석자료는 NTIS의 국가연구개발사업 과제정보를 활용하였으며, 2003년부터 2018년까지의 농업 R&D의 주요 키워드를 연도별 및 연구개발단계별로 구분하였다. 텍스트마이닝을 위해 키워드의 TF-IDF를 계산하여 점수별로 순위를 매기었으며, 유사한 키워드별로 그룹화하여 해석하였다. 주요 분석 결과는 다음과 같다. 첫 번째, 신기술의 도입과 외부 환경에 변화에 따른 농업 R&D 트렌드가 변화해가고 있다. 시간이 흐를수록 새로운 키워드가 대두되고 있으며, 기초연구 단계에서는 '기후변화'가, 응용연구 단계에서는 'ICT'와 '스마트팜'이, 개발연구 단계에서는 '수출' 키워드가 주되게 등장하고 있다. 두 번째, 연구개발 단계에서 시차를 가지고 키워드 변화가 나타나고 있다. 기초연구-응용연구-개발연구 순으로 주요 키워드가 변화하고 있으며, 대표적으로 '기후변화'와 '신품종' 키워드가 연구개발단계별로 연계되어 있었다. 세번째, 농업 R&D의 대표적인 키워드는 '벼' 키워드로 나타났다. 그러나 '녹색 및 기후변화 대응'과 '가공 및 유통기술' 같이 국내외 농업 환경 변화에 따라 연구의 방향성과 목적이 변화하고 있었다.

텍스트마이닝을 활용한 교통영향평가 교통개선대책 분석 : 경기도 도시개발사업을 대상으로 (Analysis of Traffic Improvement Measures in Transportation Impact Assessment Using Text Mining : Focusing on City Development Projects in Gyeonggi Province)

  • 양은혜;강희찬;안우영
    • 한국ITS학회 논문지
    • /
    • 제22권2호
    • /
    • pp.182-194
    • /
    • 2023
  • 교통영향평가는 도시·교통 사업 시행 시에 발생할 수 있는 교통문제를 사전에 해결하는 주요한 역할을 하는 제도이지만 사업의 특성을 고려한 작성 지침과 명확한 심의 기준이 없어 심의 결과의 일관성이 떨어지는 문제점이 있다. 본 연구에서는 교통영향평가에서 심의 의결된 교통개선대책을 분석하여 심의 결과의 핵심 키워드를 찾고 교통영향평가에서 주요하게 검토해야 하는 항목을 제시하고자 한다. 이를 위해 경기도에서 심의 의결된 도시개발사업의 교통개선대책을 중심으로 TF-IDF 및 N-gram 분석을 활용한 텍스트마이닝을 하였다. 도시개발사업에 주요하게 고려되는 사항은 도로, 교차로 등 교통 기반시설의 신설이 주요한 키워드였으며 다음으로 진출입구 위치 설정, 보행 동선 연결이 주요한 사항이었다. 향후 교통영향평가 지침과 심의 기준 마련 시 본 연구에서 제시한 주요 항목을 반영함으로써, 교통영향평가의 일관성과 객관성을 높이는 심의 운영에 이용할 수 있을 것으로 기대한다.

웹 스크래핑 및 텍스트마이닝에 기반한 중소규모 건설현장 사고유형 분석 (Analysis of accident types at small and medium-sized construction sites based on web scraping and text mining)

  • 윤영근
    • 문화기술의 융합
    • /
    • 제10권1호
    • /
    • pp.609-615
    • /
    • 2024
  • 건설업의 사고사망자 수는 402명으로 전체 산업의 약 46%이다. 이 중 50억원 미만의 건설현장이 약 69%를 차지하고 있어 중소규모 건설현장의 안전관리 강화가 요구된다. 본 연구에서는 웹 스크래핑을 이용하여 19,511건의 사고조사자료를 수집하였다. 수집된 정형 데이터에 대한 통계분석, 비정형 데이터에 대한 텍스트마이닝 분석을 통해 50억원 미만의 현장의 공사금액별 사고유형과 사고원인 분석을 진행하였다. 그 결과 공사금액별로 사고유형과 원인에 차이가 있음이 확인되었다. 본 연구의 결과가 중소규모 건설현장 맞춤형 안전관리에 활용되기를 기대한다.

텍스트마이닝을 통한 공간 컴퓨팅 인식 분석 및 전략 방향에 관한 연구: 애플 비전 프로 사례를 중심으로 (A Study on Perception Analysis and Strategic Direction of Spatial Computing through Text Mining: Focusing on the Case of Apple Vision Pro)

  • 양희태
    • 경영정보학연구
    • /
    • 제26권2호
    • /
    • pp.205-221
    • /
    • 2024
  • 2023년 6월 공간 컴퓨팅이라는 용어가 애플 비전 프로 공개로 인해 대중들에게 본격적으로 인식되기 시작하였고, 2024년 2월 공식 출시를 기점으로 관심이 폭발적으로 증가하고 있다. 이제 막 시장이 개화된 상황에서 공간 컴퓨팅의 지속가능한 성장을 위해 대중들의 인식을 분석하고 근거 기반으로 산업계와 정부를 위한 적절한 대응 방향을 제시할 필요가 있다. 이에, 본 연구는 다양한 텍스트마이닝 기법을 이용하여 국내 대중들의 공간 컴퓨팅에 대한 인식을 탐색하였고, 분석 결과를 바탕으로 성공적인 시장 안착을 위한 전략 방향을 모색하였다. 결과적으로 공간 컴퓨팅에 대한 선도적 연구 수행과 새로운 연구방법론 제시, 이해관계자들이 활용할 수 있는 전략 및 정부 정책 방향을 제시했다는 점에서 본 연구의 의의가 있다.

텍스트마이닝을 통한 최고경영자 대상 이러닝 콘텐츠 트렌드 분석 (Text Mining-Based Emerging Trend Analysis for e-Learning Contents Targeting for CEO)

  • 김경훈;채명신;이병태
    • 경영정보학연구
    • /
    • 제19권2호
    • /
    • pp.1-19
    • /
    • 2017
  • 본 연구는 텍스트마이닝 기법 중 토픽 분석을 활용하여 관련 업계 국내 1위 S사(社)의 최고경영자 대상 온라인 교육 콘텐츠 강의 중심으로 원문 스크립트를 분석했다. 지난 5년간(2011~2015)년 서비스된 총 4,824개 콘텐츠를 바탕으로 핵심 키워드를 추출한 다음 주제별 22가지 토픽으로 분류한 후 동향 분석을 수행했다. 이를 통해 최근 콘텐츠 비중이 급증하고 있는 토픽 주제를 확인할 수 있었다. 다음으로 토픽 분석을 통해 분류한 토픽 및 카테고리를 바탕으로 회원 평가 요인을 적용해 카테고리 및 각 토픽별 지적 관심도를 체계화 할 수 있었다. 경영·경제 분야에서는 마케팅전략, 인사/조직, 커뮤니케이션 분야 등이 높은 관심도와 만족도를 나타냈다. 인문 분야에서는 철학, 전쟁사, 역사(서양) 라이프스타일에서는 마음건강 분야가 관심도와 만족도 둘 다 높은 것으로 나타났다. 이와 함께 교육용 콘텐츠가 시대 변화에 민감하게 반응할지라도 회원의 관심과 만족도 제고에는 실패할 수 있다는 사실을 확인할 수 있었다. 최근 콘텐츠 비중은 급증했지만 평균 이하의 만족도를 기록한 IT기술 토픽이 대표적 사례라 할 수 있다. 이를 통해 최고경영자 대상 콘텐츠 제작 시 단순히 기술적 측면의 정보전달에서 끝나는 것이 아닌 기술 적용을 통한 가치혁신에 대한 깊이 있는 시사점을 도출하거나 풍부한 영상 자료를 바탕으로 다양한 볼거리를 제공하는 등 양적인 측면과 함께 질적인 측면을 고려해야 한다는 교훈을 얻을 수 있었다. 본 연구는 포털 사이트 혹은 SNS 자료가 아닌 국내 가장 영향력 있는 이러닝 기업 데이터를 토대로 분석을 진행했기에 보다 심도 있고 실용적인 결과를 도출했다. 또한 이러닝 관련 연구 분야에서 지금까지는 드물었지만 기술의 발달로 점점 연구 조사 방법론으로 기대가 높아진 텍스트마이닝 방법에 대하여 그 적용 가능성을 성공적으로 탐색해 보았다. 기존에는 콘텐츠 운영 현황 분석 시 콘텐츠 프로그램명에 입각, 표면적인 방식으로 분류할 수밖에 없는 한계가 존재했다면 텍스트마이닝 방법론을 활용하면 비정형 데이터 콘텐츠 스크립트를 바탕으로 분석하여 내용을 바탕으로 한 보다 심도 있는 콘텐츠 분류 및 주제 분류를 이끌어 낼 수 있다. 이를 바탕으로 연도에 따른 주제별 콘텐츠 서비스 현황을 도식화한다면 현재 부족한 분야와 필요한 분야에 대한 보다 심도 있는 고찰이 가능하다. 본 연구는 다양한 텍스트마이닝 기법 중에서 이러닝의 상황에서 효과적으로 연구하기 위한 새로운 방법론을 제시했으며 향후 최고경영자 교육 관련 분야별 지적 관심도에 대한 분석에 도움이 될 것으로 기대된다.

'미술'과 '언어' 활동 융합형의 아동 발달지원 교육 프레임워크 개발을 위한 탐색적 연구: 텍스트 마이닝을 중심으로 (An exploratory study for the development of a education framework for supporting children's development in the convergence of "art activity" and "language activity": Focused on Text mining method)

  • 박윤미;김시정
    • 한국융합학회논문지
    • /
    • 제12권3호
    • /
    • pp.297-304
    • /
    • 2021
  • 이 연구는 학령기 아동의 발달지원을 위하여 기존의 미술 치료 및 교육에서 시행되어 온 시각적 사고 중심의 접근에 더하여, 언어 교육 및 치료적 접근을 융합하고자 한 것이다. 이에 언어와 미술의 서로 다른 영역의 융합 가능 영역을 탐색하기 위하여 텍스트 마이닝 기법을 적용하였다. 이에 따라 이 연구는 기초 연구, 예비 DB구축, 텍스트 선별, DB 전 처리 및 확정, 불용어 처리, 텍스트 마이닝 분석 및 융합 가능 역 도출'의 절차에 따라 연구를 진행하였다. 연구 결과, 미술 치료 및 교육과 언어 치료 및 교육 분야에서 나타나는 문헌상의 각 군집을 연계하여 의사소통 및 학습 기능, 문제해결 및 감각 기관, 예술 및 지능, 정보와 의사소통, 가정 및 장애, 주제와 개념화 및 또래, 통합과 재구성 및 태도 등과 관련된 융합역을 도출할 수 있었다. 결론적으로 본 연구를 통하여 향후 미술과 언어의 활동 중심 융합형 프로그램을 설계할 수 있는 프레임워크를 마련하고 아동발달 지원을 위한 총체적 접근을 시도하였다는 점에서 연구의 의의가 있다.

텍스트 마이닝을 활용한 노인장기요양보험에서의 작업치료: 2007-2018년 (Occupational Therapy in Long-Term Care Insurance For the Elderly Using Text Mining)

  • 조민석;백순형;박엄지;박수희
    • 고령자・치매작업치료학회지
    • /
    • 제12권2호
    • /
    • pp.67-74
    • /
    • 2018
  • 목적 본 연구의 목적은 텍스트 마이닝이라는 빅데이터 분석 기법 중 하나를 활용하여 노인장기요양보험에서 작업치료의 역할을 정량적으로 분석하는 것이다. 연구방법 신문기사 분석을 위해 2007~208년까지 기간 설정 후 "노인장기요양보험+작업치료"를 주제어로 수집하였다. Textom이라는 웹 크롤링(Web Crawling)을 활용해 국내 검색엔진 네이버에서 <네이버뉴스>의 데이터베이스를 활용하였다. 수집결과 노인장기요양보험+작업치료 검색에서 510편의 뉴스 데이터의 기사제목과 원문을 수집한 후 연도별 기사 빈도, 핵심어분석을 시행하였다. 연구결과 연도별 기사 발행 빈도를 살펴보면 2015년과 2017년 발행한 기사 수가 70편(13.7%)으로 가장 많았고, 핵심어 분석 상위 10개의 용어는 '치매'(344)가 가장 많았으며, 작업과 핵심어의 관례를 알아보면, 치매, 치료, 병원, 건강, 서비스, 재활, 시설, 제도, 등급, 어르신, 전문, 급여, 공단, 국민이 관련이 있는 것으로 나타났다. 결론 본 연구에서는 텍스트 마이닝 기법을 통해 11년간의 노인장기요양보험의 언론 보도 동향을 토대로 관련 핵심 키워드에서 치매와 재활에 대해 사회적 요구와 작업치료사의 역할을 보다 객관적으로 확인하였다는 점에서 의의가 있다. 이 결과를 바탕으로 다음 연구에서는 연도에 따른 다양한 분석방법을 통해 연구방법론을 보완하여야 할 것이다.

텍스트마이닝을 활용한 아동, 청소년 대상 소비관련 연구 키워드 분석 (Keyword Analysis of Research on Consumption of Children and Adolescents Using Text Mining)

  • 진현정
    • 한국가정과교육학회지
    • /
    • 제33권4호
    • /
    • pp.1-13
    • /
    • 2021
  • 본 연구는 텍스트마이닝 기법으로 최근 20년간 아동, 청소년 대상 소비 관련 연구의 주요어를 분석하여 소비 관련 연구의 동향을 파악하고자 하였다. 이를 위하여 KCI 등재/등재후보 학술지에 게재된 아동, 청소년의 소비관련 연구 869편의 주요어를 분석하였다. 빈도분석 결과 가장 빈도가 높은 주요어는 청소년, 청소년소비자, 소비자교육, 과시소비, 소비행동, 캐릭터, 경제교육, 윤리적소비 순으로 나타났다. 5년 단위로 주요어의 빈도를 분석한 결과, 2006년~2010년에는 소비자교육의 빈도가 월등하게 높아 이 시기에 소비자교육에 관한 연구가 많이 이루어졌음을 확인할 수 있었다. 2011년 이후 윤리적소비에 관한 연구가 활발해졌으며, 최근 5년 동안은 두드러지는 주요어가 없는 대신 다양한 주제로 연구가 이루어졌음을 알 수 있었다. TF-IDF 기준으로 주요어를 살펴보면 2001년~2005년 사이에는 환경과 인터넷 관련 단어가 주요 키워드였다. 2006년~2010년에는 미디어이용, 광고 교육, 인터넷아이템, 2011년~2015년에는 공정무역, 녹색성장, 녹색소비, 북한이탈청소년, 소셜미디어, 2016~2020년에는 텍스트마이닝, 지속가능발전교육, 메이커교육, 2015개정교육과정이 중요한 용어로 등장하였다. 토픽모델링 결과, 소비자교육, 대중매체/또래문화, 합리적 소비, 한류/문화산업, 소비자역량, 경제교육, 교수학습방법, 친환경/윤리적소비의 8개의 토픽이 도출되었다. 동시 출현 빈도를 활용한 네트워크 분석을 통해 아동, 청소년 관련 소비 연구에서 과시소비와 소비자교육이 중요한 연구주제임을 알 수 있었다.

텍스트 마이닝과 토픽모델링 활용한 사회서비스 품질의 학술연구 동향 분석 (The Analysis of Research Trends in Social Service Quality Using Text Mining and Topic Modeling)

  • 이혜정;윤기혁
    • 사물인터넷융복합논문지
    • /
    • 제8권3호
    • /
    • pp.29-40
    • /
    • 2022
  • 본 연구는 텍스트 마이닝과 토픽모델링을 활용하여 우리나라에 사회서비스가 본격적으로 도입된 2007년부터 2020년 까지의 사회서비스 품질에 대한 학술연구 동향을 분석하였다. 이를 토대로 사회서비스 품질에 관한 논문의 패턴 및 전체 데이터 속에 의미를 파악하여 사회서비스 발전방향에 대한 기초자료를 제공하고자 함에 목적이 있다. 자료수집은 학술연구정보서비스(RISS)에서 사회서비스, 사회복지서비스, 품질 키워드로 97편의 논문을 선정하였고, 2개 구간으로 구분하여 텍스트 마이닝을 활용하여 데이터를 분석하였다. 본 연구의 결과는 첫째, 본 연구에서 활용된 97개의 논문 중 1구간은 38편, 2구간은 59편으로 나타났고, 연 평균 6.9개의 논문이 발표되었다. 둘째, 단어빈도 분석 결과 1구간과 2구간의 공통 키워드는 서비스, 품질, 사회서비스, 만족도, 이용자, 품질관리, 재이용, 정책, 바우처 등의 순으로 나타났다. TF-IDF 분석 결과 1구간과 2구간의 공통 키워드는 사회서비스, 만족도, 이용자, 고객만족, 재이용, 바우처, 품질, 노인요양시설, 품질관리, 지역사회서비스투자사업 등의 순으로 나타났다. 셋째, 토픽 모델링 분석 결과 1구간의 주요 토픽은 서비스 제공유형, 서비스 비용, 재이용, 이용자 중심, 일자리 창출로 나타났고, 2구간은 품질관리체계, 공공성, 제공인력 관리체계, 공급방식체계, 서비스 만족도로 나타났다. 본 연구 결과를 바탕으로 사회서비스 품질 학술연구의 방향성을 제시하였다.