• 제목/요약/키워드: 텍스트 마이닝 분석

검색결과 986건 처리시간 0.027초

텍스트 마이닝 기법을 활용한 컴퓨팅 사고력 연구 동향 분석 (An Analysis of Research Trends in Computational Thinking using Text Mining Technique)

  • 이재호;장준형
    • 정보교육학회논문지
    • /
    • 제23권6호
    • /
    • pp.543-550
    • /
    • 2019
  • 컴퓨팅 사고력에 대한 연구는 2006년 자넷 윙이 이를 정의하고 2014년 영국에서 SW교육을 필수교과로 운영하게 되면서 관련 연구가 본격화 되었다. 본 연구는 최근 중요도가 높아가는 컴퓨팅 사고력을 키워드로 관련 연구논문을 수집하여 텍스트 마이닝 기법으로 분석하였다. 1차는 컴퓨팅 사고력을 키워드로 CONCOR 분석을 하였으며 2차는 국내외 대표 학술지를 선정하여 컴퓨팅 사고력의 구성요소를 텍스트 마이닝 기법으로 분석하였다. 2회에 걸친 분석결과 도출된 시사점은 다음과 같다. 첫째, 추상화, 알고리즘, 데이터처리, 문제분해, 패턴인식은 컴퓨팅 사고력 구성요소에 대한 연구의 핵심을 이루고 있었다. 둘째, 컴퓨팅 사고력과 과학, 수학 교과 중심의 융합 교육에 대한 연구가 활발히 진행되고 있음을 확인하였다. 셋째, 컴퓨팅 사고력에 대한 연구가 2010년 이후 확대되고 있었다. 향후 컴퓨팅 사고력과 구성요소에 대한 분류와 정의를 정립하여 이를 교육현장에 적용하는 연구가 꾸준히 진행되어야 할 필요가 있다.

텍스트 마이닝을 이용한 스마트 도시계획 수립을 위한 전략분야 도출연구: 부산 사례를 바탕으로 (Identification of Strategic Fields for Developing Smart City in Busan Using Text Mining)

  • 채윤식;이상훈
    • 디지털융복합연구
    • /
    • 제16권11호
    • /
    • pp.1-15
    • /
    • 2018
  • 본 연구의 목적은 텍스트 마이닝 기법을 활용하여 부산 및 기타 지자체의 도시계획 보고서에 포함되어 있는 서지정보를 분석하고 새로운 스마트도시계획의 수립을 위한 전략 분야를 도출하는 것이다. 텍스트 마이닝 분석은 구조화되어 있지 않은 문서로부터 키워드를 추출하고 획득한 정보의 특성과 패턴을 발견하는 기법으로 최근 지식관리 측면에서 많이 사용되고 있다. 본 분석을 통해 초기의 부산 도시계획은 개별 산업분야 고도화에 초점이 맞춰져 있을 뿐 각 분야별 정보시스템의 연계에 대한 논의가 적은 것으로 나타났지만 최근 계획에서는 도시통합운영관리와 관련한 물리적 인프라와 ICT시스템과 관련한 내용이 다수 포함되어있는 것으로 나타났다. 특히, 타 지자체에 비해 항만/물류, 문화, 전시 분야가 특유의 서비스영역으로 도출되었지만 도시안전, 데이터공유, 신재생에너지 분야에 대한 계획은 부족한 것으로 나타났다. 본 연구는 향후 새로운 스마트 도시계획 수립을 위한 정책적 시사점을 제공할 것으로 기대한다.

텍스트 마이닝 알고리즘을 이용한 기상청 연구개발분야 과제의 추세 분석 (Analysis of patterns in meteorological research and development using a text-mining algorithm)

  • 박홍주;김하빈;박태영;이영섭
    • 응용통계연구
    • /
    • 제29권5호
    • /
    • pp.935-947
    • /
    • 2016
  • 이 연구에서는 비정형 자료 분석 기법 중 하나인 텍스트 마이닝 기법으로 기상청 연구개발분야 과제의 동향에 대하여 분석하였다. 이를 위하여 용어사전을 구축하고, 전처리를 하여 용어-문서 행렬을 만들었다. 이것을 이용해 연도별 용어 빈도수를 측정하고, 자주 나타나는 단어들에 대해서는 상대도수의 변화에 대해서 관찰하였다. 그리고 회귀 분석을 사용하여 증가추세와 감소추세를 가지는 용어들을 파악하였다. 이러한 분석으로 기상청 최근 연구개발 분야의 트렌드를 파악하였다. 이와 같은 연구는 향후 기상청 연구개발에 관한 기초 자료로 사용될 수 있으며, 연구개발의 방향성과 청사진을 제시하는데 이용될 수 있을 것이다.

텍스트 마이닝을 활용한 국가 R&D과제 동향 분석: ICT 분야와 스마트시티 중심으로 (A Study on the Analysis of ICT R&D using Text Mining Method: Focused on ICT Field and Smart City)

  • 김성순;양명석
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2021년도 추계학술발표대회
    • /
    • pp.462-465
    • /
    • 2021
  • 본 연구는 최근 ICT분야 R&D 동향을 파악하기 위하여 NTIS에서 제공하는 국가연구개발사업 과제정보를 텍스트 마이닝 기법을 통해 분석하였다. 2017년부터 2020까지의 과제 정보에서 키워드를 추출하고 연결 관계 마이닝을 통해 키워드 네트워크를 시각화하였다. 분석 결과는 다음과 같다. 첫째, 정보통신 각 분야에서 핵심 연구주제가 기술의 발전에 따라 변화하고 있음을 관찰하였다. 둘째, 키워드 네트워크 상에서 허브 역할을 하는 키워드를 통해 분야 간 융합의 매개 기술을 파악할 수 있었다. 마지막으로, 연도별 키워드 네트워크를 비교·분석함으로써 새롭게 등장하거나 연결 상태의 변화를 보이는 이머징(Emerging) 키워드를 통해 미래 유망 기술이나 최신 연구 방향성을 감지할 수 있음을 보였다.

텍스트 마이닝을 활용한 경제정책기록서비스 연구: 경제정책방향을 중심으로 (A Study on the Archival Information Services of Economic Policy Using Text Mining Methods: Focusing on Economic Policy Directions)

  • 연지현;김성원
    • 한국기록관리학회지
    • /
    • 제22권2호
    • /
    • pp.117-133
    • /
    • 2022
  • 자의적으로 구성한 기록 콘텐츠만으로는 이용자가 필요한 기간과 맥락에 대한 이해 없이 이용하게 됨으로써 주요한 경제정책기록에 효율적으로 접근하기에 어려움을 겪는다. 이러한 현재의 기록 서비스를 개선하기 위한 방안을 모색하고자 한다. 본 연구에서 1991년부터 2021년까지 30년간의 경제정책방향을 대상으로 경제정책기록에 텍스트 마이닝 기법을 활용하여 정부별 주요하게 다뤄진 경제 키워드와 변화과정을 도출하였다. 대책 배경, 주요 내용, 본문 텍스트를 수집하여 전처리를 진행한 후 텍스트 빈도분석, TF-IDF, 네트워크분석, 시계열 분석을 진행하였다. 분석 결과 '일자리', '경쟁력', '구조조정' 순으로 가장 높은 빈도수를 기록하였다. 정부별로 주요 키워드를 한눈에 볼 수 있었으며 '일자리', '부동산', '기업'의 연도별 상대비율을 시계열 순으로 분석하였다. 본 연구 결과를 바탕으로 향후 경제정책기록서비스의 발전과 저변확대를 위한 시사점을 제언하였다.

텍스트마이닝을 이용한 조선왕조실록 및 측우기기록에 나타난 주요 호우사상의 평가 (Evaluation of Major Heavy Rain Events in the Annals and Rainfall Records of the Joseon Dynasty using Text Mining)

  • 김관준;김순미;이동환;채무석;정상
    • 한국재난정보학회:학술대회논문집
    • /
    • 한국재난정보학회 2023년 정기학술대회 논문집
    • /
    • pp.198-199
    • /
    • 2023
  • 본 연구에서는 조선왕조실록을 중심으로 조선시대의 호우 및 홍수기록의 기술방법에 대해 텍스트마이닝 분석을 실시하였다. 조선왕조실록은 조선시대의 큰 호우사상은 모두 포함하고 있기 때문에 이를 일정한 등급으로 나누어 분류한다면 극치 호우 사상의 발생특성을 이해하는데 도움이 될 수 있다. 전체적으로 '큰비'에서와 같이 강우에 대한 언급만이 있는 경우가 '큰물', '홍수', '폭우'와 같이 홍수유출 및 이에 따른 피해가 설명되어 있는 경우보다 강우의 재현기간이 작게 나타나는 것을 파악할 수 있었다. 또 하나 주목할만한 점은 기록된 호우사상이 강우의 총량보다는 강우의 지속기간에 보다 민감하다는 점이다. 즉, 일시에 많은 비가 온 경우보다는 장기간에 걸쳐 내린 호우사상에 보다 초점이 맞추어져 있다는 점이다. 즉, 홍수유출의 크기 및 이에 따른 피해의 정도가 실제 이들 호우사상이 기록으로 남게 되는 원인으로 파악된다.

  • PDF

빅데이터와 텍스트마이닝을 이용한 부동산시장 동향분석 (Analysis of Real Estate Market Trend Using Text Mining and Big Data)

  • 전해정
    • 디지털융복합연구
    • /
    • 제17권4호
    • /
    • pp.49-55
    • /
    • 2019
  • 본 연구는 빅데이터 분석방법인 텍스트마이닝을 이용한 부동산시장 동향분석에 관한 연구로 자료는 2016년 8월부터 2017년 8월까지의 포털사이트인 네이버에 게시된 인터넷 뉴스를 통해 수집하였다. TF-IDF 분석결과, 주택, 분양, 가구, 시장, 지역 순으로 빈도가 높게 나타났고 대출, 정부, 대책, 규제 등 정책과 관련된 단어들도 많이 추출되었으며 지역관련 단어는 서울의 출현빈도가 가장 많은 것으로 나타났다. 지역과 관련된 단어 조합은 '서울-강남', '서울-수도권', '강남-재건축', '서울-재건축'의 출현빈도가 많은 것으로 나타나 강남지역 재건축에 대한 사람들의 관심과 기대가 높은 것을 알 수 있다.

웹 스크래핑과 텍스트마이닝을 이용한 공공 및 민간공사의 사고유형 분석 (A Study on the Analysis of Accident Types in Public and Private Construction Using Web Scraping and Text Mining)

  • 윤영근;오태근
    • 문화기술의 융합
    • /
    • 제8권5호
    • /
    • pp.729-734
    • /
    • 2022
  • 건설업의 사고원인 파악을 위해 사고사례를 이용한 다양한 연구가 진행되고 있지만, 공공 및 민간공사의 차이점에 대한 연구는 미미한 실정이다. 본 연구에서는 발주 유형별 사고원인 분석을 위해 웹 스크래핑과 텍스트 마이닝 기술을 적용하였다. 수집된 10,000건 이상의 정형 및 비정형 데이터에 대한 통계분석과 워드클라우드 분석을 통해 공공 및 민간공사의 사고유형과 사고원인에 대한 차이가 확인되었다. 또한, 주요 사고원인들의 상관관계를 파악함으로써 향후 안전관리 대책 수립에 기여할 수 있다.

텍스트마이닝 기반 아동 감정 분석 시스템 및 아동용 감정 사전 구축 방안 (A Child Emotion Analysis System using Text Mining and Method for Constructing a Children's Emotion Dictionary)

  • 박영준;김선용;김요한
    • 한국전자통신학회논문지
    • /
    • 제19권3호
    • /
    • pp.545-550
    • /
    • 2024
  • 급격하게 변화되는 사회 속에서 현대인들은 다양한 스트레스를 경험하고 있으며, 아동 또한 정신 건강 진료량이 눈에 띄게 증가하고 있다. 소아정신건강장애 등 아동의 정신 건강 문제를 예방하기 위해서는 감정 상태를 빠르게 파악해야 하지만, 유아기 아동들은 몇 가지 단어만을 사용하여 자신의 감정을 표현하는 경우가 많기에 어려움이 있다. 본 논문에서는 아동 심리 상태를 우울, 불안, 외로움, 두려움 등 4가지의 감정으로 세분화하고 아동 심리 전문가의 점수를 기반으로 한 아동용 감정 사전 구축 방안을 제안한다. 또한, STT 및 텍스트 마이닝 기반의 아동 감정 분석 시스템을 제안하고 실제 음성 데이터로 성능을 평가하였다. 평가 결과는 제안한 아동용 감정 분석 시스템이 아동 감정 상태를 정확하게 파악할 수 있음을 보여준다.

사회네트워크분석과 텍스트마이닝을 이용한 배구 경기력 분석 (Performance analysis of volleyball games using the social network and text mining techniques)

  • 강병욱;허만규;최승배
    • Journal of the Korean Data and Information Science Society
    • /
    • 제26권3호
    • /
    • pp.619-630
    • /
    • 2015
  • 본 연구의 목적은 '사회네트워크분석'과 '텍스트마이닝'을 이용하여 국내 남자프로배구 구단의 공격, 패스 패턴을 찾아내고, 배구경기력과 관련된 핵심 키워드 추출하여 경기력을 평가하여 향후 구단의 경기 전력을 수립하는데 기초자료로 활용하는데 있다. 본 연구에서는 '사회네트워크분석'을 통해 도출된 그룹변수들을 '텍스트마이닝' 기법의 결과인 경기의 '승패'에 차이를 검정하기 위해 '0' 그룹 (6명)과 '1' 그룹 (11명)으로 재구성하였다. 연구의 결과로서 '사회네트워크분석'의 연결중심성과 중개중심성의 순위로 판단하면, '0' 그룹 보다 '1' 그룹이 우수한 경기력을 보였다. '사회네트워크분석'에 의해서 재구성된 '0' 그룹과 '1' 그룹에 따라서 '텍스트마이닝'에 의해서 생성된 '승패' 그룹에 대한 유의성 검정 결과 유의한 차이가 있는 것으로 나타났다 (p값: 0.001). '그룹별' 클러스터링 결과, '0' 그룹의 경우 'D' 선수와 'E' 선수가 '세트' 플레이를 통하여 정확하게 득점한다고 할 수 있다. '1' 그룹의 경우 'K' 선수가 '디그'에 의해서 '공격'을 하는 경우 실패하는 경우가 많고, 'C' 선수와 'P' 선수는 '세트' 정확한 플레이를 한 것으로 나타났다.