• 제목/요약/키워드: 주제어 파악

검색결과 160건 처리시간 0.032초

문서 요약 및 비교분석을 위한 주제어 네트워크 가시화 (Keyword Network Visualization for Text Summarization and Comparative Analysis)

  • 김경림;이다영;조환규
    • 정보과학회 논문지
    • /
    • 제44권2호
    • /
    • pp.139-147
    • /
    • 2017
  • 문자 정보는 인터넷 공간에 통용되는 정보의 대다수를 차지하고 있다. 따라서 대용량의 문서의 의미를 빠르게 특히 자동적으로 파악하는 일은 빅 데이터 시대의 중요한 연구 주제중 하나이다. 이 분야의 대표적인 연구 중 하나는 문서의 의미를 요약해주는 주요 주제어의 자동 추출 및 분석이다. 그러나 단순히 추출된 개별 주제어들의 집합만으로 문서의 의미구조를 나타내기에는 부족함이 있다. 본 논문에서는 추출된 주제어들의 연관관계를 그래프로 표현하여 대상 문서의 의미구조를 보다 다양하게 표시하고 추상화할 수 있는 주제어 가시화 방법을 개발하였다. 먼저 각 주제어들 간의 연관관계를 추출하기 위해 주제어별 지배구간 모델과 단어거리 모델을 제안하였다. 이렇게 추출한 주제어 연결성과 그를 형상화한 그래프는 문서의 의미구조를 보다 함축적으로 담고 있으므로 문서의 빠른 내용파악과 요약이 가능하며 이 가시화 그래프를 비교함으로서 문서의 의미적 유사도 비교도 가능하다. 실험을 통하여 문서의 의미파악과 비교에 본 주제어 가시화 그래프는 일반적인 요약문이나 단순 주제어 리스트보다 더 유용함을 보였다.

동시출현 단어 분석을 통한 지식 구조의 파악 : 인공지능 분야를 대상으로 (Exploration of Intellectual Structure of Artificial Intelligence Field Using Co-word Analysis)

  • 이미경;정영미
    • 한국정보관리학회:학술대회논문집
    • /
    • 한국정보관리학회 2003년도 제10회 학술대회 논문집
    • /
    • pp.245-251
    • /
    • 2003
  • 이 연구에서는 통제된 색인어를 이용하여 파악한 지식 구조와 통제되지 않은 키워드를 이용한 지식 구조를 비교하여 두 구조가 어떤 차이점을 보이는지를 살펴보았다. 또한 색인효과가 어떻게 나타나는지, 비통제어를 사용한 경우가 실제적으로 더 상세한 하위 영역을 표현하는지를 확인하고자 하였다. 실험 결과 통제된 색인어인 주제명표목을 사용한 영역지도와 비통제 색인어인 키워드를 사용한 영역지도 둘 다 인공지능 분야의 주요 분야들을 비슷하게 나타냈지만, 주제명표목을 사용한 경우에 색인효과가 일부 나타났다. 그리고 대체적으로 주제명표목에 기반한 영역지도보다는 키워드에 기반한 영역지도가 더 상세하게 나타났다.

  • PDF

모바일 기기와 가상 스토리지 기술을 적용한 자동적 및 편재적 음성형 지식 획득 (Mobile Device and Virtual Storage-Based Approach to Automatically and Pervasively Acquire Knowledge in Dialogues)

  • 유기동
    • 지능정보연구
    • /
    • 제18권2호
    • /
    • pp.1-17
    • /
    • 2012
  • 최근에 들어 많은 관심과 인기 속에 사용되고 있는 스마트폰은 클라우드 컴퓨팅의 편재적 기능성을 접목하여 즉각적인 지식의 획득에 효과적으로 활용될 수 있다. 또한 지식의 주제어 또는 명칭을 자동으로 파악하여 해당 지식을 저장할 수 있다면 전반적인 지식 획득 과정이 자동화될 수 있다. 본 논문은 텍스트마이닝 기반 주제어 추출 기술과 클라우드 스토리지 기반 스마트폰을 접목하여 지식이 발생되는 지점 및 시점에 즉각적으로 해당 지식을 획득할 수 있는 학제적 방안을 제시한다. 이를 위해 스마트폰은 지식이 포함된, 지식소유자의 대화를 녹음하는 역할을 함과 동시에 지식소유자의 대화의 내용을 부가적으로 특성화 할 수 있는 상황정보를 채취할 수 있는 센서의 역할을 수행한다. 또한 기계학습 알고리듬 중 텍스트마이닝분야에서 우수한 성능을 나타내는 것으로 알려진 Support Vector Machine 알고리듬을 사용하여 해당 대화의 주제어를 추출한다. 파악된 주제어와 상황정보를 연관시켜 일종의 비즈니스 규칙을 생성할 수 있으며, 최종적으로 규칙, 주제어, 상황정보, 그리고 문서화된 대화를 종합하여 하나의 지식을 자동으로 획득할 수 있다.

이용자 중심의 주제어 기반 분류를 위한 주제명 개발에 관한 연구: 지식조직체계 분석을 바탕으로 (A Study on Construction of Subject Headings for the Word Based Classification)

  • 백지원
    • 정보관리학회지
    • /
    • 제28권1호
    • /
    • pp.171-193
    • /
    • 2011
  • 본 연구는 도서관 장서의 분류를 위하여 기존의 문헌 분류체계 대신 주제어 기반의 분류를 적용하고자 할 때 필수적인 주제명 개발의 필요성을 논하고, 개발 방법론의 하나로 기존의 다양한 지식조직체계의 주제어를 활용하는 방법의 가능성을 모색하는데 목적이 있다. 이를 위하여 분석 대상 저작을 선정하고 이에 대하여 부여된 문헌분류, 주제명표목, 국내외 대형 서점의 분류, 서가명 및 주제어, 이용자 태그 등 다양한 지식조직체계의 주제어를 수집하여 그 특성을 비교 분석하였다. 이러한 분석의 결과, 전통적인 도서관 중심의 지식조직체계와 상업성이 중심이 되는 지식조직체계의 성격과 범주화의 방식이 다름을 확인할 수 있었다. 한편, 이용자 태그는 최상위 빈도수의 태그인 경우 전통적인 지식조직체계 및 상업적 영역의 지식조직체계와 어휘의 측면에서 거의 차이가 없는 결과를 나타냈으나, 이용자 중심의 주제어로서 독특한 특성을 가지고 있음을 파악하였다. 이러한 분석을 바탕으로 분류를 대체하는 주제명 작성을 위해 기존의 지식조직체계를 활용할 때 고려해야 할 각각의 특성 및 상호 관계를 분석하였고, 국내에서의 적용을 위한 실질적인 고려사항을 제안하였다.

주제어 네트워크 분석(network analysis)을 통한 국내 감정노동의 연구동향 탐색 (Exploration of Emotional Labor Research Trends in Korea through Keyword Network Analysis)

  • 이남연;김준환;문형진
    • 융합정보논문지
    • /
    • 제9권3호
    • /
    • pp.68-74
    • /
    • 2019
  • 본 연구는 최근 10년 동안(2009-2018) 국내 학술지에 발표된 감정노동(emotional labor) 관련 892편의 논문을 텍스트 마이닝(text-mining) 및 네트워크 분석(network analysis)을 활용하여 연구동향을 파악하는 것이 목적이다. 이를 위해 이들 논문의 주제어를 수집 및 코딩하여 최종적으로 871개의 노드(node)와 2625개의 링크(link)로 변환시켜 네트워크 텍스트로 분석하였다. 첫째, 네트워크 텍스트 분석 결과로 동시출현빈도에 따른 상위 4개 주요 주제어는 번아웃, 이직의도, 직무스트레스, 직무만족 순으로 나타났으며, 연결중심성에 따른 상위 4개 주제어들의 빈도와 연결중심성 모두 비교적 높은 것으로 확인되었다. 둘째, 연결중심성 상위 4개의 주제어를 바탕으로 자아(ego)연결망 분석을 실시하여 각 네트워크의 연결중심도에 대한 주제어를 제시하였다.

자율주행자동차의 빅데이터 분석을 통한 연구 동향 파악 (Identify research trends through big data analysis method for autonomous driving car)

  • 남궁혜리;강선준;원유형;박성욱
    • 한국기술혁신학회:학술대회논문집
    • /
    • 한국기술혁신학회 2017년도 추계학술대회 논문집
    • /
    • pp.459-468
    • /
    • 2017
  • 본 논문에서는 자율주행자동차와 관련한 주제어를 선정하여 KCI 등재 논문의 서론 자료를 수집하고, 이에 빅데이터 분석 기법을 적용하였다. 이를 토대로 자율주행자동차와 관련된 다양한 이슈 분석을 통해 자율주행자동차의 연구 동향을 파악할 수 있으며, 추가적인 연구가 필요한 분야에 대해 알 수 있다. 제4차 산업혁명의 영향으로 등장한 다양한 기술들의 활용이라고 볼 수 있는 자율주행자동차는 2025년 상용화 될 가능성이 높다. 자율주행자동차의 상용화를 위해 지속적인 연구와 논의가 필요하지만, 과거부터 등재된 자율주행자동차 관련 KCI 논문 빅데이터 분석을 통해 기술들 간의 군집 방식과 주제어의 밀집도, 네트워킹 형성 방식 등에 대해 파악할 수 있다. 이처럼 논문 데이터 분석을 통해 향후 정부출연(연), 혹은 기업체에서 더욱 발전시켜야 할 부분에 대해 인지하고 정부 차원의 과제 지원과 연구를 통해 자율 주행자동차 상용화를 촉진시킬 수 있을 것이라고 예상한다.

  • PDF

텍스트 네트워크분석을 활용한 국방분야 연구논문 지식구조 분석 (Knowledge Structure Analysis on Defense Research Using Text Network Analysis)

  • 이용규;윤성웅;이상훈
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2018년도 제58차 하계학술대회논문집 26권2호
    • /
    • pp.526-529
    • /
    • 2018
  • 본 연구에서는 텍스트 네트워크분석을 활용하여 국방분야 연구의 핵심 주제어와 연구주제를 분석하고 이를 통해 전체 지식구조를 파악하고자 하였다. 이를 위해 2010년부터 2017년까지의 국방대학교 학위과정 논문을 대상으로 국방분야 연구현황을 진단하고 지식구조를 구성하였다. 8년간 누적된 논문 710건의 초록을 분석하여 총 6,883개의 단어를 추출한 후, 단어의 논문 등장 빈도수와 단어간 링크수를 파레토 법칙에 따라 상위 20%의 기준으로 총 270개의 단어로 추출하였고, 컴포넌트 분석을 통해 최종 170개의 핵심 주제어를 도출하였다. 이 핵심 주제어를 통해 중심성 분석과 응집구조를 분석하여, 국방분야에 대한 총 6개의 지식구조 그룹을 도출하였다.

  • PDF

유전종양간호 관련 연구경향: 텍스트 네트워크 분석을 중심으로 (Research Trend of Genetics in Oncology Nursing: Based on Text Network Analysis)

  • 이미진;오순영;최경숙
    • 한국콘텐츠학회논문지
    • /
    • 제18권2호
    • /
    • pp.47-56
    • /
    • 2018
  • 본 연구는 국내 외의 종양유전간호 관련 연구를 분석하여 연구동향을 파악하고자 하였다. 종양유전간호 관련 주제로 학술지에 게재된 논문들의 초록에서 제시한 핵심어들을 중심으로 한 텍스트 네트워크 분석을 실시하였다. 핵심어이자 중심성이 높은 주제어로 Nurse, Cancer, Genetic, Patient, Knowledge, Care, Genetic Test 등이 확인되었으며, 시기별 연구동향을 확인한 결과, 2003년 이후 Information, Care, Knowledge 등의 주제어를 포함한 연구들이 증가하였다. 간호학의 메타 패러다임으로 주제어를 분류한 결과, 건강, 간호, 인간, 환경 순으로 중심성이 높게 나타났다. 건강 영역 중 건강 위험 범주에서 Genetics, Risk, 건강 증진 범주에서 Genetic Test, Prevention 등이 가장 높은 빈도로 나타났다. 본 연구를 통해 종양유전간호 연구의 동향을 파악할 수 있으며, 유전성 암 환자들을 위한 간호 중재에 주축이 되는 간호사의 역할 및 중재프로그램 개발의 방향 설정에 활용될 수 있다는 점에서 의미가 있다.

주성분 분석을 이용한 문서 주제어 추출 (Document Thematic words Extraction using Principal Component Analysis)

  • 이창범;김민수;이기호;이귀상;박혁로
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제29권10호
    • /
    • pp.747-754
    • /
    • 2002
  • 본 논문에서는 문서의 내용을 대표할 수 있는 주제어를 추출하는데 있어 다변량 통계 분석 기법 중의 하나인 주성분 분석을 이용하는 모델을 제안한다. 제안한 모델은 고유값과 고유벡터를 이용하여 문서 자체내의 단어의 흐름을 파악한 후 주제어를 추출하는 방법이다. 제안한 모델을 문서 요약에 적용하여 그 성능을 평가하였다. 신문기사를 대상으로 실험한 결과 제안한 모델이 단어의 출현 빈도를 고려하는 방법, 시소러스를 이용하는 방법 모두에 비해 더 좋은 성능을 보였다. 제안한 모델은 정보검색, 정보추출, 문서요약 등에 이용될 수 있으리라 기대된다.

국제결혼 이주여성 건강관련 선행연구 분석 (An Analysis of Articles for International Marriage Immigrant Women Related to Health)

  • 안옥희;전미순;황윤영;김경애;윤미선
    • 농촌의학ㆍ지역보건
    • /
    • 제35권2호
    • /
    • pp.134-150
    • /
    • 2010
  • 본 연구는 국제결혼이주여성을 대상으로 다양한 학문분야에서 발표된 건강관련 선행연구 분석을 통하여 현재까지 진행된 연구들의 경향을 파악하고자 시도하였다. 국제결혼 이주여성을 대상으로 2004년 6월부터 2009년 6월까지 최근 6년간 발표된 국내 학회지 논문 및 학위논문 60편을 연구대상으로 선정하여 연구대상 논문의 일반적 특성, 저자의 전공분야, 건강영역별 주제어와 변수 및 주요변수의 측정도구를 분석하였으며 그 결과는 다음과 같다. 국제결혼이주여성 대상 논문 중 51편(84.9%)이 2007년 이후 발표되었으며, 발표형태는 석사논문 43편(71.7%)이 가장 높게 나타났다. 연구대상 논문 중 학회지 발표는 13편으로 한국가족복지학(3편, 23.1%)에 가장 많은 논문이 게재되었고, 석사학위논문은 사회복지학전공자가 25편(53.2%)으로 가장 많았다. 건강영역별로는 건강영역 2편(3.3%), 사회적 건강영역 18편(30.0%), 정신적 건강영역 36편(60.0%), 신체적 건강영역 4편(6.7%)이었다. 건강영역별 주제어는 사회적 건강영역에서의 주제어는 '적응'과 '의사소통' 2개이며, 정신적 건강영역의 주제어는 '결혼만족', '생활만족', '사회적지지', '스트레스', '우울', '부부갈등', '갈등' 등 7개였으며, 신체적 건강영역의 주제어는 '의료서비스기관 이용'과 '건강증진행위'로 나타났다. 연구대상 논문의 건강영역별 주제어에 따른 변수를 살펴보면, 건강영역 주제어의 변수는 삶의 질 2개, 사회적 건강영역의 주제어에 따른 변수는 적응 16개, 의사소통 5개이며, 정신적 건강영역 주제어 중 결혼만족 25개, 생활만족 11개, 사회적지지 3개, 스트레스 9개, 우울 25개, 부부갈등 25개였으며, 신체적 건강영역의 주제어에 따른 변수는 의료서비스기관 이용 6개, 건강증진행위 5개로 나타났다. 가장 많은 변수가 사용된 주제어는 변수가 25개인 결혼만족, 우울, 부부갈등으로 나타났다. 연구대상 논문의 건강영역별 주제어에 따른 주요변수의 측정도구 중 2회 이상 사용된 측정도구만을 제시한 결과, 건강 영역에서 주제어 '삶의 질'의 측정도구는 Campbell(1976)과 보건복지부(2005), 사회적 건강영역에서는 주제어 '적응'의 변수 중 문화적응의 측정도구 Sandhu & Asrabadi (1994), 정신적 건강영역에서는 주제어 '우울'의 변수 중 문화적응스트레스 측정도구 Sandhu와 Asrabadi(1994)가 가장 많이 사용되었다. 결론적으로 국제결혼 이주여성을 대상으로 한 논문은 최근 다양한 학문분야에서 다양한 주제들로 연구되고 있으나 대부분이 한국 내 정착과 관련된 근본적인 문제만을 다루고 있다. 그러나 국제결혼 이주여성에게 쉽게 적응하기 어려운 타문화권의 생활은 신체적, 정신적, 사회적 불건강상태를 초래할 수 있다. 즉, 본 연구의 주제어에서 알 수 있듯이 국제결혼 이주여성과 가족들에게 잠재적인 건강문제가 발생할 수 있음을 예측할 수 있다. 따라서 국제결혼 이주여성들의 한국 내 적응과정을 돕고 2차적으로 발생할 수 있는 건강문제를 예방하기 위하여 건강과 관련된 다각적인 연구 및 건강관리 방향을 모색할 필요가 있다고 사료된다.