• 제목/요약/키워드: 주제어 추출

검색결과 149건 처리시간 0.027초

SNS를 이용한 서비스 혁신 방법에 관한 연구 (A Study on the Service Innovation using SNS)

  • 이종찬;이원영
    • 전기전자학회논문지
    • /
    • 제20권3호
    • /
    • pp.235-240
    • /
    • 2016
  • 본 연구에서는 서비스 혁신을 위한 외부 자원으로 트위터(Twitter)를 활용하고자 하였다. 이를 위해 2016년 5월, S사, X사와 관련 있는 데이터를 각각 4,766건, 15,543건 씩 실시간 추출하고 분석을 실시하였다. 정서 분석(sentiment analysis, SA)을 통하여 두 기업에 대한 감성적 분위기를 파악할 수 있었고, 계량서지학적 분석(bibliometric analysis, BA)을 이용하여 주제어 간의 수직적 관계를 파악할 수 있었다. 추가적으로 사회적 연결망 분석(social network analysis, SNA)을 통하여 주제어 간의 수평적 관계 또한 확인할 수 있었다. 본 연구를 통해 혁신 주제의 탐색 시 사회 연결망 서비스가 외부 자원으로서 충분한 활용 가치가 있음을 확인하였다.

교육감 관련 연구들의 주요 핵심어와 그들 간의 관계성 분석 (An Analysis on Major Keyword & Relationship in the Studies of Superintendent)

  • 권충훈
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2019년도 제60차 하계학술대회논문집 27권2호
    • /
    • pp.177-178
    • /
    • 2019
  • 본 연구는 지방교육자치의 가장 핵심인 '교육감' 관련 연구들의 주요 핵심어들과 그들 간의 관계성을 분석하였다. 본 연구에서는 2009년부터 2018년까지(10년간)의 '교육감' 관련 선행연구 총 93건을 키워드 네트워크 분석 방법론을 활용하여, 주요 핵심어 추출 및 워드 클라우드 제시, 주요 핵심어들 간의 관계성(의미망 네트워크) 분석 등을 진행하였다. 최근 10년간 국내 '교육감' 관련 연구들의 주요 핵심어들은 교육감선거, 주민직선제, 선출제도, 개선방안, 비교연구, 교육자치, 문제점, 지방자치, 교육부장관, 교육위원 등 이었다. 주요 핵심어들(상위 출현빈도)은 높은 밀도와 연결정도를 가지고 상호 네트워크를 형성하고 있었다. 본 연구결과는 향후 진행될 '교육감' 관련 후속연구들의 새로운 연구주제 선정 및 다양한 방향 설정에 기초자료로 활용될 수 있을 것이다.

  • PDF

빅데이터를 통해 본 한국사회의 미래: 언론사 뉴스기사와 사회과학 학술논문의 '미래사회' 관련 키워드 분석 (Forecasting the Future Korean Society: A Big Data Analysis on 'Future Society'-related Keywords in News Articles and Academic Papers)

  • 김문조;이왕원;이혜수;서병조
    • 정보화정책
    • /
    • 제25권4호
    • /
    • pp.37-64
    • /
    • 2018
  • 본 연구는 빅데이터 분석을 통해 한국사회의 미래를 예견해보고자 한 것이다. 이러한 목적을 위해 일차적으로 국내 127개 주요 언론사의 뉴스기사(매체지) 및 사회과학 우수학술지 논문초록(학술지) DB에서 '미래사회' 관련 텍스트를 선정한 후, 해당 기사의 제목 및 논문 키워드로부터 주제어를 추출하였다. 추출한 핵심 주제어의 출현 빈도, 연도별 추세 및 주제어/연관어 연결망구조에 의거해 한국사회의 미래적 관심사를 탐지한 결과, 매체지의 미래 관심사는 '경제', '정치', '과학기술', 학술지의 그것은 '심리', '직무', '문화' 관련 사항들이 주축을 이루고 있음이 확인되었다. 여기에 $J{\ddot{u}}rgen$ Habermas의 '체계와 생활세계(system and life-world)' 개념틀을 적용하면, 매체지와 학술지의 미래 관심은 각기 '체계' 및 '생활세계' 범주에 집중되어 있다는 결론에 이르게 된다. 이 같은 미래 관심사의 분화 양상에 착안해 사회적 도전 과제들을 상이한 여건이나 가치들 간의 불일치의 소산으로 인식하는 '부조화론(mismatch theory)'을 미래연구를 위한 대안적 패러다임으로 제시함으로써, 절대적 혹은 상대적 빈곤 문제에 천착해 온 미래사회의 인식 수준을 한 단계 높이고자 한다.

문서의 주제어별 가중치 부여와 단어 군집을 이용한 한국어 문서 자동 분류 시스템 (An Automatic Classification System of Korean Documents Using Weight for Keywords of Document and Word Cluster)

  • 허준희;최준혁;이정현;김중배;임기욱
    • 정보처리학회논문지B
    • /
    • 제8B권5호
    • /
    • pp.447-454
    • /
    • 2001
  • 새로운 문서를 기존에 존재하는 클래스들에 할당하는 방법을 문서의 자동 분류라고 한다. 문서의 자동 분류는 뉴스 그룹의 기사분류, 웹 문서의 범주화, 전자 메일의 순서화, 사용자의 관심을 학습하여 보다 정확한 정보 검색을 제시하는데 사용될수 있다. 본 논문에서는 한국어 문서분류의 정확도를 높이기 위하여 문서내의 모든 단어들에 대한 확률값을 사용하여, 문서를 분류하는 기존의 방법과 달리 문서의 주제어를 선정하여 주제어로 선정된 단어들에 가중치를 부여하고 그렇지 않은 단어들에 대해서는 제거하너가 낮은 가중치를 부여하는 베이지안 분류자를 사용한다. 문서에는 특징으로 추출된 단어가 적어 문서를 분류하기 위한 만족할 만한 정보를 제공하지 못할 경우에 부족한 문서의 특징을 보충하기 위하여 말뭉치로부터 자동 단어 군집화를 통해 형성된 연관 단어 군집을 사용한다. 이러한 방법을 한국어 문서에 적용한 결과 기존의 베이지안 확률을 사용한 분류법보다 향상된 분류 정확도를 얻을 수 있었다.

  • PDF

한국 근대 여성 구술 기록물을 통한 시소러스 개발에 관한 연구 (A Study on Thesaurus Development Based on Women's Oral History Records in Modern Korea)

  • 최윤경;정연경
    • 한국기록관리학회지
    • /
    • 제14권1호
    • /
    • pp.7-24
    • /
    • 2014
  • 본 연구의 목적은 한국 근대 여성 구술기록물의 효율적인 주제 접근을 위한 시소러스를 개발하는 것이다. 이를 위해 문헌 연구와 국내외 시소러스 사례 분석을 수행하였고, 구술기록물에 입력된 색인어를 중심으로 시소러스를 구축하였다. 구축 과정은 총 5단계로 1단계는 한국 근대를 산 53명의 여성 구술자의 구술기록물에 입력된 한글 색인어 총 1,784개 추출하여 용어의 특성을 분석하였다. 2단계에서는 수차례에 걸쳐 해당 분야 전문가 회의를 거쳐 시소러스 대상 용어를 선정하였고, 3단계에서는 용어에 대한 등위 계층 연관 관계를 설정하였다. 4단계에서는 웹기반 시소러스 관리시스템을 개발한 후, 용어 및 관계 정보를 입력하였고, 5단계에서는 입력된 용어의 정보와 관계를 전문가 집단이 재검토하였다. 구축된 시소러스는 일반 주제어를 비롯한 지명, 장소명, 인명, 단체명 등 고유명사가 포함된 39개 대주제 영역의 1,076개의 용어로 구성되었으며 추후 추가적인 구술기록물을 바탕으로 확장될 것이다.

TV뉴스 영상 색인에 관한 연구 (A Study on the Indexing Method of Moving Image for TV News)

  • 장재화
    • 한국정보관리학회:학술대회논문집
    • /
    • 한국정보관리학회 1999년도 제6회 학술대회 논문집
    • /
    • pp.35-38
    • /
    • 1999
  • TV뉴스 영상은 다루고 있는 대상의 범위가 넓어 뉴스의 주제를 나타냄과 동시에 그 이외의 내용도 포함한다. 또한 소재의 재이용이 가능하기 때문에 뉴스의 내용에서뿐만 아니라 영상 자체가 표현하는 내용에서도 검색이 가능해야 한다. 본 연구에서는 TV뉴스의 영상을 색인하기 위해 종래 사용되던 뉴스의 나레이션, 캡션뿐만 다니라 영상 자체를 대상으로 하여 색인어를 추출하는 방안에 대해 논하였다. 연구에서는 $\ulcorner$KBS 뉴스 9$\lrcorner$을 예로 들어 영상내용정보, 나레이션과 캡션정보, 방송정보. 촬영정보로 나누어 색인어를 부여하였다.

  • PDF

서지마크 데이터베이스로부터의 색인어 추출과 색인어의 검색 활용에 관한 연구 - 경북대학교 도서관 학술정보시스템 사례를 중심으로 - (A Study on the Extraction and Utilization of Index from Bibliographic MARC Database)

  • 박미성
    • 한국도서관정보학회지
    • /
    • 제36권2호
    • /
    • pp.327-348
    • /
    • 2005
  • 본 연구의 목적은 서지정보검색시스템의 색인 정의의 중요성을 강조하고 최적 색인의 기초 자료를 마련하기 위함이다. 이를 위해 서지마크 데이터베이스로부터 색인 태그 정의 및 정규화를 통한 색인어추출이론에 대해 고찰하고, 이론에 따라 생성된 색인어의 검색 활용도를 분석하였다. 실험은 서지 2,200,488건에서 생성된 색인어 29,219,853건을 텍스트형 색인과 코드형 색인으로 나누어 이용자 왱 검색 로그에 나타난 색인 항목과 비교하여 어떤 색인 정의가 얼마나 활용되는가를 분석하였다. 결과에 따르면 서명, 저자, 출판사, 주제와 같은 텍스트형 색인어는 높은 검색 활용도를 보인 반면에 코드형 색인어는 검색 활용도가 낮아 검색에 활용되지 않는 불필요한 색인 정의들은 과감하게 제거하여 색인 정의를 최적화해야 함을 제안하였다.

  • PDF

2차 법률정보 전문데이터베이스 구축을 위한 기초 연구 (A Primary Study on Building the Secondary Legal Information Full-Text Databases)

  • 권기원;노정란
    • 한국문헌정보학회지
    • /
    • 제32권3호
    • /
    • pp.281-296
    • /
    • 1998
  • 최근 주제별 데이터베이스의 구축이 활발해지고 있다. 현재까지 이루어진 연구결과를 보면 자연어 색인시스템의 검색효율이 통제어 색인시스템의 검색효율보다 일반적으로 높은 것으로 나타나고 있어 각 주제 부문에서는 데이터베이스의 구축시 이러한 결과를 수용하여 자연어 색인시스템을 채택하는 경향이 높다. 본 연구는 전문데이터베이스로는 그 수요가 매우 높은 2차 법률정보 전문데이터베이스를 대상으로 법률정보의 내재적 특성에 근거한 통제어 색인시스템의 이론적 가능성을 제안하려는 것이다. 본 연구를 통해 색인어의 자동적 추출 가능성이 추론된다면, 그 결과는 2차 법률정보시스템의 설계자들에게 주제배경이 없이도 특정의 원리에 의하여 자동색인을 가능케 하고, 다른 주제분야의 정보시스템 설계자들에게는 해당 주제분야의 고유한 지식베이스를 활용하는데 있어서의 시사점을 제공하게 될 것이다.

  • PDF

키워드 추출과 군집화 기반의 논문 분류 시스템의 설계 및 구현 (Design and Implementation of Paper Classification Systems based on Keyword Extraction and Clustering)

  • 이윤수;테이퍼악떠라;이종혁;길준민
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2018년도 춘계학술발표대회
    • /
    • pp.48-51
    • /
    • 2018
  • 컴퓨터 및 기술의 발전으로 힘입어 수많은 논문이 오프라인뿐 아니라 온라인으로 발행되고 있고, 새로운 분야들도 계속 생기면서 사용자들은 방대한 논문들 중 자신이 필요로 하는 논문을 검색하거나 분류하기에 많은 어려움을 겪고 있다. 이러한 한계를 극복하기 위해 본 논문에서는 유사 내용의 논문을 분류하고 이를 군집화하는 방법을 제안한다. 제안하는 방법은 TF-IDF를 이용하여 각 논문의 초록으로 부터 대표 주제어를 추출하고, K-means 클러스터링 알고리즘을 이용하여 추출한 TF-IDF 값을 근거로 논문들을 유사 내용의 논문으로 군집화한다.

그래프 분할을 이용한 문장 클러스터링 기반 문서요약 (Document Summarization Based on Sentence Clustering Using Graph Division)

  • 이일주;김민구
    • 정보처리학회논문지B
    • /
    • 제13B권2호
    • /
    • pp.149-154
    • /
    • 2006
  • 문서요약은 여러 개의 하위 주제로 구성되어 있는 문서에 대해 문서의 복잡도를 줄이면서 하위 주제를 모두 포함하는 요약문을 생성하는 것이 목적이다. 본 논문은 그래프 분할을 이용하여 하위 주제별로 중요 문장을 추출하는 요약시스템을 제안한다. 문장별 공기정보에 의한 단어의 연관성 분석을 통해 선정된 대표어를 이용하여 문서를 그래프로 표현한다. 그래프는 연결정보에 의해 하위 주제를 의미하는 부분 그래프로 분할되며 부분 그래프는 긴밀한 관계를 갖는 문장들이 클러스터링된 형태이다. 부분 그래프별로 중요 문장을 추출하면 하위 주제별 핵심 내용들로만 요약문을 구성하게 되어 요약 성능이 향상된다.