• 제목/요약/키워드: 핵심단어 분석

검색결과 158건 처리시간 0.024초

Stack-Pointer Network를 이용한 한국어 의존 구문 분석 (Stack-Pointer Network for Korean Dependency Parsing)

  • 차다은;이동엽;임희석
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2018년도 제30회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.685-688
    • /
    • 2018
  • 의존 구문 분석은 자연어 문장에 포함된 단어들 간의 의존 관계를 분석하는 과제로 다양한 자연어 이해 과제에 요구되는 핵심 기술 중 하나이다. 본 연구에서는 단어와 문자 자질을 적용한 기존 Stack-Pointer Network의 인코더의 입력 단어 표상을 확장하여, 한국어를 비롯한 형태적으로 복잡한 언어(morphologically rich language)에 적합하도록 음절-태그 단위, 형태소 단위, 형태소 품사 정보 자질을 보강한 의존 구문 분석 모델을 제안한다. 실험 결과 제안하는 모델은 의존 구조로 변환된 세종 구문 분석 말뭉치에서 UAS 90.58%, LAS 88.35%의 성능을, 2018 국어 정보 처리 시스템 경진 대회 평가 데이터에서 UAS 84.69%, LAS 82.02%의 성능을 보였다. 더불어 제안하는 모델은 포함된 문장의 전체 길이가 긴 의존 관계, 의존소와 지배소의 거리가 먼 의존 관계, 의존소를 구성하는 형태소의 개수가 많은 의존 관계에서 기존 Stack-Pointer Network보다 향상된 성능을 보였다.

  • PDF

교육대학교 학생들의 '전기' 용어의 연상 단어 및 정의에 대한 네트워크 분석 (Network Analysis on Associative Words and Definitions of 'Electricity' Terminology of Education University Students)

  • 송영욱
    • 한국과학교육학회지
    • /
    • 제36권5호
    • /
    • pp.791-800
    • /
    • 2016
  • 이 연구의 목적은 네트워크 분석법을 활용하여 '전기' 용어에 대한 연상 단어 및 정의에 사용한 핵심 단어가 무엇인지 확인하고, 핵심 단어들이 어떻게 활성화되어 인지 구조를 이루는지 알아보는 데 있다. 연구대상은 지방 소재 교육대학교 1학년 대학생 총 83명으로 하였다. 대학생들의 성별과 고등학교 때 물리 과목 이수 여부에 따라 수업 전과 수업 후로 나누어 '전기' 용어에 대한 연상 단어 및 정의를 네트워크 분석하였다. 연구 결과 대학생들이 '전기'하면 가장 많이 떠올리는 단어는 수업 전 '에너지'이고 수업 후에는 '전류', '전자'이다. 그리고 '전기' 정의에 가장 많이 사용한 단어는 수업 전 '에너지', '흐름', '전자'이고 수업 후에는 '전자', '이동', '전하' 이다. '전기' 용어의 연상 단어에는 성별과 고등학교 때 물리 과목 이수 여부에 따라 조금 다른 네트워크 구조를 이루고 있었지만, 수업 후에는 대학생들의 특성에 상관없이 비슷한 네트워크 구조를 보였다. '전기' 용어의 정의에서는 수업 전 성별에 따라서는 비슷한 네트워크 구조를 갖고 있었고, 고등학교 때 물리 과목 이수 여부에 따라서는 조금 다른 네트워크 구조를 보였다. 하지만 수업 후에는 대학생들의 특성에 상관없이 비슷한 네트워크 구조가 나타났다. 끝으로 대학생들의 '전기' 용어에 대한 네트워크 분석 결과에 대한 교육적 시사점을 논의하였다.

대학 핵심역량 관련 연구들의 주요 키워드와 네트워크 분석 (Keyword and Network Analysis of University Core Competency Studies)

  • 권충훈
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2021년도 제63차 동계학술대회논문집 29권1호
    • /
    • pp.133-134
    • /
    • 2021
  • 본 연구는 최근 고등학교기관(대학)의 평가에서 가장 중심 단어가 되고 있는 있는 '핵심역량' 관련 최근 연구들의 주요 키워드들과 그들간의 네트워크를 분석하고자 한다. 본 연구에서는 2011년부터 2020년까지(최근 10년간)의 '대학 핵심역량' 관련 등재지(등재 후보지 포함)에 발표된 총 176건의 관련 연구물들을 언어 네트워크 분석 방법론을 활용하여, 주요 키워드 추출 및 워드클라우드 제시, 주요 핵심어들 간의 관계성(의미망 네트워크) 분석 등을 진행하고자 한다. 이와 같은 연구 결과는 관련 학자들이 연구를 진행할 때, 대학 관계자가 학교단위 교육활동 계획 기획 및 평가활동을 할 때 매우 중요한 기초 자료로 활용될 것으로 기대된다.

  • PDF

웹 기반 영상과 문서의 자동결합기법에 관한 연구 (A Study of Development on technique for document & image unite)

  • 나종원
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2006년도 추계학술발표대회
    • /
    • pp.187-190
    • /
    • 2006
  • 텍스트위주의 자료와 영상회의 자료를 결합하여 통합하고 이를 웹을 통해 서비스 하도록 구현하였다. 멀티미디어 회의정보 등록시 사용자는 DAM실행 파일을 자신의 PC에서 실행하고 프로그램에 내장된 윈도우 탐색기를 통해 등록하고자 하는 회의파일을 선택하면 XML 자동 피싱모듈이 실행되면서 자료 저장을 위한 핵심정보와 검색을 위한 단어색인 및 인덱스를 수행하여 오류시에는 에러메세지를 보여주고 성공시에는 분석된 핵심정보를 제공해준다. 서버로 전송된 멀티미디어 회의자료는 종류/시간/등으로 구분되어 윈도우 탐색기 형태의 트리구조와 사용자가 직접 단어를 입력하여 원하는 회의 정보를 검색하는 2가지 형태의 검색서비스를 제공하게 된다. 사용자는 본인의 서비스 환경에 따라 영상+문서, 문서 등을 자유롭게 선택하여 볼 수 있다. DAM의 경제적인 효과에 대하여 정확한 통계 자료가 국내에 아직 발표되지 않아 유사분야인 WCM시장 분석을 근거로 예상하였으며 시스템이 다양하고 복잡해질수록 투자대비 경제적인 효과가 높아 동기화 기술분야 시장이 확대될 것으로 기대된다.

  • PDF

그래프 중심성 분석에 의한 CQI 보고서 핵심어 추출 시스템의 설계 및 개발 (Design and Implementation of Keywords Extraction System from CQI Reports by the Analysis of Graph Centrality)

  • 테이퍼악떠라;임종범;이종혁;길준민
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2019년도 춘계학술발표대회
    • /
    • pp.256-259
    • /
    • 2019
  • 최근 대학교는 CQI(Continuous Quality Improvement) 등의 방대한 교육 관련 데이터를 수집하고 있고 이를 분석하여 교육 및 경영에 활용하고 있다. 핵심어는 텍스트의 내용을 간결하게 표현할 수 있는 단어이다. 그래서 CQI 보고서의 의미를 파악하기 위해서는 먼저 핵심어 추출이 필요하다. CQI 보고서에서 핵심어를 추출하면 이후 정보 검색, 인덱싱, 분류, 클러스터링, 필터링 등과 같은 많은 응용 작업을 용이하게 수행할 수 있다. 따라서 방대한 양의 CQI 보고서로부터 핵심어 추출을 자동화한다면 이후 요약 및 의미 파악에 많은 도움이 될 것이다. 이 논문에서는 CQI 보고서 요약을 위해 자동적으로 핵심어를 추출하는 방법을 제안한다.

다문화연구의 지식구조에 관한 네트워크 분석 (The Knowledge Structure of Multicultural Research Papers in Korea)

  • 장임숙;장덕현;이수상
    • 한국도서관정보학회지
    • /
    • 제42권4호
    • /
    • pp.353-374
    • /
    • 2011
  • 본 연구는 한국 다문화 지식체계의 구조를 분석하는데 목적을 두고, 2005년부터 2010년까지 발행된 등재(후보) 학술지에 수록된 다문화분야의 논문에서 저자가 부여한 키워드를 중심으로 동시단어 네트워크를 생성하고 k-core분석을 수행한다. 먼저, 2010년까지 주요 학술지에 게재된 논문들을 중심으로 한국의 다문화 연구의 현황을 살펴보고, 다문화분야의 핵심 연구주제를 추출한다. 둘째, 다문화연구가 집중적으로 생산되기 시작한 2005년부터 2010년까지의 연구 논문을 대상으로 연도별 다문화 지식구조의 변화 추이를 분석한다. 셋째, 2005년부터 2010년까지 다문화연구가 활성화된 학문분야를 중심으로 분야별 핵심 주제와 다문화 지식구조의 특성을 비교분석한다.

N3WS : 키워드 및 요약문장 추출을 이용한 인터랙티브 신문기사 탐색 (N3WS : Interactive Newspaper Article Navigation Using Keyword and Summary Extraction)

  • 조희정;손지연;윤별이;조아현;김명;박은정
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2017년도 추계학술발표대회
    • /
    • pp.694-697
    • /
    • 2017
  • 최근 인터넷 기사 중에는 부정확한 제목이나 자극적인 단어를 사용하는 경우가 많아 구독자에게 불편함을 준다. 본 논문에서는 이러한 기사들의 헤드라인을 삭제하고, 기사의 내용을 3문장으로 요약해 주어, 구독자가 원하는 기사를 효율적으로 파악할 수 있게 하는 시스템을 제안한다. 제안하는 본 시스템은 파이썬 언어의 KoNLPy 패키지를 사용하여 기사의 단어들을 형태소 단위로 분석하며, 추출된 키워드를 토대로 워드 클라우드를 생성한다. 사용자가 클라우드의 특정 단어를 선택하면, 해당 신문기사들의 본문을 분석하여 각 신문 기사만의 핵심적인 문장을 3문장으로 출력해 준다.

시맨틱 네트워크 분석을 이용한 원천기술 분야의 잠재적 기술수요 발굴기법에 관한 연구 (Identifying potential buyers in the technology market using a semantic network analysis)

  • 서일원;전채남;이덕희
    • 기술혁신연구
    • /
    • 제21권1호
    • /
    • pp.279-301
    • /
    • 2013
  • R&D 성과활용을 위한 기술마케팅의 중요성은 지속적으로 증가함에도 불구하고 특히, 수요기업 발굴을 위한 분석방법론에 대한 구체적인 연구는 미흡한 실정이다. 이에 본 연구에서는 기술속성과 기업정보와의 관계를 분석함으로써 기술과 관련성이 높은 기업정보를 인터넷에서 발굴하는 방법론을 제시한다. 이를 위해 첫째, 대상기술의 속성을 반영한 기술 키워드를 검색하여 수집한 상위 20개의 핵심단어를 추출하였다. 둘째, 핵심단어들로 구성된 매트릭스를 구성하여 단어들 간의 공출현빈도와 거리를 측정함으로써 기업정보와 기술 속성과의 관련성에 대해 분석하였다. 셋째, 각 키워드별 분석결과를 비교하여 중복횟수가 높은 기업을 잠재 수요기업으로 선정하였다. 발굴기법의 신뢰성 확인을 위해, 국내 원천 기초연구 분야 출연연구원의 특허기술에 적용한 결과 총 100개의 잠재 수요기업 후보를 발굴하였으며 키워드별 결과를 비교하여 총 7개의 기업이 잠재 수요기업으로 도출되었다. 각 기업의 사업분야 확인을 거쳐 해당 기술과의 관련성이 높은 최종 5개의 기업이 최종 잠재 수요기업으로 선정되었다. 본 연구를 통해 시맨틱 네트워크 분석방법을 잠재적 기술수요자 발굴분야에 활용함으로써 네트워크 분석의 활용범위를 확장하였다는 점에서 학술적인 의의를 찾아볼 수 있으며, 기술수요 기업을 발굴하기 위한 실증적인 방법을 제공했다는 점에서 의미를 부여할 수 있다.

  • PDF

딥러닝을 이용한 전이 기반 한국어 형태소 분석 및 품사 태깅 (A Transition based Joint Model for Korean Morpheme Segmentation and POS Tagging Using Deep Learning)

  • 민진우;나승훈;김영길
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2017년도 제29회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.305-308
    • /
    • 2017
  • 한국어 형태소 분석은 많은 자연어 처리 분야에서 핵심적인 역할을 수행하고 있기 때문에 형태소를 분류하고 형태소에 맞는 알맞은 품사를 결정하는 것은 매우 중요하다. 형태소의 품사를 태깅하는 대표적인 방법은 크게 음절 단위 형태소 분석과 단어 단위 형태소 분석의 두 가지로 나눌 수 있다. 본 논문에서는 의존 파싱 분야에서 널리 활용되고 있는 전이 기반 방식을 적용하여 전이 기반 단어 단위 한국어 형태소 분석 모델을 제안하고 해당 모델을 한국어 형태소 분석 데이터인 세종 품사 부착 말뭉치 셋에 적용하여 F1 97.77 %로 기존의 성능을 더욱 향상시켰다.

  • PDF

딥러닝을 이용한 전이 기반 한국어 형태소 분석 및 품사 태깅 (A Transition based Joint Model for Korean Morpheme Segmentation and POS Tagging Using Deep Learning)

  • 민진우;나승훈;김영길
    • 한국어정보학회:학술대회논문집
    • /
    • 한국어정보학회 2017년도 제29회 한글및한국어정보처리학술대회
    • /
    • pp.305-308
    • /
    • 2017
  • 한국어 형태소 분석은 많은 자연어 처리 분야에서 핵심적인 역할을 수행하고 있기 때문에 형태소를 분류하고 형태소에 맞는 알맞은 품사를 결정하는 것은 매우 중요하다. 형태소의 품사를 태깅하는 대표적인 방법은 크게 음절 단위 형태소 분석과 단어 단위 형태소 분석의 두 가지로 나눌 수 있다. 본 논문에서는 의존 파싱 분야에서 널리 활용되고 있는 전이 기반 방식을 적용하여 전이 기반 단어 단위 한국어 형태소 분석 모델을 제안하고 해당 모델을 한국어 형태소 분석 데이터인 세종 품사 부착 말뭉치 셋에 적용하여 F1 97.77 %로 기존의 성능을 더욱 향상시켰다.

  • PDF