• 제목/요약/키워드: 의미망분석

검색결과 472건 처리시간 0.025초

자연어를 이용한 사용자 접속에 관한 연구

  • 이동애;장덕성
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1990년도 제2회 한글 및 한국어정보처리 학술대회
    • /
    • pp.149-155
    • /
    • 1990
  • MS-DOS 명령을 대신하는 자연어 인터페이스를 연구하였다. 자연어로 입력되는 한국어 문장을 형태소분석, 구문분석, 의미분석, 개념분석을 통해 대응되는 일련의 MS-DOS 명령을 생성한다. 형태소 분석에서는 Tabular Parsing법을 사용하였고, 구문분석에서는 문법적인 수식-피수식 관계를 확대하여 의미상의 수식-피수식 관계를 설정하고 이에 따라 문장을 몇개의 단위로 나눈다. 의미분석에서는 동사와 이들 단위들간의 관계와 단위를 구성하는 어절들간의 관계를 격관계로 설정하여, 개념망(semantic network)으로 문장의 의미를 표현한다. 이 개념망으로부터 MS-DOS 명령을 생성한다.

  • PDF

명사류 의미망 구축을 위한 사전 뜻풀이의 어휘구조분석 (Lexical Analysis of Dictionary Definitions for Constructing Semantic Networks)

  • 한영균
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1994년도 제6회 한글 및 한국어정보처리 학술대회
    • /
    • pp.326-332
    • /
    • 1994
  • 본 연구에서는 중사전 규모의 현대국어사전에서 약 5,000 개의 표제항목의 뜻풀이 8,000여 항에 사용된 어휘를 분석한 결과를 제시하였다. 분석 결과 명사류의 의미구조에서 최상위계층에 속하는 것들이 사전의 뜻풀이에 자주 사용됨을 확인할 수 있었고, 아울러 뜻풀이에 사용되는 단어들이 어느 정도 통제된 상태임을 알 수 있었다. 그러나 표제항목과 뜻풀이에 사용된 단어들 사이의 관계만을 바탕으로 해서는 의미망을 구축하기 어려웠는데, 그것은 국어사전에서의 뜻풀이가 지니고 있는 구조적 문제에서 기인하는 것이다. 즉 일부 한자어의 경우에는 명사로 정의되지 않으며, 그 결과 표제명사와 뜻풀이에 사용된 명사 사이의 관계를 바탕으로 한 의미망의 구축에 포함되지 않는 것이다. 또한 순환적 뜻풀이의 경우 역시 의미망 구축에 장애요소로 작용함을 밝혔다.

  • PDF

2019년 강원도 화재 보도에 대한 언어망 분석: 미디어의제 분석을 중심으로 (Semantic Network Analysis of 2019 Gangwon-do Wild Fire News Reporting: Focusing on Media Agenda Analysis)

  • 이정훈
    • 한국콘텐츠학회논문지
    • /
    • 제19권11호
    • /
    • pp.153-167
    • /
    • 2019
  • 이번 연구는 지상파 TV, 중앙일간지, 지역지, 등 총 37개의 보도 매체의 2019년 강원도 대형 화재 보도를 분석하여 미디어의제를 파악하고 매체별, 시기별 미디어의제를 비교, 분석하였다. 토픽모델링 알고리즘과 의미망 분석을 활용한 연구는 네트워크 미디어의제의 구성을 분석하고 QAP 상관분석을 활용하여 매체간 의제 설정 효과도 검증하였다. 분석 결과, 2019년 강원도 화재 보도에서는 이재민 지원과 정치권 갈등 속성을 중심으로 다소 선정적인 미디어의제가 형성되었고 시기별, 매체별 미디어의제 간 유사성이 높은 것으로 나타났다. 이번 연구는 네트워크 의제설정 모델을 토대로 의미망 분석 도구를 활용해 대량의 기사를 분석하면서 기존의 빈도분석과는 구별되는 조사방법론을 구현한 연구라는 점에서 또 하나의 의미를 가질 수 있다.

모듈화된 신경망을 이용한 한국어 중의성 해결 시스템 (Word sense disambiguation using modular neural networks)

  • 한태식;송만석
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1995년도 제7회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.39-42
    • /
    • 1995
  • 문장 안에서 한 단어가 가지는 올바른 의미를 얻기 위해 모듈화된 신경망을 이용하였다. 앞부분에 놓인 신경망은 코호넨 신경망으로 사용자의 지도가 개입되지 않은 상태로 자율학습(Unsupervised learning)이 이루어지고, 뒤에 놓인 신경망은 앞에서 결과로 얻은 2차원의 자기 조직화 형상지도(Self-organizing feature map)를 바탕으로 역전파 신경망을 이용한 지도학습(Supervised learning)을 하게 하였다. 입력 자료는 구문분석된 문장의 조사 정보를 활용하여 입력 위치를 정해준 명사의 의미표지와 동사의 의미표지를 사용하였다. 중의성이 있는 단어를 가지는 문장은 중의성의 가지수 만큼 테스트 입력 자료가 되어 신경망을 통과하여 의미를 결정하도록 한다.

  • PDF

어휘망(U-WIN)의 구문관계 자동구축 (Automatic Construction of Syntactic Relation in Lexical Network(U-WIN))

  • 임지희;최호섭;옥철영
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제35권10호
    • /
    • pp.627-635
    • /
    • 2008
  • 본 연구에서는 사용자 어휘지능망(U-WIN)의 어휘 관계 중의 하나인 구문관계를 자동으로 구축하는 방법을 제시하고자 한다. 먼저, 구문관계를 형성할 수 있는 후보명사를 용언의 용례에서 문형 정보를 기준으로 추출함으로써, 용언의 세분화된 의미별로 정확하고 다양한 후보명사를 추출할 수 있다. 그러나 추출된 후보명사는 다양한 의미를 지니고 있으므로, 어휘간의 명확한 구문관계를 설정하기 위해서는 후보명사의 여러 의미 중에서 정확한 의미로 결정해야 한다. 그래서 본 연구에서는 용례 매칭 규칙, 구문 패턴, 의미 유사도, 빈도 정보 등을 이용하여 후보명사의 의미를 분별한다. 또한 구문패턴의 빈도 정보를 이용하여 용례에 나타나지 않지만 구문관계를 형성할 수 있는 명사를 추출하여 구문관계를 확장하고자 하였다. 이러한 연구는 명사 중심의 어휘망이 용언과의 구문관계 구축을 통해 형태소 분석, 구문 분석, 의미분석 등에 광범위하게 활용할 수 있는 어휘망의 기반을 다지는 작업이 될 수 있을 것이다.

순환 신경망 병렬화를 사용한 의존 구문 분석 및 의미역 결정 통합 모델 (Joint Model for Dependency Parser and Semantic Role Labeling using Recurrent Neural Network Parallelism)

  • 박성식;김학수
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2019년도 제31회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.276-279
    • /
    • 2019
  • 의존 구문 분석은 문장을 구성하는 성분들 간의 의존 관계를 분석하고 문장의 구조적 정보를 얻기 위한 기술이다. 의미역 결정은 문장에서 서술어에 해당하는 어절을 찾고 해당 서술어의 논항들을 찾는 자연어 처리의 한 분야이다. 두 기술은 서로 밀접한 상관관계가 존재하며 기존 연구들은 이 상관관계를 이용하기 위해 의존 구문 분석의 결과를 의미역 결정의 자질로써 사용한다. 그러나 이런 방법은 의미역 결정 모델의 오류가 의존 구문 분석에 역전파 되지 않으므로 두 기술의 상관관계를 효과적으로 사용한다고 보기 어렵다. 본 논문은 포인터 네트워크 기반의 의존 구문 분석 모델과 병렬화 순환 신경망 기반의 의미역 결정 모델을 멀티 태스크 방식으로 학습시키는 통합 모델을 제안한다. 제안 모델은 의존 구문 분석 및 의미역 결정 말뭉치인 UProbBank를 실험에 사용하여 의존 구문 분석에서 UAS 0.9327, 의미역 결정에서 PIC F1 0.9952, AIC F1 0.7312의 성능 보였다.

  • PDF

영상콘텐츠분야 정권별 빅데이터 분석 - 상위 중심성 값의 변화를 중심으로 (Analysis of Big Data by Regimes of Image Contents Field)

  • 황고은;문신정
    • 디지털콘텐츠학회 논문지
    • /
    • 제18권5호
    • /
    • pp.911-921
    • /
    • 2017
  • 이 연구는 영상콘텐츠 분야가 정권별로 어떤 의미 구조를 형성하고 있는지 분석하기 위해 의미연결망 분석 기법을 적용했다. 연구대상은 영상콘텐츠 석박사학위논문의 초록을 대상으로, 시기는 문화산업 도입기인 1993년부터 2016년까지이다. 분석대상 단어는 정권별 최상위 출현단어인 영상, 미디어, 교육, 콘텐츠 등 4개 언어의 의미연결망을 분석하였다. 분석방법에는 빅데이터 분석기법인 텍스트 마이닝과 의미연결망 분석을 활용했고, 분석프로그램으로는 R을 사용했다. 연구결과는 다음과 같다. 첫째, '교육'에 대한 영향력 감소이다. 초기 영상콘텐츠 분야는 영상과 관련한 '교육', 어떻게 '표현'할 것인지에 대한 연구들이 많이 실시되었으나 점차 감소 추세를 보였다. 둘째, '미디어'의 역할 변화이다. 중기의 영상콘텐츠 분야는 영상을 전달하는 수단인 '미디어'에 대한 연구들이 주로 실시되었으며, 더불어 '디지털' 기술에 대한 연구들이 강세를 보였다. 마지막으로 '콘텐츠' 위상의 변화이다. 노무현 정부를 시작으로 내용물의 질에 관련한 '콘텐츠'에 대한 관심이 증대하였으며, <박근혜정부>에는 '영상'과 '콘텐츠'의 위상이 거의 동등해져 연구들이 실시되었다.

구문패턴과 순환 뜻풀이망을 이용한 동형이의어 분별 (Homonym disambiguation using syntactic pattern and recursive definition network)

  • 이왕우;최호섭;옥철영
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 봄 학술발표논문집 Vol.29 No.1 (B)
    • /
    • pp.457-459
    • /
    • 2002
  • 뜻풀이에서 추출한 의미 정보를 이용만 통계시인 방법의 기존 동형이의어 분별 시스템에는 불필요한 의미 정보들을 많이 가지고 있었다. 그리고 동형이의어간의 의미정보가 서로 교차하는 부분이 많아 확률적인 결정에 오류를 발생시켰다. 본 논문에서는 뜻풀이에서 구문패턴을 분석하여 보다 정제된 의미 정보를 추출하였고, 구문패턴에 속하는 어휘들의 하위어를 사전에서 자동 추출하여 부족한 의미 정보를 보완하였다. 또한, 구문패턴으로 분별할 수 없는 일부 동형이의어들은 순환 뜻풀이 망(RDN)을 이용하여 동형이의어를 분별하였다. 이러한 방법으로 동형이의어 분별을 통해 기존 연구보다 8%의 정확률 향상을 가져왔다.

  • PDF

빅데이터 분석을 통한 아두이노 강의에 대한 사회적 인식 (Social perception of the Arduino lecture as seen in big data)

  • 이은상
    • 정보교육학회논문지
    • /
    • 제25권6호
    • /
    • pp.935-945
    • /
    • 2021
  • 이 연구의 목적은 빅데이터 분석 방법을 이용하여 아두이노 강의에 대한 사회적 인식을 분석하는 데 있다. 이를 위해 네이버 사이트의 블로그, 카페, 뉴스 채널에서 '아두이노+강의'를 검색 키워드로 2012년 1월부터 2021년 5월까지의 데이터를 텍스톰 사이트로 수집하였다. 수집된 데이터는 텍스톰 사이트를 이용하여 정제하였으며, 텍스톰 사이트, Ucinet 6, Netdraw 프로그램을 이용하여 텍스트 마이닝 분석과 의미 연결망 분석을 수행하였다. 빈도 분석, TF-IDF 분석, 연결 중심성 등의 텍스트 마이닝 분석 결과 '교육', '코딩' 등이 상위 키워드임을 확인하였다. 의미 연결망 분석을 위해 CONCOR 분석을 수행한 결과 '아두이노 관련 교육', '피지컬 컴퓨팅 관련 강의', '아두이노 특강', 'GUI 프로그래밍' 등 4개의 군집을 확인할 수 있다. 이 연구를 통해 인터넷상에서 아두이노 강의와 관련하여 일반 대중들의 여러 가지 의미 있는 사회적 인식을 확인할 수 있었다. 이 연구의 결과는 아두이노 강의를 준비하는 교수자나 해당 주제를 연구하는 연구자, 나아가 소프트웨어 교육이나 코딩 교육과 관련 정책을 수립하는 정책 입안자들에게 의미 있는 시사점을 제공하는 자료로 활용될 것이다.

의미정보모델 구축을 위한 색채정보의 수집과 정량적 분석 (Collecting and Analyzing Color Information for Constructing Semantic Information Model)

  • 류기곤;선동언;김현철
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2011년도 한국컴퓨터종합학술대회논문집 Vol.38 No.1(C)
    • /
    • pp.232-235
    • /
    • 2011
  • 지식표현은 일반적으로 논리, 규칙, 프레임 또는 의미망 형태로 표현되며, 최근에는 의미망을 이용한 온톨로지 형태로 표현되고 있다. 이러한 지식표현 방법은 개념을 설명하는 문맥적인 정보나 개념들 간의 구조적인 정보를 이용하여 개념에 대한 지식을 논리적으로 표현하는데 중점을 두었다. 하지만, 지식표현에 사용되는 의미정보는 사람에 의해 수집되고 정제되기 때문에 많은 시간, 비용 및 인력이 필요하다는 한계가 있고, 새로운 의미를 추가하거나 기존의 의미를 수정하는 것이 매우 어렵다는 한계가 있다. 색채는 특정 대상이나 개념에 대한 의미, 연상, 상징 등 객관적인 특징 뿐 아니라 시대, 나라, 문화와 같은 사회적 배경을 반영하기 때문에, 정보를 제공하고 감성을 전달하는 효과적인 수단으로 사용되고 있다. 이에 본 논문은, 색채를 이용한 의미정보모델 구축을 위해, 색채정보를 수집하고 정량적으로 분석하는 방법을 제안한다. 긍정/부정/불안/중립으로 구성된 감성어휘 273개를 이용하여 이미지를 수집한 결과 총 130,944개의 이미지를 수집하였다. 이미지에는 여러 가지 사물, 행동, 배경, 색채 등 다양한 정보가 혼재되어 있어 감성어휘와 연관된 색채를 구별하기 어렵기 때문에 이미지를 직관적으로 설명할 수 있는 사용자 태그를 별도로 수집하였다. 태그는 총 2,836,395개를 수집하였고 각 이미지와 그룹에서의 가중치를 구하였다. 태그의 가중치를 통해 이미지가 그룹 내에서 갖는 중요도를 판별하였고, 각 그룹 별로 상위 30%의 이미지를 추출하여 대표 색채를 분석하였다.