• 제목/요약/키워드: 어휘지식

검색결과 143건 처리시간 0.026초

딥러닝-규칙기반 병행 모델을 이용한 특허문서의 자동 IPC 분류 방법 (Hybrid Approach Combining Deep Learning and Rule-Based Model for Automatic IPC Classification of Patent Documents)

  • 김용일;오유리;심우철;고봉수;이봉건
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2019년도 제31회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.347-350
    • /
    • 2019
  • 인공지능 관련 기술의 발달로 다양한 분야에서 인공지능 활용에 대한 관심이 고조되고 있으며 전문영역에서도 기계학습 기법을 활용한 연구들이 활발하게 이루어지고 있다. 특허청에서는 분야별 전문지식을 가진 분류담당자가 출원되는 모든 특허에 국제특허분류코드(이하 IPC) 부여 작업을 수행하고 있다. IPC 분류와 같은 전문적인 업무영역에서 딥러닝을 활용한 자동 IPC 분류 서비스를 제공하기 위해서는 기계학습을 이용하는 분류 모델에 분야별 전문지식을 직관적으로 반영하는 것이 필요하다. 이를 위해 본 연구에서는 딥러닝 기반의 IPC 분류 모델과 전문지식이 반영된 분류별 어휘사전을 활용한 규칙기반 분류 모델을 병행하여 특허문서의 IPC분류를 자동으로 추천하는 방법을 제안한다.

  • PDF

UML 모델의 지식화 방안 (A method for constructing Knowledge of S/W Models in UML)

  • 김일석;양성봉
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1999년도 가을 학술발표논문집 Vol.26 No.2 (1)
    • /
    • pp.528-530
    • /
    • 1999
  • 컴퓨터가 인식할 수 있는 지식의 표현방식에 대한 연구는 오래전부터 인공지능 분야에서 이루어져 왔다. 현재는 대규모의 지식베이스를 구축하고 공유하기 위한 Knowledge Sharing Effort(KSE) 프로젝트가 진행중인데, 여기에서는 도메인별로 어휘와 개념을 체계적으로 정의하여 Ontology로 구축하고 있다. 이 논문에서는 객체지향 소프트웨어 개발 방법론에서 모델링언어로서 널리 받아들여지고 있는 UML을, KSE에서 표준으로 제시하고 있는 컴퓨터가 인식할 수 있는 지식의 형태인 Knowledge Interchange Format 형태로 변환하는 방법을 제시하고 이를 통해 추론과 같은 보다 유연한 지식의 처리가 가능함을 보인다.

  • PDF

워드넷 신셋에 대한 사건구조 프레임 반자동 태깅 (Semi-automatic Event Structure Frame tagging of WordNet Synset)

  • 임서현
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2018년도 제30회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.101-105
    • /
    • 2018
  • 이 논문은 가장 잘 알려진 어휘부중 하나인 워드넷의 활용 범위 확장을 위해 워드넷 신셋에 "사건구조 프레임(Event Structure Frame)"을 주석하는 연구에 관한 것이다. 워드넷을 비롯하여 현재 사용되고 있는 어휘부는 풍부한 어휘의미정보가 구조화되어 있지만, 사건구조에 관한 정보를 포함하고 있지는 않다. 이 연구의 가장 큰 기여는 워드넷에 사건구조 프레임을 추가함으로써 워드넷과의 연결만으로 핵심적인 어휘의미정보를 모두 추출할 수 있도록 해준다는 점이다. 예를 들어 텍스트 추론, 자연어처리, 멀티 모달 태스크 등은 어휘의미정보와 배경지식(상식)을 이용하여 태스크를 수행한다. 워드넷에 대한 사건구조 주석은 자동사건구조 주석 시스템인 GESL을 이용하여 워드넷 신셋에 있는 예문에 먼저 자동 주석을 하고, 오류에 대해 수동 수정을 하는 반자동 방식이다. 사전 정의된 23개의 사건구조 프레임에 따라 예문에 출현하는 타겟 동사를 분류하고, 해당 프레임과 매핑한다. 현재 이 연구는 시작 단계이며, 이 논문에서는 빈도 순위가 가장 높은 100개의 동사와 각 사건구조 프레임별 대표 동사를 포함하여 총 106개의 동사 레마에 대해 실험을 진행하였다. 그 동사들에 대한 전체 워드넷 신셋의 수는 1337개이다. 예문이 없어서 GESL이 적용될 수 없는 신셋을 제외하면 1112개 신셋이다. 이 신셋들에 대해 GESL을 적용한 결과 F-Measure는 73.5%이다. 향후 연구에서는 워드넷-사건구조 링크를 계속 업데이트하면서 딥러닝을 이용해 GESL 성능을 향상 할 수 있는 방법을 모색할 것이다.

  • PDF

어휘 의미 패턴(Lexico-Semantic Pattern)과 온톨로지를 이용한 정보검색기의 설계 및 구현 (The Design and Implementation of an Information Retrieval System Using Lexico-Semantic Pattern and Ontology)

  • 김병우;고영중
    • 한국HCI학회:학술대회논문집
    • /
    • 한국HCI학회 2007년도 학술대회 1부
    • /
    • pp.957-962
    • /
    • 2007
  • 본 논문에서 제안하는 정보 검색기는 일반적인 불리언(Boolean) 질의를 통해서 정보를 검색하는 것이 아니라, 문장으로 입력된 질의형태의 패턴을 분석하여 그에 맞는 정보를 직접 제공하는 것에 목적을 둔다. 이를 위해 어휘 의미 패턴(Lexical Semantic Pattern)과 온톨로지(Ontology) 기술이 정보검색기 개발에 적용되었다. 제안된 시스템에서는 다양한 형태로 표현된 문장 질의를 어휘 의미 패턴을 사용해서 문장의 질의 패턴을 추출하고 사용자 질의를 하나의 온톨로지(Ontology) 추론 질의와 매칭함으로써 질의에 대한 정확한 해답을 추출할 수 있다. 또한, 자연어 문장 입력에 대한 검색 질의 생성기를 구축하고 온톨로지로 표현된 지식을 사용하여 정보검색기 질의를 자동으로 확장함으로써 더욱 정확한 정보 검색 결과를 만들어 낼 수 있다.

  • PDF

글의 응집성을 포착하기 위한 개연규칙 (Abductive Rules for Text Cohesion)

  • 김곤;양재군;김민찬;배재학
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2004년도 추계학술발표논문집(상)
    • /
    • pp.517-520
    • /
    • 2004
  • 본 논문에서는 글의 응집성을 포착하기 위하여 개연규칙을 활용한다. 개연규칙은 문장 구성성분들의 문장간 개연적 연결상황을 나타내고, 글의 인과 성향이나 담화작용을 반영한다. 글을 이해하기 위한 대표적인 속성에는 글에 긴밀성을 부여하는 응집성이 있다. 글의 응집성을 파악하기 위한 대표적인 언어학적 도구나 지식으로는 어휘사슬을 들 수 있다. 이에 본 논문에서는 주어진 예문의 어휘사슬을 개연규칙으로 찾아낸 개연사슬과 비교해 보았다. 그 결과, 중요도가 높은 어휘사슬과 대응하는 개연사슬을 발견할 수 있었다. 개연사슬은 종래의 어휘사슬의 기능을 포함할 뿐만 아니라, 줄거리 단위, 단서구 용법, 문장사이의 개연성 등을 감지하여 문장간의 의미적 연관성을 포착할 수 있다. 이는 개연규칙을 활용하여 글의 화제문을 효과적으로 선별할 수 있음을 보인다.

  • PDF

어휘정보구축을 위한 사전텍스트의 구조분석 및 변환 (A Structural Analysis of Dictionary Text for the Construction of Lexical Data Base)

  • 최병진
    • 한국언어정보학회지:언어와정보
    • /
    • 제6권2호
    • /
    • pp.33-55
    • /
    • 2002
  • This research aims at transforming the definition tort of an English-English-Korean Dictionary (EEKD) which is encoded in EST files for the purpose of publishing into a structured format for Lexical Data Base (LDB). The construction of LDB is very time-consuming and expensive work. In order to save time and efforts in building new lexical information, the present study tries to extract useful linguistic information from an existing printed dictionary. In this paper, the process of extraction and structuring of lexical information from a printed dictionary (EEKD) as a lexical resource is described. The extracted information is represented in XML format, which can be transformed into another representation for different application requirements.

  • PDF

JADE를 이용한 에이전트 통신에 의한 온톨로지 어휘의 생성과 보기 (Creation and View of Ontology Vocabulary by Agent Communication using JADE)

  • 백성진;이명진;이태경
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2009년도 춘계학술발표대회
    • /
    • pp.19-22
    • /
    • 2009
  • 온톨로지는 특정 영역에서 정보 공유를 필요로 하는 개발자를 위한 공통의 어휘를 정의하고, 그 영역에서의 기본 개념의 정의와 개념들 사이의 관계를 포함한다. 따라서 이런 온톨로지를 사용함으로써 소프트웨어 에이전트들 사이의 정보 구조의 이해를 공유할 수 있고 영역 지식의 재사용이 가능하다. 본 연구에서는 $Prot{\acute{e}}g{\acute{e}}$를 사용하여 유사한 에이전트 온톨로지들을 생성하고 이들을 이용하는 JADE 에이전트들을 구현한 다음에, 특정 어휘가 주어지면 다른 온톨로지들을 가진 에이전트들과 통신하여 어떤 온톨로지에 포함된 어휘를 결정하는가를 보이고, 온톨로지 저장소에 관한 연구를 서술하였다.

통계적 기계 번역 기술의 연구 동향

  • 김선호;윤준태;임해창
    • 정보처리학회지
    • /
    • 제11권2호
    • /
    • pp.76-87
    • /
    • 2004
  • 기계번역은 자연어 처리 및 인공지능 분야에서 가장 어려 운 태스크 중의 하나로 인식되어 왔다. 이는 정확한 번역이란 텍스트에 대한 이해 없이는 불가능하기 때문이다. 그러한 이유로 연구자들은 한때 기계번역에 대한 부정적인 결론에 도달하기도 하였다. 지금까지 기계번역을 위해 다양한 방법이 연구되어 왔으며 이들 연구에서는 주로 두 언어에 대한어휘나 구의 대역사전, 숙어사전, 개별 언어의 문법, 혹은 변환규칙 및 변환사전, 문장생성에 관련된 지식, 의미나 실세계 지식, 도메인에 적합한 지식 등 번역의 방식과 목적에 따라 다양한 형태의 지식과 알고리즘이 적용되었으며 그 대부분은 방대한 양의 수작업에 의존적이었다.(중략)

  • PDF

의미정보모델 구축을 위한 색채정보의 수집과 정량적 분석 (Collecting and Analyzing Color Information for Constructing Semantic Information Model)

  • 류기곤;선동언;김현철
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2011년도 한국컴퓨터종합학술대회논문집 Vol.38 No.1(C)
    • /
    • pp.232-235
    • /
    • 2011
  • 지식표현은 일반적으로 논리, 규칙, 프레임 또는 의미망 형태로 표현되며, 최근에는 의미망을 이용한 온톨로지 형태로 표현되고 있다. 이러한 지식표현 방법은 개념을 설명하는 문맥적인 정보나 개념들 간의 구조적인 정보를 이용하여 개념에 대한 지식을 논리적으로 표현하는데 중점을 두었다. 하지만, 지식표현에 사용되는 의미정보는 사람에 의해 수집되고 정제되기 때문에 많은 시간, 비용 및 인력이 필요하다는 한계가 있고, 새로운 의미를 추가하거나 기존의 의미를 수정하는 것이 매우 어렵다는 한계가 있다. 색채는 특정 대상이나 개념에 대한 의미, 연상, 상징 등 객관적인 특징 뿐 아니라 시대, 나라, 문화와 같은 사회적 배경을 반영하기 때문에, 정보를 제공하고 감성을 전달하는 효과적인 수단으로 사용되고 있다. 이에 본 논문은, 색채를 이용한 의미정보모델 구축을 위해, 색채정보를 수집하고 정량적으로 분석하는 방법을 제안한다. 긍정/부정/불안/중립으로 구성된 감성어휘 273개를 이용하여 이미지를 수집한 결과 총 130,944개의 이미지를 수집하였다. 이미지에는 여러 가지 사물, 행동, 배경, 색채 등 다양한 정보가 혼재되어 있어 감성어휘와 연관된 색채를 구별하기 어렵기 때문에 이미지를 직관적으로 설명할 수 있는 사용자 태그를 별도로 수집하였다. 태그는 총 2,836,395개를 수집하였고 각 이미지와 그룹에서의 가중치를 구하였다. 태그의 가중치를 통해 이미지가 그룹 내에서 갖는 중요도를 판별하였고, 각 그룹 별로 상위 30%의 이미지를 추출하여 대표 색채를 분석하였다.

시각 디스플레이에서의 감성 모형 개발 -움직임과 색을 중심으로- (A Study on Developing Sensibility Model for Visual Display)

  • 임은영;조경자;한광희
    • 인지과학
    • /
    • 제15권2호
    • /
    • pp.1-15
    • /
    • 2004
  • 본 연구는 동적 시각 디스플레이에서 움직임 속성과 감성간의 관계를 이해하고자 하였다. 움직임에서의 감성 모형을 구축하기 위해 기존 연구에서 수집된 감성어휘를 움직임과 관련된 감성을 설명하기에 적절한지 평가하도록 하고 직접 움직임 자극을 제시하면서 자유롭게 움직임에서 감성을 보고하도록 하여 70개의 감성 어휘로 정리하였다. 정리된 어휘들 중 핵심적인 어휘들을 선별하기 위해 다양한 움직임에 대한 감성을 평가한 결과로 요인분석을 실시하여 각 요인을 대표하는 19개의 기본 감성 어휘를 추출하였다. 19개 어휘를 통해 움직임의 감성을 평정한 값을 다차원 척도법을 통해 분석하고 어휘들이 분포된 형태를 분석한 결과 움직임에 대한 감성 차원은 ‘적극적이다-소극적이다’ 차원과 ‘밝다-어둡다’ 두 차원으로 대부분 설명될 수 있었다. 구축된 감성 공간을 기초로 움직이는 속도와 진행 경로의 여러 속성들을 다양하게 변화시키면서 두 가지 감성 차원에 따라 움직임에서의 감성을 평가하도록 하였다. 움직임을 결정하는 물리적 속성 중 속도, 곡선 경로의 주기와 진폭이 감성 차원을 결정하는 요인으로 작용하는 경향을 보였다. 단색에서의 감성이 움직임 감성 공간에서 두 차원을 기준으로 설명된 수 있음에도 불구하고, 움직임 요인에 색이 추가될 경우 색이나 움직임 중 한 가지 요인이 특정 감성 차원에 보다 주도적인 효과를 나타내는 경향이 있었다. 색과 움직임 요인이 동시에 제시될 때 색은 ‘밝다 어둡다’ 의 차원에서의 효과를, 움직임은 ‘적극적이다-소극적이다’ 감성차원에서의 반응을 예측할 수 있는 요소로 작용하였다.uency), 다양하게(flexibility), 그리고 독특하게(originality) 제시할 수 있는 능력이 중요한 것이 아니라, 주어진 문제 상황과 관련하여 해결 개연성이 높은 적절한 아이디어를 찾아나갈 수 있는 능력이 중요한 것임을 지적한다. 필자는 발산적 사고가 작동을 하지 않고서도 어떻게 역사적인 창의적 행위가 가능할 수 있는지를 보여주는 예로 Kekule의 벤젠링 발견의 경우 둥을 살펴본다. 창의적 문제 해결에서는 발산적 사고가 중요한 것이 아니라 해결해야할 문제 영역에 대한 통찰력과 아울러 어떤 아이디어가 주어진 문제 해결에 유용한지에 대한 통찰력이 핵심 요체이며, 이러한 통찰력은 바로 논리적ㆍ비판적 사고 훈련을 통해서 길러질 수 있는 능력인 것이다. 이와 같은 비판적 사고 교육의 강조는 정보화 사회 혹은 지식기반 사회 등으로 특징지워지는 현대사회의 특성과도 밀접한 연관을 맺고 있다. 현대 과학기술의 급격한 발전과 정치ㆍ사회ㆍ문화의 패러다임의 급속한 변화는 요구되는 지식기반의 내용과 중요성을 유동적으로 변화시키게 되었다. 따라서 새로운 변화에 신속히 적응하고 새로운 상황에서 발생하는 여러 문제들을 적절히 해결할 수 있는 상황적응적인 인지적 능력의 배양이 필요하게 되었다 우리는 이제 누구나 인터넷 서핑을 통해 방대한 정보와 지식에 접근할 수 있게 되었다. 이에 따라 암기 등을 통한 정보와 지식의 습득과 축적의 그 본래적 가치는 과거에 비해 현저히 낮아졌다. 가치를 만들어 내는 중심은 지식을 가지고 있다는 데에 있지 않고, 습득한 정보와 지식들을 조합하고 재구성하여 합리적인 문제

  • PDF