• 제목/요약/키워드: 중의성 표현

Search Result 187, Processing Time 0.024 seconds

A Global-Interdependence Pairwise Approach to Entity Linking Using RDF Knowledge Graph (개체 링킹을 위한 RDF 지식그래프 기반의 포괄적 상호의존성 짝 연결 접근법)

  • Shim, Yongsun;Yang, Sungkwon;Kim, Hong-Gee
    • KIPS Transactions on Software and Data Engineering
    • /
    • v.8 no.3
    • /
    • pp.129-136
    • /
    • 2019
  • There are a variety of entities in natural language such as people, organizations, places, and products. These entities can have many various meanings. The ambiguity of entity is a very challenging task in the field of natural language processing. Entity Linking(EL) is the task of linking the entity in the text to the appropriate entity in the knowledge base. Pairwise based approach, which is a representative method for solving the EL, is a method of solving the EL by using the association between two entities in a sentence. This method considers only the interdependence between entities appearing in the same sentence, and thus has a limitation of global interdependence. In this paper, we developed an Entity2vec model that uses Word2vec based on knowledge base of RDF type in order to solve the EL. And we applied the algorithms using the generated model and ranked each entity. In this paper, to overcome the limitations of a pairwise approach, we devised a pairwise approach based on comprehensive interdependency and compared it.

Solving Nonlinear Fixed Charge Transportation Problem by Spanning Tree-based Genetic Algorithm (신장트리 기반 유전자 알고리즘에 의한 비선형 fcTP 해법)

  • Jo, Jung-Bok;Ko, Suc-Bum;Gen, Mitsuo
    • Journal of KIISE:Software and Applications
    • /
    • v.32 no.8
    • /
    • pp.752-758
    • /
    • 2005
  • The transportation problem (TP) is known as one of the important problems in Industrial Engineering and Operational Research (IE/OR) and computer science. When the problem is associated with additional fixed cost for establishing the facilities or fulfilling the demand of customers, then it is called fixed charge transportation problem (fcTP). This problem is one of NP-hard problems which is difficult to solve it by traditional methods. This paper aims to show the application of spanning-tree based Genetic Algorithm (GA)approach for solving nonlinear fixed charge transportation problem. Our new idea lies on the GA representation that includes the feasibility criteria and repairing procedure for the chromosome. Several numerical experimental results are presented to show the effectiveness of the proposed method.

Word Sense Classification Using Support Vector Machines (지지벡터기계를 이용한 단어 의미 분류)

  • Park, Jun Hyeok;Lee, Songwook
    • KIPS Transactions on Software and Data Engineering
    • /
    • v.5 no.11
    • /
    • pp.563-568
    • /
    • 2016
  • The word sense disambiguation problem is to find the correct sense of an ambiguous word having multiple senses in a dictionary in a sentence. We regard this problem as a multi-class classification problem and classify the ambiguous word by using Support Vector Machines. Context words of the ambiguous word, which are extracted from Sejong sense tagged corpus, are represented to two kinds of vector space. One vector space is composed of context words vectors having binary weights. The other vector space has vectors where the context words are mapped by word embedding model. After experiments, we acquired accuracy of 87.0% with context word vectors and 86.0% with word embedding model.

A Design of Module-based XML Processor for Structural Embedding (구성적 임베딩을 위한 모듈 기반의 XML처리기의 설계)

  • 강미연;김도완;정원호
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2002.04a
    • /
    • pp.646-648
    • /
    • 2002
  • 유무선 인터넷의 발달로, PDA, 홈패드, Hand-held PC 등 low-end로부터 high-end까지의 다양한 규모의 하드웨어 자원을 가지는 유무선 단말들이 속속 등장하고 있다. 그리하여, 이들로 임베딩되는 소프트웨어들도 과거 그들이 지녔던 경직성(fixedness)에서 탈피하여, 다양한 장치들을 수용할 수 있도록 구성적 특성을 요구 받고 있다. 웹 상의 정보 표현을 위한 표준으로 자리잡은 확장성 표기 언어인 XML을 위만 처리기는 그러한 단말에서의 자료 브라우징을 위해 필수적으로 임베딩 되어야할 소프트웨어 중의 하나이다. 본 논문에서는 다양한 규모의 단말들에 구성적 임베딩이 가능한 모듈 기반의 XML 처리기가 설계, 구현된다.

  • PDF

A Case Based Maintenance Su, pp.rt for Information Systems in COBOL Domain (COBOL 환경 하의 정보 시스템에 대한 사례 기반 유지 보수 지원 방법론)

  • 김우주;이재원;이재규
    • Journal of Intelligence and Information Systems
    • /
    • v.3 no.1
    • /
    • pp.111-142
    • /
    • 1997
  • 정보 시스템 대한 유지 보수 문제는 소프트웨어 유지 보수 분야에서 지속적으로 존재하는 문제 중의 하나이며, 특히 이러한 정보 시스템들이 아주 오래 전에 COBOL이나 계측형 데이터베이스와 같은 기술을 바탕으로 개발되었음에도 불구하고 대부분의 조직에서 중요한 역할을 담당하고 있는 것이 현실이다. 따라서 이들 정보 시스템에 대한 효율적이고, 신속한 유지 보수는 조직에 있어 매우 중요한 업무임에도 불구하고, 대부분의 조직에서 이를 제대로 수행하고 있지 못하다. 체계적이고 효과적인 정보 시스템에 대한 유지 보수업무 수행을 위해 본 연구에서는 과거 유지 보수 사례를 이용하여 사례 지식을 축적할 수 있는 유지보수 사례의표현 방법 및 유사성 평가 방법과 이를 바탕으로 새로운 유지보수 요구에 적합한 과거 사례와 유지보수 대상 코드를 제안해 주는 사례 기반 유지 보수 대상 인식 방법론을 제시하였다. 이들 제안된 방법들의 타당성과 성과는 한국전력의 실제 정보 시스템을 대상으로 검증되었으며, 현장 업무에 적용되고 있다.

  • PDF

A Study of Video Coding Based on a Morphological Representation of Wavelet Data (웨이블릿 데이터의 형태적 표현을 적용한 동영상 코딩에 관한 연구)

  • 김혜경;오해석
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2000.10b
    • /
    • pp.541-543
    • /
    • 2000
  • 영역의 수와 윤곽선의 길이는 세그멘테이션 기반의 움직임 보상된 비디오 코딩에서 두 가지의 기본적인 제약사항이다. 이 논문에서 제안하는 코딩 스킴은 영역의 수를 축소하는 것에 초점을 맞추고, 윤곽성 코딩, 그리고 치환된 프레임 차이(DFD)의 압축에 초점을 맞춘다. 제안된 스킴의 가장 중요한 특징 중의 하나는 형태적인 필터를 기반으로 하는 spatio-temporal 단순성 알고리즘이고, 그것들과 함께 이미지는 작은 수의 영역으로 나누어질 수 있다. 이 스킴의 매우 중요한 특성은 세그멘테이션 맵 샘플링 기법으로, 그것은 윤곽선 길이를 매우 작은 복원 에러에 비례하여 약 50%까지 줄인다. 실험적인 결과는, 높은 압축 비율에 대하여 매우 작은 코딩 에러를 보여주었다.

  • PDF

Study on icon types used in SNS of visual communication centered on Facebook, Instagram, KakaoTalk icons (시각적 커뮤니케이션의 SNS에서 사용되는 아이콘 유형 연구페이스북, 인스타그램, 카카오톡 아이콘을 중심으로)

  • Lee, kyoung-min;Choi, you-mi
    • Proceedings of the Korea Contents Association Conference
    • /
    • 2019.05a
    • /
    • pp.357-358
    • /
    • 2019
  • 최근 스마트폰이 대중화되면서 SNS에서 아이콘의 사용성은 점점 높아지고 있다. SNS 아이콘은 다양하게 진화되고 있으나, 동일한 의미를 제공하지 못한 채 혼란을 일으키고 있는 실정이다. 따라서 아이콘의 커뮤니케이션 의미에 따른 유형을 분류 제시하고 이러한 현 사용의 문제점을 발견하는 것이 본 연구의 목적이다. SNS에서 아이콘은 강한 의사전달력이란 속성을 가지고 그 역할이 중요하게 부각되고 있으나 효과적으로 의미를 전달하지 못하는 부분의 문제점을 해결하고자, 다양한 SNS에서 같은 의미에 다른 표현 방식의 아이콘을 추출한 후, 설문조사와 인터뷰를 통해 어떤 아이콘이 가장 효과적으로 의미 전달을 할 수 있는지 고찰해 보았다. 그 결과, SNS에서 사용되는 아이콘은 보편적, 중의적, 상충적, 브랜드 4가지 유형으로 요약되었으며, 두세 가지 유형으로 공통으로 속하는 아이콘도 있었다. 본 연구결과 아이콘의 디자인 시 아이콘 유형이 표준화에 대한 추가 연구 필요성을 제안한다.

  • PDF

Probabilistic Analysis for Rock Slope Stability (확률론적 해석방법을 이용한 암반사면 안정성 해석)

  • Park Hyuck-Jin
    • Proceedings of the Korean Geotechical Society Conference
    • /
    • 2000.03b
    • /
    • pp.365-372
    • /
    • 2000
  • 현장상황에 대한 불충분한 자료와 파괴 메커니즘에 대한 불완전한 이해로 인해 발생하는 가변성(variability)과 불확실성(uncertainty)은 암반사면공학뿐만 아니라 지반공학에서 흔히 접하게 되는 문제점이다. 특히 암반사면공학에서는 이러한 가변성과 불확실성이 불연속면의 방향 및 기하학적 특성, 그리고 실내실험 결과의 분산으로 나타난다. 그러나 안전율(factor of safety)의 개념을 기초로 하는 전통적인 결정론적 해석방법(deterministic analysis)은 이러한 분산을 고려하지 않은 채 단일 대표 값만을 이용하여 구조물의 안정성을 판단하여 왔다. 확률론적 해석방법(probabilistic analysis)은 이러한 가변성과 불확실성을 효과적으로 정량화하여 해석에 이용할 수 있는 방법 중의 하나로 제안되었다. 이러한 해석방법은 불연속면의 기하학적 특성과 강도 특성을 확률변수(random variable)로 취급하여 신뢰성이론(reliability theory)과 확률이론(probability theory)을 근거로 분석하였으며 이를 기초로 하여 Monte Carlo Simulation과 같은 해석법을 이용, 구조물의 붕괴가능성을 확률로 표현하였다. 확률론적 해석 방법은 기존의 안전율을 대체하여 구조물의 안정성을 붕괴확률(probability of failure)로 제안하였으며 이 붕괴확률은 안전율의 확률분포함수 (probability density function)에서 안전율이 1보다 작을 가능성을 확률로 나타낸 수치이다. 본 논문에서는 확률론적 해석방법을 이용하여 불연속면 특성들의 확률특성을 고찰하였으며 이를 기초로 하여 암반사면의 안정성 해석에 응용했다.

  • PDF

Convergence and Stability Analysis of LU Scheme on Unstructured Meshes: Part I - Euler Equations (비정렬 격자계에서 LU Implicit Scheme의 수렴성 및 안정성 해석 : Part I-오일러 방정식)

  • Kim, Joo-Sung;Kwon, Oh-Joon
    • Journal of the Korean Society for Aeronautical & Space Sciences
    • /
    • v.32 no.9
    • /
    • pp.1-11
    • /
    • 2004
  • A comprehensive study has been made for the investigation of the convergence and stability characteristics of the LU scheme for solving the Euler equations on unstructured meshes. The von Neumann stability analysis technique was initially applied to a scalar model equation, and then the analysis was extended to the Euler equations. The results indicated that the convergence rate is governed by a specific combination of flow parameters. Based on this insight, it was shown that the LU scheme does not suffer any convergence deterioration at all grid aspect ratios, as long as the local time step is defined using an appropriate parameter combination.

A Study on Identifying Personal Information on Conversational Text Data (대화형 텍스트 데이터 내 개인정보 식별에 대한 연구)

  • Cha, Do Hyun;Kown, Bo Keun;Youn, Hee Chang;Lee, Gu Hyup;Joo, Jong Wha J.
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2022.11a
    • /
    • pp.11-13
    • /
    • 2022
  • 데이터 3 법을 필두로, 기업은 개인정보가 포함된 데이터를 활용하기 위해 비식별 처리가 필요하게 되었다. 기존 방식은, 비정형 텍스트 데이터에서 정규표현식을 통한 개인정보 식별은 데이터의 다양성에 의해 한계가 명확하며, 기존의 Named Entity Recognition(NER) 태스크로 해결하기에는 언어의 중의적 표현과 2 인 대화에서 나타나는 개인정보가 누구의 것인지 판단하지 못한다는 한계가 존재한다. 따라서 우리는 기존의 한계점을 극복하고 개선하기 위해 BERT 언어 모델에 화자 정보를 학습시키고, 하나의 어절에 2 개의 tag 를 labeling 하는 방법을 제안하여 정확한 개인정보 식별을 시도하였다.