• Title/Summary/Keyword: 개체 모호성 해결

Search Result 5, Processing Time 0.022 seconds

Neural Network Model for Named Entitiy Linking using Wikipedia Link Data (위키피디아 링크 데이터를 이용한 Neural Network Model 기반 한국어 개체명 연결)

  • Lee, Young-Hoon;Na, Seung-Hoon
    • Annual Conference on Human and Language Technology
    • /
    • 2018.10a
    • /
    • pp.163-166
    • /
    • 2018
  • 개체명 연결이란 주어진 문장에 출현한 단어를 위키피디아와 같은 지식 기반 상의 하나의 개체와 연결하여 특정 개체가 무엇인지 식별하여 모호성을 해결하는 작업이다. 본 연구에서는 위키피디아의 링크를 이용하여 개체 표현(Entity mention)과 학습 데이터, 지식 기반을 구축한다. 또한, Mention/Context 쌍의 표현과 Entity 표현의 코사인 유사도를 이용하여 Score를 구하고, 이를 통해 개체명 연결 문제를 랭킹 문제로 변환한다. 개체의 이름과 분류뿐만 아니라 개체의 설명, 개체 임베딩 등의 자질을 이용하여 모델을 확장하고 결과를 비교한다. 확장된 모델의 개체 링킹 성능은 89.63%의 정확도를 보였다.

  • PDF

A Non-morphological Approach for DBpedia URI Spotting within Korean Text (한국어 텍스트의 개체 URI 탐지: 품사 태깅 독립적 개체명 인식과 중의성 해소)

  • Kim, Youngsik;Hahm, Younggyun;Kim, Jiseong;Hwang, Dosam;Choi, Key-Sun
    • Annual Conference on Human and Language Technology
    • /
    • 2014.10a
    • /
    • pp.100-106
    • /
    • 2014
  • URI spotting (탐지) 문제는 텍스트에 있는 단어열 중에서 URI로 대표되는 개체(entity)에 해당되는 것을 탐지하는 것이다. 이 문제는 두 개의 작은 문제를 순차적으로 해결하는 과제이다. 즉, 첫째는 어느 단어열이 URI에 해당하는 개체인가를 인식하는 것이고, 둘째는 개체 중의성 해소 문제로서 파악된 개체가 복수의 URI에 해당할 수 있는 의미적 모호성이 있을 때 그 URI중 하나를 선택하여 모호성을 해소하는 것이다. 이 논문은 디비피디아 URI를 대상으로 한다. URI 탐지 문제는 개체명 인식 문제와 비슷하나, URI(예를 들어 디비피디아 URI, 즉 Wikipedia 등재어)에 매핑될 수 있는 개체로 한정되므로 일반적인 개체명 인식 문제에서 단어열의 품사열이 기계학습의 자질로 들어가는 방법론과는 다른 자질을 사용할 수 있다. 이 논문에서는 한국어 텍스트를 대상으로 한국어 디비피디아 URI 탐지문제로서 SVM을 이용한 개체경계 인식 방법을 제시하여, 일반적 개체명 인식에서 나타나는 품사태거의 오류파급효과를 없애고자 한다. 또한 개체중의성 해소 문제는 의미모호성이 주변 문장들의 토픽에 따라 달라지므로, LDA를 활용하며 이를 영어 디비피디아 URI탐지에서 쓰인 방법들과 비교한다.

  • PDF

The Part-of-Speech Ambiguity Problems in Morphological Analysis (형태 분석에서의 품사 중의성 문제)

  • Lee, Young-Je;Kang, Beom-Mo
    • Annual Conference on Human and Language Technology
    • /
    • 2004.10d
    • /
    • pp.264-269
    • /
    • 2004
  • 이 연구는 한국어의 형태 분석(Morphological Analysis) 과정에서 도출되는 품사 중의성 문제를 해결할 수 있는 방안을 제시해 보고자 하는데 목적이 있다. 강승식(2002)에서는 품사 중의성 문제를 품사 체계의 대 중 소분류에 따라 크게 세 가지로 나누고, 이를 1 2 3차 품사 중의성으로 구분하였다. 본고에서는 이에 해당하는 예를 각각 명사-부사 통용어, 보조용언 구성, 고유명사 등을 중심으로 살펴보고, 이들의 중의성 문제 해결에 필요한 방법들을 형태적, 통사적 조건들을 중심으로 설정하고자 한다. 결과적으로 통용어 문제 해결을 위해서는 통 용어를 표시할 수 있는 중간표지를 부여하는 방법을 주장할 것이다. 그리고 본용언과 중의성을 보이는 보조용언구성에서는 본용언간의 결합 관계도 함께 고려한 규칙을 제안하는 바이며, 고유명사의 중의성 문제는 고유명사의 범위를 '특정한 개체성'을 지니는 것으로 제한함으로서 실제 형태 분석에서의 모호성을 해결할 수 있는 방법을 주장할 것이다.

  • PDF

Fast 3D Model Extraction Algorithm with an Enhanced PBIL of Preserving Depth Consistency (깊이 일관성을 보존하는 향상된 개체군기반 증가 학습을 이용한 고속 3차원 모델 추출 기법)

  • 이행석;장명호;한규필
    • Journal of KIISE:Computer Systems and Theory
    • /
    • v.31 no.1_2
    • /
    • pp.59-66
    • /
    • 2004
  • In this paper, a fast 3D model extraction algorithm with an enhanced PBIL of preserving depth consistency is proposed for the extraction of 3D depth information from 2D images. Evolutionary computation algorithms are efficient search methods based on natural selection and population genetics. 2D disparity maps acquired by conventional matching algorithms do not match well with the original image profile in disparity edge regions because of the loss of fine and precise information in the regions. Therefore, in order to decrease the imprecision of disparity values and increase the quality of matching, a compact genetic algorithm is adapted for matching environments, and the adaptive window, which is controlled by the complexity of neighbor disparities in an abrupt disparity point is used. As the result, the proposed algorithm showed more correct and precise disparities were obtained than those by conventional matching methods with relaxation scheme.

A Hybrid Genetic Algorithm for the Identical Parallel Machine Total Tardiness Problem (동종 병렬기계에서 납기지연 최소화를 위한 혼합형 유전 알고리즘의 개발)

  • Choe, Hong-Jin;Lee, Jong-Yeong;Park, Mun-Won
    • Proceedings of the Korean Operations and Management Science Society Conference
    • /
    • 2004.05a
    • /
    • pp.624-627
    • /
    • 2004
  • 본 연구는 동일한 병렬기계에서의 총 납기지연의 합을 최소화하는 일정계획 문제에 대해 다룬다. 이 문제는 Lenstra et al. (1977)에 의해 NP-hard로 알려져 있으며, 작업의 수와 기계의 수가 큰 현실적 문제에 대해 적절한 시간 내에 최적해를 찾는다는 것은 사실상 불가능하다. 따라서 본 연구에서는 이 문제를 해결하기 위하여 혼합형 유전 알고리즘(hybrid genetic algorithm)을 제안한다. 혼합형 유전 알고리즘에서는 임의로 발생시킨 모집단에 대해 먼저 유전 알고리즘(genetic algorithm)이 세대를 진행하며 해를 개선한다. 유전 알고리즘이 일정기간동안 더 이상 해를 개선하지 못하면, 부분탐색 알고리즘(local-search algorithm))이 유전 알고리즘의 모집단의 개체들에 대해 해의 개선을 시도한다. 즉, 부분 탐색 알고리즘은 모집단 속의 각각의 개체를 초기해로 하여 모집단 내의 개체 수만큼의 부분 최적해(local optimum)들을 구한다. 이렇게 구한 부분 최적해들로 새로운 모집단을 구성하면 다시 유전 알고리즘이 진행된다. 이 과정을 종료조건에 이를 때까지 번갈아가며 반복 수행한다. 본 연구에서 제안한 유전 알고리즘에서는 Bean(1994)이 제안한 Random key 방법으로 개체를 표현하였으며 Park(2000)이 제안한 3가지 교차 연산자들을 채용하였다. 부분탐색 알고리즘을 위해서는 쌍대교환(pair-wise interchange) 방법을 통해 이웃해를 생성하였다. 선행실험을 통하여 제안한 혼합형 유전알고리즘에서 사용하는 다양한 모수(parameter)값들을 최적화하였으며 알고리즘의 성능을 비교하기 위하여 기존의 알고리즘과도 비교실험을 수행하였다.복적인 지표가 채택되는 경우를 포함하고 있다. 셋째는 추상적이며 측정이 어려운 지표를 채택하고 있는 경우이다. 여기에는 지표에 대한 정확한 정의가 이루어져 있지 않아 피 평가자가 불필요하거나 과다한 평가 자료를 준비해야 하거나 평가자로 하여금 평가 시 혼돈을 유발할 가능성이 있거나, 또는 상위개념의 평가항목과 하위개념의 평가항목이 혼재되어 구분이 모호한 경우를 포함하고 있다. 바탕으로 '생태적 합리성'이라는 체계적인 지식교육을 거쳐서, '환경정의' 의식의 제고로 이어가고, 굵직한 '환경갈등'의 상황에서 뚜렷한 정치적 태도와 실천을 할 수 있는 '생태적 인간상'의 육성으로 나아갈 수 있어야 한다는 것이 필자의 생각이다. 이를 위해서는 어찌되었건 체험학습 영역에서는 환경현안에 대한 사회적 실천을 '교육 소재'로 삼을 수 있어야 하며, 교과학습 영역에서는 한국사회의 환경현안에 대한 정치경제적 접근을 외면하지 말고 교과서 저작의 소재로 삼을 수 있어야 하며, 이는 '환경관리주의'와 '녹색소비'에 머물러 있는 '환경 지식교육'과 실천을 한단계 진전시키는 작업으로 이어질 것이다. 이후 10년의 환경교육은 바로 '생태적 합리성'과 '환경정의'라는 두 '화두'에 터하여 세워져야 한다.배액에서 약해를 보였으나, 25% 야자지방산의 경우 50 ${\sim}$ 100배액 어디에서도 액해를 보이지 않았다. 별도로 적용한 시험에서, 토마토의 경우에도 25% 야자지방산 비누 50 ${\sim}$ 100배액 모두 약해를 발생하지 않았으나, 오이에서는 25% 야자지방산 비누 100배액에도 약해를 나타내었다. 12. 이상의 결과, 천연지방산을 이용하여 유기농업에 허용되는 각종의 살충비누를 제조할 수 있었으

  • PDF