• Title/Summary/Keyword: 지식 기반 공학 시스템

Search Result 273, Processing Time 0.04 seconds

Korean and English Text Chunking Using IG Back-off Smoothing and Probabilistic Model (IG back-off 평탄화와 확률 기반 모델을 이용한 한국어 및 영어 단위화)

  • Yi, Eun-Ji;Lee, Geun-Bae
    • Annual Conference on Human and Language Technology
    • /
    • 2002.10e
    • /
    • pp.118-123
    • /
    • 2002
  • 많은 자연언어처리 분야에서 문장의 단위화는 기본적인 처리 단계로서 중요한 위치를 차지하고 있다. 한국어 단위화에 대한 기존 연구들은 규칙 기반 방법이나 기계 학습 기법을 이용한 것이 대부분이었다. 본 논문에서는 통계 기반 방식의 일환으로 순수 확률기반 모델을 이용한 단위화 방법을 제시한다. 확률 기반 모델은 처리하고자 하는 해당 언어에 대한 깊은 지식 없이도 적용 가능하다는 장점을 가지므로 다양한 언어의 단위화에 대한 기본 모델로서 이용될 수 있다. 또한 자료 부족 문제를 해결하기 위해 메모리 기반 학습 시에 사용하는 IG back-off 평탄화 방식을 시스템에 적용하였다. 본 논문의 모텔을 적용한 단위화 시스템을 이용하여 한국어와 영어에 대해 실험한 결과 비교적 작은 규모의 말뭉치를 학습하였음에도 불구하고 각각 90.0%, 90.0%의 정확도를 보였다.

  • PDF

Construction of Korean WordNet (한국어 워드넷의 구축)

  • Lim, Sung-Shin;Lee, Eun-Ryoung;Kwon, Hyuk-Chul
    • Annual Conference on Human and Language Technology
    • /
    • 2004.10d
    • /
    • pp.106-111
    • /
    • 2004
  • 사람의 언어를 이해하는 자연언어처리 시스템을 개발하기 위해서는 의미처리를 위한 지식 베이스(knowledge base)가 필요하다. 지금까지 사람이 가진 지식 베이스를 컴퓨터에 도입하려는 많은 노력을 기울이고 있고 그 결과물로 온톨로지(ontology)와 시소러스(thesaurus)가 만들어지고 있다. 외국에서는 지식 베이스의 중요성을 알고 많은 연구를 수행하고 있으며 그 대표적인 사례들에는 Roget's Thesaurus, WordNet, EDR 개념사전, CYC, Euro WordNet 등이 있다. 이 중에서 가장 대표적이며 많은 활용을 보이는 것이 Princeton 대학의 WordNet이다. WordNet은 인간의 어휘지식에 대한 심리 언어학적인 연구의 결과물로써 심리학자와 언어학자들에 의해 10여 년 동안 구축되고 있는 영어에 대한 어휘데이터베이스이다. 본 논문에서는 WordNet을 기반으로 명사에 대해서 영한사전과 국어사전을 이용하여 구축한 한국어 워드넷을 소개하구 구축시 고려한 기본지침을 소개하도록 하겠다.

  • PDF

Implementation of Knowledgebase and Grammar Checker Based on Asymmetric Relationship (비대칭 관계에 기반한 지식베이스와 문법 검사기 구현)

  • Kang, Mi-Young;Lim, Sung-Shin;Kwon, Hyuk-Chul
    • Annual Conference on Human and Language Technology
    • /
    • 2002.10e
    • /
    • pp.147-154
    • /
    • 2002
  • 이 논문은 한국어 문서 교정을 위해 부산대학교 인공지능 연구실에서 개발되고 있는 맞춤법 및 문법 검사기와 그 지식베이스 구축에 대해 알아본다. 비대칭 관계(asymmetric relation) 설정과 더불어 개발된 문법 검사기는 한 문장의 임의의 두 요소간의 비대칭 관계를 토대로 (1) 잠재적 지배관계 개념을 설정하고 (2) 부분 문장 분석 방법을 사용한다. 이런 요소들을 효율적으로 운영하는 시스템을 구현하기 위해서는 한국어에 대한 이해와 경험적 자료를 적절히 조화시킨 지식베이스 구축이 필수적이다. 이 논문은 그 선수(先手) 작업으로 한국어 문서의 오류들을 관찰하고, 그로부터 추출한 언어적이거나 언어 외적인 요소들로부터 일반적 패턴을 뽑아내어 사용자의 기대를 만족시키기 위한 적절한 규칙지식베이스를 구축하고 문법 검사기의 성능 향상을 위해 문장 분석 출발점과 분석방향 그리고 분석범위를 한정한다.

  • PDF

Design of Learning Metadata Management Service for Authoring and Sharing Learning Contents (학습 컨텐츠의 제작과 공유를 위한 학습 메타데이터 관리 서비스 설계)

  • Suh, Young-Bae;Lee, Young-Seok;Cho, Jung-Won;Choi, Byung-Uk
    • Annual Conference of KIPS
    • /
    • 2004.05a
    • /
    • pp.977-980
    • /
    • 2004
  • SCORM은 웹 환경에 존재하는 다양한 학습관리시스템 간에 표준화 된 컨텐츠 모델을 제시함으로써 학습 컨텐츠의 호환성을 보장하고 재사용성을 높이고자 하는 표준이다. 하지만 기존의 SCORM 기반학습관리시스템은 학습 리소스의 공유를 위한 기반은 제공하지만 학습 컨텐츠의 세부적인 학습 내용과 학습 문맥을 표현하고, 이를 공유할 수 있는 방안은 제시해 주지 못한다.본 논문에서는 지식 관리 기술인 시맨틱 웹의 RDF를 사용하여 학습 메타데이터를 표현하고, 이를 통합 관리할 수 있는 학습 메타 데이터 관리 서비스를 기존 학습관리시스템과 연동될 수 있는 모듈로서 제안한다. 또한 SCO에 포함될 수 있는 RDF기반 특징정보 파일을 정의하고, 저장된 학습 메타데이터를 SOAP 프로토콜을 통하여 외부 학습관리시스템과 공유할 수 있는 방안을 제시한다.이를 기반으로 교수자는 학습 주제와 관련된 컨텐츠를 검색하여 새로운 학습 컨텐츠를 제작 할 수 있으며, 학습자는 의미 기반 검색을 통하여 다양한 학습 컨텐츠와 능동적인 학습 환경을 체험 할 수 있다.

  • PDF

Development and Application of a Methodology to Build Geotechnical Information System Based on Geo-Knowledge Using GIS Technology (GIS를 이용한 지반-지식 기반 지반 정보화 시스템 구축 기법의 개발 및 적용)

  • Sun Chang-Guk;Chung Choong-Ki
    • Journal of the Korean Geotechnical Society
    • /
    • v.22 no.2
    • /
    • pp.55-68
    • /
    • 2006
  • For the reliable prediction of spatial geotechnical data, a procedure to build the Geotechnical Information System (GTIS) based on geo-knowledge within the frame of GIS technology was developed by introducing a couple of new concepts of the extended area containing the study area and the additional site visit for acquiring surface geological data. To build the GTIS for Gyeongju as the case study of regional model application, intensive site investigations and pre-existing geotechnical data collections were performed and additional site visit was also carried out for acquiring surface geo-layer data in accordance with the developed procedure. Within the GTIS based on geo-knowledge for Gyeongiu area, the spatially distributed geo-layers across the extended area were predicted using the geostatistical kriging method and those for the study area were extracted. Furthermore, the spatial distribution maps for the thickess of geo-layers and the depth to bedrock were constructed for the practical use in geotechnical field. It was evaluated that the GTIS based on geo-knowledge developed in this study is superior to the conventional geotechnical GIS in terms of both the standard deviation and the geological expert judgment.

Comparison of System Call Sequence Embedding Approaches for Anomaly Detection (이상 탐지를 위한 시스템콜 시퀀스 임베딩 접근 방식 비교)

  • Lee, Keun-Seop;Park, Kyungseon;Kim, Kangseok
    • Journal of Convergence for Information Technology
    • /
    • v.12 no.2
    • /
    • pp.47-53
    • /
    • 2022
  • Recently, with the change of the intelligent security paradigm, study to apply various information generated from various information security systems to AI-based anomaly detection is increasing. Therefore, in this study, in order to convert log-like time series data into a vector, which is a numerical feature, the CBOW and Skip-gram inference methods of deep learning-based Word2Vec model and statistical method based on the coincidence frequency were used to transform the published ADFA system call data. In relation to this, an experiment was carried out through conversion into various embedding vectors considering the dimension of vector, the length of sequence, and the window size. In addition, the performance of the embedding methods used as well as the detection performance were compared and evaluated through GRU-based anomaly detection model using vectors generated by the embedding model as an input. Compared to the statistical model, it was confirmed that the Skip-gram maintains more stable performance without biasing a specific window size or sequence length, and is more effective in making each event of sequence data into an embedding vector.

A Plug-In Component-based Korean Morphological Analyzer (플러그인 컴포넌트 기반의 한국어 형태소 분석기)

  • Park, Sangwon;Choi, Donghyun;Kim, Eunkyung;Choi, Keysun
    • Annual Conference on Human and Language Technology
    • /
    • 2010.10a
    • /
    • pp.197-201
    • /
    • 2010
  • 지식/정보 서비스의 수준이 급격히 발전함에 따라 기반 기술인 자연언어처리의 중요성이 증가했고, 또 여러 분야에서 다양한 목적에 부합하는 자연언어처리 도구를 필요로 하고 있다. 한국어 자연언어처리 기반 기술 중에서 형태소 분석은 기초적이면서도 중요한 분석 단계이다. 하지만 현재까지 개발된 한국어 형태소 분석기들은 대부분 특정 시스템에 맞게 최적화되어 실행 효율성과 정확성을 높이는데 중점을 두고 있다. 이러한 도구들은 접근성과 확장성이 떨어지고 다양한 요구에 유언하게 대처할 수 없는 단점이 있다. 따라서 본 논문에서는 플러그인 형태의 한국어 형태소 분석 컴포넌트들을 이용하여 유연하게 워크플로를 구성하고 다양한 목적에 맞게 활용할 수 있도록 지원하는 한국어 형태소 분석 시스템을 제안한다. 이번 연구를 통해서 보다 많은 사람들이 형태소 분석 기술에 쉽게 접근하고 활용하여, 한국어 분석 기반 기술 및 용용 기술이 더욱 발전 할 수 있을 것으로 기대한다.

  • PDF

Design of a Multilingual Translation System Based on Interlingual Approach (중간언어에 기반한 기계 번역시스템의 설계)

  • Kim, Sang-Kuk;Park, Chang-Ho
    • Annual Conference on Human and Language Technology
    • /
    • 1993.10a
    • /
    • pp.521-526
    • /
    • 1993
  • 다언어간 번역을 지향하는 기계번역시스템의 개발을 위해서는, 의미 이해기반의 해석기술과 언어에 독립적인 생성기술의 설계가 기본이므로 원시언어와 목표언어가 어느 한쪽의 언어지식에 의존하지 않고 언어형식화가 가능한 중간언어 구조를 설정하는 것이 중요하다. 따라서, 한국어를 중심으로 하는 다언어 번역의 설계에서는 비교적 문구조의 정형화가 이루어진 영어와는 달리 어순 배열의 자유도가 높고 조사의 격표시로 문장구조가 결정되는 한국어의 특성을 고려한 해석 및 생성 메카니즘이 필요하다. 본 논문에서는 문장에 내포된 심층의미의 중간 표현으로써, 단어의 의미를 개념화시킨 개념소(Conceptual Primitive)간의 의미적 결합관계를 나타내는 개념 그래프(Conceptual Graph)를 채택하고 설계한 다언어 번역지향의 중간언어기반 번역시스템에 대하여 기술한다.

  • PDF

Solving Japanese Center Exam with Choice Verification (보기 검증을 통한 일본 센터 시험 문제 해결)

  • Kwon, Soonchoul;Nam, Daehwan;Yu, Hwanjo;Lee, Gary Geunbae
    • Annual Conference on Human and Language Technology
    • /
    • 2015.10a
    • /
    • pp.190-193
    • /
    • 2015
  • 이 논문에서는 한국의 수능 시험에 대응하는 일본 센터 시험의 세계사B 문제를 해결하는 시스템을 만들고 그 성능을 평가했다. 이 시스템은 문제의 각 보기의 신뢰도를 검증하여 어떤 보기가 참인지를 결정한다. 보기 검증을 위해 지식 베이스 기반, 정보 검색 기반, 시간적 제약 기반 검증을 사용하였다. 성능 평과 결과 6개년도 시험 중 5개 시험에서 통계적으로 의미 있는 결과를 얻었다. 이 시스템은 영어를 대상으로 하나, 한국어에도 존재하는 리소스를 사용했기 때문에 한국어에서도 같은 방법론을 적용할 수 있을 것으로 본다. 후속 연구로는 보기의 의미적 분석과 개체명 이외의 정보에 대한 검색이 필요하다.

  • PDF

Design and Implementation of a Web-Based Toy Trading System (웹 기반 장난감 거래 시스템 설계 및 구현)

  • Lim, Jongtae;Lim, Yunsoo;Lee, Dong-Geun;Yoo, Jaesoo
    • The Journal of the Korea Contents Association
    • /
    • v.19 no.10
    • /
    • pp.45-58
    • /
    • 2019
  • As modern people's daily lives are becoming more harsh in Korea, the so-called Kidults generation has appeared since a few years ago as adults have come back to their childhood sensibility and are exposed to various cultures online, and there are many people who have a hobby for collecting toys. However, as there is currently no formalized system for individual toy trade online, it is difficult to acquire expertise and share information with each other through a major portal site's $caf{\acute{e}}$, and is exposed to security or fraud while trading toys. In this paper, we design and implementation of a web-based toy trading system. Analyzing the advantages and disadvantages of the various trading and relay systems currently in use, it will provide opportunities for professional toy knowledge and information exchange to many users who have a hobby of collecting toys, and will greatly help vitalize the toy market through a secure and convenient trading environment between individuals.