• Title/Summary/Keyword: 정보 오류

Search Result 3,750, Processing Time 0.042 seconds

Fault Diagnosis and Reasoning Method based on Fault Tree (오류트리 기반의 오류 진단 및 추론 기법)

  • Kim, Yeongduck;Ko, Jaeheon;Min, Dongwook;Seo, Jeongbeom;Choi, JaeKyu;Rhee, Hyunsook;Kim, Hoonki;Jung, Sukyong;Park, Jeongmin
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2009.11a
    • /
    • pp.815-816
    • /
    • 2009
  • 자가 치유 시스템은 자율 컴퓨팅의 개념 중 하나로 사람의 개입 없이 시스템의 이상상태를 인식하고 정상상태로 복귀 가능한 시스템을 의미한다. 발생한 오류는 또 다른 오류를 유발할 수 있고, 하나 이상의 원인이 되는 오류나 사건이 있을 수 있다. 따라서 오류의 원인에 따른 치유전략을 필요로 하며 발생한 오류에서부터 전이될 수 있는 오류에 대한 추론을 요구하게 된다. 따라서 본 논문에서는 오류의 인과관계에 따른 진단 및 추론 기법을 제안하고자 한다. 제안사항을 통해 오류트리를 기반으로 하여 발생한 오류의 원인이 되는 오류를 파악할 수 있으며, 오류의 원인에 따른 치유 전략을 계획 가능하고, 발생 가능한 오류의 추론이 가능하다.

Adaptive English Context-Sensitive Spelling Error Correction Techniques for Language Environments (언어 사용환경에 적응적인 영어 문맥의존 철자오류 교정 기법)

  • Kim, Minho;Jin, Jingzhi;Kwon, Hyuk-Chul
    • Annual Conference on Human and Language Technology
    • /
    • 2015.10a
    • /
    • pp.133-136
    • /
    • 2015
  • 문서 교정기에서 문맥의존 철자오류를 교정하는 방법은 크게 규칙을 이용한 방법과 통계 정보를 이용한 방법으로 나뉜다. 한국어와 달리 영어는 오래전부터 통계 모형에 기반을 둔 문맥의존 철자오류 교정 연구가 활발히 이루어졌다. 그러나 대부분 연구가 문맥의존 철자오류 교정 문제를 특정 어휘 쌍을 이용한 분류 문제로 간주하기 때문에 실제 응용에는 한계가 있다. 또한, 대규모 말뭉치에서 추출한 통계 정보를 이용하지만, 통계 정보 자체에 오류가 있을 경우를 고려하지 않았다. 본 논문에서는 텍스트에 포함된 모든 단어에 대하여 문맥의존 철자오류 여부를 판단하고, 해당 단어가 오류일 경우 대치어를 제시하는 영어 문맥의존 철자오류 교정 기법을 제안한다. 또한, 통계 정보의 오류가 문맥의존 철자오류 교정에 미치는 영향과 오류 발생률의 변화가 철자오류 검색과 교정의 정확도와 재현율에 미치는 영향을 분석한다. 구글 웹데이터에서 추출한 통계 정보를 바탕으로 통계 모형을 구성하고 평가를 위해 브라운 말뭉치에서 무작위로 2,000문장을 추출하여 무작위로 문맥의존 철자오류를 생성하였다. 실험결과, 문맥의존 철자오류 검색의 정확도와 재현율은 각각 98.72%, 95.79%였으며, 문맥의존 철자오류 교정의 정확도와 재현률은 각각 71.94%, 69.81%였다.

  • PDF

Developing an Error Correction Tool for Sejong POS Tagged Corpus (세종 형태분석 말뭉치의 오류 수정 도구 개발)

  • Choi, Myung-Gil;Nam, Yoo-Rim;Seo, Hyung-Won;Jeon, Kil-Ho;Kim, Jae-Hoon
    • Annual Conference on Human and Language Technology
    • /
    • 2011.10a
    • /
    • pp.114-116
    • /
    • 2011
  • 한국어 정보처리에서 널리 사용되는 세종 형태분석 말뭉치는 품사정보와 문장정보 등 다양한 한국어 정보를 포함하고 있다. 이 말뭉치는 방대한 양의 정보들로 구축되었지만 많은 오류 또한 포함되어 있다. 예를 들면 철자 오류, 띄어쓰기 오류, 그리고 품사부착 오류 등이 있다. 하지만 세종말뭉치와 같이 대용량 말뭉치의 오류를 수정하는 것은 많은 인력과 시간이 필요하며 일관성 있게 오류를 수정하는 것은 쉽지 않다. 따라서 본 논문에서는 세종 형태분석 말뭉치에 포함된 오류를 빠르고 일관성 있게 수정하기 위한 오류 수정 도구를 구현하였다. 본 논문에서 수정 대상이 되는 오류는 어절과 형태소 분석 결과의 불일치에 관한 오류만 대상으로 한다. 이를 위해 세종 형태분석 말뭉치를 데이터베이스로 재구축하였으며, 본래의 어절과 품사가 부착된 형태소의 자모를 각각 분리하여 두 자모의 차이점을 분석하여 오류 후보를 선정한다. 오류 후보에서 동일한 오류 패턴을 갖는 모든 오류 후보에 대하여 동일한 방법으로 일관성 있고 빠르게 수정할 수 있다.

  • PDF

양자 오류 정정 부호의 개요

  • Heo, Jun;Sin, Jeong-Hwan
    • Information and Communications Magazine
    • /
    • v.30 no.2
    • /
    • pp.29-35
    • /
    • 2013
  • 본고에서는 양자 정보 처리 시스템에서 사용되는 양자 오류 정정 부호에 대해서 알아본다. 양자 오류 정정 부호는 디지털 정보가 아닌 연속적인 값을 갖는 양자 정보의 오류를 수정하는 기법으로 기존의 고전 오류 정정 부호를 적용할 수 없는 양자정보 시스템에서 사용되는 오류 정정 부호이다. 본 논문에서는 최근 가장 활발하게 사용되고 있는 안정 부호를 중심으로 양자 오류 정정 부호의 구성 및 기존 오류 정정 부호와의 관계를 살펴본다.

An Error Control based on An Object-oriented Multimedia Collaboration Framework for Media Multichannel (미디어 다채널을 위한 객체 지향 멀티미디어 협력 작업 프레임워크에서의 오류 제어)

  • Ko, Eung-Nam;Hwang, Dae-Joon
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2001.10a
    • /
    • pp.167-170
    • /
    • 2001
  • 제안하고자 하는 오류 제어는 멀티미디어 응용 개발 프레임워크에서 오류 발생시 오류를 하나의 미디어로 취급한다. 본 논문에서는 멀티미디어 응용 개발 프레임워크에서 다채널 방식을 사용한다. 다채널 방식이란 미디어 데이터 별로 별도의 채널을 할당하여 채널별로 단일 미디어 정보를 순서대로 전송함으로써 동일 미디어 데이터는 순서가 변할 우려가 없다. 오류도 오류 발생시 순서대로 전송한다. 그러나 이러한 다 채널 방식의 미디어 동기화는 미디어 간 동기화 문제를 유발시킨다. 미디어 간 동기화를 위해서 미디어 채널과 제어/오류제어 채널을 사용한다. 제어 채널은 동기화 정보 외에 오류 동기화 정보, 트래픽 정보, 세션의 유지 정보, 발언권 변경 정보 등과 같은 정보를 전송하는 채널이다.

  • PDF

Korean Spelling Corrector Based on Corpus Analysis (말뭉치를 기반으로 한 한국어 철자 교정기의 구현)

  • Lee, Byeong-Hun;Yun, Jun-Tae;Song, Man-Suk
    • Annual Conference on Human and Language Technology
    • /
    • 1993.10a
    • /
    • pp.285-293
    • /
    • 1993
  • 대량의 말뭉치에서 나타나는 맞춤법 오류의 대부분은 타자수의 입력 실수로 인한 것이다. 맞춤법 오류의 유형은 크게 띄어 쓰기 오류, 철자 오류, 띄어 쓰기와 철자의 복합 오류의 세 가지로 나타난다. 이 중, 철자 오류를 표층 형태만으로 표준어 오류, 조사/어미 오류, 자소 대치 오류로 유형을 분류하였다. 본 논문은 300만 말뭉치에서 형태소 분석이 실패한 맞춤법 오류 어절 중에서 띄어 쓰기와 철자 오류를 분석하여, 각 오류 유형에 따른 교정 방법과 자소 대치 규칙 베이스를 이용한 교정 방법을 구현하였다. 또한 형태소 분석기를 거친 40만 어절 사전을 이용한 분석기로 기존의 형태소 분석기를 대치시켜 교정 어절을 검증하였고, 위의 사전에서 추출한 순위 결정 요소와 Heuristic 정보를 이용하여 각 후보 어절에 대한 가중치를 계산하고 가능성이 높은 교정 어절을 제시하는 시스템을 구현하였다.

  • PDF

Detection of Soft 404 Errors based on Visual Characteristics of Web Page (웹 문서의 형태적 특징 인식에 기반한 SOFT 404 오류 판별)

  • Im, Jaehyeong;Choo, Seung-Hwa
    • Annual Conference on Human and Language Technology
    • /
    • 2018.10a
    • /
    • pp.382-385
    • /
    • 2018
  • Dead Link의 노출 최소화는 웹 검색 서비스의 품질 유지에 있어 매우 중요하다. 따라서 색인 내 Soft 404 오류의 정확한 판별은 필수적이지만, 리다이렉션 정보에 의존하거나 텍스트 혹은 HTML 자질 만을 고려하는 기존 방법의 활용만으로는 판별 가능한 Soft 404 오류의 유형이 한정될 수 있다는 문제가 있다. 이에 본 연구에서는 보다 범용성이 높은 Soft 404 오류 판별 기술의 개발을 위해, 404 오류 안내 페이지 고유의 형태적 특성을 오류 판별에 사용할 것을 제안한다. 제안 방법은 오류 안내 문서의 형태적 특성을 이미지 인식 모형에 기반해 학습한 후 이를 Soft 404 오류 판별에 사용하며, 리다이렉션 등 특정 정보에 의존하는 기존 방법에 비해 보다 폭넓게 적용 가능하다는 장점이 있다. 실험에서 제안 방법은 87.6%의 정확률과 92.7%의 재현율을 기록하는 등 높은 인식 성능을 보였다.

  • PDF

A Division Method of Korean Compound Noun by number of syllable (음절수에 따른 한국어 복합 명사 분리 방안)

  • Choi, Jae-Hyuk
    • Annual Conference on Human and Language Technology
    • /
    • 1996.10a
    • /
    • pp.262-267
    • /
    • 1996
  • 한국어 맞춤법 검사기는 문서내에서 발생되는 비표준어 오류, 띄어쓰기/붙여쓰기 오류, 조사/어미 오류, 외래어 오류, 철자 오류 등에 대해서 이에 적합한 대치어를 제시해 준다. 일반적으로 한국어의 맞춤법 오류 중 가장 빈번하게 발생되는 것이 띄어쓰기 오류이며, 이 중에서도 복합 명사에 대한 띄어쓰기 오류가 가장 많이 발생한다. 본 논문에서는 복합 명사에 대한 띄어쓰기 교정 방안으로 복합명사의 음절수에 따라 1개의 결과만을 출력하도록 하는 복합 명사 분리 방안을 제시하며, 또한 복합 명사 분리 시의 사전 참조 횟수를 줄이는 방법을 제안한다.

  • PDF

An Error Control based on Media Multi-channel for Industry Safety Services (산업 안전 서비스를 위한 미디어 다중채널 기반의 오류 제어)

  • Ko, Eung-Nam
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2010.11a
    • /
    • pp.1489-1490
    • /
    • 2010
  • 제안하는 오류 제어는 산업 안전 서비스를 위한 멀티미디어 응용 개발 프레임워크의 오류 발생시 오류를 하나의 미디어로 취급하며 멀티미디어 응용 개발 프레임워크에서 다채널 방식을 사용한다. 다채널 방식이란 미디어 데이터 별로 별도의 채널을 할당하여 채널 별로 단일 미디어 정보를 순서대로 전송함으로써 동일 미디어 데이터는 순서가 변할 우려가 없다. 오류도 오류 발생시 순서대로 전송한다.

Open Sourced and Collaborative Method to Fix Errors of Sejong Morphologically Annotated Corpora (공개와 협업을 통한 세종 형태 분석 말뭉치 오류 개선 방법)

  • Han, Gyeong-Eun;Baek, Seul-Ye;Lim, Jae-Soo
    • Annual Conference on Human and Language Technology
    • /
    • 2017.10a
    • /
    • pp.228-232
    • /
    • 2017
  • 본 논문에서는 21세기 세종계획 "현대문어 형태 분석 말뭉치"에서 나타나는 오류를 개선하는 방법으로 패치 시스템을 제안한다. 이 패치 시스템은 패치 파일과 패치 적용-생성 스크립트로 구성되며, 사용자들은 패치 파일을 사용하여 원래의 말뭉치에서 어떤 파일과 어절을 수정하였는지 확인할 수 있어 개발 목적에 맞는 학습 말뭉치를 생성할 수 있다. 또한 이 시스템을 이용해 서로의 수정 사항을 공유하고, 지속적으로 세종 말뭉치의 오류를 개선할 수 있다. 본 논문에서는 총 1,015만 어절을 대상으로 31만여 개의 오류를 수정하였다. 오류의 유형으로는 문장, 어절 분리 오류, 철자 오류, 불일치 오류, 분석 오류, 형식 오류가 있으며, 오류 수정 사항을 패치 파일에 반영하였다.

  • PDF