• Title/Summary/Keyword: 재현 정확도

Search Result 1,459, Processing Time 0.032 seconds

A Hangul Document Image Retrieval System Using Rank-based Recognition (웨이브렛 특징과 순위 기반 인식을 이용한 한글 문서 영상 검색 시스템)

  • Lee Duk-Ryong;Kim Woo-Youn;Oh Il-Seok
    • The Journal of the Korea Contents Association
    • /
    • v.5 no.2
    • /
    • pp.229-242
    • /
    • 2005
  • We constructed a full-text retrieval system for the scanned Hangul document images. The system consists of three parts; preprocessing, recognition, and retrieval components. The retrieval algorithm uses recognition results up to k-ranks. The algorithm is not only insensitive to the recognition errors, but also has the advantage of user-controllable recall and precision. For the objective performance evaluation, we used the scanned images of the Journal of Korea Information Science Society provided by KISTI. The system was shown to be practical through theevaluationofrecognitionandretrievalrates.

  • PDF

Word Alignment Using Chinese-Korean Linguistic Contrastive Information (중-한 대조분석정보를 이용한 단어정렬)

  • Li, Jin-Ji;Kim, Dong-Il;Lee, Jong-Hyeok
    • Annual Conference on Human and Language Technology
    • /
    • 2002.10e
    • /
    • pp.40-46
    • /
    • 2002
  • 본 논문에서는 범용 병렬코퍼스에서도 적용할 수 있는 단어정렬의 방법을 제안한다. 단어 단위로 정렬된 병렬코퍼스는 자연언어처리의 다양한 분야에 도움을 준다. 예를 들면 변환기반의 기계번역에서 변환패턴의 구축, MWTU(Multi Word Translation Unit)의 자동추출, 사전 구축, 의미 중의성 해소 등 분야에 적용된다. 중한 병렬 코퍼스의 단어정렬은 서로 다른 어족간의 관계의 규명을 포함하고 있기 때문에 본 논문에서는 통계적인 모델보다 중한 대역어 사전, 단일어 시소러스, 품사정보 및 언어학적 대조분석 정보 등 기존에 있는 리소스를 이용하여 재현율과 정확률을 높이는 방법에 대해 제시한다. 성능 평가를 위해 중앙일보에서 임의로 추출한 500개 대응문장을 이용하여 실험한 결과 82.2%의 정확률과 64.8%의 재현율을 보였다.

  • PDF

Korean Indicative Summarization Using Aggregate Similarity (도합유사도를 이용한 한국어 추출문서 요약)

  • Kim, Jae-Hoon;Kim, Jun-Hong
    • Annual Conference on Human and Language Technology
    • /
    • 2000.10d
    • /
    • pp.238-244
    • /
    • 2000
  • 본 논문에서 문서는 문서관계도라고 하는 그래프로 표현된다. 노드는 문서의 구성요소인 문장을 표현하고, 링크는 노드들 간의 의미적인 관계를 나타낸다 의미적 관계는 유사도에 의해서 결정되며, 문장의 중요도는 도합유사도로 나타낸다. 도합유사도는 한 노드와 인접한 노드들 사이의 유사도 합을 말한다. 본 논문에서는 도합유사도를 이용한 한국어 문서 기법을 제안한다. 실험에 사용된 평가용 요약문서는 정보처리 관련 분야에서 수집된 논문 100편과 KORDIC에서 구축한 신문기사 105건을 이용하였다. 문서 시스템에 의해서 생성된 문서의 크기가 본문의 20%이고, 본문이 논문(서론과 결론)일 경우, 재현율과 정확률은 각각 46.6%와 76.9%를 보였으며, 또한 본문이 신문기사일 경우, 재현율과 정확률은 각각 30.5%과 42.3%를 보였다. 또한 제안된 방법은 상용시스템보다 좋은 성능을 보였다.

  • PDF

Numerical Simulations of Dam-Break Flows and Inundation considering Nonhydrostatic Pressure and Dispersive Effects (동수압 및 분산 효과를 고려한 댐붕괴파와 범람 수치모의)

  • Kim, Dae-Hong;Lynett, Patrick
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2010.05a
    • /
    • pp.213-217
    • /
    • 2010
  • 댐붕괴파 (dam-break flow)나 지진해일에 의해 발생하는 undular bore와 충격파 (shock) 현상을 동수압 및 분산효과를 고려하여 수치모의를 수행하였다. 완전비선형 Boussinesq-type equations 모형을 이용하여, 동수압 및 분산 효과를 고려하였다. 방정식은 4차 정확도의 유한체적법을 이용하여 해석하였고, 시간적으로도 4차정확도의 기법을 이용하여 고차미분항에 대한 수치분산을 억제하였다. 다양한 경우의 1차원과 2차원 공간에서의 수치모의를 수행하고 검증을 수행하였다. 그 결과, 완전비선형 Boussinesq-type equations 모형은 천수방정식 (shallow water equations) 기반의 모형에서 재현이 불가능한 undular bore 등을 재현 하는 등, 전반적으로 천수방정식 기반의 모형 보다 물리적으로도 타당하고 정량적으로도 실험결과와 잘 일치하는 경향을 보였다. 즉, 댐붕괴파나 지진해일 등에 의한 범람 모의에 있어 동수압과 분산 효과의 중요성이 공학적으로도 매우 중요한 고려사항 임이 나타났다.

  • PDF

온톨로지의 구축과 학습: 상하위 관계

  • Choe, Gi-Seon;Ryu, Beop-Mo
    • Communications of the Korean Institute of Information Scientists and Engineers
    • /
    • v.24 no.4 s.203
    • /
    • pp.24-30
    • /
    • 2006
  • 온톨로지의 기본개념, 응용 분야 및 학습 단계에 대하여 간단하게 설명하였고, 온톨로지 학습단계에서 전문 분야의 개념간 계층 관계 학습 방법에 대하여 자세하게 알아보았다. 전문분야 개념을 표현하는 전문 용어 사이의 계층 관계를 학습하는 방법은 크게 규칙 기반 방법, 통계 기반 방법 그리고 용어의 전문성과 유사도를 이용하는 방법으로 나눌 수 있다. 규칙 기반 방법은 비교적 정확한 결과를 얻을 수 있는 장점이 있지만 재현율이 낮은 단점이 있다. 기존은 통계 기반 방법에서는 재현율이 높은 장점이 있지만 정확률이 낮은 단점이 있다. 또한 이 방법에서는 순수하게 통계 정보만 이용하기 때문에 오류에 대한 분석이 어려운 단점이 있다. 용어의 전문성과 용어간 유사도를 이용한 방법에서는 용어의 전문성을 이용하여 기존의 계층 구조에서 상위에 후보를 선택하고, 용어간 유사도를 이용하여 선택한 후보를 정렬하여 최적의 후보를 찾는다. 이 방법은 상위어 선정 과정을 두 단계로 분리하여 수행하기 때문에 오류 분석이 용이한 장점이 있다. 향후 온톨로지 학습 과정에서 계층 관계뿐 아니라 인과 관계 및 다양한 관계의 학습과 관련된 연구가 진행되어야 한다.

Robust Method for Sentence Boundary Identification in informal documents (비형식적인 문서에 강건한 문장 경계 인식)

  • Kim, Ju-Hee;Seo, Jung-Yun
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2010.06c
    • /
    • pp.266-270
    • /
    • 2010
  • 본 논문에서는 구두점이나 띄어쓰기가 없는 비형식적인 문서에서도 문장의 경계를 잘 인식할 수 있는 문장 경계 인식기를 제안한다. 기존의 문장인식기는 문장경계의 후보를 구두점 출현 위치만으로 하였는데 이는 잡음이 많은 웹문서를 처리하는데 한계가 있다. 반면에 제안한 방법은 문장 경계의 후보를 구두점의 출연 위치로 제한하지 않고 문장 경계 인식을 위한 자질로 구두점에 비 의존적인 음절 n-gram을 사용함으로써, 구두점이 잘 표현된 문서뿐만 아니라 구두점의 생략이 빈번한 웹문서의 문장 경계 인식까지 효과적으로 수행할 수 있다. 통계기반의 기계학습 기법으로 CRFs를 이용하여 하였고, 학습과 실험에 세종계획 말뭉치를 사용하였다. 제안한 문장 경계 인식기는 세종계획 말뭉치에서 99.99%의 정확률과 100.00%의 재현율을 보였고, 세종계획 말뭉치에서 문장 경계의 구두점을 제거한 경우에도 96.20%의 정확률과 87.51%의 재현율을 보여 구두점이 없는 경우에도 문장 경계 인식이 잘이루어짐을 확인할 수 있었다.

  • PDF

A English Composition Level Assessment System Using Machine Learning Techniques (기계학습기법을 이용한 영어작문 문장 수준평가 시스템)

  • Eom, Jin-Hee;Kwak, Dong-Min
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2013.11a
    • /
    • pp.1290-1293
    • /
    • 2013
  • 본 논문은 문장 내에서 나타나는 어휘간의 관계를 통해 표현 수준을 자동으로 평가할 수 있는 시스템을 제안한다. 제안하는 방법은 영어에세이 코퍼스 내의 문장에서 발생하는 철자 및 문법의 오류와 함께 어휘와 문법 패턴에 따른 표현난이도를 평가할 수 있는 자질을 생성하고 다양한 기계학습기법을 사용하여 문장의 수준을 평가하고자 하였다. 또한 기존에 연구되어온 규칙기반의 문장 평가시스템을 구현하고 기계학습기법을 이용한 문장 평가시스템과 비교하였다. 이를 통해 철자 및 문법의 오류율뿐만 아니라 표현난이도를 평가할 수 있는 자질들이 유용함을 확인할 수 있었다. 영어작문 문장의 수준평가를 위해서 국내 학생들의 토플 에세이 코퍼스를 수집하여 2,000문장을 추출하였고, 4명의 전문평가자들을 통해 6단계로 평가하여 학습 및 테스트 세트를 구성하였다. 성능척도로는 정확률과 재현율을 사용하였으며, 제안하는 방법으로 67.3%의 정확률과 67.1%의 재현율을 보였다.

The Impact of Descriptor Characteristics on the Accuracy of Neural Network Potentials for Predicting Material Properties (Descriptor 특성이 신경망포텐셜의 소재 물성 예측 정확도에 미치는 영향에 관한 연구)

  • Jeeyoung Kim
    • The Journal of Korea Institute of Information, Electronics, and Communication Technology
    • /
    • v.16 no.6
    • /
    • pp.378-384
    • /
    • 2023
  • In this study, we aim to derive the descriptor vector conditions that can simultaneously achieve the efficiency and accuracy of artificial Neural Network Potentials (NNP). The material system selected is silicon, a highly applicable material in various industries. Atomic structure-dependent energy data for training artificial neural networks were generated through density functional theory calculations. Behler-Parrinello type atomic-centered symmetric functions were employed as descriptors, and various length vector NNPs were generated. These NNPs were applied to reproduce the structure and mechanical properties of silicon materials in molecular dynamics simulations. In our findings, the minimum vector length for achieving both learning and computational efficiency while maintaining property reproducibility is approximately 50. It was also observed that, for the same conditions, incorporating more angle-dependent symmetric functions into the descriptor vector, could enhance the accuracy of NNP. Our results can provide guidelines for optimizing the conditions of descriptor vectors to achieve both efficiency and accuracy of NNP, simultaneously.

Compensation of Correlated Color Temperature of Gray Scale in LCD (LCD의 Gray Scale 상관 색온도 보정)

  • 구병준;이상훈;정재영;한찬호;이건일;송규익
    • Proceedings of the IEEK Conference
    • /
    • 2000.09a
    • /
    • pp.705-708
    • /
    • 2000
  • 일반적인 LCD의 색 재현 특성은 입력 디지털 값이 낮을수록 gray scale의 상관색온도가 상승하여 정확한 색 재현이 불가능하다. 본 논문에서는 LCD의 입력 디지털 값의 변화에 따른 특성을 조사하고, luminance, contrast 비 등의 특성에 열화없이 gray scale의 입력 잘 변화에 따른 상관색온도의 변화를 보정하기 위해서 입력 디지털 값을 조정하는 새로운 LUT를 제안하였다.

  • PDF

해양사고 원인규명 통합 분석 시뮬레이션 시스템

  • Lee, Sang-Gap
    • Proceedings of the Korean Institute of Navigation and Port Research Conference
    • /
    • 2016.05a
    • /
    • pp.50-54
    • /
    • 2016
  • 해양사고 원인규명 통합 분석 시뮬레이션 시스템은 해양사고가 발생하는 과정(선회)을 포함하여 충돌, 좌초, 접촉, 전복, 침수 및 침몰 등의 해양사고를 유체-구조 연성 해석기법의 고도 정밀 M&S 시스템을 사용하여 과학적으로 해양사고의 원인을 분석하고 사고의 손상과정을 체계적으로 재현할 수 있는 시스템이다. 해양사고는 육상과 공중에서 발생하는 자동차와 비행기 등의 충돌이나 추락사고와는 달리 공기의 밀도보다 천배의 물에서 발생하므로 물에서 부양되고, 운동하고, 선내에 물이 침수되고, 운항 중일 때 파도도 생성시키고, 두 물체가 근접할 경우에는 압력이 압착되고, 두 물체가 스쳐 지나거나 안벽이나 해저를 근접하여 운항할 경우에는 압력이 저하되는 등 물에서의 연성효과(interface effect)를 충분히 고려하여 재현할 수 있어야 정확하게 해양사고의 원인을 규명 및 분석할 수 있을 것이다. 또한 황천에서 발생하는 해양사고일 경우에는 강한 조루, 강풍 및 해일성 파도 등을 불규칙 스펙트럼을 사용하여 정확히 구현하여야 황천에서 발생하는 해양사고의 원인을 충분히 분석할 수 있을 것이다. 이러한 해양사고 통합 분석 시뮬레이션 시스템을 이용하여 과학적이고 정확한 해양사고의 원인규명 및 분석으로 심판의 획기적인 신뢰 구축과 심판 지연에 따른 사회적 비용을 최소화하고, 해양사고의 원인과 과실 책임, 나아가서 사고 재발방지 대책수립 등에도 활용하는데도 크게 기여할 것으로 사료된다.

  • PDF