• 제목/요약/키워드: 언어 근사

검색결과 42건 처리시간 0.022초

정보 입자에 근거한 개선된 언어적인 모델의 설계 (A Design of an Improved Linguistic Model based on Information Granules)

  • 한윤희;곽근창
    • 전자공학회논문지CI
    • /
    • 제47권3호
    • /
    • pp.76-82
    • /
    • 2010
  • 본 논문은 수치적인 입출력데이터로부터 언어적인 규칙을 생성시키기 위한 체계적인 접근방법으로써 정보입자(information granules)에 근거한 언어적인 모델(LM: Linguistic Model)을 발전시킨다. Pedrycz에 의해 소개된 언어적인 모델은 컨텍스트 기반 퍼지 클러스터링(CFC: Context-based Fuzzy Clustering)으로부터 얻어지는 퍼지 정보입자에 의해 수행되어지며, 이는 입력과 출력공간과 연관된 클러스터 된 데이터들의 동질성을 보존하도록 클러스터를 추정한다. 언어적인 모델의 효능성은 이전 연구에서 이미 증명되었음에도 불구하고 성능 측면에서 개선시킬 필요성이 있다. 따라서, 본 논문에서는 기존 언어적인 모델의 근사화와 일반화 성능을 모두 향상시키기 위해 언어적인 컨텍스트의 자동적인 생성, 바이어스항의 추가, 결론부 파라미터의 변형된 구조를 통해 이루어진다. 실험결과는 자동차 연료소비량 예측문제와 보스턴 housing 데이터를 통해 제안된 방법이 언어적인 모델뿐만 아니라 기존 방법들보다 우수함을 증명한다.

러프 집합을 이용한 색채 감성의 해석 (Rough Set Based Interpretation of Color Emotion)

  • 박은종;김순영;이준환
    • 한국감성과학회:학술대회논문집
    • /
    • 한국감성과학회 2007년도 춘계학술대회 및 국제감성 심포지엄
    • /
    • pp.109-113
    • /
    • 2007
  • 본 논문은 칼라 패턴의 감성 평가를 위해 러프 집합 이론이 효과적으로 사용될 수 있음을 보여준다. 우리는 주어진 랜덤 칼라 패턴을 보여주고 사람들로 하여금 감성 평가를 하게 하여 수집된 심리학적 실험 데이터를 기반으로 VPRS(Variable Precision Rough Set) 이론을 적용, 관련 규칙들을 추출하였다. 이러한 규칙들은 벽지 등의 컬러 패턴들에 대한 근사적인 감성 평가 뿐만 아니라, 이미지 속성 공간을 언어적 이미지 스케일로 표현된 감성 공간으로 매핑 시키기 위한 적응 퍼지 시스템 등의 초기 조건으로도 사용할 수도 있다.

  • PDF

구조적응 자기조직화 신경망 : 한글 문자인식에의 적용 (Structure-Adaptive Self-Organizing Neural Network : Application to Hangul Character Recognition)

  • 이경미;조성배;이일병
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1995년도 제7회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.137-142
    • /
    • 1995
  • 코호넨의 SOFM(Self-Organizing Feature Map)온 빠른 검증 학습이 가능하여 다층 퍼셉트론의 단점을 보완할 수 있는 패턴분류기로 부각되고 있다. 그러나 기본적으로 고정된 크기와 구조의 네트워크를 사용하기 때문에 실재 문제에 적용하기가 쉽지 않다는 문제가 있다. 본 논문에서는 패턴에 대한 사전 정보없이 복잡한 패턴공간을 적응적으로 분할하기 위해 구조적응되는 자기조직화 신경망을 소개하고 이를 인쇄체 한글 문자의 인식에 적용한 결과를 보여준다. 여기에서 제안하는 신경망은 SOFM의 각 셀이 좀더 자세한 SOFM으로 확장될 수 있도록하며, 확률분포가 0인 셀을 제거함으로써 패턴 공간에 보다 근사한 분류를 가능하게 한다. 실제로 이러한 방식이 한글과 같은 복잡한 분류 문제에서 어떻게 작동하는지 설명하고, 한글 완성형 2350자에 대해 실험한 결과를 보여준다.

  • PDF

확장된 음절 bigram을 이용한 자동 띄어쓰기 시스템 (Word Segmentation System Using Extended Syllable bigram)

  • 임동희;전영진;김형준;강승식
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2005년도 제17회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.189-193
    • /
    • 2005
  • 본 논문은 통계 기반 방법인 음절 bigram을 이용한 자동 띄어쓰기를 기본 방법으로 하고 경우의 수를 세분화한 확장된 음절 bigram을 이용한 공백 확률, 띄어쓰기 통계를 바탕으로 최종 띄어쓰기 임계치 차등 적용, 에러 사전 적용 3가지 방법을 추가로 사용하는 경우 기본적인 방법만을 쓴 경우보다 띄어쓰기 정확도가 향상된다는 것을 확인하였다. 그리고 해당 음절에 대한 bigram이 없는 경우 확장된 음절 unigram을 통해 근사적으로 계산해 데이터부족 문제를 개선하였다. 한국어 말뭉치와 중국어 말뭉치에 대한 실험을 통해 본 논문에서 제안하는 방법이 한국어 자동 띄어쓰기뿐만 아니라 중국어 단어 분리에 적용할 수 있다는 것도 확인하였다.

  • PDF

통계적 방법에 의한 후처리 (Postprocessing with statistical methods)

  • 박진우;이일병
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1994년도 제6회 한글 및 한국어정보처리 학술대회
    • /
    • pp.518-526
    • /
    • 1994
  • 본 논문에서는 통계적 방법을 이용한 후처리기를 설계하고, 구현하여 평가하였다. 통계적인 방법은 처리 속도보다는 공간 효율을 높임으로써 후처리의 성능을 높일 수 있다는 가정에서, 후처리의 성능을 향상시키기 위해서 다음의 3가지 방법을 제안한다. 첫째, 전이 확률에서 중복 표현되는 정보를 정의하고, 제거할 수 있는 방법을 제안한다. 둘째, 정수인 순위값으로부터 실수인 전이 확률의 근사값을 추정해 냄으로써 공간 효율을 높일 수 있는 방법을 제안한다. 셋째, 위의 두가지 방법을 복합적으로 적용하여 공간 효율을 높은 오류 탐지와 오류 교정 방법을 제안한다.

  • PDF

BERT를 활용한 한국어 지속가능경영 보고서의 제로샷 가독성 평가 (Zero-Shot Readability Assessment of Korean ESG Reports using BERT)

  • 손규진;윤나은;이가은
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2022년도 춘계학술발표대회
    • /
    • pp.456-459
    • /
    • 2022
  • 본 연구는 최근 자연어 인공지능 연구 동향에 발맞추어 사전 학습된 언어 인공지능을 활용한 의미론적 분석을 통해 국문 보고서의 가독성을 평가하는 방법론 두 가지를 제안한다. 연구진은 연구 과정에서 사전 학습된 언어 인공지능을 활용해 추가 학습 없이 문장을 임의의 벡터값으로 임베딩하고 이를 통해 1. 의미론적 복잡도 와 2. 내재적 감정 변동성 두 가지 지표를 추출한다. 나아가, 앞서 발견한 두 지표가 국문 보고서의 가독성과 정(+)의 상관관계에 있음을 확인하였다. 본 연구는 통사론적 분석과 레이블링 된 데이터에 크게 의존하던 기존의 가독성 평가 방법론으로 부터 탈피해, 별도의 학습 없이 기존 가독성 지표에 근사한다는 점에서 의미가 있다.

인공 신경망을 이용한 한국어 문장단위 운율 발생에 관한 연구 (A study on the Prosody Generation of Korean Sentences using Artificial Neural networks)

  • 이일구;민경중;강찬구;임운천
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1999년도 학술발표대회 논문집 제18권 2호
    • /
    • pp.105-108
    • /
    • 1999
  • TTS(Text-To-Speech) 시스템 합성음성의 자연감을 개선하기 위해 하나의 언어에 대해 존재하는 운율 법칙을 정확히 구현해야 한다. 존재하는 운율 법칙을 추출하기 위해서는 방대한 분량의 언어 자료 구축이 필요하다. 그러나 이 방법은 존재하는 운율 현상이 포함된 언어자료에 대해 완벽한 운율을 파악할 수 없으므로 합성음성의 질을 좋게 할 수 없다. 본 논문은 한국어 음성의 운율을 학습하기 위해 2개의 인공 신경망을 제안한다. 하나의 신경망으로 문장의 각 음소에 대한 피치 변화를 학습시키는 것이며, 다른 하나는 에너지 변화를 학습하도록 하였다. 신경망은 BP 신경망을 이용하며 11개의 음소를 나타내기 위해 11개의 입력과, 중간 음소의 피치와 에너지 변화곡선을 근사하는 다항식 계수를 출력하도록 하였다. 신경망시스템의 학습과 평가에 앞서, 음성학적 균형잡힌 고립단어를 기반으로 의미있는 문장을 구성하였다. 문장을 남자 화자로 하여금 읽게 하고 녹음하여 음성 DB를 구축하였다. 음성 DB에 대해 각 음소의 운율 정보를 수집하여 신경망에 맞는 목표 패턴과 훈련 패턴을 작성하였다. 이 목표 패턴은 회귀분석을 통한 추세선을 이용해 피치와 에너지에 대한 2차 다항식계수로 구성하였다. 본 논문은 목표패턴에 맞는 신경망을 학습시켜 좋은 결과를 얻었다.

  • PDF

Esterel에서 근사-제어 흐름그래프의 효율적인 생성 (Efficient Construction of Over-approximated CFG on Esterel)

  • 김철주;윤정한;서선애;최광무;한태숙
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제15권11호
    • /
    • pp.876-880
    • /
    • 2009
  • 프로그램에 대한 자료흐름분석(data flow analysis)를 수행하기 위해서는 입력된 프로그램에 대응하는 제어흐름그래프(control flow graph)가 필요하다. 본 논문에서는 동기(synchronous)식 절차(imperative)형 언어 중 하나인 Esterel로 작성된 프로그램에 대해서 단순하면서 입력 프로그램의 구조와 흡사한 형태로 표현되는 근사-제어흐름그래프(over-approximated CFG) 생성방법을 제안한다. 제안된 방법을 이용하면 병렬 제어흐름을 표현하는 부분에서 실행 불가능한 경우까지 포함할 수 있다. 그렇지만, 생성방법이 직관적이고, 실제 수행경로를 모두 포함하기 때문에 다른 분석을 수행하는데 매우 적차하다.

적응 학습 능력을 가진 SEJONG-NET (Adaptive SEJONG-NET)

  • 박혜영;이일병
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1995년도 제7회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.164-168
    • /
    • 1995
  • SEJONG-NET은 시각 문자패턴의 인식 과정을 설명 할 수 있는 적절한 패러다임을 제공하기 위해 척추동물의 시신경계 구조와 기능을 모방하여 만든 문자인식 모형이다. 초기에는 온라인 한글 인식을 위하여 설계되었으며, 이후 다양한 문자 집합이나 오프라인 한글 문자를 위한 모뎀들이 개발되었다. 현재까지 개발된 여러 SEJONG-NET 모델이 가지고 있는 문제점은 정직성이라고 할 수 있다. 즉, 설계 초기에 고려한 인식 대상 문자 집합과 문자 패턴에 대해서만 인식이 가능하고, 변형된 패턴을 기존의 패턴으로 근사화하여 해석하거나 새로운 패턴에 대하여 그것을 추가 학습하는 것이 불가능하다. 따라서 본 논문은 SEJONG-NET의 이러한 제약점을 해결하여 한글 인식 문제에 일반적으로 적용될 수 있도록 개선하는 것을 목적으로 한다. 이를 위해 상위층에서는 인간이 가지고 있는 문자에 대한 구조적인 지식을 표현하고 학습을 통해 추가적으로 습득할 수 있는 형태로 구현하였고, 하위층에서는 상위층에서 쓰이는 구조적인 지식을 표현하는데 적합한 특징을 추출해 낼 수 있도록 구현하였다. 특히 하위층에서는 인간의 초기 시각 피질에서 감지되는 특징들을 추출하도록 구현하여 사용되는 특징이 일반성을 가질 수 있도록 하였다. 이러한 방법을 기반으로 하여 본 논문에서는 변형된 패턴에 대한 적응 학습 능력을 가지며 인지과학적인 사실에 보다 충실하도록 개선된, 온라인 한글 인식을 위한 SEJONG-NET 모델을 제안한다.

  • PDF

이미지 퍼지화 기반 Canny 에지 검출기 설계에 관한 연구 (A Study on Canny Edge Detector Design Based on Image Fuzzification)

  • 박미영;김철원;박종훈
    • 한국정보통신학회논문지
    • /
    • 제15권9호
    • /
    • pp.1925-1931
    • /
    • 2011
  • 본 논문에서는 Canny 에지 검출 알고리즘의 핵심이라 할 수 있는 언어적인 애매한 개념인 "좋은 검출"과 "좋은 지역화" 문제를 퍼지 추론 방식을 통해 처리하는 접근방식을 제안하고, 그레이 스케일 이미지에 관해 퍼지 규칙 기반의 Canny 에지 검출기를 설계한다. 설계의 핵심은 화소들의 그레이 레벨들을 몇 가지의 언어적인 변수들로 분할한 다음에 퍼지 추론 규칙에 따라 편미분 계수들을 근사시키는데 있다. 이러한 접근방식은 기울기 및 기울기 변화에 따른 퍼지 제어 기법과 유사한 측면을 가진다. 이러한 작업을 바탕으로 퍼지 규칙 기반 Canny 에지 검출기를 구현하고, 결과들을 기존 방법과 비교한다. 특히, 제안된 접근 방식은 좁은 동적 범위의 그레이 레벨 이미지의 에지 검출 및 선명화에 있어서 장점을 가진다.