• 제목/요약/키워드: 자소분석

검색결과 41건 처리시간 0.024초

한글 파닉스 교육을 위한 초등 1-2학년 교과서 어휘 자소분석 (Textbook vocabulary analysis for Korean phonics program of 1st and 2nd graders)

  • 이다은;김혜지;신가영;설아영;배소영;김미배
    • 한국어정보학회:학술대회논문집
    • /
    • 한국어정보학회 2016년도 제28회 한글및한국어정보처리학술대회
    • /
    • pp.226-230
    • /
    • 2016
  • 본 연구는 초등 저학년 읽기부진아동을 위한 한글 파닉스 교육의 기반을 확립하고자 1-2학년 교과서 고빈도 어절 531개를 기반으로 자소 및 음운규칙을 분석하였다. 연구결과, 자소-음소 일치 어절을 기반으로 하였을 때 초성에서 50번 이상 나타난 자소는 /ㄱ/, /ㄹ/, /ㄴ/, /ㅅ/, /ㅎ/, /ㅈ/이다. 중성에서 50번 이상 나타난 자소는 /ㅏ/, /ㅣ/, /ㅗ/, /ㅡ/, /ㅜ/이다. 종성에서 50번 이상 나타난 자소는 /ㄹ/, /ㄴ/, /ㅇ/이다. 자소와 음소가 불일치 된 어절을 기반으로 하였을 때 가장 많이 출현하는 음운규칙은 연음화 규칙이었다. 본 연구결과를 바탕으로 교과서를 기반으로 한 한글 파닉스 교육에 유용하게 사용될 수 있을 것이다.

  • PDF

한글 파닉스 교육을 위한 초등 1-2학년 교과서 어휘 자소분석 (Textbook vocabulary analysis for Korean phonics program of 1st and 2nd graders)

  • 이다은;김혜지;신가영;설아영;배소영;김미배
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2016년도 제28회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.226-230
    • /
    • 2016
  • 본 연구는 초등 저학년 읽기부진아동을 위한 한글 파닉스 교육의 기반을 확립하고자 1-2학년 교과서 고빈도 어절 531개를 기반으로 자소 및 음운규칙을 분석하였다. 연구결과, 자소-음소 일치 어절을 기반으로 하였을 때 초성에서 50번 이상 나타난 자소는 /ㄱ/, /ㄹ/, /ㄴ/, /ㅅ/, /ㅎ/, /ㅈ/이다. 중성에서 50번 이상 나타난 자소는 /ㅏ/, /ㅣ/, /ㅗ/, /ㅡ/, /ㅜ/이다. 종성에서 50번 이상 나타난 자소는 /ㄹ/, /ㄴ/, /ㅇ/이다. 자소와 음소가 불일치 된 어절을 기반으로 하였을 때 가장 많이 출현하는 음운규칙은 연음화 규칙이었다. 본 연구결과를 바탕으로 교과서를 기반으로 한 한글 파닉스 교육에 유용하게 사용될 수 있을 것이다.

  • PDF

한국어 자소 음가 분류에 관한 연구 (A Study on the Korean Grapheme Phonetic Value Classification)

  • 유승덕;김학진;김순협
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 2001년도 추계학술발표대회 논문집 제20권 2호
    • /
    • pp.89-92
    • /
    • 2001
  • 본 논문에서는 한국어 대용량 음성인식 시스템의 기초가 되는 자소(grapheme)가 지니는 음가를 분류하였다. 한국어 자소를 음성-음운학적으로 조음 위치와 방법에 따라 분류하여, 그 음가 분석에 관한 연구와 함께 한국어 음성인식에서 앞으로 많이 논의될 청음음성학(auditory phonetics)에 대하여 연구하였다. 한국어는 발음상의 구조와 특성에 따라 음소 분리가 가능하여 초성, 중성, 종성 자소로 나눌 수 있다. 본 논문에서 초성은 자음음소 18개, 중성은 모음 음소(단모음, 이중모음) 17개, 그리고 'ㅅ' 추가 8종성체계의 자음음소로 하였다. 청음음성학적 PLU(Phoneme Like Unit)의 구분 근거는 우리가 맞춤법 표기에서 주로 많이 틀리는 자소(특히, 모음)는 그 음가가 유사한 것으로 판단을 하였으며, 그 유사음소를 기반으로 작성한 PLU는 자음에 'ㅅ' 종성을 추가하였고, 모음에 (ㅔ, ㅐ)를 하나로, (ㅒ, ㅖ)를 하나로, 그리고 모음(ㅚ, ㅙ, ㅞ)를 하나의 자소로 분류하였다. 혀의 위치와 조음 방법과 위치에 따라 분류한 자음과 모음의 자소를 HTK를 이용하여 HMM(Hidden Markov Model)의 자소 Clustering하여 그것의 음가를 찾는 결정트리를 검색하여 고립어인식과 핵심어 검출 시스템에 적용 실험한 결과 시스템의 성능이 향상되었다.

  • PDF

Multi-channel CNN을 이용한 한국어 감성분석 (Multi-channel CNN for Korean Sentiment Analysis)

  • 김민;변증현;이충희;이연수
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2018년도 제30회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.79-83
    • /
    • 2018
  • 본 논문은 한국어 문장의 형태소, 음절, 자소를 동시에 각자 다른 합성곱층을 통과시켜 문장의 감성을 분류하는 Multi-channel CNN을 제안한다. 오타를 포함하는 구어체 문장들의 경우에 형태소 기반 CNN으로 추출 할 수 없는 특징들을 음절이나 자소에서 추출 할 수 있다. 한국어 감성분석에 형태소 기반 CNN이 많이 쓰이지만, 본 논문의 Multi-channel CNN 모델은 형태소, 음절, 자소를 동시에 고려하여 더 정확하게 문장의 감성을 분류한다. 본 논문이 제안하는 모델이 형태소 기반 CNN보다 야구 댓글 데이터에서는 약 4.8%, 영화 리뷰 데이터에서는 약 1.3% 더 정확하게 문장의 감성을 분류하였다.

  • PDF

자소 접촉특성 분석에 의한 한글패턴의 부분분리 및 인식 (Separation of Subpatern and Recognition of Hanguel Patterns by Analysis of Feature of Contacting Phonemes)

  • 고찬;진용옥
    • 한국통신학회논문지
    • /
    • 제15권7호
    • /
    • pp.618-627
    • /
    • 1990
  • 본 논문은 한글문자 인식을 위하여 새로운 접촉소자의 분리 및 자획연결 특징추출 알고리즘을 제안하였다. 자소 접촉특징을 분석하여 자소접촉 형태별로 분류하고 자획연결특징 추출, 접촉자소의 분리, 문자형식 분류를 시행한다. 분리된 자소로부터 설정된 표준패턴으로 정규화하고 자소별 굴곡특징의 상대위치값으로 부터의 특징을 입력패턴으로 신경망을 이용하여 인식 실험을 하였다. 여기에서의 학습은 BEP 알고리즘을 이용하였다. 접촉자소의 분리, 형식분리, 자획연결특징 추출 및 인식 실험에서 제안된 알고리즘이 좋은 결과를 나타내었다.

  • PDF

상호활성화모형을 이용한 한글에서의 글자우월효과 특성 분석 (Analysis of Character Superiority Effects of Korean characters using Interactive Activation Model)

  • 박창수;방승양
    • 인지과학
    • /
    • 제11권2호
    • /
    • pp.69-78
    • /
    • 2000
  • 상호활성화모형은 원래 영어의 단어우월효과를 설명하기 위해서 개발되었다. 한글에서도 영어에서의 단어우월효과와 비슷한 현상이 존재함이 알려져 있다. 즉, 한글의 자소가 글자의 한 구성요소로 나타났을때가 자소 단독으로 나타났을 때보다 더 잘 인식된다는 것이다. 우리의 한글에서의 글자우월효과를 설명하기 위해서 기존의 상호활성화모형을 수정하였다. 그러나 한글에서의 글자우월효과는 글자의 유형에 따라 그 정도가 다양하게 나타난다는 사실이 보고된 바 있다. 특히 글자내에서 한 자소가 다른 자소들 사이에 둘러 쌓여 있을 때는 해당 자소가 글자의 맥락에 있다고 하더라도 인지하기 어렵다는 사실이 알려져 있다. 한글의 경우, 글자가 각 구성요소(자소)의 이차원적 구성이기 때문에 이런 특이한 현상이 발생한다고 추측해 볼 수 있다. 우리는 글자의 이차원적 형태에 중점을 두어 계산되어진 입력 자극의 가중치를 기존의 상호활성화모형에 도입하여 이러한 현상을 설명할 수 있었다.

  • PDF

Multi-channel과 Densely Connected Convolution Networks을 이용한 한국어 감성분석 (Korean Sentiment Analysis using Multi-channel and Densely Connected Convolution Networks)

  • 윤민영;구민재;이병래
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2019년도 춘계학술발표대회
    • /
    • pp.447-450
    • /
    • 2019
  • 본 논문은 한국어 문장의 감성 분류를 위해 문장의 형태소, 음절, 자소를 입력으로 하는 합성곱층과 DenseNet 을 적용한 Text Multi-channel DenseNet 모델을 제안한다. 맞춤법 오류, 음소나 음절의 축약과 탈락, 은어나 비속어의 남용, 의태어 사용 등 문법적 규칙에 어긋나는 다양한 표현으로 인해 단어 기반 CNN 으로 추출 할 수 없는 특징들을 음절이나 자소에서 추출 할 수 있다. 한국어 감성분석에 형태소 기반 CNN 이 많이 쓰이고 있으나, 본 논문에서 제안한 Text Multi-channel DenseNet 모델은 형태소, 음절, 자소를 동시에 고려하고, DenseNet 에 정보를 밀집 전달하여 문장의 감성 분류의 정확도를 개선하였다. 네이버 영화 리뷰 데이터를 대상으로 실험한 결과 제안 모델은 85.96%의 정확도를 보여 Multi-channel CNN 에 비해 1.45% 더 정확하게 문장의 감성을 분류하였다.

한글 인식에 있어서의 자소추출 (A Method of the Extraction of Phonemes in Hangeul Recognition)

  • 최병욱
    • 대한전자공학회논문지
    • /
    • 제18권2호
    • /
    • pp.36-43
    • /
    • 1981
  • 본 논문은 한글 인식에 있어서 문제점으로 되어 있는 조합문자에서의 자소추출 방법의 제안에 관한 것이다. 한글의 구성원리에 입각하여 자소의 단치정보와 Stroke의 방향성을 고려하여 Top-down 적으로 한글의 구조를 분석하고, 이에 따른 3단계 처리에 의하여 자소가 순차적으로 추출되는 과정을 보였다. 일상 활동에서 사용되고 있는 문자중, 677자에 대한 자소의 추출실험결과, 96 %의 추출률을 얻어, 본 방식의 유효성을 확인할 수 있었다.

  • PDF

런 길이를 이용한 필기체 한글 자획의 방향 성분 추출 (Extraction of Directional Strokes in Handwritten Hangul using Runlength)

  • 정민철
    • 한국산학기술학회:학술대회논문집
    • /
    • 한국산학기술학회 2006년도 춘계학술발표논문집
    • /
    • pp.485-488
    • /
    • 2006
  • 본 논문은 수평 런 길이와 수직 런 길이를 이용해 필기체 한글 문자의 자획 두께를 구하고, 그 자획 두께를 이용해 입력 문자의 자소를 수평 성분과 수직 성분으로 분리하는 기술을 제안한다. 수평 성분과 수직 성분 분석은 각도와 관계없이 자획 두께와 수평 런 길이의 변화량만을 이용해 구한다. 분리된 수평 성분 자획과 수직 성분 자획은 오프라인 필기체 한글 인식을 위한 요소 기술 중 하나인 자소 분리를 위한 특징이 된다.

  • PDF

저해상도 팩스 표지 영상의 구조 분석 (Structure Analysis of Low Contrast Fax Cover Pages)

  • 임영규;이성환
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1998년도 가을 학술발표논문집 Vol.25 No.2 (2)
    • /
    • pp.387-389
    • /
    • 1998
  • 팩스가 보편적인 정보 전달 매체로 자리잡게 됨에 따라 기업체나 관공서 뿐만 아니라 가정에서도 많은 작업이 팩스를 통해 이루어지게 되었다. 이에 따라 팩스 문서의 분석 및 인식의 필요성이 증가하게 되었다. 팩스 문서는 표지와 내용이 두 부분으로 이루어지는데 팩스 문서의 처리를 위해서는 성명, 주소등을 포함하는 팩스 표지의 분석이 중요하다. 따라서 본 논문에서는 팩스 표지 영상의 구조 분석 방법을 제안한다. 제안한 팩스 표지 구조 분석 방법은 팩스 표지가 헤드, 송/수신 정보, 메시지로 구성된다는 점에 착안하여 위치 정보를 이용한 영역 분리에 중점을 두었으며, 팩스 표지의 종류를 몇 가지로 분류하여 도표 형태의 팩스 표지도 분석이 가능하도록 하였다. 분자 인식에서는 팩스 문자 인식에 우수한 성능을 보이고 있는 자소 기반 한글 문자 인식기를 사용하였다. 또한 한글의 자소 모델에 기반한 후처리 방법을 개발하여 인식 오류를 교정하였다.

  • PDF