• 제목/요약/키워드: 자소분석

검색결과 41건 처리시간 0.02초

후기 한국어-영어 이중언어화자의 자소-음소 변환 규칙에 따른 영어 규칙성 효과 (Grapheme-to-Phoneme Conversion Regularity Effects among Late Korean-English Bilinguals)

  • 김다희;백연지;류재희;남기춘
    • 인지과학
    • /
    • 제26권3호
    • /
    • pp.323-355
    • /
    • 2015
  • 후기 한국어-영어 이중언어화자의 자소-음소 변환규칙(grapheme to phoneme conversion rule, GPC 규칙)에 따른 영어 규칙성 효과(regularity effect)가 단어수준과 하위단어수준에서 나타나는지 알아보기 위해 단어명명과제, 각운판단과제, 음소제거과제를 진행하였다. 전체 단어수준(whole word level)에서의 규칙 양상을 살펴보기 위해, [1] 영어단어명명과제(English word naming task)를 사용하였고, 단어 단위보다 하위 단계에서의 규칙성 효과를 알아보기 위해 [2] 라임판단 과제(rhyme judgement task)와 음소수준(phoneme level)에서의 과제인 [3] 음소탈락과제(phoneme deletion task)를 사용하였다. 실험 참가자들은 세 종류의 과제를 모두 수행하였고, 총 43명의 후기 이중언어화자가 실험에 참가하였다. 실험결과, 세 과제 모두에서 규칙성 효과가 나타나 한국어-영어 이중언어화자가 영어(L2) 단어 처리 시 GPC 규칙을 적극적으로 활용하고 있다는 사실을 확인하였다. 사후분석으로써 세 과제 사이의 상관분석을 진행한 결과, 단어명명과제와 라임판단과제 간 상관이 가장 높게 나타났다. 비록 영어 모국어 화자의 이전 연구결과와는 달리 라임판단과제와 단어읽기과제 간 상관이 높게 나타났지만, 이는 실험 참가자의 L2 능숙도가 모국어화자만큼 높지 않았기 때문인 것으로 보인다. 본 연구는 후기 한국어-영어 이중언어화자가 영어 GPC 규칙을 사용하여 영어단어읽기 처리를 하고 있음을 확인하였다.

부분 분석 결과를 공유하는 한국어 형태소 분석 (Korean Morphological Analysis Sharing Partial Analyses)

  • 이상호
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1994년도 제11회 음성통신 및 신호처리 워크샵 논문집 (SCAS 11권 1호)
    • /
    • pp.75-79
    • /
    • 1994
  • 한국어 어절의 모든 가능한 형태소 분석 결과는 형태소 격자 구조로 대응된다. 즉, 형태소 분석과정은 형태소 격자 구조를 만드는 과정과 동일하다고 말할 수 있다. 기존의 방법들은 여러개의 가능한 분석 결과에 중복되는 형태소들을 그대로 저장하여 자료 관리의 비효율성이 있었다. 본 논문에서 설명하는 형태소 분석기는 형태소 분석의 중간 결과를 공유하여, 자료의 중복 저장을 피했고, 모든 가능한 형태소 분석 결과를 형태소 격자 구조의 가능한 모든 경로로 대응하였다. 한편, 형태소 배열 규칙은 품사 태깅된 말뭉치로부터 자동으로 추출되었다. 또한, 사전도 품사 태깅된 말뭉치로부터 자동으로 구축되었으며, 굴절된 형태소는 등록되지 않는다. 그러나 불규칙 및 축약 현상에 관한 정보는 수동으로 추가되었다. 불규칙 및 축약 현상의 발생 가능 위치는 한글 자소 패턴에 의해서 찾아지고, 이들 현상의 처리는 절차적인 방법에 의해 해결되었다.

  • PDF

컴퓨터모의실험에 의한 자판 배열의 성능 평가 (Evaluation of Different Keyboards through Computer Simulation)

  • 정승훈;박진우;이일병
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1991년도 제3회 한글 및 한국어정보처리 학술대회
    • /
    • pp.99-117
    • /
    • 1991
  • 본 연구에서는 자판배열의 과학적인 비교분석이 필요하다는 인식을 바탕으로 자판배열과 운지법에 따라 변하는 운지거리, 글쇠의 타수 및 연타수의 관점에서 KSC 5715-2벌식자판, 공병우 390-3벌식자판 및 ISO에 제출된 북한의 표준한글자판의 성능을 평가하였다. 그 구체적인 방법으로는 타자모의실험기를 작성하여 입력하는 글의 종류에 따른 각 자판배열의 성능을 비교분석하였다. 그리고 컴퓨터 모의 실험기를 작성했으므로 언급된 자판뿐만이 아닌 다른 자판도 그 자판의 자소배열과 운지법만을 추가 입력함으로써 같은 조건하에서 비교 분석할 수 있다.

  • PDF

소형 정보통신 단말기를 위한 한글 입력 방법 (Hangul Input Method for Small Electronic Networking Devices)

  • 강승식;한광수
    • 한국멀티미디어학회논문지
    • /
    • 제8권2호
    • /
    • pp.287-295
    • /
    • 2005
  • 정보통신 단말기에서 한글을 쉽고 빠르게 입력 할 수 있는 방법을 모색하기 위해 한글 자음과 모음의 표기법 및 조합 원리를 분석하여 한글 자모 집합보다 작은 크기의 기본 자모 집합으로 한글을 입력하는 방법을 제시하였다 그 결과로 자음의 경우 기본 자음과 기능키를 이용하여 자음들을 조합하고, 모음은 8개의 기본모음으로부터 모음의 조합 원리 및 가획 원리에 의해 입력키가 할당되지 않은 모음을 조합하는 방식을 제안하였다. 특히, 유사 자소간의 에러 발생시에 지움 버튼을 사용하는 불편함을 해소하기 위해 자소간의 전환이 가능한 오류 수정 방식을 도입하였을 뿐만 아니라, 사용자가 입력 방식에 쉽게 익숙해질 수 있도록 입력방식을 다양화함으로써 사용자 편의 성 을 추구하였다 기존의 천지인, 나랏글 방식과 비교했을 때 사용자 편의성과 입력의 신속성, 에러 수정의 용이성 측면에서 매우 효율적임을 확인하였다.

  • PDF

모바일 영상에서 한글 문자의 기하학적 특징을 이용한 에지 기반 텍스트 검출 (Edge-based Text Localization Using Geometrical Features of Hangul Character in Mobile Images)

  • 박종천;오명관;전병민
    • 한국산학기술학회:학술대회논문집
    • /
    • 한국산학기술학회 2012년도 춘계학술논문집 2부
    • /
    • pp.820-822
    • /
    • 2012
  • 최근 모바일 기기의 보급이 일반화됨으로서 모바일 영상을 다루는 많은 응용프로그램이 개발되고 있다. 모바일 영상을 분석하여 정보를 추출한 결과를 인터넷 검색의 키워드로 연계함으로서 직관적인 멀티미디어 검색을 가능하도록 한다. 본 연구는 모바일 영상에 포함된 한글 문자영역을 검출하는 방법을 제안하였다. 한글 문자의 기하학적인 특징을 추출하고 이를 분석함으로서 후보 한글문자 영역을 검출하고, 검출된 후보 문자영역을 한글 자소 병합 알고리즘을 이용하여 병합한다. 그리고 후보 문자 영역을 한글 6가지 한글 문자 유형 특징을 이용하여 한글 문자 영역을 판별함으로서 최종적인 한글 문자영역을 검출한다. 실험결과, 문자영역 검출률의 성능 평가 요소로서 재현률이 향상됨을 알 수 있었다.

  • PDF

우편번호 체계에서 사용중인 한글의 빈도수 조사 (A Frequency Measure of Hangul in Korean Zip Code)

  • 김민기;권영빈
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1993년도 제5회 한글 및 한국어정보처리 학술대회
    • /
    • pp.295-301
    • /
    • 1993
  • 제약이 없이 자유롭게 쓴 오프라인 필기체 한글을 인식하는 문제는 응용분야에 따른 도메인의 정보를 이용함으로써 보다 쉽게 접근할 수 있다. 본 연구는 오프라인 필기체 한글 인식을 위한 한 도메인으로 우편봉투를 대상으로 하였을 때, 우편번호가 할당된 지명과 건물명을 대상으로 글자의 종류와 빈도수를 통계 분석하였다. 분석 결과 가능한 한글 조합 11,172자중 403자만이 쓰이고 있음을 알았다. 이러한 정보는 자소 분할이 어려운 오프라인 필기체 한글 인식에 있어, 문자 단위 정합을 사용했을 때 인식속도 및 인식률 향상에 기여 할 것으로 생각된다.

  • PDF

한글 글립의 조형적 분석에 기반한 중간 폰트 생성 (Intermediate Font Generation based on Shape Analysis of Hangul Glyph)

  • 구상옥;정순기
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제36권4호
    • /
    • pp.311-325
    • /
    • 2009
  • 본 논문에서는 외곽선 폰트의 한글 글립을 분석하고 서로 다른 두 폰트에 대한 중간 폰트를 생성하는 방법을 제안한다. 한글 글립은 글자, 자소, 획과 같이 계층적으로 표현되고 분석된다. 글립 분석 결과를 바탕으로 같은 글자를 나타내는 서로 다른 두 글립에 대해서 모핑을 수행함으로써 여러 개의 중간글립들을 얻는다. 자연스러운 글립 외곽선 모핑을 위해 스트링의 가중 평균(weighted-mean)에 의한 커브모핑 방법을 사용하며, 위상이 다른 글립 간 변환을 위한 네 가지 연산을 제공한다. 제안된 한글 글립 모핑 방법은 기존의 폰트 또는 손글씨로 부터 새로운 폰트를 생성하는 데 사용될 수 있다.

온라인 흘림체 한글 인식을 위한 곡률획 모델링 기법 (Curvature stroke modeling for the recognition of on-line cursive korean characters)

  • 전병환;김무영;김창수;박강령;김재희
    • 전자공학회논문지B
    • /
    • 제33B권11호
    • /
    • pp.140-149
    • /
    • 1996
  • 흘림체 필기 문자는 문자의 가능한 한도 펜의 움직임을 줄이려는 경제성의 원칙에서 비롯된다. 즉, 다음 획을 쓰기 위해 이동할 때 펜을 들지 않거나, 아예 이동을 생략하거나, 또는 연결된 두 획이 서로 닮아가면서 필기하기 쉬운 단순간 형태로 변화한다. 이러한 변화로 인해, 획이나 자소의 형태가 달라질 뿐만 아니라, 획간이나 자소간의 구분이 매우 어려워진다. 따라서 흘림체의 효과적인 인식을 위해서는 획이나 자소의 정확한 분할에 의존하지 않으면서, 일정한 단위로 분할하여 매칭할 수 있는 방법이 필요하다. 이 연구에서는 구조적인 형태의 단위로 분할하고 매칭하는 '곡률획 모델링 방법(curvature stroke modeling method)'을 제안한다. 곡률획(curvature stroke)은 필기의 회전 방향이 바뀌지 않는 부분획으로 정의되며, 곡률에 따라 선분, 호, 원 등의 형태를 갖는다. 흘려 써진 입력 획들을 곡률획의 나열로 변환하기 위해서는, 필기의 회전을 변화시키는 곳, 급격한 방향 변화를 일으키는 곳, 그리고 지나친 회전을 일으키는 곳 등을 분할한다. 각 참조 자소는 정자체로 입력하여 분할 과정에 의해 생성된 곡률획의 나열로 저장되어 있으며, 인식중에 융합과정을 수행함으로써 매칭을 위한 다양한 곡률획의 나열을 만들어낸다. 이때, 가상 획이 필기되거나 생략될 가능성도 고려한다. 인식의 기본 단위로 곡률획을 사용함으로써, 입력 문자의 불필요한 분할점들을 효과적으로 줄일 수 있고, 또한 자소간의 연결점을 찾기 어려운 경우에도 인접한 두 자소에 걸치는 참조 곡률획을 생성해내기 때문에 정확한 매칭이 가능해진다. 실험 결과, 83.60%의 제 1후보 인식률과 0.99초/자(CPU 클럭: 66MHz)의 처리 시간을 보였다./atom으로 추출되었다. 한편 별도의 추가적인 공정없이 일반적인 에피 성장법을 사용하여 고농도로 붕소가 도핑된 실리콘층 위에 부정합 전위가 없는 에피 실리콘을 성장시켰으며, 이 에피 실리콘의 결정성은 매우 양호한 것으로 밝혀졌다. 또 부정합 전위가 없는 에피 실리콘에 n+/p 게이트 다이오드를 제작하고 그 전압-전류 특성을 측정한 결과 5V의 역 바이어스에서 0.6nA/$cm^{2}$의 작은 누설 전류값을 나타내었다.이었다 5. 쌀의 알칼리 붕괴도는 밀양 맥후작산미가 가장 높았고 호남평야지산미가 가장 낮았는데 비해 아밀로그래프의 호화개시온도는 수원과 이리산미가 가장 낮았던 반면 밀양산미가 가장 높았다. 강하점도는 밀양산미가 가장 낮았고 다음이 이천산미가 낮았던데 비해 계화 및 이리산미가 가장 높았으며 치반점도는 이와 정반대의 경향을 나타내었다. 밥의 점성 /경도비율은 지역간 차이가 유의하지는 않았으나 남부평야산미가 중부평야산미에 비해 다소 떨어지는 경향이었다. 6. 식미와 관련이 있는 쌀 외관품질 및 이화학적 특성을 이용한 주성분 분석에서 전정보의 약 59% 설명이 가능한 제 1 및 제 2 주성분치상의 7개 품종별 6개 산지미의 분포로 보아 품종에 따라서 산지 반응이 달랐는데 대체로 자포니카와 통일형 품종군간 구분과 밀양, 중부평야 및 호남평야의 세 산지간 구분이 가능하였다. 산지내 품종간 미질변이는 남양간척지와 이리산미가 비교적 작았는데 수원산미는 이천과 남양산미의 미질변이를, 계화산미는 이리산미의 미질변이를 거의 포괄하였다.는 산불위험지역의 격자점(15km)내에 최소한 1대의 AWS 설치방안을 제시하였지만, 금후에는 15km내에서도 능선, 계곡 등 구체적인 위치확정을 위한 선행연구가 실시되어야할

  • PDF

철자오류의 통계자료에 근거한 철자오류 교정시스템 (A Spelling Correction System Based on Statistical Data of Spelling Errors)

  • 임한규;김응모
    • 한국정보처리학회논문지
    • /
    • 제2권6호
    • /
    • pp.839-846
    • /
    • 1995
  • 본 논문에서는 우리가 실제 문서 편집기에서 범하는 철자 오류를 수집하고 분석 하여, 이러한 자료를 근거로 철자 오류를 교정할 수 있게 후보를 제시하는 시스템을 구축하였다. 오류가 발견된 어절에서, 각 음절의 후보를 생성함에 있어서 자소별/음절 별 빈도수를 고려하여 개수를 최소화했으며, 따라서 후보 어절의 개수도 최소화할 수 있었다. 후보 어절의 개수는 평균 3.1개에서 8개였으며, 제시된 후보 어절 중에는 맞는 어절이 62.1% 포함되어져 있었다.

  • PDF

언어 모델 다중 학습을 이용한 한국어 개체명 인식 (Korean Named Entity Recognition using Joint Learning with Language Model)

  • 김병재;박찬민;최윤영;권명준;서정연
    • 한국어정보학회:학술대회논문집
    • /
    • 한국어정보학회 2017년도 제29회 한글및한국어정보처리학술대회
    • /
    • pp.333-337
    • /
    • 2017
  • 본 논문에서는 개체명 인식과 언어 모델의 다중 학습을 이용한 한국어 개체명 인식 방법을 제안한다. 다중 학습은 1 개의 모델에서 2 개 이상의 작업을 동시에 분석하여 성능 향상을 기대할 수 있는 방법이지만, 이를 적용하기 위해서 말뭉치에 각 작업에 해당하는 태그가 부착되어야 하는 문제가 있다. 본 논문에서는 추가적인 태그 부착 없이 정보를 획득할 수 있는 언어 모델을 개체명 인식 작업과 결합하여 성능 향상을 이루고자 한다. 또한 단순한 형태소 입력의 한계를 극복하기 위해 입력 표상을 자소 및 형태소 품사의 임베딩으로 확장하였다. 기계 학습 방법은 순차적 레이블링에서 높은 성능을 제공하는 Bi-directional LSTM CRF 모델을 사용하였고, 실험 결과 언어 모델이 개체명 인식의 오류를 효과적으로 개선함을 확인하였다.

  • PDF