• 제목/요약/키워드: 유사어절 비교

검색결과 14건 처리시간 0.017초

새 자료 <정향전>의 자료적 특성과 가치 (The Status and the Value of a New Text, Chunghyangjeon(정향전) that Professor Park Sunho Possesses)

  • 장시광
    • 동양고전연구
    • /
    • 제41호
    • /
    • pp.211-247
    • /
    • 2010
  • 이 글은 박순호 교수가 소장한 <정향전>의 이본을 분석하여 그 이본적 위상과 가치를 살피는 것을 목적으로 한다. 박순호본 <정향전>은 한 책 안에 한문본과 한글본이 같이 묶여 있다는 것이 특이하다. 박순호본 <정향전>은 서울의 장동에서, 한문본은 1934년에, 한글본은 1945년에 필사된 것으로 보이며, 천리대본과 비교할 때 한문 박본에는 생략과 축약, 추가 현상이 보이고, 선행 연구에서 천리대본을 선본(善本)이라고 주장한 바와는 달리 천리대본에는 오류가 잦고 오히려 한문 박본에 그러한 오류가 정정되어 있음을 발견할 수 있다. 비교 과정에서 드러난 결과 가운데 하나는 만송본이 천리대본을, 도남본이 만송본을 축약한 것이라는 선행 연구 역시 바로잡혀야 함을 알 수 있었다. 한문 박본은 천리대본보다는 만송본이나 도남본과 유사하고, 그 중에서도 만송본과 더욱 유사한 계열에 속한다. 한문본에는 양녕대군의 위선에 대한 표현이 약화되어 있는 반면에 양녕대군 개인의 부정적 성격은 부각되어 있다. 또 양녕대군의 심리 묘사는 약화되어 있고, 정향의 미모는 부각되어 있다. 한글본은 한문본을 축자 번역하는 것을 원칙으로 했으며, 미세하게 생략, 축약, 첨가, 변환의 현상이 보인다. 한글본에는 문호 혹은 문벌 의식이 가급적 보이지 않고, 양녕대군의 위선과 그의 부정적 성격을 드러내는 부분이 생략되어 있으며, 한시나 전고 등 한문학에 정통하지 않은 이가 보기에는 어려운 어절 등이 생략, 축약되어 있다. 박순호본 <정향전>이 지니는 가장 큰 가치는 한문본과 한글본이 합철되어 있다는 유통상의 특징이다. 이는 <정향전>의 다른 이본, 혹은 다른 고전소설의 유통 형태에서는 아직까지는 발견되지 않은 독특한 방식이다. 이러한 방식이 지니는 가장 큰 의의는 한문본의 향유자가 더 이상 정보의 독점을 꾀하지 않고 한문을 모르고 한글만을 아는 이들에게도 정보를 공유하려고 했다는 점이다.

영-한 병렬 코퍼스로부터 외래어 표기 사전의 자동 구축 (Automatic Construction of Foreign Word Transliteration Dictionary from English-Korean Parallel Corpus)

  • 이재성
    • 컴퓨터교육학회논문지
    • /
    • 제6권2호
    • /
    • pp.9-21
    • /
    • 2003
  • 본 논문에서는 한국어 번역문과 영어 원문으로 구성된 병렬 코퍼스로부터 자동으로 외래어 표기 사전을 구축하는 시스템을 제안한다. 구축 시스템은 첫 단계로 한국어 문서에서 명사를 추출하고, 두 번째 단계에서 추출된 명사 중 언어 모델에 근거하여 외래어만을 추출한 후, 마지막 세 번째 단계에서 확률적 정렬 방법을 이용하여 외래어에 대응되는 영어를 추출한다. 특히, 외래어는 한국어 어미나 조사가 붙어서 같이 쓰이기 때문에, 한국어 어절 내에서 정확하게 외래어 부분만을 분리하기 위해, 병렬 코퍼스 내에 존재하는 대응 영어 단어 정보를 활용하였다. 또, 문자체계가 다른 두 단어를 같은 문자로 변환하지 않고 직접 음운 유사도를 비교할 수 있도록 했다. 실험 결과, 성능은 전처리 단계인 한국어 미등록어 및 외래어 추정에 영향을 많이 받았고, 수작업으로 전처리를 한 모델 중 가장 성능이 높은 것은 재현률 85.4%, 정확률 91.0%를 보였고, 전 과정을 자동으로 한 모델중에서는 재현률 68.3%, 정확률 89.2%를 보였다.

  • PDF

한국어 음가를 한글 표기로 변환하는 표준규칙 제정 (Establishment of the Korean Standard Vocal Sound into Character Conversion Rule)

  • 이계영;임재걸
    • 전자공학회논문지CI
    • /
    • 제41권2호
    • /
    • pp.51-64
    • /
    • 2004
  • 표기 체계인 한글을 한국어 음가로 변환하는 음운변동 규칙을 역으로 적용하여, 한국어 음가를 한국어를 표기하는 문자 체계인 한글로 전환시키는 규칙을 고안하는 것이 본 연구의 목표이다. 제정된 규칙은 한국어 음성인식에 있어서 매우 귀중한 역할을 담당한다. 일반적인 음성인식 기법은 수회의 학습과정을 통하여 추출된 음성의 표준패턴과 인식 대상으로 입력된 음성을 비교하여 가장 유사한 패턴을 찾는 방법을 사용한다. 이 때 표준 음성패턴이 띄어쓰기 단위의 어절이라면 수백만 개의 표준 패턴이 수록되어야 하므로 표준패턴을 위한 방대한 데이터베이스의 구축은 물론 표준패턴과의 비교 회수도 너무 많아져서 실용화가 불가능하다. 이에 대한 대안인 음절 단위 인식의 경우는 인식된 음가가 실제의 한글 표기와 맞지 않으므로, 인식된 결과를 출력할 때에 실제의 한글표기로 변환해 주어야 하는 과제를 안게 된다. 이 과제를 해결하는 과정, 즉 일련의 한국어 음가들을 일련의 한글 표기 문자로 바꾸어 주는 과정에서는 본 논문에서 제안한 표준 한국어 음가 - 표기 문자 변환 규칙을 적용할 수 있을 것이다. 본 논문에서는 새롭게 제안된 표준 한글 음가-표기 문자 변환 규칙을 사용하여 한국어 음가를 한글 표기로 변환하는 시스템을 구현하였다. 그리고, 고안된 규칙의 무결성을 보이기 위하여 표준 발음규칙 30항을 반영하는 데이터 집합을 이용하여 구현된 시스템을 시험하였으며, 그 실험 결과를 제시한다.

대용량 데이터베이스를 이용한 한국어 운율 특성에 관한 연구 (A Prosodic Study of Korean Using a Large Database)

  • 김종진;이숙향
    • 한국음향학회지
    • /
    • 제24권2호
    • /
    • pp.117-126
    • /
    • 2005
  • 본 연구는 대용량 데이터베이스 분석을 통한 한국어의 운을 특성 규명을 시도하였다. 남녀 화자 1명씩 각각 낭독한 650개의 뉴스기사 문장 (총 1,300 개)은 분절음 레이블링과 운율 레이블링을 한 후, 각 운율단위의 성조유형과 크기, 상위운율단위의 크기와 하위 운율단위 수간의 상관관계, 그리고 강세구의 하강곡선과 상승곡선의 기울기와 F0 값에 대한 비교분석을 수행하였다. 운율단위의 지속시간, 어절수, 음절수와 하위 운율단위의 수는 화자뿐만 아니라 운율단위 위치에 따라서 차이를 보였으며 하위 운율단위의 수는 상위 운율단위의 음절수와 지속시간과 높은 상관관계를 보였다. 강세구 내의 하강곡선의 기울기는 강세구 음절수와 반비례 관계를 보였으며 강세구 첫 성조의 유형에 따라 기울기 값에 차이가 있었다. 이 차이는 고성조로 시작한 강세구 성조의 F0 상승과 성조 간 상승 폭의 차이로 설명할 수 있었다. 강세구 경계의 하강곡선은 일정하면서 강세구 내의 하강곡선에 비해 다소 급격한 기울기를 보였다. 강세구 내의 두 상승곡선은 유사한 기지값을 보였으나 강세구 시작 상승곡선의 F0 변화량이 끝 상승곡선의 F0 변화량보다 크게 나타났다. 그리고 하나의 상승곡선이 강세구를 이루는 L Ha의 경우에는 강세구의 음절수에 반비례 관계를 보였다.