• 제목/요약/키워드: Inflected Words

검색결과 8건 처리시간 0.017초

3세에서 8세 아동의 용언 발달 연구 (A Study on the Development of Inflected Words of Korean based on the analysis of 3 to 8 year-old Children's speech)

  • 최은아;신지영;김수진
    • 대한음성학회:학술대회논문집
    • /
    • 대한음성학회 2003년도 10월 학술대회지
    • /
    • pp.89-93
    • /
    • 2003
  • The aim of this paper is to investigate the development of inflected words of Korean based on the analysis of 3 to 8 year-old children's spontaneous speech. For this purpose, the authors transcribe the spontaneous speech of 10 Korean children for each age and classified inflected word. The result of the analysis is as follows : $\circled1$ In the verbs simple words are occupied 62%, derivative words 18% and complex words 20%. In the adjectives simple words are 82%, derivative words 7% and complex words 11%. $\circled2$ The children's getting older, derivative and complex words are increased, in spite of simple words are reduced. $\circled3$ 4 year-old children get to start the ability of word formation and then since the children become 8 year-old, the children complete that ability almost all we think.

  • PDF

인접 단어들의 접속정보를 이용한 일한 기계번역 시스템 (Japanese-Korean Machine Translation System Using Connection Forms of Neighboring Words)

  • 김정인
    • 한국멀티미디어학회논문지
    • /
    • 제7권7호
    • /
    • pp.998-1008
    • /
    • 2004
  • 일본어와 한국어는 문법적으로 많은 유사점을 가지고 있다. 이러한 유사점을 잘 이용한다면 일한 기계번역 시스템에서 구문해석이나 의미해석의 상당한 부분을 생략할 수 있다. 몇 년 전부터 우리는 유사성을 이용하여 번역율을 높이는 방법으로 번역테이블을 이용한 일한기계번역 시스템을 연구해 왔다. 그러나 이 시스템은 활용어미의 번역, 다의성 단어의 처리 등 몇 가지 문제점을 가지고 있었다. 본 논문에서는 번역테이블을 이용하는 시스템을 개선하여 이웃 하는 단어들과의 관계 정보를 이용한 일한 기계번역 시스템을 제안한다. 현재 시스템의 문제점들을 해결하기 위하여 우선 조사, 조동사의 접속 정보를 최대한 이용한다. 또한, 번역 테이블을 엔트리테이블과 접속정보 테이블로 나누어 설계하여 번역의 효율을 높인다. 즉, 하나의 역어만 가지는 단어인 경우, 우리는 일한 직접 대응 방법을 이용하여 바로 번역하고 2개 이상의 역어로 번역되어야 할 경우만 접속 정보 값을 평가하여 가장 가능성이 높은 번역어를 선택하도록 한다.

  • PDF

인접 단어들의 접속정보를 이용한 일한 활용어 번역 (Japanese-to-Korean Inflected Word Translation Using Connection Relations of Two Neighboring Words)

  • Kim, Jung-In;Lee, Kang-Hyuk
    • 인지과학
    • /
    • 제15권2호
    • /
    • pp.33-42
    • /
    • 2004
  • 일본어와 한국어는 문법적으로 많은 유사점을 가지고 있다. 이러한 유사점을 잘 이용한다면 일한 기계번역 시스템에서 구문해석이나 의미해석의 상당한 부분을 생략할 수 있다. 몇 년 전부터 우리는 유사성을 이용하여 번역율을 높이는 방법으로 번역테이블을 이용한 일한기계번역 시스템을 연구해왔다. 그러나 이 시스템은 활용어미의 번역, 다의성 단어의 처리 등 및 가지 문제점을 가지고 있었다. 본 논문에서는 번역데이블을 이용하는 시스템을 개선하여 이웃하는 단어들과의 관계 정보를 이용한 일한 기계번역 시스템을 제안한다. 현재 시스템의 문제점들을 해결하기 위하여 우선 조사, 조동사의 접속정보를 최대한 이용한다. 또한, 번역 테이블을 엔트리테이블과 접속정보 테이블로 나누어 설계하여 번역의 효율을 높인다. 즉, 하나의 역어만 가지는 단어인 경우, 우리는 일한 직접 대응 방법을 이용하여 바로 번역하고 2개 이상의 역어로 번역되어야 할 경우만 접속 정보 값을 평가하여 가장 가능성이 높은 번역어를 선택하도록 한다.

  • PDF

Using Roots and Patterns to Detect Arabic Verbs without Affixes Removal

  • Abdulmonem Ahmed;Aybaba Hancrliogullari;Ali Riza Tosun
    • International Journal of Computer Science & Network Security
    • /
    • 제23권4호
    • /
    • pp.1-6
    • /
    • 2023
  • Morphological analysis is a branch of natural language processing, is now a rapidly growing field. The fundamental tenet of morphological analysis is that it can establish the roots or stems of words and enable comparison to the original term. Arabic is a highly inflected and derivational language and it has a strong structure. Each root or stem can have a large number of affixes attached to it due to the non-concatenative nature of Arabic morphology, increasing the number of possible inflected words that can be created. Accurate verb recognition and extraction are necessary nearly all issues in well-known study topics include Web Search, Information Retrieval, Machine Translation, Question Answering and so forth. in this work we have designed and implemented an algorithm to detect and recognize Arbic Verbs from Arabic text.The suggested technique was created with "Python" and the "pyqt5" visual package, allowing for quick modification and easy addition of new patterns. We employed 17 alternative patterns to represent all verbs in terms of singular, plural, masculine, and feminine pronouns as well as past, present, and imperative verb tenses. All of the verbs that matched these patterns were used when a verb has a root, and the outcomes were reliable. The approach is able to recognize all verbs with the same structure without requiring any alterations to the code or design. The verbs that are not recognized by our method have no antecedents in the Arabic roots. According to our work, the strategy can rapidly and precisely identify verbs with roots, but it cannot be used to identify verbs that are not in the Arabic language. We advise employing a hybrid approach that combines many principles as a result.

자동 색인을 위한 한국어 형태소 분석기의 실제적인 구현 및 적용 (Practical Development and Application of a Korean Morphological Analyzer for Automatic Indexing)

  • 최성필;서정현;채영숙
    • 정보처리학회논문지B
    • /
    • 제9B권5호
    • /
    • pp.689-700
    • /
    • 2002
  • 본 논문에서는 정보검색 시스템에서 필수적인 자동 색인을 위한 한글 형태소 분석기를 구현하였다. 현존하는 대용량의 데이터에 대한 자동 색인을 효율적으로 수행하기 위해서 새로운 개념이나 아이디어의 도입 및 적용에 초점을 맞추기보다는 기존에 연구되었던 다양한 어절 분석 기법들을 바탕으로 어절분석 속도의 최대화, 형태소 분석기의 모듈화 및 구조화에 초점을 맞추었다. 따라서 본 논문에서 개발된 시스템의 특징은 이론적인 측면보다는 소프트웨어 공학적인 측면이 훨씬 더 강조된다 품사 사전의 구조화가 우선적으로 수행되었으며, 이에 따라서 체언 및 용언 분석 모듈, 수사 분석 모듈 둥이 구현되었다. 또한 형태소의 패턴을 이용한 미등록어 분석 기능이 개발되었다. 개발된 전체 시스템은 정보 검색 엔진인 K-2000 시스템의 색인 모듈로 장착되어서 적용되었다.

인공신경망을 이용한 한국어 형태음운현상 연구 (A Study of Morphophonemic Processes of Korean using Neural Networks)

  • 이찬도
    • 한국정보처리학회논문지
    • /
    • 제2권2호
    • /
    • pp.215-228
    • /
    • 1995
  • 언어에서 단어가 차지하는 중요성은 매우 크다. 그럼에도 불구하고 단어를 구성하 는 음운론적, 형태소론적 요소에 관한 계산적 연구는 그리 많지 않다. 대개의 전통적 언어학 이론은 추상적인 기저구조와 일련의 명시된 규칙들을 가정함으로 해서 형태음 운현상을 설명한다. 그러나 이러한 접근방법은 (1) 기저구조의 가정, (2) 규칙의 발 견, 그리고 (3) 규칙간의 상호관계 등에서 문제점을 내포하고 있다. 본 연구는 인공신 경망이 단어를 구성하는 음소열과 그 단어의 의미를 학습하는 과정에서 규칙은 생겨난 다는 가정에서 시작한다. 다양한 국어의 형태음운현상에 대한 실험결과는 인공신경망 이 규칙이나 기저구조의 도움없이 형태음운현상을 학습할 수 있음을 보여준다.

  • PDF

빈도 정보를 이용한 한국어 저자 판별 (Authorship Attribution in Korean Using Frequency Profiles)

  • 한나래
    • 인지과학
    • /
    • 제20권2호
    • /
    • pp.225-241
    • /
    • 2009
  • 본고에서는 빈도 정보를 이용한 저자 판별 (authorship attribution) 기법을 한국어에 적용한 연구를 소개한다. 그 대상으로는 정형화된 장르인 신문 칼럼을, 구체적으로는 조선일보에 연재 중인 4인 칼럼니스트들의 각 40개 칼럼, 총 160개 칼럼 텍스트를 선정하였다. 이들에 대하여 어절, 음절, 형태소, 각 단위 2연쇄 등의 다양한 언어 단위들의 빈도 정보들을 이용한 저자 판별을 시도한 결과, 형태소 빈도를 기반으로 하여 최고 93%를 넘는 높은 예측 정확도를 얻을 수 있었다. 또한, 저자 개인 문체간의 거리도 빈도 정보로써 계량적 표상이 가능함을 보일 수 있었다. 이로써 빈도 분석과 같은 통계적, 계량적 방법을 통하여 한국어 텍스트에 대한 성공적인 저자 판별과 개인 문체의 정량화가 가능하다는 결론을 내릴 수 있다.

  • PDF

한국어 규칙 동사와 불규칙 동사의 심성 어휘집 접근 과정 (The Lexical Access of Regular and Irregular Korean Verbs in the Mental Lexicon)

  • 박희진;구민모;남기춘
    • 인지과학
    • /
    • 제23권1호
    • /
    • pp.1-23
    • /
    • 2012
  • 본 연구는 한국어 동사의 활용된 형태인 굴절 동사의 심성어휘집 접근 과정을 알아보기 위한 연구이다. 이를 위하여 차폐 점화 어휘 판단과제 실험을 실시하여 점화크기를 비교하였다. 한국어 규칙 동사와 불규칙 동사를 다섯 가지로 나누어 실험을 수행하였다. 활용의 종류는 1) 완전규칙 2) 발음변화규칙 3) 철자변화규칙 4) 어간변화 불규칙 5) 어미변화 불규칙으로 1), 2), 3)은 규칙 활용의 범주로 4), 5)는 불규칙활용의 범주이다. 기본형의 동사를 표적자극으로 사용하였고, 점화자극으로 총 세 가지 유형이 사용하였다. 점화자극으로 사용한 자극은 기본형의 어간의 변화가 없는 규칙활용, 기본형의 어간이 철자적, 음운적으로 변화하는 불규칙활용과, 의미 및 형태적으로 관련 없는 통제된 단어이다. 또한 단어재인의 처리에서 형태소 분해 정보처리의 시간대를 살펴보기 위하여 SOA의 간격을 43ms, 72ms, 230ms의 3가지로 나누어 실험하였다. 모든 동사가 모든 SOA에서 규칙활용과 불규칙활용이 통제단어에 비해 빠른 반응시간을 보임으로써 점화효과가 관찰되었다. 그러나 규칙활용과 불규칙활용에서 뚜렷이 점화효과의 차이가 관찰되지 않는다. 이러한 규칙활용과 불규칙활용의 범주의 구분 없이 비슷한 패턴을 보여주는 결과는 한국어가 단순히 규칙과 불규칙의 기준으로 나뉘어서 처리되지 않는다는 것을 시사한다. 또한 모든 SOA에서 촉진효과를 보임으로써 형태소 정보처리가 초기과정부터 일어남을 확인하였다.

  • PDF