• 제목/요약/키워드: Vocabulary Recognition

검색결과 222건 처리시간 0.021초

워드 임베딩과 품사 태깅을 이용한 클래스 언어모델 연구 (Class Language Model based on Word Embedding and POS Tagging)

  • 정의석;박전규
    • 정보과학회 컴퓨팅의 실제 논문지
    • /
    • 제22권7호
    • /
    • pp.315-319
    • /
    • 2016
  • 음성인식 성능 개선을 위한 언어모델의 기술적 진보는 최근 심층 신경망을 기반으로 한 접근방법으로 한 단계 더 진보한 모양새다. 그러나 연구되고 있는 심층 신경망 기반 언어모델은 대부분 음성인식 이후 리스코링 단계에서 적용할 수 있는 한계를 지닌다. 또한 대규모 어휘에 대한 심층 신경망 접근방법은 아직 시간이 필요하다고 본다. 따라서 본 논문은 심층 신경망 언어 모델의 단순화된 형태인 워드 임베딩 기술을 음성인식 후처리가 아닌 기반 N-gram모델에 바로 적용할 수 있는 접근 방법을 찾는다. 클래스 언어모델이 한 접근 방법이 될 수 있는데, 본 연구에서는 워드 임베딩을 우선 구축하고, 해당 어휘별 벡터 정보를 클러스터링하여 클래스 언어모델을 구축 방법을 제시한다. 이를 기존 어휘기반 N-gram 모델에 통합한 후, 언어모델의 성능 개선 여부를 확인한다. 클래스 언어모델의 타당성 검증을 위해 다양한 클래스 개수의 언어모델 실험과 RNN LM과의 비교 결과를 검토한 후, 모든 언어모델의 성능 개선을 보장하는 품사 부착 언어모델 생성 방법을 제안한다.

증강현실(Augmented Reality) 기술 기반의 글자교구재 디지털 앱 개발 사례와 교육효과 평가: 학습동기, 학습만족도, 학습몰입도를 중심으로 (An Augmented Reality-Based Digital App as an Educational Tool for Foreign Language Learning and the Evaluation of Its Learning Effect: Towards an Examination of Learning Motivation, Learning Satisfaction, and Learning Engagement)

  • 김새론;원은진;김형기;윤필중
    • 한국IT서비스학회지
    • /
    • 제22권4호
    • /
    • pp.141-157
    • /
    • 2023
  • The present work aimed to present the development of 'Funt', the augmented reality-based digital app as an educational tool for foreign language learning. Our work further evaluated the learning efficacy of the tool by the assessment of the three dependent measures including learning motivation, learning satisfaction, and learning involvement. With a learning app of 'Funt', students can use AR app to access recognition-based or location-based experiences such that any objects, artifacts, or media appear to be in the app. Students are then able to interact with the digital content by manipulating it to learn more about it. Students's engagement should also increase when they create their own experience in AR to demonstrate their understanding of a particular concept or words. Learning effects were evaluated on survey data collected from a hundred respondents aging six to nine years. One-group design for pre-test and post-test was utilized to examine the differences of learning efficacy by comparing the non-'Funt' group and the Funt group scores. A pairwise t-Test was performed for pairwise comparisons between two learning groups. The results indicate that the 'Funt' group scored significantly higher than the non-'Funt' group in the measures of learning motivation, learning satisfaction, and learning involvement. Overall, our results suggest that 'Funt' attracted the students' attention, provided them with a fun context to learn English vocabulary, and develop positive motivation and satisfaction towards vocabulary learning through AR technology.

대구시 초${\cdot}$중등 교사들의 환경 관련 변인에 관한 이해도 조사 (A Research on Understanding about Variables Related to Environment of Primary and Secondary School Teachers in Daegu)

  • 곽홍탁;전은정
    • 한국환경교육학회지:환경교육
    • /
    • 제16권2호
    • /
    • pp.15-28
    • /
    • 2003
  • In effort to help vitalize environmental education which is the most efficient way to preserve environment and solve environmental problems and also to provide necessary basic data, this research was conducted on the primary and secondary school teachers in Daegu for their awareness of the elements of environmental education, for their interests in environment and environmental issues, for their sensitivity on the seriousness of the environmental issues and for their knowledge of environmental vocabulary. Followings are the results: 1. 96% of the teachers supported the necessity of school education on environment, but only 51% went for adopting environment as an independent subject. 2. The majority of 57% said that they came to recognize environment and environmental issues 'through media such as TV and radio'. For the desirable form of environmental education, 64% supported 'field study or experience activity'. As for the undermining factors, the majority of 50% cited 'excessive focus of school education on college entrance' and 29% 'limitations of class hours'. 3. With regard to their interests in environment and environmental issues, they were between 3.43~4.08 point range out of 5 points. For their sensitivity about the seriousness of environment and environmental problems, the survey showed the range of 3.49~4.28 points out of 5 points. 4. There was no remarkable difference in the level of recognition between male and female teacher. But, according to disparity of age, teachers who are in their forties and fifties recognized better than teachers in twenties and thirties. Also, there was a striking difference among primary school, middle school, and high school teachers. High school teachers had the highest recognition level, while, middle school teachers had the lowest recognition level.

  • PDF

클래스 종속 반연속 HMM을 이용한 립싱크 시스템 최적화 (Lip-Synch System Optimization Using Class Dependent SCHMM)

  • 이성희;박준호;고한석
    • 한국음향학회지
    • /
    • 제25권7호
    • /
    • pp.312-318
    • /
    • 2006
  • 기존의 립싱크 시스템은 음소 분할 후, 각각의 음소를 인식하는 2단계의 과정을 거쳤다. 하지만, 정확한 음소 분할의 부재와 음성이 끊긴 분할 된 음소로 이루어진 훈련 데이터들은 시스템의 전체 성능을 크게 떨어뜨렸다. 이런 문제를 해결하기 위해 Head-Body-Tail (HBT) 모델을 이용한 단모음 연속어 인식 기술을 제안한다. 주로 소규모 어휘를 다루는데 적합한 HBT 모델은 Head 와 Tail 부분에 문맥 종속 정보를 포함하여 앞 뒤 문맥에 따른 조음효과를 최대한 반영한다. 또한, 7개의 단모음을 입모양이 비슷한 세 개의 클래스로 분류하여, 클래스에 종속적인 코드북 3개를 가진 반연속HMM (Hidden Markov Model)을 적용하여 시스템을 최적화하고, 변이 부분이 큰 단어의 처음과 끝은 연속HMM의 8 믹스쳐 가우시안 구조를 사용하여 모델링하였다. 제안한 방법은 HBT구조의 연속HW과 대등한 성능을 보이지만, 파라미터 수는 33.92% 감소하였다. 파라미터 감소는 계산 양을 줄여주므로, 시스템이 실시간으로 동작 가능하게 한다.

공공보건시설 색채이미지에 대한 국가간 인식 비교 -한국과 루마니아 중심으로- (Comparative Study on Public Health Facility Color Image Vocabulary among Countries -Focusing on korea and Romania-)

  • 박혜경;;김혜영;오지영
    • 문화기술의 융합
    • /
    • 제6권3호
    • /
    • pp.185-191
    • /
    • 2020
  • 본 연구는 상대적으로 인식은 부족하나 점차 교역이 확대되는 동유럽 국가인 루마니아를 대상으로 공공보건시설 색채이미지에 대한 국가 간 문화적, 감성적 인식 차이를 파악하고자 하는 목적을 가진다. 이를 위하여 선행연구 고찰을 통해 색채이미지를 선정하였으며, 공공보건시설인 의료시설 8개소, 사회체육시설 4개소, 요양시설 8개소를 직접 방문하여 환경색채를 측색데이터를 기반으로 설문지를 구성하였다. 한국인 89명, 루마니아인 86명을 대상으로 공공시설 색채이미지에 대한 온라인 설문조사를 실시하였고, SPSS 통계분석 프로그램을 활용하여 빈도 및 교차분석을 실시하여 한국인과 루마니아인의 공공보건시설 색채이미지에 대한 인식차이를 파악하였다. 그 결과, 국가 간 공공보건시설에 대한 색채이미지 인식이 어휘평가와 이미지평가에서 통계적으로 유의한 차이가 있음을 파악하였고, 이는 공공보건시설의 색채이미지가 다른 문화권에 거주하는 집단에게 다른 의미로 해석될 수 있으므로 향후, 이와 관련된 환경 구축 시 문화적 인식차이를 고려해야함을 시사한다.

아바타를 내장한 한글 지문자 학습 게임 개발에 관한 연구 (A Study on the Development of a Korean Manual Alphabet Learning Game with Avatar)

  • 오영준;정기철
    • 한국게임학회 논문지
    • /
    • 제9권4호
    • /
    • pp.67-80
    • /
    • 2009
  • 본 논문은 아바타를 내장한 한글 지문자 학습 게임 개발에 관한 논문으로써, 초보자가 수화아바타에게서 지문자를 쉽게 배우고 쉽게 연습할 수 있도록 한글 지문자 인식 게임 프로그램개발을 제안한다. 지문자는 단어를 철자로 표현하는 한국수화의 어휘에 대응한다. 지문자 자모가 한글 자모에 일치하고 사용자에 의하여 한글이 손 모양으로 표현되었다. 시스템은 OpenGL에 기반한 수화아바타강사 GUI 팝업윈도우와 지문자 인식모듈, 여러 한글 자음 글자가 아래로 이동하는 게임 모듈, USB 카메라로 구성된다. 지문자는 한글 자모를 표현하는 것으로써, 사용자는 아바타로부터 지문자를 배우고 USB 카메라를 이용하여 시스템에 지문자를 간단하게 입력한다. 우리는 사용자들의 검증을 통하여 개발된 시스템의 성능을 평가하였다.

  • PDF

KorPatELECTRA : A Pre-trained Language Model for Korean Patent Literature to improve performance in the field of natural language processing(Korean Patent ELECTRA)

  • Jang, Ji-Mo;Min, Jae-Ok;Noh, Han-Sung
    • 한국컴퓨터정보학회논문지
    • /
    • 제27권2호
    • /
    • pp.15-23
    • /
    • 2022
  • 특허 분야에서 자연어처리(Natural Language Processing) 태스크는 특허문헌의 언어적 특이성으로 문제 해결의 난이도가 높은 과제임에 따라 한국 특허문헌에 최적화된 언어모델의 연구가 시급한 실정이다. 최근 자연어처리 분야에서는 특정 도메인에 특화되게 사전 학습(Pre-trained)한 언어모델을 구축하여 관련 분야의 다양한 태스크에서 성능을 향상시키려는 시도가 지속적으로 이루어지고 있다. 그 중, ELECTRA는 Google이 BERT 이후에 RTD(Replaced Token Detection)라는 새로운 방식을 제안하며 학습 효율성을 높인 사전학습 언어모델이다. 본 연구에서는 대량의 한국 특허문헌 데이터를 사전 학습한 KorPatELECTRA를 제안한다. 또한, 특허 문헌의 특성에 맞게 학습 코퍼스를 정제하고 특허 사용자 사전 및 전용 토크나이저를 적용하여 최적화된 사전 학습을 진행하였다. KorPatELECTRA의 성능 확인을 위해 실제 특허데이터를 활용한 NER(Named Entity Recognition), MRC(Machine Reading Comprehension), 특허문서 분류 태스크를 실험하였고 비교 대상인 범용 모델에 비해 3가지 태스크 모두에서 가장 우수한 성능을 확인하였다.

중규모급 단어 인식기의 실시간 구현을 위한 무감독 단어집단화 알고리듬 (Unsupervised Word Grouping Algorithm for real-time implementation of Medium vocabulary recognition)

  • 임동식;김진영;백성준
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1999년도 학술발표대회 논문집 제18권 2호
    • /
    • pp.81-84
    • /
    • 1999
  • 본 논문에서는 중규모급 단어인식기의 실시간 구현을 위한 무감독 단어집단화 알고리듬을 제안한다. 무감독 단어집단화는 인식대상 어휘 수가 많은 대용량 음성인식 시스템에서 대상 어휘 수를 줄여주는 역할을 하는 전처리기의 성격을 갖는다. 무감독 집단화를 위해 각 단어의 유$\cdot$무성음 고유의 특성을 잘 반영할 수 있는 특징 파라미터 5개를 사용하여 패턴 인식과 회귀분석에서 널리 사용되고 있는 분류$\cdot$회귀트리(Classification And Regression Tree)에 적용시키는 방법으로 접근하였고, 각 단어의 frame 수를 일정하게 n개로 분할(segment)하여 1개의 tree를 생성시키는 방법과 각 segment에 해당하는 tree를 생성시켜 segment들 사이의 교집합 성분으로 단어들을 집단화 하였다 실험결과 탐색 대상단어 22개에서 평균2.21개로 줄어 전체 대상 단어의 $10\%$만을 탐색하여 인식할 수 있는 방법을 제시할 수 있었다.

  • PDF

예외 단어 선별 작업을 이용한 자동 발음열 생성 시스템 (Automatic Pronunciation Generator Using Selection Procedure for Exceptional Pronunciation Words)

  • 안주은;김순협;김선희
    • 한국음향학회지
    • /
    • 제23권3호
    • /
    • pp.248-252
    • /
    • 2004
  • 실제 언어생활에 있어서 여러 다양한 경제적 문화적 사회적 환경에 따라 다른 어휘가 사용되고, 각각의 다양한 환경에서 새롭게 신조어가 추가되는 등 어휘의 양적인 변화가 일어난다. 이러한 역동적인 언어 현실을 자동 발음열 생성기에 반영하기 위하여, 본 논문은 추가된 텍스트로부터 예외발음사전을 구축하는 방법을 제안하고, 이러한 방법으로 구축된 예외발음사전을 이용한 자동 발음열 생성 시스템의 성능을 실험하였다. 본 시스템에 대하여 ETRI에서 출시된 음성인식용 텍스트 코퍼스 가운데 한 달 동안의 신문기사를 모은 53,750문장 (740,497 어절)을 이용하여 실험한 결과 100%의 성능을 얻었다.

A Collocational Analysis of Korean High School English Textbooks and Suggestions for Collocation Instruction

  • Kim, Nahk-Bohk
    • 영어어문교육
    • /
    • 제10권3호
    • /
    • pp.41-66
    • /
    • 2004
  • Under the textbook-driven approach to English education in the Korean selling, the importance of the English textbook can not be overemphasized as the main source of learning materials. Recently, with the development of computer-based language corpora, the recognition of the importance of collocations and the availability of computerized databases of words have caused a resurgence and facilitation in the instruction of collocation. The primary purpose of the present study is to identify the characteristics of lexical collocation and the extent of its use in high school 10th-grade textbooks. From all the analyses, it is revealed that the language materials reflect various constructed collocation in the case of adjective+noun and noun+noun collocations in a natural context. However, verb+noun and adverb+verb collocations are not fully reflected. This is true for delexicalized verbs, and verb and adjective intensifiers. Also the language materials do not provide sufficient support for the lexical syllabus, even though all textbooks may be somewhat adequate in terms of vocabulary size. Finally, based on the analyses of the texts, the suggestions for English collocation instruction are made in the lexical approach.

  • PDF