• 제목/요약/키워드: contextual words

검색결과 60건 처리시간 0.023초

오프라인 한글 문자 인식을 위한 효율적인 오인식 단어 교정 방법 (An Efficient Correction Method for Misrecognized Words in Off-line Hangul Character Recognition)

  • 이병희;김태균
    • 한국정보처리학회논문지
    • /
    • 제3권6호
    • /
    • pp.1598-1606
    • /
    • 1996
  • 문자 인식 과정을 거치고 난 후에 발생하게 되는 오인식된 문자들을 언어적 지식 을 이용하여 교정하는 문자 인식 후처리 과정이 반드시 필요하다. 본 논문에서는 한 국어의 형식 측면에서 품사를 재분류하고 사전을 구성하며 한글 어절의 상태 전이도 를 구성하고 형태소 분석을 위해 Head-tail구분법을 적용해 단어를 분리하였다. 또한 본 논문에서는 효율적인 단어분리와 교정을 위해 여러 문서와 책들로부터 새롭게 조 사의 결합형으로 900여개를, 규칙 어미의 활용형으로 800여개를 수집하였다. 그리고 불규칙 용언의 활용형을 위해 국어학에 나오는 9개의 불규칙을 조사하여 활용형을 구 축하였고 자동적 교체와 불구동사의 활용형도 사전에 등록하여 어절을 분석하는데 이 용하였다. 어느 인식 시스템을 가지고 문서를 인식한 결과 93.7%의 인식률을 보인 것 을 본 단어교정방법을 적용한 결과 97% 인식률을 향상시킬 수 있었다.

  • PDF

철자오류에 기인한 가의미 오류의 검출 및 교정 방법 (A Method for Detection and Correction of Pseudo-Semantic Errors Due to Typographical Errors)

  • 김동주
    • 한국컴퓨터정보학회논문지
    • /
    • 제18권10호
    • /
    • pp.173-182
    • /
    • 2013
  • 전자 문서의 초안 작성과정에서 추가되는 철자오류는 다른 유형의 오류보다 압도적으로 높은 비율을 차지한다. 입력 실수로 인한 이들 오류는 결과적으로 여전히 철자오류일 수도 있지만 상당수는 구문오류나 의미오류로 발전한다. 이러한 오류들 중 철자오류에서 발전된 가의미 오류는 순수 의미오류에 비해 문장 내에서 주변 단어의 의미에 대해 두드러진 상이성을 갖게된다. 따라서 이러한 의미 오류는 그것이 가지는 두드러진 문맥 상이성으로 인해 간단한 동시발생 빈도에 기초한 알고리즘으로 검출 및 교정이 가능하다. 본 논문에서는 이러한 오류들을 검출하고 교정하기 위한 동시발생 빈도에 기초한 알고리즘을 제안한다. 제안하는 방법에서 동시발생 빈도는 의존 구조상에서 직접 의존관계에 놓인 단어만을 대상으로 계산하며, 가의미 오류 여부를 판단하기 위해서 코사인 유사도 측정 방법을 사용한다. 제시하는 실험으로부터 제안한 방법은 전체 맞춤법 검사기 검출율을 약 2~3% 수준까지 향상 시킬 수 있을 것으로 예측하였다.

양방향 LSTM을 적용한 단어의미 중의성 해소 감정분석 (Emotion Analysis Using a Bidirectional LSTM for Word Sense Disambiguation)

  • 기호연;신경식
    • 한국빅데이터학회지
    • /
    • 제5권1호
    • /
    • pp.197-208
    • /
    • 2020
  • 어휘적 중의성이란 동음이의어, 다의어와 같이 단어를 2개 이상의 의미로 해석할 수 있는 경우를 의미하며, 감정을 나타내는 어휘에서도 어휘적 중의성을 띄는 경우가 다수 존재한다. 이러한 어휘들은 인간의 심리를 투영한다는 점에서 구체적이고, 풍부한 맥락을 전달하는 특징이 있다. 본 연구에서는 양방향 LSTM을 적용하여 중의성을 해소한 감정 분류 모델을 제안한다. 주변 문맥의 정보를 충분히 반영한다면, 어휘적 중의성 문제를 해결하고, 문장이 나타내려는 감정을 하나로 압축할 수 있다는 가정을 기반으로 한다. 양방향 LSTM은 문맥 정보를 필요로 하는 자연어 처리 연구 분야에서 자주 활용되는 알고리즘으로 본 연구에서도 문맥을 학습하기 위해 활용하고자 한다. GloVe 임베딩을 본 연구 모델의 임베딩 층으로 사용했으며, LSTM, RNN 알고리즘을 적용한 모델과 비교하여 본 연구 모델의 성능을 확인하였다. 이러한 프레임워크는 SNS 사용자들의 감정을 소비 욕구로 연결시킬 수 있는 마케팅 등 다양한 분야에 기여할 수 있을 것이다.

텍스트 마이닝 기법을 활용한 메타버스 플랫폼 고객 리뷰 분석 (Metaverse Platform Customer Review Analysis Using Text Mining Techniques )

  • 김혜진;이정승;김수경
    • Journal of Information Technology Applications and Management
    • /
    • 제31권1호
    • /
    • pp.113-122
    • /
    • 2024
  • This comprehensive study delves into the analysis of user review data across various metaverse platforms, employing advanced text mining techniques such as TF-IDF and Word2Vec to gain insights into user perceptions. The primary objective is to uncover the factors that contribute to user satisfaction and dissatisfaction, thereby providing a nuanced understanding of user experiences in the metaverse. Through TF-IDF analysis, the research identifies key words and phrases frequently mentioned in user reviews, highlighting aspects that resonate positively with users, such as the ability to engage in creative activities and social interactions within these virtual environments. Word2Vec analysis further enriches this understanding by revealing the contextual relationships between words, offering a deeper insight into user sentiments and the specific features that enhance their engagement with the platforms. A significant finding of this study is the identification of common grievances among users, particularly related to the processes of refunds and login, which point to broader issues within payment systems and user interface designs across platforms. These insights are critical for developers and operators of metaverse platforms, suggesting a focused approach towards enhancing user experiences by amplifying positive aspects. The research underscores the importance of continuous improvement in user interface design and the transparency of payment systems to foster a loyal user base. By providing a comprehensive analysis of user reviews, this study offers valuable guidance for the strategic development and optimization of metaverse platforms, ensuring they remain responsive to user needs and continue to evolve as vibrant, engaging virtual environments.

창의적 성과를 제고하는 조직 양면성 구현양식에 대한 연구 (Working Mechanisms of Organizational Ambidexterity for Creative Performance)

  • 권정언;우형록
    • 지식경영연구
    • /
    • 제17권2호
    • /
    • pp.51-73
    • /
    • 2016
  • The organizational ambidexterity has been emerging as the way to gain competitive advantage in turbulent environment. The concept of ambidexterity is simultaneously accomplishing the balance between the activities of exploration and exploitation, and overcoming their conflicting tension. The beneficial merits of ambidexterity has been investigated in innovation, financial performance, strategic management, and etc. Our study focused on the impact of ambidextrous activities on creative performance. Although three ambidextrous modes-structural ambidexterity, contextual ambidexterity, and sequential ambidexterity-have been already acknowledged, scant studies suggested the specific mechanisms to achieve ambidexterity in practice at the operating level. To address the issue we performed the semantic network analysis on the basis of the previous literatures prescribing ambidexterity theory. We took interview with 21 teams to explore behaviors of teams from the ambidextrous perspective, and then interpreted the relationship among words which appeared in the interview. This study found the appropriate mechanism which alleviate tension revealed by exploitation and exploration exist as practical reality. We demonstrated how these ambidextrous mechanisms can be used to generate the creative performance as well as examined various antecedents. These findings would contribute to the more fine-grained understanding of organizational ambidexterity, especially in conjunction with organizational creativity.

초등학생의 과학적 의사소통 능력 함양을 위해 예비 초등교사들이 작성한 수업과정안의 특징 (The Characteristics of Lesson Planning of Pre-service Elementary Teachers to Develop Scientific Communication Skills for Elementary School Students)

  • 나지연;장병기
    • 한국초등과학교육학회지:초등과학교육
    • /
    • 제37권1호
    • /
    • pp.54-65
    • /
    • 2018
  • The purpose of this study was to investigate the characteristics of lesson planning of pre-service elementary teachers to develop scientific communication skills for elementary school students. For this purpose, lesson plans and lesson planning journals written by the 53 pre-service teachers were collected and analyzed. The results of the research were as follows. The pre-service elementary teachers used an implicit and contextual approach to develop scientific communication skills. Teaching and learning activities for enhancing scientific communication were mainly conducted in words or in writing. There were many activities expressing elementary school students' thoughts and presenting the results of experiments in the lesson plan. There were many cases in which the pre-service teachers' lesson plans did not include the evaluation of scientific communication skills. In their lesson plans, there are a lot of mutual activities between teachers and students, team and whole students, and inter-students within teams together, and students' individual activities from requests of teachers. We found that the pre-service teachers had various difficulties when they planned the science lesson to develop scientific communication skills. The pre-service teachers were less likely to refer to specialized materials related to science education when planning their classes.

영어 어휘 의미 정보와 피치 액센트 (Lexical Semantic Information and Pitch Accent in English)

  • 전윤실;김기호;이용재
    • 음성과학
    • /
    • 제10권3호
    • /
    • pp.187-209
    • /
    • 2003
  • In this paper, we examine if the lexical information of the verb and its noun object affects the pitch accent patterns of the verb phrase focus. Three types of verb-object combinations with different semantic weights are discussed: when the verbs have optional direct objects, when the objects have the greater semantic weight relative to verbs, and when the verbs and the objects have equal semantic weight. Argument-structure-based works note that the pitch accent location in a focused phrase is closely related to the argument structure and contextual information. For example, it has been argued that contextually new noun objects receive accent while given noun objects don't. Contrary to nouns, verbs can be accented or not in verb phrase focus regardless of whether they are given information or new information (Selkirk 1984, 1992). However, the production experiment in this paper shows that the accenting of verbs is not fully optional, but influenced by the lexical semantic information of the verbs. The accenting of noun objects with given information is possible and the deaccenting of new noun objects also occurs depending on the lexical information of the noun objects. The results demonstrate that in addition to argument structure and information by means of context sentences, the lexical semantic information of words influences the pitch accent location in focused phrase.

  • PDF

모바일 패션 쇼핑 특성과 지각된 상호작용성, 지각된 유용성이 구매의도에 미치는 영향 (Effects of mobile fashion shopping characteristics, perceived interactivity, and perceived usefulness on purchase intention)

  • 김민정;신수연
    • 복식문화연구
    • /
    • 제23권2호
    • /
    • pp.228-241
    • /
    • 2015
  • The purpose of this study was to verify the effect of mobile fashion shopping characteristics and perceived interactivity on perceived usefulness, and the effect of perceived usefulness on purchase attitude and purchase intention based on TAM (Technology Acceptance Model). We conducted the survey targeting smartphone users in their 20s~30s living in Seoul and metropolitan area. Among 483 data collected, we used 452 samples except 31 unreliable respondents for the analysis. To analyze the structural equation model, we did factor analysis, reliability analysis, and structural equation model analysis using SPSS 18.0 and AMOS 16.0. The results were as follows: We confirmed 5 mobile fashion shopping characteristics (enjoyment, credibility, instant connectivity, security, and personalization) and 3 perceived interactivity factors (control, responsiveness and two-way communication, and contextual offer) as results of confirmative factor analysis. Mobile fashion shopping characteristics and perceived interactivity had positive effects on perceived usefulness. Mobile fashion shopping characteristics affected perceived interactivity and also had indirect effect on perceived usefulness via perceived interactivity. In other words, mobile fashion shopping characteristics had direct and indirect effect on perceived usefulness. Perceived usefulness influenced purchase attitude and purchase attitude influenced purchase intention. Perceived usefulness had direct effect on purchase intention and the indirect effect through purchase attitude was significant.

Zero-anaphora resolution in Korean based on deep language representation model: BERT

  • Kim, Youngtae;Ra, Dongyul;Lim, Soojong
    • ETRI Journal
    • /
    • 제43권2호
    • /
    • pp.299-312
    • /
    • 2021
  • It is necessary to achieve high performance in the task of zero anaphora resolution (ZAR) for completely understanding the texts in Korean, Japanese, Chinese, and various other languages. Deep-learning-based models are being employed for building ZAR systems, owing to the success of deep learning in the recent years. However, the objective of building a high-quality ZAR system is far from being achieved even using these models. To enhance the current ZAR techniques, we fine-tuned a pretrained bidirectional encoder representations from transformers (BERT). Notably, BERT is a general language representation model that enables systems to utilize deep bidirectional contextual information in a natural language text. It extensively exploits the attention mechanism based upon the sequence-transduction model Transformer. In our model, classification is simultaneously performed for all the words in the input word sequence to decide whether each word can be an antecedent. We seek end-to-end learning by disallowing any use of hand-crafted or dependency-parsing features. Experimental results show that compared with other models, our approach can significantly improve the performance of ZAR.

온톨로지 지식 기반 특성치를 활용한 Bidirectional LSTM-CRF 모델의 시퀀스 태깅 성능 향상에 관한 연구 (Improving Bidirectional LSTM-CRF model Of Sequence Tagging by using Ontology knowledge based feature)

  • 진승희;장희원;김우주
    • 지능정보연구
    • /
    • 제24권1호
    • /
    • pp.253-266
    • /
    • 2018
  • 본 연구는 질의 응답(QA) 시스템에서 사용하는 개체명 인식(NER)의 성능을 향상시키기 위하여 시퀀스 태깅 방법론을 적용한 새로운 방법론을 제안한다. 사용자의 질의를 입력 받아 데이터베이스에 저장된 정답을 추출하기 위해서는 사람의 언어를 컴퓨터가 알아들을 수 있도록 구조화 질의어(SQL)와 같은 데이터베이스의 언어로 전환하는 과정이 필요한데, 개체명 인식은 사용자의 질의에서 데이터베이스에 포함된 클래스나 데이터 명을 식별하는 과정이다. 기존의 데이터베이스에서 질의에 포함된 단어를 검색하여 개체명을 인식하는 방식은 동음이의어와 문장성분 구를 문맥을 고려하여 식별하지 못한다. 다수의 검색 결과가 존재하면 그들 모두를 결과로 반환하기 때문에 질의에 대한 해석이 여러 가지가 나올 수 있고, 계산을 위한 시간복잡도가 커진다. 본 연구에서는 이러한 단점을 극복하기 위해 신경망 기반의 방법론을 사용하여 질의가 가지는 문맥적 의미를 반영함으로써 이러한 문제를 해결하고자 했고 신경망 기반의 방법론의 문제점인 학습되지 않은 단어에 대해서도 문맥을 통해 식별을 하고자 하였다. Sequence Tagging 분야에서 최신 기술인 Bidirectional LSTM-CRF 모델을 도입함으로써 신경망 모델이 가진 단점을 해결하였고, 학습되지 않은 단어에 대해서는 온톨로지 기반 특성치를 활용하여 문맥을 반영한 추론을 사용하였다. 음악 도메인의 온톨로지(Ontology) 지식베이스를 대상으로 실험을 진행하고 그 성능을 평가하였다. 본 연구에서 제안한 방법론인 L-Bidirectional LSTM-CRF의 성능을 정확하게 평가하기 위하여 학습에 포함된 단어들뿐만 아니라 학습에 포함되지 않은 단어들도 포함한 질의를 평가에 사용하였다. 그 결과 L-Bidirectional LSTM-CRF 모형을 재학습 시키지 않아도 학습에 포함되지 않은 단어를 포함한 질의에 대한 개체명 인식이 가능함을 확인하였고, 전체적으로 개체명 인식의 성능이 향상됨을 확인할 수 있었다.