• Title/Summary/Keyword: 한국어 태도

Search Result 110, Processing Time 0.024 seconds

Korean Mobile Spam Filtering System Considering Characteristics of Text Messages (문자메시지의 특성을 고려한 한국어 모바일 스팸필터링 시스템)

  • Sohn, Dae-Neung;Lee, Jung-Tae;Lee, Seung-Wook;Shin, Joong-Hwi;Rim, Hae-Chang
    • Journal of the Korea Academia-Industrial cooperation Society
    • /
    • v.11 no.7
    • /
    • pp.2595-2602
    • /
    • 2010
  • This paper introduces a mobile spam filtering system that considers the style of short text messages sent to mobile phones for detecting spam. The proposed system not only relies on the occurrence of content words as previously suggested but additionally leverages the style information to reduce critical cases in which legitimate messages containing spam words are mis-classified as spam. Moreover, the accuracy of spam classification is improved by normalizing the messages through the correction of word spacing and spelling errors. Experiment results using real world Korean text messages show that the proposed system is effective for Korean mobile spam filtering.

Korean Learning Assistant System with Automatically Extracted Knowledge (자동 추출된 지식에 기반한 한국어 학습 지원 시스템)

  • Park, Gi-Tae;Lee, Tae-Hoon;Hwang, So-Hyun;Kim, Byeong Man;Lee, Hyun Ah;Shin, Yoon Sik
    • KIPS Transactions on Software and Data Engineering
    • /
    • v.1 no.2
    • /
    • pp.91-102
    • /
    • 2012
  • Computer aided language learning has become popular. But the level of automation of constructing a Korean learning assistant system is not so high because a practical language learning system needs large scale knowledge resources, which is very hard to acquire. In this paper, we propose a Korean learning assistant system that utilizes easily obtainable knowledge resources like a corpus, web documents and a lexicon. Our system has three modules - problem solving, pronunciation marker and writing assistant. Automatic problem generator uses a corpus and a lexicon to make problems with one correct answer and three distracters, then verifies their suitability by utilizing frequency information from web documents. We analyze pronunciation rules for a pronunciation marker and recommend appropriate words and sentences in real-time by using data extracted from a corpus. In experiment, we evaluate 400 automatically generated problems, which show 89.9% problem suitability and 64.9% example suitability.

Implementation of an English POS Tagger for Medical (의학용 영어 품사 태거 구현)

  • Lee, Hyeon-Gu;Ahn, HyeokJu;Kim, HarkSoo
    • Annual Conference on Human and Language Technology
    • /
    • 2015.10a
    • /
    • pp.155-156
    • /
    • 2015
  • 자연어처리의 여러 분야에서 기본요소로 사용되는 영어 품사 태거를 UMLS의 의학용어 어휘정보와 OANC(Open American National Corpus) 말뭉치를 이용해 의학용 문서도 분석 가능한 의학용 영어 품사 태거를 제안한다. TRIE구조를 이용한 단어 묶음 모델로 여러 어절의 의학용어를 하나로 묶고 HMM(Hiden Markov Model)을 이용한 품사 태거로 해당하는 품사를 부착한다.

  • PDF

Extracting multiple sentiment expression areas using BERT+CRF (BERT+CRF를 이용한 다중 감성 표현 영역 추출)

  • Park, Ji-Eun;Lee, Ju-Sang;Ock, Cheol-Young
    • Annual Conference on Human and Language Technology
    • /
    • 2021.10a
    • /
    • pp.571-575
    • /
    • 2021
  • 감성분석이란 텍스트에 들어있는 의견이나 감성, 평가, 태도 등의 주관적인 정보를 컴퓨터를 통해 분석하는 과정이다. 본 논문은 다양한 감성분석 실험 중 감성이 드러나는 부분을 파악하여 서술어 중심의 구 혹은 절 단위로 감성 표현 영역을 추출하는 모델을 개발하고자 한다. 제안하는 모델은 BERT에 classification layer와 CRF layer를 결합한 것이고 baseline은 일반 BERT 모델이다. 실험 결과는 기존의 baseline 모델의 f1-score이 33.44%이고 제안한 BERT+CRF 모델의 f1-score이 40.99%이다. BERT+CRF 모델이 7.55% 더 좋은 성능을 보인다.

  • PDF

Validation of RESPECT-Music With a Korean Sample (한국판 음악 기능 척도의 타당화와 정서적 적응과의 관계)

  • Lee, Jung Yun;Kim, Minhee
    • Journal of Music and Human Behavior
    • /
    • v.14 no.2
    • /
    • pp.45-70
    • /
    • 2017
  • The purpose of this study was to validate the Korean version of RESPECT-Music, which measures personal, social and cultural function of music, and to examine the correlation between the measured RESPECT data and the data measured from other scales for emotions. A survey was conducted with two separate groups of undergraduate students. Exploratory factor analysis with sample A (N=212) and confirmatory factor analysis and correlation analyses with sample B (N=296) were conducted. The result of exploratory factor analysis generated 10 factors as influential factors in music use, which was the similar results to the original scale: background, values, focus, dancing, family bonding, cultural identity, political attitudes, venting, emotional expression and social bonding. In the confirmatory factor analysis, this 35-item measurement was found to obtain adequate internal consistency and reliability. In addition, the correlations were found with other scales measuring emotional adjustment. Specifically, RESPECT showed a positive correlation with scales for positive affect, reappraisal, negative mood regulation and repair. Among the generated factors as music function, dancing was highly correlated with emotional adjustment, while political attitudes was negatively correlated with emotional adjustment. The results indicate that music use in our everyday lives is intercorrelated with the intrapersonal and interpersonal motives and emotional adjustment, while the function of music that influences cultural identity was not associated with the level of emotional adjustment. Implications for future studies were also suggested.

A Study On Continuous Digits Recognition Using the Neural Network (신경망을 이용한 연속 숫자음 인식에 관한 연구)

  • 이성권;김순협
    • The Journal of the Acoustical Society of Korea
    • /
    • v.17 no.4
    • /
    • pp.3-13
    • /
    • 1998
  • 본 논문은 음성 다이어링 시스템을 구현하기 위한 한국어 단독 숫자음 및 연속 숫 자음 인식에 관한 것이다. 단독 숫자음의 인식은 미지의 입력 음성을 재귀 신경망을 이용하 여 모델링된 각 모델에 인가하고, 신경 회로망의 출력 노드의 상태열을 검사하여 적절한 상 태 전이를 하며 최고의 확률값을 출력하는 모델을 인식된 결과로 출력한다. 연속 숫자음의 인식은 미지의 연속 숫자음을 재귀 신경 회로망을 이용한 연속 숫자음 모델에 입력하고, 신 경 회로망의 출력에 대하여 적절한 상태 전이에 대한 검사와 레벨 빌딩(Level Building)을 수행하여 최소의 오차를 가지는 모델열을 인식된 결과로 출력한다. 재귀 신경 회로망을 이 용하여 음절 모델을 만드는 과정에서 재귀 노드는 예상치가 주어지지 않으므로 신경 회로망 의 학습에서 제외되어 현저한 학습 속도의 저하를 가져온다. 따라서 본 논문에서는 재귀 신 경 회로망의 학습 속도를 향상시키기 위한 2가지 방법을 제안 한다. 첫 번째는 재귀 신경 회로망의 재귀 노드의 예상치를 실험적으로 주어줌으로써 학습 속도의 향상을 도모하였다. 두 번째는 음절 모델의 출력노드의 개수와 음절 모델의 세그먼트 경계를 알고리듬을 이용하 여 자동적으로 조절하였다. 실험결과, 단독어의 경우 음절 '에'에 포함하는 한국어 11개의 숫 자음에 대하여 화자 종속의 경우 97.3%, 화자 독립의 경우 80.5%의 인식률을 얻었으며, 연 속 숫자음의 경우는 21종류의 연속 숫자음에 대하여 화자 종속에서 88.2%, 화자 독립의 경 우 81.3%의 인식률을 얻을 수 있었다.

  • PDF

Techniques for improving performance of POS tagger based on Maximum Entropy Model (최대 엔트로피 모텔 기반 품사 태거의 성능 향상 기법)

  • Cho, Min-Hee;Kim, Myoung-Sun;Park, Jae-Han;Park, Eui-Kyu;Ra, Dong-Yul
    • Annual Conference on Human and Language Technology
    • /
    • 2004.10d
    • /
    • pp.73-81
    • /
    • 2004
  • 한국어에서의 품사 결정 문제는 형태론적 중의성 문제도 있지만, 영어에는 발생하지 않는 동품사 중의성 문제로 더 까다롭다. 이러한 문제들은 어휘 문맥을 고려하지 않고서는 해결하기 어렵다. 통계 자료 부족 문제에 쉽게 대처하는 모델이 필요하며 문맥에 따른 품사를 결정하고자 할 때 서로 다른 형태의 여러 가지 어휘 문맥 정보를 반영할 수 있는 모델이 필요하다. 본 논문에서는 이런 점에 가장 적합한 최대 엔트로피(maximum entropy : ME) 모델을 품사태깅 작업에 이용하는 문제에 대해 다룬다. 어휘 문맥 정보를 이용하기 위한 자질함수가 매우 많아지는 문제에 대처하기 위해 필요에 따라 어휘 문맥 정보를 사전화 한다. 본 시스템의 특징으로는 어절 단위 품사 태깅을 위한 처리 기법. 어절의 형태소 분석열에 대한 어절 내부 확률 계산. ME 모델의 정규화 과정 생략에 의한 성능 향상, 디코딩 경로의 확장과 같은 점들이 있다. 실험을 통하여 본 연구의 기법이 높은 성능의 시스템을 달성할 수 있음을 알게 되었다.

  • PDF

Self-Organizing n-gram Model for Automatic Word Spacing (자기 조직화 n-gram모델을 이용한 자동 띄어쓰기)

  • Tae, Yoon-Shik;Park, Seong-Bae;Lee, Sang-Jo;Park, Se-Young
    • Annual Conference on Human and Language Technology
    • /
    • 2006.10e
    • /
    • pp.125-132
    • /
    • 2006
  • 한국어의 자연어처리 및 정보검색분야에서 자동 띄어쓰기는 매우 중요한 문제이다. 신문기사에서조차 잘못된 띄어쓰기를 발견할 수 있을 정도로 띄어쓰기가 어려운 경우가 많다. 본 논문에서는 자기 조직화 n-gram모델을 이용해 자동 띄어쓰기의 정확도를 높이는 방법을 제안한다. 본 논문에서 제안하는 방법은 문맥의 길이를 바꿀 수 있는 가변길이 n-gram모델을 기본으로 하여 모델이 자동으로 문맥의 길이를 결정하도록 한 것으로, 일반적인 n-gram모델에 비해 더욱 높은 성능을 얻을 수 있다. 자기조직화 n-gram모델은 최적의 문맥의 길이를 찾기 위해 문맥의 길이를 늘였을 때 나타나는 확률분포와 문맥의 길이를 늘이지 않았을 태의 확률분포를 비교하여 그 차이가 크다면 문맥의 길이를 늘이고, 그렇지 않다면 문맥의 길이를 자동으로 줄인다. 즉, 더 많은 정보가 필요한 경우는 데이터의 차원을 높여 정확도를 올리며, 이로 인해 증가된 계산량은 필요 없는 데이터의 양을 줄임으로써 줄일 수 있다. 본 논문에서는 실험을 통해 n-gram모델의 자기 조직화 구조가 기본적인 모델보다 성능이 뛰어나다는 것을 확인하였다.

  • PDF

Perspectives on Learning English of Korean·Chinese·Japanese Students in an English Department in Korea (국내 영어학과 수업 내 한·중·일 학생들의 영어 학습에 관한 인식)

  • Lee, Younghwa;Kim, Seon Jae
    • The Journal of the Korea Contents Association
    • /
    • v.15 no.12
    • /
    • pp.650-659
    • /
    • 2015
  • This study reports on the perspectives of Korean Chinese Japanese students (KS CS JS) on learning English at multi-cultural classrooms in Korea. The participants were 32 KS, 10 CS, and 14 JS in EFL writing classes, and the data comprised open-ended questionnaires and interviews. In analyzing the data, 'Intentional content analysis' and 'Critical discourse analysis' were adopted. The findings show that the learning of English in Korea was supported by 80% of JS, 71.9% of KS, and 50% of CS. The highest satisfaction of JS was caused by rich interactions with others. English speaking was the most difficult area for all the groups. Whereas KS (43.8%) used only Korean, CS and JS used both English and Korean for communication. Most KS (78.1%) hesitated to socialize with foreign students despite their wishes. These findings suggest that a variety of programs should be developed so that students share different cultures and use more English in the multi-cultural Korean context.

Moderating Factors associated with Relationship between perceived Needs and Social Service Utilization among Female Marriage Immigrants (여성결혼이민자의 사회서비스이용 결정 연구 : 개인차와 환경의 조절효과 중심)

  • Han, Ji Eun;Lee, Gye Seung
    • Korean Journal of Social Welfare Studies
    • /
    • v.49 no.1
    • /
    • pp.133-161
    • /
    • 2018
  • Despite the amount of government budget and resources used for female immigrants who married Korean spouses, it has not been evaluated yet whether the services designed for the immigrants are actually delivered to potential users with social needs. This study is an attempt to identify moderating factors associated with perceived needs and utilizing services of the Multicultural Family Support Centers. The National Survey on Multicultural Families 2015 is used for the analysis. Findings are as follows: the immigrant with better Korean communication skills would use the center services more when they have needs; the immigrants who lack skills were more likely to use center services in spite of the needs. Secondly, the more female spouses satisfied with their marriages, they were less likely to use the services; however, the moderating effect was not significant, On the other hand, Korean male spouses' patriarchal attitude was statistically significant. According to the results, practical and political implications were suggested.