• 제목/요약/키워드: 한글 학습

검색결과 878건 처리시간 0.021초

인지이론과 ART 신경회로망에 기반한 한글 문자 분류 모델 (Hangeul Character Classification Model Based on Cognitive Theory and ART Neural Network)

  • 박중양;박재흥;장재혁
    • 한국콘텐츠학회논문지
    • /
    • 제5권5호
    • /
    • pp.33-42
    • /
    • 2005
  • 본 논문에서는 ART 신경회로망의 성능을 개선하기 위해, 불필요한 클러스터의 생성과 변화를 억제하여 효율적인 패턴 분류가 가능하도록 하는 학습 알고리즘을 제안한다. 또한, 패턴 분류의 정확성을 향상시키기 위해 한글의 구조적 특징을 이용한 위치추출 알고리즘을 적용하였다. 제안하는 학습 알고리즘은 현재 학습되는 패턴과 최초 패턴간의 일치도를 비교한 후 리세트 시스템을 작동케 한다. 그 결과, 신경회로 망은 이미 입력되었던 패턴이 다시 입력되어도 새로운 클러스터의 생성을 방지하여 오인식율을 줄이게 된다.

  • PDF

오타에 강건한 자모 조합 임베딩 기반 한국어 품사 태깅 (A typing error-robust Korean POS tagging using Hangul Jamo combination-based embedding)

  • 서대룡;정유진;강인호
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2017년도 제29회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.203-208
    • /
    • 2017
  • 본 논문은 한글 자모 조합 임베딩을 이용하여 오타에 강건한 한국어 품사 태깅 시스템을 구축하는 방법에 대해 기술한다. 최근 딥 러닝 연구가 활발히 진행되면서 자질을 직접 추출해야 하는 기존의 기계학습 방법이 아닌, 스스로 자질을 찾아서 학습하는 딥 러닝 모델을 이용한 연구가 늘어나고 있다. 본 논문에서는 다양한 딥 러닝 모델 중에서 sequence labeling에 강점을 갖고 있는 bidirectional LSTM CRFs 모델을 사용하였다. 한국어 품사 태깅 문제에서 일반적으로 사용되는 음절 임베딩은 약간의 오타에도 품사 태깅 성능이 크게 하락하는 한계가 있었다. 따라서 이를 개선하기 위해 본 논문에서는 한글 자모 임베딩 값을 조합시킨 음절 임베딩 방식을 제안하였다. 강제로 오타를 발생시킨 테스트 집합에서 실험한 결과, 자모 조합 임베딩 기법이 word2vec 음절 임베딩 방식에 비해 형태소 분할은 0.9%, 품사 태깅은 3.5% 우수한 성능을 기록하였다.

  • PDF

한글 자음과 모음결합을 이용한 학습용 퍼즐게임 구현 (Implementation of Learning Puzzle Game by using Combination of Korean Alphabet)

  • 조재영;김윤호
    • 디지털콘텐츠학회 논문지
    • /
    • 제7권4호
    • /
    • pp.257-261
    • /
    • 2006
  • 본 논문에서는 한글의 자음과 모음을 별도로 분류 한 후, 자음과 모음을 실시간으로 조합하여 단어를 만드는 퍼즐게임을 구현하였다. 단어 조합기는 API 에서 지원하는 에디터를 이용하여 구현하였고, 효율적인 조합단어의 검색을 위하여 초기 합성소 자음기반 방식을 이용하였다. 구현된 한글 조합 퍼즐게임은 아동들의 단어 학습 능력의 향상과 한글과 친해질 수 있는 기대 효과를 갖는다.

  • PDF

복수 음운 정보를 이용한 영.한 음차 표기 (English-to-Korean Transliteration using Multiple Unbounded Overlapping Phonemes)

  • 강인호;김길창
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1999년도 제11회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.50-54
    • /
    • 1999
  • 본 연구에서는 기존의 한정된 길이의 영어 또는 한글의 발음 단위를 이용하던 자동 음차 표기 방식과 달리, 학습 데이터에서 추출한 임의 길이의 음운 패턴을 사용하는 방법을 제안한다. 통계적 정보에 기반하여 추출한 음차 표기 패턴과 외래어 표기 규칙에 기반하여 기술한 음차 표기 패턴을 위치와 길이에 관계없이 사용하여 주어진 영어 단어의 한글 음차 표기를 얻어낸다. 제안하는 방법은 먼저 주어진 영어 단어의 가능한 모든 발음 단위를 기준으로 한글 표기 네트워크를 만든 후, 학습 데이터에서 추출한 음운 패턴을 교차 적용시켜 네트워크 각 노드의 가중치를 결정한다. 가중치가 결정된 네트워크에서 가중치의 합이 가장 좋은 경로를 찾아냄으로 해서 음차 표기를 수행한다. 본 연구에서 제안하는 방법으로 실험을 한 결과 자소 단위 86.5%, 단어 단위 55.3%의 정확률을 얻을 수 있었다.

  • PDF

한국어 트위터의 감정 분석 도구 (A Sentiment Analysis Tool for Korean Twitter)

  • 서형원;전길호;최명길;남유림;김재훈
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2011년도 제23회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.94-97
    • /
    • 2011
  • 본 논문은 자동으로 한글 트위터 메시지(트윗: tweet)에 포함된 감정을 분석하는 방법에 대하여 기술한다. 제안된 시스템에 의하여 수집된 트윗들은 어떤 질의에 대해 긍정 혹은 부정으로 분류된다. 이것은 일반적으로 어떤 상품을 구매하기 원하는 고객이나, 상품에 대한 고객들의 평가를 수집하기 원하는 기업에게 유용하다. 영문 트윗에 대한 연구는 이미 활발하게 진행되고 있지만 한글 트윗, 특히 감정 분류에 대한 연구는 아직 공개된 것이 없다. 수집된 트윗들은 기계 학습(Naive Bayes, Maximum Entropy, 그리고 SVM)을 이용하여 분류하였고 한글 특성에 따라 자질 선택의 기본 단위를 2음절과 3음절로 나누어 실험하였다. 기존의 영어에 대한 연구는 80% 이상의 정확도를 가지는 반면에, 본 실험에서는 60% 정도의 정확도를 얻을 수 있었다.

  • PDF

중국에서의 한류콘텐츠 선호가 한국상품 구매, 한국방문 및 한글학습의도에 미치는 영향 (How Chinese Population's Preference to Korean Wave Contents does Influence their Intent to Purchase Korean Product, Visit Korea and Learn Hangul)

  • 김주연;안경모
    • 한국콘텐츠학회논문지
    • /
    • 제12권5호
    • /
    • pp.447-458
    • /
    • 2012
  • 드라마를 시작으로 하여 시작된 중국에서의 한류는 최근 K-pop의 인기로 그 여파를 이어가고 있다. 이로 인해 한국상품 수출이 증가하고, 한국을 방문하거나, 한글을 배우려는 인구가 증가하였다. 본 연구에서는 드라마, 영화, K-pop, 게임 등 한류콘텐츠가 한국상품 구매의도, 한국방문의도, 한글학습의도 등에 미치는 영향을 실증적으로 분석하였다. 그 결과, 한류의 영향을 가장 많이 받은 것으로 파악되는 한국상품인 화장품과 의류의 구매의도에 영향을 미치는 한류콘텐츠는 드라마인 것으로 파악되었으며, K-pop도 유의한 영향을 미치는 것으로 분석되었다. 한국방문의도, 미용 성형관광과 한국음식구매의도에 있어서도 드라마에 대한 선호가 미치는 영향이 가장 높았으며 K-pop이 그 다음으로 유의한 영향을 미쳤다. 또한, 한글학습의도에 영향을 미친 한류콘텐츠는 드라마와 K-pop이었으며, 이 중 K-pop이 미친 영향력이 더 큰 것으로 분석되었다.

한글 환경에서의 언어 교육 시스템 개발 (Development of Language-Learning Courseware in Korean Environments)

  • 김혜경;윤애선;이미화
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1998년도 제10회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.335-340
    • /
    • 1998
  • 최근 컴퓨터 통신 기술의 발달로 인하여 교육분야에서의 컴퓨터 통신망을 이용한 학습의 효율성 증대에 대한 연구가 활발하다. 지금까지의 학습 방식은 교과목 특성의 개별성을 인식하지 못하거나 혹은 기술적인 문제점 등으로 인하여 학습자들에게 일관된 단답형이나 선다형의 학습 방식을 요구하여 왔다. 웹을 기반으로 한 원격 교육으로의 활용 측면에서 프랑스어와 같은 제2외국어의 경우, 한국어 환경에서의 프랑스어 악상 문자 입력이나 개별화된 저작 언어 개발 등의 문제점이 제기된다. $\lceil$Voila-web$\rfloor$ 은 한국어를 모국어로 하는 프랑스어 학습자들을 위한 교육 시스템으로 개별 교과목의 특성을 반영하고 능동적인 학습 방식을 통한 학습의 효율성 증대를 위한 시스템이다. 학습자들에게는 학습 자료의 전체적인 내용 흐름만을 제시하고 영역별 구체적인 자료의 전개는 다양한 교과 내용을 자유 항해할 수 있도록 설계되어 있다. 이는 학습자들로 하여금 통신망을 통한 컴퓨터 이용 학습의 장점을 기존의 학습 방식에 보완하여 보다 능동적인 학습 방식을 유도하여 학습의 효율성을 증대시킬 수 있다.

  • PDF

심층학습을 이용한 음절태깅 기반의 외래어 인식 시스템 (Loanword Recognition Using Deep Learning)

  • 박호민;김창현;천민아;노경목;김재훈
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2017년도 제29회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.71-75
    • /
    • 2017
  • 외래어란 외국어로부터 들어와 한국어에 동화되고 한국어로서 사용되는 언어이다. 나날이 우리의 언어사용 문화에서 외래어의 사용 비율은 높아져가는 추세로, 전문분야에서는 특히 두드러진다. 그러므로 더 효율적이고 효과적인 자연언어처리를 위해서 문서 내 외래어 인식은 중요한 전처리 과정이다. 따라서 본 논문에서는 bidirectional LSTM(이하 bi-LSTM)-CRF 모형의 심층학습을 이용한 음절태깅 기반의 외래어 인식 시스템을 제안한다. 제안하는 시스템의 외래어 인식 학습 과정은 다음과 같다. 첫째, 학습용 말뭉치 자료의 한글 음절들과 공백, 마침표(.)를 토대로 word2vec을 통해 학습용 피쳐(feature) 자료를 생성한다. 둘째, 학습용 말뭉치 자료와 학습용 피쳐 자료를 결합하여 bi-LSTM 모형 학습 자료를 구축한다. 셋째, bi-LSTM 모형을 거쳐 학습된 결과물을 CRF 모형에서 로그 가능도(log likelyhood)와 비터비(Viterbi) 알고리즘을 통해 학습 결과물을 내놓는다. 넷째, 학습용 말뭉치 자료의 정답과 비교한 뒤 모형 내부의 수치들을 조정한다. 다섯째, 학습을 마칠 때까지 반복한다. 본 논문에서 제안하는 시스템을 이용하여 자체적인 뉴스 수집 자료에 대해서 높은 정확도와 재현율을 기록하였다.

  • PDF

한글 문자의 서체 분류

  • 김삼수;김수형
    • 한국통계학회:학술대회논문집
    • /
    • 한국통계학회 2002년도 춘계 학술발표회 논문집
    • /
    • pp.113-118
    • /
    • 2002
  • 본 논문에서는 한글 문자의 세리프(serif) 계열과 산세리프(sans-serif) 계열의 분류를 위한 특징을 제안한다. 한글의 서체는 세로획의 시작 부분에 장식 세리프(돌기)가 있는 세리프 계열과 그렇지 않은 산세리프 계열로 나눌 수 있다. 제안하는 한글 문자의 서체 분류 방법은 세리프 형태에서 추출한 특징을 이용하여 세리프 또는 산세리프 클래스로 분류하고, 각 클래스별로 적합한 특징 및 분류기를 학습하여 보다 다양한 서체를 인식하도록 계층적으로 설계한다. 제안한 특징의 유용성을 입증하기 위한 실험은 명조, 바탕, 궁서, 고딕, 돋움, 굴림 서체의 3,000개 낱자 영상에 적용하였다.

  • PDF

Transformer를 사용한 이미지 캡셔닝 및 비디오 캡셔닝 (Image captioning and video captioning using Transformer)

  • 김기덕;이근후
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2023년도 제67차 동계학술대회논문집 31권1호
    • /
    • pp.303-305
    • /
    • 2023
  • 본 논문에서는 트랜스포머를 사용한 이미지 캡셔닝 방법과 비디오 캡셔닝 방법을 제안한다. 트랜스포머의 입력으로 사전 학습된 이미지 클래스 분류모델을 거쳐 추출된 특징을 트랜스포머의 입력으로 넣고 인코더-디코더를 통해 이미지와 비디오의 캡션을 출력한다. 이미지 캡셔닝의 경우 한글 데이터 세트를 학습하여 한글 캡션을 출력하도록 학습하였으며 비디오 캡셔닝의 경우 MSVD 데이터 세트를 학습하여 학습 후 출력 캡션의 성능을 다른 비디오 캡셔닝 모델의 성능과 비교하였다. 비디오 캡셔닝에서 성능향상을 위해 트랜스포머의 디코더를 변형한 GPT-2를 사용하였을 때 BLEU-1 점수가 트랜스포머의 경우 0.62, GPT-2의 경우 0.80으로 성능이 향상됨을 확인하였다

  • PDF