• 제목/요약/키워드: Web-based language learning system

검색결과 70건 처리시간 0.022초

웹 기반의 한자 쓰기 교육 시스템 (A Web-based Chinese Characters Training System)

  • 이혜선;권훈;김정희;이상준;곽호영
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2006년도 추계 종합학술대회 논문집
    • /
    • pp.292-295
    • /
    • 2006
  • 우리가 현재 구사하고 있는 단어의 70% 이상이 한자로 되어 있는 만큼 무엇보다도 정확한 의미 전달을 위해 한자 교육의 필요성은 날로 높아져 가고 있다. 최근에는 단순히 한자의 독음만이 아닌 한자를 정확히 쓰는 것에 대한 관심이 높아지고 있으며, 이에 따른 서적들과 인터넷을 이용한 콘텐츠들이 개발되어지고 있다. 그러나 현재 웹을 이용하여 개발되어진 한자 교육을 위한 콘텐츠들은 대부분 한자의 독음과 해석만을 중심으로 구성되어 있다. 또한 한자 쓰기에 대해서는 한자를 출력해서 연습할 수 있도록 하는 학습지형태로 제공하고 있다. 따라서 한자 쓰기에 대한 비중이 많이 미약하다. 이에 본 논문에서는 웹 기반의 한자 쓰기 시스템을 설계하고자 한다. 이를 통해 사용자는 마우스를 이용하여 직접 한자를 써 보고, 그에 따른 학습 진도를 관리할 수 있다. 또한 이 시스템은 웹을 이용하여 인터넷이 연결된 어느 곳에서든지 사용할 수 있는 시스템을 제공하는데 그 목적이 있다.

  • PDF

자연어 처리 기반 맞춤형 트윗 추천 시스템 (Natural Language Processing-based Personalized Twitter Recommendation System)

  • 이현창;유동필;정가빈;남용욱;김용혁
    • 한국융합학회논문지
    • /
    • 제9권12호
    • /
    • pp.39-45
    • /
    • 2018
  • 트위터 사용자는 팔로우, 리트윗 등을 사용하여 자신이 관심 있어 하는 트윗을 찾는다. 하지만 사용자가 3억여 명에 달하는 트위터에서 사용자가 관심 있는 트윗을 찾기는 힘든 일이다. 이를 해결하기 위해 본 논문에서는 사용자 맞춤형 트윗 추천 시스템을 개발하였다. 우선, 사용자에게 추천할 수 있을 만한 가치가 있는 트윗을 수집하기 위해 현재 트랜드를 수집하고, 트랜드에 대해 이야기하는 인기 있는 트윗들을 수집한다. 이후 사용자를 분석하고 맞춤형 트윗을 추천하기 위해 사용자의 트윗과 수집한 트윗을 범주화한다. 최종적으로 웹서비스를 이용하여 사용자에게 본인과 카테고리가 일치하는 트윗과 관심사가 일치하는 사용자를 추천해준다. 결과적으로 67.2%로 적절한 트윗을 추천하였다.

대형 사전훈련 모델의 파인튜닝을 통한 강건한 한국어 음성인식 모델 구축 (Building robust Korean speech recognition model by fine-tuning large pretrained model)

  • 오창한;김청빈;박기영
    • 말소리와 음성과학
    • /
    • 제15권3호
    • /
    • pp.75-82
    • /
    • 2023
  • 자동 음성 인식(automatic speech recognition, ASR)은 딥러닝 기반 접근 방식으로 혁신되었으며, 그중에서도 자기 지도 학습 방법이 특히 효과적일 수 있음이 입증되고 있다. 본 연구에서는 다국어 ASR 시스템인 OpenAI의 Whisper 모델의 한국어 성능을 향상시키는 것을 목표하여 다국어 음성인식 시스템에서의 비주류 언어의 성능 문제를 개선하고자 한다. Whisper는 대용량 웹 음성 데이터 코퍼스(약 68만 시간)에서 사전 학습되었으며 주요 언어에 대한 강력한 인식 성능을 입증했다. 그러나 훈련 중 주요 언어가 아닌 한국어와 같은 언어를 인식하는 데 어려움을 겪을 수 있다. 우리는 약 1,000시간의 한국어 음성으로 구성된 추가 데이터 세트로 Whisper 모델을 파인튜닝하여 이 문제를 해결한다. 또한 동일한 데이터 세트를 사용하여 전체 훈련된 Transformer 모델을 베이스 라인으로 선정하여 성능을 비교한다. 실험 결과를 통해 Whisper 모델을 파인튜닝하면 문자 오류율(character error rate, CER) 측면에서 한국어 음성 인식 기능이 크게 향상되었음을 확인할 수 있다. 특히 모델 크기가 증가함에 따라 성능이 향상되는 경향을 포착하였다. 그러나 Whisper 모델의 영어 성능은 파인튜닝 후 성능이 저하됨을 확인하여 강력한 다국어 모델을 개발하기 위한 추가 연구의 필요성을 확인할 수 있었다. 추가적으로 우리의 연구는 한국어 음성인식 애플리케이션에 파인튜닝된 Whisper 모델을 활용할 수 있는 가능성을 확인할 수 있다. 향후 연구는 실시간 추론을 위한 다국어 인식과 최적화에 초점을 맞춰 실용적 연구를 이어갈 수 있겠다.

리눅스 기반의 인터넷 원격 교육 시스템 개발-교재 설계 모듈을 중심으로 (A the internet distance education system development of the LINUXBASED subtitle - A the center of textbook design module)

  • 성평식
    • 한국컴퓨터산업학회논문지
    • /
    • 제2권2호
    • /
    • pp.141-150
    • /
    • 2001
  • 본 논문은 인터넷을 통해 개발이 이루어진 운영체제로서 네트워크 지원에 관련된 기능이 매우 우수한 리눅스 TUI (Text user interface)/GUI(Graphic user Interface) 환경에서 개발된 원격 교육을 위한 교재 설계 및 저작 모듈의 전반전인 개발 원리와 세부 시스템의 알고리듬을 소개하고자 한다. 리눅스는 지원하는 네트워크 프로토콜(Protocol) 이 다양하여 TCP/IP는 물론 다른 프로토콜 지원으로 많은 이 기종들과 네트워크 상에서 원활한 네트워크 자원을 공유할 수 있으므로 기존의 Windows NT와의 용이한 integration은 물론이고 Windows NT나 Windows 2000 에 비해서 낮은 사양의 하드웨어 환경으로도 높은 수준의 서비스를 제공할 수 있으므로 예산에 많은 제약을 받고 있는 학교 교육 환경에 가장 적합한 네트워크 운영 시스템이라고 할 수 있다. 원격 교육시스템의 개발 환경은 웹서버는 아파치 서버를, 교재 설계와 저작 모듈을 위한 응용프로그램은 component 기반의 Java bean을, 웹개발 즉 HTML 문서는 PHP를, DBMS 는 MySQL 서버를 사용하고 있다.

  • PDF

지식베이스 구축을 위한 한국어 위키피디아의 학습 기반 지식추출 방법론 및 플랫폼 연구 (Knowledge Extraction Methodology and Framework from Wikipedia Articles for Construction of Knowledge-Base)

  • 김재헌;이명진
    • 지능정보연구
    • /
    • 제25권1호
    • /
    • pp.43-61
    • /
    • 2019
  • 최근 4차 산업혁명과 함께 인공지능 기술에 대한 연구가 활발히 진행되고 있으며, 이전의 그 어느 때보다도 기술의 발전이 빠르게 진행되고 있는 추세이다. 이러한 인공지능 환경에서 양질의 지식베이스는 인공지능 기술의 향상 및 사용자 경험을 높이기 위한 기반 기술로써 중요한 역할을 하고 있다. 특히 최근에는 인공지능 스피커를 통한 질의응답과 같은 서비스의 기반 지식으로 활용되고 있다. 하지만 지식베이스를 구축하는 것은 사람의 많은 노력을 요하며, 이로 인해 지식을 구축하는데 많은 시간과 비용이 소모된다. 이러한 문제를 해결하기 위해 본 연구에서는 기계학습을 이용하여 지식베이스의 구조에 따라 학습을 수행하고, 이를 통해 자연어 문서로부터 지식을 추출하여 지식화하는 방법에 대해 제안하고자 한다. 이러한 방법의 적절성을 보이기 위해 DBpedia 온톨로지의 구조를 기반으로 학습을 수행하여 지식을 구축할 것이다. 즉, DBpedia의 온톨로지 구조에 따라 위키피디아 문서에 기술되어 있는 인포박스를 이용하여 학습을 수행하고 이를 바탕으로 자연어 텍스트로부터 지식을 추출하여 온톨로지화하기 위한 방법론을 제안하고자 한다. 학습을 바탕으로 지식을 추출하기 위한 과정은 문서 분류, 적합 문장 분류, 그리고 지식 추출 및 지식베이스 변환의 과정으로 이루어진다. 이와 같은 방법론에 따라 실제 지식 추출을 위한 플랫폼을 구축하였으며, 실험을 통해 본 연구에서 제안하고자 하는 방법론이 지식을 확장하는데 있어 유용하게 활용될 수 있음을 증명하였다. 이러한 방법을 통해 구축된 지식은 향후 지식베이스를 기반으로 한 인공지능을 위해 활용될 수 있을 것으로 판단된다.

웹 기반 주의력 검사의 사용자 인터페이스 설계: 회귀억제 과제와 그래픽 UI를 중심으로 (User Centered Interface Design of Web-based Attention Testing Tools: Inhibition of Return(IOR) and Graphic UI)

  • 곽지은;곽호완
    • 인지과학
    • /
    • 제19권4호
    • /
    • pp.331-367
    • /
    • 2008
  • 웹 기반 신경심리검사의 타당도를 저해할 수 있는 요인들에 대한 해결책의 일환으로 검사 툴의 인터페이스 디자인을 개선하고자 세 단계를 거쳐 연구를 진행하였다. 연구 1은 곽호완의 웹 기반 신경심리검사 중 주의력 검사 툴의 UI 디자인 문제점을 파악하기 위한 것으로, 전문가에 의한 발견적 시찰법을 실시하였다. 그 결과, 이 검사 툴의 지시 화면, 조사 양식, 과제 화면, 결과 화면 등의 디자인에서 세부적인 사용성 문제점들이 드러났다. 연구 2는 찾아낸 사용성 문제점을 해결하기 위해 웹 기반 주의력 검사에 특화된 11개 디자인 가이드라인을 도출하였다. 이를 토대로 사용자의 작업 흐름에 맞추어 화면 구성과 사이트 구조 등을 최적화하고 재미 요소를 가미하여 검사 툴을 새롭게 디자인 한 다음, JAVA를 이용하여 프로토타입을 개발하였다. 이렇게 구현한 개선 툴(그래픽 툴)이 기존 툴(텍스트 툴)에 비해 더 효과적임을 검증하기 위해, 연구 3에서 사용자들을 대상으로 수행 측정과 설문 조사를 실시하여, 실수 유형과 출현비율 및 UI 만족도를 측정하였다. 수행 측정 결과, 그래픽 툴이 텍스트 툴에 비해 UI 디자인 문제들로 인해 발생하는 사용자 실수 유형과 출현비율이 유의하게 감소하였다. 사후 설문 조사 분석 결과, 텍스트 툴에 비해 그래픽 툴은 전반적인 만족도, 화면, 용어와 시스템 정보, 학습 용이성, 시스템 성능 등의 만족도 측면에서 우수한 것으로 입증되었다.

  • PDF

개념 망 구조를 기반으로 한 문항 관리 시스템의 설계 및 구현 (Design and Implementation of a Question Management System based on a Concept Lattice)

  • 김미혜
    • 한국콘텐츠학회논문지
    • /
    • 제8권11호
    • /
    • pp.412-425
    • /
    • 2008
  • 이-러닝을 통한 교육에 있어 학습자의 학업 성취도를 향상시킬 수 있는 중요한 요인 중의 하나는 다양한 평가문항을 제공하여 학습자가 원하는 주제의 문제들을 용이하게 검색하여 학습할 수 있도록 지원하는 것이다. 그러나 평가문항을 위한 시스템은 주로 구문해석에 기반 한 키워드 검색과 영역별 단원 중심의 계층적인 분류체계에만 의존하고 있어 영역별 연관 관계에 의한 통합된 유형의 문항 검색에는 어려움을 지닌다. 본 논문에서는 C언어 프로그래밍 학습을 위한 문항을 웹상에서 쉽게 관리하고 유지할 수 있는 더불어 관리된 문항들을 효과적으로 검색하여 활용할 수 있는 문항관리 및 검색 시스템을 설계하고 구현 하였다. 제안된 문항 검색 시스템은 사용자 질의가 가지는 의미로부터 문항간의 개념적 연관 관계에 의한 검색을 가능하게 함으로써 단일 주제의 문항뿐만 아니라 영역별 연관 관계에 의한 통합된 유형의 문항들을 편리하게 검색하여 학습에 활용할 수 있도록 하였다. 따라서 제안된 시스템은 교과의 기본적인 원리, 개념의 이해뿐만 아니라 종합적인 지식 활용 및 문제 해결 능력 향상을 지원하는 시스템으로 기대된다.

사전과 말뭉치를 이용한 한국어 단어 중의성 해소 (Korean Word Sense Disambiguation using Dictionary and Corpus)

  • 정한조;박병화
    • 지능정보연구
    • /
    • 제21권1호
    • /
    • pp.1-13
    • /
    • 2015
  • 빅데이터 및 오피니언 마이닝 분야가 대두됨에 따라 정보 검색/추출, 특히 비정형 데이터에서의 정보 검색/추출 기술의 중요성이 나날이 부각되어지고 있다. 또한 정보 검색 분야에서는 이용자의 의도에 맞는 결과를 제공할 수 있는 검색엔진의 성능향상을 위한 다양한 연구들이 진행되고 있다. 이러한 정보 검색/추출 분야에서 자연어처리 기술은 비정형 데이터 분석/처리 분야에서 중요한 기술이고, 자연어처리에 있어서 하나의 단어가 여러개의 모호한 의미를 가질 수 있는 단어 중의성 문제는 자연어처리의 성능을 향상시키기 위해 우선적으로 해결해야하는 문제점들의 하나이다. 본 연구는 단어 중의성 해소 방법에 사용될 수 있는 말뭉치를 많은 시간과 노력이 요구되는 수동적인 방법이 아닌, 사전들의 예제를 활용하여 자동적으로 생성할 수 있는 방법을 소개한다. 즉, 기존의 수동적인 방법으로 의미 태깅된 세종말뭉치에 표준국어대사전의 예제를 자동적으로 태깅하여 결합한 말뭉치를 사용한 단어 중의성 해소 방법을 소개한다. 표준국어대사전에서 단어 중의성 해소의 주요 대상인 전체 명사 (265,655개) 중에 중의성 해소의 대상이 되는 중의어 (29,868개)의 각 센스 (93,522개)와 연관된 속담, 용례 문장 (56,914개)들을 결합 말뭉치에 추가하였다. 품사 및 센스가 같이 태깅된 세종말뭉치의 약 79만개의 문장과 표준국어대사전의 약 5.7만개의 문장을 각각 또는 병합하여 교차검증을 사용하여 실험을 진행하였다. 실험 결과는 결합 말뭉치를 사용하였을 때 정확도와 재현율에 있어서 향상된 결과가 발견되었다. 본 연구의 결과는 인터넷 검색엔진 등의 검색결과의 성능향상과 오피니언 마이닝, 텍스트 마이닝과 관련한 자연어 분석/처리에 있어서 문장의 내용을 보다 명확히 파악하는데 도움을 줄 수 있을 것으로 기대되어진다.

Bi-LSTM 기반의 한국어 감성사전 구축 방안 (KNU Korean Sentiment Lexicon: Bi-LSTM-based Method for Building a Korean Sentiment Lexicon)

  • 박상민;나철원;최민성;이다희;온병원
    • 지능정보연구
    • /
    • 제24권4호
    • /
    • pp.219-240
    • /
    • 2018
  • 감성사전은 감성 어휘에 대한 사전으로 감성 분석(Sentiment Analysis)을 위한 기초 자료로 활용된다. 이와 같은 감성사전을 구성하는 감성 어휘는 특정 도메인에 따라 감성의 종류나 정도가 달라질 수 있다. 예를 들면, '슬프다'라는 감성 어휘는 일반적으로 부정의 의미를 나타내지만 영화 도메인에 적용되었을 경우 부정의 의미를 나타내지 않는다. 그렇기 때문에 정확한 감성 분석을 수행하기 위해서는 특정 도메인에 알맞은 감성사전을 구축하는 것이 중요하다. 최근 특정 도메인에 알맞은 감성사전을 구축하기 위해 범용 감성 사전인 오픈한글, SentiWordNet 등을 활용한 연구가 진행되어 왔으나 오픈한글은 현재 서비스가 종료되어 활용이 불가능하며, SentiWordNet은 번역 간에 한국 감성 어휘들의 특징이 잘 반영되지 않는다는 문제점으로 인해 특정 도메인의 감성사전 구축을 위한 기초 자료로써 제약이 존재한다. 이 논문에서는 기존의 범용 감성사전의 문제점을 해결하기 위해 한국어 기반의 새로운 범용 감성사전을 구축하고 이를 KNU 한국어 감성사전이라 명명한다. KNU 한국어 감성사전은 표준국어대사전의 뜻풀이의 감성을 Bi-LSTM을 활용하여 89.45%의 정확도로 분류하였으며 긍정으로 분류된 뜻풀이에서는 긍정에 대한 감성 어휘를, 부정으로 분류된 뜻풀이에서는 부정에 대한 감성 어휘를 1-gram, 2-gram, 어구 그리고 문형 등 다양한 형태로 추출한다. 또한 다양한 외부 소스(SentiWordNet, SenticNet, 감정동사, 감성사전0603)를 활용하여 감성 어휘를 확장하였으며 온라인 텍스트 데이터에서 사용되는 신조어, 이모티콘에 대한 감성 어휘도 포함하고 있다. 이 논문에서 구축한 KNU 한국어 감성사전은 특정 도메인에 영향을 받지 않는 14,843개의 감성 어휘로 구성되어 있으며 특정 도메인에 대한 감성사전을 효율적이고 빠르게 구축하기 위한 기초 자료로 활용될 수 있다. 또한 딥러닝의 성능을 높이기 위한 입력 자질로써 활용될 수 있으며, 기본적인 감성 분석의 수행이나 기계 학습을 위한 대량의 학습 데이터 세트를 빠르게 구축에 활용될 수 있다.

전통문화 콘텐츠 표준체계를 활용한 자동 텍스트 분류 시스템 (A System for Automatic Classification of Traditional Culture Texts)

  • 허윤아;이동엽;김규경;유원희;임희석
    • 한국융합학회논문지
    • /
    • 제8권12호
    • /
    • pp.39-47
    • /
    • 2017
  • 한국 문화의 역사, 전통과 관련된 디지털 웹 문서가 증가하게 되었다. 하지만 창작자 또는 전통 문화와 관련된 소재를 찾는 사용자들은 정보를 검색해도 결과가 충분하지 않았으며 원하는 정보를 얻지 못하는 경우가 나타나고 있다. 이런 효과적인 정보를 접하기 위해서는 문서 분류가 필요하다. 과거에 문서 분류는 작업자가 수작업으로 문서 분류하여 시간과 비용이 많이 소비하는 어려움이 있었지만, 최근 기계학습 기반으로 한 자동 문서 분류를 통해 효율적인 문서 분류가 이루어진다. 이에 본 논문은 전통문화 콘텐츠를 체계적인 분류체계로 구성한 한민족정보문화마당 데이터를 기반으로 전통문화 콘텐츠 자동 텍스트 분류 모델을 개발한다. 본 연구는 한민족정보문화마당 텍스트 데이터에 대해 단어 빈도수를 추출하기 위해 TF-IDF모델, Bag-of-Words 모델, TF-IDF/Bag-of-Words를 결합한 모델을 적용하여 각각 SVM 분류 알고리즘을 사용하여 전통문화 콘텐츠 자동 텍스트 분류 모델을 개발하여 성능평가를 확인하였다.