• 제목/요약/키워드: 텍스트수준

검색결과 267건 처리시간 0.023초

과학 텍스트 의미지도 읽기 전략이 고등학생의 추론적 이해에 미치는 영향 (The Effects of Semantic Mapping as a Science Text Reading Strategy On High School Students' Inferential Comprehension)

  • 이수진;박지훈;남정희
    • 대한화학회지
    • /
    • 제67권5호
    • /
    • pp.362-377
    • /
    • 2023
  • 이 연구는 과학 텍스트 읽기 전략으로 의미지도가 고등학생의 추론적 이해에 미치는 영향을 알아보는 것을 목적으로 하였다. 이를 위해 고등학교 3학년 과학중점반 2개 학급 학생 46명을 대상으로 한 학기 동안 의미지도 읽기 전략을 활용하여 8개 주제의 과학 텍스트 읽기 수업을 실시하였다. 의미지도 읽기 전략이 과학 텍스트의 추론적 이해에 미치는 영향을 알아보기 위해 학생들이 작성한 사전·사후 읽기 능력 검사지를 비교 분석하였다. 추론적 이해 변화를 알아보기 위해 추론적 이해 분석틀을 개발하여 추론적 이해 수준을 분석하였다. 추론적 이해 변화를 분류하기 위해 추론적 이해 분석틀의 세부 항목인 3개 항목의 수준을 점수로 환산하였다. 학생들의 추론적 이해 변화 분석 결과는 의미지도 읽기 전략 수업이 고등학생의 추론적 이해 변화에 영향을 미쳤으며, 특히 추론적 이해의 하위 유형 중 교량 추론과 정교화 추론에 영향을 미치는 것으로 나타났다.

유전 알고리즘 기반 한글 텍스트 스테가노그래피의 연구 (A Study of Hangul Text Steganography based on Genetic Algorithm)

  • 지선수
    • 한국산업정보학회논문지
    • /
    • 제21권3호
    • /
    • pp.7-12
    • /
    • 2016
  • 인터넷의 적대적인 환경에서 보안성을 향상시키기 위해 스테가노그래피는 커버 매체 내부에 비밀 메시지를 숨기는데 초점을 두고 있다. 즉 암호화의 보완이다. 이 논문에서 한글을 이용한 텍스트 스테가노그래피 기법을 제안한다. 보안 수준을 높이기 위해 비밀 메시지는 유전 알고리즘 연산자 교차를 통해 암호화한다. 커버 매체의 특성과 구조 변화가 없는 스테고 텍스트 형태를 만들기 위한 커버 텍스트로 메시지를 삽입한다. 커버 매체에 3.69% 삽입 용량을 유지하기 위해, 스테고 텍스트의 크기가 14%로 증가되는 것을 확인할 수 있다.

말레이시아 학생들의 L2 읽기 문제: 한국 대학의 사례를 중심으로 (L2 Reading Difficulties Faced by Malaysian Students in a Korean University)

  • 김경란
    • 디지털융복합연구
    • /
    • 제19권2호
    • /
    • pp.21-32
    • /
    • 2021
  • 본 연구는 말레이시아 대학생들의 인식을 통해 그들의 유창한 L2 구두 능력이 고급 수준의 텍스트를 읽는데 어떻게 반영되는지와 독해 과정에서는 어떠한 어려움을 보이는지를 조사했다. 연구의 참여자는 한국 대학에 재학 중인 9명의 말레이시아 학생들로서 반 구조화 형식의 심층 면접에 참여했다. 수집된 자료는 학생들이 L2를 매우 익숙한 언어로 받아들이고 있고, 그에 따른 학생들의 유창한 구두 능력이 일반적 수준의 L2 읽기에 대한 부담감을 덜어주는 효과가 있다는 점을 보여주었다. 그러나 그들의 구두 능력이 고급 수준의 텍스트를 읽고 이해하는 데는 큰 영향을 주지 못했다. 학생들이 언급한 읽기의 어려움은 주로 어휘 지식의 부족에서 기인했으나, 배경지식과 흥미의 부족 또한 읽기 능력을 방해하는 요소로 작용했다. 이러한 요소들은 텍스트에 대한 부정확한 이해를 유발하고, 텍스트에 담긴 속뜻을 찾으려는 의지를 상실시킴으로써 학생들의 독해능력을 저하시키는 것으로 나타났다. 이 결과물은 국제학생뿐만 아니라 한국 학생들의 읽기 수업에도 적용되어 중요하게 다루어질 필요가 있다.

빅데이터 환경에서 텍스트마이닝 기법을 활용한 공공문서 분류체계의 적용사례 연구 (Case Study on Public Document Classification System That Utilizes Text-Mining Technique in BigData Environment)

  • 심장섭;이강욱
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2015년도 추계학술대회
    • /
    • pp.1085-1089
    • /
    • 2015
  • 과거의 텍스트마이닝기법은 텍스트 자체의 복잡성과 텍스트 내에 산재한 변수의 자유도 때문에 분석 알고리즘을 구현하는데 어려움이 있었다. 의미 있는 정보를 얻기 위하여 어렵게 알고리즘을 구현했다고 하더라도, 기계적으로 텍스트 분석에 소요되는 시간이 텍스트를 사람이 직접 읽어 분석 하는 것보다 많은 시간이 요구 되었다. 그러나 최근 하드웨어와 분석 알고리즘의 발전과 함께 빅데이터라는 기술이 등장하였으며, 앞에서 설명한 제약사항을 극복할 수 있게 되었고, 텍스트마이닝을 통한 분석이 현실세계에서 그 가치를 충분히 인정받고 있다. 만약, 텍스트의 탐색 수준에서 벗어나 마이닝을 통하여 분석이 가능하다면 텍스트 분석에 소비되는 인적, 물적 자원의 비용을 절감할 수 있기 때문에 공공분야에서 절실히 요구되는 창조적인 일에 더 많은 자원을 효과적으로 활용할 수 있을 것이다. 이에 본 논문에서는 인적 자원이 수작업으로 하는 공공분야 문서 분류의 결과값과 빅데이터 환경에서 텍스트마이닝기반의 문서내 단어 빈도수(TF-IDF)와 문서간 코사인 유사도(Cosine Similarity)를 활용한 공공분야 문서분류의 결과값을 비교하여 평가한다.

  • PDF

한국어 Text-to-Speech 변환을 위한 음운 변동 시스템에 관한 연구 (Implementation to phonological alteration module for a korean text-to-speech)

  • 박수현;권혁철
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1995년도 제7회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.35-38
    • /
    • 1995
  • Text-to-speech 시스템은 텍스트를 입력으로 받아 텍스트와 일치하는 음성을 출력하는 시스템으로, 인간이 자신의 모국어로 텍스트를 읽는 것과 비슷한 수준의 음성을 출력하는 데 목적이 있다. 한국어의 각 단어들은 한 단어 내에 있는 형태소들 사이에 음운 변동 현상을 일으켜 쓰여진 형태와 다르게 발음된다. 그러므로 한국어 텍스트를 자연스럽게 발음하기 위해서는 음운 변동 현상을 효율적으로 처리할 수 있어야 한다. 한국어에서 음운 변동을 일으키는 규칙은 여러 가지이고, 정확한 발음을 위해서는 이러한 규칙들이 차례대로 적용되어져야 한다. 따라서 본 논문에서는 이러한 한국어의 발음상의 특성을 고려하여 two-level 모델에 기반한 음운 변동 시스템을 구현한다.

  • PDF

초등학생을 위한 HTML 텍스트 에디터 개발 연구 (A Study on HTML Text Editor Development for Elementary School Students)

  • 이은영;김갑수
    • 한국정보교육학회:학술대회논문집
    • /
    • 한국정보교육학회 2006년도 하계학술대회
    • /
    • pp.257-262
    • /
    • 2006
  • PISA의 연구 결과에 따르면 컴퓨터 활용 빈도나 ICT 활용 환경 등의 양적 활용 실태는 세계적인 수준이나 프로그램이나 소프트웨어 활동 등의 컴퓨터 질적 활용 정도는 제고될 필요성이 있는 것으로 나타났다. 이는 초등 컴퓨터 교육에도 시사하는 바가 크다. 하지만 인적 물적 여건 등으로 인해 프로그래밍 교육을 초등학교 현장에 바로 적용하기에는 무리가 있다. 따라서 본 논문에서는 언어의 복잡성이 낮고 프로그래밍 단계와 과정이 간단한 HTML을 현장에 효과적으로 적용하기 위한 텍스트 에디터를 개발하고 개선점을 찾아보았다. 텍스트 에디터는 우선 태그를 직접 칠 필요가 없으며 학생들이 쉽게 학습할 수 있도록 도움말을 제시해 주었고 간단한 이미지 뷰어 기능을 통해 쉽게 이미지를 넣을 수 있도록 하였다. 개발된 텍스트 에디터의 효과를 설문지로 조사한 결과 쉽게 HTML 문서를 작성할 수 있어 학습에 도움이 된다는 점과 도움말을 제시한 부분은 긍정적으로 평가된 반면 보다 UI를 좀더 개선해야 한다는 결과가 나왔다.

  • PDF

소셜 데이터와 텍스트 분류 기술을 이용한 개인 맞춤형 학습 시스템 (A Personalized Learning System Using Social Data and Text Classification Techniques)

  • 김선표;김은상;전영호;이기훈
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2014년도 추계학술발표대회
    • /
    • pp.718-720
    • /
    • 2014
  • 정보통신 기기의 발달에 따라 스마트 러닝으로 교육방법이 진화하고 있다. 스마트 러닝에 있어서 학습자의 관심분야에 맞는 적절한 콘텐츠의 제공이 필수적이다. 본 논문에서는 텍스트 분류 기술을 이용하여 학습자의 SNS 데이터로부터 관심분야를 자동적으로 파악해내는 시스템을 제안한다. 텍스트 분류를 위해 카테고리 별로 기 분류되어있는 데이터를 수집하여 기계 학습을 수행하였다. 텍스트 분류의 정확도 향상을 위해 카테고리 분류 단위 크기를 변화시키면서 정확도를 측정하고 분석하여 실제 서비스에 적용 가능한 수준으로 판단되는 82.5%의 정확도를 얻었다.

자동색인을 위한 학습기반 주요 단어(핵심어) 추출에 관한 연구 (Learning-based Automatic Keyphrase Indexing from Korean Scientific LIS Articles)

  • 김혜진;정유경
    • 한국정보관리학회:학술대회논문집
    • /
    • 한국정보관리학회 2017년도 제24회 학술대회 논문집
    • /
    • pp.15-18
    • /
    • 2017
  • 학술 데이터베이스를 통해 방대한 양의 텍스트 데이터에 대한 접근이 가능해지면서, 많은 데이터로부터 중요한 정보를 자동으로 추출하는 것에 대한 필요성 또한 증가하였다. 특히, 텍스트 데이터로부터 중요한 단어나 단어구를 선별하여 자동으로 추출하는 기법은 자료의 효과적인 관리와 정보검색 등 다양한 응용분야에 적용될 수 있는 핵심적인 기술임에도, 한글 텍스트를 대상으로 한 연구는 많이 이루어지지 않고 있다. 기존의 한글 텍스트를 대상으로 한 핵심어 또는 핵심어구 추출 연구들은 단어의 빈도나 동시출현 빈도, 이를 변형한 단어 가중치 등에 근거하여 핵심어(구)를 식별하는 수준에 그쳐있다. 이에 본 연구는 한글 학술논문의 초록으로부터 추출한 다양한 자질 요소들을 학습하여 핵심어(구)를 추출하는 모델을 제안하였고 그 성능을 평가하였다.

  • PDF

자동문서분류를 위한 텐서공간모델 기반 심층 신경망 (A Tensor Space Model based Deep Neural Network for Automated Text Classification)

  • 임푸름;김한준
    • 데이타베이스연구회지:데이타베이스연구
    • /
    • 제34권3호
    • /
    • pp.3-13
    • /
    • 2018
  • 자동문서분류(Text Classification)는 주어진 텍스트 문서를 이에 적합한 카테고리로 분류하는 텍스트 마이닝 기술 중의 하나로서 스팸메일 탐지, 뉴스분류, 자동응답, 감성분석, 쳇봇 등 다양한 분야에 활용되고 있다. 일반적으로 자동문서분류 시스템은 기계학습 알고리즘을 활용하며, 이 중에서 텍스트 데이터에 적합한 알고리즘인 나이브베이즈(Naive Bayes), 지지벡터머신(Support Vector Machine) 등이 합리적 수준의 성능을 보이는 것으로 알려져 있다. 최근 딥러닝 기술의 발전에 따라 자동문서분류 시스템의 성능을 개선하기 위해 순환신경망(Recurrent Neural Network)과 콘볼루션 신경망(Convolutional Neural Network)을 적용하는 연구가 소개되고 있다. 그러나 이러한 최신 기법들이 아직 완벽한 수준의 문서분류에는 미치지 못하고 있다. 본 논문은 그 이유가 텍스트 데이터가 단어 차원 중심의 벡터로 표현되어 텍스트에 내재한 의미 정보를 훼손하는데 주목하고, 선행 연구에서 그 효능이 검증된 시멘틱 텐서공간모델에 기반하여 심층 신경망 아키텍처를 제안하고 이를 활용한 문서분류기의 성능이 대폭 상승함을 보인다.

위키피디어 기반 개념 공간을 가지는 시멘틱 텍스트 모델 (A Semantic Text Model with Wikipedia-based Concept Space)

  • 김한준;장재영
    • 한국전자거래학회지
    • /
    • 제19권3호
    • /
    • pp.107-123
    • /
    • 2014
  • 텍스트마이닝 연구의 기본적인 난제는 기존 텍스트 표현모델이 자연어 문장으로 기술된 텍스트 데이터로부터 의미 또는 개념 정보를 표현하지 않는데 기인한다. 기존 텍스트 표현모델인 벡터공간 모델(vector space model), 불리언 모델(Boolean model), 통계 모델(statistical model), 텐서공간 모델(tensor space model) 등은 'Bag-of-Words' 방식에 바탕을 두고 있다. 이러한 텍스트 모델들은 텍스트에 포함된 단어와 그것의 출현 횟수만으로 텍스트를 표현하므로, 단어의 함축 의미, 단어의 순서 및 텍스트의 구조를 전혀 표현하지 못한다. 대부분의 텍스트 마이닝 기술은 대상 문서를 'Bag-of-Words' 방식의 텍스트 모델로 표현함을 전제로 하여 발전하여 왔다. 하지만 오늘날 빅데이터 시대를 맞이하여 방대한 규모의 텍스트 데이터를 보다 정밀하게 분석할 수 있는 새로운 패러다임의 표현모델을 요구하고 있다. 본 논문에서 제안하는 텍스트 표현모델은 개념공간을 문서 및 단어와 동등한 매핑 공간으로 상정하여, 그 세 가지 공간에 대한 연관 관계를 모두 표현한다. 개념공간의 구성을 위해서 위키피디어 데이터를 활용하며, 하나의 개념은 하나의 위키피디어 페이지로부터 정의된다. 결과적으로 주어진 텍스트 문서집합을 의미적으로 해석이 가능한 3차 텐서(3-order tensor)로 표현하게 되며, 따라서 제안 모델을 텍스트 큐보이드 모델이라 명명한다. 20Newsgroup 문서집합을 사용하여 문서 및 개념 수준의 클러스터링 정확도를 평가함으로써, 제안 모델이 'Bag-of-Word' 방식의 대표적 모델인 벡터공간 모델에 비해 우수함을 보인다.