• 제목/요약/키워드: 문장 수준

검색결과 223건 처리시간 0.026초

한국어 병렬문의 통사, 의미, 문맥 분석을 위한 결합범주문법 (Combinatory Categorial Grammar for the Syntactic, Semantic, and Discourse Analyses of Coordinate Constructions in Korean)

  • 조형준;박종철
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제27권4호
    • /
    • pp.448-462
    • /
    • 2000
  • 자연언어처리에 있어서 병렬구문은 분석의 복잡성, 단어의 애매성, 서술어 생략 등에 따른 처리의 어려움을 내포하고 있다. 본 논문에서는 한국어에서 발생하는 병렬문의 통사적 특징을 능력문법 (competence grammar)의 입장에서 접근하고 분석된 결과를 기반으로 하여 한국어 병렬문 해석을 위한 결합범주문법 (Combinatory Categorial Grammar)을 제안한다. 제안된 결합범주문법을 사용해서 병렬문에 대한 각각 다른 수준의 통사적, 의미적, 문맥적 정보들이 사전에 어휘적으로 통합될 수 있고 통합된 정보를 이용하여 통사적, 의미적, 문맥적 분석들이 각각 다른 수준의 처리를 거치지 않고 동시에 점진적으로 유도될 수 있음을 보인다. 유도된 정보들을 통해 일반적으로 한국어 병렬문의 주된 기능이라고 생각되는 두 문장이 가지는 정보를 대조, 비교하는 기능이 표현될 수 있음을 보인다. 말뭉치를 분석하여 병렬문이 한국어 처리에서 차지하는 비중과 제시한 문법으로 처리할 수 없는 문형들에 대한 논의를 제공한다.

  • PDF

초급 상 수준을 위한 스토리텔링 중심의 영어 말하기 교수 전략 (Strategies of Storytelling Based Teaching of English Speaking for Novice High Learners)

  • 고미숙
    • 한국산학기술학회논문지
    • /
    • 제16권5호
    • /
    • pp.3172-3179
    • /
    • 2015
  • 본 연구는 성인 영어 학습자의 말하기 숙련도 향상을 위한 영어교수법을 제안하고 있다. 패턴 위주의 문장암기나 문법 규칙 중심의 대화식 영어회화 교육 방법을 탈피하여 스토리텔링 기법을 적용한 영어 말하기 교수 방법론을 소개하고 있다. 스토리텔링 중심의 영어 말하기 교수법의 이론적 타당도를 세 가지 측면에서 살펴본다. 말하기의 목적 즉, 자신의 생각을 적절히 설득적으로 표현하고 자신의 의견을 나눌 수 있기 위해서는 먼저 풍부한 담화량의 확보가 관건이다. 이를 위하여 이야기 구성요소 중심의 말하기 전략 12가지를 소개하고, 말하기 학습에 적용해 보고 있다. 다음으로, 수사학적 차원에서 설득적인 말하기를 위한 전략을 살펴본다. 아리스토텔레스의 설득적인 말하기를 위한 수사학적 5대 영역을 중심으로 스토리텔링 기법의 말하기와의 관련성을 찾아본다. 끝으로, 교육 현장에서 스토리텔링 중심의 영어 교수법 적용의 가능성을 살펴본다. 외국어 학습자로서의 언어 숙련도가 모국어 수준과 다르다는 이유만으로 위와 같은 스토리텔링 기법의 영어 말하기 교수가 교육 현장에서 실현될 수 있을까에 관한 의문에 학습자 전략 사용 양상을 살펴봄으로써 이에 대한 실현 가능성을 긍정적으로 기대한다.

한국어 음소 단위 LSTM 언어모델을 이용한 문장 생성 (Korean Sentence Generation Using Phoneme-Level LSTM Language Model)

  • 안성만;정여진;이재준;양지헌
    • 지능정보연구
    • /
    • 제23권2호
    • /
    • pp.71-88
    • /
    • 2017
  • 언어모델은 순차적으로 입력된 자료를 바탕으로 다음에 나올 단어나 문자를 예측하는 모델로 언어처리나 음성인식 분야에 활용된다. 최근 딥러닝 알고리즘이 발전되면서 입력 개체 간의 의존성을 효과적으로 반영할 수 있는 순환신경망 모델과 이를 발전시킨 Long short-term memory(LSTM) 모델이 언어모델에 사용되고 있다. 이러한 모형에 자료를 입력하기 위해서는 문장을 단어 혹은 형태소로 분해하는 과정을 거친 후 단어 레벨 혹은 형태소 레벨의 모형을 사용하는 것이 일반적이다. 하지만 이러한 모형은 텍스트가 포함하는 단어나 형태소의 수가 일반적으로 매우 많기 때문에 사전 크기가 커지게 되고 이에 따라 모형의 복잡도가 증가하는 문제가 있고 사전에 포함된 어휘 외에는 생성이 불가능하다는 등의 단점이 있다. 특히 한국어와 같이 형태소 활용이 다양한 언어의 경우 형태소 분석기를 통한 분해과정에서 오류가 더해질 수 있다. 이를 보완하기 위해 본 논문에서는 문장을 자음과 모음으로 이루어진 음소 단위로 분해한 뒤 입력 데이터로 사용하는 음소 레벨의 LSTM 언어모델을 제안한다. 본 논문에서는 LSTM layer를 3개 또는 4개 포함하는 모형을 사용한다. 모형의 최적화를 위해 Stochastic Gradient 알고리즘과 이를 개선시킨 다양한 알고리즘을 사용하고 그 성능을 비교한다. 구약성경 텍스트를 사용하여 실험을 진행하였고 모든 실험은 Theano를 기반으로 하는 Keras 패키지를 사용하여 수행되었다. 모형의 정량적 비교를 위해 validation loss와 test set에 대한 perplexity를 계산하였다. 그 결과 Stochastic Gradient 알고리즘이 상대적으로 큰 validation loss와 perplexity를 나타냈고 나머지 최적화 알고리즘들은 유사한 값들을 보이며 비슷한 수준의 모형 복잡도를 나타냈다. Layer 4개인 모형이 3개인 모형에 비해 학습시간이 평균적으로 69% 정도 길게 소요되었으나 정량지표는 크게 개선되지 않거나 특정 조건에서는 오히려 악화되는 것으로 나타났다. 하지만 layer 4개를 사용한 모형이 3개를 사용한 모형에 비해 완성도가 높은 문장을 생성했다. 본 논문에서 고려한 어떤 시뮬레이션 조건에서도 한글에서 사용되지 않는 문자조합이 생성되지 않았고 명사와 조사의 조합이나 동사의 활용, 주어 동사의 결합 면에서 상당히 완성도 높은 문장이 발생되었다. 본 연구결과는 현재 대두되고 있는 인공지능 시스템의 기초가 되는 언어처리나 음성인식 분야에서 한국어 처리를 위해 다양하게 활용될 수 있을 것으로 기대된다.

멀티미디어 프레젠테이션을 통한 영어 학습과정 연구 (An innovative Approach to Teaching-learning Process through Multimedia Presentation)

  • 이일석
    • 디지털콘텐츠학회 논문지
    • /
    • 제15권2호
    • /
    • pp.173-179
    • /
    • 2014
  • 영어 수업에 있어서 멀티미디어 프레젠테이션을 만들어가는 것을 통하여 영어를 배우는 창조적 기술을 시도하는 학습 환경이 매우 중요하다. 영어를 학교 밖에서 사용할 기회가 없는 학생들에게 이러한 방법은 수업의 목표와 적합한 연습을 가능하게 하고 또한 개인의 수준에 맞는 관계를 형성하도록 해준다. 언어는 문장의 구조와 품사, 시제 등을 포함하고 있기 때문에 더욱 외국어 습득에 있어서 문법을 학습하는 것은 매우 중요하다. 이 연구의 목적은 멀티미디어 프레젠테이션이나 파워포인트 프레젠테이션을 이용하여 영어 문법을 학습할 때 제2 외국어로서 영어를 공부하는 학생들을 위하여 효과적인 영어 문법을 가르치기 위하여 멀티미디어 프레젠테이션을 이용한 새로운 영어 교육 방법을 개발하고자 한다.

음성언어 번역 시스템을 위한 새로운 형태소 분석 (A New Morphological Analysis for the Spoken Language Translation System)

  • 양승원;김재훈
    • 한국음향학회지
    • /
    • 제18권4호
    • /
    • pp.17-22
    • /
    • 1999
  • 음성 처리부와 기계번역부를 통합하는 음성언어 번역 시스템에서는 각 모듈들이 다루는 자료나 처리단위 등이 서로 달라 통합이 어렵다. 따라서, 전체 시스템의 효율을 제고하면서 각 모듈에서 공통으로 사용할 수 있는 새로운 입출력 단위가 필요하다. 본 논문에서는 음성언어 번역 시스템에서 음성 처리 모듈들과 언어번역 모듈과의 인터페이스 단위로서 의사 형태소를 제안하고, 입력되는 문장을 의사 형태소 단위로 분석하는 형태소 분석기를 구현하였다. 의사형태소를 이용한 음성인식/합성은 어절이나 형태소단위의 음성인식/합성에서 보다 개선된 결과를 얻을 수 있게 해주며, 전체적인 음성언어 번역시스템의 성능도 높일 수 있다. 본 논문에서 구현한 의사 형태소 분석기의 분석율은 약98.9%로 일반 형태소 분석기와 동일한 수준의 성능을 보였다.

  • PDF

주관식 평가를 위한 웹기반 온라인 평가 시스템의 구현 및 적용 (Web-based online evaluation system for essay question)

  • 김홍기;홍동권
    • 정보교육학회논문지
    • /
    • 제8권2호
    • /
    • pp.251-259
    • /
    • 2004
  • 우리 생활 전반은 인터넷 서비스의 확대 보급으로 많은 변화를 보이고 있으며 학교 현장 역시 인터넷과 학교 전산망이 설치되어 교육에 필요한 다양한 정보의 수집과 탐색이 용이해짐으로써 인터넷을 활용한 웹 기반 가상 수업 실시, 실시간 평가, 학습 진도 관리 등 새로운 형태의 교육 활동이 이루어지고 있다. 본 논문은 문제의 정답이 한가지로 이루어진 단답형 문제가 아니라 간단한 문장으로 이루어진 문제를 처리할 수 있는 웹 기반 온라인 주관식 문항 평가 시스템을 학습자의 성취 수준을 보다 빠르게 정확하게 알 수 있도록 하였다. 정확히 규정된 정답과 정확한 채점 기준이 있는 주관식 문제는 교사가 직접 채점하는 경우와 유사한 정확성을 가지고 있으며 채점 시간의 신속성이 매우 높아서 평가 결과의 실시간 피드백이 가능하여 주관식 문제를 평가하는데 그 효율성이 기대된다.

  • PDF

발주자 안전관리 실태조사 연구 (Survey of Client/Owner Construction Safety Management)

  • 문장옥;안홍섭
    • 한국건설관리학회:학술대회논문집
    • /
    • 한국건설관리학회 2006년도 정기학술발표대회 논문집
    • /
    • pp.53-57
    • /
    • 2006
  • 안전관리는 건설사업의 시공과정 중에 발생 가능한 유해, 위험으로부터 인명을 보호하는 것이며, 건설사업의 주제는 발주자로서 발주자 역할의 극대화는 효과적인 건설재해 방지의 관건이다. 건설프로젝트의 발주자, 설계자, 감리자, 시공자, 협력업자 등 다수 참여자의 장기간에 걸친 공동작업으로 이루어지는 건설공사의 특성을 고려할 때, 기존의 건설안전관리체제로는 건설공사에 수반되는 이와 다양한 유형의 사고를 방지하기 위한 근본적인 처방으로는 미흡하며, 건설산업의 총체적인 안전수준의 향상을 통한 시설품의 생애주기 전반에 걸쳐 안전성을 확보할 수 있는 근원적인 안전관리제도의 구축이 요구되고 있다. 실태조사 결과 공공발주자와 민간발주자의 안전의식 및 안전관리실태에는 격차가 크며, 대다수 발주자의 안전관리에 대한 책임의식이 미흡하며, 민간발주자의 경우가 훨씬 열악한 것으로 나타났다. 정부 감독기관의 발주자에 대한 안전책임 부여도 소극적이다. 발주자 안전관리가 미흡한 원인과 이의 촉진 방안에 대한 도출이 필요하다. 발주자에 대한 접근 방법의 홍보를 통한 책임의식의 고취, 발주자를 위한 안전관리매뉴얼 등 안전관리 도구의 제공, 법령을 동한 명확한 책임의 부여, 발주자가 책임을 이행할 수 있는 자질있는 안전전문가의 활용이 긴요한 것으로 사료된다.

  • PDF

웹에 기반한 국어 작문 학습시스템 구현 (Web-Based Intelligent Learning System for Korean Language)

  • 남현숙;권현주;김수남;유승훈;신민규;권혁철
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1999년도 제11회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.413-417
    • /
    • 1999
  • 최근 인터넷을 통한 언어 교육 연구에 관심이 고조되면서 다양한 언어 학습 홈페이지가 등장하였다. 이 논문은 국어 작문 학습을 목표로 본 연구실에서 개발한 '바른 우리글 쓰기' 학습시스템에 대해 다룬다. 본 학습 시스템은 초보자에서 전문가에 이르는 학습자를 대상으로 우리말로 글을 쓸 때 필요한 우리말 지식을 체계적으로 학습하도록 하거나 학습자가 직접 쓴 문장에서 스스로 오류를 찾아 분석하고 그에 따른 설명 및 글쓰기 규칙을 더 상세하게 알 수 있도록 설계하였다. 학습시스템의 내부 구조를 효율적으로 구성하기 위해 우리말 글과 관련 있는 자료를 수집하여 각각 지식베이스화하고, 학습 내용을 서로 체계적으로 연결하기 위해 우리나라 사람이 자주 틀리는 오류를 중심으로 해당 글쓰기 규칙과 참고 자료와 용례를 하이퍼텍스트화하였다. 이 시스템은 특히 학습 모형에 따라 학습 자료를 재구성할 수 있도록 지식베이스와 모형을 독립하였다. 이와 같이 학습 자료를 풍부하게 준비하고 학습 내용을 구성하는 일 만큼이나 중요한 과제는 학습자의 수준에 맞춰 학습 줄거리를 구성하는 작업이다. 이 시스템에서도 학습자의 특성을 살릴 수 있도록 연역적 학습 모형과 귀납적 학습 모형을 시도하였지만 더 세분화된 학습 줄거리 구성에 대한 연구가 있어야 한다. 따라서 학습자의 학습 동기를 유발할 수 있는 학습 내용과 적절한 기술이 조화를 이룬 홈페이지를 만드는 일이 향후 우리가 지향할 연구 과제이다.

  • PDF

대어휘 음성인식을 위한 의사형태소 분석 시스템의 구현 (Implementation of A Morphological Analyzer Based on Pseudo-morpheme for Large Vocabulary Speech Recognizing)

  • 양승원
    • 한국산업정보학회논문지
    • /
    • 제4권2호
    • /
    • pp.102-108
    • /
    • 1999
  • 교착어인 한국어를 대상으로 대용량의 대화체 어휘를 포함하는 연속 음성을 인식하는 데에는 인식단위를 결정하는 것이 매우 중요하다. 본 논문에서는 어절이나 형태소를 사용하는 기존의 음성인식 시스템에서의 난점을 해소하고 새로운 인식단위인 의사형태소를 제안하고, 입력되는 문장을 의사 형태소 단위로 분석하는 형태소 분석기와 태거를 구현하였다. 의사형태소를 이용한 음성인식/합성은 어절이나 형태소단위의 음성인식/합성에서 보다 개선된 결과를 얻을 수 있게 해주며, 인식의 출력을 인식의 다음 단계인 언어처리부의 처리단위와 일치시킬 수 있으므로 전체적인 음성언어 번역시스템의 성능도 높일 수 있다. 본 논문에서 구현한 시스템은 일반 형태소를 대상으로 하는 시스템과 동일한 수준의 성능을 보였다.

  • PDF

확률적 문법규칙에 기반한 국어사전의 뜻풀이말 구문분석기 (A Parser of Definitions in Korean Dictionary based on Probabilistic Grammar Rules)

  • 이수광;옥철영
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제28권5호
    • /
    • pp.48-460
    • /
    • 2001
  • 국어사전의 뜻풀이말은 표제어의 의미를 기술할 뿐만 아니라, 상위/하위개념, 부분-전체개념, 다의어, 동형이의어, 동의어, 반의어, 의미속성 등의 많은 의미정보를 내재하고 있다. 본 연구는 뜻풀이말에서 다양한 의미정보를 획득을 위한 기본적인 도구로서 국어사전의 뜻풀이말 구문분석기를 구현하는 것을 목적으로 한다. 이를 위해서 우선 국어사전의 뜻풀이말을 대상으로 일정한 수준의 품사 및 구문 부착 말 뭉치를 구축하고, 이 말뭉치들로부터 품사 태그 중의성 어절의 빈도 정보와 통계적 방법에 기반한 문법규칙과 확률정보를 자동으로 추출한다. 본 연구의 뜻풀이말 구문분석기는 이를 이용한 확률적 차트파서이다. 품사 태그 중의성 어절의 빈도 정보와 문법규칙 및 확률정보는 파싱 과정의 명사구 중의성을 해소한다. 또한, 파싱 과정에서 생성되는 노드의 수를 줄이고 수행 속도를 높이기 위한 방법으로 문법 Factoring, Best-First 탐색 그리고 Viterbi 탐색의 방법을 이용한다. 문법규칙의 확률과 왼쪽 우선 파싱 그리고 왼쪽 우선 탐색 방법을 사용하여 실험한 결과, 왼쪽 우선 탐색 방식과 문법확률을 혼용하는 방식이 가장 정확한 결과를 보였으며 비학습 문장에 대해 51.74%의 재현률과 87.47%의 정확률을 보였다.

  • PDF