• Title/Summary/Keyword: sentence structure

검색결과 228건 처리시간 0.026초

ORMN: 참조 표현 이해를 위한 심층 신경망 모델 (ORMN: A Deep Neural Network Model for Referring Expression Comprehension)

  • 신동협;김인철
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제7권2호
    • /
    • pp.69-76
    • /
    • 2018
  • 참조 표현이란 장면 영상 내의 특정 물체를 가리키는 자연어 문장들을 의미한다. 본 논문에서는 참조 표현 이해를 위한 새로운 심층 신경망 모델을 제안한다. 본 논문에서 제안하는 모델은 장면 영상 내 대상 물체의 영역을 찾아내기 위해, 참조 표현에서 언급하는 대상 물체뿐만 아니라 보조 물체, 그리고 대상 물체와 보조 물체 사이의 관계까지 풍부한 정보를 활용한다. 또한 제안 모델에서는 영상 내 각 후보 영역의 적합도 계산을 위해 물체 적합도와 관계 적합도를 참조 표현의 문장 구조에 따라 결합한다. 따라서, 본 모델은 크게 총 네 가지 서브 네트워크들로 구성된다: 언어 표현 네트워크(LRN), 물체 정합 네트워크(OMN), 관계 정합 네트워크(RMN), 그리고 가중 결합 네트워크(WCN). 본 논문에서는 세 가지 서로 다른 참조 표현 데이터집합들을 이용한 실험을 통해, 제안 모델이 현존 최고 수준의 참조 표현 이해 성능을 보인다는 것을 입증하였다.

도서관 주간 표어의 내용 및 구조 분석 (Analysis of Content and Structure of Library Week Slogans)

  • 임성관
    • 한국도서관정보학회지
    • /
    • 제51권3호
    • /
    • pp.53-80
    • /
    • 2020
  • 도서관 주간은 1964년에 설정된 이래 2020년까지 56년 동안 이어지면서 도서관 분야의 가장 크고 중요한 활동으로 자리 잡았다. 따라서 한국도서관협회는 도서관 주간 홍보에 활용하기 위한 표어를 공모 및 선정하여 포스터 제작 등에 활용하는데, 본 연구는 그 내용과 효과에 대해 분석하여 브랜딩 전략 차원에서 보다 효율적인 표어를 개발 및 활용할 수 있는 방안을 제안하는데 목적이 있다. 연구 목적 달성을 위해 도서관 주간 공식 표어로 선정된 116개의 내용을 박영준(2001)이 제안한 언어적 기법과 핵심 단어에 따라 분석했는데, 그 결과 '한글 문자'로만 이루어진 것이 103개(88.79%)였고, 문자 구조 유형은 '문장형'이 46개(39.66%)로 가장 높게 나타났다. 또한 표어에 포함된 핵심 단어를 분석한 결과 '도서관'이 포함된 것이 111개(96.52%)로 가장 많았다. 따라서 도서관 주간 표어는 '도서관'이라는 단어가 포함된 '한글 문자'로 이루어진 '문장형'이 대부분이라고 할 수 있다.

초등 수학 교과서의 수학 용어 정의 및 문장제에 사용된 표현의 문장 복잡성 비교 분석 (A Comparative Analysis of the Word Depth Appearing in Representations Used in the Definitions of Mathematical Terms and Word Problem in Elementary School Mathematics Textbook)

  • 강윤지;백석윤
    • 한국초등수학교육학회지
    • /
    • 제24권2호
    • /
    • pp.231-257
    • /
    • 2020
  • 본 연구는 현행 초등 수학 교과서 내 주요 용어의 정의 및 단원평가의 문장제에 사용된 표현을 구문론적 관점에서 문장 복잡성(Yngve, 1960)에 따라 비교분석하였다. 분석 결과, 교과서 내 용어의 정의와 문장제에 사용된 표현에서 저학년 교과서의 문장 복잡성이 낮게 구성되었고, 각 용어의 개별 특성에 따라 문장 구조 및 형태가 서로 다르게 나타나며, 전반적으로 간결하며 문장 복잡성이 낮게 해당 용어의 정의 및 문장제가 서술되었고 용어 정의의 문장이 문장제의 문장보다 복잡하게 구성되었음을 알 수 있었다. 초등학생이 복잡한 문장으로 인하여 수학적 개념 학습의 어려움을 겪지 않도록 교과서 내 문장을 명확하게 서술하고, 적절한 시각적 자료를 함께 제시하며, 개별 학습자의 문해 수준에 알맞은 설명을 보다 섬세하게 고려하여 제공하는 등의 노력이 필요하다.

명사화의 관점에서 수와 연산 영역의 교과서 문장제 분석 (Analysis of Word Problems in the Domain of 'Numbers and Operations' of Textbooks from the Perspective of 'Nominalization')

  • 장혜원;강윤지
    • 한국수학교육학회지시리즈C:초등수학교육
    • /
    • 제25권4호
    • /
    • pp.395-410
    • /
    • 2022
  • 명사화는 문법적 은유 중 하나로, 동적 표현을 명사 상당 어구를 통해 표현하는 것이다. 수학 문장제에서 명사화를 사용한 문장 표현은 수학화 단계에서 주목해야 할 대상을 분명하게 한다는 장점과 일상적 표현과 달리 문장의 이해를 어렵게 하고 온전한 수학적 모델링 단계의 경험을 저해한다는 단점을 모두 지닌다. 본 연구의 목적은 수학 학습시 학생들의 어려움을 야기하는 문장제 해결과 관련하여, 언어학적 요소인 명사화의 관점에서 교과서 문장제를 분석하고 시사점을 도출하는 것이다. 이를 위해 2015 개정 교육과정에 따른 초등학교 수학 교과서의 수와 연산 영역에 포함된 연산 관련 문장제 341개의 명사화 유형을 학년군별, 차시 활동과 단원 평가, 특화 차시별, 수식화에 대한 명시적인 요구 문장제의 네 가지 관점에서 분석하였다. 분석 결과에 기초하여 수학 문장제의 언어적 표현과 관련한 교수학적 시사점을 도출하였다.

Bi-directional Maximal Matching Algorithm to Segment Khmer Words in Sentence

  • Mao, Makara;Peng, Sony;Yang, Yixuan;Park, Doo-Soon
    • Journal of Information Processing Systems
    • /
    • 제18권4호
    • /
    • pp.549-561
    • /
    • 2022
  • In the Khmer writing system, the Khmer script is the official letter of Cambodia, written from left to right without a space separator; it is complicated and requires more analysis studies. Without clear standard guidelines, a space separator in the Khmer language is used inconsistently and informally to separate words in sentences. Therefore, a segmented method should be discussed with the combination of the future Khmer natural language processing (NLP) to define the appropriate rule for Khmer sentences. The critical process in NLP with the capability of extensive data language analysis necessitates applying in this scenario. One of the essential components in Khmer language processing is how to split the word into a series of sentences and count the words used in the sentences. Currently, Microsoft Word cannot count Khmer words correctly. So, this study presents a systematic library to segment Khmer phrases using the bi-directional maximal matching (BiMM) method to address these problematic constraints. In the BiMM algorithm, the paper focuses on the Bidirectional implementation of forward maximal matching (FMM) and backward maximal matching (BMM) to improve word segmentation accuracy. A digital or prefix tree of data structure algorithm, also known as a trie, enhances the segmentation accuracy procedure by finding the children of each word parent node. The accuracy of BiMM is higher than using FMM or BMM independently; moreover, the proposed approach improves dictionary structures and reduces the number of errors. The result of this study can reduce the error by 8.57% compared to FMM and BFF algorithms with 94,807 Khmer words.

標記"了"的認知解析考察

  • 이주은
    • 중국학논총
    • /
    • 제53호
    • /
    • pp.1-16
    • /
    • 2017
  • The grammatical meaning of "了", a marker of aspects in Mandarin has been described differently among researchers, three of which are to express the end, a certain phase of event and the start of an event or a state. This paper consists of four parts. Set out below is a summary of main points of each part. The first chapter elaborates on the results of previous related studies, points out the purpose and meaning of the current study. Chapter two introduces marked "了" including concepts of the meaning and "Done", "complete whole", "realization" Corresponds to the case study. And explains syntactic and semantic features of the "了", highlights the look "of the了" problems of syntax and semantics, "了2" made three domains Limit 3 Including of the knowledge. This chapter holds that its grammartical meaning can be described as follows an event has taken place or a state has formed prior to a certain reference time, and that the grammartical meanings mentioned above can be considered sub - grammartical meanings of "了",which result from different prominence of the phases of an event. Chapter three explains tag component of the "了1", "了2". It discusses limited constraints, first place for "了" syntactic meaning, "The End" and "extension" of the opposition for "了" is looming around the root system, "了" and "着" sentence structure and semantic and syntactic forms. Chapter four discusses bounded features of the 了. It mainly focuses on "了"of bounded / unbounded function. It analyses the functions of components and explains a bounded function of "了1" and a bounded function of "了2". Chapter five is the conclusion. It consolidates and summarises the previous contents of the paper and points out the conclusion.

텍스트 마이닝 기법을 활용한 고전 추리 소설 작가 간 문체적 차이와 문체 구조에 대한 연구 (A study on detective story authors' style differentiation and style structure based on Text Mining)

  • 문석형;강주영
    • 지능정보연구
    • /
    • 제25권3호
    • /
    • pp.89-115
    • /
    • 2019
  • 본 연구는 고전 추리 소설 작가로 유명한 아서 코난 도일과 애거서 크리스티의 문체적 차이점을 데이터 분석을 통해 제시하고, 나아가 텍스트 마이닝에 입각한 문체 연구의 해석적 방법론을 제시하고자 시행되었다. 추리 소설의 핵심 요소인 사건과 인물에 더해 작가의 문법적인 집필 방식을 문체로 정의하고 분석을 시도하였다. 작가 별로 각 2권, 총 4권의 책을 선정하였으며 문장 단위로 텍스트를 나누어 데이터를 확보하였다. 각 문장에 따른 감성 점수를 부여한 뒤 페이지 진행에 따른 감성을 시각화하였으며, 페이지에 따라 토픽 모델링을 적용하여 소설 속 사건 진행 흐름을 파악할 수 있었다. 동시 발생 매트릭스(co-occurrence matrix)를 구성하고 네트워크 분석(Network Analysis)을 시행함으로써 사건이 진행되는 과정에서 인물들 간 관계의 변화를 확인할 수 있었다. 또한 전체 문장을 총 6가지 문체를 기준으로 문법적인 체계를 나누어 작가 간, 그리고 작품 간 집필 방식의 차이점을 확인하였다. 이러한 일련의 연구 과정은 문체에 대한 이해를 바탕으로 글 전체의 맥락을 파악할 수 있도록 도움을 줄 수 있으며, 나아가 기존에 개별적으로 진행되었던 문체 연구를 통합시킴으로써 문체 구조에 대한 이해를 도울 수 있다. 그리고 이러한 선행된 이해를 통해 온라인 텍스트를 비롯한 비정형 데이터 속 문체의 존재를 발견하고 구체화하는 작업에 기여할 수 있다. 뉴미디어를 포함한 온라인 텍스트를 심도 있게 분석하고자 하는 시도가 증가하고 있는 상황에서 해당 연구들과 연계를 통해 보다 의미 있는 온라인 텍스트 분석에 기여할 것으로 기대된다.

지식베이스 구축을 위한 한국어 위키피디아의 학습 기반 지식추출 방법론 및 플랫폼 연구 (Knowledge Extraction Methodology and Framework from Wikipedia Articles for Construction of Knowledge-Base)

  • 김재헌;이명진
    • 지능정보연구
    • /
    • 제25권1호
    • /
    • pp.43-61
    • /
    • 2019
  • 최근 4차 산업혁명과 함께 인공지능 기술에 대한 연구가 활발히 진행되고 있으며, 이전의 그 어느 때보다도 기술의 발전이 빠르게 진행되고 있는 추세이다. 이러한 인공지능 환경에서 양질의 지식베이스는 인공지능 기술의 향상 및 사용자 경험을 높이기 위한 기반 기술로써 중요한 역할을 하고 있다. 특히 최근에는 인공지능 스피커를 통한 질의응답과 같은 서비스의 기반 지식으로 활용되고 있다. 하지만 지식베이스를 구축하는 것은 사람의 많은 노력을 요하며, 이로 인해 지식을 구축하는데 많은 시간과 비용이 소모된다. 이러한 문제를 해결하기 위해 본 연구에서는 기계학습을 이용하여 지식베이스의 구조에 따라 학습을 수행하고, 이를 통해 자연어 문서로부터 지식을 추출하여 지식화하는 방법에 대해 제안하고자 한다. 이러한 방법의 적절성을 보이기 위해 DBpedia 온톨로지의 구조를 기반으로 학습을 수행하여 지식을 구축할 것이다. 즉, DBpedia의 온톨로지 구조에 따라 위키피디아 문서에 기술되어 있는 인포박스를 이용하여 학습을 수행하고 이를 바탕으로 자연어 텍스트로부터 지식을 추출하여 온톨로지화하기 위한 방법론을 제안하고자 한다. 학습을 바탕으로 지식을 추출하기 위한 과정은 문서 분류, 적합 문장 분류, 그리고 지식 추출 및 지식베이스 변환의 과정으로 이루어진다. 이와 같은 방법론에 따라 실제 지식 추출을 위한 플랫폼을 구축하였으며, 실험을 통해 본 연구에서 제안하고자 하는 방법론이 지식을 확장하는데 있어 유용하게 활용될 수 있음을 증명하였다. 이러한 방법을 통해 구축된 지식은 향후 지식베이스를 기반으로 한 인공지능을 위해 활용될 수 있을 것으로 판단된다.

이미지 캡션 생성을 위한 심층 신경망 모델의 설계 (Design of a Deep Neural Network Model for Image Caption Generation)

  • 김동하;김인철
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제6권4호
    • /
    • pp.203-210
    • /
    • 2017
  • 본 논문에서는 이미지 캡션 생성과 모델 전이에 효과적인 심층 신경망 모델을 제시한다. 본 모델은 멀티 모달 순환 신경망 모델의 하나로서, 이미지로부터 시각 정보를 추출하는 컨볼루션 신경망 층, 각 단어를 저차원의 특징으로 변환하는 임베딩 층, 캡션 문장 구조를 학습하는 순환 신경망 층, 시각 정보와 언어 정보를 결합하는 멀티 모달 층 등 총 5 개의 계층들로 구성된다. 특히 본 모델에서는 시퀀스 패턴 학습과 모델 전이에 우수한 LSTM 유닛을 이용하여 순환 신경망 층을 구성하며, 캡션 문장 생성을 위한 매 순환 단계마다 이미지의 시각 정보를 이용할 수 있도록 컨볼루션 신경망 층의 출력을 순환 신경망 층의 초기 상태뿐만 아니라 멀티 모달 층의 입력에도 연결하는 구조를 가진다. Flickr8k, Flickr30k, MSCOCO 등의 공개 데이터 집합들을 이용한 다양한 비교 실험들을 통해, 캡션의 정확도와 모델 전이의 효과 면에서 본 논문에서 제시한 멀티 모달 순환 신경망 모델의 높은 성능을 확인할 수 있었다.

다각적 관점에서 본 시조 형식 연구 (A study on the Form of Sijo seen from Various Aspects)

  • 임종찬
    • 한국시조학회지:시조학논총
    • /
    • 제30집
    • /
    • pp.147-164
    • /
    • 2009
  • 이 논문에서 밝힌 바를 요약 정리하면 다음과 같다. 첫째, 여태 일반적으로 말해온 음수율은 아래와 같이 정리할 수 있다. 각 숫자는 음보율에서는 음보 단위가 되고 있다. 현대시조에 와서는 자수의 넘침이 고시조보다 심한 경우가 있지만 대체로 아래 표로 정리될 수 있겠다. 초장 3(2 - 4) $\leqq$ 4(3 - 5) $\vee$ 3(4 - 5) $\leqq$ 4(3 - 5) 중장 3(2 - 4) $\leqq$ 4(3 - 5) $\vee$ 3(4 - 5) $\leqq$ 4(3 - 5) 종장 3(고정) $\prec$ 5(6 - 7) $\vee$ 4(3 - 5) $\geqq$ 3(4) 둘째, 문장구조의 측면에서 시조 형식을 살펴본 결과는 이렇게 설명된다. 1) 각 장은 수식어를 극도로 배제하여 논리전개를 명확하게 하고 있음을 확인하게 된다. 고시조는 시의 형식을 취하지만 언어로서 논리 정연한 문장이었다. 사고의 배치가 안정되고 전달내용이 정제되어서 의미의 혼란을 야기시키지 않았다. 2) 고시조는 의미와 의미의 연결을 확실히 하여 텍스트로서 단단히 결속되어 있음을 확인하게 된다. 즉 고시조는 어느 것이나 장과 장 사이에는 연결성(응결성, 응집성)이 확실하게 존재하고 있어 의미의 맥락이 정돈되고 마무리된다. 3) 종장의 앞에는 비록 생략되어있지만 의미상 '그래서' '그런데'라는 접속부사가 한정적으로 놓인다는 점이다. '그래서' '그런데' 가 놓여야 종장이 말하는 의미의 마무리가 확보하게 되는데 고시조는 이런 접속부사가 생략되어 나타나고 있다. 4) 시조의 각 후의 문장은 다음 4가지 형태로 짜여 있어서 안정된 기반을 갖추고 있음을 확인하게 된다. 일반적으로 정형시는 시행이 통사적 제약을 받는 경우가 많다. 한시(漢詩)의 칠언시(七言詩)의 경우는 의미맥락이 4와 3으로 나누어지는 것과 마찬가지로 고시조는 다음과 같이 짜여지고 있음을 알 수 있다. ㄱ) 주어구 + 서술어구 ㄴ) 전절 + 후절 ㄷ) 위치어 + 문(文) ㄹ) 목적어구 + 서술어구 이렇게 짜여 있기 때문에 시조를 일러 3장 6구라고 한다. 이것은 시조가 정형시임을 입증하는 요소가 되기도 한다. 이와 같이 볼 때, 시조형식을 음수율, 또는 음보율로 설명한다 해도 음수율을 가미한 음보율로서 설명되어야 하겠고, 문장구조상의 형식을 보충해야만 보다 충실한 시조형식을 설명하게 된다고 할 수 있겠다.

  • PDF