• Title/Summary/Keyword: local grammar

Search Result 15, Processing Time 0.029 seconds

Multi-Label Classification for Corporate Review Text: A Local Grammar Approach (머신러닝 기반의 기업 리뷰 다중 분류: 부분 문법 적용을 중심으로)

  • HyeYeon Baek;Young Kyun Chang
    • Information Systems Review
    • /
    • v.25 no.3
    • /
    • pp.27-41
    • /
    • 2023
  • Unlike the previous works focusing on the state-of-the-art methodologies to improve the performance of machine learning models, this study improves the 'quality' of training data used in machine learning. We propose a method to enhance the quality of training data through the processing of 'local grammar,' frequently used in corpus analysis. We collected a vast amount of unstructured corporate review text data posted by employees working in the top 100 companies in Korea. After improving the data quality using the local grammar process, we confirmed that the classification model with local grammar outperformed the model without it in terms of classification performance. We defined five factors of work engagement as classification categories, and analyzed how the pattern of reviews changed before and after the COVID-19 pandemic. Through this study, we provide evidence that shows the value of the local grammar-based automatic identification and classification of employee experiences, and offer some clues for significant organizational cultural phenomena.

Derivational approach and representational approach in generative grammar (생성문법에서 도출적 접근과 표시적 접근)

  • Choe, Sook-Hee
    • English Language & Literature Teaching
    • /
    • v.10 no.1
    • /
    • pp.179-200
    • /
    • 2004
  • The purpose of this study is to investigate the adequacy of derivational approach and representational approach to syntactic theories in generative grammar. As the generative grammar is based on the derivational process of syntactic theories, it is suggested that derivational approach is more valid than representational approach. Move, Economy Principle, Local Economy and Label-free Phrase Structure in Minimalist framework support the preference of derivational approach to representational approach with the elimination of computational complexity, minimality, and label-free phrase structure. Syntactic structure is considered as the result of the interaction of the properties of lexical items containing probe and economy conditions constrained by bare output conditions. On the other hand, Pseudogapping in Lasnik(1999) is analyzed in terms of Object Shift, that is, overt raising to Spec of $Agr_o$ and the PF deletion of VP in representational approach. Hence, it is suggested that the combination of derivational and representational approaches to syntactic theories can be admitted in generative grammar.

  • PDF

A Study of Automatic Ontology Building by Web Information Extraction and Natural Language Processing (웹 문서 정보추출과 자연어처리를 통한 온톨로지 자동구축에 관한 연구)

  • Kim, Myung-Gwan;Lee, Young-Woo
    • The Journal of the Institute of Internet, Broadcasting and Communication
    • /
    • v.9 no.3
    • /
    • pp.61-67
    • /
    • 2009
  • The proliferation of the Internet grows, according to electronic documents, along with increasing importance of technology in information retrieval. This research is possible to build a more efficient and accurate knowledge-base with unstructured text documents from the Web using to extract knowledge of the core meaning of LGG (Local Grammar Graph). We have built a ontology based on OWL(Web Ontology Language) using the areas of particular stocks up/down patterns created by the extraction and grammar patterns. It is possible for the user can search for meaning and quality of information about the user wants.

  • PDF

Representation of Local Grammar for Temporal Expression and Analysis of Temporal Phrase with FST (시간 표현에 대한 부분 문법 기술 및 FST를 이용한 시간 구문 분석)

  • Kim, Youn-Gwan;Yoon, Jun-Tae;Song, Man-Suk
    • Annual Conference on Human and Language Technology
    • /
    • 1999.10e
    • /
    • pp.231-236
    • /
    • 1999
  • 시간표현은 문장에서 다른 명사와 결합하여 복합어를 이루는 경우가 있고, 용언과 결합하여 시간 부사의 역할을 하는 경우가 있는데, 이는 구문 분석에 있어서 중의적 해석이 두드러지며, 그 결과 구문 분석의 오류를 빈번히 야기하기도 한다. 본 논문에서는 이러한 시간 관계의 표현을 대량의 말뭉치로부터 획득하고 이들을 부분문법(local grammar)으로 표현한 후, 이것을 FST(Finite State Transducer)를 이용하여 부분 구문분석을 하고자 한다. 이를 위해 5천만 어절의 말뭉치에서 259개의 시간 단어를 추출하였고, 시간 단어들의 의미적 또는 기능적 사용에 의해서 26개의 어휘 범주로 분류하고 각 범주들의 결합관계를 일반화하였다. 실험을 통하여 인식을 위한 시간표현의 결합관계는 최고 97.2%의 정확률을 보였고, 품사태깅에 있어서는 평균 96.8%의 정확률을 보였다. 이는 시간 표현의 결합관계가 부분 구문분석에 있어서 유용한 정보임을 보여준다.

  • PDF

Construction of LGG for Extracting Meeting Location (개최장소 추출을 위한 LGG의 구축)

  • Kim, Kyoung-Ryol;Choi, Dong-Hyun;Kim, Eun-Kyung;Choi, Key-Sun
    • Annual Conference on Human and Language Technology
    • /
    • 2011.10a
    • /
    • pp.49-54
    • /
    • 2011
  • 본 논문에서는 회의공지 이메일을 대상으로 하는 개최장소 추출시스템에 대하여 소개한다. 개최장소 추출 시스템은 두 단계로 구성되는데, 첫 번째 단계는 본문에 포함된 개최장소의 추출이고, 두 번째 단계는 추출된 개최장소의 Geocoding이다. 개최장소의 추출을 위하여 문맥 패턴을 분석하여 개최장소가 포함된 문장 주변의 패턴을 반영하는 Local-Grammar Graph를 구축하며, 개최장소의 Geocoding을 위하여는 Addr2Geocode API를 사용한다. 본 논문은 일정공지메일의 개최장소를 추출하기 위한 LGG 방법론 기반의 어휘-통사적 언어 정보를 기술하는 것을 목적으로 한다.

  • PDF

Evaluation analysis on compatibility of English homepage for tourist information (영문 관광안내 홈페이지 웹호환성 평가 연구)

  • Shin, Young Kee
    • Journal of Korea Society of Digital Industry and Information Management
    • /
    • v.10 no.3
    • /
    • pp.297-310
    • /
    • 2014
  • The objective of this research is to evaluate the web standard as well as web compatibility of English homepage of tourist information manage local government. Thru this research, effective information and service can be provided to increasing foreign visitors and compatibility of English homepage can be strengthened. SortSite, a web compatibility measurement tool and UNICORN, a web standard measurement tool were utilized for this research. Chrome, Internet Explorer, Firefox, Safari and Opera were targeted for evaluating web compatibility and observance rate of Markup grammar and CSS grammar was checked for evaluating web standard. Research result showed that 46.7% of Chrome version ${\leq}34$ and 35 didn't observe the web compatibility while 95.6%, 53.3%, 53.3%, 53.3% and 55.6% of Internet Explorer version in order of 7.0, 8.0, 9.0, 10.0 and 11.0 didn't observe the web compatibility. Concerning Firefox, 75.6% and 48.9% of version in order of ${\leq}6.0$ and 7.0 didn't observe the web compatibility and 37.8% of Opera version ${\leq}12.17$ and ${\leq}21$ didn't observe the web compatibility. Regarding the web standard, 80% of English homepage didn't observe Markup grammar and 60% of them didn't observe CSS grammar. Therefore, urgent improvement of web compatibility and web standard is required.

Study on Domain-dependent Keywords Co-occurring with the Adjectives of Non-deterministic Opinion (휴먼 오피니언 자동 분류 시스템 구현을 위한 비결정 오피니언 형용사 구문에 대한 연구)

  • Ahn, Ae-Lim;Han, Yong-Jin;Park, Se-Young;Nam, Jee-Sun
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2011.06c
    • /
    • pp.248-251
    • /
    • 2011
  • 본 연구에서는, 웹 문서로부터 특정 상품에 대한 의견 문장을 분석하는 오피니언 마이닝(Opinion Mining) 연구의 일환으로, 특히 함께 공기하는 자질 명사에 따라 그 극성 값이 달라지는 '비결정 오피니언어휘'의 처리를 위해서 도메인을 '맛집'으로 한정하여 공기하는 도메인 키워드의 목록을 결정하고, 이를 부분문법그래프(Local Grammar Graphs) 방법론을 통해서 이들 간의 어휘 통사적 관계를 결정해 주었다.

Automatic Query Answering System Using The UNITEX for Robots Domain (UNITEX를 이용한 로봇 주제의 자동 질의응답 시스템)

  • Jung, Byung-Ho;Park, Choong-Shik;Woo, Young-Woon
    • Proceedings of the Korean Institute of Information and Commucation Sciences Conference
    • /
    • 2009.10a
    • /
    • pp.310-313
    • /
    • 2009
  • 기존의 자동 질의응답 시스템은 복잡한 구문처리와 의미분석으로 인하여 그 구현에 많은 어려움이 있다. 본 논문에서는 대화의 주제를 특정 분야로 제한할 경우 구문구(syntactic phrases)와 동의구(synonymous phrases)를 용이하게 처리하는 UNITEX를 사용해 문법을 처리하는 자동응답시스템을 제안한다. 자동응답시스템의 지식표현과 추론, 응답문 생성은 자체 개발한 지식처리시스템인 NEO를 사용한다.

  • PDF

LGG-based Phrase-Pattern Dictionaries of Non-Standard Tokens that contain Bound Nouns in Social Media Texts (SNS 텍스트의 비정규토큰 분석 성능 향상을 위한 의존명사 내포 어형의 LGG 기반 패턴문법 사전)

  • Choi, Seong-Yong;Shin, Dong-Hyok;Hwang, Chang-Hoe;Yoo, Gwang-Hoon;Nam, Jee-Sun
    • Annual Conference on Human and Language Technology
    • /
    • 2018.10a
    • /
    • pp.394-399
    • /
    • 2018
  • 본 연구는 SNS 텍스트에서 형태소 분석기로 분석되지 않는 비정규토큰 유형 중 고빈도로 나타나는 의존명사 내포 어형의 형태소를 인식할 수 있는 LGG 기반 패턴문법 사전 구축과 그 성능을 평가하는 것을 목표로 한다. SNS 텍스트에서는 기존의 정형화된 텍스트와 달리, 띄어쓰기 오류로 인한 미분석어가 매우 높은 빈도로 나타나는데, 특히 의존명사를 포함한 유형이 20% 이상을 차지하며 가장 빈번한 것으로 나타났다. 이에 본 연구에서는 의존명사를 내포한 비정규토큰의 띄어쓰기 오류 문제를 효과적으로 처리하기 위해, 부분 문법 그래프(Local Grammar Graph: LGG) 프레임에 기반한 패턴문법 사전을 구축하였다. 이를 SNS 코퍼스에 적용하여 성능을 평가한 결과, 정확률 91.28%, 재현율 89%, 조화 평균 90.13%의 성능을 통해 본 연구의 접근 방법론의 유용성과 구축 자원의 실효성을 입증하였다.

  • PDF

DecoFESA: A Hybrid Platform for Feature-based Sentiment Analysis Based on DECO-LGG Linguistic Resources with Parser and LSTM (DECO-LGG 언어자원 및 의존파서와 LSTM을 활용한 하이브리드 자질기반 감성분석 플랫폼 DecoFESA 구현)

  • Hwang, Changhoe;Yoo, Gwanghoon;Nam, Jeesun
    • Annual Conference on Human and Language Technology
    • /
    • 2020.10a
    • /
    • pp.321-326
    • /
    • 2020
  • 본 연구에서는 한국어 감성분석 성능 향상을 위한 DECO(Dictionnaire Electronique du COreen) 한국어 전자사전과 LGG(Local-Grammar Graph) 패턴문법 기술 프레임에 의존파서 및 LSTM을 적용하는 하이브리드 방법론을 제안하였다. 본 연구에 사용된 DECO-LGG 언어자원을 소개하고, 이에 기반하여 의미 정보를 의존파서(D-PARS)와 페어링하는 한편 OOV(Out Of Vocabulary)의 문제를 LSTM을 통해 해결하여 자질기반 감성분석 결과를 제시하였다. 부트스트랩 방식으로 반복 확장될 수 있는 LGG 언어자원 및 알고리즘을 통해 수행되는 자질기반 감성분석 프로세스는 전용 플랫폼 DecoFESA를 통해 그 범용성을 확장하였다. 실험을 위해서 네이버 쇼핑몰의 '화장품 구매 후기글'을 크롤링하였으며, DecoFESA 플랫폼을 통해 현재 구축된 DECO-LGG 언어자원 기반의 감성분석 성능을 평가하였다. 이를 통해 대용량 언어자원의 구축과 이를 활용하기 위한 어휘 시퀀스 처리 알고리즘의 구현이 보다 정확한 자질기반 감성분석 결과를 제공할 수 있음을 확인하였다.

  • PDF