• Title/Summary/Keyword: Language Models

검색결과 872건 처리시간 0.029초

이중주격구문의 의미구조 (Semantic Structure of Double Nominative Constructions)

  • 김경환
    • 한국콘텐츠학회논문지
    • /
    • 제20권5호
    • /
    • pp.338-343
    • /
    • 2020
  • 언어의 통사, 의미, 형태 등 여러 다른 영역들을 동시에 그리고 독립적으로 생성되는 모듈로 보는 자율어휘문법을 기반으로 이중주격에 대한 의미론적 분석을 제시하는 것이 본 논문의 목적이다. 과거의 통사중심주의적 이론에서는 이중주격에 대한 분석방식으로 소유자인상, 예외적 격부여, 병합 등이 제시되었다. 통사중심주의적 이론과 달리 본 논문에서는 내적소유와 외적소유에 대한 기능-논항구조를 밝혀 이중주격에 대한 의미론적 분석을 제시한다. 이중주격에 사용되는 소유대상은 관계명사로 기능-논항구조에서 소유자를 논항으로 취하는 것으로 본다. 소유자에 해당되는 이 논항이 바로 관계명사와 결합하면 내적소유구문이 생성된다. 반면에 소유자가 공백상태인 경우 소유자와 공지시관계인 논항이 최종적으로 술어와 결합하여 그 결과 소유자가 주격으로 표현되는 외적소유구문이 생성된다. 외적소유의 기능-논항구조는 해당 문장이 내적소유와 달리 주격으로 표현된 소유자에 대해 서술하고 있음을 구조적으로 보여준다.

의미 유사도를 활용한 Distant Supervision 기반의 트리플 생성 성능 향상 (Improving The Performance of Triple Generation Based on Distant Supervision By Using Semantic Similarity)

  • 윤희근;최수정;박성배
    • 정보과학회 논문지
    • /
    • 제43권6호
    • /
    • pp.653-661
    • /
    • 2016
  • 기존의 패턴기반 트리플 생성 시스템은 distant supervision의 가정으로 인해 오류 패턴을 생성하여 트리플 생성 시스템의 성능을 저하시키는 문제점이 있다. 이 문제점을 해결하기 위해 본 논문에서는 패턴과 프로퍼티 사이의 의미 유사도 기반의 패턴 신뢰도를 측정하여 오류 패턴을 제거하는 방법을 제안한다. 의미 유사도 측정은 비지도 학습 방법인 워드임베딩과 워드넷 기반의 어휘 의미 유사도 측정 방법을 결합하여 사용한다. 또한 한국어 패턴과 영어 프로퍼티 사이의 언어 및 어휘 불일치 문제를 해결하기 위해 정준 상관 분석과 사전 기반의 번역을 사용한다. 실험 결과에 따르면 제안한 의미 유사도 기반의 패턴 신뢰도 측정 방법이 기존의 방법보다 10% 높은 정확률의 트리플 집합을 생성하여, 트리플 생성 성능 향상을 증명하였다.

Building Light Weight CORBA Based Middleware for the CAN Bus Systems

  • Hong, Seongsoo
    • Transactions on Control, Automation and Systems Engineering
    • /
    • 제3권3호
    • /
    • pp.181-189
    • /
    • 2001
  • The software components of embedded control systems get extremely complex as they are designed into distributed systems get extremely complex as they are designed into distributed systems consisting of a large number of inexpensive microcontrollers interconnected by low-bandwidth real-time networks such as the controller area network (CAN). While recently emerging middleware technologies such as CORBA and DCOM address the complexity of distributed programming, they cannot be directly applied to distributed control system design due to their excessive resource demand and inadequate communication models. In this paper, we propose a CORBA-based middleware design for CAN-based distributed embedded control systems. Our design goal is to minimize its resource need and make it support group communication without losing the IDL (interface definition language) level compliance to the OMG standards. To achieve this, we develop a transport protocol on the CAN and a group communication scheme based on the well-known publisher/subscriber model. The protocol effectively realizes subject-based addressing and supports anonymous publisher/subscriber communication. We also customize the method invocation and message passing protocol, referred to as the general inter-ORB protocol (GIOP), of CORBA so that CORBA method invocations are efficiently serviced on a low-bandwidth network such as the CAN. This customization includes packed data encoding and variable-length integer encoding for compact representation of IDL data types. We have implemented our CORBA-based middleware on the mArx real-time operating system we have developed at Seoul National University. Our experiments clearly demonstrate that it is feasible to use CORBA in developing distributed embedded control systems possessing severe resource limitations. Our design clearly demonstrates that it is feasible to use a CORBA-based middleware in developing distributed embedded systems on real-time networks possessing severe resource limitations.

  • PDF

수문학적 유역특성자료 자동화 추출 및 분석시스템 개발 (I) (System Development for Automatic Extraction and Analysis of Hydrology-Related Watershed Characteristic Data)

  • 황의호;권형중;이근상;유병혁;고덕구
    • 한국지리정보학회지
    • /
    • 제11권3호
    • /
    • pp.1-12
    • /
    • 2008
  • 본 연구에서는 다양한 수문 모형에 적용을 위한 입력자료 도출 기반을 마련하고자 보다 편리하고 체계적인 유역특성자료 분석시스템을 개발하였다. PRMS 모형을 이용하여 유출분석 수행시 입력자료 생성을 위해 사용되는 USGS WEASEL을 참고하여 시스템 개발항목을 도출하고, 체계적이고 효율적인 시스템 개발 및 유지관리를 위하여 UML을 이용한 객체지향 시스템을 설계하였다. 또한, 편리한 사용자 인터페이스 제공 및 다양한 수질 수문 모형에 적용하기 위하여 GIS 컴포넌트 기반인 ArcGIS ArcObjects를 이용하여 유역특성자료 분석시스템을 개발하였다.

  • PDF

한국어 음성 합성을 위한 음가 변환 테이블 생성 (Formation of A Phonetic-Value Look-up Table for Korean Voice Synthesis)

  • 이계영;임재걸
    • 전자공학회논문지CI
    • /
    • 제38권5호
    • /
    • pp.44-57
    • /
    • 2001
  • 문법적으로 정확한 한국어 음성을 합성하려면 표준어 규정의 '표준 발음법'을 준용해야 한다. 따라서 한국어 음가 합성 시스템에 사용되는 한글을 음성으로 변환하여 주는 규칙은 '표준 발음법'을 완전하게 반영하며 또한 무결해야 한다. 기존의 연구에서는 표준 발음법을 검증없이 적용하여 왔고, 표준 발음법 자체에 모순이 있는가의 여부에 대해서도 체계적인 분석을 위한 시도가 진부하였다. 본 논문에서는 한국어 음가 생성의 기본 규칙으로 준용할 표준 발음법을 페트리 넷으로 모델링하여 표준 발음법의 일관성을 검증하였다. 그리고, 음운 변동 현상을 여러 단계로 나누어 차례로 적용한다든지, 변동된 단어에 대하여 처음부터 다시 변환 작업을 재수행하는 기존의 음가 생성 방법의 문제점을 해결하기 위하여 한번의 테이블 탐색으로 모든 음운 변동이 완료되는 한국어 음성 합성을 위한 음가 변환 테이블을 구현하였다.

  • PDF

상위레벨에서의 VHDL에 의한 순차회로 모델링과 테스트생성 (High-level Modeling and Test Generation With VHDL for Sequential Circuits)

  • 이재인;이종한
    • 한국정보처리학회논문지
    • /
    • 제3권5호
    • /
    • pp.1346-1353
    • /
    • 1996
  • 본 논문은 상위레벨에서 VHDL을 사용하여 순차회로의 주요 구성요소인 플립플롭을 모델링하는 방법과 고장을 검출하기 위한 테스트생성 알고리즘을 제안 한다. RS, JK, D, T플립플롭은 데이터 흐름형을 이용하여 모델링한다. 칩레벨 모델의 기본 구조인 마이크로 오퍼레이션 시이퀸스를 하나 이상의 다른 마이크로 오퍼레이션 사이퀸스에 연결된 제어점으로 나타낸다. 다른 마이크로 오퍼레이션을 제한하고 있는 마이크로 오퍼레이션고 장(FMOP고장)을 효과적으로 나타내기 위하여 고울트리의 개념을 사용하며 고울을 처리하기 위해서 휴리스틱 조건을 이용한다. FMOP나 제어점 고장(FCON)이 발생 할때 고장 활성화, 경로 활성화 및 활성화된 경로를 유지하기 위한 명료화과정을 거쳐 테스트 패턴을 생성 제안한 알고리즘을 C 언어로 실현하고 예제를 통하여 유효성을 확인 한다.

  • PDF

개체-관계 모델에선 XML Schema의 생성 (A Generation from Entity-Relationship Model to XML Schema Model)

  • 김창석;김대수;손동철
    • 한국지능시스템학회논문지
    • /
    • 제14권6호
    • /
    • pp.667-673
    • /
    • 2004
  • 본 XML이 웹 상에서 문서 교환의 표준으로 자리잡고 있으며 그 수요가 나날이 증가하고 있다. 그에 따라 XML 데이터나 문서 구조를 모델링하는 XML Schema(W3C XML Schema Spec) 또한 수요가 증가하고 있다. 그러나 XML Schema는 다양한 자료형과 풍부한 표현력을 제공하지만 그 복잡성으로 인해 모델링하기가 어려운 단점이 있다. 본 논문에서는 관계형 데이터베이스 설계의 기본적인 도구인 개체-관계 모델을 이용하여 XML Schema를 간단하게 생성하는 방법을 제시한다. 개체-관계 모델과 변환될 XML Schema의 구조는 서로 일대일로 매핑되지 않아 직접 변환할 수는 없다. 그래서 몇 가지 알고리즘을 이용하여 개체-관계 모델을 계층적 구조모델로 변환을 한다. 이렇게 변환된 계층적 구조 모델을 이용하여 최종적으로 XML Schema를 생성한다. 기존의 XML Schema 생성 방법은 개체간의 애트리뷰트가 상위 혹은 하위로 이동하면서 최초 설계시의 개체가 사라지므로 XML Schema의 중요한 특성인 재사용을 이용할 수 없다는 단점을 가진다. 여기서 제시한 알고리즘은 XML Schema의 중요한 특성들인 재사용성, 전역 및 로컬 기능 등을 가진 문서를 생성한다는 것이다.

Accuracy of new implant impression technique using dual arch tray and bite impression coping

  • Lee, Shin-Eon;Yang, Sung-Eun;Lee, Cheol-Won;Lee, Won-Sup;Lee, Su Young
    • The Journal of Advanced Prosthodontics
    • /
    • 제10권4호
    • /
    • pp.265-270
    • /
    • 2018
  • PURPOSE. The purpose of this in vitro study was to evaluate the accuracy of a new implant impression technique using bite impression coping and a dual arch tray. MATERIALS AND METHODS. Two implant fixtures were placed on maxillary left second premolar and first molar area in dentoform model. The model with two fixtures was used as the reference. The impression was divided into 2 groups, n=10 each. In group 1, heavy/light body silicone impression was made with pick up impression copings and open tray. In group 2, putty/light body silicone impression was made with bite impression copings and dual arch tray. The reference model and the master casts with implant scan bodies were scanned by a laboratory scanner. Surface tessellation language (STL) datasets from test groups was superimposed with STL dataset of reference model using inspection software. The three-dimensional deviation between the reference model and impression models was calculated and illustrated as a color-map. Data was analyzed by independent samples T-test of variance at ${\alpha}=.05$. RESULTS. The mean 3D implant deviations of pick up impression group (group 1) and dual arch impression group (group 2) were 0.029 mm and 0.034 mm, respectively. The difference in 3D deviations between groups 1 and 2 was not statistically significant (P=.075). CONCLUSION. Within limitations of this study, the accuracy of implant impression using a bite impression coping and dual arch tray is comparable to that of conventional pick-up impression.

Fitting Cure Rate Model to Breast Cancer Data of Cancer Research Center

  • Baghestani, Ahmad Reza;Zayeri, Farid;Akbari, Mohammad Esmaeil;Shojaee, Leyla;Khadembashi, Naghmeh;Shahmirzalou, Parviz
    • Asian Pacific Journal of Cancer Prevention
    • /
    • 제16권17호
    • /
    • pp.7923-7927
    • /
    • 2015
  • Background: The Cox PH model is one of the most significant statistical models in studying survival of patients. But, in the case of patients with long-term survival, it may not be the most appropriate. In such cases, a cure rate model seems more suitable. The purpose of this study was to determine clinical factors associated with cure rate of patients with breast cancer. Materials and Methods: In order to find factors affecting cure rate (response), a non-mixed cure rate model with negative binomial distribution for latent variable was used. Variables selected were recurrence cancer, status for HER2, estrogen receptor (ER) and progesterone receptor (PR), size of tumor, grade of cancer, stage of cancer, type of surgery, age at the diagnosis time and number of removed positive lymph nodes. All analyses were performed using PROC MCMC processes in the SAS 9.2 program. Results: The mean (SD) age of patients was equal to 48.9 (11.1) months. For these patients, 1, 5 and 10-year survival rates were 95, 79 and 50 percent respectively. All of the mentioned variables were effective in cure fraction. Kaplan-Meier curve showed cure model's use competence. Conclusions: Unlike other variables, existence of ER and PR positivity will increase probability of cure in patients. In the present study, Weibull distribution was used for the purpose of analysing survival times. Model fitness with other distributions such as log-N and log-logistic and other distributions for latent variable is recommended.

연속음성인식 시스템의 성능 향상을 위한 반복학습법을 이용한 언어모델 (Language Models Using Iterative Learning Method for the Improvement of Performance of CSR System)

  • 오세진;황철준;김범국;정호열;정현열
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1999년도 학술발표대회 논문집 제18권 1호
    • /
    • pp.82-85
    • /
    • 1999
  • 본 연구에서는 연속음성인식 시스템의 성능 향상을 위하여 음성의 채록환경 및 데이터량 등을 고려한 효과적인 언어모델 작성방법을 제안하고, 이를 항공편 예약시스템에 적용하여 성능 평가 실험을 실시한 결과 $91.6\%$의 인식률을 얻어 제안한 방법의 유효성을 확인하였다. 이를 위하여 소량의 200문장의 항공편 예약 텍스트 데이터를 이용하여 좀더 강건한 단어발생 확률을 가지도록 하기 위해 일반적으로 대어휘 연속음성인식에서 많이 이용되고 있는 단어 N-gram 언어모델을 도입하고 이를 다양한 발성환경을 고려하여 1,154문장으로 확장한 후 동일 문장'을 반복 학습하여 언어모델을 작성하였다. 인식에 있어서는 오인식과 문법적 오류를 최소화하기 위하여 forward - backward pass 방법의 stack decoding알고리즘을 이용하였다. 인식실험 결과, 평가용 3인의 200문장을 각 반복학습 회수에 따라 학습한 각 언어모델에 대해 평가한 결과, forward pass의 경우 평균 $84.1\%$, backward pass의 경우 평균 $91.6\%$의 문장 인식률을 얻었다. 또한, 반복학습 회수가 증가함에 따라 backward pass의 인시률의 변화는 없었으나, forward pass의 경우, 인식률이 반복회수에 따라 증가하다가 일정값에 수렴함을 알 수 있었고, 언어모델의 복잡도에서도 반복회수가 증가함에 따라 서서히 줄어들며 수렴함을 알 수 있었다. 이상의 결과로부터 소량의 텍스트 데이터를 이용한 제한된 태스크에서 언어모델을 작성할 때 반복학습 방법이 유효함을 확인할 수 있다.

  • PDF