• 제목/요약/키워드: Language-Independent Model

검색결과 83건 처리시간 0.025초

Document Summarization Model Based on General Context in RNN

  • Kim, Heechan;Lee, Soowon
    • Journal of Information Processing Systems
    • /
    • 제15권6호
    • /
    • pp.1378-1391
    • /
    • 2019
  • In recent years, automatic document summarization has been widely studied in the field of natural language processing thanks to the remarkable developments made using deep learning models. To decode a word, existing models for abstractive summarization usually represent the context of a document using the weighted hidden states of each input word when they decode it. Because the weights change at each decoding step, these weights reflect only the local context of a document. Therefore, it is difficult to generate a summary that reflects the overall context of a document. To solve this problem, we introduce the notion of a general context and propose a model for summarization based on it. The general context reflects overall context of the document that is independent of each decoding step. Experimental results using the CNN/Daily Mail dataset show that the proposed model outperforms existing models.

커스텀 파서와 SMT 솔버를 활용한 모델 기반 테스트 데이터 생성 기법 (Model-Based Automatic Test Data Generation Method Using Custom Parser and SMT Solver)

  • 신기욱;임동진
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제6권8호
    • /
    • pp.385-390
    • /
    • 2017
  • 지속적으로 증가하는 소프트웨어 복잡성으로 인해, 모델 기반 개발 기법은 소프트웨어 개발에 있어 거의 필수적인 기법이 되고 있다. 그러나, 모델 기반 기법을 활용한다 하더라도 복잡한 소프트웨어를 위한 테스트 케이스 생성은 여전히 풀어야 할 숙제이다. 본 논문에서는, 커스텀 파서와 SMT 솔버를 이용해 UML 모델 기반에서 자동 테스트 데이터를 생성하는 기법을 제안한다. 제안된 기법을 이용하면, 모델이 액션 언어(action language)와 같은 플랫폼 독립적인 언어로 구현되어 있거나, 플랫폼 종속적인 언어로 기술되어 있더라도 테스트 입력을 생성할 수 있다. 또한, 모델에서 테스트 케이스를 효율적으로 생성하기 위해 콘콜릭 수행 기법을 적용하였다. 본 논문에서는, 제안된 테스트 데이터 생성 기법을 통해 현대 산타페의 파워윈도우 스위치 모델에 활용된 사례를 기술한다.

데이터플로우 그래프 표현 방식을 이용한 함수 논리 언어의 실행 (Execution of a functional Logic language using the Dataflow Graph Representation)

  • 김용준;전서현
    • 한국정보처리학회논문지
    • /
    • 제5권9호
    • /
    • pp.2435-2446
    • /
    • 1998
  • 본 논문에서는 함수 논리 언어를 수행할 수 있는 데이터 플로우 표현 방법을 제시하고 함수 논리 언어의 각 결과 함수를 데이터플로우 그래프로 변환하는 방법에 대해 설명한다. 실행의 효율성을 높이기 위해 AND-병렬성을 위한 종속성 분석을 서브고울과 병행 수행하여 지연시간을 줄였으며, 함수 부분의 수행을 위해 병렬 감축을 사용하였다. RAP을 도입함으로써 발생하는 지연시간을 줄이기 위해 종속성 분석과 서브 고울을 병렬로 처리함으로써 CGE+ 표현 방식에 비해 효율적임을 보였다. 지능형 퇴각 검색을 도입하여 병렬 컴퓨터에서 효율적인 수행을 할 수 있도록 하였다.

  • PDF

PC-KIMMO-based Description of Mongolian Morphology

  • Jaimai, Purev;Zundui, Tsolmon;Chagnaa, Altangerel;Ock, Cheol-Young
    • Journal of Information Processing Systems
    • /
    • 제1권1호
    • /
    • pp.41-48
    • /
    • 2005
  • This paper presents the development of a morphological processor for the Mongolian language, based on the two-level morphological model which was introduced by Koskenniemi. The aim of the study is to provide Mongolian syntactic parsers with more effective information on word structure of Mongolian words. First hand written rules that are the core of this model are compiled into finite-state transducers by a rule tool. Output of the compiler was edited to clarity by hand whenever necessary. The rules file and lexicon presented in the paper describe the morphology of Mongolian nouns, adjectives and verbs. Although the rules illustrated are not sufficient for accounting all the processes of Mongolian lexical phonology, other necessary rules can be easily added when new words are supplemented to the lexicon file. The theoretical consideration of the paper is concluded in representation of the morphological phenomena of Mongolian by the general, language-independent framework of the two-level morphological model.

MPSoC용 임베디드 소프트웨어의 PSM 모델링 및 시뮬레이션 (Modeling and Simulation of Platform Specific Model in MPSoC Environment)

  • 송인권;오기영;홍장의;배두환
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제34권8호
    • /
    • pp.697-707
    • /
    • 2007
  • 임베디드 소프트웨어는 탑재될 하드웨어 아키텍처에 매우 의존적이기 때문에 플랫폼 특성을 고려한 소프트웨어 설계가 이루어져야 한다. 본 연구에서는 MPSoC(Multi Processor System On Chip)용 플랫폼에 탑재될 임베디드 소프트웨어의 PIM(Platform Independent Model)을 PSM(Platform Specific Model)에 매핑하기 위한 기법을 제안하고, 매핑 결과에 대한 시뮬레이션을 통해 매핑 기법의 유효성을 검사하였다. 제안하는 방법은 UML(Unified Modeling Language) 기반의 객체지향 모델로부터 태스크를 도출하여 이 기종의 하드웨어 컴포넌트로 구성된 MPSoC 플랫폼에 할당하기 위한 것으로써, 할당의 정확성 및 신속성과 소프트웨어 병렬성을 극대화 할 수 있는 장점을 제공한다.

다양한 연속밀도 함수를 갖는 HMM에 대한 우리말 음성인식에 관한 연구 (The Study of Korean Speech Recognition for Various Continue HMM)

  • 우인성;신좌철;강흥순;김석동
    • 전기전자학회논문지
    • /
    • 제11권2호
    • /
    • pp.89-94
    • /
    • 2007
  • 본 논문은 연속 밀도 함수를 갖는 HMM별 한국어 연속 음성인식에 관한 연구이다. 여기서 우리는 밀도 함수가 2개에서 44개까지 갖는 연속 HMM모델에서 가장 효율적인 연속 음성인식을 위한 방법을 제시한다. 음성 모델은 36개로 구성한 기본음소를 사용한 CI-Model과 3,000개로 구성한 확장음소를 사용한 CD-Model을 사용하였고, 언어 모델은 N-gram을 이용하여 처리하였다. 이 방법을 사용하여 500개의 문장과 6,486개의 단어에 대하여 화자 독립으로 CI Model에서 최고 94.4%의 단어인식률과 64.6%의 문장인식률을 얻었고, CD Model에서는98.2%의 단어인식률과 73.6%의 문장인식률을 안정적으로 얻었다.

  • PDF

저작물 이용권한 명세를 위한 ODRL 확장 모델 및 프로토타입 설계 (ODRL Ontology Extention Model and Prototype Design for the Specification of the Rights to use Digital Contents)

  • 김정민;정현숙
    • 융합정보논문지
    • /
    • 제10권1호
    • /
    • pp.13-21
    • /
    • 2020
  • 인터넷 기술 및 디지털 콘텐츠 편집 소프트웨어의 발전으로 인해 점점 많은 수의 1인 미디어 창작자(크리에이터)들이 다양한 콘텐츠들을 생산하고 공유하고 있다. 그러나 1인 미디어 활성화를 위해서는 콘텐츠의 사용, 판매, 편집, 재가공 등 다양한 거래 유형별 이용권한(라이선스) 생성과 함께 콘텐츠 사용 모니터링, 라이선스 거래 추적 등의 핵심 기술이 1인 미디어 플랫폼에서 지원되어야 한다. 본 논문에서는 ODRL(Open Digital Rights Language) 온톨로지(ontology)에 기반하여 다양한 수준의 디지털 콘텐츠 이용권한 및 이용추적을 명세할 수 있는 Policy 클래스 확장 모델을 정의하고 모델의 성능을 평가하기 위한 사용자 인터페이스 프로토타입을 구현하였다. 본 논문의 제안 모델은 개인 창작물 공유 플랫폼의 라이선스 관리 모듈 구현의 핵심 요소로 참조될 수 있다.

다국적 임상시험 지원을 위한 CDISC 표준의 확장 (CDISC Extension for Supporting Multinational Clinical Trials)

  • 염지현;최인영;김석일;김혁만
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제15권8호
    • /
    • pp.566-575
    • /
    • 2009
  • CDISC 컨소시엄에서는 임상시험에서의 비효율적인 데이터 처리 과정을 개선하기 위해, 플랫폼에 독립적인 임상시험 데이터 표준을 정의하였다. 그러나, CDISC 표준은 여러 나라의 여러 기관이 함께 참여하는 다국가 임상시험에서 발생하는 임상시험 데이터를 다국어로 표현하는 방법에 많은 제약을 갖고 있다. 특히, CDISC가 제정한 표준 중 임상시험 데이터의 콘텐츠 및 포맷에 해당하는 SDTM(Study Data Tabulation Model)과 ODM(Operational Data Model)에서의 다국어 지원이 매우 미비하다. 본 논문은 CDISC의 SDTM과 ODM에서의 언어 설정에 대한 문제점을 해결하기 위해, SDTM과 ODM 표준의 확장을 제안한다. 이를 위해 SDTM에서는 다국어 지원을 위한 새로운 도메인을 설계하였고, ODM에서는 ODM의 확장 스키마를 서브타이핑 방법으로 구현하였다. 확장 SDTM과 ODM을 기반으로 임상시험 데이터를 처리하면, 다국가 임상시험이 수행되는 경우 다국어로 표현된 임상시험 데이터도 효율적으로 처리할 수 있다.

Back-off bigram을 이랑한 대용량 연속어의 화자적응에 관한 연구 (A Study on Speaker Adaptation of Large Continuous Spoken Language Using back-off bigram)

  • 최학윤
    • 한국통신학회논문지
    • /
    • 제28권9C호
    • /
    • pp.884-890
    • /
    • 2003
  • 본 논문에서는 화자 독립 시스템에서 필요한 화자 적응 방법에 관해 연구하였다. 훈련에 참여하지 않은 새로운 화자에 대해서 bigram과 back-off bigram, MAP와 MLLR의 결과를 비교해 보았다. back-off bigram은 훈련중 나타나지 않은 bigram 확률을 unigram과 back-off 가중치를 적용하므로 bigram 확률 값에 약간의 가중치를 더하는 효과를 가져온다. 음성의 특징 파라미터로는 12차의 MFCC와 log energy, 1차 미분, 2차 미분을 사용하여 총 39차의 특징 벡터를 사용하였다. 인식 실험을 위해 CHMM, 삼중음소(tri-phones)의 인식 단위, 그리고 bigram과 back-off bigram의 언어 모델을 사용한 시스템을 구성하였다.

회귀 분석 모델을 이용한 고리 1호기 해체 비용 추정 (Decommissioning Cost Estimation of Kori Unit 1 Using a Multi-Regression Analysis Model)

  • 주한영;김재욱;정소윤;문주현
    • 방사성폐기물학회지
    • /
    • 제18권2_spc호
    • /
    • pp.247-260
    • /
    • 2020
  • 본 논문에서는 고리 1호기 해체 비용 추정을 위해 외국 원자력발전소 해체 비용 데이터를 현가화한 후 원자력발전소 해체 비용 추정 회귀 분석모델을 개발하였다. 이 모델 개발에 사용된 데이터는 해체 또는 진행 중인 BWR 13기, PWR 16기의 해체 비용 데이터이다. 회귀 분석모델 도출을 위해, 해체 비용을 종속변수로 정하고, 해체 원전의 운전 특성을 반영할 수 있게 고안된 Contamination factor와 해체 기간을 독립변수로 선정하였다. 빅데이터 분석 도구인 R language의 통계패키지를 이용하여 회귀 분석모델을 도출하였다. 이 회귀 분석 모델을 적용하여 고리 1호기 해체 비용을 예측한 결과, 미화 663.40~928.32백만 달러, 한화 약 7,828.12억~1조 954.18억 원이 소요될 것으로 예측되었다.