• Title/Summary/Keyword: 언어 독립적 모델

Search Result 61, Processing Time 0.023 seconds

Design of Translator for generating Java Bytecode from Thread code of Multithreaded Models (다중스레드 모델의 스레드 코드를 자바 바이트 코드로 변환하기 위한 번역기 설계)

  • 김기태;이갑래;양창모;유원희
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2000.04a
    • /
    • pp.68-70
    • /
    • 2000
  • 다중스레드 모델은 데이터플로우 모델의 내부적인 병렬성, 비동기적 자료 가용성과 폰 노이만 모델의 실행 지역성을 결합하여 병렬처리 시스템의 성능을 향상 시켰다. 이 모델은 프로그램의 실행을 위하여 컴파일러에 의해 생성된 스레드를 수행하며, 스레드의 생성 방법에 따라 자원 활용 빈도나 동기화 빈도와 같은 스레드의 질이 결정 되는 특징이 있다. 하지만 다중스레드 모델은 실행 모델이 특정 플랫폼에 제한되는 단점을 가지고 있다. 이에 반해 자바는 플랫폼에 독립적인 특징을 가지고 있어 다중스레드 모델의 스레드 코드를 실행 단위인 자바 언어로 변환하면 다중스레드 모델의 특징을 여러 플랫폼에서 수정 없이 사용할 수 있게 된다. 자바는 원시 언어를 중간 언어 형태의 바이트 코드로 변환하여 각 아키텍처에 맞게 설계된 자바 가상 머신이 설치된 시스템에서 자바 언어를 수행한다. 이러한 자바 언어의 바이트 코드는 번역기의 중간 언어와 같은 역할을 수행하고, 자바 가상 머신은 번역기의 후위부와 같은 역할을 한다. 본 논문은 다중스레드 코드가 플랫폼에 독립적인 특성을 갖출 수 있도록 다중스레드 코드를 자바 가상 머신에서 실행 가능하도록 한다. 즉, 다중스레드 모델의 스레드 코드를 자바 바이트 코드로 변환하는 번역기를 설계, 구현하고, 자바 가상 머신의 실행을 분석한다.

  • PDF

For Automatic File Name Attachment Service Unsupervised Learning-based File Name Extraction Method (파일명 자동 부착 서비스를 위한 비지도 학습 기반 파일명 추출방법)

  • Ju-oh Sun;Youngjin Jang;Harksoo Kim
    • Annual Conference on Human and Language Technology
    • /
    • 2022.10a
    • /
    • pp.596-599
    • /
    • 2022
  • 심층 학습은 지속적으로 발전하고 있으며, 최근에는 실제 사용자에게 제공되는 애플리케이션까지 확장되고 있다. 특히 자연어처리 분야에서는 대용량 언어 말뭉치를 기반으로 한 언어모델이 등장하면서 사람보다 높은 성능을 보이는 시스템이 개발되었다. 그러나 언어모델은 높은 컴퓨팅 파워를 요구하기 때문에 독립적인 소형 디바이스에서 제공할 수 있는 서비스에 적용하기 힘들다. 예를 들어 스캐너에서 제공할 수 있는 파일명 자동 부착 서비스는 하드웨어의 컴퓨팅 파워가 제한적이기 때문에 언어모델을 적용하기 힘들다. 또한, 활용할 수 있는 공개 데이터가 많지 않기 때문에, 데이터 구축에도 높은 비용이 요구된다. 따라서 본 논문에서는 컴퓨팅 파워에 비교적 독립적이고 학습 데이터가 필요하지 않은 비지도 학습을 활용하여 파일명 자동 부착 서비스를 위한 파일명 추출 방법을 제안한다. 실험은 681건의 문서 OCR 결과에 정답을 부착하여 수행했으며, ROUGE-L 기준 0.3352의 성능을 보였다.

  • PDF

Cost Evaluation of the SPARQL-to-SQL Translation System Model Independent on Storages (저장소에 독립적인 SPARQL-to-SQL 변환 시스템 모텔에 대한 비용 평가)

  • Son, Ji-Seong;Jeong, Dong-Won;Baik, Doo-Kwon
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2009.01a
    • /
    • pp.401-406
    • /
    • 2009
  • 이 논문에서는 저장소에 독립적인 SPARQL-to-SQL변환 시스템 모델의 비용 평가를 수행한다. 시맨틱 웹이 발전하면서 이를 기술하기 위한 다양한 웹 온톨로지 언어들이 제안되었고 이를 저장 및 검색하기 위한 관계형 데이터베이스 기반의 저장소와 SPARQL과 같은 질의 언어가 개발되었다. SPARQL의 활용도가 높아짐에 따라 관계형 데이터베이스에 저장된 웹 온톨로지 데이터를 질의하기 위해서는 SPARQL을 SQL로 변환하기 위한 알고리즘이 필요하다. 그러나 기존에 제안된 변환 알고리즘들은 몇 가지 해결해야 할 문제점을 가지고 있는데 그 중 변환 알고리즘이 저장소에 종속적이라는 문제점 때문에 변환 알고리즘의 활용도가 떨어진다. 이를 해결하기 위하여 기존 논문에서는 저장소에 독립적으로 변환 알고리즘을 활용할 수 있는 시스템 모델을 제안하였으며 프로토타입을 구현하여 제안 모델을 통한 질의 결과의 정확성을 측정하였다. 또한, 저장소의 종속적인 모델과 독립적인 모델간의 정성적 평가를 통하여 저장소에 독립적인 모델이 여러 측면에서 활용도가 높다는 것을 평가하였다. 그러나 기존 논문에서는 제안한 시스템 모델에 대한 명확한 정량적 평가가 이루어지지 않았다. 따라서 이 논문에서는 비용 평가 모델을 정의하여 제안한 시스템 모델의 효율성을 정량적으로 평가한다.

  • PDF

An Analysis of Named Entity Recognition System using MLM-based Language Transfer Learning (MLM 기반 언어 간 전이학습을 이용한 개체명 인식 방법론 분석)

  • Junyoung Son;Gyeongmin Kim;Jinsung Kim;Yuna Hur;Heuiseok Lim
    • Annual Conference on Human and Language Technology
    • /
    • 2022.10a
    • /
    • pp.284-288
    • /
    • 2022
  • 최근 다양한 언어모델의 구축 및 발전으로 개체명 인식 시스템의 성능은 최고 수준에 도달했다. 하지만 이와 관련된 대부분의 연구는 데이터가 충분한 언어에 대해서만 다루기 때문에, 양질의 지도학습 데이터의 존재를 가정한다. 대부분의 언어에서는 개체 유형에 대한 언어의 잠재적 특성을 충분히 학습할 수 있는 지도학습 데이터가 부족하기 때문에, 종종 자원 부족의 어려움에 직면한다. 본 논문에서는 Masked language modeling 기반 언어 간 전이학습을 이용한 개체명 인식 방법론에 대한 분석을 수행한다. 이를 위해 전이를 수행하는 소스 언어는 고자원 언어로 가정하며, 전이를 받는 타겟 언어는 저자원 언어로 가정한다. 본 논문에서는 언어모델의 토큰 사전에 언어 독립적인 가상의 자질인 개체 유형에 대한 프롬프트 토큰을 추가하고 이를 소스 언어로 학습한 뒤, 타겟 언어로 전이하는 상황에서 제안하는 방법론에 대한 평가를 수행한다. 실험 결과, 제안하는 방법론은 일반적인 미세조정 방법론보다 높은 성능을 보였으며, 한국어에서 가장 큰 영향을 받은 타겟 언어는 네덜란드어, 한국어로 전이할 때 가장 큰 영향을 준 소스 언어는 중국어인 결과를 보였다.

  • PDF

A Development of View Generation Tool for Mapping the Jena Storage Structure to TRIPLES Structure (Jena 저장소 구조를 TRIPLES 구조로의 사상을 위한 뷰 생성 도구 개발)

  • Ji, Jong-Jin;Son, Ji-Seong;Jeong, Dong-Won
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2009.01a
    • /
    • pp.411-416
    • /
    • 2009
  • 웹 온톨로지 언어의 개발에 따라 웹 온톨롤지를 저장하기 위한 다양한 저장소들이 개발되었으며 이러한 웹 저장소는 관계형 데이터베이스 모델을 기반으로 하고 있다. 또한 웹 온톨로지 데이터를 검색하기 위한 질의 언어로서 W3C에서 SPARQL을 제안하였다. 웹 온톨로지 저장소로서 관계형 데이터베이스가 활발히 개발되고 SPARQL의 이용이 증가함에 따라 SPARQL을 SQL로 변환 하는 알고리즘의 필요성이 대두되었다. 지금까지 제안된 변환 알고리즘들은 SPARQL-to-SQL 변환 알고리즘이 저장소 구조에 종속적이라는 문제점이 있다. 이를 해결하기 위하여 관계형 뷰를 기반으로 저장소에 독립적인 변환 알고리즘을 활용할 수 있는 모델이 제안되었다. 그러나 제안된 모델에서 변환 알고리즘을 독립적으로 활용하기 위해서는 사전에 사용자가 SQL 문을 작성하여 수동적으로 뷰를 생성해 주어야 한다. 이 경우 수동적인 SQL 작성으로 인한 불편함과 사용자의 실수로 인한 SQL문의 오류가 생길 수 있다는 문제점이 있다. 따라서 이 논문에서는 이러한 문제점을 해결하기 위하여 다양한 웹 온톨로지 저장소 모델 OWL 관련 시스템 개발에 가장 많이 사용되고 있는 Jena 저장소를 이용하여 독립적 저장소 활용을 위한 뷰 생성 독인 Jena-to-TRIPLES 변환 도구를 제안한다.

  • PDF

Design and Implementation of Java based Browsing System using Wireless Markup Language Document Object Modeling (무선 마크업 언어 문서의 객체 모델링을 통한 자바 기반 브라우징 시스템의 설계 및 구현)

  • 최은정;한동원;김태주;임경식
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2001.04a
    • /
    • pp.271-273
    • /
    • 2001
  • 본 논문에서는 무선 마크업 언어의 특성을 고려하여 무선 환경에 적합한 무선 인터넷 컨텐츠인 바이너리 무선 마크업 언어 문서를 브라우징하기 위한 시스템을 설계, 구현하였다. 카드 랜더링 및 사용자와의 상호작용 시 브라우징 처리를 단순화하기 위해 문서를 개체 모델링하였다. 무선 마크업 언어 문서 객체 모델은 무선 마크업 언어 특성을 고려하여 설계되었으며, 브라우징 처리 시에 문서의 검색 및 편집을 용이하게 하는 장점을 가진다. 또한 문서객체 모델은 컨텐츠의 파싱과 브라우징 처리를 분리하는 역할을 하기도 한다. 본 논문의 브라우징 시스템은 자바를 기반으로 설계 및 구현되었기 때문에 플랫폼 독립적이며, 메모리나 디스크가 제한되어 있어 한번에 여러 개의 프로그램을 상주시킬 수 없는 단말의 경우 네트워크를 통해 동적으로 프로그램을 실행시킬 수 있다는 장점이 있다.

RBAC 모델의 Java 2 환경 적용연구 동향 및 활용연구

  • 이형효;이동익;노봉남
    • Review of KIISC
    • /
    • v.10 no.4
    • /
    • pp.69-82
    • /
    • 2000
  • 자바기술은 플랫폼에 독립적인 프로그래밍 언어와 실행환경 특성으로 인터넷의 확산과 함께 활용분야를 넓혀가고 있다. 초기의 매우 엄격한 자비 보안모델은 네트워크 환경에서 유용한 기능을 수행하는 프로그램 개발에 장애가 되었으나, 현재는 보안정책에 기반한 유연한 접근통제기능을 제공하도록 수정, 보완되었다. 그러나 현재의 자바 보안모델이 코드 기반의 접근통제기능만을 제공하고 있어 네트워크 환경에서 여러 사용자에 의해 수행되는 응용 프로그램 실행환경에 적합하지 않은 문제점이 있다. 본 논문에서는 이와 같은 문제점을 해결하기 위해 자바 환경에 역할기반 접근통제모델을 적용하는 연구들에 대해 살펴보고 역할기반 접근통제모델이 적용된 자바 기술이 활용될 수 있는 분야에 대해 기술한다.

  • PDF

Extracting Korean-English Parallel Sentences based on Measure of Sentences Similarity Using Sequential Matching of Heterogeneous Language Resources (이질적인 언어 자원의 순차적 매칭을 이용한 문장 유사도 계산 기반의 위키피디아 한국어-영어 병렬 문장 추출 방법)

  • Cheon, Juryong;Ko, Youngjoong
    • Annual Conference on Human and Language Technology
    • /
    • 2014.10a
    • /
    • pp.127-132
    • /
    • 2014
  • 본 논문은 위키피디아로부터 한국어-영어 간 병렬 문장을 추출하기 위해 이질적 언어 자원의 순차적 매칭을 적용한 유사도 계산 방법을 제안한다. 선행 연구에서는 병렬 문장 추출을 위해 언어 자원별로 유사도를 계산하여 선형 결합하였고, 토픽모델을 이용해 추정한 단어의 토픽 분포를 유사도 계산에 추가로 이용함으로써 병렬 문장 추출 성능을 향상시켰다. 하지만, 이는 언어 자원들이 독립적으로 사용되어 각 언어자원이 가지는 오류가 문장 간 유사도 계산에 반영되는 문제와 관련이 적은 단어 간의 분포가 유사도 계산에 반영되는 문제가 있다. 본 논문에서는 이질적인 언어 자원들을 이용해 순차적으로 단어를 매칭함으로써 언어 자원들의 독립적인 사용으로 각 자원의 오류가 유사도에 반영되는 문제를 해결하였고, 관련이 높은 단어의 분포만을 유사도 계산에 이용함으로써 관련이 적은 단어의 분포가 반영되는 문제를 해결하였다. 실험을 통해, 언어 자원들을 이용해 순차적으로 매칭한 유사도 계산 방법은 선행 연구에 비해 F1-score 48.4%에서 51.3%로 향상된 성능을 보였고, 관련이 높은 단어의 분포만을 유사도 계산에 이용한 방법은 약 10%에서 34.1%로 향상된 성능을 얻었다. 마지막으로, 제안한 유사도 방법들을 결합함으로써 선행연구의 51.6%에서 2.7%가 향상된 54.3%의 성능을 얻었다.

  • PDF

Utterance Intention Analysis Using CNN-LSTM Neural Network (CNN-LSTM 신경망을 이용한 발화 분석 모델)

  • Kim, Min-Kyoung;Kim, Harksoo
    • Annual Conference on Human and Language Technology
    • /
    • 2017.10a
    • /
    • pp.122-124
    • /
    • 2017
  • 대화시스템이 적절한 응답을 제시해 주기 위해서는 사용자의 의도를 분석하는 것은 중요한 일이다. 사용자의 의도는 도메인에 독립적인 화행과 도메인에 종속적인 서술자의 쌍으로 나타낼 수 있다. 사용자 의도를 정확하게 분석하기 위해서는 화행과 서술자를 동시에 분석하고 대화의 문맥을 고려해야 한다. 본 논문에서 제안하는 모델은 합성곱 신경망에서 공유 계층을 이용하여 화행과 서술자간 상호작용이 반영된 발화 임베딩 모델을 학습한다. 그리고 순환 신경망을 통해 대화의 문맥을 반영하여 발화를 분석한다. 실험 결과 제안 모델이 이전 모델들 보다 높은 성능 (F1-measure로 화행에 대해 0.973, 서술자 0.919)을 보였다.

  • PDF

A Compound Noun Processing in the Two-level Morphological Analysis of Korean (Two-level 한국어 형태소 해석에서의 복합명사 처리)

  • 이근용;박기선;이용석
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2002.04b
    • /
    • pp.505-507
    • /
    • 2002
  • Two-level 형태소 해석 모델은 단어들이 결합할 때 발생하는 철자변화를 처리하는 언어 독립적인 형태소 해석 모델이다. 그러나 한국어의 경우 활용과 첨용이 자유로운 교착어에 속하며 음절단위 표현법 때문에 two-level 모델을 이용한 형태소 해석 방법보다는 언어 종속적인 형태소 해석 방법을 사용하여 왔다. 한국어 용언과 다양한 변형을 처리하기 위한 two-level 규칙이 표현되었지만, 형태소 해석에서 사용하기 위해서 필요한 복합명사 치리와 미지어 처리에 대한 적절한 방법이 아직 계시되지 않았다. 본 논문은 어절 생성 규칙을 이용한 사전 구성을 이용하여 two-level 모델에서의 한국어 복합명사의 처리에 대해서 다루고, two-level 모델에서 한국어 복합명사 처리가 가능함을 보이고자 한다.

  • PDF