• 제목/요약/키워드: 원시 언어

검색결과 99건 처리시간 0.026초

4세대 언어에서의 역공학 환경 구성 (A Study on Construction of Reverse Engineering Environment in Forth Generation Language)

  • 진영배;왕창종
    • 한국정보처리학회논문지
    • /
    • 제2권4호
    • /
    • pp.509-523
    • /
    • 1995
  • 소프트웨어의 종류가 다양하고, 크기가 커짐에 따라서 유지 보수 문제는 더욱 복 잡하고 어렵게 되었다. 따라서 소프트웨어의 유지 보수가 소프트웨어 생명 주기에서 가장 비용을 많이 차지하는 부분이 되었다. 또한 범용 소프트웨어를 개발하거나, 사용 하기 위해 단말기 사용자에게도 쉽게 느껴지는 4세대 언어가 앞으로 많이 적용되는 개 발 환경으로 될 것이다. 이에 따라서 프로그램의 유지 보수 측면에서 많은 연구가 이 루어진 COBOL, C, FORTRAN, RASCAL등과 같은 언어처럼 4세대 언어로 작성된 원시크드 에 대해서도 프로그램의 이해를 위한 분석 및 재사용 방법의 연구가 이루어져야 한다. 본 연구에서는 4세대 언어로 작성된 원시 코드로부터 메타 언어 형태로 변환하고 프로 그램 이해를 위한 문서 생성기(Document Generator), 보고서 생성기(Report Generator) , 모듈 분석기(Mldule Analyzer), 코드번역기(Code Translator)를 설계하고 구현함으 로서 4세대는 언어에서의 역공학 도구를 제안하여, 프로그램의 이해 및 관리를 효율적 으로 하는데 목적이 있다.

  • PDF

시조문화 정보시스템 개발의 가능성과 전망 (The possibility and prospect for developing Sijo Munhwa information system)

  • 한창훈
    • 한국시조학회지:시조학논총
    • /
    • 제19권1호
    • /
    • pp.37-62
    • /
    • 2003
  • 이 논문은 시조문화 정보 시스템 개발의 가능성과 전망을 논한 것이다. 본문의 내용을 요약하여 제시하면 다음과 같다. 1. 언어 자료로서의 시조 문화 정보 시스템은 원전 자료를 포함한 자료의 입력ㆍ교정 작업이 우선 필요하다. 2. 구축된 원시 자료를 가공할 때에는 TEI (Text Encoding Initiative), 시소러스(Thesauras) 등의 작업이 고려되어야 한다. 3. 이는 Topic Map을 구축하는 기본 작업이 된다. 4. 예술 자료로서의 시조 문화 정보 시스템은 다른 자료들 - 이미지, 동영상 등 -과의 연결(link)이 매우 중요하다.

  • PDF

XML에 기반을 둔 C 원시 코드의 주석 관리 시스템 (An XML-based Comment Management System for C Source Code)

  • 박근옥;임종태
    • 정보처리학회논문지D
    • /
    • 제11D권4호
    • /
    • pp.799-808
    • /
    • 2004
  • C 언어가 주로 사용되는 미션 크리티컬 응용 소프트웨어 영역에는 문서화, 간결성, 정확성을 갖는 원시 코드가 요구된다. 본 연구는 XML 기반의 C 원시 코드의 주석관리 체계를 제안한다. 이 주석 관리체계는 주석 사용자 모듈, 검토자 모듈, 주석 추출 모듈, 주석 추적 연계 모듈, 주석 태그 정의 모듈, 저장관리 모들을 포함하는 6개 모듈로 구성된다. 본 연구에서 정의된 XML 주석 태그는 IEEE 표준 1028과 IEEE 표준 1012를 적용하는 개발공정 활동의 범주를 포함한다. C 원시 코드에 주석을 삽입하고 추출하기 위하여 XML 스키마가 사용되며. 주석 추출 결과의 시각적 표시 처리를 위하여 XSL-FO가 사용된다.

나이브 베이즈 분류기와 혼동 행렬을 이용한 OCR에서의 철자 교정 (Using Naïve Bayes Classifier and Confusion Matrix Spelling Correction in OCR)

  • 노경목;김창현;천민아;김재훈
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2016년도 제28회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.310-312
    • /
    • 2016
  • OCR(Optical Character Recognition)의 오류를 줄이기 위해 본 논문에서는 교정 어휘 쌍의 혼동 행렬(confusion matrix)과 나이브 베이즈 분류기($na{\ddot{i}}ve$ Bayes classifier)를 이용한 철자 교정 시스템을 제안한다. 본 시스템에서는 철자 오류 중 한글에 대한 철자 오류만을 교정하였다. 실험에 사용된 말뭉치는 한국어 원시 말뭉치와 OCR 출력 말뭉치, OCR 정답 말뭉치이다. 한국어 원시 말뭉치로부터 자소 단위의 언어 모델(language model)과 교정 후보 검색을 위한 접두사 말뭉치를 구축했고, OCR 출력 말뭉치와 OCR 정답 말뭉치로부터 교정 어휘 쌍을 추출하고, 자소 단위로 분해하여 혼동 행렬을 만들고, 이를 이용하여 오류 모델(error model)을 구축했다. 접두사 말뭉치를 이용해서 교정 후보를 찾고 나이브 베이즈 분류기를 통해 확률이 높은 교정 후보 n개를 제시하였다. 후보 n개 내에 정답 어절이 있다면 교정을 성공하였다고 판단했고, 그 결과 약 97.73%의 인식률을 가지는 OCR에서, 3개의 교정 후보를 제시하였을 때, 약 0.28% 향상된 98.01%의 인식률을 보였다. 이는 한글에 대한 오류를 교정했을 때이며, 향후 특수 문자와 숫자 등을 복합적으로 처리하여 교정을 시도한다면 더 나은 결과를 보여줄 것이라 기대한다.

  • PDF

지연함수언어 Miranda의 G-기계 기반 번역기 개발 (Development of a G-machine Based Translator for a Lazy Functional Programming Language Miranda)

  • 이종희;최관덕;윤영우;강병욱
    • 한국정보처리학회논문지
    • /
    • 제2권5호
    • /
    • pp.733-745
    • /
    • 1995
  • 본 연구는 함수언어의 번역기 개발을 목적으로 한다. 이를 위하여 지연어의를 갖 는 원시함수 언어를 정의하고 그것의 번역기를 설계, 구현, 평가한다. 함수프로그램의 실행모형은 G-기계를 기반으로 한 컴비네이터 그래프축소이다. 번역기는 전체 4단계로 구성되며 원시프로그램을 C를 사용한 목적프로그램으로 번역한다. 번역기의 첫 번째 단계에서는 원시프로그램을 확장람다계산 그래프로 번역하고, 두 번째 단계에서 수 퍼컴비네이터그래프로 변환하고, 세 번째 단계에서 G-기계어 프로그램으로 번역하고, 마지막 단계에서 G-기계어 프로그램을 C로 번역한다. 생성된 목적 프로그램은 C 컴파 일러에 의해서 실행 프로그램은 번역한다. 번역기 구현은 UNIX환경에서 컴파일러 자동 화 도구인 YACC, Lex를 이용하여 구문분석기, 어휘분석기를 구현하고, 그 외의 루틴은 C로 구현한다. 본 논문에서는 번역기에 사용된 구현기법과 수행결과를 기술한다.

  • PDF

EVM SIL에서 C 프로그램 생성을 위한 역컴파일러의 설계 및 구현 (Design and Implementation of Decompiler for Generating C Program from EVM SIL)

  • 김영근;권혁주;이양선
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2005년도 춘계학술발표대회
    • /
    • pp.549-552
    • /
    • 2005
  • 기존의 ANSI C 프로그램은 각각의 플랫폼에 따른 컴파일러를 통해서 목적기계의 코드로 변환되고, 실행되어 플랫폼에 의존적인 단점이 있다. 이러한 단점을 보완하는 방법으로는 스택기반의 가상기계와 가상기계의 입력형태인 중간코드를 이용하는 기법이 있다. EVM(Embedded Virtual Machine)은 ANSI C 언어와 SUN사의 Java 언어 등을 모두 수용할 수 있는 임베디드 시스템을 위한 가상기계이며, SIL(Standard Intermediate Language)은 EVM에서 실행되는 중간언어로 다양한 프로그래밍 언어를 수용하기 위해서 객체지향 언어와 순차적인 언어를 모두 수용하기 위한 연산 코드 집합을 갖고 있다. 본 논문에서는 SIL 코드가 올바른 수행을 하는 것인지를 검증하고 원시코드의 분석을 용이하게 하기 위해서 생성된 SIL 코드를 어셈블리 형태와 유사한 재 표현된 ANSI C 언어로 바꾸는 역컴파일러 시스템을 설계하고 구현하였다.

  • PDF

정적 분석을 이용하여 시간 제약 조건을 해결한 실시간 언어의 설계 및 구현 (Design and Implementation of Real-Time Language Satisfying Timing Constraints using the Results of Static Analysis)

  • 이준동;백정현;원유헌
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제6권6호
    • /
    • pp.620-627
    • /
    • 2000
  • 실시간 프로그램은 다양한 응용분야에 중요하게 이용되고 있는데, 기존의 일반 언어는 시간적인 개념을 고려하여 설계하지 않았으므로 실시간 응용에 부적합하며, 이를 해결하기 위한 실시간 언어는 시간 개념을 표현하기 위하여 많은 문법이 추가되어 기존 프로그래머에 익숙치 못한 결점이 있다. 본 연구에서는 기존의 C언어에 익숙한 프로그래머들이 저항감 없이 실시간 프로그래밍을 할 수 있는 언어를 설계하고 구현한다. 이 구현에서는 시간 트리를 이용함으로써 원시 언어와 목적 언어의 연결이 가능하며, 정적 분석을 이용한 결과를 코드 생성에 이용함으로써 외부적인 타이머 없이 시간적인 사건의 처리가 가능하다.

  • PDF

C++ 컴파일러에서 중간코드의 검증과 분석을 위한 역컴파일러의 설계 및 구현 (Design and Implementation of a Decompiler for Verification and Analysis of Intermediate Code in C++ Compiler)

  • 배성균;김영근;이양선
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2006년도 춘계학술발표대회
    • /
    • pp.1405-1408
    • /
    • 2006
  • C++ 언어는 객체지향 프로그래밍 언어로, 기존의 C++ 프로그램은 각각의 플랫폼에 따른 컴파일러를 통해 목적기계의 코드(object code)로 변환되므로 실행되는 플랫폼에 의존적인 단점이 있다. 이러한 단점을 보완하는 방법으로 스택기반의 가상기계와 가상기계의 입력형태인 중간코드를 이용하는 기법이 있다. EVM(Embedded Virtual Machine)은 ANSI C, ISO/IEC C++ 언어와 SUN사의 Java 언어 등을 모두 수용할 수 있는 임베디드 시스템 기반의 가상기계이며, EVM에서 실행되는 중간코드인 SIL(Standard Intermediate Language)은 객체지향 언어와 순차적인 언어를 모두 수용하기 위한 명령 코드의 집합으로 설계되어 있다. 본 논문에서는 C++ 컴파일러를 통해 생성된 SIL 코드가 올바른지 검증하고 원시코드의 분석을 용이하게 하기 위해서 SIL 코드를 어셈블리 코드와 유사한 형태의 재 표현된 C++ 프로그램으로 역컴파일하는 시스템을 설계하고 구현하였다.

  • PDF

단어간 의존관계에 기반한 언어모델링 (Language Modeling based on Inter-Word Dependency Relation)

  • 이승미;최기선
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1998년도 제10회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.239-246
    • /
    • 1998
  • 확률적 언어모델링은 일련의 단어열에 문장확률값을 적용하는 기법으로서 음성인식, 확률적 기계번역 등의 많은 자연언어처리 응용시스템의 중요한 한 요소이다. 기존의 접근방식으로는 크게 n-gram 기반, 문법 기반의 두가지가 있다. 일반적으로 n-gram 방식은 원거리 의존관계를 잘 표현 할 수 없으며 문법 기반 방식은 광범위한 커버리지의 문법을 습득하는데에 어려움을 가지고 있다. 본 논문에서는 일종의 단순한 의존문법을 기반으로 하는 언어모델링 기법을 제시한다. 의존문법은 단어와 단어 사이의 지배-피지배 관계로 구성되며 본 논문에서 소개되는 의존문법 재추정 알고리즘을 이용하여 원시 코퍼스로부터 자동적으로 학습된다. 실험 결과, 제시된 의존관계기반 모델이 tri-gram, bi-gram 모델보다 실험코퍼스에 대해서 약 11%에서 11.5%의 엔트로피 감소를 보임으로써 성능의 개선이 있었다.

  • PDF

다중스레드 모델의 스레드 코드를 자바 바이트 코드로 변환하기 위한 번역기 설계 (Design of Translator for generating Java Bytecode from Thread code of Multithreaded Models)

  • 김기태;이갑래;양창모;유원희
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 봄 학술발표논문집 Vol.27 No.1 (A)
    • /
    • pp.68-70
    • /
    • 2000
  • 다중스레드 모델은 데이터플로우 모델의 내부적인 병렬성, 비동기적 자료 가용성과 폰 노이만 모델의 실행 지역성을 결합하여 병렬처리 시스템의 성능을 향상 시켰다. 이 모델은 프로그램의 실행을 위하여 컴파일러에 의해 생성된 스레드를 수행하며, 스레드의 생성 방법에 따라 자원 활용 빈도나 동기화 빈도와 같은 스레드의 질이 결정 되는 특징이 있다. 하지만 다중스레드 모델은 실행 모델이 특정 플랫폼에 제한되는 단점을 가지고 있다. 이에 반해 자바는 플랫폼에 독립적인 특징을 가지고 있어 다중스레드 모델의 스레드 코드를 실행 단위인 자바 언어로 변환하면 다중스레드 모델의 특징을 여러 플랫폼에서 수정 없이 사용할 수 있게 된다. 자바는 원시 언어를 중간 언어 형태의 바이트 코드로 변환하여 각 아키텍처에 맞게 설계된 자바 가상 머신이 설치된 시스템에서 자바 언어를 수행한다. 이러한 자바 언어의 바이트 코드는 번역기의 중간 언어와 같은 역할을 수행하고, 자바 가상 머신은 번역기의 후위부와 같은 역할을 한다. 본 논문은 다중스레드 코드가 플랫폼에 독립적인 특성을 갖출 수 있도록 다중스레드 코드를 자바 가상 머신에서 실행 가능하도록 한다. 즉, 다중스레드 모델의 스레드 코드를 자바 바이트 코드로 변환하는 번역기를 설계, 구현하고, 자바 가상 머신의 실행을 분석한다.

  • PDF