• 제목/요약/키워드: 형식 언어

검색결과 498건 처리시간 0.027초

형식형태소가 한국어 단어 벡터 생성에 미치는 영향 (Grammatical morphemes' effect on Korean word vector generation)

  • 윤준영;김도원;민태홍;이재성
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2017년도 제29회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.179-183
    • /
    • 2017
  • 단어 벡터는 단어 사이의 관계를 벡터 연산으로 가능하게 할 뿐 아니라, 상위의 신경망 프로그램의 사전학습 데이터로 많이 활용되고 있다. 한국어 어절은 생산적인 조사나 어미 때문에 효율적인 단어 벡터 생성이 어려워 대개 실질형태소만을 사용하여 한국어 단어 벡터를 생성한다. 본 논문에서는 실질형태소와 형식형태소를 모두 사용하되, 형식형태소를 적절하게 분류하여 단어 벡터의 성능을 높이는 방법을 제안한다. 자체 구축한 단어 관계 테스트 집합으로 추출 성능을 평가해 본 결과, 제안한 방법으로 형식형태소를 사용할 경우, 성능이 향상되었다.

  • PDF

MPEG-4 컨텐츠 저작의 형식 정의와 시스템 개발 (A Formalization and System Development for MPEG-4 Contents Authoring)

  • 김상욱;김희선;차경애
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2000년도 추계학술발표논문집 (상)
    • /
    • pp.755-758
    • /
    • 2000
  • 시각 언어는 인간-컴퓨터 사이의 인터랙션 수단이다. 올바른 인터랙션을 위하여 저작된 컨텐츠와 재생되는 씬의 시맨틱이 인간과 컴퓨터는 물론 인간과 인간 사이에서 일관성과 신뢰성을 가져야 한다. 본 논문에서는 인터랙션의 일관성과 신뢰성을 위한 시각 언어의 시각문장 집합을 정의하고 형식화한다. 이러한 형식화는 시각 언어의 시각적 저작 내용의 모호성을 제거하여 공동 참여자의 신뢰성을 높인다. 또한 형식 정의에 대하여 저작 컨텐츠와 재생 씬의 동일성을 그래프로 증명한다. 이러한 형식 정의를 MPEG-4 컨텐츠 저작 도구에 적응한다. 즉. 각 객체 사이의 시간관계 정의에 따라 저작하며, 사용자 인터랙션에 따른 씬의 속성의 변화를 효율적으로 지원한다. 저작된 컨텐츠는 씬의 속성 정보에 따라 객체 사이의 동기화를 유지하면서 재생한다.

  • PDF

인공위성 탑재컴퓨터 가상머신을 위한 토큰 컴파일러 (Token Compiler for Virtual machine on Spacecraft Computer)

  • 윤영일;정현아;조현우;김형신
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2012년도 한국컴퓨터종합학술대회논문집 Vol.39 No.1(A)
    • /
    • pp.276-278
    • /
    • 2012
  • 본 논문에서는 인공위성 탑재 컴퓨터의 가상머신에서 사용되는 C 언어와 유사한 언어를 번역하는 SpaceApp 토큰 컴파일러를 개발하였다. SpaceApp은 위성 제어를 위한 지상으로부터 업로드 가능한 프로그램으로, 이를 실행하기 위한 환경으로 자바가상머신과 유사한 SpaceApp 가상머신이 개발되었다. 이러한 가상머신에 필요한 컴파일러는 SpaceApp 언어를 번역할 수 있어야 하고, 실행 가능한 파일 형식으로 변환되어야 한다. 따라서 논문에서 개발한 컴파일러는 C 언어와 유사하게 SpaceApp 언어를 번역 가능하다. 그리고 인공위성 임무에 맞게 라이브러리를 지원하며, 가상머신에서 실행 가능한 파일 형식을 출력할 수 있도록 구현했다. 또한 통합 개발 환경으로 이클립스를 이용하여 편의성을 제공하도록 구현하였다.

의식론: 의식의 언어와 사고 전개 기능 (A Theory of Consciousness: Deployment of Language and Thought)

  • 김병원
    • 한국인지과학회:학술대회논문집
    • /
    • 한국인지과학회 2002년도 춘계학술대회
    • /
    • pp.145-150
    • /
    • 2002
  • 의도와 관심의 실현을 위하여, 언어 행동을 주도하는 '의식'이 사고와 언어를 연결할 때에 드러내는 특성과 기능 일부를 밝히기 위해, <실용 논리> 수업 시간에 녹화한 한 대학생의 토론 첫 부분 내용을 Chafe의 '억양 단위' 분석법에 따라 분석한 결과, 억양의 단위는 평균 1.8초, 9.5음절로 구성되며, 언어와 사고는, 물처럼 흐르는 것이 아니라, 억양 단위로 끈어진 토막들이 의식에 의해 연결되면서 '관심점'의 내용이 전개되고 있는 것임을 발견하였다. 각 억양 단위 속에는 뚜렷하게 발음하는 하나 정도의 '초점'과, 그렇지 않은'주변' 내용과 형식으로 구성됨을 확인하고, 초점들을 서로 이으면 결국, 이어진 말 중심 내용이 드러남도 발견하였다. 한국어와 일본어 억양 단위는 주어+동사 형식을 갖추지 않은 예가 60%와 67.4%이므로, 주어+동사 모형은 언어와 사고 전개 모형의 한 예에 불과하다고 해석한다. 각 단위들의 연결 면에는 문제가 있음도 발견하였다.

  • PDF

모바일을 위한 UML 2.0 기반의 아키텍쳐 모델링 언어 프레임웍 (UML 2.0 based ADL Framework for Mobile Application)

  • 박용우;김현성;전태웅
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2005년도 가을 학술발표논문집 Vol.32 No.2 (2)
    • /
    • pp.448-450
    • /
    • 2005
  • Acme와 같은 ADL(Architecture Description Language) 들은 컴포넌트 기반 시스템의 아키텍쳐를 정형적으로 명세할 수 있는 장점을 가지고 있다. 하지만 날로 다각화되는 개발 과정 상의 이해관계들을 다 포용하지 못하고, 아키텍쳐에 특화된 별도의 표기 형식을 익혀야 하는 부담이 있어 아키텍쳐를 명세하는 언어로서 정착되지 못하고 있다. 반면 UML(Unified Modeling Language)은 범용 모델링 언어이여 소프트웨어 개발의 전 과정에 일관된 표기형식과 폭넓은 지원도구들을 제공하고 있어 소프트웨어 개발을 위한 사실상의 표준 언어로 자리잡고 있다. 이에 따라 지금까지 UML을 이용하여 아키텍쳐를 모델링하기 위한 연구들이 많이 진행되어 왔다. 특히 UML에서 표현수단이 미흡한 아키텍쳐의 핵심 개념들을 명시적으로 표현할 수 있도록 UML의 확장 메커니즘을 사용하여 UML을 특화하는 연구 결과들이 많이 소개되고 있으나 특화된 영역의 아키텍쳐를 기술하기에는 부족하다. 본 논문에서는 최근에 활발히 개발되고 있는 모바일 애플리케이션의 특징중의 하나인 device의 제약사항을 QoS로 정의하고 UML 확장메커니즘을 이용하여 모바일을 위한 아키텍쳐 모델링 언어 프레임웍을 제시하고 있다.

  • PDF

형식문서에서 지정된 셀내의 문자추출 및 복원 (Character Extraction and Restoration in the Specified Cell of Form Document)

  • 심상옥;유진용;김민기;권영빈
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1997년도 제9회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.183-187
    • /
    • 1997
  • 세금계산서나 영수증등의 형식문서를 처리하기 위해서는 일반문서와는 달리 형식문서에서 인식의 대상이 되는 특정 셀에 대한 추출이 필요하다. 본 논문에서는 정형화된 형식문서에서 원하는 특정 셀의 내용만을 추출하는 방법을 제시하고자 한다. 제안된 방법은 지정된 셀을 이루고 있는 라인을 제거하는 것과, 라인제거시 손상된 문자를 복원하는 과정으로 나뉜다. 우선 라인들의 평균적인 두께를 구한 후 라인을 트레이스(trace)하면서 이 두께 범위내에 있는 라인은 지운다. 트레이스하는 과정에서 두께보다 큰 라인은 문자와 접촉된 것으로 판단하여 이 접촉된 좌표를 저장한 후 미리 정의된 접촉유형을 이용하여 문자의 복원 작업을 수행한다.

  • PDF

유비쿼터스 게임 플랫폼을 위한 SAF 어셈블러의 설계 및 구현 (Design and Implementation of a SAF Assembler for the Ubiquitous Game Platform)

  • 최홍석;이양선
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2007년도 춘계학술발표대회
    • /
    • pp.1516-1519
    • /
    • 2007
  • 본 연구팀은 유비쿼터스 환경에서 다양한 분야의 콘텐츠를 보다 쉽게 개발하고 실행할 수 있는 통합소프트웨어 개발 솔루션인 유비쿼터스 게임 플랫폼(Ubiquitous Game Platform)을 개발하였다. 유비쿼터스 게임 플랫폼은 유비쿼터스 환경의 기기에 탑재되어 콘텐츠들을 C/C++/Java 언어 모두를 수용하며 가상기계 방식이어서 유비쿼터스 환경의 기기에 독립적으로 실행이 가능하다는 장점을 가지고 있다. 본 논문에서는 유비쿼터스 게임 플랫폼의 가상기계인 유비쿼터스 가상기계(u-VM)의 입력인 SEF(Standard Executable Format) 실행파일을 생성하기 위한 SAF 어셈블러를 설계 및 구현 하였다. SAF 어셈블러는 중간언어 형식인 SAF(Standard Assembly Format)를 입력으로 받아 u-VM이 실행 가능한 파일 형식인 SEF를 생성한다. SEF 파일을 생성하면서 SAF 어셈블러는 여러개의 SAF파일을 한 개의 SEF로 묶어주는 링커의 역할을 하여 주며, 실행 파일을 텍스트 형식의 SAF에서 바이너리 형식의 SEF로 바꿈으로써 보안상의 문제를 해결해 준다. 또한 SEF는 SAF에 비해 가볍게 변환이 되어 가상기계에서의 실행속도를 개선하는 역할을 하여 준다.

  • PDF

데이터베이스 의미론의 기초: 자질 구조에서 테이블로 (A Basis of Database Semantics: from Feature Structures to Tables)

  • 이기용
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1999년도 제11회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.297-303
    • /
    • 1999
  • 오늘날 전산망을 통해 대량의 다양한 언어 정보가 일상 언어로 교환되고 있다. 따라서 대량의 이러한 정보를 효율적으로 처리할 수 있는 언어 정보 처리 시스템이 필요하다. Hausser (1999)와 이기용(1999)는 그러한 언어 정보 처리 시스템으로 데이터베이스 의미론을 주장하였다. 이 의미론의 특징은 자연언어의 정보 처리 시스템 구축에 상업용 데이터베이스 관리 시스템을 활용한다는 점이다. 이때 야기되는 문제 중의 하나가 표상(representation)의 문제이다. 그 이유는 언어학의 표상 방법이 데이터베이스 관리 시스템의 표상 방법과 다르기 때문이다. 특히, 관계형 데이터베이스 관리 시스템(RDBMS)에서는 테이블 (table) 형식으로 각종 정보를 표시한다. 따라서, 이 논문의 주안점(主眼点)은 언어학에서 흔히 쓰이는 표상 방법, 즉 문장의 통사 구조를 표시하는 수형(tree)이나 의미 구조를 표시하는 논리 형태(logical form), 또는 단어나 구의 특성을 나타내는 자질 구조(feature structure)를 테이블 형식으로 대체하는 방법을 모색하는 것이다. 더욱이 관계형 데이터베이스 관리 시스템에서는 테이블에 대한 각종 연산, 특히 두 테이블을 연결(link)하는 작업이 가능하고 이런 연산 과정을 통해 정보를 통합하거나 여과할 수 있기 때문에 관련 정보를 하나의 테이블에 표상하거나 정보 자료의 분산 저장과 자료의 순수성을 유지하는 것이 용이하다. 이 논문은 곧 이러한 점을 가급적 간단한 예를 들어 설명하는 데 그 목적이 있다.

  • PDF

자율 학습에 의한 실질 형태소와 형식 형태소의 분리 (A Korean Language Stemmer based on Unsupervised Learning)

  • 차영태;조세형
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2002년도 추계학술발표논문집 (상)
    • /
    • pp.577-580
    • /
    • 2002
  • 자연어의 처리를 위해 반드시 필요한 형태소 분석에는 여러 가지 방법이 있으나 기본적으로 사전을 갖춘 상태에서 가장 가능성 있는 후보를 선택하는 방식을 선택한다. 이러한 방식으로는 사전이 없는 미지의 언어를 분석하기는 불가능하다. 기지의 언어라도 지속적으로 어휘가 변하는 경우나 매우 특별한 분야의 경우에는 필요로 하는 사전이 존재하지 않는다. 본 논문에서는 태그가 없는 단순 말뭉치만을 가지고 자율학습을 이용하여 한국어의 실질 형태소와 형식 형태소를 분리해내는 기법에 대하여 기술한다.

  • PDF

규칙 기반 영한 기계번역에서의 구문 규칙 컴파일러 (Syntactic Rule Compiler in Rule-based English-Korean Machine Translation)

  • 김성동
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2013년도 추계학술발표대회
    • /
    • pp.1315-1317
    • /
    • 2013
  • 규칙 기반의 영한 기계번역 시스템의 구문 분석 시스템은 영어의 구문 구조를 기술하는 규칙 부분과 규칙을 적용하여 차트 파싱을 수행하는 실행 부분으로 구성된다. 구문 규칙은 문맥 자유 문법의 형식으로 기술되는데, 기술된 구문 규칙을 적용하여 파싱을 실행하는 실행 부분은 C 언어 함수로 표현되므로, 구문 규칙을 C 언어 함수로 변환해야 한다. 본 논문에서는 문맥 자유 문법 형식으로 기술된 구문 규칙을 C 언어 함수로 변환하는 도구인 구문 규칙 컴파일러를 개발하였다. 구문 규칙 컴파일러는 자동적으로 구문 규칙을 C 언어 함수로 변환함으로써 영한 기계번역 시스템의 성능 개선 과정에서 빈번하게 발생하는 구문 규칙의 생성과 수정을 용이하게 하여 번역 성능을 개선하는 작업을 지원한다.