• 제목/요약/키워드: 점진적 파싱

검색결과 11건 처리시간 0.02초

LR 파서를 위한 효율적인 점진적 파싱 (An Efficient Incremental Parsing for LR Parsers)

  • 안희학
    • 한국정보처리학회논문지
    • /
    • 제5권6호
    • /
    • pp.1660-1669
    • /
    • 1998
  • 본 논문에서는 실제 사용에 있어서 시간과 기억 장소를 상당히 요구하는 기존의 점진적 파싱 알고리즘들을 조사하여, 이들보다 효율적인 점진적 LR 파싱 알고리즘을 제안한다. 문법 기호를 포함하는 확장형 LR 파싱표를 본 논문에서 제안한 점진적 LR 파싱 알고리즘을 적용한다. 여러 문장의 경우에 본 점진적 LR 파싱 알고리즘을 이용하여 파싱 단계와 기억 장소를 감소시켰다. 본 알고리즘은 복잡하고 큰 문법의 경우에 더욱 효과적이다.

  • PDF

점진적 스레드 트리를 구성하기 위한 파싱 알고리즘 (A Parsing Algorithm for Constructing Incremental Threaded Tree)

  • 이대식
    • 인터넷정보학회논문지
    • /
    • 제7권4호
    • /
    • pp.91-99
    • /
    • 2006
  • 점진적 파싱 기법은 프로그램의 점진적 구성을 허용하는 언어기반 환경의 중요한 부분이며, 프로그램의 변경된 부분에 대해서만 구문분석을 다시 함으로써 시스템의 성능을 향상 시킨다. 기존의 점진적 파싱은 파싱 정보를 저장하기 위해 스택 자료구조를 사용한다. 본 논문에서는 스택 자료구조를 사용하지 않고 노드 주소로 스레드를 추가하여 스레드 트리 구성 알고리즘을 제안한다. 또한 구성된 스레드 트리를 사용하여 5단계의 점진적 파싱 과정으로 나누어 점진적 스레드 트리 구성 알고리즘을 제안한다.

  • PDF

효율적인 노드 재사용을 위한 점진적 파싱 알고리즘 (An Efficient Node Reuse inIncremental Parsing Algorithms)

  • 박정윤;김영철;김상헌;유재우
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1998년도 가을 학술발표논문집 Vol.25 No.2 (1)
    • /
    • pp.401-403
    • /
    • 1998
  • 점진적 파싱 알고리즘은 사용자 중심의 시스템 구현을 위한 핵심적인 기술의 하나이다. 오늘날 속성문법에서 사용되는 트리에는 노드에 파스서 상태와 심볼외에 평가된 속성 정보가 포함되므로 이 정보를 재사용하는 것이 바람직하다. 따라서 효율적인 점진적 파서는 파스트리상에서 생성된 노드를 효율적으로 재사용 할 수 있어야 한다. 본 연구에서는 이전의 파싱과정에서 생성된 노드를 효율적으로 재사용할 수 있는 쓰레드 트리를 기반으로 한 점진적 파싱 알고리즘을 제안하였다. 이전에 생성된 파스결과를 쓰레드 트리로 보관하고 이를 이용하여 효율적으로 노드를 재사용할 수 있도록 하였다. 제안된 알고리즘은 LR 기반의 파싱 방법에서 확장형 파싱표와 쓰레드 트리를 이용해 생성된 트리의 노드를 효율적으로 유지할 수 있다. 본 연구에서 제시된 알고리즘은 구문분석이 필요한 대화식 환경에서 효율적으로 사용될 수 있다.

변화된 스레드 트리를 이용한 점진적 LR 파싱 알고리즘 구현 및 설계 (On Design and Implementation of Incremental LR Parsing Algorithm Using Changed Threed Tree)

  • 이대식
    • 융합보안논문지
    • /
    • 제5권4호
    • /
    • pp.19-25
    • /
    • 2005
  • 스레드 트리란 LR 파싱표를 사용하여 파스 트리인 동시에 파스 스택을 표현 할 수 있는 자료구조이다. $Larchev\^{e}que$는 스택을 사용하여 스레드 트리들 구성하고 점진적 파싱을 한다. 본 논문에서는 재 파싱 노드와 파싱속도를 줄이기 위해 스택을 사용하지 않는 변화된 스레드 트리를 구성하는 알고리즘을 제안한다. 또한 노드의 재 파싱 과정을 없애기 위해 변화된 스레드 트리와 LR 파싱표를 사용하는 점진적 파싱 알고리즘을 제안한다.

  • PDF

점진적 LR 파싱 : 리덕션 골의 예상을 이용한 방법 (Incremental LR Parsing: Methods Using Reduction Goal Prediction)

  • 이경옥
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제31권5호
    • /
    • pp.651-657
    • /
    • 2004
  • 본 논문에서는 LR 파싱 시에 미리 예상 가능한 리덕션 골의 정보를 이용한 점진적 LR 파서를 제안한다. 이 방법은 기존의 연구들에 비해 상대적으로 적은 메모리 공간과 컴퓨팅 시간을 필요로 한다.

개선된 점진적 LL(1) 파싱 방법 (An Improved Incremental LL(1) Parsing Method)

  • 이경옥
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제37권6호
    • /
    • pp.486-490
    • /
    • 2010
  • 점진적 파싱은 기존의 입력 문자열에 대한 파싱 정보를 새로운 문자열의 파싱시에 이용하고자 하는 취지로 연구 개발되었다. 본 논문은 기존에 제안된 비단말 심볼을 미리보기(lookahead) 심볼로 포함시킨 점진적 LL(1) 파서를 개선시킨 방법을 제안한다. 기존 연구에서는 오류가 발생한 상황에서 불필요한 작업을 반복적으로 수행하기에 시간적으로 비효율적이다. 본 논문에서는 이에 대한 해결 방안을 제공한다.

스택을 이용하지 않는 스레드 트리 구성 알고리즘 (A Threaded Tree Construction Algorithm not Using Stack)

  • 이대식
    • 인터넷정보학회논문지
    • /
    • 제5권5호
    • /
    • pp.119-127
    • /
    • 2004
  • 언어 기반 프로그래밍 환경의 발전에 따라 점진적 파싱에 대한 연구는 핵심적인 분야가 되었다. 본 논문의 목적은 파싱 속도(lime)와 기억장소가 많이 요구하는 기존의 알고리즘들보다 효율적인 점진적 파싱 알고리즘을 제시하는데 있다. 본 논문에서는 스택을 이용하지 않는 스레드 트리 구성 알고리즘을 제안하였다. 또한 노드의 재파싱 과정을 없애기 위해 스택을 이용하지 않는 노드 생성 알고리즘과 점진적 스레드 트리 구성 알고리즘을 제안하였다.

  • PDF

그래프⇋시퀀스의 반복적 추론을 이용한 한국어 AMR 파싱 (Korean AMR Parsing using Graph⇋Sequence Iterative Inference)

  • 민진우;나승훈;최현수;김한샘
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2020년도 제32회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.211-214
    • /
    • 2020
  • Abstract Meaning Representation(AMR)은 문장의 의미를 그래프 구조로 인코딩하여 표현하는 의미 형식표현으로 문장의 각 노드는 사건이나 개체를 취급하는 개념으로 취급하며 간선들은 이러한 개념들의 관계를 표현한다. AMR 파싱은 주어진 문장으로부터 AMR 그래프를 생성하는 자연어 처리 태스크이다. AMR 그래프의 각 개념은 추상 표현으로 문장 내의 토큰과 명시적으로 정렬되지 않는 어려움이 존재한다. 이러한 문제를 해결하기 위해 별도의 사전 학습된 정렬기를 이용하여 해결하거나 별도의 정렬기 없이 Sequence-to-Sequence 계열의 모델로 입력 문장으로부터 그래프의 노드를 생성하는 방식으로 연구되어 왔다. 본 논문에서는 문장의 입력 시퀀스와 부분 생성 그래프 사이에서 반복 추론을 통해 새로운 노드와 기존 노드와의 관계를 구성하여 점진적으로 그래프를 구성하는 모델을 한국어 AMR 데이터 셋에 적용하여 Smatch 점수 39.8%의 실험 결과를 얻었다.

  • PDF

모바일 환경에서의 이진 부호화된 XML 문서를 위한 복호기 설계 및 구현 (Design and Implementation of Decoder for Binary Encoded XML Document on Mobile Environment)

  • 유정수;낭종호
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2008년도 한국컴퓨터종합학술대회논문집 Vol.35 No.1 (B)
    • /
    • pp.411-415
    • /
    • 2008
  • 최근 멀티미디어 응용에서 XML은 메타데이터를 표현하기 위하여 그 사용량이 증가하고 있는 추세이며, 그 예로는 MPEG-7 MDS, MPEG-21등이 있다. 이러한 XML형식의 메타데이터의 크기를 줄이기 위하여 MPEG-7에서 정의한 포맷이 Binary Format for Metadata(BiM)이다. BiM은 스트리밍을 고려하여 단편화를 통한 점진적인 전송이 가능하며, 압축률이 높고 복호화에 따르는 오버헤드가 작다는 장점을 제공한다. 본 논문에서는 BiM에 대한 간단한 소개와 모바일 환경에 적합하도록 구현한 BiM 복호기의 설계 및 구현에 대하여 소개한다.구현한 복호기는 모바일 환경의 다양한 플랫폼에서의XML 파싱 모듈과 DOM 트리모듈에 대한 종속성을 제거하기 위하여, 스키마 파일의 파싱을 데스크탑에서 수행하고 이에 대한 파싱 결과를 자체 정의한 Syntax File 형식으로 복호기에 전송할 수 있도록 하였다. 또, BiM형태로 전송되는 ESG 메타데이터와 MPEG-4 LASeR 스트림에 대하여 Windows, Windows CE, embeded Linux 환경에서 정상적으로 복호화 하는 것을 확인하였다.

  • PDF

정보 검색을 위한 숫자의 해석에 관한 구문적.의미적 판별 기법 (Syntactic and Semantic Disambiguation for Interpretation of Numerals in the Information Retrieval)

  • 문유진
    • 한국컴퓨터정보학회논문지
    • /
    • 제14권8호
    • /
    • pp.65-71
    • /
    • 2009
  • 월드 와이드 웹의 정보 검색에서 산출되어지는 수많은 정보를 효율적으로 검색하기 위해서 자연어 정보처리가 필수적이다. 이 논문은 텍스트에서 숫자의 의미 파악을 위한 판별기법을 제안한 것이다. 숫자 의미 판별기법은 챠트 파싱 기법과 함께 문맥자유 문법을 활용하여 숫자 스트링과 연관된 접사를 해석하였으며, N-그램 기반의 단어에 의거하여 조직화된 의미 파악을 하도록 설계되었다. 그리고 POS 태거를 사용하여 트라이그램 단어의 제한조건이 자동 인식되도록 시스템을 구성하여, 점진적으로 효율적인 숫자의 의미 파악을 하도록 하였다. 이 논문에서 제안한 숫자 해석 시스템을 실험한 결과, 빈도수 비례 방법은 86.3%의 정확률을 나타냈고 조건수 비례 방법은 82.8%의 정확률을 나타냈다.