• 제목/요약/키워드: 구문 구조

검색결과 476건 처리시간 0.028초

웹 문서 검색을 위한 검색어 추출과 확장에 관한 연구 (A Study on Keyword Extraction and Expansion for Web Text Retrieval)

  • 윤성희
    • 한국컴퓨터산업학회논문지
    • /
    • 제5권9호
    • /
    • pp.1111-1118
    • /
    • 2004
  • 웹 문서 검색 시스템 사용자에게 자연어 질의를 입력하는 방법은 가장 이상적인 인터페이스이다. 본 논문은 자연어 질의를 입력하는 웹 문서 검색 시스템을 위해 자연어 처리 기술에 기반하여 사용자의 입력 질의 문장을 구문 분석한 후 검색어를 추출하고 확장하는 다중검색 기법을 제안한다. 질의문에 대한 형태소 분석 및 구문 분석을 수행하고, 구문 트리를 순회하여 구조적으로 연관된 복합명사를 조합하거나 분할하며, 검색어가 되는 음역어와 축약어들을 확장하여 다중 검색함으로써 재현율과 정확도를 향상시킬수 있음을 보였다.

  • PDF

RDF기반 인터넷 자원 메타데이터 설계에 관한 연구 (A Study on Designing Metadata with Resource Description Framework for Internet Resources)

  • 조윤희;이두영
    • 정보관리학회지
    • /
    • 제17권3호
    • /
    • pp.147-170
    • /
    • 2000
  • RDF는 모든 자원을 독립적으로 취급하며, 특정 자원과 관련한 자원을 연결하는 모형을 제공하는 인터넷 자원 기술을 위한 통합기술모형이다. 본 연구는 인터넷의 분산된 정보환경에서 탐색과 접근을 제공하는 의미와 구조, 구문의 공통적인 규칙인 RDF의 모형과 구문, 스키마 명세와 메타데이터 기술요소인 Dublin Core의 이론적인 검토를 수행하였다. 이를 통해 XML의 응용인 RDF를 기반으로 Dublin Core 요소의 DTD 및 스키마, 메타데이터 설계를 구현하였다.

  • PDF

Linked Data를 위한 한국어 자연언어처리 플랫폼 (Korean Natural Language Processing Platform for Linked Data)

  • 함영균;임경태;;박정열;윤용운;최기선
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2012년도 제24회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.16-20
    • /
    • 2012
  • 본 논문에서는 한국어 자연언어처리를 위해 형태소분석기와 구구조 구문분석기와 의존구조 구문분석기를 통합한 하나의 플랫폼을 제공하고, 외국의 다양한 자연언어처리 도구들의 결과물과의 국제적 상호운용성 및 Linked Data를 위한 RDF 형태로의 변환 시스템을 제시한다.

  • PDF

2018 국어 정보 처리 시스템 경진 대회: 한국어 의존 구문 분석 (2018 Korean Information Processing System Competition: Korean Dependency Parsing)

  • 이창기;배장성;박천음;홍혜진;이승재
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2018년도 제30회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.675-677
    • /
    • 2018
  • 의존 구문 분석은 문장 구조를 중심어와 수식어로 이루어진 의존 관계로 표현하는 방법이다. 표현 방식이 간단하고 자유 어순에 적합하기 때문에 한국어와 같이 어순이 자유롭고 문장 성분의 생략이 빈번한 언어에 적합한 것으로 알려져 있다. 본 논문에서는 한국어 의존 구문 분석 연구를 활성화하기 위해 개최된 2018 국어 정보 처리 시스템 경진대회에서 사용된 학습 및 평가 데이터를 간략히 소개하고, 각 참가자들이 제출한 시스템의 결과를 요약한다.

  • PDF

동적 구문지향 SGML 문서편집기 (Dynamic Syntax-Directed SGML Document Editor)

  • 강춘길;신경희;유재우
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 봄 학술발표논문집 Vol.27 No.1 (A)
    • /
    • pp.71-73
    • /
    • 2000
  • 본 논문에서 다루는 SGML 문서편집기는 파서를 내포하는 구조로서, 문서편집을 위하여 DTD 가 입력되고, 입력된 DTD 는 DTD 파서에 의해 적합성을 점검하게 된다. DTD 파서는 표준규칙에 따라 DTD를 파싱하고, 결과를 편집처리에 적합한 BNF-스타일 형태로 변환된 문법 테이블을 생성한다. SGML 문서 편집은 문법테이블 정보에 따라 처리된다. 문법 테이블의 크기는 엘리먼트 선언내용 중 컨텐트 모델의 표현에 따라 결정된다. 그 중 and(&) 접속자는 엘리먼트 개수에 따라 문법수가 기하급수적으로 증가하므로 DTD 파서에 의해 처리된다면 속도나 비용면에서 비효율적이다. 이에 본 논문에서는 고정된 문법테이블을 이용하는 SGML 편집기에 and 접속자로 표현된 엘리먼트 문법을 동적으로 확정 처리할 수 있는 기능이 추가 향상된 구문지향적 SGML 문서편집기를 제시한다. 그러므로 향상된 구문지향 SGML 문서편집기는 고정된 문법을 이용한 문서편집 뿐 아니라 편집처리에 따른 변환에 능동적으로 처리할 수 있다는 특징을 갖게된다.

  • PDF

내부 및 외부 확률을 이용한 의존문법의 비통제 학습 (An unsupervised learning of dependency grammar Using inside-outside probability)

  • 장두성;최기선
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2000년도 제12회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.133-137
    • /
    • 2000
  • 구문태그가 부착되지 않은 코퍼스를 사용하여 문법규칙의 확률을 훈련하는 비통제 학습(unsupervised learning) 방법의 대표적인 것이 CNF(Chomsky Normal Form)의 CFG(Context Free Grammar)를 입력으로 하는 inside-outside 알고리즘이다. 본 연구에서는 의존문법을 CNF로 변환하는 기법에 대해 논하고 의존문법을 위해 변형된 inside-outside 알고리즘을 논한다. 또한 이 알고리즘을 사용하여 실제 훈련한 결과를 보이고, 의존규칙과 구문구조 확률을 같이 사용하는 hybrid방식 구문분석기에 적용한 결과를 보인다.

  • PDF

구문 분석 결과를 이용한 한국어 무제한 정보추출 (A Syntax-Based Hybrid System for Korean Open Information Extraction)

  • 김병수;유환조;이근배
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2015년도 제27회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.41-45
    • /
    • 2015
  • 무제한 정보추출은 주로 영어를 대상으로 연구가 진행 되었지만, 최근에는 영어가 아닌 다른 언어에 대한 적용이 시도되고 있다. 본 논문에서는 관계 어휘의 유형을 동사형과 명사형 2가지로 정의하고, 각 유형별로 구문 분석 결과 기반의 서로 다른 방법론을 적용하는 한국어 대상 무제한 정보추출 시스템을 소개한다. 동사형 관계 어휘에 대해서는 의존 관계 기반의 추출 규칙을 적용하고, 명사형 관계 어휘에 대해서는 대량의 말뭉치로부터 자동으로 학습한 의존 관계 구조 기반의 추출 패턴을 적용한다. 임의의 100개 문장에 대해서 수행한 결과는 산출된 전체 트리플에 대해 0.8이상의 정밀도를 보임으로써 본 논문에서 제안하는 방법의 효용성을 증명하였다.

  • PDF

정보 검색 시스템의 성능 향상을 위한 구문 분석과 검색어 확장 (Syntactic Analysis and Keyword Expansion for Performance Enhancement of Information Retrieval System)

  • 윤성희
    • 한국산학기술학회논문지
    • /
    • 제5권4호
    • /
    • pp.303-308
    • /
    • 2004
  • 자연어 질의문장을 입력하는 방법은 정보 검색 시스템 사용자에게 가장 이상적인 인터페이스이다. 본 논문은 자연어 질의문장을 입력하는 검색 시스템을 위해 자연어 처리 기술에 기반 하여 사용자의 입력 질의 문장을 분석하고 검색어를 확장하는 다중검색 기법을 제안한다. 질의 문에 대한 형태소 분석 및 구문 분석을 수행하고, 구문 트리를 순회하여 구조적으로 연관된 복합명사를 조합하거나 분할하고, 이형표기 용어와 축약표기 용어들을 확장하여 다중 검색함으로써 재현율을 11.3%, 정확도를 4.7% 높였다.

  • PDF

한국어 구문분석을 위한 구묶음 기반 의존명사 처리 (Processing Dependent Nouns Based on Chunking for Korean Syntactic Analysis)

  • 박의규;나동열
    • 인지과학
    • /
    • 제17권2호
    • /
    • pp.119-138
    • /
    • 2006
  • 구묶음 작업은 문장의 분석을 보다 용이하게 해주는 것으로 알려져 있다. 본 논문에서는 한국어 문장의 구조 분석에 유용한 구묶음의 한 기법을 소개한다. 의존명사는 한국어 문장을 매우 복잡하고 길게 만드는 특성이 있다. 의존명사와 그 주변의 관계되는 단어에 대한 구묶음 작업을 통하여 문장의 복잡도를 낮출 수 있으며 이는 다음 분석 단계인 구문분석 작업을 보다. 용이하게 만든다. 본 논문에서는 이러한 목적을 달성하기 위한 의존명사와 관련된 구묶음 처리에 대해서 자세히 알아보았다. 우리는 의존명사의 종류에 따라 매우 다양한 형태의 구묶음 방식을 제안하였다. 실험을 통하여 본 논문에서 제안한 의존명사 관련 구묶음 처리 기법이 구문분석 시스템의 성능을 크게 향상시키는 것을 확인하였다.

  • PDF

프로그램 유사도 평가 알고리즘 (A Program Similarity Evaluation Algorithm)

  • 김영철;황석찬;최재영
    • 인터넷정보학회논문지
    • /
    • 제6권1호
    • /
    • pp.51-64
    • /
    • 2005
  • 본 논문에서는 서로 다른 두 개의 C 프로그램의 구문트리를 이용하여 유사도를 평가하는 시스템을 제시한다. 구문 트리를 이용하는 방법은 기존의 유사도 평가 방법과는 달리 들여쓰기, 여백, 설명문 등 프로그램과 무관한 프로그램 스타일의 변화에 민감하지 않으며, 문장, 코드 블록, 함수 등의 순서 바꾸기 같은 제어 구조의 변경에 민감하지 않은 특징을 가지고 있다. 그리고 프로그램을 파싱함으로써 구문 오류도 함께 검사찬 수 있는 장점을 제공한다. 논문에서는 유사도를 평가하기 위한 알고리즘과 함께 프로그램의 비교횟수를 줄이기 위한 그룹 짓기 알고리즘도 같이 제공한다. 실험부분에서는 구문트리 비교방법을 이용한 프로그램의 유사도 평가 결과와, 그룹 짓기를 수행한 후에 많은 비교 횟수를 줄일 수 있다는 것을 보여준다.

  • PDF