• 제목/요약/키워드: Syntactic

검색결과 719건 처리시간 0.035초

단어통사론을 위한 계산 모형 (A Computational Model for the Word-Syntax)

  • 김동주;김한우
    • 전자공학회논문지CI
    • /
    • 제39권6호
    • /
    • pp.11-23
    • /
    • 2002
  • 한국어 형태론에 대한 기존의 전산모형은 선형적인 것들로 단어 내부구조 분석보다 형태소 분리 문제에만 관심을 두고 있다. 이러한 선형적 전산모형을 구문 분석 과정과 통합적으로 고려할 경우, 구문 단위 요소의 형성을 위해 형태소 분석 결과를 묶어야만 하는 추가적인 과정이 필요할 뿐만 아니라 의미적 직관성을 얻기도 어려웠다. 본 논문에서는 형태소 분리와 구문 요소 형성뿐만 아니라 단어의 구조 분석까지도 통합적으로 다룰 수 있는 단어통사론적 시각에 따른 전산 모형을 제안한다. 먼저 형태소 분리와 변형 문제를 다루기 위해 2단계형태론의 형식화를 도입하고, 품사 문맥을 반영하기 위해 기능성 구분문자를 제안한다. 그리고 형태소의 통사적 결합 검사를 위해 GLR에 기반한 변형 알고리즘을 제안한다.

전자상거래의 지능형 RSS 도입을 위한 이슈 분석과 지능형 RSS 프레임워크의 제안 (Issues of Applying Intelligent RSS Framework to Electronic Commerce)

  • 박상언;강주영;김우주
    • 한국전자거래학회지
    • /
    • 제12권2호
    • /
    • pp.269-290
    • /
    • 2007
  • RSS는 향후 IT와 관련된 전 분야의 변화를 주도할 것으로 기대되는 웹 2.0의 핵심적인 요소이다. 뉴스, 블로그, 멀티미디어, 의학, 학술 등 다양한 분야에서 웹 콘텐츠의 지속적인 배포를 위해 활발히 사용되고 있으며, 전자상거래에서도 향후 효과적인 마케팅 수단이 될 것으로 예측되고 있다. 본 논문에서는 현재 국내 쇼핑몰에서 활용되고 있는 RSS의 문제점들을 분석하고, 이로부터 RSS의 효과적인 전자상거래 적용을 위한 요구사항들을 제안하였다. 그리고, 요구사항의 구현과 관련된 다양한 이슈들과 해결책을 제시한 후, 이를 기반으로 전자상거래를 위한 지능형 RSS 프레임워크를 제안하였다. 제시된 프레임워크에서 RSS 정보의 의미 해석을 위해서는 RSS 기반의 정보 제공자와 RSS 리더기 사이에 형식적 상호운용성과 의미적 상호운용성이 보장되어야 한다. 본 논문에서는 시맨틱 웹을 이용해 이와 같은 상호운용성을 구현하는 방안을 제시하였다.

  • PDF

과학 기술 문헌 분석을 위한 기계학습 기반 범용 전문용어 인식 시스템 (Terminology Recognition System based on Machine Learning for Scientific Document Analysis)

  • 최윤수;송사광;전홍우;정창후;최성필
    • 정보처리학회논문지D
    • /
    • 제18D권5호
    • /
    • pp.329-338
    • /
    • 2011
  • 문헌에서의 전문용어 인식 연구는 정보검색, 정보추출, 시맨틱 웹, 질의응답 분야 등의 연구를 위한 선행 연구로서, 지금까지 대부분 특정 분야, 특히 생의학 분야에서 집중되어 연구되어 왔다. 그러나 기존 연구들이 특정 도메인 또는 문헌 내부 통계 정보를 활용함으로써 범용적인 전문용어 인식에 한계점을 보여 왔기 때문에, 본 연구에서는 웹 검색 결과와 사전, 후보용어의 문형 특징 등을 활용하는 기계 학습 기반 범용 전문용어 인식 방법을 제안하였다. 제안한 방법을 문헌의 지역 통계 정보를 사용하는 방법(C-value)과 비교 실험하여 80.8%의 F-값으로 6.5%의 성능향상을 보였다. 다양한 응집도 자질들을 접목한 두 번째 실험에서는 Normalized Google Distance 방법과 접목한 방식이 F-값 81.8%의 성능으로 최고의 성능을 나타냈다. 기계 학습 방법으로는 로지스틱 회귀분석, C4.5, SVMs 등을 적용하였는데, 일반적으로 이진 분류에 좋은 성능을 보이는 SVMs과 로지스틱 회귀분석 방법보다 결정 트리 방식의 C4.5가 전반적으로 좋은 성능을 보였다.

단문형의 영작문 자동 채점 시스템 구축 (Building an Automated Scoring System for a Single English Sentences)

  • 김지은;이공주;진경애
    • 정보처리학회논문지B
    • /
    • 제14B권3호
    • /
    • pp.223-230
    • /
    • 2007
  • 영어 작문 자동 채점 시스템은 수험자가 작성한 영작문을 사람의 개입 없이 시스템이 처리하여 점수나 피드백을 줄 수 있는 시스템이다. 본 연구에서는 영작문 중 여러 문장이나 단락으로 구성된 에세이가 아닌 단문형의 영작문을 채점하는 시스템을 개발하였다. 단일 문장을 채점하기 때문에 정답 문장과 좀 더 자세한 비교를 할 수 있고 수험자들에게 좀 더 상세한 피드백을 제공해 줄 수 있다. 단일 문장을 채점하기 위해서는 크게 두 단계의 처리가 요구된다. 첫 번째 단계는 문장내의 오류를 탐지하는 과정으로, 수험자의 영작문을 분석하여 문장 내에 포함되어 있을 수 있는 철자 및 구문 오류를 검사한다. 둘째 단계는 문장 간 오류를 탐지하는 과정으로 문제 출제자가 제공한 정답문장과 수험자의 영작문을 비교하여 두 문장 사이의 차이를 오류로 인식한다. 실제로 중학교 3학년 학생들을 대상으로 영작문 시험을 수행하였고, 이를 본 연구에서 개발한 영작문 자동 채점 시스템을 이용하여 채점해 보았다 인간 채점자와의 비교를 통해서 영작문 자동 채점 시스템의 효용성을 살펴보았다.

영작문 자동 채점 시스템에서의 중복 보고 오류 제거를 통한 성능 향상 (Accuracy Improvement of an Automated Scoring System through Removing Duplicately Reported Errors)

  • 이현아;김지은;이공주
    • 정보처리학회논문지B
    • /
    • 제16B권2호
    • /
    • pp.173-180
    • /
    • 2009
  • 영어 작문 자동 채점 시스템은 수험자가 작성한 영작문을 사람의 개입 없이 시스템이 처리하여 점수나 피드백을 줄 수 있는 시스템이다. 본 논문에서 개발한 영작문 자동 채점 시스템은 단어 단계, 구문 단계, 의미 단계의 세 단계 처리 과정을 통해서 오류를 탐지하고 탐지된 오류 개수를 기반으로 채점 점수를 결정한다. 이와 같이 독립적인 세 단계의 처리 과정에서 오류를 탐지하므로 동일한 오류 현상에 대해 서로 다른 단계에서 서로 다른 이름으로 오류를 탐지하는 경우가 발생할 수 있다. 이는 결과적으로 전체 시스템의 채점 점수의 정확도를 저하시키는 원인이 된다. 본 논문에서는 동일한 오류 현상에 대해 서로 다른 단계에서 탐지된 오류 쌍을 '중복 보고 오류'라고 정의한다. 본 논문에서는 중복 보고 오류를 찾는 방법을 제안하고 중복 보고 오류 제거를 통해 영작문 자동 채점 시스템의 채점 점수를 향상시킬 수 있음을 보인다.

XL-BPMN 모델 기반 비즈니스 서비스 식별 기법 (A Business Service Identification Techniques Based on XL-BPMN Model)

  • 송치양;조은숙
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제5권3호
    • /
    • pp.125-138
    • /
    • 2016
  • 서비스 지향 개발에서 서비스 식별은 워크플로우, 목표와 시나리오, 유스케이스, 컴포넌트, 휘처, 패턴 등에 기반해서 이루어져 왔다. 그러나, 비즈니스 가치 관점에서 의미적 접근에 의한 서비스의 식별은 아직 구체화되어 있지 않다. 본 논문은 비즈니스 서비스 식별의 정확성을 향상시키기 위하여, XL-BPMN 모델 대상의 구조적 및 의미적 분석에 의한 비즈니스 서비스를 식별하는 방법을 제시한다. 비즈니스 시나리오에 기반해서 비즈니스 프로세스들을 식별하고, 이 프로세스는 XL-BPMN 비즈니스 프로세스 모델로 디자인한다. 이 비즈니스 프로세스 모델에서, 액티비티들간 구조적 패턴과 속성 기반 의미적 유사성의 통합된 분석 결과에 의해 밀접한 액티비티를 바인딩해서 단위 비즈니스 서비스를 식별한다. 이를 통해, 상위 비즈니스 가치 관점의 XL-BPMN 모델을 통한 정확성과 모듈성이 높은 단위 비즈니스 서비스 식별을 할 수 있다. 식별된 서비스의 재사용을 통해서 서비스 지향 개발을 더욱 가속화를 도모할 수 있을 것이다.

휘처 모델의 Z 정형 명세와 검사 기법 (A Formal Specification and Checking Technique of Feature model using Z language)

  • 송치양;조은숙;김철진
    • 한국컴퓨터정보학회논문지
    • /
    • 제18권1호
    • /
    • pp.123-136
    • /
    • 2013
  • 시각적이고 비정형적인 구조로 표현된 휘처 모델(Feature model)은 구문적 명확성을 보장할 수 없고, 자동화 툴(tool)에 의한 구문(syntax)의 검증이 어렵다. 따라서, 휘처 모델이 가진 구조물의 구문적 명확성을 입증하기 위한 정형적 명세와 모델 검사(model checking)가 필요하다. 본 논문은 Z 언어를 이용한 휘처 모델의 정형적 명세와 모델 검사를 통해서, 휘처 모델의 정확성을 검사하는 기법을 제시한다. 이를 위해, 휘처 모델과 Z간 변환 규칙을 정의하고, 이 규칙에 의거하여 휘처 모델의 구문에 대해 Z 스키마(schema)로 명세한다. 모델 검사는 Z 스키마 명세에 대해 Z/Eves 툴을 사용하여 구문, 타입 검사(type checking), 그리고 도메인 검사(domain checking)를 수행하여 모델의 모호성을 검사한다. 이로서, 휘처 모델의 구조물을 좀더 명확하게 표현할 수 있으며, 설계된 모델의 오류를 검사할 수 있다.

국소 구문 관계 및 의미 공기 정보에 기반한 명사 의미 모호성 해소 (Word Sense Disambiguation Based on Local Syntactic Relations and Sense Co-occurrence Information)

  • 김영길;홍문표;김창현;서영애;양성일;류철;황은하;최승권;박상규
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2002년도 제14회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.184-188
    • /
    • 2002
  • 본 논문에서는 단순히 주변에 위치하는 어휘들간의 문맥 공기 정보를 이용하는 방식과는 달리 국소 구문 관계 및 의미 공기 정보에 기반한 명사 의미 모호성 해소 방안을 제안한다. 기존의 WSD 방법은 구조 분석의 어려움으로 인하여 문장의 구문 관계를 충분히 고려하지 못하고 주변 어휘들과의 공기 관계로 그 의미를 파악하려 했다. 그러나 본 논문에서는 동사구의 논항 의미 관계뿐만 아니라 명사구내에서의 의미 관계도 고려한 국소 구문관계를 고려한 명사 의미 모호성 해소 방법을 제안한다. 이 때, 명사들의 의미는 자동번역 시스템의 목적에 맞게 공기(co-occurrence)하는 동사들에 따라 분류하였다. 그리고 한중 자동 번역 지식으로 사용되는 명사 의미 코드가 부착된 74,880 의미 격틀의 의미 공기정보를 이용하였으며 형태소 태깅된 말뭉치로부터 의미모호성이 발생하지 않게 의미 공기정보 및 명사구 의미 공기 정보를 자동으로 추출하였다. 실험 결과, 의미 모호성이 발생하는 명사들에 대해서 83.9%의 의미 모호성 해소 정확률을 보였다.

  • PDF

기능적 자기공명영상에 나타난 한글 의미.통사 문장 처리의 해리 (Dissociation of the semantic and syntactic processing reflected on fMRI in Korean sentences)

  • 이홍재;이동훈;남기춘;이은정;문찬홍;유재욱;나동규
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2000년도 제12회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.405-410
    • /
    • 2000
  • 본 연구에서는 기능적 자기공명영상을 이용하여 한글 문장의 의미와 통사 처리에 관한 뇌의 활성화 양상을 비교함으로써 한글문장 이해의 과정에 대한 신경해부학적 증거를 찾고자 하였다. 6명의 자원자를 대상으로 문장진위판단과제를 이용하여 활성화를 유도하였다. 1.5T 초전도 자기공명영상 장치에서 EPI로 BOLD 기법을 이용하여 기능적 영상을 얻었으며 영상 후 처리는 SPM99 분석 프로그램을 이용하였다. 의미관련 통사관련 문장 모두에서 좌 우 전두회(frontal gyrus) 영역에서 활성화되었다. 의미와 통사처리 영역을 구분하기 위하여 감산법을 적용한 결과, 의미처리는 좌반구의 중측두회(middle temporal gyrus) 영역에서, 통사처리는 우반구의 하전두회(BA44) 부위에서 더 많이 활성화되었다. 의미처리에서 더 우세한 성향을 띠는 부위로 밝혀진 중측두회 영역은 의미처리시에 활성화되는 영역으로 보고하는 기존의 연구와 일치하는 결과이다. 의미와 통사 문장처리시의 뇌 활성화 양상은 뇌의 여러 영역에서 중첩되어 있기는 하지만, 특정영역에서의 차이를 보이고 있으므로, 의미와 통사처리는 다른 기전(mechanism)에 의해서 일어남을 시사해 준다.

  • PDF

한국어 문장 유형의 자동 분류 한국어-수화 변환 및 한국어 음성 합성에의 응용 (Sentence Type Identification in Korean Applications to Korean-Sign Language Translation and Korean Speech Synthesis)

  • 정진우;이호준;박종철
    • 한국HCI학회논문지
    • /
    • 제5권1호
    • /
    • pp.25-35
    • /
    • 2010
  • 본 논문에서는 한국어 문장 유형을 자동으로 분류하는 방법을 제안하고 한국어-수화 변환과 한국어 음성 합성 분야에서 문장 유형 정보가 자연스러운 수화 표현과 음성 표현을 생성하는데 이용되는 과정을 보인다. 한국어에서 문장 유형은 크게 평서문, 명령문, 청유문, 의문문, 감탄문의 다섯 가지로 분류되는데, 기존의 방법으로는 대화체 문장에서 동일한 문장이 여러 가지 유형으로 해석되는 중의성의 문제가 발생한다. 본 논문에서는 문장 내에서 형태소 및 구문단위의 다양한 단서들을 활용하여 이를 해결하는 방법을 제안하며, 실험 결과 본 논문에서 제시한 문장 유형 분류 시스템이 만족할 만한 성능을 보이는 것을 확인하였다. 이를 이용하여 한국어-수화 변환 시스템에서 문장 유형에 따라 수화의 비수지신호가 다르게 표현되는 현상을 처리하는 과정과 한국어 음성 합성 시스템에서 문장 유형에 따라 문장의 문미 억양이 변하는 현상을 처리하는 과정을 제시한다. 문장 유형 정보를 음성 합성과 수화 자동 생성에 이용하는 것은 기존에는 연구되지 않았던 방법으로, 좀 더 자연스러운 음성과 수화 표현을 생성하는데 중요한 역할을 할 것으로 기대한다.

  • PDF