• 제목/요약/키워드: 수정규칙

검색결과 274건 처리시간 0.026초

개념 계층 이용 흥미로운 부분 데이터의 탐색 (Discovery of Interesting Knowlege using Concept Hierarchy)

  • 홍정희;김성민;남도원;이동하;이전영
    • 한국지능정보시스템학회:학술대회논문집
    • /
    • 한국지능정보시스템학회 2000년도 춘계정기학술대회 e-Business를 위한 지능형 정보기술 / 한국지능정보시스템학회
    • /
    • pp.261-270
    • /
    • 2000
  • 개념 계층(Concept Hierarchy)은 데이터베이스 분야에서 사용되는 대표적인 배경 지식(Background Knowledge)으로써, 데이터베이스에 내재되어 있는 구조적인 정보, 데이터의 분포, 영역전문가(Domain Expert)에 의해 주어지는 외부 지식 등이 반영되어 있다. 개념 계층의 특성상 부모(parent)-자식(child) 관계가 있는 두 노드가 있을 때, 한 노드의 값으로부터 다른 노드의 값을 추정할 수 있다. 이 추정된 값을 기대치라고 하고, 한 노드의 값으로부터 추정된 기대치와 실제치가 상당히 상이한 값을 보이는 노드가 있을 때, 이를 흥미롭다(interesting)라고 할 수 있다. 그러나 아직까지 개념계층상에서의 흥미로운 부분 탐색에 대한 연구가 없었으며, 흥미로움(interestingness)의 척도(measurement)에 대한 연구로서는 신뢰도(confidence), 리프트(lift), 컨빅션(conviction)등이 있다. 그러나 이런 흥미도의 척도에 관한 연구도 연관규칙에 한정되어 이루어졌으므로 개념계층상의 데이터에 적용하기 위해서는 약간의 수정 및 새로운 정의가 필요하다. 본 논문에서는 데이터의 특성에 따른 개념계층이 존재할 때, 이를 이용하여 기대치와 실제치가 상이한 흥미로운 부분을 발견하고자 하며, 이를 위하여 개념계층이 존재할 때, 이를 이용하여 기대치와 실제치가 상이한 흥미로운 부분을 발견하고자 하며, 이를 위하여 개념계층상에서의 흥미도의 척도를 제안하고 흥미로운 부분을 탐색하는 방법을 기술하고자 한다. 또한 데이터마이닝의 결과인 연관규칙을 개념계층에 적용하여 연관규칙을 통해 얻어질 수 있는 기대치를, 지지도(support), 신뢰도(confidence), 리프트(lift), 컨빅션(conviction)등의 관계를 통해 다양한 방법으로 모색해본다. 이 연구에서 제안하는 이러한 개념계층상의 흥미로운 부분의 탐색은, 전자 상거래에서의 CRM(Customer Relationship Management)나 틈새시장(niche market) 마케팅 등에 적용가능하리라 여겨진다.

  • PDF

KTAG99: 새로운 환경에 쉽게 적응하는 한국어 품사 태깅 시스템 (KTAG99: Highly-Adaptable Koran POS tagging System to New Environments)

  • 김재훈;선충녕;홍상욱;이성욱;서정연;조정미
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1999년도 제11회 한글 및 한국어 정보처리 학술대회 및 제1회 형태소 분석기 및 품사태거 평가 워크숍
    • /
    • pp.99-105
    • /
    • 1999
  • 한국어 정보처리를 위한 언어정보는 응용 분야에 따라 큰 차이를 보인다. 특히 말뭉치를 이용한 연구에서는 언어정보가 달라질 때마다 시스템을 새로 구성해야 하는 어려움이 있다. 본 논문에서는 이와 같은 어려움을 다소 완화시키기 위해 새로운 환경에 잘 적응할 수 있는 한국어 품사 태깅 시스템에 관해서 논한다. 본 논문에서는 이 시스템을 KTAG99라고 칭한다. KTAG99는 크게 실행부와 학습부로 구성되었다. 한국어 품사 태깅을 위한 실행부는 고유명사 추정기, 한국어 형태소 분석기, 통계기반 품사 태거, 품사 태깅 오류교정기로 구성되었으며, 실행부에서 필요한 언어정보를 추출하는 학습부는 고유명사 추정규칙 추출기, 형태소 배열규칙 추출기, 사전 추출기, 확률정보 추정기, 품사 태깅 오류수정 규칙 추정기로 구성되었다. KTAG99에서 필요한 언어정보의 대부분은 학습 말뭉치로부터 추출되거나 추정되기 때문에 아주 짧은 시간 내에 새로운 환경에 적응할 수 있다.

  • PDF

XML 라이브러리의 효율적 재사용을 위한 비즈니스 정보 개발 방안 (Research on a Development of Business Information for the Efficient Reuse of XML Libraries)

  • 박찬권;김형도
    • 한국산업정보학회:학술대회논문집
    • /
    • 한국산업정보학회 2008년도 추계 공동 국제학술대회
    • /
    • pp.656-663
    • /
    • 2008
  • XML 기술의 발전에 따라 확장성 있는 ebXML(Electronic Business eXtensible Markup Language) 기반의 스키마 사용이 확장되면서 점차 기존 EDI 전자문서나 DTD(Document Type Definition) 구조로 되어 있는 전자문서를 XML 스키마 형태로 변환하거나 새롭게 개발해고 있는 추세이다. 한국전자거래진흥원에서는 XML 전자운세 개발 지침과 함께 XML 라이브러리를 개발하여 제시함으로써 표준 XML 전자문서의 개발을 지원하고 있다. XML 전자문서 개발 지침은 ebXML CCTS 기술규격에서 제시하고 있는 방법론을 준용하고, UN/CEFACT ATG 그룹에서 개발한 XML Naming & Design Rule 규격을 국내에 맞게 수정하여 적용하고 있다. 또한 XML 라이브러리는 전자문서 개발지침에 따라 사전에 정의하고 개발해 놓은 핵심 컴포넌트와 비즈니스 정보 개체들로 구성되어 있다. 하지만 전자문서개발 지침상의 일부 규칙들이 의미상 명확하지 않은 상태에서 개발자의 임의적 선택의 폭을 허용하거나 개체의 명명에 대한 뚜렷한 기준을 제시하지 못함으로써 핵심 컴포넌트와 비즈니스 정보 개체의 검색 및 재사용을 제한하고 라이브러리 유지보수를 어렵게 하고 있는 실정이다. 본 연구에서는 XML 전자문서 개발지침 상의 일부 규칙에 대한 문제점을 분석, 규칙을 구제화함으로써 개발자 중립적인 핵심 컴포넌트와 비즈니스 정보 개체의 개발을 지원하고 라이브러리 관리를 효율적으로 수행할 수 있는 방안을 제시하고자 한다.

  • PDF

어절별 중의성 해소 정보를 이용한 품사 태깅의 성능 향상 (Improving Part-of-speech Tagging by using Resolution Information for Individual Ambiguous Word)

  • 박희근;서영훈
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2007년도 제19회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.134-139
    • /
    • 2007
  • 품사 태깅 시스템에서 규칙 정보와 통계 정보는 상호보완적으로 사용되어 품사 태깅의 성능을 향상시킨다. 하지만, 두 가지 정보로는 품사 태깅의 성능을 향상시키기에는 한계가 있다. 이에 본 논문에서는 어절별 중의성 해소 정보를 이용하여 품사 태깅 시스템의 정확률을 향상시키는 방법에 대해서 기술한다. 통계 정보는 21세기 세종계획의 천만 어절 균형 말뭉치와 태그 부착 말뭉치에서 추출한 trigram 형태의 중의성 어절 및 품사 태그열 출현 빈도 정보를 이용하여 구축하였고, 규칙 정보는 보조용언, 숙어, 관용적 표현 등을 이용하여 구축하였다. 어절별 중의성 해소 정보는 세종 천만 어절 균형 말뭉치의 중의성 어절에서 고빈도 상위 50%에 해당하는 어절을 대상으로 해당 어절의 의미정보와 문맥정보를 고려하여 구축되었고, 이것은 통계 정보를 이용한 품사 태깅 전에 적용되어 분석 후보를 줄여준다. 또한, 학습을 통하여 어절별 중의성 해소 정보를 수정 및 보강하여 잘못된 품사 태깅 결과를 보정해준다. 이와 같이 통계 정보와 규칙 정보를 이용한 품사 태깅 시스템에 고빈도 중의성 어절에 대한 어절별 중의성 해소 정보를 이용함으로써 품사 태깅의 성능을 향상시킬 수 있었다.

  • PDF

개미군락시스템에서 수정된 지역 갱신 규칙을 이용한 최적해 탐색 기법 (Optimal solution search method by using modified local updating rule in Ant Colony System)

  • 홍석미;정태충
    • 한국지능시스템학회논문지
    • /
    • 제14권1호
    • /
    • pp.15-19
    • /
    • 2004
  • 개미군락시스템 (Ant Colony System, ACS)은 조합 최적화 문제를 해결하기 위한 기법으로 생물학적 기반의 메타휴리스틱 접근법이다. 지나간 경로에 대하여 페로몬을 분비하고 통신 매개물로 사용하는 실제 개미들의 추적 행위를 기반으로 한다. 최적 경로를 찾기 위해서는 보다 다양한 에지들에 대한 탐색이 필요하다. 기존 개미군락시스템의 지역 갱신 규칙에서는 지나간 에지에 대하여 고정된 페로몬 갱신 값을 부여하고 있다. 그러나 본 논문에서는 방문한 도시간의 거리와 해당 에지의 방문 횟수를 이용하여 페로몬을 부여한다. 보다 많은 정보를 탐색에 활용함으로써 기존의 방법에 비해 지역 최적화에 빠지지 않고 더 나은 해를 찾을 수 있었다.

개념 계층 이용 흥미로운 부분 데이터의 탐색 (Discovery of Interesting Knowledge using Concept Hierarchy)

  • 홍정희;김성민;남도원;이동하;이전영
    • 지능정보연구
    • /
    • 제6권2호
    • /
    • pp.77-89
    • /
    • 2000
  • 개념 계층(Concept Hierarchy)은 데이터베이스 분야에서 사용되는 대표적인 배경 지식(Background Knowledge)으로써, 데이터베이스에 내재되어 있는 구조적인 정보, 데이터의 분포, 영역전문가 (Domain Expert)에 의해 주어지는 외부 지식 등이 반영되어 있다. 개념계층의 특성상 부모(parent)-자 식(child) 관계가 있는 두 노드가 있을 때, 한 노드의 값으로부터 다른 노드의 값을 추정할 수 있다 이 추정된 값을 기대치라고 하고, 한 노드의 값으로부터 추정된 기대치와 실제치가 상당히 상이한 값을 보이는 노드가 있을 때, 이를 흥미롭다(interesting)고 말할 수 있다. 그러나 아직까지 개념계층 상에서의 흥미로운 부분 탐색에 대한 연구가 없었으며, 흥미로움(interestingness)의 척도(measurement) 에 대한 연구로서는 신뢰도(confidence),리프트(lift),컨빅션(conviction)등이 있었다. 그러나 이런 흥미도 의 척도에 관한 연구도 연관규칙에 한정되어 이루어졌으므로 개념계층상의 데이터에 적용하기 위해 서는 약간의 수정 및 새로운 정의가 필요하다. 본 논문에서는 데이터의 특성에 따른 개념계층이 존재할 때, 이를 이용하여 기대치와 실제치가 상이한 흥미로운 부분을 발견하고자 하며, 이를 위하여 개념계층상에서의 흥미도의 척도를 제안하고 흥미로운 부분을 탐색하는 방법을 기술하고자 한다. 또한 데이터마이닝의 결과인 연관규칙을 개념 계층에 적용하여 연관규칙을 통해 얻어질 수 있는 기대치를, 지지도(support), 신뢰도(confidence), 리프트(lift), 컨빅션(conviction)등의 관계를 통해 다양한 방법으로 모색해본다. 이 연구에서 제안하는 이러한 개념계층상의 흥미로운 부분의 탐색은, 전자 상거래에서 CRM(Customer Relationship Management)나 틈새시장(niche market) 마케팅 등에 적용 가능하리라 여겨진다.

  • PDF

억양과 초점에 관한 화용론적 연구 (A Pragmatically-oriented Study of Focus and Intonation)

  • 이영길
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1999년도 학술발표대회 논문집 제18권 2호
    • /
    • pp.379-382
    • /
    • 1999
  • 모든 문장에는 '새로운' 정보를 전달하기 위한 초점이 있고 높낮돋들림을 포함하는 초점범위는 다시 정보 초점을 필수 요소로 갖는 정보 구조 경계를 갖는다. 모호성이 없는 적절한 초점 구조를 결정하기 위해 '국어 초점 원리'를 도입함으로써 초점 성분의 영역이 확인되고 화맥에 의한 초점 해석이 가능해진다. 초점 성분을 설명하고 높낮돋들림과 초점 돋들림의 관계를 기술하는 '기본초점규칙'이 필요하며 '정보 구조 원리'에 의해 '새로운' 정보가 선택되어 초점 범위는 화맥에 의해 구체화된다. 정보 구조가 문법 체계의 모든 의미 계층과 관계를 가지며 정보 구조의 경계 안에 정보 초점으로 실현되는 초점 돋들림이 있게 되므로 기본 초점 규칙은 '초점 돋들림 원리'로 수정되어 초점 범위 내의 음절에 초점 돋들림이 할당된다.

  • PDF

G-machine 에서의 AP 노드 재사용 (Reusing AP Node in G-machine)

  • 주성용;우균
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2002년도 추계학술발표논문집 (하)
    • /
    • pp.2329-2332
    • /
    • 2002
  • G-machine은 지연 함수형 언어를 효율적으로 구현하기 위한 추상기계이다. G-machine은 축약 과정에서 생성되는 그래프를 저장하기 위해서 많은 기억장소를 필요로 한다. 본 논문은 힙에 할당되는 그래프 노드 중 AP 노드를 재사용하는 방법을 제시한다. 일반적으로 AP 노드를 루트로 하는 그래프가 한 단계 축약된 후 다시 AP 노드를 루트로 하는 그래프로 구성되어지는 경우 루트 노드를 재사용할 수 있다. 이를 위해서는 기존 G-machine을 약간 확장 시켜야 하는데, 본 논문에서는 AP 노드의 일부를 변경하기 위한 명령어 UPDL과 UPDR을 제시하고, 이들 명령어의 상태변환 규칙과 이들 명령어 생성을 위해 수정된 R-변환 규칙을 제시한다. 본 논문에서 제시하는 방식으로 기 생성된 AP 노드를 재사용함으로써 힙 기억공간의 사용량을 줄일 수 있고, 이 과정에서 힙 기억장소 할당과 쓰기 연산의 수를 줄일 수 있다.

  • PDF

수목구조 지능시스템을 이용한 고차원 공간 위에서의 비선형 근사 (Nonlinear Approximation in High-Dimensional Spaces Using Tree-Structured Intelligent Systems)

  • 길준민;정창호;강성훈;박주영;박대희
    • 한국지능시스템학회논문지
    • /
    • 제6권3호
    • /
    • pp.25-36
    • /
    • 1996
  • 기존의 RBF 신경망 및 퍼지 시스템을 고차원 입력 공간 위에서의 비선형 근사에 적용할 경우 은닉 노드의 수혹은 퍼지 IF-THEN 규칙의 수가 기하급수적으로 증가한다. 본 논문에서는 이러한 문제점을 개선하기 위해 반국소 유닛을 기본 요소로 하는 수목구조지능시스템을 제안하고, 이를 효과적으로 학습하기 위하여 수정 유전자 알고리즘 및 LMS 규칙에 기반을 둔 학습 알고리즘을 개발한다. 제안된 시스템에 대한 근사 능력 해석이 수행되고, 실험적 고찰을 통하여 개발된 방법론의 유용성이 입증된다.

  • PDF

포장과 법률 - 제품의포장재질.포장방법에관한기준등에관한규칙

  • (사)한국포장협회
    • 월간포장계
    • /
    • 통권236호
    • /
    • pp.103-115
    • /
    • 2012
  • 환경부는 제품의 포장재질 포장방법에 관한 기준 등에 관한 규칙(환경부령) 개정('13.7.1 시행 예정) 사항 반영 및 포장 방법 변경 다양화에 따른 현행 포장 측정방법을 개선 보완하고자 다음과 같이 개정안을 발표했다. 주요내용은 종합제품의 정의를 "같은 종류 또는 다른 종류의 최소 판매단위 제품을 2개 이상 함께 포장한 제품을 말한다"로 수정하고 비매품, 설명서 등 참조용 물품은 종합제품의 구성품에서 제외하는 단서를 신설(안 제2조제2호)하는 것과 종이 골판지 펄프몰드로 제조된 받침접시 또는 포장용 완충재 사용시 공간비율 5%를 가산해주던 조항 삭제(안 제4조제2항제1호, 안 제4조제2항제2호)안 등이 나타나 있다. 본 고에서는 주요 내용과 함께 신구조문을 비교해 살펴보도록 한다.

  • PDF