• Title/Summary/Keyword: 규칙 수정

Search Result 274, Processing Time 0.032 seconds

Discovery of Interesting Knowlege using Concept Hierarchy (개념 계층 이용 흥미로운 부분 데이터의 탐색)

  • 홍정희;김성민;남도원;이동하;이전영
    • Proceedings of the Korea Inteligent Information System Society Conference
    • /
    • 2000.04a
    • /
    • pp.261-270
    • /
    • 2000
  • 개념 계층(Concept Hierarchy)은 데이터베이스 분야에서 사용되는 대표적인 배경 지식(Background Knowledge)으로써, 데이터베이스에 내재되어 있는 구조적인 정보, 데이터의 분포, 영역전문가(Domain Expert)에 의해 주어지는 외부 지식 등이 반영되어 있다. 개념 계층의 특성상 부모(parent)-자식(child) 관계가 있는 두 노드가 있을 때, 한 노드의 값으로부터 다른 노드의 값을 추정할 수 있다. 이 추정된 값을 기대치라고 하고, 한 노드의 값으로부터 추정된 기대치와 실제치가 상당히 상이한 값을 보이는 노드가 있을 때, 이를 흥미롭다(interesting)라고 할 수 있다. 그러나 아직까지 개념계층상에서의 흥미로운 부분 탐색에 대한 연구가 없었으며, 흥미로움(interestingness)의 척도(measurement)에 대한 연구로서는 신뢰도(confidence), 리프트(lift), 컨빅션(conviction)등이 있다. 그러나 이런 흥미도의 척도에 관한 연구도 연관규칙에 한정되어 이루어졌으므로 개념계층상의 데이터에 적용하기 위해서는 약간의 수정 및 새로운 정의가 필요하다. 본 논문에서는 데이터의 특성에 따른 개념계층이 존재할 때, 이를 이용하여 기대치와 실제치가 상이한 흥미로운 부분을 발견하고자 하며, 이를 위하여 개념계층이 존재할 때, 이를 이용하여 기대치와 실제치가 상이한 흥미로운 부분을 발견하고자 하며, 이를 위하여 개념계층상에서의 흥미도의 척도를 제안하고 흥미로운 부분을 탐색하는 방법을 기술하고자 한다. 또한 데이터마이닝의 결과인 연관규칙을 개념계층에 적용하여 연관규칙을 통해 얻어질 수 있는 기대치를, 지지도(support), 신뢰도(confidence), 리프트(lift), 컨빅션(conviction)등의 관계를 통해 다양한 방법으로 모색해본다. 이 연구에서 제안하는 이러한 개념계층상의 흥미로운 부분의 탐색은, 전자 상거래에서의 CRM(Customer Relationship Management)나 틈새시장(niche market) 마케팅 등에 적용가능하리라 여겨진다.

  • PDF

KTAG99: Highly-Adaptable Koran POS tagging System to New Environments (KTAG99: 새로운 환경에 쉽게 적응하는 한국어 품사 태깅 시스템)

  • Kim, Jae-Hoon;Sun, Choong-Nyoung;Hong, Sang-Wook;Lee, Song-Wook;Seo, Jung-Yun;Cho, Jeong-Mi
    • Annual Conference on Human and Language Technology
    • /
    • 1999.10d
    • /
    • pp.99-105
    • /
    • 1999
  • 한국어 정보처리를 위한 언어정보는 응용 분야에 따라 큰 차이를 보인다. 특히 말뭉치를 이용한 연구에서는 언어정보가 달라질 때마다 시스템을 새로 구성해야 하는 어려움이 있다. 본 논문에서는 이와 같은 어려움을 다소 완화시키기 위해 새로운 환경에 잘 적응할 수 있는 한국어 품사 태깅 시스템에 관해서 논한다. 본 논문에서는 이 시스템을 KTAG99라고 칭한다. KTAG99는 크게 실행부와 학습부로 구성되었다. 한국어 품사 태깅을 위한 실행부는 고유명사 추정기, 한국어 형태소 분석기, 통계기반 품사 태거, 품사 태깅 오류교정기로 구성되었으며, 실행부에서 필요한 언어정보를 추출하는 학습부는 고유명사 추정규칙 추출기, 형태소 배열규칙 추출기, 사전 추출기, 확률정보 추정기, 품사 태깅 오류수정 규칙 추정기로 구성되었다. KTAG99에서 필요한 언어정보의 대부분은 학습 말뭉치로부터 추출되거나 추정되기 때문에 아주 짧은 시간 내에 새로운 환경에 적응할 수 있다.

  • PDF

Research on a Development of Business Information for the Efficient Reuse of XML Libraries (XML 라이브러리의 효율적 재사용을 위한 비즈니스 정보 개발 방안)

  • Park, Chan-Gwon;Kim, Hyeong-Do
    • Proceedings of the Korea Society for Industrial Systems Conference
    • /
    • 2008.10b
    • /
    • pp.656-663
    • /
    • 2008
  • XML 기술의 발전에 따라 확장성 있는 ebXML(Electronic Business eXtensible Markup Language) 기반의 스키마 사용이 확장되면서 점차 기존 EDI 전자문서나 DTD(Document Type Definition) 구조로 되어 있는 전자문서를 XML 스키마 형태로 변환하거나 새롭게 개발해고 있는 추세이다. 한국전자거래진흥원에서는 XML 전자운세 개발 지침과 함께 XML 라이브러리를 개발하여 제시함으로써 표준 XML 전자문서의 개발을 지원하고 있다. XML 전자문서 개발 지침은 ebXML CCTS 기술규격에서 제시하고 있는 방법론을 준용하고, UN/CEFACT ATG 그룹에서 개발한 XML Naming & Design Rule 규격을 국내에 맞게 수정하여 적용하고 있다. 또한 XML 라이브러리는 전자문서 개발지침에 따라 사전에 정의하고 개발해 놓은 핵심 컴포넌트와 비즈니스 정보 개체들로 구성되어 있다. 하지만 전자문서개발 지침상의 일부 규칙들이 의미상 명확하지 않은 상태에서 개발자의 임의적 선택의 폭을 허용하거나 개체의 명명에 대한 뚜렷한 기준을 제시하지 못함으로써 핵심 컴포넌트와 비즈니스 정보 개체의 검색 및 재사용을 제한하고 라이브러리 유지보수를 어렵게 하고 있는 실정이다. 본 연구에서는 XML 전자문서 개발지침 상의 일부 규칙에 대한 문제점을 분석, 규칙을 구제화함으로써 개발자 중립적인 핵심 컴포넌트와 비즈니스 정보 개체의 개발을 지원하고 라이브러리 관리를 효율적으로 수행할 수 있는 방안을 제시하고자 한다.

  • PDF

Improving Part-of-speech Tagging by using Resolution Information for Individual Ambiguous Word (어절별 중의성 해소 정보를 이용한 품사 태깅의 성능 향상)

  • Park, Hee-Geun;Seo, Young-Hoon
    • Annual Conference on Human and Language Technology
    • /
    • 2007.10a
    • /
    • pp.134-139
    • /
    • 2007
  • 품사 태깅 시스템에서 규칙 정보와 통계 정보는 상호보완적으로 사용되어 품사 태깅의 성능을 향상시킨다. 하지만, 두 가지 정보로는 품사 태깅의 성능을 향상시키기에는 한계가 있다. 이에 본 논문에서는 어절별 중의성 해소 정보를 이용하여 품사 태깅 시스템의 정확률을 향상시키는 방법에 대해서 기술한다. 통계 정보는 21세기 세종계획의 천만 어절 균형 말뭉치와 태그 부착 말뭉치에서 추출한 trigram 형태의 중의성 어절 및 품사 태그열 출현 빈도 정보를 이용하여 구축하였고, 규칙 정보는 보조용언, 숙어, 관용적 표현 등을 이용하여 구축하였다. 어절별 중의성 해소 정보는 세종 천만 어절 균형 말뭉치의 중의성 어절에서 고빈도 상위 50%에 해당하는 어절을 대상으로 해당 어절의 의미정보와 문맥정보를 고려하여 구축되었고, 이것은 통계 정보를 이용한 품사 태깅 전에 적용되어 분석 후보를 줄여준다. 또한, 학습을 통하여 어절별 중의성 해소 정보를 수정 및 보강하여 잘못된 품사 태깅 결과를 보정해준다. 이와 같이 통계 정보와 규칙 정보를 이용한 품사 태깅 시스템에 고빈도 중의성 어절에 대한 어절별 중의성 해소 정보를 이용함으로써 품사 태깅의 성능을 향상시킬 수 있었다.

  • PDF

Optimal solution search method by using modified local updating rule in Ant Colony System (개미군락시스템에서 수정된 지역 갱신 규칙을 이용한 최적해 탐색 기법)

  • Hong, Seok-Mi;Chung, Tae-Choong
    • Journal of the Korean Institute of Intelligent Systems
    • /
    • v.14 no.1
    • /
    • pp.15-19
    • /
    • 2004
  • Ant Colony System(ACS) is a meta heuristic approach based on biology in order to solve combinatorial optimization problem. It is based on the tracing action of real ants which accumulate pheromone on the passed path and uses as communication medium. In order to search the optimal path, ACS requires to explore various edges. In existing ACS, the local updating rule assigns the same pheromone to visited edge. In this paper, our local updating rule gives the pheromone according to the number of visiting times and the distance between visited cities. Our approach can have less local optima than existing ACS and find better solution by taking advantage of more informations during searching.

Discovery of Interesting Knowledge using Concept Hierarchy (개념 계층 이용 흥미로운 부분 데이터의 탐색)

  • 홍정희;김성민;남도원;이동하;이전영
    • Journal of Intelligence and Information Systems
    • /
    • v.6 no.2
    • /
    • pp.77-89
    • /
    • 2000
  • 개념 계층(Concept Hierarchy)은 데이터베이스 분야에서 사용되는 대표적인 배경 지식(Background Knowledge)으로써, 데이터베이스에 내재되어 있는 구조적인 정보, 데이터의 분포, 영역전문가 (Domain Expert)에 의해 주어지는 외부 지식 등이 반영되어 있다. 개념계층의 특성상 부모(parent)-자 식(child) 관계가 있는 두 노드가 있을 때, 한 노드의 값으로부터 다른 노드의 값을 추정할 수 있다 이 추정된 값을 기대치라고 하고, 한 노드의 값으로부터 추정된 기대치와 실제치가 상당히 상이한 값을 보이는 노드가 있을 때, 이를 흥미롭다(interesting)고 말할 수 있다. 그러나 아직까지 개념계층 상에서의 흥미로운 부분 탐색에 대한 연구가 없었으며, 흥미로움(interestingness)의 척도(measurement) 에 대한 연구로서는 신뢰도(confidence),리프트(lift),컨빅션(conviction)등이 있었다. 그러나 이런 흥미도 의 척도에 관한 연구도 연관규칙에 한정되어 이루어졌으므로 개념계층상의 데이터에 적용하기 위해 서는 약간의 수정 및 새로운 정의가 필요하다. 본 논문에서는 데이터의 특성에 따른 개념계층이 존재할 때, 이를 이용하여 기대치와 실제치가 상이한 흥미로운 부분을 발견하고자 하며, 이를 위하여 개념계층상에서의 흥미도의 척도를 제안하고 흥미로운 부분을 탐색하는 방법을 기술하고자 한다. 또한 데이터마이닝의 결과인 연관규칙을 개념 계층에 적용하여 연관규칙을 통해 얻어질 수 있는 기대치를, 지지도(support), 신뢰도(confidence), 리프트(lift), 컨빅션(conviction)등의 관계를 통해 다양한 방법으로 모색해본다. 이 연구에서 제안하는 이러한 개념계층상의 흥미로운 부분의 탐색은, 전자 상거래에서 CRM(Customer Relationship Management)나 틈새시장(niche market) 마케팅 등에 적용 가능하리라 여겨진다.

  • PDF

A Pragmatically-oriented Study of Focus and Intonation (억양과 초점에 관한 화용론적 연구)

  • Lee Yeong-kil
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • autumn
    • /
    • pp.379-382
    • /
    • 1999
  • 모든 문장에는 '새로운' 정보를 전달하기 위한 초점이 있고 높낮돋들림을 포함하는 초점범위는 다시 정보 초점을 필수 요소로 갖는 정보 구조 경계를 갖는다. 모호성이 없는 적절한 초점 구조를 결정하기 위해 '국어 초점 원리'를 도입함으로써 초점 성분의 영역이 확인되고 화맥에 의한 초점 해석이 가능해진다. 초점 성분을 설명하고 높낮돋들림과 초점 돋들림의 관계를 기술하는 '기본초점규칙'이 필요하며 '정보 구조 원리'에 의해 '새로운' 정보가 선택되어 초점 범위는 화맥에 의해 구체화된다. 정보 구조가 문법 체계의 모든 의미 계층과 관계를 가지며 정보 구조의 경계 안에 정보 초점으로 실현되는 초점 돋들림이 있게 되므로 기본 초점 규칙은 '초점 돋들림 원리'로 수정되어 초점 범위 내의 음절에 초점 돋들림이 할당된다.

  • PDF

Reusing AP Node in G-machine (G-machine 에서의 AP 노드 재사용)

  • Joo, Sung-Yong;Woo, Gyun
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2002.11c
    • /
    • pp.2329-2332
    • /
    • 2002
  • G-machine은 지연 함수형 언어를 효율적으로 구현하기 위한 추상기계이다. G-machine은 축약 과정에서 생성되는 그래프를 저장하기 위해서 많은 기억장소를 필요로 한다. 본 논문은 힙에 할당되는 그래프 노드 중 AP 노드를 재사용하는 방법을 제시한다. 일반적으로 AP 노드를 루트로 하는 그래프가 한 단계 축약된 후 다시 AP 노드를 루트로 하는 그래프로 구성되어지는 경우 루트 노드를 재사용할 수 있다. 이를 위해서는 기존 G-machine을 약간 확장 시켜야 하는데, 본 논문에서는 AP 노드의 일부를 변경하기 위한 명령어 UPDL과 UPDR을 제시하고, 이들 명령어의 상태변환 규칙과 이들 명령어 생성을 위해 수정된 R-변환 규칙을 제시한다. 본 논문에서 제시하는 방식으로 기 생성된 AP 노드를 재사용함으로써 힙 기억공간의 사용량을 줄일 수 있고, 이 과정에서 힙 기억장소 할당과 쓰기 연산의 수를 줄일 수 있다.

  • PDF

Nonlinear Approximation in High-Dimensional Spaces Using Tree-Structured Intelligent Systems (수목구조 지능시스템을 이용한 고차원 공간 위에서의 비선형 근사)

  • 길준민;정창호;강성훈;박주영;박대희
    • Journal of the Korean Institute of Intelligent Systems
    • /
    • v.6 no.3
    • /
    • pp.25-36
    • /
    • 1996
  • Conventional radial-basis-function networks and fuzzy systems have serious problems in dealing with the non1inea:r approximations on high-dimensional spaces due to the explosive increase of the number of hidden nodes or fuzzy IF-THEN rules. In order to avoid such problems, this paper proposes a tree-structured intelligent system in which semi-local basis functions form its basic elements, and develops a training algorithm for the proposed system based on the modified genetic algorithm and LMS rule. Theoretical analysis is performed on the approximation capability of the proposed system, together with experimental studies which demonstrate the effectiveness of the developed methodology.

  • PDF

포장과 법률 - 제품의포장재질.포장방법에관한기준등에관한규칙

  • (사)한국포장협회
    • The monthly packaging world
    • /
    • s.236
    • /
    • pp.103-115
    • /
    • 2012
  • 환경부는 제품의 포장재질 포장방법에 관한 기준 등에 관한 규칙(환경부령) 개정('13.7.1 시행 예정) 사항 반영 및 포장 방법 변경 다양화에 따른 현행 포장 측정방법을 개선 보완하고자 다음과 같이 개정안을 발표했다. 주요내용은 종합제품의 정의를 "같은 종류 또는 다른 종류의 최소 판매단위 제품을 2개 이상 함께 포장한 제품을 말한다"로 수정하고 비매품, 설명서 등 참조용 물품은 종합제품의 구성품에서 제외하는 단서를 신설(안 제2조제2호)하는 것과 종이 골판지 펄프몰드로 제조된 받침접시 또는 포장용 완충재 사용시 공간비율 5%를 가산해주던 조항 삭제(안 제4조제2항제1호, 안 제4조제2항제2호)안 등이 나타나 있다. 본 고에서는 주요 내용과 함께 신구조문을 비교해 살펴보도록 한다.

  • PDF