• 제목/요약/키워드: 구조 정보 표현

Search Result 2,201, Processing Time 0.035 seconds

Automatic Structuralization of Thesaurus (시소러스 자동 구조화)

  • 김해수;이남경;이원규
    • Proceedings of the Korean Society for Information Management Conference
    • /
    • 1994.12a
    • /
    • pp.97-100
    • /
    • 1994
  • 정보과학 분야에서 필요로 하는 의미해석 기술 개발에 중요한 역할을 하는 것이 시소러스이다. 정확한 관계 정의 및 대량정보 수용의 필요성은 시소러스 구축의 커다란 장애 요인이다. 시소러스 구축에은 다방면의 전문지식 활용과 막대한 비용 및 시간 투자가 요구된다. 기계적으로 관리 운영이 가능한 시소러스내의 관계는 BT, NT로 표현되는 계층관계와 USE, UF로 표현되는 등가관계로 이루어 진다. 본 연구는 개념적인 관계를 정의하는 두 관계를 기계적으로 추출하고, 기존의 평면적인 시소러스 구조를 실세계의 정보 구조에 적합하게 조직화하여 시소러스 구축에 있어서의 문제점을 개선하는데 그 목적이 있다. 제시되는 알고리즘은 단일 언어내의 시소러스 구축 뿐만 아니라, 구축된 시소러스들의 융합 및 다국어 시소러스 구축에도 적용된다.

  • PDF

Regular Expression Matching Processor Architecture Supporting Character Class Matching (문자클래스 매칭을 지원하는 정규표현식 매칭 프로세서 구조)

  • Yun, SangKyun
    • Journal of KIISE
    • /
    • v.42 no.10
    • /
    • pp.1280-1285
    • /
    • 2015
  • Many hardware-based regular expression matching architectures are proposed for high performance matching. In particular, regular expression processors such as ReCPU and SMPU perform pattern matching in a similar approach to that used in general purpose processors, which provide the flexibility when updating patterns. However, these processors are inefficient in performing class matching since they do not provide character class matching capabilities. This paper proposes an instruction set and architecture of a regular expression matching processor, which can support character class matching. The proposed processor can efficiently perform character class matching since it includes character class, character range, and negated character class matching capabilities.

The Simplification of Web Sites Representation with the EMFG (EMFG를 이용한 웹사이트 표현의 간략화)

  • Yeo Jeong Mo;An Jeong Suk
    • The KIPS Transactions:PartD
    • /
    • v.12D no.2 s.98
    • /
    • pp.327-334
    • /
    • 2005
  • The representation of Web Sites with EMFG(Extended Mark Flow Graph) is studied as a new method that represents the complicated Web Sites structure. The Web Sites usually have the number of iteration structures. The representation of these Web Sites with EMFG is too complicated, and so we can not understand the structure of these Web Sites sometimes. Therefore, in this paper, we classify these iteration structures when express Web Sites by EMFG as serial iteration structures and parallel iteration structures and propose the method that can simplify these iteration structures. Then we can reduce number of boxes, arcs, and transitions, and efficiently design and manage Web Sites by using this method.

MPEG-7 Content-Based Retrieval System using XML (XML을 이용한 MPEG-7 내용기반 검색 시스템)

  • 조철범;박만곤
    • Proceedings of the Korea Multimedia Society Conference
    • /
    • 2004.05a
    • /
    • pp.632-635
    • /
    • 2004
  • 디지털 정보기술의 급속한 발전과 고속 네트워크의 보급으로 멀티미디어 데이터가 급격하게 늘어나고 있다. 이러한 데이터들을 빠르고 정확하게 검색하기 위하여 가장 중요한 기반이 되는 것이 데이터의 적절한 표현이다. 최근 최종화 단계를 거친 MPEG-7은 멀티미디어 데이터에 대한 구조화 및 의미 정보를 제공함으로써 효율적인 검색과 필터링을 가능하게 하는 멀티미디어 데이터의 표현에 대한 표준화를 다루고 있다. 본논문에서는 MPEG-7의 표준화와 내용기반 검색 시스템을 소개하고 MPEG-7의 비주얼 기술자를 내용 정보 간의 상호 연관성을 표현하기에 적합한 XML로 구조화 하여 효과 적인 검색이 가능한 내용기반 검색 시스템을 제안한다.

  • PDF

Semantic-Based Label Lists Represented Information Extraction from Tree Data (트리 구조 데이터의 의미 기반 라벨 리스트 표현 정보 추출)

  • Paik, Juryon
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2020.07a
    • /
    • pp.27-28
    • /
    • 2020
  • 이형 데이터 간의 정보 전송과 교환을 가능하게 하는 유연한 트리 구조의 특성은 인터넷 및 IoT 환경에서의 대량 데이터 저장·전송·교환 등에 있어서 XML이나 JSON에서 주요하게 사용된다. 사용성에 있어서는 수월한 반면에, 감추어져 있는 가치있는 정보들을 트리 구조의 대량 데이터들로부터 찾아내는 것은 일반 단순 구조의 데이터에 비해서 훨씬 어려우며 복잡하고 난해한 문제들을 발생시킨다. 이는 트리가 갖는 계층 구조 때문이다. 본 논문에서는 계층 구조를 갖는 대량 트리 데이터들을 보다 단순한 리스트 구조로 변형한 후 해당 구조로부터 가장 자주 발생하는 유용한 정보들을 추출하는 방법을 제시한다.

  • PDF

Automatic Acquisition of Ranked IS-A Relation from Unstructured Text (텍스트에서 IS-A 관계의 자동 추출 및 순위화)

  • Ryu, Pum-Mo;Choi, Key-Sun
    • Annual Conference on Human and Language Technology
    • /
    • 2007.10a
    • /
    • pp.150-157
    • /
    • 2007
  • 본 논문에서는 의존 구조 매칭과 약한 지도식 학습 방법을 적용하여 텍스트에서 IS-A 관계를 자동으로 추출하고 순위화하는 방법을 제안한다. 텍스트에서 잠재적인 IS-A 관계를 표현하는 [관계 표현, 하위어, 상위어]의 삼진관계 리스트를 추출하고, 관계 표현과 IS-A 관계 인스턴스, IS-A 관계 후보, 사이의 상호 관련성을 이용하여 각각의 점수를 반복적으로 정제한다. 제안한 방법의 대표적인 특징은 다음과 같다. 1) 의존 구조에 기반한 패턴 매칭 방법을 적용하여 정규 표현에 기반한 방법보다 다양한 형태의 삼진관계를 추출할 수 있고, 2) 도메인 코퍼스에서 통계적으로 추출한 어휘 사이의 관련성 정보를 이용하여 도메인에 적합한 IS-A 관계 인스턴스의 순위를 높일 수 있으며, 3) 관계 표현과 관계 인스턴스의 점수를 상호 관련성에 기반한 방법으로 반복적으로 점수화하여 IS-A 관계 인스턴스 사이의 변별력을 높일 수 있다. 실험에서 순위화된 관계 인스턴스는 전문가의 판단과 66%이상 일치함을 보였고, 의존 구조를 이용한 유연한 패턴 매칭 방법은 정규표현을 이용한 방법보다 43.6%의 추가적인 삼진관계를 추출하였다.

  • PDF

통합지식표현에 의한 자연언어처리기법 : 한글 구 구조문법

  • Jeong, Hui-Seong
    • ETRI Journal
    • /
    • v.11 no.1
    • /
    • pp.59-74
    • /
    • 1989
  • 컴퓨터에 의한 종래의 자연언어처리에서는 보통 생성과 인식과정에서 서로 다른 지식 표현과 프로그램을 쓰고, 음운처리, 형태처리, 통어처리, 의미처리로 분리되어 있는 것이 통례이다. 이것을 분할접근법(devide and conguer approach)이라 부른다. 분할접근법은 인간의 언어처리에 있어서의 생성, 인식간의 체계적 관계를 포착하지 못할 뿐 아니라 공학적으로도 갖가지의 문제를 안고 있다. 이 논문은 인간의 언어 생성과 인식과정의 관계를 설명하기 위하여 동일 심적 프로그램이 생성과정과 인식과정을 동시에 제어하고 있다는 가설에 선다. 이 가설을 취하는 것은 생성과 인식의 프로그램과 문법을 각각 통합하고 음운처리, 형태처리, 통어처리, 의미처리를 동시에 행해야 한다는 것을 의미한다. 이것을 통합접근법(unifying approach)이라 부른다. 통합 접근법은 예를 들어 구 구조문법 (Pharase Structure Grammar)과 단일화 (unification)에 의해서 실현할 수 있다. 구 구조 문법을 이용하여 음운정보, 형태정보, 구문정보, 의미정보를 동일의 구조중에 표현할 수 있고 그 위에 이들의 정보표현을 모두 단일화에 의해 동시에 처리할 수 있다. 단일화는 입출력의 방향을 제한하지 않으므로 생성.인식 양쪽의 문법을 얻을 수 있다. 또 단일화되는 패턴에 충족 가능한 조건을 부여함에 따라 패턴에 다양한 정보를 갖게 할 수 있으므로 처리상의 일반성을 파악할 수 있으며 처리 효율을 확보할 수 있다. 이 논문에서는 통합접근법을 도입한 한글기술문법 : KPSG(Korean Phrase Structure Grammer)의 선진성에 대해서 논의하고 있다.

  • PDF

The Design of Storage Structure for Path Expressions in RDF and RDF Schema (경로 정보를 이용한 RDF와 RDF 스키마의 저장 구조 설계)

  • Kim Youn Hee;Kim Byung Gon;Lee Jaeho;Lim Hae Chull
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2005.07b
    • /
    • pp.217-219
    • /
    • 2005
  • 정보의 단순한 연결을 표현하는 현재 웹 환경의 한계를 보완하기 위해 차세대 웹으로서 평가되고 있는 시맨틱 웹에서는 정보 리소스의 의미와 개념적 관계를 정의하는 메타데이터와 온톨로지의 역할이 무엇보다 중요시되고 있다. 따라서 RDF와 RDF 스키마와 같은 표준 언어로써 표현되는 메타데이터와 온톨로지의 효과적인 저장과 검색의 방법이 필요하다. RDF와 RDF 스키마는 그래프 모델로서 표현이 가능하고 다양한 질의의 형태가 그래프 형태에서 추출 가능한 경로 형식으로 표현들 수 있기 때문에 보다 효율적인 질의 처리를 위해서는 경로 정보의 저장에 대한 연구가 필요하다. 따라서 본 논문에서는 관계형 데이터베이스를 기반으로 RDF와 RDF 스키마의 기본적인 정보와 특정 클래스, 프로퍼티, 리소스로 시작하는 경로 정보를 함께 저장할 수 있는 저장 구조를 제안한다.

  • PDF

A Heterogeneity Resolution of XML DTD Using MDR (MDR을 이용한 XML DTD 이질성 해결 기법)

  • 김진관;김중일;최오훈;백두권
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2002.10c
    • /
    • pp.67-69
    • /
    • 2002
  • 정보통신기술의 급속한 발달과 인터넷 환경의 급속한 확산에 따라 정보통신 시스템의 통합과 다양한 분야의 정보통신 시스템 사이의 정보공유가 필수적이다. 그러나 정보통신 시스템의 통합과 정보공유의 가장 큰 걸림돌은 시스템의 통합 메커니즘 문제뿐만 아니라, 데이터의 의미(semantic), 구조(structure), 표현(representation)의 불일치이다. MDR은 정의된 표준 요소와의 매칭을 통해 데이터의 의미와 표현에 관한 이질성 문제를 해결할 수 있도록 해주며, XML은 메타데이터 레지스트리(Metadata Registry, MDR)에서 제공하지 않는 구조화된 데이터에 대한 표현 방법을 제공한다. 본 논문에서는 분야별 종적 데이터 공유를 위한 데이터의 의미, 구조, 표현의 이질성에 따른 문제를 분류하고, MDR과 XML의 활용을 통해 그 해결 방안을 제시한다.

  • PDF

A Study on the Conceptualization of Information Resources for Localities Based on the FRBRoo/CIDOC CRM (FRBRoo/CIDOC CRM 기반의 로컬리티 정보자원 구조화 연구)

  • Hyun, Moonsoo
    • Journal of the Korean BIBLIA Society for library and Information Science
    • /
    • v.25 no.4
    • /
    • pp.265-290
    • /
    • 2014
  • The aim of the study is to examine the applicability of FRBRoo / CIDOC CRM to conceptualize information resources for localities. It attemps to establish the conceptual structure and the relationship of them and seeks ways to apply the model. For this purpose, almost 30 articles specially in localities research were analysed and categories of information resources for localities were identified. After examining conceptual model in cultural information management sectors (library, museum, archive), 6 case of conceptualization were attempted based on FRBRoo / CIDOC CRM. In conclusion, it presented that FRBRoo / CIDOC CRM could be applied to various type of information resources for localities and that it could be possible to represent information resources based on particular space(place, local) through the conceptualization.