• 제목/요약/키워드: 온톨로지 검색

검색결과 472건 처리시간 0.033초

Non-First Normal Form에 입각한 eBook Annotation 온톨로지의 설계와 구현 (Design and Implementation of eBook Annotation Ontology Based on Non-First Normal Form)

  • 신성욱;김종석;임순범;최윤철
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2005년도 한국컴퓨터종합학술대회 논문집 Vol.32 No.1 (B)
    • /
    • pp.361-363
    • /
    • 2005
  • 본 연구에서는 온라인 다중 사용자 환경의 eBook 어노테이션 시스템 개발에서 데이터를 의미 기반으로 관리하고, 데이터에 대하여 상호 공통적인 이해를 표현하며, 그리고 데이터에 대한 무결성 검사 등을 지원하기 위해서 eBook 어노테이션 온톨로지를 구축하였다. eBook 어노테이션 테이터에 대한 상호 공통적인 이해의 표현을 위해서 한국 전자책 문서 표준인 EBKS(Electronic Book of Korea Standard)를 기반으로 구축 하였으며 구축된 온톨로지는 Conceptual Graph(CG)를 사용하여 표현하였다. 의미 기반의 처리를 위해서 본 온톨로지에서는 다국어(Multilingua) 관계를 고려하였으며 또한 오노테이션 데이터 생성 시 중요도를 표현하기 위해서 중요성 axiom을 고려했고, $NF^2$(Non-First Normal Form)에 입각하여 온톨로지를 설계함으로서 어노테이션 데이터의 검색에 활용도를 높였다. 제안된 온톨로지는 어노테이션 데이터의 재사용성을 높일 수 있고 의미 정보를 활용함으로써 eLearning, cyberclass과 같은 다중 사용자 환경에서 효과적인 협업을 가능하게 한다. 본 연구에서는 구현한 eBook annotation 시스템은 구축한 온톨로지를 사용함으로써 의미 기반의 데이터 관리가 가능하다. 또한 어노테이션 생성 시 온톨로지 구조를 모르더라도 어노테이션을 생성할 수 있는 인터페이스를 구현하였다.

  • PDF

한의 기초 온톨로지 기반 시맨틱 검색 시스템 (A Semantic Search System based on Basic Ontology of Traditional Korean Medicine)

  • 김상균;장현철;김진현;김철;예상준;송미영
    • 한국한의학연구원논문집
    • /
    • 제17권2호
    • /
    • pp.57-62
    • /
    • 2011
  • We in this paper propose a semantic search system using the basic ontology in Korean medicine field. The basic ontology provides a formalization of medicinal materials, formulas, and diseases of Korean medicine. Recently, many studies for the semantic search system have been proposed. However, they do not support the semantic search and reasoning in the domain of Korean medicine because they do not have the Korean medicine ontology. Our system provides the semantic search features of semantic keyword recommendation, associated information browsing, and ontology reasoning based on the basic ontology. In addition, they also have the features of ontology search of a form of table and graph, synonym search, and external Open API supports. The general search engines usually provide search results for the simple keyword, while our system can also provide the associated information with respect to search results by using ontology so that can recommend more exact results to users.

온톨로지를 이용한 일자리 데이터의 추론 해석 (Inference Interpretation of Job Data using Ontology)

  • 김광제;김정호
    • Journal of Platform Technology
    • /
    • 제10권3호
    • /
    • pp.69-78
    • /
    • 2022
  • 채용 플랫폼의 일자리 정보는 IT 기술의 발전과 함께 많은 산업 분야에서 대량의 데이터를 발생시키고 있으며 실시간 발생하는 비정형도가 높은 특징이 있다. 또한 일자리와 관련한 채용공고와 훈련정보 등은 4차 산업혁명 등 산업기술의 변화와 밀접한 관계가 있어 기술변화 및 발전을 이해하는데 높은 데이터 가치를 지니고 있다. 본 논문은 구인-구직과 관련된 정보들을 직관적으로 이해하고 활용하기 위해 관련된 데이터를 정의해 직무데이터 사전을 만들고, 공고-직무-훈련 등 데이터 간 연계와 추론을 할 수 있도록 온톨로지 모델링에 기반한 데이터맵을 설계·구축 및 평가를 수행하였다. 이를 통해 업무능력 중심의 추론 기능은 수요자 간 미스매치를 최소화하고 데이터사전 최적화로 사용자가 만족할 수 있는 QoS 지원이 가능함과 검색엔진 기반 구인-구직 시스템보다 성능이 우수함을 확인하였다.

Ontology를 이용한 이종 메타데이터 검색 시스템의 설계 및 구현 (A Design and Implementation of Heterogeneous Metadata Searching System using Ontology)

  • 최현종;김태영
    • 정보교육학회논문지
    • /
    • 제8권3호
    • /
    • pp.353-360
    • /
    • 2004
  • 웹은 이제 더 이상 무의미한 정보의 바다가 아니라, 의미있는 정보를 사용자에게 정확하게 전해줄 수 있는 새로운 Semantic Web 시대를 맞이하고 있다. 그 출발점이 XML과 메타데이터였다면 웹의 자원을 연결시켜 주는 RDF를 거쳐, 이제는 의미와 논리가 Ontology를 통해 자리 잡고 있다. 현재 국내의 많은 웹 교육 자료들이 한국교육학술정보원의 메타데이터형식(KEM)에 메타데이터가 구축되었다. 따라서 우리나라도 이제는 의미와 논리의 형식을 연구해야 될 시기가 되었다. 하지만, 국내의 많은 연구자들은 KEM보다 DublinCore의 DC와 SCORM의 LOM의 연구에 더 적극적이다. 따라서 현재는 의미와 추론의 연구보다 세 개의 서로 다른 메타데이터를 엮어서로 공유하고 통합할 수 있는 방법의 연구가 선행되어져야 한다. 이에 본 연구는 세 메타데이터 형식을 통합해주는 Ontology를 설계해 보고, 프로토타입 검색 시스템을 구현해 보았다. 연구 결과 세 메타데이터의 많은 요소들이 서로 같은 요소 이름과 의미를 가지고 있었고, 몇 개의 요소들은 서로 같은 의미이지만 다른 요소 이름을 가지고 있었다. Ontology를 설계할 때 이렇게 동일한 의미를 가진 다른 이름의 요소들은 일대일 매핑 기법을 적용하여 설계하였다. 본 연구에서 설계한 Ontology가 세 가지 다른 형식의 메타데이터를 통합하는 통합 스키마로 활용될 수 있음을 확인하였다. 더불어 검색 결과를 좀 더 다양하게 동의, 반의, 계층, 연관 관계까지 제공하기 위해서는 좀 더 정교한 속성 설계가 필요하였다.

  • PDF

관계 데이터 모델 기반 라이프로그 관리 시스템과 그 응용 (A Lifelog Management System Based on the Relational Data Model and its Applications)

  • 송인철;이유원;김현규;김항규;함덕민;김명호
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제15권9호
    • /
    • pp.637-648
    • /
    • 2009
  • 하드 디스크 저장 매체의 가격이 하락함에 따라 가까운 시일 안에 개인 컴퓨터에 1TB가 넘는 하드 디스크가 기본으로 장착될 것으로 예상된다. 한 사람이 한 달에 1GB의 데이터를 저장한다고 가정하면 대략 1TB면 그 사람의 일생 동안에 걸친 데이터를 저장할 수 있다. 이에 따라 개인이 일상 생활에서 보고들은 것을 기록한 라이프로그(lifelog)를 효과적으로 관리하는 라이프로그 관리에 대한 연구가 활발히 이루어지고 있다. 지금까지 관계 데이터 모델 기반, 온톨로지 기반, 파일 시스템 기반 라이프로그 관리 시스템(LMS: Lifelog Management System) 등 다양한 LMS들이 제안되었지만, 관계 데이터 모델 기반 LMS는 질의 처리 성능이 뛰어난 반면 복잡한 질의를 잘 처리하지 못하고 온톨로지 기반 LMS는 복잡한 질의를 처리할 수 있는 반면 질의 처리 성능이 떨어지며 파일 기반 LMS는 질의만 지원하는 등 저마다 장단점을 가진다. 또한 이들 시스템들은 라이프로그 그룹을 효과적으로 관리하기 위한 기능을 제공하지 못하고 있고 효과적인 검색을 위해 라이프로그의 태그(데타데이터)를 수정하거나 새로운 태그를 추가하기 위한 편리한 인터페이스를 제공하지 못하고 있다. 본 논문에서는 이러한 문제점들을 해결하기 위해 관계 데이터 모델 기반 라이프로그 관리 시스템을 제안한다. 제안하는 시스템은 라이프로그를 관계 데이터 모델로 모델링하고 사용자 질의를 SQL로 변환해 처리함으로써 질의 처리 성능이 뛰어나다. 또한 복잡한 질의를 잘 처리하지 못하는 관계 데이터 모델 기반 LMS의 단점을 보완하기 위해 찾으려는 라이프로그와 직접적으로 관련 있는 라이프로그에 대한 정보에 기반해 라이프로그를 검색하는 단순화된 관계 질의를 지원한다. 이와 더불어, 제안하는 시스템은 라이프로그 그룹 생성, 편집, 검색, 플레이 및 공유 기능을 제공함으로써 라이프로그 그룹에 대한 효과적인 관리를 지원한다. 마지막으로 제안하는 LMS에서 제공하는 라이프로그 태깅 도구는 태그 추상화를 통해 여러 종류의 태그를 손쉽게 수정하거나 추가할 수 있는 기능을 제공한다. 본 논문에서는 제안하는 시스템의 설계 및 구현을 설명하고 이 시스템을 활용한 다양한 응용을 소개한다.

디지털 아카이브즈의 문제점과 방향 - 문화원형 콘텐츠를 중심으로 - (Digital Archives of Cultural Archetype Contents: Its Problems and Direction)

  • 함한희;박순철
    • 한국비블리아학회지
    • /
    • 제17권2호
    • /
    • pp.23-42
    • /
    • 2006
  • 본고는 문화원형콘텐츠를 유통시키고 있는 문화콘텐츠닷컴의 디지털아카이브 시스템에 주목해서 문제점을 분석하고 대안을 제시하는 것이 목적이다. 문화원형콘텐츠는 전통문화와 컴퓨터기술을 접목시켜 개척한 새로운 분야이다. 정부에서는 이 산업을 육성해서 한국문화의 세계화와 국가 경쟁력을 강화시킬 의도를 가지고 있다. 우리나라의 역사와 전통 풍물 생활 전승 예술 지리지 등 다양한 분야의 문화원형을 디지털 콘텐츠화하여 문화산업에 필요한 창작소재로 제공하는 것이 그 핵심내용이다. 아울러 디지털 콘텐츠 유통체계 정립과 저작권 관리를 통해서 공공부문 문화콘텐츠의 산업적 활용도를 제고하려는 의도도 포함된다. 본고에서 다루는 대상자료는 현재 문화콘텐츠닷컴에서 유통, 관리되고 있는 문화원형콘텐츠들이다. 이 성과물들은 2002년부터 2005년까지 개발되어서 문화콘텐츠닷컴 DB에 구축되어 있다. 이 자료들을 통해서 현재의 디지털아카이브 시스템의 문제점을 분석하였고, 현재의 시스템이 안고 있는 한계점을 요약하면 다음과 같다. 첫째는 각 자료에서 사용하는 주요 용어의 선택에 따라 유사한 자료들이 서로 다른 주제로 분류되면서 다른 항목에 속하게 되는 것이다. 둘째는, 따라서 서로 다른 항목 간에 교차검색이 이루어지지 않는 한계점이 있다. 현재의 제 문제를 해결할 수 있는 방법으로 본고에서는 온톨로지 기능을 포함한 데이터마이닝시스템을 이용해서 풍부한 지식정보표현과 활용이 가능한 디지털아카이브 시스템을 제안하고 있다. 데이터마이닝은 다섯 가지의 방법으로 가능하다. 의미검색 문서요약 문서클러스터링 문서분류 그리고 주제추적이다. 최근에 빠르게 개발되고 있는 디지털 신기술도 인문학과 긴밀하게 연결되지 않으면, 그 활용도가 제한적이라는 점을 본고를 통해서 지적하였다. 창작소재로서의 문화원형콘텐츠의 활용도를 크게 향상시킬 수 있는 길은 바로 신지식관리를 위한 통학적(uni-discipline) 접근이라는 점을 일깨우고자 한다.

효과적인 지식확장을 위한 LOD 클라우드에서의 변화수용적 심층검색 (Change Acceptable In-Depth Searching in LOD Cloud for Efficient Knowledge Expansion)

  • 김광민;손용락
    • 지능정보연구
    • /
    • 제24권2호
    • /
    • pp.171-193
    • /
    • 2018
  • 본 연구는 시멘틱 웹의 실질적 구현체인 LOD 클라우드에서 연결정책을 활용함으로써 LOD들간 연결을 효과적으로 제공하고 LOD의 변경된 내용을 검색결과에 빠짐없이 반영할 수 있는 방안을 제시한다. 현재 LOD 클라우드에서는 개체간 연결은 를 이용하여 개체들이 동일함을 명시적으로 기술하는 방식으로 이루어져 있다. 하지만, 이러한 명시적 연결방식은 LOD 클라우드 규모의 방대함에도 불구하고 개체간 동일성을 개체단위에서 파악하여야 하는 어려움이 있으며 주기적으로 LOD에 추가하여야 함에 따라 검색 시 개체들이 누락되는 한계가 있다. 이를 극복하기 위하여 본 연구에서는 명시적 연결을 생성하는 대신 LOD별로 연결하고자 하는 LOD와의 연결정책을 수립하여 LOD와 함께 공개하는 방식을 제안한다. 연결정책을 활용함으로써 연결하여야 할 동일개체를 검색시점에서 파악할 수 있으므로 추가되었던 개체들을 누락됨 없이 검색결과에 포함시킬 수 있고 LOD 클라우드에서의 연결성도 효과적으로 확충할 수 있다. 확충된 연결성은 정보의 지능적 처리의 선행과정인 지식확장의 근간이 된다. 연결정책은 연결하고자 하는 소스와 타겟 LOD의 주어 개체들간의 동일성을 평가하는데 도움이 되는 술어 쌍을 명세하는 방식으로 수립하며 검색 시 이러한 술어쌍에 대응하는 RDF 트리플을 검색하고 이들의 목적어들이 충분히 동일한 것인가를 평가하여 주어개체들의 동일수준을 판단한다. 본 연구에서는 이러한 연결정책을 이용하여 여러 LOD들을 심층적으로 검색하는 시스템을 구현하였다. 검색과정에서는 기존 명시적 연결들도 함께 활용하도록 구현하였다. 검색시스템에 대한 실험은 DBpedia의 주요 LOD들을 대상으로 진행하였다. 실험결과 연결대상 개체들의 목적어들이 0.8 ~ 0.9의 유사수준을 가지는 경우 적정한 확장성을 가지고 충분히 신뢰적인 개체들을 적절하게 포함하는 것으로 확인하였다. 또한, 개체들은 8개 이상의 동일연결을 제공하여야 검색결과가 신뢰적으로 활용될 수 있을 것으로 파악되었다.

클라우드 컴퓨팅 환경에서의 대용량 RDFS 추론을 위한 분산 테이블 조인 기법 (Distributed Table Join for Scalable RDFS Reasoning on Cloud Computing Environment)

  • 이완곤;김제민;박영택
    • 정보과학회 논문지
    • /
    • 제41권9호
    • /
    • pp.674-685
    • /
    • 2014
  • 지식 서비스 시스템이 효과적인 서비스를 제공하기 위해서는, 명시된 지식을 바탕으로 새로운 지식을 추론 할 수 있어야 한다. 대부분 지식 서비스 시스템은 온톨로지로 지식을 표현한다. 실 세계의 지식 정보의 양은 점점 방대해지고 있으며, 따라서 대용량 온톨로지를 효과적으로 추론하는 기법이 요구되고 있다. 본 논문은 클라우드 컴퓨팅 환경을 기반으로 대용량 온톨로지를 RDFS수준으로 추론하기 위한 분산 테이블 조인 방법을 제안하고, 성능을 평가한다. 본 논문에서 제안하는 RDFS 추론은 분산 파일 시스템 환경에서 RDFS 메타 테이블을 기반으로 맵-리듀스를 적용한 방식과, 맵-리듀스를 사용하지 않고 클라우드 컴퓨터의 메모리만 사용한 방식에 초점을 맞추었다. 따라서 본 논문에서는 제안하는 각 기법에 대한 추론 시스템 구조와 RDFS 추론 규칙에 따른 메타 테이블 설계 및 추론 전략 알고리즘에 대해서 중점적으로 설명한다. 제안하는 기법의 효율성을 검증하기 위해 온톨로지 추론과 검색 속도를 평가하는 공식 데이터인 LUBM1000부터 LUBM6000을 대상으로 실험을 수행 하였다. 가장 큰 LUBM6000(8억 6천만 트리플)의 경우, 메타 테이블 기반의 RDFS 추론 기법은 전체 추론 시간이 13.75분(초당 1,042 트리플 추론) 소요된 반면, 클라우드 컴퓨터의 메모리를 적용한 방식은 7.24분(초당 1,979 트리플 추론)이 소모되어 약 2배정도 빠른 추론 속도를 보였다.

저자명 모호성 해결을 위한 개념망 기반 카테고리 유틸리티 (WordNet-Based Category Utility Approach for Author Name Disambiguation)

  • 김제민;박영택
    • 정보처리학회논문지B
    • /
    • 제16B권3호
    • /
    • pp.225-232
    • /
    • 2009
  • 동명이인의 저자를 구분하는 것은 웹에서 문서 색인과 검색의 성능을 향상시킨다. 동명이인의 저자 구분은 웹사이트 상에서 같은 이름을 갖는 여러 명의 사람이 존재했을 때 야기되는 여러 가지 문제점을 해결한다. 본 논문은 동명이인의 저자 구분을 위해 개념망 기반의 카테고리 유틸리티를 제안한다. 따라서 본 논문에서는 학술회의 웹 사이트를 대상으로 제안하고자 하는 방법을 설명한다. 제안된 방법은 저자가 가지고 있는 다양한 속성(제목, 요약, 공동저자, 소속)을 반영한 저자 온톨로지와 개념망을 활용한다. 저자 온톨로지는 OWL API와 휴리스틱한 방법을 사용하여 반자동으로 구축 되었다. 저자명 모호성 해결은 개념망 기반 카테고리 유틸리티를 사용하여 저자 온톨로지 내에 존재하는 동명이인 저자(Candidate Authors)들로부터 해당 논문에 관련된 정확한 저자를 결정한다. 카테고리 유틸리티는 각각의 저자간의 intra-class 유사성 와 inter-class 비유사성을 기본적인 개념으로 하는 평가 함수다. 이에 비해 개념망 기반 카테고리 유틸리티는 모호성 해결을 위해 개념망이 갖는 개념 정보를 추가로 활용한다. 실험 결과를 분석한 결과 개념망 기반 카테고리 유틸리티가 일반적인 카테고리 유틸리티에 비교해서, 저자명 모호성 해결에 있어서 10% 정도 우수한 성능을 보였으며, 전체적으로 98%의 정확도를 보였다.

이동 객체의 효과적 표현을 위한 시맨틱 어노테이션 방법 (A Semantic Annotation Method for Efficient Representation of Moving Objects)

  • 이진활;홍명덕;이기성;정진국;조근식
    • 한국컴퓨터정보학회논문지
    • /
    • 제16권7호
    • /
    • pp.67-76
    • /
    • 2011
  • 최근 비디오가 대화형 콘텐츠를 위한 타입으로 많은 각광을 받기 시작하면서 비디오 데이터에 포함된 객체들을 의미적으로 표현하고 검색하기 위한 시맨틱 어노테이션 방법에 대한 연구가 활발히 진행되고 있다. 비디오 데이터에 포함된 객체들은 시간의 변화에 따라 공간적 위치가 변화하기 때문에 매 프레임마다 상이한 위치 데이터가 발생한다. 따라서 모든 프레임의 객체에 대한 위치 데이터들을 저장하는 것은 매우 비효율적이므로 이를 부적절한 오차가 발생하지 않는 범위 내에서, 효과적으로 압축하여 표현할 필요가 있다. 본 논문은 컴퓨터 또는 에이전트가 직관적으로 객체에 대한 정보를 이해할 수 있도록 표현하기 위해 비디오 데이터가 포함하는 객체에 대하여 의미적 정보를 부여하기 위한 온톨로지 모델링 방법과 이동 객체의 위치 데이터를 압축하기 위해 3차 스플라인 보간법을 적용하여 의미적 정보와 함께 어노테이션 하는 방법을 제안한다. 제안한 어노테이션 방법의 효율을 검증하기 위한 대화형 비디오 시스템을 구현하고, 다양한 특징을 가지는 객체가 나타나는 비디오 데이터 셋을 이용하여 샘플링 간격에 따른 오차율과 데이터량을 비교하였다. 그 결과, 샘플링 간격이 15프레임 이하 일 때, 최대 80%의 데이터 저장 공간을 절약할 수 있을 뿐만 아니라 객체의 실제 좌표 대비 최대 31픽셀, 평균 4픽셀 미만의 오차 편차를 얻을 수 있었다.