• 제목/요약/키워드: 온톨로지 검색

검색결과 472건 처리시간 0.027초

시맨틱 기술 개발을 지원하기 위한 Open API (Opne API for semantic technology)

  • 박정원;남세진;최기선
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2009년도 제21회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.111-115
    • /
    • 2009
  • 현재 Open API는 프로그램 개발 및 정보의 제공 등 다양한 방향에서 많이 활용 되고 있다. Open API는 개발된 기술을 웹으로 공개하여 네트워크가 연결된 곳이라면 어디서든지 그 기술을 활용할 수 있다. 잘 개발된 Open API는 매쉬업을 통해 또 다른 기술과 합쳐 새로운 서비스를 개발하는 등 그 활용빈도가 높다. 이미 개발된 기술을 활용할 수 있어서 개발 속도가 단축되고 새로운 서비스를 개발하면서 기존의 부족한 부분을 합쳐 더욱 창의적인 정보 제공이 가능하다. 이러한 Open API의 특성을 이용하여 시맨틱 기술 개발을 지원할 수 있으며, 개발 시간 단축 및 관계 설정, 온톨로지 제공 등을 네트워크를 통해 사용자들에게 제공하고 활용할 수 있는 방법을 제시한다. 시맨틱 기술은 사람이 글을 읽고 의미를 이해하는 것처럼 컴퓨터가 이해할 수 있는 언어와 규칙들을 정해 놓아 컴퓨터 사이의 의사소통을 가능하게 하는 지능형 기술이다. 이런 시맨틱 기술 개발을 지원하기 위하여 Open API를 통해 온톨로지의 개념 및 속성, 관계 설정, 코퍼스 등을 제공하기 하기 위해 CoreOnto API라는 것을 구축했다. CoreOnto API는 네트워크에서 사용할 수 있는 Open API로 세가지의 큰 형태의 Open API를 제공하고 있다. 첫 번째, 온톨로지에 대한 클래스, 속성, 관계를 제공하는 APIs, 두 번째, 트리플(두개의 용어가 어떤 관계인지를 표현한 형태로 구성(용어1, 관계, 용어2)) 생성 및 구축된 트리플을 검색할 수 APIs, 세 번째, 온톨로지를 생성하기 위해 필요한 자원(온톨로지 명, 개체명, 관계, 코퍼스 등)을 제공하는 APIs로 구성했다. 이상과 같이 시맨틱 기술 개발을 지원하기 위한 큰 형태의 세 가지 APIs를 구축하는 방법과 APIs의 활용, 그리고 서비스를 테스트한 결과를 제시한다.

  • PDF

역량 온톨로지 기반 교육 콘텐츠 검색 시스템 (The educational contents recommendation system using the competency ontology)

  • 이윤수;장병철;강현상;차재혁
    • 디지털콘텐츠학회 논문지
    • /
    • 제11권4호
    • /
    • pp.487-494
    • /
    • 2010
  • 최근 교육에서 대두 되고 있는 중요한 문제는 학습자 중심의 맞춤형 교육이 이루어져야 한다는 것이다. 이러한 요구를 만족 시킬 수 있는 방법 중 하나는 학습자의 역량을 고려하여 학습을 진행하는 것이다. 이를 위해서는 학습자가 가진 역량에 따라 학습자의 목표를 이루기에 부족하다고 판단된 역량을 효율적으로 개발할 수 있는 콘텐츠를 추천하는 방법이 필수적이다. 우리는 임의의 학습자에 대한 역량 정보와 목표를 LIP 또는 ePortfolio 형식을 통해 제공하는 학습자 정보 시스템이 존재한다고 가정한다. 본 논문은 많은 교육 콘텐츠들이 존재할 때 위 역량 평가 시스템으로부터 얻어진 학습자의 역량 및 목표와 역량 맵을 확장한 역량 온톨로지를 활용하여 각 학습자에 가장 적합한 콘텐츠를 추천하는 시스템을 제안한다. 이 시스템은 역량 온톨로지와 도메인 온톨로지를 활용하여 역량 맵과 역량 정의가 지속적으로 변하더라도 유연하게 이에 대처할 수 있다.

PHR 기반 개인 맞춤형 건강정보 탐사 알고리즘 설계 (Design of knowledge search algorithm for PHR based personalized health information system)

  • 신문선
    • 디지털융복합연구
    • /
    • 제15권4호
    • /
    • pp.191-198
    • /
    • 2017
  • PHR(Personal Health Record)기반 헬스케어 서비스 플랫폼 지능화를 위해서는 사용자 맞춤형 건강정보 제공서비스가 필요하다. 본 논문에서는 개인 맞춤형 건강정보 추천을 위해서 온톨로지 기반 건강 정보 모델을 제안하였다. 또한 기계학습과 데이터마이닝 기법을 적용한 유사 건강정보 탐사 알고리즘을 설계하였다. 기존의 데이터마이닝 기법중 연관규칙 알고리즘을 확장하여 속성을 기반으로 연관규칙 탐사를 수행하여 지식탐사의 연관성을 높이고 효율적인 탐사시간을 제공할 수 있도록 하였다. 머신러닝의 한 기법인 K근접이웃 알고리즘을 적용하여 사용자 프로파일별 그룹화를 수행하고 유사패턴의 사용자 프로파일을 검색할 수 있도록 하였다. 이는 사용자의 질환과 건강상태에 따른 맞춤형 건강정보 탐사 수행의 효율성을 높인다. 제안된 알고리즘은 개인 맞춤형 헬스케어 서비스 플랫폼에서 추론과정에 적용되어 사용자에게 개인맞춤형건강정보를 추천하는 것을 가능하게 한다. 이는 고령화사회에서 스마트한 자가 건강관리에 활용될 수 있다.

분산시각 미디어 검색 프레임워크의 성능향상을 위한 브로커 서버 우선순위를 이용한 라운드 로빈 스케줄링 기법 (A Scheduling Algorithm using The Priority of Broker for Improving The Performance of Semantic Web-based Visual Media Retrieval Framework)

  • 심준용;원재훈;김세창;김정선
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제35권1호
    • /
    • pp.22-32
    • /
    • 2008
  • 기존의 Ontology를 이용한 이미지 검색 시스템이나 메타데이타 기반의 분산 이미지 검색 시스템들의 단점들을 극복하기 위해 이미지 제공자들의 자율성을 보장하면서, Semantic 기반의 이미지 검색을 지원하는 분산 시각미디어 검색 프레임워크인 HERMES(The Retrieval Framework for Visual Media Service)가 제안되었다. 제안된 프레임워크에서는 서비스를 사용하는 다수 사용자들이 Broker서버에 동시에 접속했을 경우 발생하는 Overhead에 대한 문제를 해결 할 수 없었기 때문에 성능의 저하와 확장성을 고려할 수 없는 문제를 안고 있다. 본 논문에서는 다수의 동시 사용자들이 접속했을 경우에도 성능의 저하 없이 비슷한 수준의 서비스를 제공하기 위해서 Broker서버를 증설하여 Monitoring System으로부터 각각의 Broker 내부 컴포넌트의 수행시간을 측정하여 저장하고, 저장된 데이타에 대하여 각 Broker들에 대한 우선순위를 결정하는 테이블을 작성한다. 사용자로부터 Query를 입력받는 User Interface는 Broker의 Ranking Table을 참조하여 다수의 Query 수행을 여러 서버로 분산처리하게 함으로써 성능에 대한 신뢰성을 향상시킬 수 있는 Load Balancing 시스템을 제안한다. 또한 기존의 방식들과 비교실험을 통하여 제안하는 Load Balancing 시스템의 스케줄링 기법이 빠르다는 것을 보여준다.

시맨틱 웹 기반 국방무기 다차원 정보 분석 시스템 (Semantic Web based Multi-Dimensional Information Analysis System on the National Defense Weapons)

  • 최중환;박정호;김평;이승우;정한민;서동민
    • 한국콘텐츠학회논문지
    • /
    • 제12권11호
    • /
    • pp.502-510
    • /
    • 2012
  • 국방 과학기술의 발달에 따라 첨단 무기들이 지속적으로 개발되고 온라인을 통한 정보의 공유가 활발해지면서, 각국의 미래 전략무기 소요 제기를 위한 정보의 수집 및 분석의 중요성이 증가하고 있으며, 이를 위한 이종의 국방정보를 통합 관리 및 분석하는 시스템이 필요하다. 시맨틱 웹은 이종의 지식자원을 통합하고 검색 및 내비게이션 할 수 있는 차세대 지식정보 관리 기반 기술로 최근에는 지능형 시스템 구축에 활발하게 사용되고 있다. 시맨틱 웹은 단순 키워드 검색이 아닌 의미적으로 연관된 정보 검색을 제공하기 때문에 신뢰도 높은 분석 결과를 제공한다. 본 논문에서는 시맨틱 웹을 기반으로 무기 제원 정보를 중심으로 무기의 제조국, 개발 회사, 개발 현황 등 무기와 관련된 다양한 관련 정보를 온톨로지로 구조화하는 것은 물론, 관련 정보를 이용해서 무기를 효과적으로 검색 및 분석할 수 있는 국방무기 다차원 정보분석시스템을 제안한다. 제안한 시스템은 무기의 제원명과 제원의 상하위 관계를 이용해서 확장 검색 기능을 제공하며, 무기 관련 정보를 이용해서 다양한 경로로 무기정보에 접근할 수 있는 기능과 함께 무기체계에 따른 다양한 분석 기능도 제공한다. 또한 개발된 시스템은 무기 분야의 전문가 지식과 웹에서 수집된 무기 관련 정보를 온톨로지로 구축하고 지능화된 검색 서비스를 구현함으로써, 정보전 시대에 필요한 첨단 무기 정보 획득의 효율성을 제고한다.

온톨로지 지식 기반 특성치를 활용한 Bidirectional LSTM-CRF 모델의 시퀀스 태깅 성능 향상에 관한 연구 (Improving Bidirectional LSTM-CRF model Of Sequence Tagging by using Ontology knowledge based feature)

  • 진승희;장희원;김우주
    • 지능정보연구
    • /
    • 제24권1호
    • /
    • pp.253-266
    • /
    • 2018
  • 본 연구는 질의 응답(QA) 시스템에서 사용하는 개체명 인식(NER)의 성능을 향상시키기 위하여 시퀀스 태깅 방법론을 적용한 새로운 방법론을 제안한다. 사용자의 질의를 입력 받아 데이터베이스에 저장된 정답을 추출하기 위해서는 사람의 언어를 컴퓨터가 알아들을 수 있도록 구조화 질의어(SQL)와 같은 데이터베이스의 언어로 전환하는 과정이 필요한데, 개체명 인식은 사용자의 질의에서 데이터베이스에 포함된 클래스나 데이터 명을 식별하는 과정이다. 기존의 데이터베이스에서 질의에 포함된 단어를 검색하여 개체명을 인식하는 방식은 동음이의어와 문장성분 구를 문맥을 고려하여 식별하지 못한다. 다수의 검색 결과가 존재하면 그들 모두를 결과로 반환하기 때문에 질의에 대한 해석이 여러 가지가 나올 수 있고, 계산을 위한 시간복잡도가 커진다. 본 연구에서는 이러한 단점을 극복하기 위해 신경망 기반의 방법론을 사용하여 질의가 가지는 문맥적 의미를 반영함으로써 이러한 문제를 해결하고자 했고 신경망 기반의 방법론의 문제점인 학습되지 않은 단어에 대해서도 문맥을 통해 식별을 하고자 하였다. Sequence Tagging 분야에서 최신 기술인 Bidirectional LSTM-CRF 모델을 도입함으로써 신경망 모델이 가진 단점을 해결하였고, 학습되지 않은 단어에 대해서는 온톨로지 기반 특성치를 활용하여 문맥을 반영한 추론을 사용하였다. 음악 도메인의 온톨로지(Ontology) 지식베이스를 대상으로 실험을 진행하고 그 성능을 평가하였다. 본 연구에서 제안한 방법론인 L-Bidirectional LSTM-CRF의 성능을 정확하게 평가하기 위하여 학습에 포함된 단어들뿐만 아니라 학습에 포함되지 않은 단어들도 포함한 질의를 평가에 사용하였다. 그 결과 L-Bidirectional LSTM-CRF 모형을 재학습 시키지 않아도 학습에 포함되지 않은 단어를 포함한 질의에 대한 개체명 인식이 가능함을 확인하였고, 전체적으로 개체명 인식의 성능이 향상됨을 확인할 수 있었다.

상황정보를 기반으로 한 서비스 관리 시스템 설계 (Design of Service Management System based on Context Information)

  • 이승근;임기욱;이정현
    • 전자공학회논문지CI
    • /
    • 제42권5호
    • /
    • pp.49-58
    • /
    • 2005
  • 상황 인식 기반 편재형 컴퓨팅(Pervasive Computing) 환경의 다양한 응용에 관심이 증대되고 있으며, 개발자들이 상황인식 응용을 보다 쉽게 개발할 수 있도록 지원하는 개발환경들에 대한 연구가 활발하게 이루어지고 있다. 서비스 관리 시스템은 상황 인식 응용이 필요로 하는 서비스를 찾아서 제공해 주는 시스템으로 상황 인식 응용 개발환경에 필수적인 부분이다. 그러나, 기존 연구에서는 단순 구문 매칭이나 서비스 타입 등의 제한적인 온톨로지 기반 매칭을 사용하고 있으며 상황 정보에 대한 고려가 없다. 또한, 사용자가 원하는 서비스가 없는 경우 기존 서비스들을 조합해서 이용할 수 있도록 할 수 있어야 한다. 이 논문에서는 상황 정보 기반 서비스 관리 시스템을 제안한다. 제안하는 시스템은 온톨로지를 이용한 의미적 매칭 방법과 상황 정보를 고려함으로써 보다 정확한 검색이 가능하게 하고, 서비스 조합 기능을 제공함으로써 사용자가 원하는 서비스가 서비스 레지스트리에 없는 경우에는 기존 서비스들을 조합하는 서비스 리스트를 제공할 수 있다. 설계한 시스템을 평가하기 위해서 서비스 질의를 위한 프로토타입을 개발하였으며 이를 통해서 상황 정보 기반 검색과 서비스 조합이 적절하게 지원함을 보였다.

텍스트 마이닝과 소셜 네트워크 분석을 이용한 재난대응 용어분석 (Analyzing Disaster Response Terminologies by Text Mining and Social Network Analysis)

  • 강성경;유환;이영재
    • 경영정보학연구
    • /
    • 제18권1호
    • /
    • pp.141-155
    • /
    • 2016
  • 세월호 침몰사고, 판교 환풍구 붕괴사고 등 재난은 점차 복합적이고 대형화되고 있다. 따라서 이러한 재난에 신속히 대응하기 위한 기관들의 협업 또한 중요해지고 있다. 다수기관 간 협업과정에서는 다양한 용어를 바탕으로 의사소통이 이루어진다. 의사소통은 '용어'를 기반으로 하므로 '용어'에 대한 중요성 또한 간과할 수 없다. 따라서 본 연구에서는 재난현장에서 사용하는 용어를 선정하여 텍스트 마이닝 및 소셜 네트워크 분석(SNA: Social Network Analysis)을 이용해 어떤 용어가 대응과정에 있어 핵심적인 용어인지를 파악해보았다. 텍스트 마이닝의 TDM을 이용하여 역문헌 빈도수를 산출해 용어와 문서 간의 관계를 알아보고, SNA를 통해 노드(용어)와 노드 사이의 관계를 파악하였다. 용어분석의 결과 표현은 용어 간의 유기적인 관계를 시각화할 수 있는 마인드맵(Mind Map)을 이용하였다. 용어는 미국의 NIMS, EMR, 그리고 우리나라의 재난 및 안전관리 기본법을 토대로 온톨로지 개념에 따라 계층적(Class, Object, Instance)으로 분류하였으며. 신문기사와 사설, 정책보고서 등의 정부 간행물에서 선정하였다. 이러한 재난대응 핵심용어의 파악은 재난현장에서 사용하는 용어를 표준화하기 위한 기초자료로 활용할 수 있으며, 온톨로지 개념에 따라 용어들을 계층적으로 분류하였기 때문에 재난 대응에 대한 다양한 자료들을 축적하고 검색하는데 용어의 분류체계를 활용할 수 있다. 이 밖에 사고대응 시나리오 작성 시에도 핵심용어를 활용할 수 있을 것으로 판단된다.

신뢰값 기반 대용량 트리플 처리를 위한 스파크 환경에서의 RDFS 온톨로지 추론 (Spark based Scalable RDFS Ontology Reasoning over Big Triples with Confidence Values)

  • 박현규;이완곤;바트셀렘;박영택
    • 정보과학회 논문지
    • /
    • 제43권1호
    • /
    • pp.87-95
    • /
    • 2016
  • 최근 인터넷과 디바이스의 발전으로 지식 정보의 양이 방대해 지면서 대용량 온톨로지를 이용한 추론 연구가 활발히 진행되고 있다. 일반적으로 트리플로 표현되는 빅데이터는 기계학습 프로그램이나 지식 공학자가 각 트리플의 신뢰도를 측정하여 제공한다. 하지만 수집된 데이터는 불확실한 데이터를 포함하고 있으며, 이러한 데이터를 추론하는 것은 불확실성을 내포한 추론 결과를 초래할 수 있다. 본 논문에서는 불확실성 문제를 해결하기 위해 수집된 데이터에 대한 신뢰의 정도를 나타내는 신뢰값(Confidence Value)를 이용한 RDFS 규칙 추론 방법에 대하여 설명하고, 메모리 기반의 분산 클러스터 프레임워크인 스파크(Spark)를 기반으로 데이터의 불확실성에 대한 고려를 하지 않는 기존의 추론 방법과 달리 신뢰값 계산에 대한 방법을 응용하여 RDFS 규칙을 통해 추론되는 새로운 데이터의 신뢰값을 계산하며, 계산된 신뢰값은 추론된 데이터에 대한 불확실성을 나타낸다. 제안하는 추론 방법의 성능을 검증하기 위해 온톨로지 추론과 검색 속도를 평가할 때 활용되는 공식 데이터인 LUBM을 대상으로 신뢰값을 추가하여 실험을 수행하였으며, 가장 큰 데이터인 LUBM3000을 수행하였을 때 1179초의 추론시간이 소요되었고, 초당 350K 트리플을 처리할 수 있는 성능을 보였다.

온톨로지 기반 법령 검색시스템의 개발: 철도·교통 분야 연구개발사업을 중심으로 (A Development of Ontology-Based Law Retrieval System: Focused on Railroad R&D Projects)

  • 원민재;김동희;정해민;이상근;홍준석;김우주
    • 한국전자거래학회지
    • /
    • 제20권4호
    • /
    • pp.209-225
    • /
    • 2015
  • 철도교통 분야의 연구개발사업은 여러 법령과 긴밀하게 관련되어 있기 때문에, 연구개발을 성공적으로 수행했더라도 법령에 의해 제약되어 연구개발 결과의 실질적인 사업화 또는 실용화를 이루어내지 못하는 사례가 발생하고 있다. 본 논문에서는 이러한 사례를 방지하기 위한 방편으로 철도교통 분야에서 진행되는 연구개발사업과 관련된 법령을 검색할 수 있는 법령검색시스템의 모델을 제시하였다. 사업 내용을 설명하는 연구개발계획서가 시스템에 입력되면 요약서의 내용을 대상으로 형태소 분석을 수행하여 명사들만을 남긴다. 국가법령정보센터에서 제공하는 법령정보공동활용서비스를 사용하여 명사들 중 법령용어를 분류하고, 법령용어와 해당 법령용어를 정의하는 법령과의 관계를 지능형 지식 베이스인 온톨로지에 저장한다. 온톨로지에 저장된 법령들은 본 연구에서 개발한 추가적인 지표 계산과정을 거쳐 연구개발사업과 관련된 정도를 기준으로 순위가 매겨진 후, 시스템 사용자에게 제공된다. 사용자는 연구개발에 영향을 미칠 수 있는 법령을 검색할 수 있게 되어 사업 시작 전에 연구 방향을 결정하는 데 참고하거나, 사업 진행하는 과정에서도 참고자료로 사용할 수 있다. 궁극적으로, 법령에 의해 철도교통 분야 연구개발사업이 실패하거나 실용화되지 못하는 경우를 사전에 방지함으로써, 사업에 투자한 예산에 의해 기대되는 충분한 기술적 경제적 효과를 얻을 수 있게 될 것이다.