• Title/Summary/Keyword: 학술 논문 데이터베이스

Search Result 2,657, Processing Time 0.053 seconds

Comparative analysis of Biomedical Databases and Text mining Technologies (바이오메디컬 데이터베이스 및 텍스트마이닝 기술의 비교 분석 및 전망)

  • Joh, Taewon;Lee, Kyubum;Kang, Jaewoo
    • Annual Conference of KIPS
    • /
    • 2010.11a
    • /
    • pp.189-192
    • /
    • 2010
  • 분자 생물학을 통한 연구가 심화되면서, 생물학 정보는 기하급수적으로 늘어나고 있다. 그에 따라 바이오메디컬(생물학, 의학) 관련 논문들의 출판 및 등록 건수도 해마다 증가하고 있다. 그러나 바이오메디컬 문서들에서 유용한 정보를 추출하는 기술은 이러한 분야의 전문가 큐레이터(curator)에 의존한 경우가 많아서, 그 작업의 속도와 양적인 면에서 한계를 가지고 있다. 이러한 이유 때문에 바이오메디컬 문서를 기계학습을 통하여 분석하는 기법이 도입되기 시작하였다. 아직까지는 기계학습을 이용하여 구축된 데이터베이스가 소수에 불과하지만, 점차 증가하는 추세에 있다. 이러한 현 추이를 분석하고 향후의 추세를 예측하고자 텍스트마이닝 기술이 생물학과 의학 분야에서 어떻게 사용되며, 그 정보들이 어떻게 관리되는지 연구, 조사 하게 되었다. 현재 바이오메디컬 관련 데이터베이스들이 여러 기관 및 단체에 의해 구축 및 관리되고 있으며, 국가적인 프로젝트로서 이러한 데이터베이스들을 통합하는 과정을 진행하고 있다. 이처럼 국가기관의 주도하에 데이터베이스를 통합하여 관리하고자 하는 노력들이 계속되고 있어, 앞으로는 바이오메디컬 자료들을 검색하기가 보다 용이해질 것으로 생각된다. 텍스트마이닝을 이용하여 바이오메디컬 정보들을 추출하는 기술은 초기에는 공동 발생(co-occurence)과 같이 단순한 통계적 방법을 이용하였지만, 최근에는 다른 문서에서 추출된 정보와 기존의 정보들을 연계하여 새로운 정보를 추출해 내는 기법이 확산되고 있음을 알 수 있었다.

Design of Spatiotemporal Data Model for Managing History of Digital Map (수치지도의 이력 관리를 위한 시공간 데이터 모델 설계)

  • Kim, Sang Yeob;Kim, Hyeongsoo;Lee, Yang Koo;Zhou, Tie Hua;Jo, Ui Hwan;Park, Ki Surk;Ryu, Keun Ho
    • Annual Conference of KIPS
    • /
    • 2009.04a
    • /
    • pp.356-359
    • /
    • 2009
  • 최근 센서와 모바일 기술의 발달에 따라 대용량 데이터 처리가 가능해지고, 유비쿼터스와 텔레매틱스 등의 도입으로 공간 데이터가 다양한 환경에 응용되거나 활용 분야가 점차 증가하고 있다. 특히 사용자에게 다양한 공간 데이터를 제공하는 수치지도의 활용성이 점차 증가하고 있다. 기존의 수치지도 관리 시스템은 이력에 대한 체계적인 관리방법과 공간 객체의 변화를 분석 또는 이력에 대한 질의 처리에 대한 구체적인 방안이 없는 실정이다. 따라서 이 논문에서는 효율적인 이력 관리를 위해 시공간 데이터 모델을 설계하고 그 모델을 기반으로 공간 객체의 이력 관리 기법을 제안한다. 제안된 모델을 통해 효율적인 이력 관리 및 시간에 대한 질의 처리가 가능하며, 사용자에게 정확한 이력 정보를 제공할 수 있다.

The Formalization of a Temporal Object Oriented Model Based on an Attribute versioning (속성 버전화에 기반한 시간지원 객체지향 모델의 형식화)

  • 이홍로;김삼남;류근호
    • Proceedings of the Korea Database Society Conference
    • /
    • 1997.10a
    • /
    • pp.483-503
    • /
    • 1997
  • One important question that arises when dealing with temporal databases in context of object-oriented systems is the method that associates time with attributes relationship semantics. Results of previous work about attribute versioning, particularity extending flat(First Normal Form: FNF) or nested(Non-First Normal Form: NFNF) relational models. are not applicable to temporal object-oriented databases. This is because object-oriented models provide more powerful constructs than traditional models for structuring complex objects. Therefore, this paper presents an formal approach for incorporating temporal extension to object-oriented databases. Our goal in this paper is to study temporal object-oriented database representation according to generalization, aggregation and association among objects. We define tile concepts of attribute versioning in temporal object-oriented model, and we concentrate on the representation of temporal relationship among objects. Another contribution of this paper is to specify time constraints on relationship semantics and analyze our model based on representation criteria. By means of formalizing tile temporal object oriented model, this paper can not only provide tile robust operating functions that design algebraic operators, but also entrance the reuse of modules.

  • PDF

Mining Commuter Patterns from Large Smart Card Transaction Databases (대용량 교통카드 트랜잭션 데이터베이스에서 통근 패턴 탐사)

  • Park, Jong-Soo
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2010.06a
    • /
    • pp.38-39
    • /
    • 2010
  • 수도권 대중교통 이용자는 2004년 서울시의 대중교통 체계 개편에 따라 교통 카드를 사용하여 버스와 지하철을 이용하게 되었다. 교통 카드를 사용하는 각 승객의 승차와 하차에 관한 데이터가 하나의 트랜잭션으로 구성되고, 하루 천만 건 이상의 트랜잭션들로 구성된 대용량 교통카드 트랜잭션 데이터베이스가 만들어지고 있다. 대중교통을 이용하는 승객들의 승차와 하차에 관한 여러 정보를 담고 있는 교통카드 트랜잭션 데이터베이스에서 유용한 패턴이나 정보를 탐사해내는 연구가 계속 진행되고 있다. 이런 연구 결과는 수도권 대중교통 정책을 입안하는데 중요한 기초 자료가 되고 수도권 승객들에게 대중교통을 보다 잘 이용할 수 있는 정보로 제공된다. 교통카드 이용률은 2006년 79.5%, 2007년 80.3%, 2008년 81.6%로 점차적으로 증가하고 있다. 대용량의 교통카드 트랜잭션 데이터베이스에 대한 연구를 살펴보면 하루 동안의 교통카드 트랜잭션 데이터베이스에서 순차 패턴을 탐사하는 알고리즘을 연구하였고[1], 승객들의 통행 패턴에 대한 분석연구를 확장하여 일 년에 하루씩 2004년에서 2006년까지 3일간의 교통카드 트랜잭션 데이터베이스로부터 승객 시퀀스의 평균 정류장 개수와 환승 횟수 등을 연도별로 비교하였다[2]. 수도권 지하철 시스템의 특성에 관한 연구로는 네트워크 구조 분석이 있었고[3], 승객의 기종점 통행 행렬(Origin-Destination trip matrix)에 의한 승객 흐름의 분포가 멱함수 법칙(power law)임을 보여주는 연구가 있었고[4], 지하철 교통망에서 모든 링크상의 승객들의 흐름을 찾아내는 연구가 있었다[5]. 본 논문에서는 교통카드 트랜잭션 데이터베이스에서 지하철 승객들의 통근 패턴을 탐사해내는 방법을 연구하였다. 수도권 지하철 네트워크에 대한 정보를 입력하고 하루치의 교통카드 트랜잭션 데이터베이스에 연구된 방법을 적용하여 8가지 통근 패턴들을 탐사해내고 분석하였다. 탐사된 패턴들 중에서 많은 승객들이 지지하는 출퇴근 패턴에 대해서는 시간대별로 승객수를 그래프로 보여주었다.

  • PDF

A Study on the Open Access Model for Scholarly Communication (정보공유적 모델 기반의 학술커뮤니케이션에 대한 연구: 저작권을 중심으로)

  • 정경희
    • Journal of the Korean Society for information Management
    • /
    • v.19 no.4
    • /
    • pp.384-399
    • /
    • 2002
  • The ownership of scholarly communication, i.e. copyright is very important to solve the problem of access to many academic journals in network environment. The purpose of this article is to give a conceptual model for the open access based scholarly communication. The main point of this model is for the authors of research paper to retain copyright on their works and to license the work whenever it is reproduced or redistributed for non-profit use with academic purpose. And library have to construct full text journal databases under this open access license.

workspace Transaction Model for Job Synchronization (작업 동기화를 위한 작업공간 트랜잭션 모델)

  • 오암석
    • Proceedings of the Korea Multimedia Society Conference
    • /
    • 1998.10a
    • /
    • pp.130-134
    • /
    • 1998
  • 멀티미디어 응용들은 공동 작업을 위한 작업 동기화 지원이 필요하다. 이 논문은 데이터베이스를 이용한 멀티미디어 응용 개발시 한 트랜잭션의 처리가 긴 공동 작업 환경에서 작업 동기화를 지원하기 위한 새로운 공동 트랜잭션 모델을 제안한다. 이 논문에서 제시하는 모델은 기존의 로킹 기법을 사용하지 않고 여러 작업공간에서 수행되는 작업간의 동기화를 제공한다.

  • PDF

Automated-Database Tuning System With Knowledge-based Reasoning Engine (지식 기반 추론 엔진을 이용한 자동화된 데이터베이스 튜닝 시스템)

  • Gang, Seung-Seok;Lee, Dong-Joo;Jeong, Ok-Ran;Lee, Sang-Goo
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2007.06a
    • /
    • pp.17-18
    • /
    • 2007
  • 데이터베이스 튜닝은 일반적으로 데이터베이스 어플리케이션을 "좀 더 빠르게" 실행하게 하는 일련의 활동을 뜻한다[1]. 데이터베이스 관리자가 튜닝에 필요한 주먹구구식 룰(Rule of thumb)들을 모두 파악 하고 상황에 맞추어 적용하는 것은 비싼 비용과 오랜 시간을 요구한다. 그렇게 때문에 서로 다른 어플 리케이션들이 맞물려 있는 복잡한 서비스는 필수적으로 자동화된 데이터베이스 성능 관리와 튜닝을 필 요로 한다. 본 논문에서는 이를 해결하기 위하여 지식 도매인(Knowledge Domain)을 기초로 한 자동화 된 데이터베이스 튜닝 원칙(Tuning Principle)을 제시하는 시스템을 제안한다. 각각의 데이터베이스 튜닝 이론들은 지식 도매인의 지식으로 활용되며, 성능에 영향을 미치는 요소들을 개체(Object)와 콘셉트 (Concept)로 구성하고 추론 시스템을 통해 튜닝 원칙을 추론하여 쉽고 빠르게 현재 상황에 맞는 튜닝 방법론을 적용시킬 수 있다. 자동화된 데이터베이스 튜닝에 대해 여러 분야에 걸쳐 학문적인 연구가 이루어지고 있다. 그 예로써 Microsoft의 AutoAdmin Project[2], Oracle의 SQL 튜닝 아키텍처[3], COLT[4], DBA Companion[5], SQUASH[6] 등을 들 수 있다. 이러한 최적화 기법들을 각각의 기능적인 방법론에 따라 다시 분류하면 크게 Design Tuning, Logical Structure Tuning, Sentence Tuning, SQL Tuning, Server Tuning, System/Network Tuning으로 나누어 볼 수 있다. 이 중 SQL Tuning 등은 수치적으로 결정되어 이미 존재하는 정보를 이용하기 때문에 구조화된 모델로 표현하기 쉽고 사용자의 다양한 요구에 의해 변화하는 조건들을 수용하기 쉽기 때문에 이에 중점을 두고 성능 문제를 해결하는 데 초점을 맞추었다. 데이터베이스 시스템의 일련의 처리 과정에 따라 DBMS를 구성하는 개체들과 속성, 그리고 연관 관계들이 모델링된다. 데이터베이스 시스템은 Application / Query / DBMS Level의 3개 레벨에 따라 구조화되며, 본 논문에서는 개체, 속성, 연관 관계 및 데이터베이스 튜닝에 사용되는 Rule of thumb들을 분석하여 튜닝 원칙을 포함한 지식의 형태로 변환하였다. 튜닝 원칙은 데이터베이스 시스템에서 발생하는 문제를 해결할 수 있게 하는 일종의 황금률로써 지식 도매인의 바탕이 되는 사실(Fact)과 룰(Rule) 로써 표현된다. Fact는 모델링된 시스템을 지식 도매인의 하나의 지식 개체로 표현하는 방식이고, Rule 은 Fact에 기반을 두어 튜닝 원칙을 지식의 형태로 표현한 것이다. Rule은 다시 시스템 모델링을 통해 사전에 정의되는 Rule와 튜닝 원칙을 추론하기 위해 사용되는 Rule의 두 가지 타업으로 나뉘며, 대부분의 Rule은 입력되는 값에 따라 다른 솔루션을 취하게 하는 분기의 역할을 수행한다. 사용자는 제한적으로 자동 생성된 Fact와 Rule을 통해 튜닝 원칙을 추론하여 데이터베이스 시스템에 적용할 수 있으며, 요구나 필요에 따라 GUI를 통해 상황에 맞는 Fact와 Rule을 수동으로 추가할 수도 었다. 지식 도매인에서 튜닝 원칙을 추론하기 위해 JAVA 기반의 추론 엔진인 JESS가 사용된다. JESS는 스크립트 언어를 사용하는 전문가 시스템[7]으로 선언적 룰(Declarative Rule)을 이용하여 지식을 표현 하고 추론을 수행하는 추론 엔진의 한 종류이다. JESS의 지식 표현 방식은 튜닝 원칙을 쉽게 표현하고 수용할 수 있는 구조를 가지고 있으며 작은 크기와 빠른 추론 성능을 가지기 때문에 실시간으로 처리 되는 어플리케이션 튜닝에 적합하다. 지식 기반 모률의 가장 큰 역할은 주어진 데이터베이스 시스템의 모델을 통하여 필요한 새로운 지식을 생성하고 저장하는 것이다. 이를 위하여 Fact와 Rule은 지식 표현 의 기본 단위인 트리플(Triple)의 형태로 표현된다, 트리플은 Subject, Property, Object의 3가지 요소로 구성되며, 대부분의 Fact와 Rule들은 트리플의 기본 형태 또는 트리플의 조합으로 이루어진 C Condition과 Action의 두 부분의 결합으로 구성된다. 이와 같이 데이터베이스 시스템 모델의 개체들과 속성, 그리고 연관 관계들을 표현함으로써 지식들이 추론 엔진의 Fact와 Rule로 기능할 수 있다. 본 시스템에서는 이를 구현 및 실험하기 위하여 웹 기반 서버-클라이언트 시스템을 가정하였다. 서버는 Process Controller, Parser, Rule Database, JESS Reasoning Engine으로 구성 되 어 있으며, 클라이 언트는 Rule Manager Interface와 Result Viewer로 구성되어 었다. 실험을 통해 얻어지는 튜닝 원칙 적용 전후의 실행 시간 측정 등 데이터베이스 시스템 성능 척도를 비교함으로써 시스템의 효용을 판단하였으며, 실험 결과 적용 전에 비하여 튜닝 원칙을 적용한 경우 최대 1초 미만의 전처리에 따른 부하 시간 추가와 최소 약 1.5배에서 최대 약 3배까지의 처리 시간 개선을 확인하였다. 본 논문에서 제안하는 시스템은 튜닝 원칙을 자동으로 생성하고 지식 형태로 변형시킴으로써 새로운 튜닝 원칙을 파생하여 제공하고, 성능에 영향을 미치는 요소와 함께 직접 Fact과 Rule을 추가함으로써 커스터마이정된 튜닝을 수행할 수 있게 하는 장점을 가진다. 추후 쿼리 자체의 튜닝 및 인텍스 최적화 등의 프로세스 자동화와 Rule을 효율적으로 정의하고 추가하는 방법 그리고 시스템 모델링을 효과적으로 구성하는 방법에 대한 연구를 통해 본 연구를 더욱 개선시킬 수 있을 것이다.

  • PDF

Development of Database for Network Application Softwares of Prototype Korean Energy Management Systems (한국형 EMS NA Prototype용 DB 구축)

  • Yun, S.Y.;Cho, Y.S.;Lee, U.W.;Shin, C.H.;Lee, J.
    • Proceedings of the KIEE Conference
    • /
    • 2009.07a
    • /
    • pp.40_41
    • /
    • 2009
  • 본 논문은 한국형 에너지 관리 시스템(Korean Energy Management System)의 프로토타입 네트웍 어플리케이션 개발을 위한 데이터 베이스 구축에 대해 요약하였다. 본 논문에서는 두가지 측면에 집중하였다. 첫째, 각 어플리케이션 프로그램의 연산에 필요한 데이터를 추출하였다. 몇 가지 네트웍 어플리케이션 프로그램이 기저 모델로 선택되었으며 각 기저 모델에 필요한 데이터가 추출되었다. 둘째, 국내 실정에 적합한 전력계통의 토폴로지 구조 및 설비 모델에 대한 공통 모델이 구축되었다. 본 논문에서는 KEMS 너트웍 어플리케이션 프로그램에 공통으로 적용될 어플리케이션 공통 모델(application common model, ACM)을 제시하였다. 공통 모델은 계층적 비계층적 전력계통 구조를 포함하며 직간접의 데이터 링크를 이용하여 연관관계가 정의되었다. 제안한 데이터베이스 모델은 국내 전계통 데이터를 이용하여 시험되었으며 실시간 SCADA 데이터가 시험을 위해 사용되었다. 시험을 통해 제안한 데이터베이스 구조가 한국형 에너지 관리 시스템에 효과적으로 적용될 수 있음을 입증하였다.

  • PDF

A Design of Agent System for Distance Medical Care (원격 진료를 위한 에이전트 시스템 설계 및 구현)

  • Seo, In-Hong;Kim, Woo-Sung;Han, Ye-Ji
    • Annual Conference of KIPS
    • /
    • 2002.11a
    • /
    • pp.331-334
    • /
    • 2002
  • 초기의 웹은 많은 정보를 서로 공유하고 교환하는 정도였는데, 현재는 에이전트와 웹마이닝 등 여러 새로운 기술들을 웹 상에 적용함으로써 사용자가 직접 어떤 정보를 찾으러 웹 상을 돌아다니지 않아도 사용자가 필요로 하는 정보를 미리 알고 제공해주는 시스템으로 발전하고 있다. 하지만 웹 상의 원격 진료 시스템에서는 에이전트의 도입이 늦어지고 있다. 본 논문에서는 원격 진료 시스템에 에이전트의 개념을 도입하여 사용자가 미리 만들어져 있는 문진표를 작성하면 에이전트가 이메일로 사용자에게 진료 내용을 곧바로 보내주는 시스템 구현을 목표로 한다. 병원에서 직접 진료를 하고 있는 전문의사와 회피를 통해 문진표를 만들고, 체계적인 데이터베이스의 구축을 통하여 사용자의 현재 건강진단과 앞으로 조심해야할 부분을 미리 진단하여 이메일로 푸쉬해주는 원격 진료 에이전트 시스템을 개발하고자 함이 본 논문의 목적이다. 본 논문은 우선적으로 내과 환자들에게만 적용하는 데이터베이스를 구축한다.

  • PDF

Utilization of A Data Base for Query Processing of natural language on the Repository of natural language (자연어 저장소에 기반을 둔 자연어 질의처리를 위한 데이터베이스 활용 방안에 관한 연구)

  • Jeon, Danny;LEE, Byeong Rae
    • Annual Conference of KIPS
    • /
    • 2012.04a
    • /
    • pp.1058-1061
    • /
    • 2012
  • 최근 웹을 기반으로 한 계속적인 기술 발전에 따라 의사결정에 필요한 데이터의 요구는 점점 다양해지고 있으며 다양한 요구를 효과적으로 대응하기 위해 데이터 추출 방법에 대한 연구도 지속적으로 이루어지고 있다. 이에 본 논문에서는 자연어를 통해 사용자가 쉽게 원하는 자료를 추출 할 수 있는 방법론을 연구 하였다. 자연어 처리 기술에 대한 연구는 여러 방면에서 이루어지고 있는데 그 중에서도 본 논문에서는 기존의 자연어 처리 연구를 바탕으로 크게 3가지 형태로 연구 진행 하였다. 사용자가 입력한 정보를 바탕으로 유추하여 자연어를 처리하거나 이후 진행될 검색을 선 예측 하는 방법과 사용자 별로 검색되는 자연어를 통해 연관 관계를 설정하여 사용자에게 예측검색을 유도하는 방법 그리고 의사 결정을 위해 구축된 데이터베이스 스키마 정보를 이용하여 사용자가 쉽게 질의 문을 생성할 수 있도록 하는 방법론 연구이다. 본 논문을 통해 연구된 내용은 실제 구축하여 진행 하였고, 연구결과로 생성된 질의 문이 효과적으로 시스템에서 처리 되는 과정에 대한 연구도 함께 진행하고 검증하였다.