• Title/Summary/Keyword: Data Scientists

Search Result 3,360, Processing Time 0.024 seconds

A scoring method for evaluating the reliability of protein-protein interaction data (단백질 상호작용 데이터의 신뢰도 검증 기법)

  • 홍진선;한경숙
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2004.10b
    • /
    • pp.292-294
    • /
    • 2004
  • 단백질 상호작용 검출 방법의 발달로 많은 양의 데이터가 산출되고 있고, 이러한 상호작용 데이터의 방대한 양으로 인해 통계적 방법을 이용하여 데이터를 처리함으로서 유용한 지식을 얻을 수 있다 예측한 상호작용 데이터는 첫째, 대량의 데이터를 생산해내므로, 많은 false-positive를 내포하고 있고, 둘째, 예측한 상호작용을 검증시 실험을 하는 방법 외에는 신뢰도를 측정하기가 어렵다는 문제점이 있다. 본 연구에서는 점수 할당시스템을 사용함으로서 예측한 인간 단백질 상호작용 데이터의 false-positive를 줄이고, 각각 상호작용에 점수를 부설함으로서 상호작용 데이터의 신뢰도를 검증하는 방법을 제안하고 있다.

  • PDF

Construction of KBIF Data Node (KBIF 데이터 노드 구축)

  • 안성수;양진호;권창혁;박형선
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2004.10b
    • /
    • pp.280-282
    • /
    • 2004
  • 국제생물다양성정보기구(GBIF)는 전세계의 생물다양성데이터베이스를 네트워크로 연결하고 인터넷을 통한 서비스를 제공하여 생물다양성데이터가 자유롭게 널리 이용될 수 있는 임무를 수행하고 있다. 한국에서는 KISTI가 국가중점노드 역할을 수행하면서 생물다양성데이터 보유기관에 데이터노드 구축 관련 기술과 소프트웨어를 보급하고 있고 현재 한국에서는 2개의 데이터 노드가 구축되어 GBIF의 데이터 포털과 연결되어 있다. 본 논문에서는 GBIF의 생물다양성데이터를 교환하기 위해서 필요한 데이터 표준 프로토콜, 관련 소프트웨어를 소개하고 데이터 노드 구축 방법을 소개하고 생물다양성데이터의 응용 방법에 대친 논의한다.

  • PDF

Data Interoperation Method between Workflow And Application Systems (워크플로우 시스템과 애플리케이션 상호간의 데이터 연동 방법)

  • 채정숙;황재각;이용준
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2004.10b
    • /
    • pp.172-174
    • /
    • 2004
  • 워크플로우 관리 시스템은 조직의 신속하고 정확한 의사결정을 지원하기 위하여 효율적인 업무 프로세스를 정의하고 이를 관리하며 업무 분석의 최적화를 이룰 수 있도록 지원하는데 목적이 있다. 워크플로우 시스템은 기업 내의 업무 프로세스를 진행하는 데 있어 시스템/애플리케이션 상호간의 데이터의 교환과 더불어 각 업무에 대한 흐름을 어떤 시정 또는 어떤 이벤트에 따라서 어디에서 어디로 업무가 진행되어야 하는지를 정의하고 운용할 수 있는 기능을 담당한다. 본 논문에서는 이러한 시스템과 애플리케이션 상호간의 데이터 교환을 위한 데이터 연동 방법의 아키텍처를 정의하고 이를 구현한다.

  • PDF

Development of Decision-Support System for Building of Data Mart and General Affairs Management (병원 원무관리를 위한 원무 데이터 마트 구축 및 의사결정지원시스템 개발)

  • 김도경;박성미;정윤기;이배호
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2004.10b
    • /
    • pp.100-102
    • /
    • 2004
  • 방대한 양의 의료 데이터를 이용하여 함축적이며 특정 주제 혹은 부서 단위에 적합한 원무 데이터마트를 구축하고자 한다. 먼저 다양한 정보를 사용자의 요구에 따라 체계적으로 분석하고 설계하여 원무관리를 위한 데이터마트를 구축하고, OLAP 기반의 의사결정지원시스템을 개발하여 원무 관리자나 최고 경영자의 의사결정에 도움을 주는 한편, 이를 통해 가치 있는 정보를 추출함으로써 경영활동을 돕고 분석된 내용을 토대로 마케팅에 활용할 수 있도록 의미 있는 데이터를 제공하고자 한다.

  • PDF

EP2 Labeling Scheme for XML Data (XML 데이타를 위한 EP2 레이블링 스킴)

  • 진주용;배진욱;이석호
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2004.10b
    • /
    • pp.79-81
    • /
    • 2004
  • 범위 기반 레이블링 스킴(range-based labeling scheme)을 이용하면 임의의 두 노드에 대한 조상-자손 관계를 쉽게 판별할 수 있으므로, XPath나 XQuery 형태의 질의를 효율적으로 처리할 수 있다. 그러나 노드의 삽입이 일어나는 동적인 상황에서는 불가피하게 전체 또는 일부의 레이블을 다시 할당(re-labeling)할 가능성이 있다는 문제점이 있다. 본 논문에서는 Dietz 레이블링 스킴을 개선한 EP2(extended preorder & postorder) 레이블링 스킴을 제안한다. 제안하는 스킴은 동일한 저장 공간상에서 범위 기반 레이블링 스킴에 비해 동적인 갱신에 유리하며, 기존의 구조 조인 알고리즘(structural join algorithm)을 이용하여 효율적으로 구조 질의(structural query)를 처리할 수 있다.

  • PDF

A New Approach for Multi-Source Bio-data Integration and Analysis (멀티 소스 바이오 데이터 통합과 분석을 위한 새로운 접근 방법)

  • 윤혜성;이상호;김주한
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2004.10b
    • /
    • pp.268-270
    • /
    • 2004
  • 네트워크가 보편화되면서 어떠한 정보의 교환도 시간과 장소에 상관없이 가능하게 되었다. 자체 실험실에서 실험한 값을 포함하여 분산된 다양한 소스로부터 많은 실험 값의 정보를 통합하는 즉, 멀티 소스 데이터에 대한 통합 규칙을 만들 수 있다면 다양하고 유용한 정보를 얻을 수 있을 것이다. 또한 통합된 규칙을 통해서 새로운 안목으로 실험을 진행할 수도 있으며, 미처 생각하지 못했던 관련 지식을 습득할 수도 있을 것이다. 본 논문에서는 이러한 분산된 데이터를 통합하여 멀티 소스 데이터들 간의 통합 규칙을 만들고 이의 분석 기반이 되도록 하는 방법에 대해 소개한다.

  • PDF

Ordered Indexing Technique for Storing XML Data Using Relational Databases (관계형 데이터베이스 기반 색인을 이용한 XML 테이터의 저장 기법)

  • 손대준;정병수
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2004.10b
    • /
    • pp.205-207
    • /
    • 2004
  • 인터넷의 급속한 발전으로 인해 다양한 종류의 데이터들이 증가하게 되었으며 이러한 데이터의 표현과 데이터 교환을 위해 XML이 사실상의 표준으로 빠르게 자리 잡아 가고 있다. XML문서를 데이터로 저장 시 오랜 기간에 걸쳐서 성숙된 RDBMS를 사용하여 XML데이터를 RDBMS로 저장 시 발생할 수 있는 단편화 방지와 XML질의의 효과적인 질의 처리에 대한 많은 연구들이 제안되었다. 본 논문에서는 XML 문서를 관계형 데이터베이스 스키마로 저장 시 발생할 수 XML문서내의 엘리먼트의 관계에 대한 정보를 저장하기 위해서 추가적으로 발생하는 정보의 수를 줄이고 엘리먼트간의 관계를 효과적으로 저장할 수 있는 방법에 대해서 연구한다.

  • PDF

Implementation of a Web-based xml query report ing tool (XML 문서 관리 및 질의를 위한 웹 기반의 도구 설계 및 구현)

  • 박유림;이민수
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2004.10b
    • /
    • pp.193-195
    • /
    • 2004
  • 데이터베이스에 저장된 수많은 자료들을 사용자의 질의에 맞추어 웹상에서 표현해주는 것이 바로 리포팅 툴의 역할이다. 그에 관한 연구들로 BBQ(Blended Browsing and Querying), EASY BASE, QURSED(Querying and Reporting Semistructured Data)와 같은 여러 리포팅 툴들이 상용화되어 있다. 하지만 사용자가 보다 쉽고 직관적으로 XML 문서를 작성하고 관리할 수 있는 툴들은 미흡한 것이 사실이다. 이 논문에서는 XML과 XSL문서를 각각 그룹핑하고 직관적인 구조로 표현 해주며 사용자의 관점에 맞추어 XQuery를 지원하는 시스템을 설계 구현하였다.

  • PDF

Design and Implementation of Intelligent Institute Management System Using Data Mining (데이터마이닝 기법을 이용한 지능형 학회 관리 시스템 설계 및 구현)

  • 조영기;백성욱;김상수;조주상;장인엽;장철호
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2004.10b
    • /
    • pp.190-192
    • /
    • 2004
  • 본 논문에서는 학회사이트의 중요 정보들을 효율적으로 관리하기 위해 구축된 지능형 학회 관리 시스템의 설계 및 구현사례를 제시한다. 시스템 운영을 지원 하기위해 회원정보, 기업정보, 논문분야 정보 틴 논문 정보 등의 데이터를 기반으로 데이터마이닝을 수행했으며 데이터마이닝 과정에서 나타난 여러 유용한 규칙들을 제시했다. 분석된 정보를 이용해 회원 위주의 학회 사이트 운영정책과 동적 인터페이스를 제공하기 위한 웹사이트의 개인화 계획을 제시하였다.

  • PDF

Design of Spatial Data Synchronization System in Mobile Environment (모바일 환경에서 공간데이터 동기화 시스템 설계)

  • 이혜진;김진석
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2004.10b
    • /
    • pp.184-186
    • /
    • 2004
  • 본 연구는 공간데이터 동기화 표준 프로토콜 명세인 SyncML(Synchronization Markup Language)을 이용하여 모바일 장비와 서버사이에 공간데이터를 동기화 구조를 정의하여 상호운용성 확보를 위하여 기존에 사용되어온 GML(Geographic Markup Language) 데이터와의 통합 및 다양한 데이터 소스에 대한 접근 가능성을 제시한다 뿐만 아니라 Metadata 및 Catalog Service를 이용한 공간데이터 동기화 시스템을 제시함으로써 분산되어 있는 다양한 형태의 공간데이터, 비공간 데이터의 관계성을 고려한 데이터 연동을 가능하게 한다.

  • PDF