• 제목/요약/키워드: Document Based Database

검색결과 197건 처리시간 0.023초

대용량 XML 문서의 효율적인 검색과 관리를 위한 SCOF 모델 (Service-centric Object Fragmentation Model for Efficient Retrieval and Management of Huge XML Documents)

  • 정창후;최윤수;진두석;김진숙;윤화묵
    • 인터넷정보학회논문지
    • /
    • 제9권1호
    • /
    • pp.103-113
    • /
    • 2008
  • XML 문서가 증가하면서 XML 문서를 처리하는 방법론에 대한 많은 논의가 있어왔다. 본 논문에서는 두 가지 중요한 목적을 가지고 XML 정보 검색 및 관리 시스템을 개발하는데, 첫 번째는 질의에 적합한 내용을 쉽고 빠르게 검색해서 제공하는 것이고, 두 번째는 시스템의 부담을 최소화하면서 효율적이고 안정적인 관리 기능을 제공하는 것이다. 이렇게 실용적인 시스템을 개발하는 핵심 기술은 XML 문서를 어떻게 효과적으로 분할하여 구조적으로 서비스하는가에 달려 있다. 이러한 목적을 달성하기 위하여 본 논문에서는 SCOF(Service-centric Object Fragmentation) 모델을 제안한다. SCOF 모델은 XML 데이터 베이스 관리자에 의해서 정의되는 변환 규칙(conversion rule)을 이용하여 문서를 분할하는 준분할(semi-decomposition) 저장 방식이다. SCOF 모델을 사용한 키워드 기반 검색은 전형적인 XML 질의 언어처럼 문서의 특정 엘리먼트나 속성 값을 이용하여 검색을 수행할 수 있다. 비록 이러한 접근법이 XML 문서 컬렉션에 대한 관리자의 지식을 필요로 한다고 하더라도, 개별 문서의 크기나 전체 문서의 양에 상관없이 검색과 관리를 효율적으로 수행할 수 있기 때문에 실용적인 시스템을 구축할 수 있다는 장점이 있다.

  • PDF

한양도성 석재공급지 추정을 위한 고문헌 분석 및 암석학적 데이터베이스 구축 (Analysis of Ancient Document and Establishment of Petrological Database for Presumption of Stone Source Area of the Seoul City Wall, Korea)

  • 조영훈;이찬희
    • 암석학회지
    • /
    • 제24권3호
    • /
    • pp.193-207
    • /
    • 2015
  • 이 연구에서는 한양도성 석재공급지 추정을 위해 고문헌을 분석하고 산지탐색 지점에 대한 광역조사를 수행하여 암석학적 기초 데이터베이스를 구축하였다. 고문헌 분석 결과를 종합하면 성돌은 조선 초기에 주로 도성과 인접한 석산에서 조달된 반면 후기로 갈수록 도성 외부의 고정 채석장으로부터 공급되었다. 따라서 고문헌에 기록된 채석 산지를 중심으로 암석학적 조사를 수행한 결과, 산지탐색 전역에 걸쳐 담홍색화강암과 우백질화강암이 분포하였으며, 이들 화강암류는 광물조성 및 지구화학적 거동특성이 거의 유사하였다. 그러나 담홍색화강암은 남산 북사면에서 불암산의 북동방향으로 갈수록 대자율 값이 증가하는 자철석 계열을 보였으며, 우백질화강암은 용마산을 시작으로 남산과 인왕산 등의 편마암 경계부에 주로 나타나고 티탄철석계열의 낮은 대자율 특성을 가졌다. 이상의 내용을 종합할 때, 한양도성 석재공급지 추정을 위한 중요한 암석학적 지시자는 색상과 대자율로 판단된다. 이와 함께 채석장의 석재 양, 운반거리 및 기술력 등을 고려하여 원산지 해석의 신뢰도를 높일 필요가 있다.

기술가치평가를 위한 시장대체원가 접근법 (A Market-Based Replacement Cost Approach to Technology Valuation)

  • 강필성;금영정;박현우;김상국;성태응;이학연
    • 대한산업공학회지
    • /
    • 제41권2호
    • /
    • pp.150-161
    • /
    • 2015
  • This paper proposes a new approach to technology valuation, the market-replacement cost approach which integrates the cost-based approach and market-based approach. The proposed approach estimates the market-replacement cost of a target technology using R&D costs of similar R&D projects previously conducted. Similar R&D projects are extracted from project database based on document similarity between project proposals and technology description of the target technology. R&D costs of similar R&D projects are adjusted by mirroring the rate of technological obsolescence and inflation. Market-replacement cost of the technology is then derived by calculating the weighted average of adjusted costs and similarity values of similar R&D projects. A case of "Prevention method and system for the diffusion of mobile malicious code" is presented to illustrate the proposed approach.

2-패스 색인 기법과 규칙 기반 질의 처리기법을 이용한 고속, 고성능 질의 응답 시스템 (A Fast and Powerful Question-answering System using 2-pass Indexing and Rule-based Query Processing Method)

  • 김학수;서정연
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제29권11호
    • /
    • pp.795-802
    • /
    • 2002
  • 본 논문은 2-패스 점수 부여 방법에 기초한 정답 후보 색인기를 이용하여 고속, 고정밀의 질의 응답을 실현하는 한국어 질의 응답 시스템을 제안한다. 제안한 정답 후보 색인기의 색인 과정은 다음과 같다. 먼저, 대상 문서에 포함된 모든 정답 후보들을 추출한다. 그리고, 2-패스 점수 부여 방법을 이용하여 각 정답 후보와 밀접하게 연관된 주변 내용어들에게 점수를 부여한다. 마지막으로 데이터베이스에 각 정답과 점수가 부여된 내용어들을 역파일 형태로 저장한다. 사용자의 질의에 포함된 의도(질의 유형)을 파악하기 위해서는 수동으로 구축된 lexico-syntactic 패턴을 이용한다. 이러한 색인 방법과 질의 처리 방법을 이용하여, 제안된 질의 응답 시스템은 빠른 응답 시간을 보장하고 정확률을 향상시킨다.

택시 데이터에 대한 효율적인 Top-K 빈도 검색 (Finding Frequent Route of Taxi Trip Events Based on MapReduce and MongoDB)

  • ;안성아;;정한유;권준호
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제4권9호
    • /
    • pp.347-356
    • /
    • 2015
  • IoT(사물인터넷) 기술의 빠른 개발로 인하여 기존의 택시들은 디스패처와 위치 시스템을 통해 서로 연결되고 있다. 일반적으로 현대의 택시들은 경로 정보를 획득하기 위한 목적으로 GPS(Global Positioning System)를 탑재하고 있다. 택시 운행 데이터들의 경로 빈도를 분석하여, 주어진 질의 시간에 해당하는 빈번한 경로를 찾을 수 있다. 그러나 위치 데이터의 용량이 매우 크고 복잡하기 때문에 택시의 운행 이벤트의 위치 데이터를 분석된 빈도 정보로 변환할 때에 확장성 문제가 발생한다. 이 문제를 해결하기 위하여, NoSQL 데이터베이스에 기반한 택시 운행 데이터에 대한 Top-K 질의 시스템을 제안한다. 첫째, 원시 택시 운행 이벤트를 분석하고 모든 경로들의 빈도 정보를 추출한다. 추출한 경로 정보는 NoSQL 문서-지향 데이터베이스인 MongoDB에 해시 기반의 인덱스 구조로 저장한다. 주로 발생하는 경로에 대한 효율적인 Top-K 질의 처리는 몽고DB의 상에서 이루어진다. 미국 뉴욕시의 실제 택시 운행 데이터를 이용한 실험을 통하여 알고리즘의 효율성을 검증하였다.

사회망 기반 순환 탐지 기법을 이용한 저자명 명확화 기법 (Name Disambiguation using Cycle Detection Algorithm Based on Social Networks)

  • 신동욱;김태환;정하나;최중민
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제36권4호
    • /
    • pp.306-319
    • /
    • 2009
  • 이름은 사람을 구별하기 위한 특징이지만 여러 사람이 하나의 이름을 공유하는 경우와 한 사람이 여러 이름을 사용하는 경우 때문에 이름만으로는 사람을 명확히 구별할 수 없다. 이러한 문제는 정보 검색 분야에서 문서 검색이나 웹 검색, 데이터베이스 통합 등에 영향을 미친다. 특히 서지 정보에는 저자들 중 동명이인이 존재하거나 한 저자가 축약된 이름 혹은 잘못된 철자를 사용하기도 하기 때문에 에러정보가 많이 포함되어 있다. 이러한 문제를 해결하기 위해 데이터베이스에 입력된 자료 중 이름에 대한 정보를 명확하게 해야 한다. 본 논문에서는 저자간의 관계로부터 구축된 사회망을 이용해 이름의 모호성을 해결하는 방법을 제안하고 컴퓨터 과학 서지정보를 제공하는 DBLP(Digital Bibliography & Library Project) 데이터를 기반한 실험을 통해 제안한 시스템의 성능의 효율성을 평가하였다.

XML 데이터베이스를 활용한 성과물 관리 프로세스의 효과 (Effective Management of Construction Information Using a XML Based Project Deliverable Management System)

  • 문성우;양병수
    • 대한토목학회논문집
    • /
    • 제26권3D호
    • /
    • pp.481-489
    • /
    • 2006
  • 건설사업의 관리는 정보화 환경에서 이뤄지고 있으며, 건설업무 추진 중 많은 양의 건설정보가 생성된다. 사업종료 후 건설정보는 성과물 형태로 정리되어서 발주자에게 이관된다. 정보화의 발전에도 불구하고 성과물은 문서, 자료 등 파일을 CD로 작성하여 제출하는 방법을 현재 따르고 있다. 기업의 관점에서 다수의 프로젝트가 존재할 경우 파일형태의 성과물 관리는 데이터 관리에 있어서 비효과적이다. 본 논문은 XML 데이터베이스를 기반으로 하는 성과물 관리 프로세스를 제시하여 프로젝트 성과물의 활용성을 높이는 것을 목적으로 한다. 새롭게 제시된 프로세스에서는 건설 프로젝트의 성과물을 단순한 파일 형태로 제공하는 것이 아니라 데이터베이스 형태로 제공한다. 본 연구의 효과를 검증하기 위해서 개발된 XML 데이터 베이스 기반의 성과물관리시스템 파일럿은 성과물 자료의 이관을 편리하게 할 뿐만 아니라, 데이터의 저장과 검색, 수정을 용이하게 하여 성과물의 활용성을 높인다는 것을 보여준다.

도식화 피스기반 2D패션 디자인 시스템의 설계 및 구현 (Design and Implementation of 2D Fashion Design System based on Diagraming Piece)

  • 김영운;이혜정;정성태;정석태;이용주;조진애
    • 한국컴퓨터정보학회논문지
    • /
    • 제9권1호
    • /
    • pp.45-54
    • /
    • 2004
  • 국내 의류$.$패션디자인 분야의 CAD및 도식화 프로그램은 다양하게 존재하고 있으나. 본 연구에서는 데이터베이스 시스템을 접목한 피스 기반의 디자인 CAD와 도식화 시스템을 구현하였다. 본 시스템에서는 도식화 피스에 대하여 다양한 분류와 검색어를 제공해 디자이너가 사용하고자 하는 데이터를 빠르고 쉽게 찾아 활용할 수 있다. 본 시스템의 특징은 사용하기 쉬운 사용자 인터페이스(GUI) 다양한 드로잉 도구 지원, 벡터형식 문서지원, XML 기반의 데이터 활용, 다양한 라이브러리 제공, 쉬운 Mapping 기능 등을 제공한다.

  • PDF

XML기반의 수강신청 관리 시스템 설계 및 구현 (Design and Implementation of Student Taking a course application Management System Based on XML)

  • 윤호군
    • 한국게임학회 논문지
    • /
    • 제2권2호
    • /
    • pp.104-112
    • /
    • 2002
  • 효율적인 데이터 관리 및 처리를 위하여 XML이 웹 기반 웅용 시스템 에 적용되었다. 또한, ASP는 쉬운 웹 기반 프로그래밍의 구현을 가능하게 하였으며, UML은 시스템 모델링 기법의 새로운 대안으로 연구되고있다. 이에 관하여, 본 논문에서는 XML, ASP, UML을 이용하여 학생 수강신청 관리 시스템을 구현하였다. 이는, 학생모드와 관리자 모드로 구성되었으며, 효과적인 데이터 관리 및 처리를 위한 XML을 이용하였다. 또한, 시스템 분석 및 설계를 위하여 UML을 이용하였으며, 전체 시스템은 ASP로 구현하였다. 그리고, 데이터베이스는 MS-ACCESS를 이용하였으며, 웹 문서의 효율적인 활용을 위하여 Java Script 언어를 사용하였다.

  • PDF

u-GIS 환경에서 효율적인 공간 정보 유통을 위한 S-XML 변환 기법 (S-XML Transformation Method for Efficient Distribution of Spatial Information on u-GIS Environment)

  • 이동욱;백성하;김경배;배해영
    • 한국공간정보시스템학회 논문지
    • /
    • 제11권1호
    • /
    • pp.55-62
    • /
    • 2009
  • u-GIS 환경에서는 센서 네트워크를 통해 필요한 공간 데이터를 수집하고 이를 실시간 처리 및 가공 또는 기 저장되어 있는 정보와 함께 유통된다. 웹 기반 응용서비스 등에서 인터넷 망을 통한 정보가 요청되는 경우 표준 문서인 XML로 전달된다. 특히 요청되는 정보에 공간 데이터가 포함되는 경우 공간데이터 처리가 가능한 GML, S-XML 등의 문서가 사용된다. 이 과정에서 DSMS에서와 같이 실시간 처리된 스트림데이터는 S-XML 문서 형태로 변환되고, 웹 기반의 공간정보 응용서비스는 인터넷 망을 통해 S-XML 문서를 전달받는다. 대부분의 공간정보 응용서비스는 저장시스템으로 기존의 공간 데이터베이스 관리 시스템을 사용하기 때문에 S-XML 데이터와 SDBMS에서 사용되는 데이터간의 상호 변환과정이 필요하다. 본 논문에서는 공간 데이터의 캐싱을 이용한 S-XML 변환 기법을 제안한다. 제안 기법은 공간 정보유통을 위한 S-XML과 관계형 공간 데이터베이스와의 효율적인 변환을 위해, S-XML에서 공간 데이터에 해당하는 부분을 캐싱하고, 동일 지역의 공간데이터에 대한 변환이 요구될 경우 캐시 데이터를 재사용하여 별도의 변환 비용 없이 변환한다. 제안 기법을 통해 u-GIS 환경에서 공간정보의 유통을 위한 S-XML 문서와 이를 이용하는 웹 기반 공간정보 응용서비스 사이의 변환 비용을 감소하였으며, 성능평가를 통하여 질의 처리 성능이 향상됨을 보인다.

  • PDF