• 제목/요약/키워드: Page Object

검색결과 53건 처리시간 0.023초

병렬공간 조인을 위한 객체 캐쉬 기반 태스크 생성 및 할당 (Task Creation and Assignment based on Object Caching for Parallel Spatial Join)

  • 서영덕;김진덕;홍봉희
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제26권10호
    • /
    • pp.1178-1178
    • /
    • 1999
  • A spatial join has the property that its execution time exponentially increases in proportion to the number of spatial objects. Recently, there have been many attempts for improving the performance of the spatial join by using parallel processing schemes, In the case of executing parallel spatial join using the parallel machine with shared disk architecture, the disk bottleneck of parallel processing of spatial join worsens in comparison with sequential spatial join. This paper presents the algorithms of task creation and assignment to reduce the disk bottleneck caused by accessing the shared disk at the same time, and to minimize message passing between processors, This paper proposes object caching which is a higher level of abstraction than page caching, and uses it to do creation and assignment of tasks according to temporal and spatial localities for minimizing disk access time. The object caching shows the performance improvement of 50%. The task creation and assignment using localities gives the gain of 30% and 20%. Overall performance evaluation of the proposed algorithms shows 7.2 times speed up than those of sequential execution of spatial joins.

XSL-FO 문서를 PostScript Format으로 변환하기 위한 PostScript-Converter에 관한 연구 (A Study on PostScript-Converter for conversion XSL-FO into PostScript Format)

  • 유동석;김차종
    • 한국정보통신학회논문지
    • /
    • 제8권3호
    • /
    • pp.614-621
    • /
    • 2004
  • 현재의 전자문서처리 환경은 WYSIWYG 방식이다. 이를 위해 문서를 논리적인 구조와 물리적인 구조로 구조화하였고 이러한 구조를 마크업언어로 표현하고 있다. 특히 인터넷상의 전자문서 작성 및 교환을 위한 마크업언어로 XML이 발표되어 전자문서의 표현과 같은 전통적인 사용에서부터 검색을 위한 데이터베이스화에 이르기까지 전자문서의 활용 영역이 다양해지고 있다. 그러나 출력 품질면에서 워드프로세서나 전자출판에 의한 전자문서와 XML 문서의 출력 품질은 매우 큰 차이가 있다. 이는 비록 XML 문서가 스타일 정보를 포함하고 있긴 하지만 화면 출력과 인쇄 매체로의 출력 모두 고품질의 출력을 위한 적용이 부족했기 때문이다. 이러한 문제 해결을 위해 W3C에서는 고품질의 XML 출력 문서를 얻을 수 있도록 XSL-FO(XSL-Formatting Object)를 개발하였다. 한편 고품질의 전자출판물을 얻기 위해 폐이지 기술 언어(PDL)가 필요하고, 이의 업계표준인 Postscript가 이미 널리 사용되고 있다. 따라서 본 논문에서는 XML-FO를 PostScript에 적용함으로써 고품질의 XML 출력문서를 얻기 위한 변환기를 설계하였다.

Object detection in financial reporting documents for subsequent recognition

  • Sokerin, Petr;Volkova, Alla;Kushnarev, Kirill
    • International journal of advanced smart convergence
    • /
    • 제10권1호
    • /
    • pp.1-11
    • /
    • 2021
  • Document page segmentation is an important step in building a quality optical character recognition module. The study examined already existing work on the topic of page segmentation and focused on the development of a segmentation model that has greater functional significance for application in an organization, as well as broad capabilities for managing the quality of the model. The main problems of document segmentation were highlighted, which include a complex background of intersecting objects. As classes for detection, not only classic text, table and figure were selected, but also additional types, such as signature, logo and table without borders (or with partially missing borders). This made it possible to pose a non-trivial task of detecting non-standard document elements. The authors compared existing neural network architectures for object detection based on published research data. The most suitable architecture was RetinaNet. To ensure the possibility of quality control of the model, a method based on neural network modeling using the RetinaNet architecture is proposed. During the study, several models were built, the quality of which was assessed on the test sample using the Mean average Precision metric. The best result among the constructed algorithms was shown by a model that includes four neural networks: the focus of the first neural network on detecting tables and tables without borders, the second - seals and signatures, the third - pictures and logos, and the fourth - text. As a result of the analysis, it was revealed that the approach based on four neural networks showed the best results in accordance with the objectives of the study on the test sample in the context of most classes of detection. The method proposed in the article can be used to recognize other objects. A promising direction in which the analysis can be continued is the segmentation of tables; the areas of the table that differ in function will act as classes: heading, cell with a name, cell with data, empty cell.

테라헤르츠 신호를 이용한 영상의 글자 추출을 위한 화질 개선처리에 대한 연구 (A Study of Image Enhancement Processing for Letter Extraction of Image Using Terahertz Signal)

  • 김성윤;최현근;박인호;김영섭;이용환
    • 반도체디스플레이기술학회지
    • /
    • 제16권3호
    • /
    • pp.111-115
    • /
    • 2017
  • Terahertz waves are superior to conventional X-ray or Magnetic Resonance Tomography(MRI), and the amount of information that can be transmitted is as large as thousands of times that conventional X-ray or MRI. In addition, Terahertz waves have great performance in analyzing an object which have some layered structure. By using this advantage, we can extract the letters of a page by analyzing information such as absorption amount and reflection amount by irradiating a closed book with pulses of various frequencies within gap of a terahertz wave. However, in the image of each page using the Terahertz wave might be obtained various kinds of noise and the different character occlusion region. So, to extract letters from the terahertz image, we must take the noise and occlusion region away. We have been working to enhancement the image quality in various ways, and keep on studying de-noising processing for enhancement about the image quality and high resolution. Finally, we also keep on studying about OCR(Optical Character Recognition) technology, which based on pattern matching technique, to read letters.

  • PDF

유비쿼터스 환경의 원격교육을 위한 저작도구의 개발 (The Development of Authoring Tool for Distance Education of Ubiquitous Environment)

  • 김치수;임재현
    • 정보교육학회논문지
    • /
    • 제8권3호
    • /
    • pp.365-372
    • /
    • 2004
  • 본 논문은 자체 에디터가 포함된 벡터 기반의 원격교육시스템(FVU)을 개발함으로써 컨텐츠 제작의 편의성을 높이고, 보다 효율적으로 원격교육 매체를 제작할 수 있는 저작도구를 만들고자 하였다. 본 논문에서는 UML을 이용하여 저작도구를 설계하였으며 FVU라 명명하였다. FVU의 VUEditor에서는 강의에 필요한 첫 화면을 구성할 수 있으며, 이렇게 제작된 강의안은 Vector변환을 통해서 VUAuthor로 익스포트(Export)함으로써 파일 사이즈를 감소시키며, 낮은 대역폭을 형성하게 한다. 또한 교수자는 VUEditor에서 이미지 삽입, 도형 그리기, 텍스트 입력, 지우기 등의 작업을 할 수 있으며, VUAuthor에서 교재 제작 과정 중 잘못 그려진 선, 도형 등을 수정할 수도 있도록 설계되었다. 이러한 설계는 결과적으로 이미지 툴이나 파워포인트와 같은 응용 프로그램이 없어도 강의에 필요한 첫화면을 VUEditor 자체적으로 구성할 수 있도록 하였으며, 교수자의 컨텐츠 제작에 편의성을 향상시켰으며, 결과 파일의 크기가 작아지므로 유비쿼터스 무선 환경에서의 원격교육에 적합하도록 네트워크 트래픽의 문제를 다소 해결하였다.

  • PDF

시그니처 기반 블록 탐색을 통한 XML 질의 최적화 기법 (An XML Query Optimization Technique by Signature based Block Traversing)

  • 박상원;박동주;정태선;김형주
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제29권1호
    • /
    • pp.79-88
    • /
    • 2002
  • 인터넷에서 사용되는 많은 데이터들이 XML로 표현되고 있는 추세이다. 이러한 XML 데이터는 트리 형태로 표현되므로 이것을 저장하고 질의하는 시스템으로 그 모델링 능력 때문에 객체 저장소가 적합하다. 객체 저장소에서 XML의 각 노드는 객체로 저장된다. XML 질의의 특징은 정규 경로식으로 표현되는 것이며 이것은 XML 트리의 각 객체를 탐색하면서 처리된다. 정규 경로식을 지원하기 위하여 여러 인덱스들이 제안되었지만 이러한 인덱스들은 디스크 공간이라는 제약 때문에 모든 가능한 경로에 대한 인덱스를 제공하지는 못한다. 이러한 상태에서 정규 경로식을 잘 지원하기 위해서 블록 탐색과 시그니처 방법을 이용하여 질의를 효과적으로 처리하는 최적 객체 탐색 기법을 제안하였다. 시그니처는 트리의 각 노드에 시그니처를 첨가하여 탐색 범위를 줄이는 것이다. 블록 탐색은 한 페이지 내에 있는 접근 가능한 객체들을 미리 처리함으로써 디스크 I/O를 줄이는 것이다. 이와 같은 두가지 방법을 같이 이용하면 일반적인 질의 처리보다 월등히 나은 성능을 보인다는 것을 실험을 통하여 보였다.

이동 객체 데이타베이스에서 KDB-tree의 동적 분할 정책 (The Dynamic Split Policy of the KDB-Tree in Moving Objects Databases)

  • 임덕성;이창헌;홍봉희
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제33권4호
    • /
    • pp.396-408
    • /
    • 2006
  • 시간의 흐름에 따라 누적되는 대용량의 과거 위치를 관리하는 이동 객체 데이타베이스에서 이동 객체의 과거 위치를 효율적으로 검색하기 위해서는 이동 객체의 특성을 고려한 색인 구조가 필요하다. 그러나, 영역 질의 성능이 우수한 다차원 색인인 KDB-tree를 이동 객체 데이타베이스에 적용할 경우 시간 도메인이 증가하는 이동 객체 데이타베이스의 특성으로 인해 공간 도메인 가중 분할이 발생한다. 공간 도메인 가중 분할은 하나의 노드가 차지하는 MBR의 공간 영역이 분할 횟수에 반비례하게 감소되어 시공 간 영역 질의 처리시 색인의 검색 비용을 증가시키는 문제가 있다. 이 논문에서는 이동 객체 데이타베이스에서 시공간 영역 질의를 효율적으로 처리하기 위한 KDB-tree의 동적 분할 정책을 제안한다. 동적 분할 정책은 공간 우선 분할 방법을 적용하는 분할 도메인 선정 방법과 포인터 페이지에서 공간 활용도를 최대화시킬 수 있는 최근 시간 분할 정책, 영역 페이지에서 적용되는 최후 시간 분할 정책으로 구성된다. 제안한 동적 분할 정책의 성능을 평가하기 위해 3DR-tree, MV3R-tree, KDB-tree와의 성능을 비교한다. 영역 질의를 위한 성능 평가에서 동적 분할 정책을 적용한 MKDB-tree는 기존 색인에 비해 평균 30% 이상의 노드 접근 회수를 감소시킨다.

다차원 중포 속성 색인구조의 최적 설계기법 (An Optimal Design Method for the Multidimensional Nested Attribute Indexes)

  • 이종학
    • 한국멀티미디어학회논문지
    • /
    • 제6권2호
    • /
    • pp.194-207
    • /
    • 2003
  • 본 논문에서는 객체 데이터베이스 시스템에서 중포 속성에 대한 색인구조로 다차원 색인구조를 이용하는 다차원 중포 속성 색인구조(Multidimensional Hefted Attribute Index: MD-NAI)의 최적 설계 기법을 제시한다. MD-NAI는 $B^{+}$-tree와 같은 일차원 색인구조를 이용한 중포 속성 색인구조에서 지원할 수 없는 클래스 계층과 중포 속성이 포함된 복합 형태의 질의들에 대한 처리를 잘 지원할 수 있다. 그러나, MD-NAI는 사용자 질의 형태에 따라 색인검색의 성능이 매우 나빠질 수 있다 본 논문에서는 질의 형태에 따른MD-NAI의 성능 개선을 위하여, 먼저 중포 술어에 대한 질의 정보로서 색인 페이지 영역의 최적 모양을 결정하고, 이 최적 모양을 갖는 색인페이지 영역의 모양이 되도록 하는 영역분할 전략을 적용하여 최적의 MD-NAI를 구성한다. 또한, 성능평가를 위하여 MD-NAI를 이용하여 다양한 중포 술어의 형태와 객체 분포에 대하여 실시한 실험 결과를 제시한다. 성능평가의 결과에 의하면, 주어진 질의 패턴에 따라 최적 의 MD-NAI를 구성할 수 있었으며, 삼차원 MD-NAI의 경우에 질의 영역의 구간비가 1:16:256일 때 기존의 순환분할 전략에 의한 MD-NAI에 비해 성능이 5.5배 이상까지 향상되었다.

  • PDF

웹상에서의 의사결정모형의 객체지향적 표현과 관리를 위한 구조적 마크업 언어 (A Structured Markup Language for the Object-Oriented Representation and Management of Decision Models on the Web)

  • 김형도
    • Asia pacific journal of information systems
    • /
    • 제8권2호
    • /
    • pp.53-67
    • /
    • 1998
  • The explosive growth of the Web is providing end-users access to ever-increasing volumes of information. The resources of legacy systems and relational databases have also been made available to the Web browser, which has become an essential business tool. Recently, model management on the Internet/Web is also proposed with its conceptual design or prototypical system like DecisionNet and DSS Web. However, they are also suffering from the same symptoms as the Web, Although we can identify the elements of a page with HTML tags and (declare) the relationships among the various document elements, they are semantically opaque to computer systems and have no domain-specific meaning. However, HTML is not extensible, so developers are forced to invent convoluted, non-standard solutions for embedding and parsing data. Extensible Markup Language (XML) is a simplified subset of SGML that has many benefits for folks who want to improve structure, maintainability, searchability, presentation, and other aspects of their document management. This paper proposes a structured markup language for model representation and management on the Web as an XML application. The language is based on a conceptual modeling framework, Object-Oriented Structured Modeling (OOSM), which is an extension of the structured modeling.

  • PDF

Symbolic Meanings in Postmodern Fashion Advertisements

  • Lee, Jaeil
    • The International Journal of Costume Culture
    • /
    • 제7권1호
    • /
    • pp.17-27
    • /
    • 2004
  • Using semiotic analysis, visual images in selected postmodern fashion advertisements were analyzed. Semiotics is the study of the structure of the meanings of signs. Semiotic analysis involves deconstruction, and thus draws on the researcher’s value-mediated introspection and subjective interpretation of texts i.e., ads). Through deconstruction, culturally assigned meanings, which represent consumers and culture, were revealed. Postmodern characteristics including open interpretation, use of the human body as an object, multi page format, new mood, black and white scenes, use of real people, and new ideology were identified in the ads. The importance of analyzing visual images in fashion ads was stressed in the findings of the study, as was the importance of educating consumers on how to read the visual images.

  • PDF