• 제목/요약/키워드: HTML documents

검색결과 149건 처리시간 0.049초

Oracle8i XDK를 이용한 XML 문서의 저장 (Storing XML Documents using Oracle8i XDK)

  • 하상호;이강석;백인천
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 2000년도 춘계학술발표논문집
    • /
    • pp.324-327
    • /
    • 2000
  • XML은 웹 상에서 데이터의 원활한 교환을 위해서 HTML을 보완하여 설계된 차세대 인터넷문서작성용언어이다. XML 문서와 같은 반구조(semistructured) 의 특성을 갖는 데이터를 효과적으로 다루기 위한 새로운 데이터모델과 질의어가 제안되어 오고 있지만, 여기서는 관계형 데이터베이스에 XML 문서를 효과적으로 저장하는 방법에 관해서 논의한다. 먼저, 도서를 표현하는 XML 문서를 위한 DTD를 제시하고, 이 DTD를 관계 테이블로 변환하는 방법을 논의한다. 다음에는 Oracle서 지원하는 XDK를 이용하여 XML문서를 Oracle8i DB에 저장하는 방법에 대해서 논의한다.

  • PDF

구조 정보를 이용한 웹 문서 범주화 모형 (A Categorization Model Based On Information Structure of HTML Documents)

  • 조이영;최상희;정영미
    • 한국정보관리학회:학술대회논문집
    • /
    • 한국정보관리학회 2000년도 제7회 학술대회 논문집
    • /
    • pp.147-152
    • /
    • 2000
  • 본 연구는 다양한 웹 문서를 효과적으로 범주화 할 수 있는 모형을 구축하는데 그 목적이 있다. 이를 위해 본 연구에서는 웹 문서가 가지고 있는 구조 정보인 링크(link)와 문서 단계(level)를 활용하여 문서 유형을 식별한 후, 각 유형별로 범주화 과정을 달리 적용하여 범주화 성능을 개선시키는 방법을 고안하였다.

  • PDF

웹 기반 경영과학 교육 시스템 ORED의 개발 (The Development of ORED, a Web-Based Educational System for Operations Research)

  • 박순달;임성묵;도승용;이승석;김호동
    • 경영과학
    • /
    • 제19권1호
    • /
    • pp.89-106
    • /
    • 2002
  • ORED is a Web-Based educational system for operations research. It consists of operations research theories, help system for theories, cases, application programs and management system. Users can study theories and cases through HTML documents and solve Problems with java applet and servelet programs. The help system provides users with detailed explanations of theories. And the management system provides the administrator with efficient tools necessary for managing the ORED In the Web.

복잡한 컬러 문서에 대한 문자인식 (A Character Recognition on Complex Color Documents)

  • 양철용;김갑기;김진욱;김항준
    • 융합신호처리학회 학술대회논문집
    • /
    • 한국신호처리시스템학회 2000년도 하계종합학술대회논문집
    • /
    • pp.233-236
    • /
    • 2000
  • 최근 수많은 인쇄된 문서들이 HTML과 같은 디지털 문서로 바뀌고 있으며 이를 자동으로 변환해 주는 문자인식 기술에 대한 관심이 증가하고 있다. 본 논문에서는 그림과 글자가 공존하는 문서에서 자동으로 문자영역을 추출해서 문자를 인식하는 방법을 제안한다. 우선 입력문서는 유사한 칼라로 이루어진 영역들로 나누어진 뒤 휴리스틱 룰에 의해 문자후보 영역과 비 문자 영역으로 나누어진다. 그 다음 이들 문자후보영역들은 문자인식기를 이용하여 문자 혹은 문자의 일부분으로 인식된다. 제안된 방법으로 여러 문서들에 대하여 실험한 결과를 보이며 그 성능을 평가한다.

  • PDF

웹 번역문서 판별과 병렬 말뭉치 구축 (Judging Translated Web Document & Constructing Bilingual Corpus)

  • Jee-hyung, Kim;Yill-byung, Lee
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 가을 학술발표논문집 Vol.31 No.2 (1)
    • /
    • pp.787-789
    • /
    • 2004
  • People frequently feel the need of a general searching tool that frees from language barrier when they find information through the internet. Therefore, it is necessary to have a multilingual parallel corpus to search with a word that includes a search keyword and has a corresponding word in another language, Multilingual parallel corpus can be built and reused effectively through the several processes which are judgment of the web documents, sentence alignment and word alignment. To build a multilingual parallel corpus, multi-lingual dictionary should be constructed in each language and HTML should be simplified. And by understanding the meaning and the statistics of document structure, judgment on translated web documents will be made and the searched web pages will be aligned in sentence unit.

  • PDF

Adaptive User Profile for Information Retrieval from the Web

  • Srinil, Phaitoon;Pinngern, Ouen
    • 제어로봇시스템학회:학술대회논문집
    • /
    • 제어로봇시스템학회 2003년도 ICCAS
    • /
    • pp.1986-1989
    • /
    • 2003
  • This paper proposes the information retrieval improvement for the Web using the structure and hyperlinks of HTML documents along with user profile. The method bases on the rationale that terms appearing in different structure of documents may have different significance in identifying the documents. The method partitions the occurrence of terms in a document collection into six classes according to the tags in which particular terms occurred (such as Title, H1-H6 and Anchor). We use genetic algorithm to determine class importance values and expand user query. We also use this value in similarity computation and update user profile. Then a genetic algorithm is used again to select some terms from user profile to expand the original query. Lastly, the search engine uses the expanded query for searching and the results of the search engine are scored by similarity values between each result and the user profile. Vector space model is used and the weighting schemes of traditional information retrieval were extended to include class importance values. The tested results show that precision is up to 81.5%.

  • PDF

Cognitive Based Context Aware Reference History Management Tool

  • Punithan, Dharani;McKay, Bob
    • 한국HCI학회:학술대회논문집
    • /
    • 한국HCI학회 2009년도 학술대회
    • /
    • pp.227-231
    • /
    • 2009
  • The aim of the research is to focus on the cognitive principles and to achieve human-level intelligence in referring context based browser history and the Windows history. One of the major problems faced by today's computer users is insufficient and single exclusive context based reference of the browser history and the Windows history. Today we search for the browser history and Windows history in different places even though the context is the same. For e.g., When working on a research paper or preparing a business presentation, a user may require to refer many web sites on the internet and various documents on the local computer. The browser can provide only time based history. The windows document history is also time based and limited to list only few documents. Hence, we propose a tool "Cognitive Based Context Aware Reference History Management Tool" which helps to access the exclusive reference of context and time based history in one place. The tool also proposes to store image history with urls and classifies images of a specific topic accessed in different time, bookmarks management and cross browser history management. These features are very useful as we can access all related documents (doc, docx, ppt, pptx, pdf, txt, and html), web pages, images and bookmarks in one place. The tool uses the cognitive principles like classification and association to achieve the purpose.

  • PDF

A XML/EDI System for Maritime Export Customs Clearance

  • Kim, Hyun S.;Park, Nam K.;Hyung R. Chol
    • 한국지능정보시스템학회:학술대회논문집
    • /
    • 한국지능정보시스템학회 2001년도 The Pacific Aisan Confrence On Intelligent Systems 2001
    • /
    • pp.45-49
    • /
    • 2001
  • Korean government and companies have given a lot of their efforts to exchange electronic documents between themselves and their partners. As the results of them. Korean EDI standards were made by Korean EDIFACT Committee and the standards have been used by companies and governmental organization in Korea. However, Korean export customs clearance EDI system is based on VAN(Value Added Network) and one VAN company ha monopolistic right to relay EDI documents to Korean Customs Service. Therefor is leads to a lot of problems such as inconvenient software, expensive transmission fee and the difficulty of connection with the in-house systems of user companies. To solve these problems, a few good solutions and systems have been suggested and one of them is the Internet EDI. we will suggest a new export customs clearance EDI system running on the Web. This system is basically an Internet EDI system, but we have developed this system using XML instead of HTML, XML is a new markup language with merit such as isolating data from style of documents. This system consists of 7 modules, schema/style/template management, XML/EDI document management, XML/EDI transformation, EDI transmission, certification management and log management. Also this system can be used with other traditional EDI systems that have UN/EDIFACT standards. We will discuss the advantages and disadvantages of XML/EDI system for customs clearance. The development of this system will be a leading study for XML/EDI standards in export clearance EDI system.

  • PDF

SCORM 기반의 XML 학습 컨텐츠 검색 시스템 (XML-based Retrieval System for SCORM-based Virtual Learning Contents)

  • 최병욱;송미숙;조정원
    • 컴퓨터교육학회논문지
    • /
    • 제6권1호
    • /
    • pp.9-17
    • /
    • 2003
  • 차세대 인터넷 표준 언어인 XML(eXtensible Markup Language)은 데이터(data)와 표현(presentation) 그리고 구조(structure)가 구분되기 때문에 어느 환경에서나 재사용성이나 재구성이 용이한 장점을 보이고 있다. 본 논문에서는 XML 문서를 가상교육 시스템(Virtual Education System)의 멀티미디어 컨텐츠로 범위를 제한하여 사용자 위주의 효율적인 검색 시스템을 구현한다. 본 시스템에서는 가상교육 표준안으로 제안되고 있는 SCORM(Sharable Content Object Reference Model)에서 정의한 SCO(Sharable Content Object)단위의 메타데이터를 기반으로 컨테츠를 설계하고 각 문서를 키워드, 엘리먼트, 애트리뷰트 단위로 색인한다. 또한 사용자 인터페이스에서 엘리먼트 검색화면을 구조적으로 구성해줌으로써 사용자가 DTD(Document Type Definition)에 대한 사전지식 없이도 검색이 가능하며, XML-QL로 재구성된 XML 문서의 형태와 XSL(eXtensible markup language Stylesheet Language)을 이용한 HTML 형태의 두 가지 결과화면을 제시함으로써 사용자 선택의 폭을 넓혀준다.

  • PDF

웹 서비스 기반의 클라이언트 OLAP API와 큐브 브라우징에의 응용 사례 (A Web Services-based Client OLAP API and Its Application to Cube Browsing)

  • 배은주;김명
    • 정보처리학회논문지D
    • /
    • 제10D권1호
    • /
    • pp.143-152
    • /
    • 2003
  • 이기종 플랫폼간의 데이터 교환과 통합을 위한 표준 기술로 XML과 웹 서비스 기술이 각광을 받고 있다. 이러한 기술을 지원하는 XML/A는 클라이언트 응용과 데이터 분석 엔진이 인터넷 상에서 데이터를 교환할 수 있도록 하는 SOAP 기반의 XML 통신 API이다. 데이터가 XML 문서 형태로 교환된다는 점에서 XML/A는 플랫폼 독립적이지만, 클라이언트 응용 개발자들은 서버에 데이터를 요청할 때마다 XML 문서를 생성해야 하고, 서버가 보내는 XML 데이터 검색을 위해 별도의 XML 쿼리 언어를 사용해야 하는 단점이 있다. 본 연구에서는 윈도우즈 환경의 클라이언트 응용 개발자들이 XML/A의 OLAP 관련 서비스를 편리하게 사용할 수 있도록 하는 상위 수준의 클라이너트 OLAP API인 XMLMD를 설계하고 구현하였다. XML/A와 XML/A의 관계는 OLEDB for OLAP과 ADOMD의 응용 사례로써 데이터의 다차원적 분석결과를 인터넷을 통해 제공하는 웹 OLAP 큐브 브라우저도 개발하였다. 이 브라우저는 전송된 데이터를 XML, HTML, 엑셀, 그래프 등의 다양한 형태로 제공한다.