• Title/Summary/Keyword: 인터넷 색인작성

Search Result 11, Processing Time 0.023 seconds

A Study on Web Indexing (웹 색인작성에 관한 연구)

  • 윤구호
    • Journal of Korean Library and Information Science Society
    • /
    • v.33 no.2
    • /
    • pp.235-258
    • /
    • 2002
  • Since 1991 when the first Web pages wore placed on the internet, information access for numerous Web sites has developed new indexing methods which are different from traditional methods. This paper, as a basic research, deals with Web indexing(Website indexing). Embedded indexing providing basics of Web indexing is examined, and essential META tags used in Web indexing are reviewed in brief. Finally, all the important issues of Web indexing are investigated in detail.

  • PDF

The Design for Ancient Literature Retrival System Using XML (XML 기반의 고문헌 검색 시스템 설계)

  • 이근우;이근무
    • Proceedings of the Korea Multimedia Society Conference
    • /
    • 2001.06a
    • /
    • pp.390-394
    • /
    • 2001
  • 논문에서는 최근 인터넷 상에서 표준 공통 포맷으로 대두되는 XML을 이용하여 웹 기반의 역사자료의 데이터베이스 검색 시스템을 설계 및 구현하였다. 원격 교육 시스템의 참조문헌 지원 시스템을 설계하였다. 컴퓨터 상에서 고문헌 자료 주로 한자를 입력하고 검색할 수 있는 환경이 점차 나아지고 있다고는 하지만, 여전히 원전사료의 한자를 일반적인 환경에서 자유롭게 구현하는 일은 결코 용이하지 않다. 종래의 연구자들은 텍스트 별로 수작업으로 작성한 색인류를 이용하여 연구를 해왔다. 그러나 이러한 색인 이용방법에는 문제가 있다. 색인어로 삼고자 하는 단어를 텍스트에서 추출하는 과정에서 누락되는 경우가 있기 때문이다. 전산화된 데이터는 이른바 '발견적 이용'이라는 관점에서 활용될 수 있다.

  • PDF

Operations And Assignments Of Multidimensional Nested Element Indexs For XML Databases (XML 데이터베이스를 위한 다차원 중포 엘리먼트 색인구조의 운용과 할당)

  • Lee, Jung-A;Lee, Jong-Hak
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2006.11a
    • /
    • pp.401-404
    • /
    • 2006
  • 최근 XML 데이터베이스는 웹의 발전과 더불어 광범위한 인터넷의 자원 공유에 크게 기여하고 있다. XML로 작성된 문서를 저장하고 검색하기 위해 XML 문서의 저장, 질의언어, 질의처리 등에 대한 분야가 활발히 연구되고 있다. 특히 그 중 질의처리의 처리비용을 줄이기 위한 데이터 질의 최적화 기법에 관한 연구가 중요한 과제이다. 증포된 엘리먼트에 대한 기존의 색인기법들은 일차원 색인구조를 이용함으로써 XML Schema가 가지는 타입상속 개념을 고려한 XML 질의들에 대한 처리를 효율적으로 지원하지 못하는 문제점을 가지고 있다. 따라서 본 논문에서는 XML Schema가 가지는 타입상속 개념을 고려한 XML 질의들에 대한 처리를 효율적으로 지원할 수 있는 다차원 증포 엘리먼트 색인구조와 다차원 경로 엘리먼트 색인구조의 운용법을 제시한다. 또한 효과적인 질의 처리를 하기 위한 XML 데이터베이스 색인구조의 유지비용을 줄이기 위하여 저장 공간 및 갱신 유지 비용을 최소화할 수 있는 효과적인 색인할당 방법을 제시한다.

  • PDF

Retrieval of Large scaled XML Documents based on Path Query using Inverted indexes (역 색인을 이용한 경로 질의 기반 대용량 XML문서 검색)

  • Moon, Kyung-Won;Hwang, Byung-Yeon
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2005.05a
    • /
    • pp.35-38
    • /
    • 2005
  • 1998년 XML 문서 표준이 제안된 이래, 다양한 응용 분야에서 XML은 데이터를 표현하는 표준으로 자리잡아 가고 있다. 특히, 인터넷상의 많은 데이터들이 XML 형태로 작성되고 변환됨에 따라 다량의 XML 데이터가 생성되고 있다. 따라서 현재 XML 문서의 저장 및 질의 처리 기법의 연구가 활발하게 진행되고 있다. 하지만 기존의 연구는 대용량 XML 문서를 다루기에는 미흡한 점이 있다. 본 논문에서는 인터넷상의 널리 퍼져있는 방대하고, 다양한 구조의 XML문서들을 대상으로 패스 기반 질의를 빠르게 처리할 수 있는 검색 기법을 제안한다. 제안된 기법은 인터넷상에 산재해 있는 여러 XML 문서를 관계형 데이터베이스에 효율적으로 저장하고 질의를 통해 인터넷상 XML 문서의 엘리먼트를 빠르게 검색하는데 주안점을 둔다. 먼저, XML 문서를 관계형 데이터베이스에 효율적으로 저장하는 계층형 XML 저장 기법을 제안하고, 정보 검색 시스템에서 많이 사용하는 역 인덱스를 사용하여 저장된 XML 문서에 대한 검색 성능을 향상시킨다.

  • PDF

Clustering Method Of Plagiarism Document To Use Similarity Syntagma Tree (유사 어절 트리를 이용한 표절 문서의 Clustering 방법)

  • Cheon, Seung-Hwan;Kim, Mi-Young;Lee, Guee-Sang
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2002.11c
    • /
    • pp.2269-2272
    • /
    • 2002
  • 인터넷과 컴퓨터를 이용한 학생들의 과제물을 평가하는데 있어 표절의 용이성으로 인해 정확히 판별하는 것은 매우 어렵고 번거로운 일이다. 특히 동일한 주제에 대해서 작성되는 경우가 많으므로 독자적으로 작성된 문서와 표절되어진 문서를 판별하기가 쉽지 않다. 이것은 클러스터링 하고자 하는 문서들에서 주요 단어들 즉, 색인어들의 출현 빈도를 추출한 뒤 이를 이용하여 가장 적합한 Clustering을 찾는 기존의 정보 검색 방법들과는 전혀 다른 문제이다. 본 논문에서는 과제물의 평가에 지침을 제공할 수 있도록 유사 어절 트리를 이용한 표절 유사도에 따른 Cluster들을 생성하는 방법에 대해 제안한다.

  • PDF

A study on the use of DDC scheme in directory search engine for research information resources on internet (인터넷 학술정보자원의 디렉토리 서비스 설계에 있어서 DDC 분류체계의 활용에 관한 연구)

  • 최재황
    • Journal of the Korean Society for information Management
    • /
    • v.15 no.2
    • /
    • pp.47-68
    • /
    • 1998
  • Although the research information resources on Internet are spread out on thousands of computers, it is not always easy to get them on the right time by the right manner. The purpose of this study is to use DDC(Dewey Decimal Classification) scheme in subject-based directory search engine for research information resourcees to aid retrieval on the Internet. For the design of classification code, this study followed 'systematic order' of DDC to arrange subjects from the general o the specific in a logical order, and for the design of classification dictionary, 'Relative Index' of DDC was used to bring together the various aspects of subjects.

  • PDF

Clustering System of Restaurant Review in Blog based on Word Similarity (단어 유사도를 기반으로 한 맛집 블로그 포스트 클러스터링 시스템)

  • Jo, Kyungeun;Woo, Gyun
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2015.04a
    • /
    • pp.993-996
    • /
    • 2015
  • 인터넷 블로그를 이용한 맛집 마케팅은 외식 산업에서 상당한 영향력을 발휘하고 있다. 사람들은 블로그를 이용해 많은 맛집 리뷰를 작성 및 검색하고 있다. 그런데 사람들이 맛집 리뷰를 검색하면, 검색 엔진에서는 검색어에 대한 정확도 및 시간순으로 검색 결과를 정렬해 주기 때문에 같은 식당에 대한 포스트들이 분산되어 검색된다. 따라서 사람들은 수많은 맛집 리뷰가 섞여있는 검색 결과를 보고 그중 한 식당을 선택하는 것에 어려움을 느낄 수 있다. 이때, 같은 식당에 대한 리뷰를 모아서 보여준다면 어떤 식당에 대한 리뷰가 존재하는지 일목요연하게 볼 수 있으며, 한 식당에 대한 다양한 의견을 참고하여 가고자 하는 식당을 선택하는데 도움이 된다. 따라서 본 논문에서는 블로그의 맛집 포스트를 클러스터링 하는 시스템을 제안하였다. 시스템을 통해 생성된 클러스터의 평가 결과, 정확률, 난수 색인, 순수도는 90% 이상의 높은 값을 보였다.

A Comparative Study on the Information Literacy Programs (정보이용능력 교육 프로그램의 비교 연구)

  • Kang, Hye-Young
    • Journal of the Korean Society for Library and Information Science
    • /
    • v.36 no.1
    • /
    • pp.297-320
    • /
    • 2002
  • The purpose of this study is to identify theoretical basis of information literacy program in the Korea. Nine Information Literacy Program were compared with ACRL Information Standards. The result of this study is as follows: (1) The identification of information needed was included in the programs that emphasized a thesis or topic statement and formulated question, critical thinking, information technology. (2) Most programs contained mainly potential sources for information. (3) Each programs had element of Information access strategy and skills that explained to OPAC, Indexes and Abstracts, On-line retrievals. (4) Implements the search strategy using various formats was essential elements in the programs. (5) Evaluation and synthesis was included in the programs, partially evaluation for information process and satisfaction was included. (6) The writing skills for termpaper. quotations and oral presentations are important elements of information use in the programs, however. those programs didn't contain enough the ethical and legal uses of information with respect to the standard.

An Intelligent Marking System based on Semantic Kernel and Korean WordNet (의미커널과 한글 워드넷에 기반한 지능형 채점 시스템)

  • Cho Woojin;Oh Jungseok;Lee Jaeyoung;Kim Yu-Seop
    • The KIPS Transactions:PartA
    • /
    • v.12A no.6 s.96
    • /
    • pp.539-546
    • /
    • 2005
  • Recently, as the number of Internet users are growing explosively, e-learning has been applied spread, as well as remote evaluation of intellectual capacity However, only the multiple choice and/or the objective tests have been applied to the e-learning, because of difficulty of natural language processing. For the intelligent marking of short-essay typed answer papers with rapidness and fairness, this work utilize heterogenous linguistic knowledges. Firstly, we construct the semantic kernel from un tagged corpus. Then the answer papers of students and instructors are transformed into the vector form. Finally, we evaluate the similarity between the papers by using the semantic kernel and decide whether the answer paper is correct or not, based on the similarity values. For the construction of the semantic kernel, we used latent semantic analysis based on the vector space model. Further we try to reduce the problem of information shortage, by integrating Korean Word Net. For the construction of the semantic kernel we collected 38,727 newspaper articles and extracted 75,175 indexed terms. In the experiment, about 0.894 correlation coefficient value, between the marking results from this system and the human instructors, was acquired.

Design and Implementation of Thesaurus System for Geological Terms (지질용어 시소러스 시스템의 설계 및 구축)

  • Hwang, Jaehong;Chi, KwangHoon;Han, JongGyu;Yeon, Young Kwang;Ryu, Keun Ho
    • Journal of the Korean Association of Geographic Information Studies
    • /
    • v.10 no.2
    • /
    • pp.23-35
    • /
    • 2007
  • With the development of semantic web technologies in information retrieval area, the necessity for thesaurus is recently increasing along with internet lexicons. A thesaurus is the combination of classification and a lexicon, and is the topic map of knowledge structure expressing relations among concepts(terms) subject to human knowledge activities such as learning and research using formally organized and controlled index terms for clarifying the context of superordinate and subordinate concepts. However, although thesaurus are regarded as essential tools for controlling and standardizing terms and searching and processing information efficiently, we do not have a Korean thesaurus for geology. To build a thesaurus, we need standardized and well-defined guidelines. The standardized guidelines enable efficient information management and help information users use correct information easily and conveniently. The present study purposed to build a thesaurus system with terms used in geology. For this, First, we surveyed related works for standardizing geological terms in Korea and other countries. Second, we defined geological topics in 15 areas and prepared a classification system(draft) for each topic. Third, based on the geological thesaurus classification system, we created the specification of geological thesaurus. Lastly, we designed and implemented an internet-based geological thesaurus system using the specification.

  • PDF