• Title/Summary/Keyword: 부분구조화

Search Result 151, Processing Time 0.025 seconds

A Method of Efficient Web Crawling Using URL Pattern Scripts (URL 패턴 스크립트를 이용한 효율적인 웹문서 수집 방안)

  • Chang, Moon-Soo;Jung, June-Young
    • Journal of the Korean Institute of Intelligent Systems
    • /
    • v.17 no.6
    • /
    • pp.849-854
    • /
    • 2007
  • It is difficult that we collect only target documents from the Innumerable Web documents. One of solution to the problem is that we select target documents on the Web site which services many documents of target domain. In this paper, we will propose an intelligent crawling method collecting needed documents based on URL pattern script defined by XML. Proposed crawling method will efficiently apply to the sites which service structuralized information of a piece with database. In this paper, we collected 50 thousand Web documents using our crawling method.

A Web-based Programming Language Practice System supporting Distributed Environment (분산환경을 지원하는 웹 기반의 프로그래밍 언어 실습 시스템)

  • 노미라;이수현
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2001.10b
    • /
    • pp.568-570
    • /
    • 2001
  • 현재 다양한 패러다임의 수많은 프로그래밍 언어가 존재하고 있으며, 각각의 프로그래밍 언어를 실습하려면 해석기(interpreter)나 컴파일러(compiler) 같은 언어처리기를 갖추는 것이 필요하다. 언어처리기를 개별적으로 갖추는 것은 설치에 대한 시간적 부담, 시스템 자원 낭비 업그레이드의 필요성 등으로 인해서 언어 학습과 직접적인 관련이 없는 부분에 대한 부담이 커진다. 본 논문에서는 WWW 환경에서 프로그래밍 언어를 실습할 수 있는 시스템을 구축하였다. 실습하는 프로그래밍 언어는 특정 서버에 제한적이지 않고, 네트워크를 통한 분산환경에서 확장이 용이하다. 또한 실습환경을 설정하는 구성 파일은 구조화된 문서의 작성을 지원하는 XML을 이용하여 관리자가 쉽게 구성파일을 작성할 수 있도록 했고, 자바의 정책(policy)파일을 이용해 시스템 자원 사용 허가를 투명하게 했다.

  • PDF

A Study on the User Segmentation Analysis through POSA method (POSA 분석을 통한 소비자 유형 분류에 관한 연구)

  • Kim, Tae-Kyun
    • 한국HCI학회:학술대회논문집
    • /
    • 2006.02b
    • /
    • pp.252-257
    • /
    • 2006
  • 기본적으로 모든 소비자들은 조금씩 다르며, 제품은 그 차이를 극대화 시킴으로써 다양한 소비를 촉진하게 된다. 이와 같은 시장 세분화와 포지셔닝 전략은 디자인 경영에 있어 매우 중요한 전략적 단계라 할 수 있으며, 기업의 소비자 분석의 목적이기도 하다. 다차원 척도법은 군집 분석에서와 마찬가지로 자료에 내재된 구조를 찾아내어 자료를 함축적으로 표현하고자 하는 자료축약형 다변량 분석 기법이다. 패턴 분류의 수량화를 이용하는 POSA(Partial Order Scalogram Analysis)는 MSA(Multidimensional Scalogram Analysis)의 구조화된 방법으로 디자인 전략을 수립하는 단계에서 소비자의 성향을 보다 세분화할 수 있다. 본 논문에서는 디자인 리서치 단계에 POSA 방법론을 적용하였을 때 소비자 유형 분류가 가능하다고 보고, 창의적 디자인 컨셉의 도출에 어느 정도 역할을 하는지 알아보고자 함을 목적으로 하였다. 본 연구에서는 부분적 계층 분석법인 POSA 분석방법을 통하여 사용자의 계층을 세분화하는 방법을 고안하고, 이를 분석함으로써 소비자의 유형을 분류하여 디자인 포지셔닝과 방향을 제시하는 방법론을 제안하고자 하였다. 이를 위하여 설문조사를 통하여 POSA 기법을 이용한 소비자 유형 분류 방법이 고안되었고, 이를 기반으로 모바일 기기를 위한 프로젝트에 실제 디자인 사례로 적용되었으며, 이러한 소비자 유형 분석을 통하여 타겟 유저의 시나리오 작성 단계에서 창의적 발상을 지원한다는 점을 발견할 수 있었다.

  • PDF

Design of signature system based Java for XML/EDI Document (XML 표준전자문서의 Java기반 서명 시스템 설계)

  • 이대하;김순자
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2000.04a
    • /
    • pp.475-477
    • /
    • 2000
  • 확장성 마크업 언어인 XML은 W3C에 의해 고안된 구조화된 표준이다. 이에 SGML의 부분집합으로서 문서의 내용에 관련된 태그를 사용자가 직접 정의할 수 있다. 이런 확장성이 뛰어난 XML을 이용하여 기업간에 사용되는 EDI 문서를 표현함으로써 이기종 시스테뫄 응용프로그램간의 원활한 문서유통을 이룰 수 있다. 그러나 그런 XML 표준전자문서의 인증이나 신뢰성이 보장되지 않는다면, 전송중 문서의 조작, 도청 및 오용등가 같은 위협 때문에 그 사용이 제한될 것이다. 본 논문에서는 그러한 위협을 방지하고 XML 표준전자문서의 신뢰성 있는 전송을 보장하기 위하여 Java 기반 서명 시스템을 설계하였다. 여기서 서명은 XML 기반으로 구성되었고, 시스템은 Java 애플릿과 애플리케이션을 이용한 두 가지 경우로 설계하였다.

  • PDF

An Implementation of XML Message Encryption Transfer Method (XML 메시지 암호화 전송 방법 구현)

  • Jang, Ui-Jin;Ko, Hoon;Shin, Yong-Tae
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2001.10c
    • /
    • pp.706-708
    • /
    • 2001
  • 인터넷 기술의 비약적인 발전으로 상품 및 서비스 구매나 발주 광고 활동 등 인터넷을 기반으로 행하는 전자상거래가 활발해지면서 대량의 전자문서를 관리하는 효율적인 정보서비스가 요구되어 왔다. 이에 따라 서로 다른 기종간의 효율적인 문서정보 교환을 위한 여러 표준화 작업들이 이루어져 왔는데, 그 중 인터넷 상에서 구조화된 전자문서를 표현하고 처리하기 위한 표준으로 W3C 에서 XML이 발표되었다. 그러나 전자상거래의 활성화로 XML 문서의 전송 중 개인정보 유출에 대한 위협이 있을 수 있는데, 본 논문에서는 특정 부분에 대한 암호화를 지원할 수 있는 XML의 구조적 특징을 이용한 XML 메시지 암호화 전송 기법을 구현하였다.

  • PDF

A Hierarchical Index Technique for Moving Image Retrieval System based on MPEG-7 (MPEG-7에 기반한 동영상 검색 시스템을 위한 계층형 인덱스 기법)

  • Kim Tack gon;Kim Woo saeng
    • The Journal of Korean Institute of Communications and Information Sciences
    • /
    • v.29 no.10C
    • /
    • pp.1444-1450
    • /
    • 2004
  • MPEG-7 based on XML represents various information of multimedia data's contents. and it support search and browsing by user's wants. But, MPEG-7 standard don't support retrieval method and Many XML Indexing is not compatible to retrieval MPEG-7 documents. So Much research activity and interest has emerged recently in retrieval MPEG-7 documents. In our paper, we suppose a hierarchical index based on MPEG-7 document's structural information, and review how to query processing based on high level feature description.

A Fuzzy Databased Models for Supporting Disjunctive Fuzzy Information (논리합 퍼지 부분 정보를 지원하는 퍼지 데이터베이스 모델)

  • Yang, Jae-Dong
    • Journal of KIISE:Software and Applications
    • /
    • v.26 no.2
    • /
    • pp.234-240
    • /
    • 1999
  • 널값(null value)중 그 값은 존재하지만 현재 알려지지 않은 값을 미지 값(unknown value)이라고 한다. 본 논문에서는 논리합 퍼지 정보를 허용하는 퍼지 데이터베이스 응용 환경에서 잠재술어(Implicit Predicate, IP)를 이용하여 미지 값을 문제를 해결하기 위한 새로운 접근 방법을 제안한다. 이 방법의 특징은 첫째, 논리합 퍼지 정보를 퍼지 데이터베이스 내에 허용함으로써 미지 값의 의미적 표현력을 강화시키고, 둘째 개념에 기반한 퍼지 부합 매커니즘을 지원할 수 있으며, 셋째, 퍼지 소속성 함수를 구조화하여 시소러스로 활용함으로서 보다 정교한 부합을 가능하게 한다는 점 등이다. 본 논문에서는 먼저 이러한 IP의 특징들에 대해 기술하고 퍼지 데이터베이스에서 이 IP들을 최대한 이용하여 확정적 답을 이끌어 내기 위한 질의 평가 방식을 제안한다.

A Extensible the ETID Structured Information for Efficient Retrieval of XML Documents (XML 문서의 효율적인 검색을 위한 확장된 ETID 구조정보)

  • Shin Ju-Hyun;Choi Jun-Ho;Kim Pan-Koo
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2004.11a
    • /
    • pp.141-144
    • /
    • 2004
  • XML문서가 웹상에서의 정보의 표현 및 교환의 표준 포맷으로 선택 되면서 XML데이터에 대한 저장 기법과 검색 효율을 높일 수 있는 방법들이 연구 되고 있다. 본 논문에서는 구조화 정보검색을 위해 기존에 연구되어진 ETID 구조정보 표현의 한계를 개선하여 엘리먼트 및 에트리뷰트의 특정부분에 대한 직접적인 검색을 하기 위해 DTD에 상관없이 형제 엘리먼트간의 확장된 구조정보를 표현하여 효율적인 검색을 수행할 수 있는 방법을 제안한다.

  • PDF

A Web-Based Information System for the Integrated Search for Protein Structure Classifications (단백질 구조 분류의 통합 검색을 위한 웹 정보시스템)

  • 신원준;황의윤;김진홍;안건태;이명준
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2004.04b
    • /
    • pp.274-276
    • /
    • 2004
  • 단백질은 대부분 공간상의 특징을 고려할 때 유사한 부분을 기준으로 분류되는 경우가 많다 단백질 구조 분류 데이터베이스는 단백질이 가지는 다양한 구조 정보를 바탕으로 단백질 구조 분류 정보를 제공하고 있다. 대표적인 단백질 구조 분류 데이터베이스에는 CATH와 SCOP 데이터베이스가 있다. 이들 데이터베이스는 서로 다른 구조 분류 기준으로 단백질 구조를 분류하고 있으며, 단백질 구조 분류 정보를 검색하는 웹 서비스를 개별적으로 제공하고 있다. 따라서 여러 종류의 단백질 구조 분류 정보를 하나의 웹 사이트에서 검색할 수 있으면 유용할 것이다. 본 논문에서는 CATH와 SCOP에서 정의한 단백질 구조 분류 정보의 통합적인 검색 기능 일 통계 정보를 체계적으로 제공하는 웹 정보시스템에 관하여 기술한다. 제안된 시스템은 CATH와 SCOP에서 제공하는 각각의 데이터를 가공하여 효과적인 구조 분류 검색을 지원하는 구조화된 데이터베이스를 구축하였다. 개발된 시스템은 PDB 식별자, CAT터 식별자. 그리고 SCOP 식별자 또는 단백질 분류 이름으로 한번의 검색으로 두 데이터베이스에서 제공하는 계층적 구조 분류 정보를 제공한다. 또한, 단백질 구조에 대한 유용한 통계 정보를 제공한다.

  • PDF

A Naive Bayesian Learning of Clustering for Medical Datamining (의료데이터마이닝에서 클러스터링 기반의 나이브 베이지안 학습)

  • Han, Song-Yi;Jung, Young-Gyu
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2010.06c
    • /
    • pp.410-413
    • /
    • 2010
  • 병원정보시스템의 전세계적인 보급과 데이터웨어하우스의 도입으로 인해서 병원내의 의료데이터가 기하 급수적인 증가추세를 보이고 있다. 환자에 대한 임상적인 특징을 다수 포함하고 있는 의료데이터는 유용한 임상지식의 보고로서 그 가치가 매우 유용하다. 따라서 데이터에 숨겨진 지식을 발견하여 구조화시킴으로써 새로운 지식을 창조하는 데이터마이닝은 임상부분에 적합한 기술이라 말할 수 있다. 본 연구에서는 급성염증을 가진 환자들의 의료데이터를 기반으로 특징을 추출하고, 추출된 특징을 바탕으로 병명을 판단하기 위한 학습을 수행한다. 학습 방법은 클러스터링을 이용한 나이브 베이지안으로 진행한다. 기존의 나이브 베이지안 학습은 대량의 데이터를 처리하는데 효과적이며 성능 또한 우수하지만, 속성별 독립을 가정하기 때문에 의료데이터를 분석에는 잘 사용되지 않는다. 따라서 높은 신뢰도를 구현하기 위해 나이브 베이지안 학습 전에 클러스터링을 선행하여, 기존 데이터에 클러스터링 클래스를 추가한다. 이를 통해 급성염증의 증상을 보이는 환자데이터를 바탕으로 자동적으로 방광염과 결석으로 인한 신장염을 효과적으로 진단해낸다.

  • PDF