• Title/Summary/Keyword: 사용자 문서

Search Result 1,731, Processing Time 0.028 seconds

Design and Implementation of a Text Mining System using Intelligent Miner (인텔리전트마이너를 이용한 텍스트마이닝 시스템의 설계 및 구현)

  • 최윤정;박승수
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2000.04b
    • /
    • pp.316-318
    • /
    • 2000
  • 데이터마이닝 기능은 문서의 구조화되지 않은 텍스트보다는 테이블과 일반적인 DB에 있는 구조화된 자료에 초점이 맞춰져 있다. 정보화의 과정속에서 많은 기업이나 조직들은 과거의 시스템을 DB로 구축하여 어느 정도 형태를 갖추게 되었지만, E-business, E-commerce가 활발해지면서 보유하고 있는 DB기반이 아닌 무작위의 새로운 데이터가 사용자들에 의해 생성되기도 한다. 본 논문에서는 이러한 텍스트 문서에 숨어있는 정보들을 발견하기 위한 텍스트마이닝 과정을 시나리오로 설정하고, 문서와 문서집합에 대해 분석도구를 적용하는 어플리케이션을 구현해 보았다. 대규모의 문서집합에 분석도구를 이용함으로써 빠른 문서처리가 가능하고 이는 사용자가 많은 양의 문서들을 다룰 때의 시간비용을 최소화시킬 수 있는 방법이 될 수 있다. 또한 마이닝과정을 통해 발견한 지식과 특징들을 기반으로 반구조화된 파일로 변환하여, 규칙발견, 데이터마이닝기법을 적용하여 의미있는 새로운 결론을 얻을 수 있을 것이다.

  • PDF

Development of Advanced Intelligent Table Search System (향상된 지능형 테이블 검색 시스템의 개발)

  • Han, Kee-Jun;Kim, Seong-Chan;Liu, Ying
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2012.06b
    • /
    • pp.405-407
    • /
    • 2012
  • 학술 문서 내에서 테이블은 실험 결과, 정의, 요약하는 정보들을 함축하여 사용자에게 제공하는 역할을 한다. 즉 이러한 테이블을 학술 문서 내에서 탐색, 추출하여 검색에 이용하는 것은 학술 문서의 이해를 돕는 것과 더불어 학술 문서를 사용자가 직접 작성할 때에도 비슷한 형태의 테이블을 참조하여 형식에 맞는 테이블을 작성하는 데에 도움을 준다. 따라서 본 연구는 이러한 다양한 목적의 테이블 검색을 지원하기 위하여 문서로부터 자동으로 적합한 키워드를 추출하고 이를 통하여 문서와 유사한 테이블, 문서 내 테이블과 유사한 형식의 테이블을 검색하는 데 적합한 새로운 지능형 테이블 검색 시스템을 제안하며 이를 통해 기존에 존재하는 테이블 검색 시스템 알고리즘들과 성능 비교를 통해 향후 테이블 기반 검색 시스템 발전 가능성을 제시한다.

Design and implementation of web-robot using XML (XML을 이용한 웹 문서 수집기 설계 및 구현)

  • Lee, Sae-Byuk;Lim, Heui-Seok
    • Proceedings of the KAIS Fall Conference
    • /
    • 2008.11a
    • /
    • pp.49-52
    • /
    • 2008
  • 웹2.0, RIA(Rich Internet Application)의 발전으로 웹 기반 서비스가 다양해지고 기존의 응용프로그램 역시 웹 기반 인터페이스로 제공되면서 사용자 또한 단순 사용자가 아닌 서비스를 제공하는 컨슈머(Consumer)의 형태가 되었다. 따라서 웹 문서는 더욱 방대해 지고 검색, 분류, 색인 등을 위해서 웹문서의 수집이 새로운 형태로 필요하게 되었다. 그러나 기존의 데이터베이스 사용 방법이나, 문서의 전문을 파일형식으로 저장하는 방법은 웹문서를 이용하여 다양한 컨텐츠를 제공하기에 적합하지 않다. 그러므로 본 연구는 웹 문서를 파싱(Parsing)하여 필요한 부분을 XML파일 형태로 저장하여, 재사용성을 높이는데 초점을 맞추어 HTML을 파싱하고 자동으로 임의의 파일을 수집하는 문서수집기를 구현하게 되었다.

  • PDF

Auto generation of a query language through visualization of XML (XML 시각화를 통한 자동 질의문 생성)

  • 송민호;이기호
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2002.10d
    • /
    • pp.637-639
    • /
    • 2002
  • XML 문서를 효과적으로 관리하고 검색하기 위한 다양한 XML 질의 언어에 대한 연구가 활발히 수행되고 있지만 다양한 XML 질의 언어의 구문은 일반 사용자들이 숙지하는데 어려움이 있고, 또한 텍스트 형태의 XML 문서는 계층적인 구조로 되어있어 이러한 XML 문서의 구조를 알아야만 질의를 할 수 있다는 문제점이 있다. 따라서 본 논문에서는 복잡한 XML 질의어 구문과 질의 대상인 XML 문서의 구조를 동시에 시각화하고, 사용자와의 상호작용을 통해 질의문을 자동으로 생성하고자 한다. 이를 위해 본 논문에서는 다음과 같이 세 가지 컴포넌트를 기반으로 자동 질의어 생성을 위한 visual query interface를 제안하였다. 이 컴포넌트는 계층적 XML 문서 구조를 보여주는 XML structure viewer, 질의에 사용되는 연산자들을 아이콘화한 operator panel, 그리고 이 두 컴포넌트의 상호작용으로 작성된 질의 구문을 문법적으로 검사하기 위한 query statements panel로 구성된다. 이를 통해 다양한 계층적인 XML 문서의 구조와 복잡한 XML 질의 언어의 구문에 대해서 잘 모르는 초보자라 하더라도 쉽게 XML 문서 상에서 질의를 할 수 있다.

  • PDF

An Algorithm of Documents Classification and Query Extension using Fuzzy Function (퍼지 함수에 의한 질의어 확장과 문서 분류 알고리즘)

  • Eun, Hye-Ju;Ha, Yan;Kim, Yong-Sung
    • Journal of KIISE:Software and Applications
    • /
    • v.28 no.3
    • /
    • pp.272-284
    • /
    • 2001
  • 웹 기반 검색 시스템에서사용자의 관심이 많은 문서를 선별하여 제공하기 위해 프로파일이나 시소러스에 관한 연구가 이루어지고 있다. 그러나, 프로파일이나 시소러스를 구축하고 유지보수 하는데 많은 시간과 노력이 필요하다. 특히 구축된 시소러스에 대해 구조화 및 적합성의 문제가 있다. 따라서, 이러한 문제점을 극복하고자 본 논문에서는 문서에서 추출한 용어 빈도를 문서에서 용어의 중요 정도로 사상시키기 위해 시그모이드 멤버 쉽 함수를 적용한다. 또한, 이 중요 정도에 따라 질의어를 확장하고 의미적으로 연결된 문서를 동일한 문서 집단으로 분류할 수 있는 알고리즘을 제안하여 사용자의 선호도가 반영된 문서를 선별하고 제공하고자 한다.

  • PDF

Retrieval of XML Documents Using Link Information (링크 정보를 활용한 XML 문서의 검색)

  • Moon, Chan-Ho;Kang, Hyun-Chul
    • Annual Conference of KIPS
    • /
    • 2000.04a
    • /
    • pp.45-49
    • /
    • 2000
  • 다양한 정보 형태를 가진 전자 문서의 효과적인 관리를 위해 XML과 관련된 연구들이 활발히 진행되고 있다. 그러나 XML과 관련된 대부분의 연구들은 XML 문서들을 저장, 관리 및 검색할 수 있는 XML 저장 관리 시스템을 대상으로 하고 있다. 본 논문에서는, 실제 Web 상에 분산되어 저장된 전자 문서들 중 하이퍼링크로 연결된 XML 문서들을 대상으로 사용자 질의에 대해 효율적인 검색을 지원해주기 위해, XML 링크 정보를 추출하여 참조하는 검색 질의 처리 방안을 제시한다. 이를 위해 링크 정보를 저장하는 링크 정보 관리 테이블의 구조, 링크 정보를 활용한 XML 문서의 검색 모델, XML 문서의 검색 질의 처리 방안, 그리고 링크 정보의 갱신을 질의 처리 중에 부가적으로 수행하는 방안을 기술하였다. 주어진 사용자 질의에 대한 처리 과정 중 링크와 관련된 질의 처리에 대해 추출된 링크 정보를 이용하여 부질의를 생성하고 처리할 수 있도록 하였다.

  • PDF

One of User Friendly Word Editors (사용자에 친밀한 문서 편집기의 한가지)

  • 심상덕;김인순;이상욱;추명경;손영선
    • Proceedings of the Korean Institute of Intelligent Systems Conference
    • /
    • 2000.11a
    • /
    • pp.399-402
    • /
    • 2000
  • 본 논문에서는 Windows 환경에서 동작하는 문서 편집기상에서 사용자의 명령을 음성으로 입력받아 글자 크기 및 화면의 이동속도를 조절하는 시스템을 연구하였다. 입력된 명령으로부터 추론된 글자 크기 값을 중심으로 font size 변경 범위를 1/2씩 줄여감으로써 사용자가 만족하는 글자 크기로 접근해 가는 방법을 사용하였다. 화면의 이동 속도는 사용자가 선택한 명령 부근에서는 원하는 이동 속도로 근접할 것이라는 개념을 도입하여 사용자가 원하는 속도로 접근하는 방법을 사용하였다.

  • PDF

The Information Filtering Agent System with a Customized Document Summary (사용자 맞춤의 문서 요약을 제공하는 정보 여과 에이전트 시스템)

  • 조영희;김교정
    • Proceedings of the Korea Inteligent Information System Society Conference
    • /
    • 2000.04a
    • /
    • pp.377-386
    • /
    • 2000
  • 현재의 정보 과적재(information overload) 상황은 대량의 정보 가운데서 사용자의 관련 정보에 대한 요청을 도와 불필요한 정보로부터 막기 위한 도구가 매우 필요한 실정이다. 이러한 도구중 대표적으로 사용되는 웹 검색 엔진과 같은 정보 검색 시스템의 단점은 적합한 검색용어를 선택해야만 하는 점과, 결과에 대한 효율적인 요약이 제공되지 않는다는 점이다.따라서 본 논문에서는 이러한 검색 엔진에서의 단점을 보완하여 사용자를 정보 과잉 상황에서의 불필요한 정보로부터 보호하기 위해, 사용자의 프로파일을 기반으로 하여 정보를 개인화된 요약과 함께 제공하는 정보 여과 에이전트(information filtering agent)인 '사용자 맞춤의 문서 요약을 제공하는 정보 여과 에이전트 시스템'을 제안한다.

  • PDF

A Web-document Recommending System using the Korean Thesaurus (한국어 시소러스를 이용한 웹 문서 추천 에이전트)

  • Seo, Min-Rye;Lee, Song-Wook;Seo, Jung-Yun
    • Journal of the Korea Institute of Information and Communication Engineering
    • /
    • v.13 no.1
    • /
    • pp.103-109
    • /
    • 2009
  • We build the web document recommending agent system which offers a certain amount of web documents to each user by monitoring and learning the user's action of web browsing. We also propose a method of query expansion using the Korean thesaurus. The queries to search for new web documents generate a candidate set using the Korean thesaurus. We extract the words which are mostly correlated with the queries, among the words in the candidate set, by using TF-IDF and mutual information. Then, we expand the query. If we adopt the system of query expansion, we can recommend a lot of web documents which have potential interests to users. We thus conclude that the system of query expansion is more effective than a base system of recommending web-documents to users.

XML document transformation for small-screen device (소형 스크린 장치를 위한 XML 문서 변환)

  • 이영호;김상훈
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2004.04b
    • /
    • pp.856-858
    • /
    • 2004
  • PDA나 휴대폰 같은 모바일 장치는 데스크 탑 컴퓨터에 비해 상대적으로 작은 스크린을 가진다 웹 문서는 일반적으로 데스크 탑 컴퓨터 스크린을 기준으로 작성되기 때문에 이러한 웹 문서가 모바일 장치에서 표현되기 위해서는 다수의 좌, 우 스크롤을 필요하게 된다. 이는 문서 내용의 독이성을 떨어뜨리며 사용자에게 많은 불편함을 준다. 본 논문에서는 XML로 작성된 웹 문서를 소형 스크린 장치에 적합하도록 변환하는 주석 기반 XML 변환 시스템을 제안한다. XML 변환 시스템은 분할 정보가 기술된 외부 주석을 이용하여 XML 문서를 소형 스크린에 알맞은 다수의 XML 문서로 분할하고, 분할된 XML 문서를 HTML 문서로 변환하는 과정으로 XML 문서 변환을 처리한다.

  • PDF