• Title, Summary, Keyword: 섭 텍스트

Search Result 46, Processing Time 0.086 seconds

Performance Analysis of Construction Algorithms for Compressed Suffix Arrays (압축된 써픽스 배열 구축 알고리즘의 성능 분석)

  • Park Chi-Seong;Jo Jun-Ha;Sim Jeong-Seop;Kim Dong-Kyue
    • Proceedings of the Korean Information Science Society Conference
    • /
    • /
    • pp.409-411
    • /
    • 2006
  • 써픽스 배열은 사전적 순서로 정렬된 써픽스들의 인덱스를 저장한 인덱스 자료구조로서, 긴 텍스트에서 반복되는 패턴 검색 시 효율적으로 사용 될 수 있다. 하지만 O($n\;log{\Sigma}$) 비트의 텍스트보다 큰 O(n log n) 비트 공간을 차지하기 때문에 대용량의 텍스트에 대해서는 큰 공간을 필요로 하는 문제점이 있다. 이를 해결하기 위해 압축된 써픽스 배열이 제안되었지만, 구축 시 이미 만들어진 써픽스 배열을 이용하기 때문에 실제 사용 공간을 줄이지는 못했다. 최근 써픽스 배열 없이 텍스트에서 직접 압축된 써픽스 배열을 구축할 수 있는 두 가지 알고리즘이 개발되었다. 본 논문에서는 이 두 가지 알고리즘을 구현한 후, 구축 시간과 사용 공간 등의 실험을 통해 기존의 써픽스 배열들과의 성능을 비교하고 분석한다.

  • PDF

A Study on Actant Models in the TV Talk-Show Program -Focus on 'Healing Camp'- (TV토크프로그램에서의 행동자 모델 관한 연구 -'힐링캠프'를 중심으로-)

  • Chung, Tae-Sub
    • Proceedings of the KAIS Fall Conference
    • /
    • /
    • pp.197-200
    • /
    • 2012
  • 본 논문에서는 그래마스의 이론을 적용하여 행동자의 모델을 통해 출연자의 관계와 서로의 행동적 모델을 분석하고자 함이다. 본 연구에서는 텍스트의 분석이 아닌 영상에서 나타난 의미를 텍스트적으로 들여다보고 이를 통하여 영상에 대입하여 분석하였다. '힐링캠프'의 3명의 사회자와 초대손님의 관계에 대하여 분석함으로서 그래마스의 행동자 모델에 적용함으로서 서로의 관계에 대하여 연구해 보았다.

  • PDF

Case Study on Public Document Classification System That Utilizes Text-Mining Technique in BigData Environment (빅데이터 환경에서 텍스트마이닝 기법을 활용한 공공문서 분류체계의 적용사례 연구)

  • Shim, Jang-sup;Lee, Kang-wook
    • Proceedings of the Korean Institute of Information and Commucation Sciences Conference
    • /
    • /
    • pp.1085-1089
    • /
    • 2015
  • Text-mining technique in the past had difficulty in realizing the analysis algorithm due to text complexity and degree of freedom that variables in the text have. Although the algorithm demanded lots of effort to get meaningful result, mechanical text analysis took more time than human text analysis. However, along with the development of hardware and analysis algorithm, big data technology has appeared. Thanks to big data technology, all the previously mentioned problems have been solved while analysis through text-mining is recognized to be valuable as well. However, applying text-mining to Korean text is still at the initial stage due to the linguistic domain characteristics that the Korean language has. If not only the data searching but also the analysis through text-mining is possible, saving the cost of human and material resources required for text analysis will lead efficient resource utilization in numerous public work fields. Thus, in this paper, we compare and evaluate the public document classification by handwork to public document classification where word frequency(TF-IDF) in a text-mining-based text and Cosine similarity between each document have been utilized in big data environment.

  • PDF

Image Logging Technique of a Web URL Page on the Tiny Web Server (Web URL Page 의 Image Logging 기법)

  • Yoo, Seung-Hee;Cho, Dong-Sub
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • /
    • pp.679-682
    • /
    • 2008
  • 기존의 웹서버는 텍스트형식의 로그파일을 기록한다. 웹 서버에서 로그파일은 클라이언트의 웹서버에 대한 접속정보와 웹서버의 처리상황 등 모든 상황을 기록하고 저장한다. 이 정보를 분석하면 웹 서비스를 하는데 있어서 웹 서비스의 질을 높이는데 좋은 참고자료가 될 뿐 아니라 웹 서버에 이상이 생겼을 경우 발생한 오류를 조기에 발견하는 데에도 사용되는 중요한 자료이다. 현재 이러한 로그파일은 텍스트 파일로 저장되어있기 때문에 조작의 가능성도 있고 오랜 시간이 지나 해당 웹 페이지가 삭제되었을 경우 로그파일에 기록된 그 시각의 웹 페이지를 볼 수 없다. 본 연구에서는 로그파일에 기록된 그 시간의 웹 URL 페이지 이미지를 저장하여 이미지 로그파일을 만드는 시스템을 구현해 봄으로써 텍스트형식 로그파일의 단점을 보안하고 오랜 시간이 지난 후에도 그 웹 페이지를 볼 수 있는 기법을 연구하였다. 이 기법은 로그파일로써의 역할 뿐만 아니라 Digital Forensics 로 범죄 수사에도 많은 도움이 될 수 있고 휴대전화에서 풀 인터넷 브라우징 연구에도 적용될 수 있다.

  • PDF

Design of Gamer's Behavior Analysis System using Packet Mining (Packet Mining을 이용한 Gamer의 행위분석시스템)

  • Lee, Mi-Ran;Cho, Dong-Sub
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • /
    • pp.2467-2470
    • /
    • 2002
  • 사용자의 필요를 충족시켜 줄 수 있도록 사용자에 대한 연구가 인터넷 비즈니스에서 활발히 이루어지고 있다. 인터넷 비즈니스와 마찬가지로 컴퓨터 게임 산업 분야에서도 이러한 연구가 필요하다. 하지만 컴퓨터 게임의 특성상 기존의 인터넷 비즈니스 방식과 같은 방법으로는 게이머(Gamer)의 행동을 알기 어렵다. 이러한 문제점을 해결하고자 본 논문에서는 패킷 마이닝(Packet Mining)을 이용한 게이머의 행위 분석 시스템을 제안하고자 한다. 이 시스템은 게이머들과 시스템 사이에 전달된 패킷을 수집하여 프로토콜별 텍스트 형태로 저장하고, 일정 시간이 흐르면 텍스트 형태로 저장된 패킷을 데이터베이스로 생성한다. 게이머 행위 분석 시스템은 이렇게 생성된 데이터베이스를 분석하고, 다양한 정보를 추출해내어 게이머의 행위를 분석한다.

  • PDF

Dictionary Based Hyper e-Mail Document Generator (사전 기반의 하이퍼 e-Mail 문서 생성기)

  • 최지연;민수홍;조동섭
    • Proceedings of the Korea Multimedia Society Conference
    • /
    • /
    • pp.720-723
    • /
    • 2003
  • E-Mai1 서비스는 현재 가장 많이 쓰이는 WWW 시스템의 가장 기본적인 기능이다. 그러나 현 e-mai1 서비스는 텍스트 기반 구조를 통한 비동기적인 형태의 서비스를 계속 유지하고 있어, 동기적인 표현방법이 요구되는 실정이다 따라서 단순한 정보의 제공을 위한 서비스로서가 아니라, 사용자가 직접 설정하여 서비스를 받는 형태의 e-mai1 을 제안하고자 한다. 사용자가 지정해놓은 사전을 기반으로 HTML 문서가 재생산되어, 색 지정 기능과 하이퍼 텍스트 기능을 제공하는 한편, 사전에 등록된 정보를 바탕으로 개체에 대한 정보가 tooltip으로 표시될 수 있도록 하는 사전기반 하이퍼 문서 생성기능을 지원하도록 한다

  • PDF

Design and Implementation of Image Gallery using Text Embedded JPEG (Text Embedded JPEG를 이용한 Image Gallery의 설계 및 구현)

  • 천시영;곽미라;조동섭
    • Proceedings of the Korea Multimedia Society Conference
    • /
    • /
    • pp.724-727
    • /
    • 2003
  • 현재 웹상의 이미지 갤러리에는 이미지와 함께 제목이나 설명이 포함되는 경우가 많다. 본 논문에서는 갤러리의 검색, 정렬 등의 기능을 강화하고 이미지와 정보의 통합을 위해서 JPEG 이미지의 헤더를 확장하여 이미지의 저작자, 만든 날짜, 설명, 파일크기 등의 텍스트 정보를 내장한 Text Embedded JPEG를 고안하였다. 이 Text Embedded JPEG를 이용한 웹 갤러리에서 이용자는 이미지에 대한 보다 자세한 정보를 볼 수 있고 이 각각의 정보들에 따라 정렬할 수도 있고 이미지 정보를 변경할 수도 있도록 설계하였다.

  • PDF

Hypertext Model Extension and Dynamic Server Allocation for Database Gateway in Web Database Systems (웹 데이타베이스에서 하이퍼텍스트 모델 확장 및 데이타베이스 게이트웨이의 동적 서버 할당)

  • Shin, Pan-Seop;Kim, Sung-Wan;Lim, Hae-Chull
    • Journal of KIISE:Databases
    • /
    • v.27 no.2
    • /
    • pp.227-237
    • /
    • 2000
  • A Web database System is a large-scaled multimedia application system that has multimedia processing facilities and cooperates with relational/Object-Oriented DBMS. Conventional hypertext modeling methods and DB gateway have limitations for Web database because of their restricted versatile presentation abilities and inefficient concurrency control caused by bottleneck in cooperation processing. Thus, we suggest a Dynamic Navigation Model & Virtual Graph Structure. The Dynamic Navigation Model supports implicit query processing and dynamic creation of navigation spaces, and introduce node-link creation rule considering navigation styles. We propose a mapping methodology between the suggested hypertext model and the relational data model, and suggest a dynamic allocation scheduling technique for query processing server based on weighted value. We show that the proposed technique enhances the retrieval performance of Web database systems in processing complex queries concurrently.

  • PDF

Design and Implementation of Customer's Buying Trend Analysis in e-Commerce Environment (전자상거래 소비자 구매 패턴 분석 도구 개발)

  • 한지선;조동섭
    • Proceedings of the Korean Information Science Society Conference
    • /
    • /
    • pp.239-241
    • /
    • 2000
  • 전자상거래에서는 소비자의 구매 패턴을 분석하는 것이 필요하다. 이러한 패턴을 효과적으로 분석하기 위해 지능형 로그 서버를 정의하고 이를 설계, 구현하였다. 지능형 로그 서버란 전자상거래 쇼핑몰의 환경에서 사용자 로그를 데이터베이스화하여 저장하고 데이터베이스에 저장된 정보를 서버 종류별, 시간별, 페이지별 등으로 분석하여 사용자 패턴을 분석할 수 있는 서버를 말한다. 이 서버는 텍스트 파일로 로그를 저장하는 서버보다 자세한 정보를 효율적으로 저장할 수 있다. 그리고 데이터베이스 접근 기술로 ADO(ActiveX Data Object)를 사용하여 데이터베이스 접근 속도를 향상시켰으며 관계형.비관계형 데이터베이스에 모두 접근할 수 있다는 장점을 가진다. 또한 소비자의 구매 패턴을 분석하기 위해 DBMiner2.0을 사용하였다.

  • PDF

A Study on Image Retrieval System using image information (이미지 정보를 추가할 수 있는 이미지 검색 시스템)

  • Chun, Si-Yong;Kwak, Mi-Ra;Cho, Dong-Sub
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • /
    • pp.101-104
    • /
    • 2003
  • 많은 디지털 이미지 중에서 원하는 이미지를 효과적으로 검색하기 위한 방법 중에 이미지에 저장되어 있는 이미지에 대한 텍스트 정보를 가지고 검색을 하는 방법이 있다. 하지만 이는 이미지에 대한 정보 형식 자체가 이미 정해져 있다는 한계가 있다. 하지만 이미지에 따라 검색에 사용할 수 있는 정보 자체가 다를 수 있다. 따라서 본 논문에서는 사용자가 원하는 이미지 필드자체를 추가하여 정보를 삽입하고 검색에 활용하는 방안은 제안하고자 한다. 또한 이미지의 영역에 대한 정보를 추가하여 이미지의 영역별 특징을 나타낼 수 있게 하여 검색 시에 원하는 영역의 이미지만을 표시하게 함으로써 검색의 속도도 높이고자 한다.

  • PDF