• Title/Summary/Keyword: Text Communication System

검색결과 370건 처리시간 0.024초

An Improved Text Classification Method for Sentiment Classification

  • Wang, Guangxing;Shin, Seong Yoon
    • Journal of information and communication convergence engineering
    • /
    • 제17권1호
    • /
    • pp.41-48
    • /
    • 2019
  • In recent years, sentiment analysis research has become popular. The research results of sentiment analysis have achieved remarkable results in practical applications, such as in Amazon's book recommendation system and the North American movie box office evaluation system. Analyzing big data based on user preferences and evaluations and recommending hot-selling books and hot-rated movies to users in a targeted manner greatly improve book sales and attendance rate in movies [1, 2]. However, traditional machine learning-based sentiment analysis methods such as the Classification and Regression Tree (CART), Support Vector Machine (SVM), and k-nearest neighbor classification (kNN) had performed poorly in accuracy. In this paper, an improved kNN classification method is proposed. Through the improved method and normalizing of data, the purpose of improving accuracy is achieved. Subsequently, the three classification algorithms and the improved algorithm were compared based on experimental data. Experiments show that the improved method performs best in the kNN classification method, with an accuracy rate of 11.5% and a precision rate of 20.3%.

Enhancing Text Document Clustering Using Non-negative Matrix Factorization and WordNet

  • Kim, Chul-Won;Park, Sun
    • Journal of information and communication convergence engineering
    • /
    • 제11권4호
    • /
    • pp.241-246
    • /
    • 2013
  • A classic document clustering technique may incorrectly classify documents into different clusters when documents that should belong to the same cluster do not have any shared terms. Recently, to overcome this problem, internal and external knowledge-based approaches have been used for text document clustering. However, the clustering results of these approaches are influenced by the inherent structure and the topical composition of the documents. Further, the organization of knowledge into an ontology is expensive. In this paper, we propose a new enhanced text document clustering method using non-negative matrix factorization (NMF) and WordNet. The semantic terms extracted as cluster labels by NMF can represent the inherent structure of a document cluster well. The proposed method can also improve the quality of document clustering that uses cluster labels and term weights based on term mutual information of WordNet. The experimental results demonstrate that the proposed method achieves better performance than the other text clustering methods.

신호의 복원된 위상 공간을 이용한 오디오 상황 인지 (A new approach technique on Speech-to-Speech Translation)

  • ;이승룡
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2009년도 추계학술발표대회
    • /
    • pp.239-240
    • /
    • 2009
  • We live in a flat world in which globalization fosters communication, travel, and trade among more than 150 countries and thousands of languages. To surmount the barriers among these languages, translation is required; Speech-to-Speech translation will automate the process. Thanks to recent advances in Automatic Speech Recognition (ASR), Machine Translation (MT), and Text-to-Speech (TTS), one can now utilize a system to translate a speech of source language to a speech of target language and vice versa in affordable manner. The three phase process establishes that the source speech be transcribed into a (set of) text of the source language (ASR) before the source text is translated into the target text (MT). Finally, the target speech is synthesized from the target text (TTS).

청각 장애인을 위한 모바일 통화 시스템 설계 및 구현 (Design and Implementation of Mobile Communication System for Hearing- impaired Person)

  • 윤동희;김영웅
    • 한국인터넷방송통신학회논문지
    • /
    • 제16권5호
    • /
    • pp.111-116
    • /
    • 2016
  • 미래창조과학부의 정보격차 실태조사에 따르면 장애인의 스마트폰 보유율은 일반인의 1/3 수준에 머물러 있어 장애인의 정보접근성은 비장애인에 비해 현저히 떨어지는 실정이다. 본 논문은 청각장애인의 모바일 음성 통화를 보다 편리하게 사용할 수 있도록 도와주는 어플리케이션인 CallHelper를 개발하였다. CallHelper는 전화가 오면 자동으로 구동되어 상대방의 전화음성을 텍스트로 실시간 번역하여 모바일 화면에 출력하고, 상대방의 음성에서 감정을 추론하여 이모티콘으로 시각화해서 표시하며, 음성과 번역된 텍스트, 감정을 동시에 저장하여 추후 번역결과를 확인해 볼 수 있도록 하는 어플리케이션이다.

WCTT: HTML 문서 정형화 기반 웹 크롤링 시스템 (WCTT: Web Crawling System based on HTML Document Formalization)

  • 김진환;김은경
    • 한국정보통신학회논문지
    • /
    • 제26권4호
    • /
    • pp.495-502
    • /
    • 2022
  • 오늘날 웹상의 본문 수집에 주로 이용되는 웹 크롤러는 연구자가 직접 HTML 문서의 태그와 스타일을 분석한 후 수집 채널마다 다른 수집 로직을 구현해야 하므로 유지 관리 및 확장이 어렵다. 이러한 문제점을 해결하려면 웹 크롤러는 구조가 서로 다른 HTML 문서를 동일한 구조로 정형화하여 본문을 수집할 수 있어야 한다. 따라서 본 논문에서는 태그 경로 및 텍스트 출현 빈도를 기반으로 HTML 문서를 정형화하여 하나의 수집 로직으로 본문을 수집하는 웹크롤링 시스템인 WCTT(Web Crawling system based on Tag path and Text appearance frequency)를 설계 및 구현하였다. WCTT는 모든 수집 채널에서 동일한 로직으로 본문을 수집하므로 유지 관리 및 수집 채널의 확장이 용이하다. 또한, 키워드 네트워크 분석 등을 위해 불용어를 제거하고 명사만 추출하는 전처리 기능도 제공한다.

내장형 ARM 보드를 이용한 전광판 시스템 설계에 관한 연구 (A Study on Design of the Electric Sign Board System using Embedded ARM Board)

  • 최재우
    • 한국산학기술학회논문지
    • /
    • 제5권3호
    • /
    • pp.241-246
    • /
    • 2004
  • 본 논문은 ARM7TDMI 칩을 사용하여 모듈단위의 확장이 가능하도록 전광판 시스템을 설계하고 자체적인 한글 입출력 처리가 가능하도록 하였다. 전광판 시스템에 사용자가 원하는 표출문구의 입력, 편집을 쉽고 편리하게 할 수 있는 여러 가지 형태의 입력방법에 대해 연구하였다. PC와 PDA에 의한 유/무선 문구입력이 가능하게 하였고 한글오토마타를 구현하여 리모트 컨트롤러에 의한 표출문구 입력도 가능하게 하였다. 또한 LINUX OS가 포팅 된 PXA255프로세서 기반의 내장형 보드에서 그래픽 라이브러리 툴인 QT/Embedded 2.3.7을 터치패널사용이 가능하도록 포팅하여 원격지의 전광판에 문구를 이더넷 통신방법에 의해 쉽게 바꿀 수 있게 하였다. 본 연구에서 설계한 시스템은 한글에 대한 코드 값만 저장하는 방식이므로 기존 전광판 시스템보다 많은 양의 사용자 정의 문구를 시스템에 저장하여 사용할 수 있다는 장점을 가지고 있다.

  • PDF

사용자 편의성과 효율성을 증진하기 위한 신뢰도 높은 이미지-텍스트 융합 CAPTCHA (Reliable Image-Text Fusion CAPTCHA to Improve User-Friendliness and Efficiency)

  • 문광호;김유성
    • 정보처리학회논문지C
    • /
    • 제17C권1호
    • /
    • pp.27-36
    • /
    • 2010
  • 웹 서비스 신청 단계에서 신청자가 실제 인간 사용자임을 확인하기 위해 사용되는 텍스트 기반 캡차(text-based CAPTCHA)의 변형된 문자를 광학문자인식 기술로 파악하는 것이 가능하기에 캡차의 신뢰성이 떨어지는 문제가 발생하고 있다. 이 문제를 해결하기 위해 제안되었던 기존의 이미지 기반 캡차(image-based CAPTCHA)에서도 여러 문제점이 존재한다. 인공지능 프로그램을 사용하여 시스템이 보유하고 있는 제한된 수의 이미지 내용을 파악함으로써 신뢰도가 떨어지는 문제가 발생할 수 있으며, 제공된 이미지에 대해 사용자가 다른 유사한 단어를 입력하는 경우에는 오답으로 판정되어 반복적으로 캡차를 시도해야 하는 불편함이 발생 할 수 있으며 또한, 사용자에게 캡차 문제를 제공하기 위해 여러 이미지 파일을 전송해야 하기에 전송 비용의 비효율성 문제가 존재한다. 이러한 기존 이미지 기반 캡차의 문제점들을 해결하기 위해 본 논문에서는 이미지와 관련 키워드 일부를 융합하여 제공하는 이미지-텍스트 융합 캡차를 제안하였다. 본 논문에서 제안한 이미지-텍스트 융합 캡차에서는 이미지와 관련된 단어의 일부분을 힌트로 활용하여 쉽게 정답을 입력할 수 있도록 사용자 편리성을 제공하며 이미지와 텍스트를 한 이미지 파일 내에 융합시켰기 때문에 전송 비용을 절약하여 효율성을 증진할 수 있다. 또한, 캡차 시스템의 신뢰성 증진을 위해 인터넷 검색으로 캡차용 이미지를 대량으로 수집하도록 하였으며 수집되는 캡차 이미지의 정확성을 유지하기 위해 필터링 과정을 거치도록 하였다. 또한, 본 논문에서는 실제 실험을 통해 제안된 이미지-텍스트 융합 캡차가 기존 이미지 기반 캡차보다 사용자에게 편리하고 신뢰성이 증진될 수 있음을 입증하였다.

동기/비동기 기반의 통합 E-코칭 시스템 설계 및 구현 (Design and Implementation of Integrated E-Coaching system Based on Synchronous and Asynchronous)

  • 김도연;김도현
    • 한국인터넷방송통신학회논문지
    • /
    • 제15권4호
    • /
    • pp.1-7
    • /
    • 2015
  • 지금까지 대부분의 코칭은 대면 중심으로 이루어졌으나, 인터넷을 활용한 e-코칭으로 확장이 시도되고 있다. 현재 e-코칭은 대면 코칭을 위한 보조 역할을 수행하고 있다. 따라서 코치와 피코치 간의 수평적 관계에서 언제 어디서나 소통할 수 있는 e-코칭 시스템의 개발이 요구되고 있다. 기존의 e-코칭은 전자문서, 비디오 채팅, 문자 채팅, 전화 등의 네 가지 형태가 일반적이다. 대부분의 e-코칭 방식은 접근성이 용이하나, 비디오 채팅은 우수한 가시성을 제공하나 동기방식을 요구한다. 이에 반해 전자 메일은 비동기 방식이며, 문서 작성 중심이다. 본 논문에서는 동기와 비동기를 지원하는 통합 e-코칭 시스템을 설계하고 구현한다. 제안한 e-코칭 시스템은 비동기 방식의 전자 메일과 동기 방식의 P2P(Peer to Peer) 비디오 채팅과 그룹 문자 채팅을 지원한다. 이를 통해 비동기와 동시적인 방법을 함께 지원하여 개인 혹은 그룹 간의 규칙적, 비공식적 코칭이 가능할 수 있다.

A Semantic Content Retrieval and Browsing System Based on Associative Relation in Video Databases

  • Bok Kyoung-Soo;Yoo Jae-Soo
    • International Journal of Contents
    • /
    • 제2권1호
    • /
    • pp.22-28
    • /
    • 2006
  • In this paper, we propose new semantic contents modeling using individual features, associative relations and visual features for efficiently supporting browsing and retrieval of video semantic contents. And we implement and design a browsing and retrieval system based on the semantic contents modeling. The browsing system supports annotation based information, keyframe based visual information, associative relations, and text based semantic information using a tree based browsing technique. The retrieval system supports text based retrieval, visual feature and associative relations according to the retrieval types of semantic contents.

  • PDF

XML Repository System Using DBMS and IRS

  • Kang, Hyung-Il;Yoo, Jae-Soo;Lee, Byoung-Yup
    • International Journal of Contents
    • /
    • 제3권3호
    • /
    • pp.6-14
    • /
    • 2007
  • In this paper, we design and implement a XML Repository System(XRS) that exploits the advantages of DBMSs and IRSs. Our scheme uses BRS to support full text indexing and content-based queries efficiently, and ORACLE to store XML documents, multimedia data, DTD and structure information. We design databases to manage XML documents including audio, video, images as well as text. We employ the non-composition model when storing XML documents into ORACLE. We represent structured information as ETID(Element Type Id), SORD(Sibling ORDer) and SSORD(Same Sibling ORDer). ETID is a unique value assigned to each element of DTD. SORD and SSORD represent an order information between sibling nodes and an order information among the sibling nodes with the same element respectively. In order to show superiority of our XRS, we perform various experiments in terms of the document loading time, document extracting time and contents retrieval time. It is shown through experiments that our XRS outperforms the existing XML document management systems. We also show that it supports various types of queries through performance experiments.