• 제목/요약/키워드: Text Input

검색결과 360건 처리시간 0.026초

E-business 웹사이트에서의 데이터 입력디자인에 관한 비교 연구 (A Comparative Study on Data Input Design of E-business Websites)

  • 정홍인
    • 디자인학연구
    • /
    • 제17권1호
    • /
    • pp.127-134
    • /
    • 2004
  • 본 연구를 통해 e-business 웹사이트에서 사용자의 입력에 사용되는 어느 정도 표준화된 인터페이스 디자인들을 실험을 통해 비교하고 최적의 사용법을 알아내었다. 풀다운 메뉴, 텍스트 입력 창, 리스트, 라디오 버튼 등의 입력 디자인(도구)들이 실험에 사용되었으며 이들은 호텔 객실의 예약 웹사이트 시뮬레이션을 통해 비교되었다. 실험 결과 사용자의 입력 선택 사양이 4가지 이상인 경우 전문가에겐 텍스트 입력 창이 입력시간을 줄여주고 일반 사용자에게는 풀다운 메뉴가 사용성 측면에서 효율적임을 알 수 있었다. 단지 두 가지의 선택 사양이 존재할 경우엔 만족도, 유연성, 단순성을 고려했을 땐 리스트가 우수하며 사용 편의성 면에선 라디오 버튼이 최적의 인터페이스로 나타났다. 연구 결과를 사용자의 데이터 입력이 필요한 인터렉티브한 웹사이트의 디자인에 적용할 경우 경제적 효율과 사용성을 증대시킬 것이다.

  • PDF

Neural Text Categorizer for Exclusive Text Categorization

  • Jo, Tae-Ho
    • Journal of Information Processing Systems
    • /
    • 제4권2호
    • /
    • pp.77-86
    • /
    • 2008
  • This research proposes a new neural network for text categorization which uses alternative representations of documents to numerical vectors. Since the proposed neural network is intended originally only for text categorization, it is called NTC (Neural Text Categorizer) in this research. Numerical vectors representing documents for tasks of text mining have inherently two main problems: huge dimensionality and sparse distribution. Although many various feature selection methods are developed to address the first problem, the reduced dimension remains still large. If the dimension is reduced excessively by a feature selection method, robustness of text categorization is degraded. Even if SVM (Support Vector Machine) is tolerable to huge dimensionality, it is not so to the second problem. The goal of this research is to address the two problems at same time by proposing a new representation of documents and a new neural network using the representation for its input vector.

Text Line Segmentation of Handwritten Documents by Area Mapping

  • Boragule, Abhijeet;Lee, GueeSang
    • 스마트미디어저널
    • /
    • 제4권3호
    • /
    • pp.44-49
    • /
    • 2015
  • Text line segmentation is a preprocessing step in OCR, which can significantly influence the accuracy of document analysis applications. This paper proposes a novel methodology for the text line segmentation of handwritten documents. First, the average width of the connected components is used to form a 1-D Gaussian kernel and a smoothing operation is then applied to the input binary image. The adaptive binarization of the smoothed image forms the final text lines. In this work, the segmentation method involves two stages: firstly, the large connected components are labelled as a unique text line using text line area mapping. Secondly, the final refinement of the segmentation is performed using the Euclidean distance between the text line and small connected components. The group of uniquely labelled text candidates achieves promising segmentation results. The proposed approach works well on Korean and English language handwritten documents captured using a camera.

한국어 text-to-speech(TTS) 시스템을 위한 엔드투엔드 합성 방식 연구 (An end-to-end synthesis method for Korean text-to-speech systems)

  • 최연주;정영문;김영관;서영주;김회린
    • 말소리와 음성과학
    • /
    • 제10권1호
    • /
    • pp.39-48
    • /
    • 2018
  • A typical statistical parametric speech synthesis (text-to-speech, TTS) system consists of separate modules, such as a text analysis module, an acoustic modeling module, and a speech synthesis module. This causes two problems: 1) expert knowledge of each module is required, and 2) errors generated in each module accumulate passing through each module. An end-to-end TTS system could avoid such problems by synthesizing voice signals directly from an input string. In this study, we implemented an end-to-end Korean TTS system using Google's Tacotron, which is an end-to-end TTS system based on a sequence-to-sequence model with attention mechanism. We used 4392 utterances spoken by a Korean female speaker, an amount that corresponds to 37% of the dataset Google used for training Tacotron. Our system obtained mean opinion score (MOS) 2.98 and degradation mean opinion score (DMOS) 3.25. We will discuss the factors which affected training of the system. Experiments demonstrate that the post-processing network needs to be designed considering output language and input characters and that according to the amount of training data, the maximum value of n for n-grams modeled by the encoder should be small enough.

Prosodic Annotation in a Thai Text-to-speech System

  • Potisuk, Siripong
    • 한국언어정보학회:학술대회논문집
    • /
    • 한국언어정보학회 2007년도 정기학술대회
    • /
    • pp.405-414
    • /
    • 2007
  • This paper describes a preliminary work on prosody modeling aspect of a text-to-speech system for Thai. Specifically, the model is designed to predict symbolic markers from text (i.e., prosodic phrase boundaries, accent, and intonation boundaries), and then using these markers to generate pitch, intensity, and durational patterns for the synthesis module of the system. In this paper, a novel method for annotating the prosodic structure of Thai sentences based on dependency representation of syntax is presented. The goal of the annotation process is to predict from text the rhythm of the input sentence when spoken according to its intended meaning. The encoding of the prosodic structure is established by minimizing speech disrhythmy while maintaining the congruency with syntax. That is, each word in the sentence is assigned a prosodic feature called strength dynamic which is based on the dependency representation of syntax. The strength dynamics assigned are then used to obtain rhythmic groupings in terms of a phonological unit called foot. Finally, the foot structure is used to predict the durational pattern of the input sentence. The aforementioned process has been tested on a set of ambiguous sentences, which represents various structural ambiguities involving five types of compounds in Thai.

  • PDF

원키 키보드: 웨어러블 컴퓨팅 환경에서 문자입력을 지원하는 초소형 QWERTY 키보드 (One-key Keyboard: A Very Small QWERTY Keyboard Supporting Text Entry for Wearable Computing)

  • 이우훈;손민정
    • 한국HCI학회논문지
    • /
    • 제1권1호
    • /
    • pp.21-28
    • /
    • 2006
  • 상용화된 웨어러블 컴퓨팅용 문자입력장치 중 팔목에착용하는 키보드가 많은데 대부분 소형화를 위해 키 수를 줄이는 방식을 택하고 있다. 하지만 충분한 착용성 확보를 위해 키보드의 키 수를 대폭 줄일 경우 보통 문자당 키입력수(KSPC)가 증가하기 때문에 입력효율이 저하되고 학습을 위해 부가적인 노력이 요구되는 등 우수한 웨어러블 키보드를 개발하는데 있어 착용성과 사용성이 상충하는 문제상황에 직면하게 된다. 본 연구는 이런 문제를 해결하기 위해 키 간격을 줄여 극적으로 키보드를 소형화할 수 있는 방법을 탐색하였다. 일련의 실험을 통해 키 간격 7mm인 키보드의 경우 물리적 폼팩터차원에서 착용성과 사회적 수용성이 충분히 긍정적이고 문자입력속도가 3세션 평균 15.0WPM 정도의 가능성 있는 결과를 도출했다. 하지만 수동적인 촉각 피드백과 입력에 대한 충분한 시각적 피드백의 부재가 문자입력수행도를 저하시킨다는 실험참가자들의 지적에 따라 원키 키보드라는 개념을 제안하였다. 전통적인 키보드의 경우 하나의 키에 하나의 문자가 할당한다. 반면 원키 키보드의 경우는 $70mm{\times}35mm$ 사이즈의 단일 키 위에 10*5배열의 QWERTY 키보드 문자배열을 모두 표시하였다. 따라서 일반적인 키보드와는 달리 키 판에서 어떤 문자를 입력했는지 키 입력 순간 손가락의 위치를 센싱하여 해당 문자를 계산하도록 하였다. 원키 키보드에 대한 입력효율 평가를 통해 5세션 평균 18.9WPM의 입력속도와 6.7%에러율을 기록했으면 최고 24.5WPM을 기록했다. 실험결과를 통해 본 연구에서 제안한 원키 키보드는 웨어러블 컴퓨팅 환경에서 착용성, 사회적 수용성, 입력효율성, 학습용이성 등의 상충적 요소에 대한 적절한 절충점을 제시하는 가능성 있는 문자입력장치로 평가되었다.

  • PDF

Academic Registration Text Classification Using Machine Learning

  • Alhawas, Mohammed S;Almurayziq, Tariq S
    • International Journal of Computer Science & Network Security
    • /
    • 제22권1호
    • /
    • pp.93-96
    • /
    • 2022
  • Natural language processing (NLP) is utilized to understand a natural text. Text analysis systems use natural language algorithms to find the meaning of large amounts of text. Text classification represents a basic task of NLP with a wide range of applications such as topic labeling, sentiment analysis, spam detection, and intent detection. The algorithm can transform user's unstructured thoughts into more structured data. In this work, a text classifier has been developed that uses academic admission and registration texts as input, analyzes its content, and then automatically assigns relevant tags such as admission, graduate school, and registration. In this work, the well-known algorithms support vector machine SVM and K-nearest neighbor (kNN) algorithms are used to develop the above-mentioned classifier. The obtained results showed that the SVM classifier outperformed the kNN classifier with an overall accuracy of 98.9%. in addition, the mean absolute error of SVM was 0.0064 while it was 0.0098 for kNN classifier. Based on the obtained results, the SVM is used to implement the academic text classification in this work.

모바일 플랫폼 교육 콘텐츠 지원을 위한 손 글씨 기반 텍스트 인터페이스 설계 (Design of Handwriting-based Text Interface for Support of Mobile Platform Education Contents)

  • 조윤식;조세홍;김진모
    • 한국컴퓨터그래픽스학회논문지
    • /
    • 제27권5호
    • /
    • pp.81-89
    • /
    • 2021
  • 본 연구는 모바일 플랫폼 환경에서 언어 기반의 교육 콘텐츠 지원을 위한 텍스트 인터페이스를 제안한다. 이는 손 글씨를 통해 단어를 작성하는 입력 구조로 딥 러닝을 활용한다. 모바일 플랫폼 콘텐츠의 버튼, 메뉴 등을 활용한 GUI (Graphical User Interface)와 화면 터치, 클릭, 드래그 등의 입력 방식을 기반으로 손 글씨를 사용자로부터 직접 입력하여 처리할 수 있는 텍스트 인터페이스를 설계한다. 이는 EMNIST (Extended Modified National Institute of Standards and Technology database) 데이터 셋과 훈련된 CNN (Convolutional Neural Network)을 사용하여 알파벳 텍스트를 분류하고 조합하여 단어를 완성한다. 최종적으로 영어 단어 교육 콘텐츠를 직접 제작하여 제안하는 인터페이스의 학습 지원 효과를 분석하고 만족도를 비교하기 위한 실험을 진행한다. 동일한 교육 환경에서 기존의 키 패드 방식의 인터페이스와 제안하는 손 글씨 기반 텍스트 인터페이스를 서로 체험한 사용자들이 제시하는 영어 단어를 학습하는 능력을 비교하고, 인터페이스를 조작하여 단어를 작성하는 과정에서의 전체적인 만족도를 분석, 확인하도록 한다.

Self-Attention을 적용한 문장 임베딩으로부터 이미지 생성 연구 (A Study on Image Generation from Sentence Embedding Applying Self-Attention)

  • 유경호;노주현;홍택은;김형주;김판구
    • 스마트미디어저널
    • /
    • 제10권1호
    • /
    • pp.63-69
    • /
    • 2021
  • 사람이 어떤 문장을 보고 그 문장에 대해 이해하는 것은 문장 안에서 주요한 단어를 이미지로 연상시켜 그 문장에 대해 이해한다. 이러한 연상과정을 컴퓨터가 할 수 있도록 하는 것을 text-to-image라고 한다. 기존 딥 러닝 기반 text-to-image 모델은 Convolutional Neural Network(CNN)-Long Short Term Memory(LSTM), bi-directional LSTM을 사용하여 텍스트의 특징을 추출하고, GAN에 입력으로 하여 이미지를 생성한다. 기존 text-to-image 모델은 텍스트 특징 추출에서 기본적인 임베딩을 사용하였으며, 여러 모듈을 사용하여 이미지를 생성하므로 학습 시간이 오래 걸린다. 따라서 본 연구에서는 자연어 처리분야에서 성능 향상을 보인 어텐션 메커니즘(Attention Mechanism)을 문장 임베딩에 사용하여 특징을 추출하고, 추출된 특징을 GAN에 입력하여 이미지를 생성하는 방법을 제안한다. 실험 결과 기존 연구에서 사용되는 모델보다 inception score가 높았으며 육안으로 판단하였을 때 입력된 문장에서 특징을 잘 표현하는 이미지를 생성하였다. 또한, 긴 문장이 입력되었을 때에도 문장을 잘 표현하는 이미지를 생성하였다.