• Title/Summary/Keyword: 언어TEXT

Search Result 762, Processing Time 0.03 seconds

Frequency and Social Network Analysis of the Bible Data using Big Data Analytics Tools R (R을 이용한 성경 데이터의 빈도와 소셜 네트워크 분석)

  • Ban, ChaeHoon;Ha, JongSoo
    • Proceedings of the Korean Institute of Information and Commucation Sciences Conference
    • /
    • 2018.10a
    • /
    • pp.93-96
    • /
    • 2018
  • Big datatics technology that can store and analyze data and obtain new knowledge has been adjusted for importance in many fields of the society. Big data is emerging as an important problem in the field of information and communication technology, but the mind of continuous technology is rising. R, a tool that can analyze big data, is a language and environment that enables information analysis of statistical bases. In this thesis, we use this to analyze the Bible data. R is used to investigate the frequency of what text is distributed and analyze the Bible through analysis of social network.

  • PDF

Prosodic-Boundary Prediction for Korean Text-to-Speech System (한국어 TTS 시스템을 위한 운율구 경계 예측)

  • Chun Jin-wook;Kim Han Woo;Kim Dong gun;Lee Yanghee
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • spring
    • /
    • pp.77-82
    • /
    • 2002
  • 운율은 음성의 초분절적인 면에 연관하는 음성의 한 성으로서 통상적으로 화자는 음성을 달하는 과정에서 청자의 이해를 돕기 위해 운율을 사용하게 된다. 본 논문은 이러한 운율을 이루는 성분 중의 하나인 운율구의 위치 예측에 대한 성능을 향상시키는 것에 그 목적을 둔다. 한국어 운율 정보에 대한 표기 방법 중의 하나인 K-ToBI를 기반으로 하여, 운율구의 경계와 그에 대한 레벨을 Break Indices 정보로서 나타내었고, 통계학 분야에서 제안된 Support Vector Machine(SVM)을 이용하여 시스템의 예측률 향상을 꾀하였다. 기존의 방법에서 사용된 트리 기반 모델을 이용하여 한국어 운율에 가장 많은 영향을 끼치는 언어 정보들을 추출하였고 이를 실험에 적용하였다. 기존의 트리 모델과 SVM 모델에 대한 예측률을 비교한 결과, 경계 유무 정보 예측과 4단계의 레벨을 가지는 경계 정보의 예측에서 모두 본 방법이 보다 높은 예측률을 보여 주어 본 연구에서 제시한 접근법이 운율구의 경계 정보를 예측하는 데에 있어 더욱 효과적인 접근법임을 실험적으로 입증하였다.

  • PDF

Design of the Personalized Searching Navigator of Learning Contents Based on the Topic Maps (토픽맵 기반 개인별 학습 콘텐츠 탐색 네비게이터 구조 설계)

  • Jeung, Kyoung-Hui;Kim, Pan-Koo
    • Annual Conference of KIPS
    • /
    • 2006.11a
    • /
    • pp.23-26
    • /
    • 2006
  • 최근 대부분의 이러닝(E-Learning)을 교육하는 사이트는 학습 콘텐츠를 검색하는 방법이 단순한 리스트의 나열과 택스트 매칭(Text matching)방법을 사용하는 단점이 있다. 이를 보완하기 위해 좀 더 컴퓨터가 정보 데이터의 의미를 분석하여 검색이 가능하도록 개념 네트워크인 시맨틱웹(Semantic Web)이 등장하였다. 본 논문에서는 이러한 시맨틱웹의 온톨로지(Ontology) 언어 중에 토픽맵(Topic Maps)을 사용하여 많은 양의 학습 정보 데이터를 쉽고도 정확하게 연결 지어 학습 콘텐츠에 대한 정보를 표현하고, 구조화할 수 있는 방법을 모색해 보고자 한다. 학습자의 관심분야 정보, 학습객체의 학습 권장자의 정보와 함께 학습 경험과 검색 빈도수를 분석한 협력 필터링과 학습 에이전트의 개인화 기법을 동시에 사용하여 선호도를 분석한다. 이 선호도를 가지고 학습자의 메타데이터를 생성하고, 로그 데이터를 따로 데이터베이스에 저장한다. 이러한 학습자의 정보와 학습 콘텐츠간의 정보를 상호 연결하여, 그 토픽맵을 사용하여 연관관계를 정의해 줌으로써 학업성취도를 높이고, 학습자 개개인의 성향에 가장 알맞은 학습 콘텐츠를 탐색해가는 네비게이터(Navigator)를 설계하였다.

  • PDF

Morpheme Conversion for korean Text-to-Sign Language Translation System (한국어-수화 번역시스템을 위한 형태소 변환)

  • Park, Su-Hyun;Kang, Seok-Hoon;Kwon, Hyuk-Chul
    • The Transactions of the Korea Information Processing Society
    • /
    • v.5 no.3
    • /
    • pp.688-702
    • /
    • 1998
  • In this paper, we propose sign language morpheme generation rule corresponding to morpheme analysis for each part of speech. Korean natural sign language has extremely limited vocabulary, and the number of grammatical components eing currently used are limited, too. In this paper, therefore, we define natural sign language grammar corresponding to Korean language grammar in order to translate natural Korean language sentences to the corresponding sign language. Each phrase should define sign language morpheme generation grammar which is different from Korean language analysis grammar. Then, this grammar is applied to morpheme analysis/combination rule and sentence structure analysis rule. It will make us generate most natural sign language by definition of this grammar.

  • PDF

A Method for Recovering Image Data for Caption Regions and Replacing Caption Text (비디오 자막 영역 원영상 복원 후 자막 교환 방법)

  • Chun, Byung-Tae;Han, Kyu-Seo;Bae, Young-Lae
    • Annual Conference of KIPS
    • /
    • 2001.10a
    • /
    • pp.743-746
    • /
    • 2001
  • 멀티미디어 정보 중 비디오 데이터는 정보량이 많기 때문에 자동화된 비디오 영상 처리 기술이 필요하다. 시청자의 이해와 시청의 편의성을 제공하기 위하여 대부분 비디오에 자막을 삽입하게 된다. 외국 방송물 및 영화에 삽입된 다른 언어 자막을 편집 과정에서 자막으로 교환 할 필요성이 종종 있게 된다. 기존의 방법들은 자막 부분을 충분히 포함하는 일정 영역에 특정 색상을 채운 후 새로운 자막을 삽입하게 된다. 기존 방법의 문제점은 많은 영역에 대해 비디오 영상 정보를 손실 시킴으로써 시청자에게 시청의 불편을 초래하고 자막 교환의 비 효율성과 부 자연스러움을 발생시킨다. 본 논문에서는 기존 방법의 문제점을 극복하기 위하여 자막 영역을 원영상으로 복원한 후 다른 자막으로 교환하는 방법을 제안하고자 한다. 원영상 복원을 위하여 비디오 정보와 BMA(Block Matching Algorithm)를 이용한 원영상 복원 방법을 제안하고, 복원된 영역에 다른 자막으로 교환함으로써 효과적인 자막 교환 방법을 제안하고자 한다. 실험 결과 원영상 복원을 이용한 자막 교환 방법은 기존 방법에 비해 자연스럽고 효과적인 교환 방법임을 볼 수 있었다.

  • PDF

A Study on the Visual System of Object - Oriented Based on Abstract Information (객체지향을 기반으로한 추상화 정보의 시각화 시스템에 대한 연구)

  • Kim, Haeng-Kon;Han, Eun-Ju;Chung, Youn-Ki
    • The Transactions of the Korea Information Processing Society
    • /
    • v.4 no.10
    • /
    • pp.2434-2444
    • /
    • 1997
  • As software industry progresses, the necessity of visual information have increased more than text-oriented information. So, automatic tools are required to satisfy a user's desire for visual design representation of various source information in the real-world. In this paper, we discuss the methodology and tools for parsing abstract information through semantic analysis and extracting visual information through visual mapping. Namely, as to abstract informations are represented as relational structure and then mapped into visual structure using regular rule, user can obtain visual information. We suggest VOLS(Visual Object Layout System) to transform a abstract information to visual information. It can improve user understandability and assist a maintenance for existing source code.

  • PDF

Developing XML Hub System based on SOAP (SOAP을 기반으로 한 XML Hub 시스템 개발)

  • Kim, Yong-Soo;Joo, Kyung-Soo
    • The KIPS Transactions:PartD
    • /
    • v.10D no.2
    • /
    • pp.351-358
    • /
    • 2003
  • SOAP is a protocol used for information exchange in distributed computing environment and defines mechanisms for message transferring between distributed system and remote procedure cai]/response process. This SOAP is able to be used independently on operating systems and program languages because it is a protocol using text-based XML. Therefore ebXML that is a standard for I-Commerce adopts SOAP for message exchange. In this paper, we developed XML Hub System based on SOAP By this in Hub System we can more easily exchange messages for B2B. Accordingly we can manage and integrate a lots of business partners.

Text Case Extraction with Message Sequence Diagram (MSD) based on UML2.4.1 (UML2.4.1 기반 메시지-순차적 다이어그램을 통한 테스트 케이스 추출 연구)

  • Woo, SuJeong;Kim, D.H.;Son, S.H.;Kim, Robert Young Chul
    • Annual Conference of KIPS
    • /
    • 2012.11a
    • /
    • pp.1567-1570
    • /
    • 2012
  • 기존 연구에서는 순차적, 상태, 엑티브 다이어그램 기반의 테스트케이스 추출을 초점을 두고 있다. 하지만 현재 최신의 모델링 언어인 UML2.4.1(Unified Modeling Language) 기반으로 한 테스트케이스 추출 메커니즘은 없다. 그래서 본 논문은 UML2.4.1 기반에 기존의 원인-결과 다이어그램의 접목을 통해 테스트케이스 추출 메커니즘을 제안 한다. 이를 위해 UML2.4.1 의 메시지-순차적 다이어그램에 ECA Rule(Event Condition Action)기법을 적용하고, 제안한 접목 알고리즘을 통해 확장된 메시지-순차적 다이어그램을 원인-결과 다이어그램과 접목한 후, 결정 테이블화로 테스트케이스를 발생한다. 이러한 절차를 통해 모델링 기반에서 테스트케이스 추출 가이드가 제공된다. 본 논문에서는 복잡한 메시지-순차적 다이어그램을 통해 테스트케이스 발생 사례연구로서 자동차 와이퍼 시스템을 적용한다.

A Study on Diversification of the Ancillary Materials for Chinese Education: Focusing on Some Songs of Jay Chou (중국어교육의 보조자료 다양화를 위한 모색: 주걸륜(周杰倫)의 몇 곡을 중심으로)

  • Park, Chan-Wook
    • Cross-Cultural Studies
    • /
    • v.46
    • /
    • pp.253-279
    • /
    • 2017
  • This study aims to examine how the Chinese popular culture, especially music, can contribute to diversification of the ancillary materials for teaching Chinese language, literature and culture, based on the analysis of some songs of Jay Chou. For this purpose, this study analysed 10 songs that have been used in the tests or the text contents in China or Taiwan in terms of rhyme, words relation to the ancient poems, and the Chinese culture. Consequently, the songs of Jay Chou show that they can be used as an ancillary material in the Chinese class from the linguistic, literary, and cultural angles. For use in the Chinese language, literature, culture class in the future, there is a constant need to discover and analyse new materials from the Chinese popular culture.

A Scraping Method of In-Frame Web Sources Using Python (파이썬을 이용한 프레임내 웹 페이지 스크래핑 기법)

  • Yun, Sujin;Seung, Li;Woo, Young Woon
    • Proceedings of the Korean Institute of Information and Commucation Sciences Conference
    • /
    • 2019.05a
    • /
    • pp.271-274
    • /
    • 2019
  • In this paper, we proposed a detailed address acquisition scheme for automatically collecting data of a web page in a frame that is difficult to access by a general web access method. Using the Python language and the Beautiful Soup library, which can utilize the proposed address resolution technique and the HTML selector, we were able to automatically collect all the bulletin board text data written in several pages. By using the proposed method, we can collect large amount of data automatically by Python web scraping program for web pages of any form of address, and we expect that it can be used for big data analysis.

  • PDF