• Title/Summary/Keyword: 텍스트 연구

Search Result 3,552, Processing Time 0.032 seconds

Authorship Attribution in Korean Using Chosun Ilbo Column Texts (빈도 정보를 이용한 저자 판별: 조선일보 4인 칼럼을 대상으로)

  • Han, Na-Rae
    • Annual Conference on Human and Language Technology
    • /
    • 2008.10a
    • /
    • pp.29-34
    • /
    • 2008
  • 본고에서는 빈도 정보를 이용한 저자 판별 (authorship attribution) 기법을 한국어에 적용한 연구를 소개한다. 그 대상으로는 정형화된 장르인 신문 칼럼을, 구체적으로는 조선일보에 연재 중인 4인 칼럼니스트들의 각 40개 칼럼, 총 160개 칼럼 텍스트를 선정하였다. 이들에 대하여 어절, 음절, 형태소, 각 단위 2연쇄 등의 다양한 언어 단위들의 빈도 정보들을 이용한 저자 판별을 시도한 결과, 형태소 빈도를 기반으로 하여 최고 93%를 넘는 높은 예측 정확도를 얻을 수 있었다. 또한, 저자 개인 문체간의 거리도 빈도 정보로써 계량적 표상이 가능함을 보일 수 있었다. 이로써 빈도 분석과 같은 통계적, 계량적 방법을 통하여 한국어 텍스트에 대한 성공적인 저자 판별과 개인 문체의 정량화가 가능하다는 결론을 내릴 수 있다.

  • PDF

A Similarity Evaluation using Structural Information of Documents (문서구조 정보 기반의 유사도 측정)

  • Shin, Mi-Hae;Ko, Bang-Won;Kim, Young-Chul;Jeong, Jin-Yeong
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2010.07a
    • /
    • pp.499-502
    • /
    • 2010
  • 인터넷의 발달로 인한 수많은 정보의 공유는 지식 정보사회의 발전을 가져왔다. 이러한 정보사회의 발전과 동시에 표절과 같은 새로운 지식 범죄도 급증하고 있다. 표절은 연구의 정직성과 창의성을 떨어뜨리고 학문의 발전을 저해하는 요소이다. 이러한 표절을 근절하기 위해서 그동안 많은 방법들과 시스템들이 제시되었다. 이중 자연어로 구성된 구조가 없는 일반 문서의 표절을 검사하는 방법은 지문법을 이용하였다. 지문법과 같이 통계적인 방법을 이용한 유사도 검사 방법은 문서 대 문서 전체를 비교하기 때문에 부분적 유사성, 즉 문장이나 문단 단위의 비교를 할 수 없는 단점이 있다. 본 논문에서 제시하는 시스템은 자연어로 이루어진 일반문서 중 특별한 문서의 구조 정보를 가질 수 있는 일반 텍스트 문서를 대상으로 유사도를 측정하였다. 즉 텍스트 문서 구조를 AST 형태의 자료구조로 표시하고 이를 이용하여 사용자가 원하는 부분 또는 전체 유사도 측정 방법을 제시한다.

  • PDF

A Study on the Application of Text Mining for Corporate Application form (기업 자기소개서 대상 텍스트 마이닝 적용 연구)

  • Kim, Kyoung-Sik;Kim, Seong-Bo;Kim, Ung-mo
    • Annual Conference of KIPS
    • /
    • 2017.11a
    • /
    • pp.668-670
    • /
    • 2017
  • 최근 우리 나라 청년실업률의 증가와 함께 기업에서는 좋은 인재를 뽑기 위하여 정형화된 자격증보다는 지원자의 경험과 역량을 보기 위한 자기소개서에 대한 중요성이 커지고 있다. 그리하여 비정형 데이터를 분석하는 대표적인 방법인 텍스트 마이닝 기법을 이용하여 취업 커뮤니티에 올라 온 합격한 삼성, 현대자동차, LG 자기소개서 데이터를 얻어내고 그 후 KONLPY 패키지를 통하여 형태소 분석을 실시한다. 합격자소서에 자주 나온 단어의 순위를 매기고 공통적으로 많이 들어간 단어와 각 대기업 별 차이가 나는 단어를 회사의 인재상과 비교해본다. 그리고 취업 준비생들에게 효율적인 방법을 통해 자기소개서를 작성하여 합격률을 높이는 방향으로 사용한다.

A Method for Automatic Extract ion of Term Definition from Text (텍스트로부터 용어 정의문의 자동 추출 방법)

  • Shin, Hyo-Shik;Kim, Jae-Ho;Lee, Hae-Yun;Choi, Key-Sun
    • Annual Conference on Human and Language Technology
    • /
    • 2002.10e
    • /
    • pp.292-299
    • /
    • 2002
  • 본 연구는 텍스트 코퍼스로부터 용어의 정의를 자동으로 추출하여 용어의 자동 추출기술과 통합하여 다목적의 용어뱅크를 구축하기 위한 목적으로부터 출발하였다. 지식정보의 확산에 따라 기존 전문분야 용어집에 수록되지 알은 용어의 수는 폭발적으로 증가하고 있다. 기존의 용어집 혹은 용어사전의 디지털화만으로는 새로운 전문용어의 포괄성에서 한계가 있는 것이다. 정보의 획득이라는 면에서 보면 이러한 한계를 극복하고 모든 용어에 대해서 즉시적으로 용어의 정의를 제공받는 것이 바람직하다. 자동으로 구축된 용어집의 응용은 여러 가지로 기대된다. 새로운 용어에 대한 의미 파악을 위해서는 물론, 확장된 전문용어집의 작성이나 전문분야 온톨로지의 구축 등에도 이용될 수 있다.

  • PDF

A Study on the rhetorical expression of the Fusion Design (퓨전 디자인의 수사학적 표현에 관한 연구)

  • 김은지;이정욱
    • Korean Institute of Interior Design Journal
    • /
    • no.29
    • /
    • pp.3-10
    • /
    • 2001
  • In recent years when the importance of public communication is more emphasized, it has to be noticed that we are now living in the public-initiated age of rhetoric resulted from rapid development of broadcast media. Therefore, the purpose of this treatise is to examine the structural characteristics in the fusion design in order to anaylize the rhetorical expressions as symbols of communication. One of those is intertextuality that expresses metaphorically by bleding and borrowing codes and another is hypertextual space where various texts twines around each other making brand-new and diverse organizations, as the combined allegory with a number of hidden expression. The fusion design may be understood as the Intention to attract gaze to visual messages and as the rhetorical expressions based on compounding aesthetic codes by producing new cultural meanings. If fusion, a phenomenon which represents the 21st century, not a passing fad of cultural mixture, is ready to take the initiative, the design has to be groped for that creates a synergy effect.

  • PDF

A Study on Access Control of the Multimedia Text Data Retrieval (멀티미디어 텍스트 데이터 검색을 위한 접근기법 연구)

  • Yang, Chang-Ho;Jung, Yoon-Ki;Lee, Bae-Ho
    • Annual Conference of KIPS
    • /
    • 2003.05a
    • /
    • pp.95-98
    • /
    • 2003
  • 컴퓨터와 통신의 급속한 발전으로 인하여 하루에도 수십 기가바이트의 정보가 매일매일 업데이트 되고 있다. 하지만 이러한 유용한 정보의 증가에도 불구하고 우리가 사용의 어려움과 검색시간이 길어진다면 엄청난 정보의 낭비를 초래할 것이다. 멀티미디어 정보에 대한 접근을 데이터의 특성상 매우 신속해야 하므로 검색시간 또한 최소화되어야 한다. 하지만 대용량의 멀티미디어 데이터베이스에서 데이터 접근은 막대한 시간을 낭비할 소지가 다분하다. 멀티미디어 데이터 접근은 데이터베이스를 구성하는 여러 미디어에 대해 생성되는 메타데이터에 기본을 둔다. 또한 사용되는 인덱스 구조는 미디어, 메타데이터, 질의 형식에 기반을 두고 생성된다. 즉 인덱싱의 기법에 따라 탁월한 검색성능의 향상을 보일 수 있다. 본 논문에서는 멀티미디어 데이터 중 텍스트 데이터 접근에 이용 가능한 여러 가지 인덱싱 기법들을 살펴보고 그에 따른 적용방법들을 제안한다.

  • PDF

Design and Implementation of homepage with speech interface voice for the blind (시각장애인을 위한 음성 지원 홈페이지 설계 및 구현)

  • 최훈일;조경환;조철환;장영건
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2000.10b
    • /
    • pp.275-277
    • /
    • 2000
  • 오늘날 인터넷이 급속하게 확산되면서 많은 홈페이지들이 다양한 정보를 제공하고 있고 이를 활용하고 있다. 그러나 대부분의 홈페이지들은 장애인을 위한 지원이 없는 실정이라 장애자들은 인터넷의 혜택으로부터 소외받고 있다. 현재 몇몇 홈페이지들이 장애인을 위한 서비스를 제공하고 있지만 정보제공이라는 면에서는 매우 미흡한 상태이다. 본 연구에서는 시각장애인을 위해 음성으로 정보를 제공하는 음성 지원 홈페이지를 설계, 구현하였다. 이 홈페이지는 한국장애인재활협회의 홈페이지를 대상으로 하였으며, 현재는 텍스트의 정보만을 음성으로 지원하고 있다. 이번에 구현한 음성 지원 홈페이지는 정상인들에게 제공하는 거의 모든 텍스트 정보를 제공하고 있어 시각장애인들도 정상인과 같은 정보를 얻을 수 있고, 또한 시각장애인들을 위한 인터페이스로 숫자키패드만을 이용하므로 사용이 용이하도록 하였다.

  • PDF

Library User Education using HyperCard (하이퍼 카드를 응용(應用)한 도서관 이용자(利用者) 교육(敎育))

  • Tak, Hae-Kyung
    • Journal of Information Management
    • /
    • v.25 no.3
    • /
    • pp.1-27
    • /
    • 1994
  • HyperCard used the concept of hypertext not only is the database management program and the educational medium used hypermedia but also provides the environment able to develop the educational software. In this paper, the concept and characteristics of HyperCard are reviewed, and the example applied HyperCard program to library user education are given.

  • PDF

A Study on the Extension Meaning of Expressed Clothing in Novel (복식의 의미확장연구 -소설텍스트를 중심으로-)

  • 유지헌
    • Journal of the Korean Society of Clothing and Textiles
    • /
    • v.26 no.8
    • /
    • pp.1228-1238
    • /
    • 2002
  • This study attempted to identify that how the meaning of clothes and clothing behavior were extended, and to examine that they, produce what kinds of meaning in the specific contort in a novel, the Honpul. The Frame of meaning analysis proposed by Beaugrande, Dressier, and Damesteter was used as an analyzing method. The 100 texts were collected for analysis from the Honpul volume 1 to 10. Psychological meanings were categorized to sensitivity meaning, disposition meaning and incantation meaning. Those had not only a basic meaning which could be gotten from the practical clothing but also second and third extended meanings. The point of this study was to present a new method and possibility for analyzing the code of costume culture by the extended meanings in novels.

A Study on the Representation of Body Images from Date Show Program: Text Analysis of TVn's "Love Switch" (데이트 쇼 프로그램에서 표출된 몸 이미지의 표상 -TVn <러브스위치> 텍스트 분석을 중심으로-)

  • Hahm, Hyun
    • Journal of the Korea Academia-Industrial cooperation Society
    • /
    • v.12 no.7
    • /
    • pp.2957-2962
    • /
    • 2011
  • The purpose of this paper is a semiotic analysis of a dating show on television program, and the attribute contains a variety of social and cultural phenomenons. Analyzed in this study shows relates with TVn's "Love Switch" from cable channel of the text through the classification of gender and thinking of behavior revealed by the structural characteristics of the men and women's appearances. And, how the television culture We rule the world and develop a sense of whether they are examined.