• Title/Summary/Keyword: 텍스트 연구

Search Result 3,471, Processing Time 0.031 seconds

Building an RST-tagged Corpus and its Classification Scheme for Korean News Texts (한국어 수사구조 분류체계 수립 및 주석 코퍼스 구축)

  • Noh, Eunchung;Lee, Yeonsoo;Kim, YeonWoo;Lee, Do-Gil
    • 한국어정보학회:학술대회논문집
    • /
    • 2016.10a
    • /
    • pp.33-38
    • /
    • 2016
  • 수사구조는 텍스트의 각 구성 성분이 맺고 있는 관계를 의미하며, 필자의 의도는 논리적인 구조를 통해서 독자에게 더 잘 전달될 수 있다. 따라서 독자의 인지적 효과를 극대화할 수 있도록 수사구조를 고려하여 단락과 문장 구조를 구성하는 것이 필요하다. 그럼에도 불구하고 지금까지 수사구조에 기초한 한국어 분류체계를 만들거나 주석 코퍼스를 설계하려는 시도가 없었다. 본 연구에서는 기존 수사구조 이론을 기반으로, 한국어 보도문 형식에 적합한 30개 유형의 분류체계를 정제하고 최소 담화 단위별로 태깅한 코퍼스를 구축하였다. 또한 구축한 코퍼스를 토대로 중심문장을 비롯한 문장 구조의 특징과 분포 비율, 신문기사의 장르적 특성 등을 살펴봄으로써 텍스트에서 응집성의 실현 양상과 구문상의 특징을 확인하였다. 본 연구는 한국어 담화 구문에 적합한 수사구조 분류체계를 설계하고 이를 이용한 주석 코퍼스를 최초로 구축하였다는 점에서 의의를 갖는다.

  • PDF

A Study on Icon-URI structure using ENUM service (ENUM 서비스를 이용한 화상 인식 URI 구조에 관한 연구)

  • 최지원;강현식;김기천
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2004.04a
    • /
    • pp.856-858
    • /
    • 2004
  • 인터넷의 급속한 발전으로 인해 네트워크를 통한 텍스트, 이미지, 사운드, 비디오 등과 같은 디지털 컨텐츠의 유통이 점차 대용량으로 변화하고 있다. 이러한 컨텐츠의 유통을 위해 쓰이는 URI는 텍스트의 한 페이지, 사운드 또는 비디오 클립, 정지 화상과 동영상은 물론 프로그램과 같은 컨텐츠를 인식하는데 쓰이고 URL을 이용하여 정보자원의 물리적 위치를 표시하는 문자열을 통해 정보자원에 접근하고 검색하게 된다. 하지만 휴대용 단말기를 이용하는 경우 단점이라 할 수 있는 입력기능의 제한으로 인해 정보이용이 쉽지 않기 때문에 정보 접근을 위한 새로운 URI 체계와 서비스 환경이 필요하다. 새로운 URI 체계에 하나의 대안으로 바코드나 특정 이미지와 같은 화상을 이용할 수 있는 방법이 있으며 이를 화상 URI로 체계화시키는 작업이 필요하다. 본 논문에서는 ENUM과 화상인식 관련 기술들을 연구하고 ENUM서비스가 실용화될 경우 ENUM서비스와 연계하여 사용할 수 있는 화상 인식 URI용 인식코드를 제안한다.

  • PDF

A Design of Contents Display Method for Effective E-book Reading (효과적인 전자책 구독을 위한 콘텐츠 표시 방법 설계)

  • Ko, Ginam;Kim, JongIn;Moon, Nammee
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2013.06a
    • /
    • pp.171-172
    • /
    • 2013
  • 기존의 종이책은 다양한 스마트 모바일기기의 활발한 보급으로 인해 전용 단말기와 뷰어 앱(Veiwer App)을 통해 전자책(e-book)으로 서비스되고 있다. 최근에는 텍스트(Text) 중심의 전자책과 달리, 텍스트와 함께 동영상, 다양한 상호작용 요소를 중심으로 하는 앱북(App book)의 형태로 진화되고 있다. 아이패드(iPad)용 앱스토어(App Store)에서는 도서 관련 앱이 28%를 차지할 정도로 앱북 시장이 빠르게 성장함에도 불구하고, 여러 가지 전자책 전용 단말기, 뷰어 앱 UI(User Interface) 관련 연구들에 비해 앱북의 콘텐츠 및 UI에 대한 연구가 상대적으로 부족한 상황이다. 이에, 본 논문에서는 앱북 콘텐츠의 표시 방법에 따라 3개의 유형으로 분류하고, 대표 앱북을 선정하여, 콘텐츠의 객체 표시방법에 대해 분석하고, 상호작용 요소들을 분석하였다. 이를 통해, 객체 별 상호작용 요소를 고려한 전자잡지형 앱북의 콘텐츠 표시 방법 프레임워크를 설계하였다.

  • PDF

Extracting Comparative Elements from Comparative Sentences (비교 문장으로부터 비교 요소 자동 추출)

  • Yang, Seon;Ko, Young-Joong
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2011.06a
    • /
    • pp.225-228
    • /
    • 2011
  • 본 논문은 비교 마이닝(comparison mining) 의 일환인 비교 요소 자동 추출에 관하여 연구한다. 비교 마이닝은 텍스트 마이닝의 한 분야로서 대용량의 텍스트를 대상으로 비교 관계롤 자동 분석하며, 비교 문장인지 아닌지를 식별하는 단계, 비교 타입을 분류하는 단계, 다양한 비교 요소들을 추출하는 단계, 추출된 요소를 분석 및 요약하는 단계 등을 거치게 된다. 본 연구에서는 특정 타입의 비교 문장이 주어졌을때, 그 문장에서 비교 요소를 자동으로 추출하는 단계의 과제를 수행하며, 우열 비교 타입 및 최상급 타입 문장들을 대상으로 비교 주체, 비교 대상, 비교 술어를 추출한다. 실험 과정으로는, 우선 비교 요소 후보들을 선정하고, 그 후 각 요소별로 확률을 계산하여 가장 높은 수치를 기록한 요소를 정답으로 채택하게 된다. 확률 계산은 지지 벡터 기계 (Support Vector Machine)를 이용한다. 인터넷 상의 다양한 도메인에서 추출된 비교 문장들을 대상으로 비교 요소 추출을 수출한 결과, 정확도 86.81 %의 우수한 성능을 산출 할 수 있었다.

Design of Gamer's Behavior Analysis System using Packet Mining (Packet Mining을 이용한 Gamer의 행위분석시스템)

  • Lee, Mi-Ran;Cho, Dong-Sub
    • Annual Conference of KIPS
    • /
    • 2002.11c
    • /
    • pp.2467-2470
    • /
    • 2002
  • 사용자의 필요를 충족시켜 줄 수 있도록 사용자에 대한 연구가 인터넷 비즈니스에서 활발히 이루어지고 있다. 인터넷 비즈니스와 마찬가지로 컴퓨터 게임 산업 분야에서도 이러한 연구가 필요하다. 하지만 컴퓨터 게임의 특성상 기존의 인터넷 비즈니스 방식과 같은 방법으로는 게이머(Gamer)의 행동을 알기 어렵다. 이러한 문제점을 해결하고자 본 논문에서는 패킷 마이닝(Packet Mining)을 이용한 게이머의 행위 분석 시스템을 제안하고자 한다. 이 시스템은 게이머들과 시스템 사이에 전달된 패킷을 수집하여 프로토콜별 텍스트 형태로 저장하고, 일정 시간이 흐르면 텍스트 형태로 저장된 패킷을 데이터베이스로 생성한다. 게이머 행위 분석 시스템은 이렇게 생성된 데이터베이스를 분석하고, 다양한 정보를 추출해내어 게이머의 행위를 분석한다.

  • PDF

Using Text Mining Techniques for Intrusion Detection Problem in Computer Network (텍스트 마이닝 기법을 이용한 컴퓨터 네트워크의 침입 탐지)

  • Oh Seung-Joon;Won Min-Kwon
    • Journal of the Korea Society of Computer and Information
    • /
    • v.10 no.5 s.37
    • /
    • pp.27-32
    • /
    • 2005
  • Recently there has been much interest in applying data mining to computer network intrusion detection. A new approach, based on the k-Nearest Neighbour(kNN) classifier, is used to classify Program behaviour as normal or intrusive. Each system call is treated as a word and the collection of system calls over each program execution as a document. These documents are then classified using kNN classifier, a Popular method in text mining. A simple example illustrates the proposed procedure.

  • PDF

Research on the big data collecting system for measuring of broadcast content influence (방송콘텐츠 영향력 도출을 위한 빅데이터 분석체계에 관한 연구)

  • Choi, Hong-Gyu;Park, Goo-Man;Choi, Seong-Jhin;Kim, Sung-Tae
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2014.11a
    • /
    • pp.171-174
    • /
    • 2014
  • 본 논문은 방송콘텐츠 영향력 도출을 위해 고려되어야 할 요소들에 대해 다뤄보았다. 기존에 방송콘텐츠의 영향력을 나타내는 측정지표로 시청률과 청취율 같은 설문조사 방식의 조사자의 개입을 통한 방식이 활용되었다면, 최근 소셜미디어를 통해 수많은 정보가 교환되는 환경에서는 새로운 측정방식의 제안이 가능할 것으로 보았다. 이에, 본 연구에서는 소셜미디어상 대용량의 텍스트 데이터인 이른바 '소셜텍스트 빅데이터'를 활용해 방송콘텐츠의 영향력을 분석하는 방식을 제안하였다. 또한 이러한 빅데이터 분석을 위해 일반적으로 발생할 수 있는 문제들과 이 과정에서 유의하여야 사항들에 대해 다뤄보았다.

  • PDF

Development of Total Information System for Agricultural Machinery (농업기계 종합정보시스템 개발)

  • 김병갑;신승엽;이용복;윤진하;이중용
    • Proceedings of the Korean Society for Agricultural Machinery Conference
    • /
    • 2002.07a
    • /
    • pp.419-423
    • /
    • 2002
  • 본 연구는 농업기계에 관한 정보를 종합적으로 체계화하여 데이터베이스로 구축하고 정보 수요자가 인터넷을 통해 구축된 데이터베이스를 쉽게 검색할 수 있는 프로그램을 개발하기 위 해 수행되었다. 가. 농업기계 정보 DB는 농업기계와 관련된 텍스트, 이미지, 수치자료들을 데이터베이스화한 것으로서 지원시책, 구입, 이용, 사후관리, 연구 및 교육, 시험평가, 통계, 기타 정보 등의 8개의 카테고리로 구성하였으며 원시자료가 텍스트, 이미지 자료인 경우는 Html로 자체 제작하거나 기존 사이트에 링크하고, 원시자료가 수치자료인 농업기계 사양 및 농업기계화 현황은 관계형 데이터베이스로 구축하였다. 나. 구축된 농업기계 정보 DB를 검색하기 위하여 검색프로그램을 개발하였다. Html로 제작된 DB는 메뉴식 검색방법 또는 검색어 검색방법으로 검색할 수 있으며 관계형 DB는 DBMS를 개발하여 검색이 가능하도록 하였다.

  • PDF

Emotion Recognition of Sentence by using Speech Act (화행 정보를 활용한 문장에서의 감정 인식)

  • Kim, Ki-Tai;Ryu, Pum-Mo;Choi, Yong-Seok;Lee, Sang-Tae
    • Proceedings of the Korean Society for Emotion and Sensibility Conference
    • /
    • 2009.05a
    • /
    • pp.199-200
    • /
    • 2009
  • 자연스러운 대화가 가능한 인공지능 대화시스템을 구축하기 위해서는 사용자의 문장에 내재된 감정을 이해할 수 있는 시스템이어야만 한다. 또한 상호간의 대화를 통해서 풍겨지는 분위기를 파악할 수 있다면 사용자에게 마치 인간과 대화하는 듯한 자연스러움을 느끼도록 할 수 있을 것이다. 실제 대화에서 감정은 언어적인 표현뿐 아니라 비언어적인 표현으로도 표출되지만, 본 논문은 텍스트 상에서 언어적으로 표현되는 감정 정보를 인식하는데 초점을 둔다. 언어적인 표현으로 한정하여 감정을 인식하는 경우에는 감정을 직접 표현하고 있는 형용사나 동사가 중심이 된다. 본 논문에서는 형용사를 중심으로 하여 화행 정보와 결합하여 감정을 인식하는 시스템에 대해서 제시하고자 한다. 이 논문은 문장에 내재되어 있는 숨겨진 감정이나 분위기 등을 파악하기 위한 연구에 대한 선행 연구로서 텍스트 상에서 직접 드러나는 감정을 인식하기 위한 방법을 제안한다.

  • PDF

A case study of a broadcast script by using topic model (토픽 모델을 이용한 방송 대본 분석 사례 연구)

  • Noh, Yunseok;Kwak, Chang-Uk;Kim, Sun-Joong;Park, Seong-Bae;Lee, Sang-Jo
    • Annual Conference on Human and Language Technology
    • /
    • 2015.10a
    • /
    • pp.228-230
    • /
    • 2015
  • 방송 대본은 방송 콘텐츠에 대해 얻을 수 있는 가장 주요한 텍스트 데이터 중에 하나이다. 본 논문에서는 토픽 모델을 통해 방송 대본 분석을 수행하고 그 결과를 제시한다. 방송 대본을 토픽 모델로 학습하기 위해 대본의 장면 단위로 문서를 구성하여 학습하여 대본의 장면을 분석하고 등장인물 단위로 문서를 구성하여 등장인물을 분석하여 그 특징을 살펴본다. 토픽 모델을 사용하여 방송 대본을 분석하는 과정에서 방송 대본이 가지는 특징을 분석하고 그로부터 향후 연구방향에 대해 논의한다.

  • PDF