• Title/Summary/Keyword: 텍스트 연구

Search Result 3,492, Processing Time 0.031 seconds

A Study on Information Map based on Hypertext (하이퍼텍스트 기반의 정보 지도에 관한 연구)

  • Ryu, Cheol;Lee, Kang-Chan
    • Annual Conference of KIPS
    • /
    • 2001.04b
    • /
    • pp.755-758
    • /
    • 2001
  • 웹 문서는 하이퍼텍스트의 특성을 가지는 문서 형태를 가지며, 일반적인 문서의 특성 보다는 사용자에 의하여 쉽게 생성, 변경, 삭제되는 특성을 가지고 있다. 본 논문은 WWW 검색 엔진이 WWW의 확장성과 역동성을 반영하지 못하는 단점을 보완하는데 그 의의가 있다. 본 논문에서 제시하는 시스템은 기존의 WWW 검색 엔진을 통하여 얻은 검색 결과를 출발점으로 한 실시간 검색을 통하여 WWW 문서의 현재 상태를 정확하게 파악할 수 있는 장정이 있다. 또한 탐색 결과의 가시화를 통하여 웹 문서에 대한 정보 지도(information map)를 추출할 수 있으며, 이러한 기능을 통하여 기존의 정보 검색 엔진에서 제공하지 못하던 자신의 정보 요구에 맞는 정보 지도를 제공함으로써 새로운 지식의 전달을 꾀할 수 있다.

  • PDF

Developing a Model for Quality Evaluation of Text Database Contents (데이터베이스 품질 평가를 위한 모형 개발-텍스트 데이터베이스 내용을 중심으로-)

  • 장혜란
    • Journal of the Korean Society for information Management
    • /
    • v.17 no.4
    • /
    • pp.83-97
    • /
    • 2000
  • Bascd on thc ~esuhs of previous cvalnation cfforts, a database qualily evaluation model. applicable to text databases, is developed. Focusing on dalahase contents. 5 evaluation criteria consisting of 16 clanmts a e delined. For each clcmcnt, data collcctioll method along u,ilh measuing process is eslablished. h d an evalualion scales ale also provided. The concludn~g section suggests several areas for impleinenlalion and h u e development.

  • PDF

Forecasting Emerging Technology in AMOLED Using Keyword Quantitative Analysis Based on Textmining (텍스트 마이닝 기반의 특허키워드정량분석을 이용한 AMOLED 부상기술 예측)

  • Choe, do-han;Kim, gab-jo;Park, sang-sung;Jang, dong-sik
    • Proceedings of the Korea Contents Association Conference
    • /
    • 2013.05a
    • /
    • pp.365-366
    • /
    • 2013
  • 국가나 기업의 연구개발 사업에 있어서 기술예측의 중요성이 더욱 커짐에 따라 그 방법들 또한 다양해지고 있다. 그 중 한 방법으로 특허정보를 분석하여 미래 기술의 향방을 예측하는 방법이 있다. 본 논문에서는 텍스트 마이닝을 이용하여 특허문서에서 키워드를 추출하고 그 키워드들의 평균과 표준편차를 이용한 중요도와 시계열 자료를 이용한 부상도를 분석하여 부상기술을 예측해 보고자 한다. 이를 통해 기술예측 시 보다 신속하고 객관적인 판단을 가능케 하고자 한다.

  • PDF

An Object-based Tracking Scheme for Interactive HyperVideo (대화형 하이퍼 비디오 저작을 위한 객체 기반 추적 방법)

  • 황본우;손형진;이성환
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2001.10b
    • /
    • pp.427-429
    • /
    • 2001
  • 컴퓨터 비전 기술을 이용한 효과적인 객체 추적 기술은 인공 시각, 컴퓨터와 인간의 상호작용(HCI), 영상 기반 제어 장치, 감시 시스템 등 다양한 분야의 응용에 있어 중요한 연구 과제이다. 특히 최근 들어 초고속 통신망의 보급으로 인해 인터넷 방송과 같은 실시간 동영상 전송 기술이 가능해 짐에 따라 단순한 텍스트와 정지영상을 제공하는 하이퍼텍스트 환경에서 사운드를 포함하는 동영상 데이터를 제공하는 하이퍼미디어 환경으로 변하고 있다. 이러한 하이퍼미디어 환경에서의 객체 추적은 객체 단위의 링크가 가능한 하이퍼비디오 구현에 있어서 필수적이다. 따라서 본 논문에서는 다양한 동영상 데이터 상의 객체를 효과적으로 추적하는 알고리즘을 제안하고자 한다.

  • PDF

A Reasearch on Signature File Methods for Korean Text Retrieval (한글 텍스트 검색을 위한 요약 화일 기법에 관한 연구)

  • Song, Byoung-Ho;Lee, Suk-Ho
    • Annual Conference on Human and Language Technology
    • /
    • 1991.10a
    • /
    • pp.231-237
    • /
    • 1991
  • 텍스트에 대한 내용 본위 검색 기법으로서 요약 화일(signature file) 기법은 역화일(inverted file)이 허용되지 않을 때 매우 유용하다. 그러나 한글은 영문과 달리 어절의 형성이 복잡하고 띄어쓰기 형태가 고정되지 않음에 따라 기존의 단어 위주 영문 본위 요약 화일 기법을 그대로 적용시킬 수 없다. 본 논문에서는 이를 위하여 띄어쓰기를 무시하고 중복된 2음절 패턴을 도출하여 요약 화일을 구성, 검색하는 기법을 제안한다. 이 기법은 일본어, 중국어 등 비슷한 문제를 가진 외국어에도 적용될 수 있다.

  • PDF

Authorship Attribution in Korean Using Chosun Ilbo Column Texts (빈도 정보를 이용한 저자 판별: 조선일보 4인 칼럼을 대상으로)

  • Han, Na-Rae
    • Annual Conference on Human and Language Technology
    • /
    • 2008.10a
    • /
    • pp.29-34
    • /
    • 2008
  • 본고에서는 빈도 정보를 이용한 저자 판별 (authorship attribution) 기법을 한국어에 적용한 연구를 소개한다. 그 대상으로는 정형화된 장르인 신문 칼럼을, 구체적으로는 조선일보에 연재 중인 4인 칼럼니스트들의 각 40개 칼럼, 총 160개 칼럼 텍스트를 선정하였다. 이들에 대하여 어절, 음절, 형태소, 각 단위 2연쇄 등의 다양한 언어 단위들의 빈도 정보들을 이용한 저자 판별을 시도한 결과, 형태소 빈도를 기반으로 하여 최고 93%를 넘는 높은 예측 정확도를 얻을 수 있었다. 또한, 저자 개인 문체간의 거리도 빈도 정보로써 계량적 표상이 가능함을 보일 수 있었다. 이로써 빈도 분석과 같은 통계적, 계량적 방법을 통하여 한국어 텍스트에 대한 성공적인 저자 판별과 개인 문체의 정량화가 가능하다는 결론을 내릴 수 있다.

  • PDF

A Similarity Evaluation using Structural Information of Documents (문서구조 정보 기반의 유사도 측정)

  • Shin, Mi-Hae;Ko, Bang-Won;Kim, Young-Chul;Jeong, Jin-Yeong
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2010.07a
    • /
    • pp.499-502
    • /
    • 2010
  • 인터넷의 발달로 인한 수많은 정보의 공유는 지식 정보사회의 발전을 가져왔다. 이러한 정보사회의 발전과 동시에 표절과 같은 새로운 지식 범죄도 급증하고 있다. 표절은 연구의 정직성과 창의성을 떨어뜨리고 학문의 발전을 저해하는 요소이다. 이러한 표절을 근절하기 위해서 그동안 많은 방법들과 시스템들이 제시되었다. 이중 자연어로 구성된 구조가 없는 일반 문서의 표절을 검사하는 방법은 지문법을 이용하였다. 지문법과 같이 통계적인 방법을 이용한 유사도 검사 방법은 문서 대 문서 전체를 비교하기 때문에 부분적 유사성, 즉 문장이나 문단 단위의 비교를 할 수 없는 단점이 있다. 본 논문에서 제시하는 시스템은 자연어로 이루어진 일반문서 중 특별한 문서의 구조 정보를 가질 수 있는 일반 텍스트 문서를 대상으로 유사도를 측정하였다. 즉 텍스트 문서 구조를 AST 형태의 자료구조로 표시하고 이를 이용하여 사용자가 원하는 부분 또는 전체 유사도 측정 방법을 제시한다.

  • PDF

A Study on the Application of Text Mining for Corporate Application form (기업 자기소개서 대상 텍스트 마이닝 적용 연구)

  • Kim, Kyoung-Sik;Kim, Seong-Bo;Kim, Ung-mo
    • Annual Conference of KIPS
    • /
    • 2017.11a
    • /
    • pp.668-670
    • /
    • 2017
  • 최근 우리 나라 청년실업률의 증가와 함께 기업에서는 좋은 인재를 뽑기 위하여 정형화된 자격증보다는 지원자의 경험과 역량을 보기 위한 자기소개서에 대한 중요성이 커지고 있다. 그리하여 비정형 데이터를 분석하는 대표적인 방법인 텍스트 마이닝 기법을 이용하여 취업 커뮤니티에 올라 온 합격한 삼성, 현대자동차, LG 자기소개서 데이터를 얻어내고 그 후 KONLPY 패키지를 통하여 형태소 분석을 실시한다. 합격자소서에 자주 나온 단어의 순위를 매기고 공통적으로 많이 들어간 단어와 각 대기업 별 차이가 나는 단어를 회사의 인재상과 비교해본다. 그리고 취업 준비생들에게 효율적인 방법을 통해 자기소개서를 작성하여 합격률을 높이는 방향으로 사용한다.

A Method for Automatic Extract ion of Term Definition from Text (텍스트로부터 용어 정의문의 자동 추출 방법)

  • Shin, Hyo-Shik;Kim, Jae-Ho;Lee, Hae-Yun;Choi, Key-Sun
    • Annual Conference on Human and Language Technology
    • /
    • 2002.10e
    • /
    • pp.292-299
    • /
    • 2002
  • 본 연구는 텍스트 코퍼스로부터 용어의 정의를 자동으로 추출하여 용어의 자동 추출기술과 통합하여 다목적의 용어뱅크를 구축하기 위한 목적으로부터 출발하였다. 지식정보의 확산에 따라 기존 전문분야 용어집에 수록되지 알은 용어의 수는 폭발적으로 증가하고 있다. 기존의 용어집 혹은 용어사전의 디지털화만으로는 새로운 전문용어의 포괄성에서 한계가 있는 것이다. 정보의 획득이라는 면에서 보면 이러한 한계를 극복하고 모든 용어에 대해서 즉시적으로 용어의 정의를 제공받는 것이 바람직하다. 자동으로 구축된 용어집의 응용은 여러 가지로 기대된다. 새로운 용어에 대한 의미 파악을 위해서는 물론, 확장된 전문용어집의 작성이나 전문분야 온톨로지의 구축 등에도 이용될 수 있다.

  • PDF

A Study on the rhetorical expression of the Fusion Design (퓨전 디자인의 수사학적 표현에 관한 연구)

  • 김은지;이정욱
    • Korean Institute of Interior Design Journal
    • /
    • no.29
    • /
    • pp.3-10
    • /
    • 2001
  • In recent years when the importance of public communication is more emphasized, it has to be noticed that we are now living in the public-initiated age of rhetoric resulted from rapid development of broadcast media. Therefore, the purpose of this treatise is to examine the structural characteristics in the fusion design in order to anaylize the rhetorical expressions as symbols of communication. One of those is intertextuality that expresses metaphorically by bleding and borrowing codes and another is hypertextual space where various texts twines around each other making brand-new and diverse organizations, as the combined allegory with a number of hidden expression. The fusion design may be understood as the Intention to attract gaze to visual messages and as the rhetorical expressions based on compounding aesthetic codes by producing new cultural meanings. If fusion, a phenomenon which represents the 21st century, not a passing fad of cultural mixture, is ready to take the initiative, the design has to be groped for that creates a synergy effect.

  • PDF