• 제목/요약/키워드: Tags

검색결과 1,307건 처리시간 0.024초

A Rule-Based Analysis from Raw Korean Text to Morphologically Annotated Corpora

  • Lee, Ki-Yong;Markus Schulze
    • 한국언어정보학회지:언어와정보
    • /
    • 제6권2호
    • /
    • pp.105-128
    • /
    • 2002
  • Morphologically annotated corpora are the basis for many tasks of computational linguistics. Most current approaches use statistically driven methods of morphological analysis, that provide just POS-tags. While this is sufficient for some applications, a rule-based full morphological analysis also yielding lemmatization and segmentation is needed for many others. This work thus aims at 〔1〕 introducing a rule-based Korean morphological analyzer called Kormoran based on the principle of linearity that prohibits any combination of left-to-right or right-to-left analysis or backtracking and then at 〔2〕 showing how it on be used as a POS-tagger by adopting an ordinary technique of preprocessing and also by filtering out irrelevant morpho-syntactic information in analyzed feature structures. It is shown that, besides providing a basis for subsequent syntactic or semantic processing, full morphological analyzers like Kormoran have the greater power of resolving ambiguities than simple POS-taggers. The focus of our present analysis is on Korean text.

  • PDF

Preliminary EST analysis of immune-relevant genes from the liver of LPS-stimulated rock bream Oplegnathus fasciatus

  • Kim, Ju-Won;Park, Hyung-Jun;Baeck, Gun-Wook;Park, Chan-Il
    • 한국어병학회지
    • /
    • 제23권2호
    • /
    • pp.229-238
    • /
    • 2010
  • We constructed a rock bream (Oplegnathus fasciatus) liver cDNA library and a total of 1533 expressed sequence tag (EST) clones were generated. Gene annotation procedures and homology searches of the sequenced ESTs were analyzed using BLASTX. Of the 1533 EST clones, 1165 different ESTs showed significant homology to previously described genes while 368 ESTs were unidentified, hypothetical, or unnamed proteins. Encoding 106 different sequences were identified as putative bio-defense genes or genes associated with immune response.

자바기반의 SMIL 동작기의 설계 및 구현 (Design and Implementation of a JAVA-based Synchronized Multimedia)

  • 김상국;신화종;신동일;신동규;송상훈
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1999년도 가을 학술발표논문집 Vol.26 No.2 (1)
    • /
    • pp.433-435
    • /
    • 1999
  • The Synchronized Multimedia Integration Language (SMIL) is a recommendation from the W3C that makes authoring of TV-like multimedia presentations on the Web easier. It uses the eXtensible Markup Language (XML) to define a set of markup tags to synchronize the timing and positioning relationships between multimedia objects. We present the design and implementation of JAVA-based SMIL player, SSP(Sejong SMIL Player). SSP processes different types of media objects using multiple threads. Moreover, its cache engine detects the mediatype and allocates the proper cache memory for the corresponding media object.

  • PDF

저전력 RFID 시스템을 위한 해시 체인 기반의 경량화 된 상호 인증 프로토콜 (A Lightweight Mutual Authentication Protocol based Hash Chain for Low-power RFID Systems)

  • 이기성
    • 한국산학기술학회논문지
    • /
    • 제10권3호
    • /
    • pp.560-566
    • /
    • 2009
  • 저전력 RFID 시스템은 무선 주파수를 이용하여 물리적인 접촉 없이 사물에 대한 정보를 읽거나 기록하는 자동인식 기술이다. 이 시스템은 무선 주파수와 RFID 태그 사용으로 불법적인 위변조, 도청, 추적, 프라이버시 침해 등은 불가피하다 따라서 본 논문에서는 태그와 데이터베이스간에 해시 체인을 이용하여 키를 생성하는데 이를 통해 공격자는 위의 공격을 수행할 수 없다. 또한 계산 량을 줄이기 위해 해시 함수를 이용하여 효율성을 높였다.

발전설비장치에서 RFID 적용을 위한 인식성능 분석 (Analysis of Awareness Performance for Applying RFID in Electric Power Equipment)

  • 홍진근;한군희
    • 한국산학기술학회논문지
    • /
    • 제10권9호
    • /
    • pp.2313-2318
    • /
    • 2009
  • 본 논문에서는 RFID 기반 하에 발전설비를 관리할 때, 상태정보를 효율적으로 관리하기 위한 방안으로 필요한 RFID 주파수 인식 성능을 분석하였다. 제안된 논문은 모니터링 서비스에서 발전설비의 고장 상태를 진단하기 위해서, 발전설비 및 주요 자재에 부착시, 인식 성능의 최적화를 목적으로 연구되었다. 본 논문의 결과는 발전설비에 RFID를 적용하는 환경에 유용할 것으로 사료된다.

NFC태그를 이용한 스마트 상품 추천 시스템 (A Smart System for Product Recommendation Using NFS tags)

  • 김현철;노현덕;김재구;김우성;임동혁;박근덕
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2015년도 춘계학술발표대회
    • /
    • pp.720-721
    • /
    • 2015
  • 본 논문에서는 스마트폰 NFC 기술을 이용하여 모바일 쿠폰 및 포인트 적립 등을 하며, 고객의 관심사를 프로파일화 하고 사용자가 찾아가 가게의 상품 데이터베이스와 온톨로지 데이터를 사용하여 유사 매칭을 시도하여 상품을 추천하는 어플리케이션을 개발하였다. 고객용 어플리케이션과 가게용 어플리케이션을 각각 따로 개발하여 데이터를 따로 보관하게 구현 하였으며, 고객의 데이터는 우리가 규정한 데이터로 확인하여 가게에서는 고객의 성함과 관심 품목만 나타나게 구현하였다.

A Study on Effective Internet Data Extraction through Layout Detection

  • Sun Bok-Keun;Han Kwang-Rok
    • International Journal of Contents
    • /
    • 제1권2호
    • /
    • pp.5-9
    • /
    • 2005
  • Currently most Internet documents including data are made based on predefined templates, but templates are usually formed only for main data and are not helpful for information retrieval against indexes, advertisements, header data etc. Templates in such forms are not appropriate when Internet documents are used as data for information retrieval. In order to process Internet documents in various areas of information retrieval, it is necessary to detect additional information such as advertisements and page indexes. Thus this study proposes a method of detecting the layout of Web pages by identifying the characteristics and structure of block tags that affect the layout of Web pages and calculating distances between Web pages. This method is purposed to reduce the cost of Web document automatic processing and improve processing efficiency by providing information about the structure of Web pages using templates through applying the method to information retrieval such as data extraction.

  • PDF

Semi-Automatic Ontology Construction from HTML Documents: A conversion of Text-formed Information into OWL 2

  • Im, Chan jong;Kim, Do wan
    • International Journal of Contents
    • /
    • 제12권2호
    • /
    • pp.24-30
    • /
    • 2016
  • Ontology is known to be one of the most important technologies in achieving semantic web. It is critical as it represents the knowledge in a machine readable state. World Wide Web Consortium (W3C) has been contributing to the development of ontology for the last several years. However, the recommendation of W3C left out HTML despite the massive amount of information it contains. Also, it is difficult and time consuming to keep up with all the technologies especially in the case of constructing ontology. Thus, we propose a module and methods that reuse HTML documents, extract necessary information from HTML tags and mapping it to OWL 2. We will be combining two kinds of approaches which will be the structural refinement for making an ontology skeleton and linguistic approach for adding detailed information onto the skeleton.

카이 제곱 통계량과 지지벡터기계를 이용한 자동 스팸 메일 분류기 (An Automatic Spam e-mail Filter System Using χ2 Statistics and Support Vector Machines)

  • 이성욱
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2009년도 춘계학술대회
    • /
    • pp.592-595
    • /
    • 2009
  • 우리는 지지벡터기계를 이용하여 스팸 이메일을 자동으로 분류하는 시스템을 제안한다. 단어의 어휘 정보와 품사 태그 정보를 지지벡터기계의 자질로 사용한다. 우리는 카이 제곱 통계량을 이용하여 유용한 자질을 선택한 후 각각의 자질을 문서 빈도(TF)와 역문헌빈도(IDF) 값으로 표현하였다. 자질들을 이용하여 SVM을 학습한 후, SVM 분류기는 각각의 이메일의 스팸 유무를 결정한다. 실험 결과, 웹메일 시스템에서 수집한 이메일 데이터에 대해 약 82.7%의 정확률을 얻었다.

  • PDF