• 제목/요약/키워드: signature extraction

검색결과 63건 처리시간 0.031초

Company Name Discrimination in Tweets using Topic Signatures Extracted from News Corpus

  • Hong, Beomseok;Kim, Yanggon;Lee, Sang Ho
    • Journal of Computing Science and Engineering
    • /
    • 제10권4호
    • /
    • pp.128-136
    • /
    • 2016
  • It is impossible for any human being to analyze the more than 500 million tweets that are generated per day. Lexical ambiguities on Twitter make it difficult to retrieve the desired data and relevant topics. Most of the solutions for the word sense disambiguation problem rely on knowledge base systems. Unfortunately, it is expensive and time-consuming to manually create a knowledge base system, resulting in a knowledge acquisition bottleneck. To solve the knowledge-acquisition bottleneck, a topic signature is used to disambiguate words. In this paper, we evaluate the effectiveness of various features of newspapers on the topic signature extraction for word sense discrimination in tweets. Based on our results, topic signatures obtained from a snippet feature exhibit higher accuracy in discriminating company names than those from the article body. We conclude that topic signatures extracted from news articles improve the accuracy of word sense discrimination in the automated analysis of tweets.

Topic Signature와 동시 출현 단어 쌍을 이용한 문서 범주화 (Text Categorization using Topic Signature and Co-occurrence Features)

  • 배원식;한요섭;차정원
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2008년도 한국컴퓨터종합학술대회논문집 Vol.35 No.1 (C)
    • /
    • pp.262-267
    • /
    • 2008
  • 본 논문에서는 문서 내에서 동시에 출현하는 단어 쌍을 자질 추출 단위로 하는 문서 범주화 시스템에 대하여 기술한다. 자질 추출 단위를 단어 쌍으로 정의한 것은 문서에서 빈번하게 동시에 출현하는 단어들은 서로 연관관계가 높으며, 단어 하나보다는 연관관계가 높은 단어들의 쌍이 특정 범주의 문서에서만 나타날 확률이 높아지므로 문서 분류 능력을 높이는데 좋은 요인으로 작용할 수 있을 것이라는 가정 때문이다. 그리고 문서 요약 분야에서 제안된 Log-likelihood Ratio를 기반으로 하는 Topic Signature Term Extraction 방법을 사용하여 자질 추출을 하고, Naive Bayes 분류기를 이용하여 문서를 분류한다. 본 연구는 Reuters-21578 문서 집합을 이용한 성능평가에서 좋은 결과를 보였으며, 이는 앞으로의 연구에도 기여할 수 있을 것이라 기대한다.

  • PDF

서명 검증을 위한 특정 기반의 FE-SONN (Feature Extraction based FE-SONN for Signature Verification)

  • 구건서
    • 한국컴퓨터정보학회논문지
    • /
    • 제10권6호
    • /
    • pp.93-102
    • /
    • 2005
  • 본 논문은 퍼지 c-means 알고리즘의 퍼지 멤버십 등식을 신경망과 융합한 서명의 특징정보를 기반으로 하는 자율적인 자기조직화 신경망 모델 이용하여 서명 검증하는 방법을 제안하였다. 기존 온라인 서명인식 방법인 함수적 접근법과 매개변수적 접근법의 한계점을 개선하기 위해 자율적 클러스터 특징정보에 의해 서명 패턴 분류 접근법을 제안했다. 본 논문의 중요한 요소는 서명의 특징 정보를 36개의 전역적 특징 정보 정의와 12개의 지역적 특징 정보를 정의하였고, 이를 기반으로 FE-SONN에 학습하여 서명의 진위여부를 검증하는 검증시스템 구현에 있다. 총 713개의 서명을 가지고 실험하였으며, 원본 서명 155개와 시험용으로 위조 서명 180개와 본인이 작성한 진본 서명 378개를 테스트한 결과 97.67$\%$이상의 검증률을 얻을 수 있었다. 그러나 눈으로 식별이 불가능한 정교한 위조서명은 검증 시스템에서도 진위여부 판단에 어려움이 있다.

  • PDF

악성코드 침입탐지시스템 탐지규칙 자동생성 및 검증시스템 (Automatic Malware Detection Rule Generation and Verification System)

  • 김성호;이수철
    • 인터넷정보학회논문지
    • /
    • 제20권2호
    • /
    • pp.9-19
    • /
    • 2019
  • 인터넷을 통한 서비스 및 사용자가 급격하게 증가하고 있다. 이에 따라 사이버 공격도 증가하고 있으며, 정보 유출, 금전적 피해 등이 발생하고 있다. 정부, 공공기관, 회사 등은 이렇게 급격한 사이버 공격 중 알려진 악성코드에 대응하기 위하여 시그니처 기반의 탐지규칙을 이용한 보안 시스템을 사용하고 있지만, 시그니처 기반의 탐지규칙을 생성하고 검증하는 데 오랜 시간이 걸린다. 이런 문제를 해결하기 위하여 본 논문에서는 잠재 디리클레 할당 알고리즘을 통한 시그니처 추출과 트래픽 분석 기술 등을 이용하여 시그니처 기반의 탐지규칙 생성 및 검증 시스템을 제안하고 개발하였다. 개발한 시스템을 실험한 결과, 기존보다 훨씬 신속하고, 정확하게 탐지규칙을 생성하고 검증하였다.

신호파형 역대합을 통한 지중레이다 자료의 수직해상도 향상 (Enhanceement of Vertical Resolution of GPR data through Signature Deconvolution)

  • 김기영;손호웅;이주한;홍명호
    • 지구물리
    • /
    • 제9권1호
    • /
    • pp.1-6
    • /
    • 2006
  • 지중레이다 신호의 울림현상을 제거하고 수직분해능을 높이기 위한 연구의 일환으로, 소양호에서 100 MHz 안테나로 기록한 지중레이다 자료를 대상으로 신호파형 역대합을 시험 적용하였다. 호저면에서 반사된 파를 중합하여 추출한 신호파형을 이용한 결정론적 역대합 결과를 기존의 Wienner 역대합 방법과 비교하였다. 두 가지 역대합 방법을 적용시킨 시험자료는 모두 수직 분해능이 높아졌으며, 입력자료 상에서는 한 개의 층으로만 해석되던 퇴적층 내에서 3개층 이상을 인지할 수 있다. 그러나 Wienner 필터 적용 결과는 분별력이 낮아서, 울림현상이 심한 자료 사이에 존재하는 반사면 존재를 객관적으로 인식하기 어려운 점이 있다. 신호파형 역대합 적용 결과는 분별력과 수직분해능이 모두 높아서 퇴적층 경계뿐만 아니라 각 층 내부의 세밀한 층서상태까지 보여준다. 이 역대합 방법은 반사시간별로 신호파형 추출이 가능하여, 시간에 따라 신호파형이 심하게 변하는 특성을 가진 지중레이다 자료에 효과적으로 적용시킬 수 있다.

  • PDF

모바일 단말에서 외부 저장 매체로의 불법 데이터 유출 방지 기법 (Prohibiting internal data leakage to mass storage device in mobile device)

  • 정보흥;김정녀
    • 정보보호학회논문지
    • /
    • 제21권1호
    • /
    • pp.125-133
    • /
    • 2011
  • 최근 들어, 모바일 단말의 폭발적인 보급 더불어 단말 내의 중요정보가 외부 저장 매체로 불법적으로 유출되는 보안 위협이 증가되고 있다. 따라서, 본 논문에서는 단말 내 중요정보의 외부 저장 매체로의 유출 방지 기법을 설계 및 구현한다. 이 기법은 파일의 임의위치에서 시그니처를 샘플링하고 이를 이용하여 유출 탐지, 차단 기능을 수행한다. 시그니처 샘플링 과정은 대상 파일을 일정 크기의 추출 윈도우로 구분한 후 이 영역 내에서 임의의 위치에서 1개 이상의 시그니처를 추출한다. 그리고, 가장 효과적인 샘플링을 수행하기 위하여 전체 샘플링, 이항분포 샘플링, 동적 샘플링의 다양한 추출 방식을 구현 및 시뮬레이션을 수행 한다. 제안된 기법은 파일의 임의 위치에서 시그니처를 샘플링하여 공격자의 시그니처 예측성을 낮출 수 있고 원본 데이터에 대한 변형 없이 유출 방지기능을 효과적으로 구현할 수 있다는 장점을 가진다. 따라서, 사용자 편의성이 중시되고 비교적 저 사양의 시스템인 모바일 단말에서 효과적으로 유출방지 기능을 구현할 수 있는 기법이다.

PCA-CIA Ensemble-based Feature Extraction for Bio-Key Generation

  • Kim, Aeyoung;Wang, Changda;Seo, Seung-Hyun
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제14권7호
    • /
    • pp.2919-2937
    • /
    • 2020
  • Post-Quantum Cryptography (PQC) is rapidly developing as a stable and reliable quantum-resistant form of cryptography, throughout the industry. Similarly to existing cryptography, however, it does not prevent a third-party from using the secret key when third party obtains the secret key by deception, unauthorized sharing, or unauthorized proxying. The most effective alternative to preventing such illegal use is the utilization of biometrics during the generation of the secret key. In this paper, we propose a biometric-based secret key generation scheme for multivariate quadratic signature schemes, such as Rainbow. This prevents the secret key from being used by an unauthorized third party through biometric recognition. It also generates a shorter secret key by applying Principal Component Analysis (PCA)-based Confidence Interval Analysis (CIA) as a feature extraction method. This scheme's optimized implementation performed well at high speeds.

비전정보와 캐드DB 매칭을 통한 웹 기반 금형 판별 시스템 개발 (Development of Web Based Mold Discrimination System using the Matching Process for Vision Information and CAD DB)

  • 최진화;전병철;조명우
    • 한국공작기계학회논문집
    • /
    • 제15권5호
    • /
    • pp.37-43
    • /
    • 2006
  • The target of this study is development of web based mold discrimination system by matching vision information with CAD database. The use of 2D vision image makes possible speedy mold discrimination from many databases. The image processing such as preprocessing, cleaning is done for obtaining vivid image with object information. The web-based system is a program which runs to exchange messages between a server and a client by making of ActiveX control and the result of mold discrimination is shown on web-browser. For effective feature classification and extraction, signature method is used to make sensible information from 2D data. As a result, the possibility of proposed system is shown as matching feature information from vision image with CAD database samples.

LDA를 활용한 네트워크 위협 시그니처 추출기법 (Extraction of Network Threat Signatures Using Latent Dirichlet Allocation)

  • 이성일;이수철;이준락;염흥열
    • 인터넷정보학회논문지
    • /
    • 제19권1호
    • /
    • pp.1-10
    • /
    • 2018
  • 인터넷 웜, 컴퓨터 바이러스 등 네트워크에 위협적인 악성트래픽이 증가하고 있다. 특히 최근에는 지능형 지속 위협 공격 (APT: Advanced Persistent Threat), 랜섬웨어 등 수법이 점차 고도화되고 그 복잡성(Complexity)이 증대되고 있다. 지난 몇 년간 침입탐지시스템(IDS: Intrusion Detection System)은 네트워크 보안 솔루션으로서 중추적 역할을 수행해왔다. 침입탐지시스템의 효과적 활용을 위해서는 탐지규칙(Rule)을 적절히 작성하여야 한다. 탐지규칙은 탐지하고자 하는 악성트래픽의 핵심 시그니처를 포함하며, 시그니처를 포함한 악성트래픽이 침입탐지시스템을 통과할 경우 해당 악성트래픽을 탐지하도록 한다. 그러나 악성트래픽의 핵심 시그니처를 찾는 일은 쉽지 않다. 먼저 악성트래픽에 대한 분석이 선행되어야 하며, 분석결과를 바탕으로 해당 악성트래픽에서만 발견되는 비트패턴을 시그니처로 사용해야 한다. 만약 정상 트래픽에서 흔히 발견되는 비트패턴을 시그니처로 사용하면 수많은 오탐(誤探)을 발생시키게 될 것이다. 본고에서는 네트워크 트래픽을 분석하여 핵심 시그니처를 추출하는 기법을 제안한다. 제안 기법은 LDA(Latent Dirichlet Allocation) 알고리즘을 활용하여, 어떠한 네트워크 트래픽에 포함된 시그니처가 해당 트래픽을 얼마나 대표하는지를 정량화한다. 대표성이 높은 시그니처는 해당 네트워크 트래픽을 탐지할 수 있는 침입탐지시스템의 탐지규칙으로 활용될 수 있다.

펜 입력정보를 기반으로 한 온라인 서명의 생체정보 추출 및 ICA를 이용한 특징 추출 (Bio- Information Extraction of On-line Signature Based on Pen-Input Informations and Feature Extraction with Independent Component Analysis)

  • 성한호;윤성수;이일병
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 가을 학술발표논문집 Vol.29 No.2 (2)
    • /
    • pp.577-579
    • /
    • 2002
  • 향후 보안시장을 이끌어갈 생체인식 기술은 현재까지 많은 발전을 거듭하고 있다. 이미 알려진 바와 같이 생체인식은 신체의 여러 부분들과 신체적 특징, 개인의 습관들이 이용되는데 전자의 경우 지문, 얼굴, 홍채, 망막, 음성, 필체, 정맥 등의 인식이 있고 후자의 경우 타이핑 습관, 걸음걸이 습관, 필기 습관 등이 해당된다. 본 연구에서는 서명인식을 필체 자체의 특징에 관련된 정보를 추출하여 인식하는 방법과는 달리 개개인의 필기 습관에 주목하여 서명을 할 때 펜을 눌러쓴 정도, 펜을 사용하는 위치 및 펜을 얼마나 뉘어 쓰는지 세워 쓰는지, 왼손잡이인지 오른손잡이인지 등의 동적 정보에 따른 특성을 알 수 있는 펜의 방위각과 기울임 정도에 대한 생체정보를 추출하고 현재 음성인식 등 여러 분야에서 사용되는 ICA를 사용하여 추출한 서명데이터의 생체정보를 분리.추출하여 이를 개개인의 검증데이터로 활용하는 방법을 제안한다.

  • PDF