• 제목/요약/키워드: Parsing technology

검색결과 153건 처리시간 0.017초

실시간 이상 행위 탐지 및 시각화 작업을 위한 보안 정보 관리 시스템 구현 (Implementation of Security Information and Event Management for Realtime Anomaly Detection and Visualization)

  • 김남균;박상선
    • 예술인문사회 융합 멀티미디어 논문지
    • /
    • 제8권5호
    • /
    • pp.303-314
    • /
    • 2018
  • 지난 수년간, 정부 기관 및 기업들은 취약성을 악용하고 운영을 혼란시키며 중요한 정보를 훔칠 수 있도록 은밀하고 정교하게 설계된 사이버공격에 대하여 적절한 대응을 못하고 있는 상태이다. 보안정보 및 이벤트 관리(SIEM)는 이러한 사이버 공격에 대응할 수 있는 유용한 도구이지만, 시중에서 판매되고 있는 SIEM 솔루션은 매우 비싸며 사용하기가 어렵다. 그래서 우리는 차세대 보안 솔루션을 제공하기 위한 연구 및 개발을 진행하여 기본적인 SIEM 기능을 구현하게 되었으며 우리는 호스트로 부터 실시간 로그 수집과 집계 및 분석에 중점을 두었다. 이 툴은 포렌식을 위한 로그데이터의 파싱과 검색을 제공한다. 이는 기존의 단순한 로그관리 이외에 침입을 탐지하고 보안이벤트의 순위를 이용하여 사용자에게 경고를 할 수 있다. 이러한 보안정보의 운영과 시각화를 위해 Elastic Stack를 사용하였는데, Elastic Stack은 대량의 데이터로부터 정보를 탐색하고 상관관계를 식별하며 모니터링을 위한 풍부한 시각화를 생성 할 수 있는 유용한 툴이다. 본 논문에서는 취약성으로부터 정보를 수집하는 기능을 SIEM에 추가하는 방식을 제안하였다. 호스트를 공격하며 보안정보관리 체계를 기반으로 모니터링, 경고 및 보안감사에 대한 실시간 사용자의 대응을 확인할 수 있었다.

L1/L2 혼합형 중계 방법을 적용한 이더넷 기반 비압축 오디오 분배 시스템의 성능 분석 (Performance of Uncompressed Audio Distribution System over Ethernet with a L1/L2 Hybrid Switching Scheme)

  • 남위정;윤종호;박부식;조남홍
    • 대한전자공학회논문지TC
    • /
    • 제46권12호
    • /
    • pp.108-116
    • /
    • 2009
  • 본 논문에서는 고품질 비압축 오디오 트래픽의 분배 시에 요구되는 낮은 지연 및 지터를 보장하고 이더넷 환경에서 데이터 트래픽의 효율적인 교환을 가능하게 하는 새로운 L1/L2 혼합형 중계 방식을 적용한 이더넷 기반 오디오 분배 시스템을 제안하고 성능을 분석하였다. 제안하는 방식이 적용된 오디오 분배 시스템은 마스터 노드와 다수의 중계 노드로 구성되며 이들은 상호간에 상향 하향 링크를 통하여 데이지 체인 형태로 연결된다. 마스터 노드는 스테레오 24채널에서 PCM샘플링된 16비트 오디오 채널을 수납할 수 있는 오디오 프레임을 125us의 주기마다 생성하여 하향 링크를 통해 전송한다. 하향 링크를 통하여 오디오 프레임을 수신한 중계 노드들은 생성한 오디오 트래픽을 해당 노드에게 할당된 오디오 채널에 수납하고 다음 중계노드로 물리 계층 기반(L1)의 전송을 한다. 망의 종단 노드는 수신되는 오디오 프레임을 상향 링크를 통하여 마스터 노드로 루프백시키고 오디오가 상향 링크를 통하여 전송되는 과정에서 모든 중계 노드들은 자신이 수신해야 할 오디오 채널을 복사하여 오디오를 재생한다. 오디오 프레임의 송신이 완료되면 남은 기간 동안 중계 노드들은 L2 스위치로 동작하면서 데이터 프레임을 데이터 링크 계층 기반(L2)에서 교환한다. 이와 같은 L1/L2 혼합형 중계 방식의 동작을 위해 노드 입력 부의 물리 계층과 데이터 링크 간에 존재하는 MII에 오디오 프레임과 데이터 프레임을 구분하는 기능을 가지는 글루로직을 새로 추가하였다. 제안된 방식에 대하여 네트워크 시뮬레이터인 OMNeT++를 사용하고 다양한 파라미터를 통하여 제안된 방식이 오디오 트래픽의 지연 특성과 데이터 트래픽의 전송 효율 면에서 우수한 특성을 제공할 수 있음을 보였다. 제안된 방식은 물리 계층 기반의 전송 또는 데이터 링크 기반의 전송 방식을 사용하는 기존 이더넷 기반 오디오 분배 기술에 비하여 향상된 지연 성능 및 전송 효율을 제공할 수 있어 오디오분배 시스템뿐만 아니라 비디오분배 시스템, 디지털 AV장치 간의 연결 등에도 활용될 수 있다.

키워드 자동 생성에 대한 새로운 접근법: 역 벡터공간모델을 이용한 키워드 할당 방법 (A New Approach to Automatic Keyword Generation Using Inverse Vector Space Model)

  • 조원진;노상규;윤지영;박진수
    • Asia pacific journal of information systems
    • /
    • 제21권1호
    • /
    • pp.103-122
    • /
    • 2011
  • Recently, numerous documents have been made available electronically. Internet search engines and digital libraries commonly return query results containing hundreds or even thousands of documents. In this situation, it is virtually impossible for users to examine complete documents to determine whether they might be useful for them. For this reason, some on-line documents are accompanied by a list of keywords specified by the authors in an effort to guide the users by facilitating the filtering process. In this way, a set of keywords is often considered a condensed version of the whole document and therefore plays an important role for document retrieval, Web page retrieval, document clustering, summarization, text mining, and so on. Since many academic journals ask the authors to provide a list of five or six keywords on the first page of an article, keywords are most familiar in the context of journal articles. However, many other types of documents could not benefit from the use of keywords, including Web pages, email messages, news reports, magazine articles, and business papers. Although the potential benefit is large, the implementation itself is the obstacle; manually assigning keywords to all documents is a daunting task, or even impractical in that it is extremely tedious and time-consuming requiring a certain level of domain knowledge. Therefore, it is highly desirable to automate the keyword generation process. There are mainly two approaches to achieving this aim: keyword assignment approach and keyword extraction approach. Both approaches use machine learning methods and require, for training purposes, a set of documents with keywords already attached. In the former approach, there is a given set of vocabulary, and the aim is to match them to the texts. In other words, the keywords assignment approach seeks to select the words from a controlled vocabulary that best describes a document. Although this approach is domain dependent and is not easy to transfer and expand, it can generate implicit keywords that do not appear in a document. On the other hand, in the latter approach, the aim is to extract keywords with respect to their relevance in the text without prior vocabulary. In this approach, automatic keyword generation is treated as a classification task, and keywords are commonly extracted based on supervised learning techniques. Thus, keyword extraction algorithms classify candidate keywords in a document into positive or negative examples. Several systems such as Extractor and Kea were developed using keyword extraction approach. Most indicative words in a document are selected as keywords for that document and as a result, keywords extraction is limited to terms that appear in the document. Therefore, keywords extraction cannot generate implicit keywords that are not included in a document. According to the experiment results of Turney, about 64% to 90% of keywords assigned by the authors can be found in the full text of an article. Inversely, it also means that 10% to 36% of the keywords assigned by the authors do not appear in the article, which cannot be generated through keyword extraction algorithms. Our preliminary experiment result also shows that 37% of keywords assigned by the authors are not included in the full text. This is the reason why we have decided to adopt the keyword assignment approach. In this paper, we propose a new approach for automatic keyword assignment namely IVSM(Inverse Vector Space Model). The model is based on a vector space model. which is a conventional information retrieval model that represents documents and queries by vectors in a multidimensional space. IVSM generates an appropriate keyword set for a specific document by measuring the distance between the document and the keyword sets. The keyword assignment process of IVSM is as follows: (1) calculating the vector length of each keyword set based on each keyword weight; (2) preprocessing and parsing a target document that does not have keywords; (3) calculating the vector length of the target document based on the term frequency; (4) measuring the cosine similarity between each keyword set and the target document; and (5) generating keywords that have high similarity scores. Two keyword generation systems were implemented applying IVSM: IVSM system for Web-based community service and stand-alone IVSM system. Firstly, the IVSM system is implemented in a community service for sharing knowledge and opinions on current trends such as fashion, movies, social problems, and health information. The stand-alone IVSM system is dedicated to generating keywords for academic papers, and, indeed, it has been tested through a number of academic papers including those published by the Korean Association of Shipping and Logistics, the Korea Research Academy of Distribution Information, the Korea Logistics Society, the Korea Logistics Research Association, and the Korea Port Economic Association. We measured the performance of IVSM by the number of matches between the IVSM-generated keywords and the author-assigned keywords. According to our experiment, the precisions of IVSM applied to Web-based community service and academic journals were 0.75 and 0.71, respectively. The performance of both systems is much better than that of baseline systems that generate keywords based on simple probability. Also, IVSM shows comparable performance to Extractor that is a representative system of keyword extraction approach developed by Turney. As electronic documents increase, we expect that IVSM proposed in this paper can be applied to many electronic documents in Web-based community and digital library.