• Title/Summary/Keyword: 정규 표현

Search Result 384, Processing Time 0.025 seconds

A Hardware Architecture of Multibyte-based Regular Expression Pattern Matching for NIDS (NIDS를 위한 다중바이트 기반 정규표현식 패턴매칭 하드웨어 구조)

  • Yun, Sang-Kyun;Lee, Kyu-Hee
    • The Journal of Korean Institute of Communications and Information Sciences
    • /
    • v.34 no.1B
    • /
    • pp.47-55
    • /
    • 2009
  • In recent network intrusion detection systems, regular expressions are used to represent malicious packets. In order to process incoming packets through high speed networks in real time, we should perform hardware-based pattern matching using the configurable device such as FPGAs. However, operating speed of FPGAs is slower than giga-bit speed network and so, multi-byte processing per clock cycle may be needed. In this paper, we propose a hardware architecture of multi-byte based regular expression pattern matching and implement the pattern matching circuit generator. The throughput improvements in four-byte based pattern matching circuit synthesized in FPGA for several Snort rules are $2.62{\sim}3.4$ times.

Development of the Pattern Matching Engine using Regular Expression (정규 표현식을 이용한 패턴 매칭 엔진 개발)

  • Ko, Kwang-Man;Park, Hong-Jin
    • The Journal of the Korea Contents Association
    • /
    • v.8 no.2
    • /
    • pp.33-40
    • /
    • 2008
  • In various manners, string pattern matching algorithm has been proven for prominence in speed of searching particular queries and keywords. Whereas, the existing algorithms are limited in terms of various pattern. In this paper, regular expression has been utilized to improve efficiency of pattern matching through efficient execution towards various pattern of queries including particular keywords. Such as this research would enable to search various harmful string pattern more efficiently, rather than matching simple keywords, which also implies excellent speed of string pattern matching compared to that of those existing algorism. In this research, the proposed string search engine generated from the LEX are more efficient than BM & AC algorithm for a string patterns search speed in cases of 1000 with more than patterns, but we have got similar results for the keywords pattern matching.

Classification and Normalization of Korean Numerals (한국어 수사어절의 유형 분류 및 정규화)

  • 강승식
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 1999.10b
    • /
    • pp.187-189
    • /
    • 1999
  • 여러 가지 형태로 표현되는 수사어절을 아라비아 숫자로 구성된 표준형으로 변환하기 위하여 수사어절을 인식하는 알고리즘과 수사어절을 표준형으로 변환하는 수사어절 정규화 알고리즘을 제안한다. 띄어쓴 수사어절은 전처리 단계에서 수사어절 인식 알고리즘을 이용하여 한 어절로 결합한다.

  • PDF

EDF 통계량을 이용한 다변량 정규성 검정

  • Kim, Nam-Hyeon
    • Proceedings of the Korean Statistical Society Conference
    • /
    • 2005.05a
    • /
    • pp.31-36
    • /
    • 2005
  • EDF에 근거한 Cramer-von Mises 형태의 통계량을 합교원리를 이용하여 다변량으로 일반화한다. 그리고 제안된 통계량의 귀무가설에서의 극한분포를 적절한 공분산함수를 가진 가우스 과정의 적분의 형태로 표현하고 통계량의 근사적인 계산방법을 고려한다.

  • PDF

Temporal Information Extraction from Korean News for Event Detection and Tracking (사건 탐지/추적을 위한 시간 정보 추출)

  • Kim, Pyung;Sung, Ki-Youn;Myaeng, Sung-Hyon
    • Annual Conference on Human and Language Technology
    • /
    • 2003.10d
    • /
    • pp.22-29
    • /
    • 2003
  • 시간정보는 사건 탐지/추적 시스템은 물론 정보 추출, 질의/응답 시스템 등에서 매우 중요한 역할을 한다. 본 연구에서는 한국어 신문 기사를 대상으로 시간 표현을 추출하고 정규화한 후 사건 관련 동사와 연결하는 자동화된 방법들을 제안하였다. 시간 표현을 추출하기 위해서 품사정보로 구축된 패턴과 시간 표현 어휘가 사용되었고, 정규화 과정과 사건 관련 동사와의 연결을 위한 규칙이 만들어졌다. 한국어 신문을 대상으로 제안한 방법의 단계별 평가를 수행하였고, 제안하는 방법의 확장성을 보이기 위해 서로 다른 도메인에도 실험을 하였다.

  • PDF

비정규직 문제와 노동계급 계급균열: 비정규직 문제를 둘러싼 정규직·비정규직 의식 비교

  • Jo, Don-Mun
    • Korean Journal of Labor Studies
    • /
    • v.14 no.2
    • /
    • pp.169-200
    • /
    • 2008
  • 노동계급은 다양한 형태의 내적 이질성을 지니고 있으며, 신자유주의 경제정책과 구조조정 과정에서 고용형태에 따른 이질성은 계급균열로 발달하며 노동계급 내적 이질성 논의의 핵심을 구성하게 되었다. 국내의 선행 연구들도 정규직과 비정규직 사이의 물질적 존재조건의 양극화 추세와 사회적 관계의 위계적 배제적 성격을 확인해 주고 있다. 하지만 정규직과 비정규직 사이의 계급균열이 극복되고 노동계급의 내적 통합과 계급형성 과정을 이룰 수 있는지에 대한 논의로 발전하지는 못했다. 본 연구는 계급균열의 극복과 노동계급 통합의 가능성을 검토하기 위해 계급균열의 핵심인 비정규직 노동자 문제를 둘러싼 정규직 비정규직의 의식 수준의 비교연구를 실시한다. 본 연구는 민주노총 공공운수연맹 노동조합원들에 대한 설문조사와 심층면접 연구를 통해 계급균열의 존재를 확인하고 그 원인과 의미를 분석하였다. 첫째, 정규직과 비정규직 노동자들은 비정규직 문제에 대한 인식을 공유하고 있지만 구체적 해결책에 대해서는 입장 차이를 보임으로써 고용형태에 따른 계급균열은 존재하며, 경제위기 이후에도 해소되지 않고 고착화되고 있음을 확인시켜 주었다. 둘째, 고용형태에 따른 계급내적 균열이 비정규직 문제 인식과 추상적 원칙 수준에서는 유의미한 의식 차이를 보이지 않지만 비정규직 문제 해결을 위한 구체적 해결책에 대해 유의미한 입장 차이를 보이는 것은 정규직과 비정규직 사이의 물질적 이해관계의 차이 때문이다. 정규직 노동자들은 비정규직 노동자들의 고용안정성과 노동조건의 개선을 허용하더라도 자신들의 이해관계가 위협받지 않는 수준에서 이루어져야 한다고 보는 것이다. 셋째, 정규직 노동자들이 추상적 원칙 수준에서는 비정규직 노동자들과 동질성을 보이지만 구체적 대안에서 차별성을 보이는 것은 정규직 노동자들의 의식의 양면성을 표현하는 것이며, 물질적 이해관계에 기초한 개인적 수준의 합리성과 계급적 원칙에 기초한 계급적 수준의 합리성이 갈등하고 있는 것이다. 넷째, 정규직 노동자들의 주관성 속에서 개인적 합리성과 계급적 합리성이 갈등하는 정도는 노동조합 가입 여부 및 소속 노동조합의 정체성, 즉 이익집단 정체성 혹은 계급조직 정체성에 의해 결정된다. 여기에 계급조직 정체성을 지닌 민주노조들이 노동계급 계급균열을 극복하고 계급형성을 이루는데 기여할 수 있다는 실천적 함의가 있다.

Genealogy-based Indexing Technique for XML Documents (XML문서를 위한 족보 기반 인덱싱 기법)

  • 이월영;용환승
    • Journal of KIISE:Databases
    • /
    • v.31 no.1
    • /
    • pp.72-81
    • /
    • 2004
  • Theses days, a number of data over the Internet are represented using XML because of a virtue of XML. In proportion to the increase of XML data, query processing techniques are required that support quickly and efficiently the diverse queries to search the useful information on XML documents. But, up to now, the researches handling queries for XML data are methodologies focusing on how to process regular path expressions. Therefore, we have developed a new genealogy-based indexing technique to solve various queries such as not only regular path expression but also simple path expression, path expression referencing other elements, and so on. Also, we have applied this technique on object-relational model and evaluated the performance for many documents and various query types. The result shows improved performance in comparison with the other storage techniques.

Correction for Hangul Normalization (올바른 한글 정규화를 위한 수정 방안)

  • Ahn, Dae-Hyuk;Park, Young-Bae
    • Annual Conference on Human and Language Technology
    • /
    • 2006.10e
    • /
    • pp.73-80
    • /
    • 2006
  • 현재 유니코드에서 한글텍스트의 정규화 기법은 완성형 현대한글 음절과 옛 한글을 표현하는 조합형 한글 그리고 호환 자모등과 같이 사용할 경우 원래의 글자와는 전혀 다른 글자의 조합을 만들어내는 문제점이 있다. 이러한 문제점은 호환 한글 자모 및 기호들의 잘못된 정규화 변환과 유니코드의 한글자모 조합 규칙에서 자모와 완성형 현대한글 음절을 다시 조합하여 한글음절로 사용 할 수 있게 허용한 때문이다. 이는 정규화 형식을 처음 작성할 당시 옛 한글의 사용을 고려하지 않았거나, 한글에 대한 올바른 이해가 부족한 상태에서 작성 된데 따른 결과라 하겠다. 따라서 본 연구에서는 유니코드 환경에서의 한글코드와 특히 최근 들어 Web을 비롯하여 XML과 IDN에서 필연적으로 사용하는 정규화에 따른 문제점을 파악하고 이들을 올바르게 처리하기 위한 정규화의 수정 방안과 조합형 한글의 조합규칙에 대한 수정 방안을 제안한다.

  • PDF

Rule-based Normalization of Relative Temporal Information

  • Jeong, Young-Seob;Lim, Chaegyun;Lee, SeungDong;Mswahili, Medard Edmund;Ndomba, Goodwill Erasmo;Choi, Ho-Jin
    • Journal of the Korea Society of Computer and Information
    • /
    • v.27 no.12
    • /
    • pp.41-49
    • /
    • 2022
  • Documents often contain relative time expressions, and it is important to define a schema of the relative time information and develop a system that extracts such information from corpus. In this study, to deal with the relative time expressions, we propose seven additional attributes of timex3: year, month, day, week, hour, minute, and second. We propose a way to represent normalized values of the relative time expressions such as before, after, and count, and also design a set of rules to extract the relative time information from texts. With a new corpus constructed using the new attributes that consists of dialog, news, and history documents, we observed that our rule-set generally achieved 70% accuracy on the 1,041 documents. Especially, with the most frequently appeared attributes such as year, day, and week, we got higher accuracies compared to other attributes. The results of this study, our proposed timex3 attributes and the rule-set, will be useful in the development of services such as question-answer systems and chatbots.

An Efficient Technique for Evaluating Queries with Multiple Regular Path Expressions (다중 정규 경로 질의 처리를 위한 효율적 기법)

  • Chung, Tae-Sun;Kim, Hyoung-Joo
    • Journal of KIISE:Databases
    • /
    • v.28 no.3
    • /
    • pp.449-457
    • /
    • 2001
  • As XML has become an emerging standard for information exchange on the World Wide Web, it has gained attention in database communities to extract information from XML seen as a database model. XML queries are based on regular path queries, which find objects reachable by given regular expressions. To answer many kinds of user queries, it is necessary to evaluate queries that have multiple regular path expressions. However, previous work such as query rewriting and query optimization in the frame work of semistructured data has dealt with a single regular expression. For queries that have multiple regular expressions we suggest a two phase optimizing technique: 1. query rewriting using views by finding the mappings from the view's body to the query's body and 2. for rewritten queries, evaluating each query conjunct and combining them. We show that our rewriting algorithm is sound and our query evaluation technique is more efficient than the previous work on optimizing semistructured queries.

  • PDF