• 제목/요약/키워드: String matching

검색결과 101건 처리시간 0.023초

한국어 어절의 철자변화 현상 분류와 인식 방법 ((A Method to Classify and Recognize Spelling Changes between Morphemes of a Korean Word))

  • 김덕봉
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제30권5_6호
    • /
    • pp.476-486
    • /
    • 2003
  • 현재의 한국어 형태소 태그 부착 말뭉치에는 형태소 결합 경계의 철자변화 정보가 명시적으로 표시되어 있지 않다. 이로 인해 태그 부착 말뭉치로부터 형태소 분석에 필요한 사전을 자동으로 구축하거나 형태소 결합 경계의 철자변화 현상에 대한 체계적 예제 수집 등과 같은 한국어 형태론 연구에 필요한 자료 획득이 어렵다. 이 문제를 해결하기 위하여 본 논문은 사전과 음운 규칙을 이용하지 않고, 태그 부착 말뭉치의 어절 문자열과 형태소 문자열만을 비교하여 어절을 구성하는 형태소의 철자변화 현상을 인식하는 간단한 방법을 제안한다. 이 방법은 규칙을 사용하지 않기 때문에 두 형태소 결합으로 나타나는 모든 철자변화 현상을 유연하게 인식할 수 있고, 알고리즘 구현만으로 문제를 해결할 수 있기 때문에 비용이 싸다는 특징이 있다. 한 태그 부착 말뭉치에 대한 실험에서 본 방법은 실험 말뭉치 어절에 나타나는 철자 변화를 100% 인식하는 것으로 나타났다.

구조 및 의미 정보를 활용한 파스 트리 커널 기반의 온톨로지 정렬 방법 (Ontology Alignment based on Parse Tree Kernel usig Structural and Semantic Information)

  • 손정우;박성배
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제36권4호
    • /
    • pp.329-334
    • /
    • 2009
  • 기존 온톨로지 정렬 기법은 두가지 문제점을 가지고 있다. 먼저 자질을 해당 분야 전문가가 정의하기 때문에 중요한 자질들이 자질셋에 포함되지 않을 수 있다는 것이다. 다음으로는 온톨로지의 의미 정보와 구조 정보를 이용하여 유사도를 따로 계산한 후, 각각의 실험에 의해 정의된 가중치를 이용하여 전체 유사도를 계산한다. 하지만 온톨로지 상에 나타나는 의미 정보와 구조정보의 상대적인 가중치가 실험적인 방법 혹은 사용자에 의해 결정되기 때문에 시스템이 특정 온톨로지에 한정되거나 성능이 떨어질 수 있어 문제이다. 본 논문에서는 온톨로지 정렬을 위한 파스 트리 커널을 제안한다. 온톨로지 상의 개체에 대한 유사도를 계산하기 위해 먼저 온톨로지를 트리 구조로 변환한다 그 후, 변환된 트리 간의 유사도는 온톨로지 정렬을 위해 수정된 파스트리 커널을 이용하여 계산한다. 이때 자질은 명시적으로 나열하지 않는다. 유사도 계산시, 파스 트리 커널에 근사 스트링 매칭 기법을 적용하여 의미 정보를 반영한다. 검증 위한 실험에서 제안한 방법은 기존의 온톨로지 정렬 기법보다 나은 성능을 보였다.

교정사전과 신문기사 말뭉치를 이용한 한국어 철자 오류 교정 모델 (A Spelling Error Correction Model in Korean Using a Correction Dictionary and a Newspaper Corpus)

  • 이세희;김학수
    • 정보처리학회논문지B
    • /
    • 제16B권5호
    • /
    • pp.427-434
    • /
    • 2009
  • 인터넷 및 모바일 환경의 빠른 발전과 함께 신조어나 줄임말과 같은 철자 오류들을 포함하는 텍스트들이 활발히 통용되고 있다. 이러한 철자 오류들은 텍스트의 가독성을 떨어뜨림으로써 자연어처리 응용들을 개발하는데 걸림돌이 된다. 이러한 문제를 해결하기 위해서 본 논문에서는 철자오류 교정사전과 신문기사 말뭉치를 이용한 철자 오류 교정 모델을 제안한다. 제안 모델은 구하기 쉬운 신문기사 말뭉치를 학습 말뭉치로 사용하기 때문에 데이터 구축비용이 크지 않다는 장점이 있다. 또한 교정사전 기반의 단순 매칭 방법을 사용하기 때문에 띄어쓰기 교정 시스템이나 형태소 분석기와 같은 별도의 외부 모듈이 필요 없다는 장점이 있다. 신문기사 말뭉치와 실제 휴대폰에서 수집한 문자 메시지 말뭉치를 이용한 실험 결과, 제안 모델은 다양한 평가 척도에서 비교적 높은 성능(오교정률 7.3%, F1-척도 97.3%, 위양성율 1.1%)을 보였다.

EM에서 SPARC 코드로 효율적인 코드 확장 (An Efficient Code Expansion from EM to SPARC Code)

  • 오세만;윤영식
    • 한국정보처리학회논문지
    • /
    • 제4권10호
    • /
    • pp.2596-2604
    • /
    • 1997
  • ACK는 가상 스택 기계에 기반을 둔 EM 중간 코드로부터 레지스터 구조에 기반을 둔 SPARC 기계에 대한 목적 코드를 생성하기 위해서는 코드 확장기(code expander)를 이용하고 있다. 따라서 EM 코드로부터 SPARC 목적 코드를 생성하기 위해 스택 지향 구조로부터 레지스터 지향 구조로 변환하여야 한다. 코드 확장기를 이용한 SPARC 코드 생성 기법은 각 EM 명령어에 대해 SPARC 코드로 확장하는 루틴들로 구성되며 코드 생성기에 비해 코드의 질을 개선하기 위해 푸쉬-팝 최적화 동작을 수행한다. 하지만 코드 확장시에 별도의 자원과 관리를 요구하는 혼합 스택(hybrid stack)을 이용하고 있으며 전단부의 정보 손실로 레지스터 윈도우를 이용한 효율적인 매개변수 전달을 고려하지 않는다. 본 논문에서는 ACK의 전체적인 구조의 변경 없이 목적 기계의 스택과 매개변수 전달을 고려하나 효율적인 SPARC 코드를 생성하기 위해 EM 트리를 이용한 SPARC 코드 확장기를 설계하고 구현하였다. 이를 위해, 순차적인 EM 코드를 입력으로 받아 스택 속성을 반영한 트리로 구성하며 혼합 스택을 제거하기 위해 지역 변수 정보를 별도로 관리하였다. EM 트리의 순회 및 확장 과정에서 목적 코드를 생성할 수 있는 루틴을 통하여 목적 코드를 출력하며 추출된 정보와 노드의 성격에 출력 시기와 목적 코드를 결정한다.

  • PDF

공간 효율적인 DNA 시퀀스 인덱싱 방안 (A Space Efficient Indexing Technique for DNA Sequences)

  • 송혜주;박영호;노웅기
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제36권6호
    • /
    • pp.455-465
    • /
    • 2009
  • 서픽스 트리는 공통의 프리픽스의 빈도수가 높을 때 효과적인 알고리즘으로, 한정된 문자로만 구성된 DNA 유사성 검색을 위한 연구에서 널리 활용되고 있다. 그러나, 서픽스 트리는 인덱스 특성상 메모리 공간을 많이 차지하며, 트리의 분할 시 DNA 시퀀스의 비율로 인한 쏠림현상이 발생한다는 문제점을 가진다. 따라서, 본 논문에서는 공통의 프리픽스를 가지는 가변길이의 파티셔닝 방법으로 합병하지 않는 인덱싱 방안인 SENoM을 제안한다. SENoM은 전체 시퀀스에서 공통의 프리픽스를 가지는 서픽스들의 발생 빈도수가 임계치 이하인 경우 디스크에 저장하고, 임계치 이상인 경우 임계치 이하가 될 때까지 프리픽스를 확장한다. 모든 파티션은 서브트리로 구축한 후 디스크에 저장하며, 질의처리를 위해, 구축된 파티션의 프리픽스를 서픽스로 가지는 트리를 구축한다. 제안하는 기법은 복잡한 합병과정을 제거하고, 많은 파티션 발생으로 인한 디스크 I/O 발생을 줄인다. 실험을 통해, SENoM이 Trellis 알고리즘에 비해 메모리 사용량을 약 35%, 인덱스 크기를 약 20% 감소시켰음을 보인다. 또한, 질의길이가 긴 경우에도 프리픽스 트리를 이용하여 효과적인 질의처리가 가능함을 보인다.

화학 데이타베이스에서 부분구조 검색을 위한 인덱스 구조 (An Index Structure for Substructure Searching In Chemical Databases)

  • 이환구;차재혁
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제31권6호
    • /
    • pp.641-649
    • /
    • 2004
  • 약물의 화학적 구조와 그 약물의 약리작용간의 연관성은, 'Medicinal Chemistry' 분야에서 활발히 연구된다. 이는 화학구조를 기반으로 하여 신약을 설계하려는 시도로서, 약학자는 신약 개발 시 만들고자 하는 약물과 비슷한 화학구조를 가지고 있는 기존 약물들에는 어떠한 것들이 있는지 조사하며, 특정 화학구조가 어떤 약물들에서 나타나는지 신속히 검색하기를 원한다. 이처럼 어떤 화차구조에서, 특정한 부분구조가 존재하는지를 검사하는 것을 부분구조검색(Substructure Searching)이라 하며, 이는 그래프 이론에서 NP-complete인 동형성 판정(Subgraph Isomorphism) 문제로 귀결된다. 검색 시간을 단축시키고자 여러 다른 전근방법들이 연구되었는데, 1990년대에는 구조에 대한 인덱스를 미리 만들어 RDBMS에 저장한 후, 검색시 이론 이용하여 성능을 높이는 방법으로 미국 특허를 획득한 RS3 시스템(http://www.acelrys.com/rs3)이 현재 상용화되어 쓰이고 있다. 본 논문에서는 RS3 시스템의 문제점을 규명하고, 이의 개선방안으로서 새로운 인덱스를 제안한다 RS3 시스템은 각 원자를 중심으로 다른 원자와의 구조를 문자연로 표현하고, 부분구조검색 쿼리를 부분문자열 검색을 실행함으로써 수행하는데, 이의 화학구조를 기술하는 인덱스에는 동일 원자, 동릴 결합에 대한 정렬이 불가능하여 재현율(Recall)과 정도(Precision)가 낮다. 이론 개선하기 위하여 본 논문에서는 2차원의 화학구조를 나누어 1차원의 구조 단편으로 만들고 이를 문자열로 기술하는 방안을 제시하며 구체적인 방법으로 한 인자를 중심으로 최소비용신장트리를 구성한 다음 레벨별로 경로를 나누어 기술하는 방안을 제안하며, 이와 같은 방법의 새로운 인덱스로 재현율과 정도가 급격히 향상됨을 보인다.

인공지능 기술의 통합보안관제 적용 및 사이버침해대응 절차 개선 (Application of Integrated Security Control of Artificial Intelligence Technology and Improvement of Cyber-Threat Response Process )

  • 고광수;조인준
    • 한국콘텐츠학회논문지
    • /
    • 제21권10호
    • /
    • pp.59-66
    • /
    • 2021
  • 본 논문에서는 통합보안관제에 인공지능 기술을 적용하고, 기존 보안관제와 인공지능 보안관제의 대응절차를 일원화한, 개선된 통합보안관제 절차를 새롭게 제안하였다. 현재의 사이버보안관제는 사람의 능력 수준에 의존도가 매우 높다. 그래서 사람에 의해 여러 이기종 장비에서 발생하는 다양한 로그를 분석하고, 급증하는 보안이벤트를 모두 분석·처리한다는 것은 사실상 무리가 있다. 그리고 문자열과 패턴 일치로 탐지하는 시그니처 기반의 보안장비는 APT(Advanced Persistent Threat)와 같은 고도화·지능화된 사이버공격을 정확히 탐지하기에 기능상 부족한 면이 있다. 이러한 문제들을 해결하기 위한 방안으로 인공지능 지도·비지도학습 기술을 사이버공격 탐지 및 분석에 적용하고, 이를 통해 수 없이 많이 발생하는 로그와 이벤트의 분석을 자동화하여, 고도화된 사이버공격의 지속적인 발생을 예측·차단할 수 있도록 하여 전반적인 측면에서 대응수준을 높였다. 그리고 보안관제에 인공지능 기술을 적용한 후 AI와 SIEM의 중복 탐지 등의 문제점을 일원화 된 침해대응 프로세스(절차)로 통합·해결함으로써 개선된 통합보안관제 서비스 모델을 새롭게 제안하였다.

WhiteList 기반의 악성코드 행위분석을 통한 악성코드 은닉 웹사이트 탐지 방안 연구 (Research on Malicious code hidden website detection method through WhiteList-based Malicious code Behavior Analysis)

  • 하정우;김휘강;임종인
    • 정보보호학회논문지
    • /
    • 제21권4호
    • /
    • pp.61-75
    • /
    • 2011
  • 최근 DDoS공격용 좀비, 기업정보 및 개인정보 절취 등 각종 사이버 테러 및 금전적 이윤 획득의 목적으로 웹사이트를 해킹, 악성코드를 은닉함으로써 웹사이트 접속PC를 악성코드에 감염시키는 공격이 지속적으로 증가하고 있으며 은닉기술 및 회피기술 또한 지능화 전문화되고 있는 실정이다. 악성코드가 은닉된 웹사이트를 탐지하기 위한 현존기술은 BlackList 기반 패턴매칭 방식으로 공격자가 악성코드의 문자열 변경 또는 악성코드를 변경할 경우 탐지가 불가능하여 많은 접속자가 악성코드 감염에 노출될 수 밖에 없는 한계점이 존재한다. 본 논문에서는 기존 패턴매칭 방식의 한계점을 극복하기 위한 방안으로 WhiteList 기반의 악성코드 프로세스 행위분석 탐지기술을 제시하였다. 제안방식의 실험 결과 현존기술인 악성코드 스트링을 비교하는 패턴매칭의 MC-Finder는 0.8%, 패턴매칭과 행위분석을 동시에 적용하고 있는 구글은 4.9%, McAfee는 1.5%임에 비해 WhiteList 기반의 악성코드 프로세스 행위분석 기술은 10.8%의 탐지율을 보였으며, 이로써 제안방식이 악성코드 설치를 위해 악용되는 웹 사이트 탐지에 더욱 효과적이라는 것을 증명할 수 있었다.

웹서비스 유사성 평가 방법들의 실험적 평가 (Evaluation of Web Service Similarity Assessment Methods)

  • 황유섭
    • 지능정보연구
    • /
    • 제15권4호
    • /
    • pp.1-22
    • /
    • 2009
  • 월드와이드웹(WWW)은 유용한 정보를 포함하는 자료들의 집합에서 유용한 작업을 수행할 수 있는 서비스들의 집합으로 변화하고 있다. 새롭게 등장하고 있는 웹서비스 기술은 향후 웹의 기술적 변화를 추구하며 최근의 웹의 변화에 중요한 역할을 수행할 것으로 기대된다. 웹서비스는 어플리케이션 간의 통신을 위한 호환성 표준을 제시하며 기업 내/외를 아우를 수 있는 어플리케이션 상호작용 및 통합을 촉진한다. 웹서비스를 서비스 중심 컴퓨팅환경으로서 운용하기 위해서는 웹서비스 저장소는 조직화되어 있어야 할 뿐 아니라, 사용자들의 요구에 맞는 웹서비스 컴포넌트를 찾을 수 있는 효율적인 도구들을 제공하여야 한다. 서비스 중심 컴퓨팅을 위한 웹서비스의 중요성이 증대됨에 따라 웹서비스 발견을 효율적으로 제공할 수 있는 기법의 수요 또한 증대된다. 웹서비스 발견을 위한 많은 기법들이 제안되어 왔지만, 대부분의 선행연구들은 활용하기에는 제대로 발달하지 못하였거나 특정 도메인에 너무 치중하여 일반화하기 어려웠다. 이 논문에서는 군집화기법과 XML기반의 서비스 기술표준인 WSDL의 의미적 가치를 활용하여 다수의 웹서비스를 군집화하는 프레임워크를 제안한다. 웹서비스 발견이라는 연구영역에 최초로 데이터마이닝 기법을 적용한 연구이다. 본 논문에서 제안하는 방식은 여러 흥미로운 요소들이 있다: (1) 서비스 사용자와 제공자들의 사전지식 요구를 최소화한다 (2) 특정 도메인에 과도하게 치중한 온톨로지를 피한다 (3) 웹서비스들 간의 의미론적 관계를 시각화할 수 있다. 이 논문에서 인공신경 정신망 네트워크를 기반으로 하여 프로토타입 시스템을 개발하였으며, 실제 운용되고 있는 웹서비스 저장소로부터 획득한 실제 웹서비스들을 사용하여 제안하는 웹서비스 조직화 프레임워크를 실증적으로 평가하였으며 제안하는 방식의 효용성을 보여주는 실험결과를 보고한다.

  • PDF

향(香) 집에 관한연구 (A study on Perfume case)

  • 이선재
    • 복식
    • /
    • 제33권
    • /
    • pp.117-142
    • /
    • 1997
  • This study is on perfume case that is one of a great number of ornaments which was designed by out ancestors. We had developed the tradition and the history of perfume case bag fan-weight etc. These have the same function as the present perfume. case. There were basket-shaped perfume cases which were the smellest one among the personal girdle ornaments in the silla era. The various patterned perfume case were made of gold metal coral platinum or green jadeite etc. In the single-crop trinkets a embroidered perfume bag with the gold and silver thread whose forms perfectly match their functions appeared during the Yi Dynasty. There was also a perfume bag which was one of the daily necessities. A precious "jul perfume" was carried by noble women. A fan-weight perfume bag was attached to the fan to emphasize the intrinsic beauty of utility and function. It is necessary to know the function of prefume case. As perfume case is weared on the clothes it was given more decorative effects as well as the function of medicinal amulet with a sweet smell. Therefore it is very important for us to study perfume case that has various function as an ornament. So The purpose of this study is to investigate the practical and decorative side of perfume case with the general examines of perfume finding how to practice use through our life. The results were as follows; 1. The first use of perfume is perfume through smoke which is for ceremony of religion It removes human body odor by degrees and spreads a sweet odor. Also the materials for making perfume of early age is aromatic plants which will be used flour-made flowers stems. As the materials for making perfume use is increasing today we can invent alcohol perfume today 2. Our country the custom of perfume-used is wide. Among them men's perfume-used was very special phenomenon. For example men were wearing perfume bag in the Silla era. Because perfume represented wealth and noble in those days. They shew off social position personality through perfume-used. 3. One of early religion ceremony article there was the perfume. And perfume case was means for containing perfume. Gradually the perfume case was used widly as increasing needs of perfume in human life. 4. In the middle period of 'Koryo' Dynasty perfume cases had a close relationship with clothes but after Mongolian has been attacked 'Koryo' there were changes in wearing clothes therefore the position of perfume cases were transfered to coat string that was the origin of decoration style that they began. That is to say the perfume case has been influenced the position of perfume case shapes with changing of fashion. 5. The perfume case has been made manifest various function as an ornament. In the practical side First medical-perfume in perfume case has been played an important role in first-aid medicine in critical condition. Second it was amulet for self protection. That is the shape pattern color materials perfume of the perfume case was represented the amuletive nature. Third it was used as substitute article of perfume. Modern women use liquid-perfume as our ancestors used perfume case bag or jul perfume As started above. Also In the decorative side the perfume case has a beautiful formative arts by itself as well as a close relationship with clothes. That well as a close relationship with clothes. That is when the perfume case is worn on the clothes costume is showed aesthetices. That is the materials shapes color pattern of the perfume case we can see the visual beauty also the materials colors embroidered pattern knots tassel that are used the perfume case are increased the decorative beauty of costume. Sixth the symbol in pattern of the pattern case is shown ancetor's wealth and rank health longevity immortality many-born-boy in those days. Today the perfume case is not used with changing of costume by degrees, Accordingly I hope that the result of this study is an influened in devlopment of the perfume case design with matching the modern fashion.

  • PDF