• Title/Summary/Keyword: 문자패턴

Search Result 297, Processing Time 0.031 seconds

A Study on User's Purchasing Pattern based on Text mining and Location awareness for T-Commerce (T-Commerce를 위한 위치인식 및 텍스트마이닝 기반 사용자 구매 패턴 연구)

  • Song, HyeJin;Kim, Jin-Ah;Lee, Sunmin;Moon, Nammee
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2016.11a
    • /
    • pp.134-136
    • /
    • 2016
  • 최근 TV시청은 다양한 매체를 통해서 이루어지고 있으며, 특히 스마트폰을 통한 시청률이 늘고 있는 상황이다. 광고시장에서도 TV시청 중에 스마트기기를 함께 이용하는 멀티태스킹 사용자가 급증하고 있으며 특히 10~30대의 사용이 적극적이다. TV시청 중 스마트 기기의 사용분야는 메신저, 정보검색, SNS 순이며 스마트 기기사용 내용 중 69%는 시청하던 TV 시청과 관련된 것이었다. 이 중에 75%는 TV에 등장한 제품, 브랜드, 장소에 관한 것이다[1]. TV를 시청하는 상황에 스마트기기의 소셜 활동의 문자를 분석하는 것은 사용자 의도를 파악할 수 있는 의미가 있으며, 시청자의 현재 위치를 파악함으로써 시청자의 의도에 반영되는 상황을 파악할 수 있다. T-Commerce 구매 의도는 사용자의 현재 상황에 대한 순간 의도를 파악하는것이 중요하며, 이와 같은 구매의도를 파악하기 위해서 본 연구에서는 GPS와, Wi-Fi 기반 Fingerprinting 측위기법을 사용하여 특별한 도구나 장비의 설치 없이 현재위치와 멀티태스킹 데이터를 분석하여 구매의도를 파악한다. T-Commerce 소비환경 패턴이 바뀜에 따라, 다양한 소비 환경 데이터 분석은 효율적인 광고 제공과 만족도를 높일 것으로 기대된다.

  • PDF

Enhanced Fuzzy Single Layer Perceptron (개선된 퍼지 단층 퍼셉트론)

  • Lee, Jae-Eon;Her, Joo-Yong;Kim, Kwang-Baek
    • Proceedings of the Korean Institute of Information and Commucation Sciences Conference
    • /
    • v.9 no.1
    • /
    • pp.447-452
    • /
    • 2005
  • 기존의 단층 퍼셉트론은 출력 노드가 선형 분리 가능한 패턴들만을 분류할 수 있고 Exclusive OR와 같은 비선형 문제에 대해서는 분류할 수 없는 단점이 있다. 그러나 퍼지 단층 퍼셉트론은 퍼지소속 함수(fuzzy membership function)를 적용하여 단층 구조로 Exclusive OR 문제와 같은 고전적인 문제를 개선하였다. 그러나 퍼지 단층 퍼셉트론은 기존의 단층 퍼셉트론과 마찬가지로 결정 경계선이 진동하는 경우가 생기며 초기 가중치의 범위와 학습률에 따라 수렴성이 매우 낮아지는 단점이 있다. 따라서 본 논문에서는 바이어스항을 도입하여 결정 경계선이 진동하는 것을 방지하여 수렴성을 개선시키고 선형 활성화 함수를 제안하고 학습률과 모멘텀 개념을 도입하여 학습 시간을 단축시키는 개선된 퍼지 단층 퍼셉트론 알고리즘을 제안한다. 제안된 방법과 퍼지 단층 퍼셉트론간의 학습 성능을 분석하기 위하여 인공 신경망에서 벤치마크로 사용되는 exclusive OR 문제와 문자 패턴 분류에 적용하여 epoch 수와 수렴성을 비교한 결과, 제안된 방법이 기존의 퍼지 단층 퍼셉트론보다 학습 시간이 적게 소요되고 수렴성이 개선된 것을 확인하였다.

  • PDF

Font Classification using NMF and EMD (NMF와 EMD를 이용한 영문자 활자체 폰트분류)

  • Lee, Chang-Woo;Kang, Hyun;Jung, Kee-Chul;Kim, Hang-Joon
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2004.04b
    • /
    • pp.688-690
    • /
    • 2004
  • 최근 전자화된 문서 영상을 효율적으로 관리하고 검색하기 위한 문서구조분석 방법과 문서의 자동 분류에 관한 많은 연구가 발표되고 있다. 본 논문에서는 NMF(non-negative matrix factorization) 알고리즘을 사용하여 폰트를 자동으로 분류하는 방법을 제안한다. 제안된 방법은 폰트의 구분 특징들이 공간적으로 국부성을 가지는 부분으로 표현될 수 있다는 가정을 바탕으로, 전체의 폰트 이미지들로부터 각 폰트들의 구분 특징인 부분을 학습하고, 학습된 부분들을 특징으로 사용하여 폰트를 분류하는 방법이다. 학습된 폰트의 특징들은 계층적 군집화 알고리즘을 이용하여 템플릿을 생성하고, 테스트 패턴을 분류하기 위하여 템플릿 패턴과의 EMD(earth mover's distance)를 사용한다. 실험결과에서 폰트 이미지들의 공간적으로 국부적인 특징들이 조사되고, 그 특징들의 폰트 식별을 위한 적절성을 보였다. 제안된 방법이 기존의 문자인식. 문서 검색 시스템들의 전처리기로 사용되면. 그 시스템들의 성능을 향상시킬 것으로 기대된다.

  • PDF

Automatic Generation of Snort Content Rule for Network Traffic Analysis (네트워크 트래픽 분석을 위한 Snort Content 규칙 자동 생성)

  • Shim, Kyu-Seok;Yoon, Sung-Ho;Lee, Su-Kang;Kim, Sung-Min;Jung, Woo-Suk;Kim, Myung-Sup
    • The Journal of Korean Institute of Communications and Information Sciences
    • /
    • v.40 no.4
    • /
    • pp.666-677
    • /
    • 2015
  • The importance of application traffic analysis for efficient network management has been emphasized continuously. Snort is a popular traffic analysis system which detects traffic matched to pre-defined signatures and perform various actions based on the rules. However, it is very difficult to get highly accurate signatures to meet various analysis purpose because it is very tedious and time-consuming work to search the entire traffic data manually or semi-automatically. In this paper, we propose a novel method to generate signatures in a fully automatic manner in the form of sort rule from raw packet data captured from network link or end-host. We use a sequence pattern algorithm to generate common substring satisfying the minimum support from traffic flow data. Also, we extract the location and header information of the signature which are the components of snort content rule. When we analyzed the proposed method to several application traffic data, the generated rule could detect more than 97 percentage of the traffic data.

Error Correction Methode Improve System using Out-of Vocabulary Rejection (미등록어 거절을 이용한 오류 보정 방법 개선 시스템)

  • Ahn, Chan-Shik;Oh, Sang-Yeob
    • Journal of Digital Convergence
    • /
    • v.10 no.8
    • /
    • pp.173-178
    • /
    • 2012
  • In the generated model for the recognition vocabulary, tri-phones which is not make preparations are produced. Therefore this model does not generate an initial estimate of parameter words, and the system can not configure the model appear as disadvantages. As a result, the sophistication of the Gaussian model is fall will degrade recognition. In this system, we propose the error correction system using out-of vocabulary rejection algorithm. When the systems are creating a vocabulary recognition model, recognition rates are improved to refuse the vocabulary which is not registered. In addition, this system is seized the lexical analysis and meaning using probability distributions, and this system deactivates the string before phoneme change was applied. System analysis determine the rate of error correction using phoneme similarity rate and reliability, system performance comparison as a result of error correction rate improve represent 2.8% by method using error patterns, fault patterns, meaning patterns.

The Algorithm of implementation for genome analysis ecosystems : Mitochondria's case (유전체 생태계 분석을 위한 알고리즘 구현: 미토콘드리아 사례)

  • Choi, Sung-Ja;Cho, Han-Wook
    • Journal of Digital Convergence
    • /
    • v.14 no.4
    • /
    • pp.349-353
    • /
    • 2016
  • The studies on the human environment and ecosystem analysis is being actively researched. In recent years, The service of genome analysis has been offering the customized service to prevent the disease as reading an individual's genome information. The genome information by analyzing technology is being required accurate and fast analyses of ecosystem-dielectrics due to the spread of the disease, the use of genetically modified organism and the influx of exotic. In this paper the algorithm of K-Mean clustering for a new classification system was utilized. It will provide new dielectrics information as quickly and accurately for many biologists.

Named Entity and Event Annotation Tool for Cultural Heritage Information Corpus Construction (문화유산정보 말뭉치 구축을 위한 개체명 및 이벤트 부착 도구)

  • Choi, Ji-Ye;Kim, Myung-Keun;Park, So-Young
    • Journal of the Korea Society of Computer and Information
    • /
    • v.17 no.9
    • /
    • pp.29-38
    • /
    • 2012
  • In this paper, we propose a named entity and event annotation tool for cultural heritage information corpus construction. Focusing on time, location, person, and event suitable for cultural heritage information management, the annotator writes the named entities and events with the proposed tool. In order to easily annotate the named entities and the events, the proposed tool automatically annotates the location information such as the line number or the word number, and shows the corresponding string, formatted as both bold and italic, in the raw text. For the purpose of reducing the costs of the manual annotation, the proposed tool utilizes the patterns to automatically recognize the named entities. Considering the very little training corpus, the proposed tool extracts simple rule patterns. To avoid error propagation, the proposed patterns are extracted from the raw text without any additional process. Experimental results show that the proposed tool reduces more than half of the manual annotation costs.

Improvement of Runtime Intrusion Prevention Evaluator (RIPE) (실행시간 침입 방지 평가 프로그램(RIPE)의 개선)

  • Lee, Hyungyu;Lee, Damho;Kim, Taehwan;Cho, Donghwang;Lee, Sanghoon;Kim, Hoonkyu;Pyo, Changwoo
    • Journal of KIISE
    • /
    • v.42 no.8
    • /
    • pp.1049-1056
    • /
    • 2015
  • Runtime Intrusion Prevention Evaluator (RIPE), published in 2011, is a benchmark suite for evaluating mitigation techniques against 850 attack patterns using only buffer overflow. Since RIPE is built as a single process, defense and attack routines cannot help sharing process states and address space layouts when RIPE is tested. As a result, attack routines can access the memory space for defense routines without restriction. We separate RIPE into two independent processes of defense and attacks so that mitigations based on confidentiality such as address space layout randomization are properly evaluated. In addition, we add an execution mode to test robustness against brute force attacks. Finally, we extend RIPE by adding 38 attack forms to perform format string attacks and virtual table (vtable) hijacking attacks. The revised RIPE contributes to the diversification of attack patterns and precise evaluation of the effectiveness of mitigations.

시공간 데이터를 위한 클러스터링 기법의 성능 비교

  • 강주영;이봉재;송재주;신진호;용환승
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2004.10b
    • /
    • pp.49-51
    • /
    • 2004
  • 최근 GPS시스템, 감시 시스템, 기상 관측 시스템과 같은 다양한 응용 시스템으로부터 수집된 시공간 속성을 가진 데이터를 분석하고자 하는 시공간 데이터 마이닝에 대한 관심이 더욱 높아지고 있다. 기존의 시공간 데이터 마이닝에 대한 연구는 문자.숫자 데이터를 기반의 마이닝 기법을 그대로 적용하고 있기 때문에 데이터의 시공간 속성을 충분히 고려한 분석으로는 한계가 많은 것이 사실이다. 본 논문에서는 패턴 인식과 클러스터링 능력이 뛰어나다고 알려진 SOM을 기반으로 시공간 클러스터링 모듈을 개발하고, 개발된 모듈의 성능과 클러스터링 정확성에 대하여 K-means, 응집 계층 알고리즘(Average Linkage, Ward)과 비교함으로써 시공간 데이터 마이닝을 위한 각 알고리즘들의 성능을 분석하였다 또한 입력 데이터의 특성과 클러스터링 결과를 더욱 정확하게 나타내어 가시적인 분석을 도울 수 있도록 시공간 데이터 클러스터링을 위한 가시화 모듈을 개발하였다.

  • PDF

Full Parsing Approach to Extracting Protein-to-Protein Interactions from the Biological Literature (생물학 문헌으로부터 단백질 상호작용 정보 추출을 위한 자연어 처리 기법)

  • 노정호;차재혁;최용석
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2004.10b
    • /
    • pp.256-258
    • /
    • 2004
  • 단백질 상호작용에 대한 연구는 생명현상의 전반적인 원리를 규명하는데 필수적이다. 생물학 문헌 데이터베이스로부터 단백질 상호작용 정보를 찾는 것은 많은 시간과 노력이 필요하기 때문에 컴퓨터로 자동화시키는 방법이 요구된다. 문헌으로부터 단백질 상호작용 정보를 추출하는 작업은 단순 문자열 비교를 통한 정보검색으로는 한계가 있으므로 자연어 처리 기법을 적용해 문장의 문법 구조, 품사 정보 등을 이용하면 더 정확한 추출이 가능하다. 본 논문에서는 자연어 처리를 이용하여 문장을 트리로 표현한 뒤 가지치기, 병합 등을 통해 추상화된 트리를 패턴과 매칭하는 방법을 제안한다. 그리고 실제 데이터를 이용한 실험 결과를 통해 기존 방법에 비해 더 높아진 정확도를 확인하였다.

  • PDF