• 제목/요약/키워드: Feature(s)

검색결과 4,159건 처리시간 0.027초

Continuous Conditional Random Field에 의한 인터넷 쇼핑몰 신규 고객등급 예측 (Prediction of New Customer's Degree of Loyalty of Internet Shopping Mall Using Continuous Conditional Random Field)

  • 안길승;허선
    • 대한산업공학회지
    • /
    • 제41권1호
    • /
    • pp.10-16
    • /
    • 2015
  • In this study, we suggest a method to predict probability distribution of a new customer's degree of loyalty using C-CRF that reflects the RFM score and similarity to the neighbors of the customer. An RFM score prediction model is introduced to construct the first feature function of C-CRF. Integrating demographical similarity, purchasing characteristic similarity and purchase history similarity, we make a unified similarity variable to configure the second feature function of C-CRF. Then parameters of each feature function are estimated and we train our C-CRF model by training data set and suggest a probabilistic distribution to estimate a new customer's degree of loyalty. An example is provided to illustrate our model.

품사 부착 실험을 통한 Bags-of-Features 방법의 정량적 평가 (Quantitative Evaluation of Bags-of-Features Method Using Part-of-Speech Tagging)

  • 이찬희;이설화;임희석
    • 한국어정보학회:학술대회논문집
    • /
    • 한국어정보학회 2017년도 제29회 한글및한국어정보처리학술대회
    • /
    • pp.298-300
    • /
    • 2017
  • 본 논문에서는 단순하지만 효과적인 단어 표현 방법인 Bags of Features에 대한 비교 실험을 수행한다. Bags of Features는 어휘집의 크기에 제한이 없으며, 문자 단위의 정보를 반영하고, 벡터화 과정에서 신경망 구조에 의존하지 않는 단어 표현 방법이다. 영어 품사 부착 실험을 사용하여 실험한 결과, one-hot 인코딩을 사용한 모델과 대비하여 학습 데이터에 존재하지 않는 단어의 경우 49.68%, 전체 부착 정확도는 0.96% 향상이 관찰되었다. 또한, Bags of Features를 사용한 모델은 기존의 영어 품사 부착 분야의 최첨단 모델들 중 학습 데이터 외의 추가적인 데이터를 활용하지 않는 모델들과 비견할 만한 성능을 보였다.

  • PDF

Possessor Agreement as Theta Feature Sharing

  • Cho, Sung-Eun;Lee, Won-Bin
    • 한국언어정보학회지:언어와정보
    • /
    • 제7권2호
    • /
    • pp.163-178
    • /
    • 2003
  • Korean displays an interesting construction (so-called possessor agreement construction), where a possessor nominal and its possessum nominal are marked with the same case as shown in the example Mary-ka John-ul tali-lul cha-ss-ta ‘Mary kicked John's leg’ More interestingly, not all possessors in possessive construction are marked the same case with its possessum as shorn in the ungrammatical sentence *Mary-ka John-ul cha-lul cha-ss-ta ‘Mary kicked John's car’. Hence, a simple but non-trivial question arises: In what situation are both possessors and possessums marked with the same case\ulcorner In this paper, we advance three claims: (i) Possessor agreement appears in the situation where entailment is satisfied as follows: If Mary kicked John's leg, it entails that Mary kicked John, (ii) entailment in possessor agreement results from theta-feature sharing; specifically, the whole DP and the possessor DP share the same theta role, and (iii) Possessor nominals are marked with accusative (or nominative) case when they are assigned internal theta role from the predicate directly.

  • PDF

기계학습 기반 IDS 보안이벤트 분류 모델의 정확도 및 신속도 향상을 위한 실용적 feature 추출 연구 (A Practical Feature Extraction for Improving Accuracy and Speed of IDS Alerts Classification Models Based on Machine Learning)

  • 신익수;송중석;최장원;권태웅
    • 정보보호학회논문지
    • /
    • 제28권2호
    • /
    • pp.385-395
    • /
    • 2018
  • 인터넷의 성장과 함께 각종 취약점을 악용한 사이버 공격들이 지속적으로 증가하고 있다. 이러한 행위를 탐지하기 위한 방안으로 침입탐지시스템(IDS; Intrusion Detection System)이 널리 사용되고 있지만, IDS에서 발생하는 많은 양의 오탐(정상통신을 공격행위로 잘못 탐지한 보안이벤트)은 여전히 해결되지 않은 문제로 남아있다. IDS 오탐 문제를 해결하기 위한 방법으로 기계학습 알고리즘을 통한 자동분류 연구가 진행되고 있지만 실제 현장 적용을 위해서는 정확도와 데이터 처리속도 향상을 위한 연구가 더 필요하다. 기계학습 기반 분류 모델은 다양한 요인에 의해서 그 성능이 결정된다. 최적의 feature를 선택하는 것은 모델의 분류 성능 및 정확성 향상에 크게 영향을 미치기 때문에 기계학습에서 매우 중요한 부분을 차지한다. 본 논문에서는 보안이벤트 분류 모델의 성능 향상을 위해 기존 연구에서 제안한 기본 feature에 추가로 10종의 신규 feature를 제안한다. 본 논문에서 제안하는 10종의 신규 feature는 실제 보안관제센터 전문 인력의 노하우를 기반으로 고안된 것으로, 모델의 분류 성능을 향상시킬 뿐만 아니라 단일 보안이벤트에서 직접 추출 가능하기 때문에 실시간 모델 구축도 가능하다. 본 논문에서는 실제 네트워크 환경에서 수집된 데이터를 기반으로 제안한 신규 feature들이 분류 모델 성능 향상에 미치는 영향을 검증하였으며, 그 결과, 신규 feature가 모델의 분류 정확도를 향상시키고 오탐지율을 낮춰주는 것을 확인할 수 있었다.

일정 학습계수와 이진 강화함수를 가진 자기 조직화 형상지도 신경회로망 (Self-Organizing Feature Map with Constant Learning Rate and Binary Reinforcement)

  • 조성원;석진욱
    • 전자공학회논문지B
    • /
    • 제32B권1호
    • /
    • pp.180-188
    • /
    • 1995
  • A modified Kohonen's self-organizing feature map (SOFM) algorithm which has binary reinforcement function and a constant learning rate is proposed. In contrast to the time-varing adaptaion gain of the original Kohonen's SOFM algorithm, the proposed algorithm uses a constant adaptation gain, and adds a binary reinforcement function in order to compensate for the lowered learning ability of SOFM due to the constant learning rate. Since the proposed algorithm does not have the complicated multiplication, it's digital hardware implementation is much easier than that of the original SOFM.

  • PDF

객체검출을 위한 빠르고 효율적인 Haar-Like 피쳐 선택 알고리즘 (A Fast and Efficient Haar-Like Feature Selection Algorithm for Object Detection)

  • 정병우;박기영;황선영
    • 한국통신학회논문지
    • /
    • 제38A권6호
    • /
    • pp.486-491
    • /
    • 2013
  • 본 논문은 객체검출(object detection)에 사용되는 분류기의 학습을 위한 빠르고 효율적인 Haar-like feature 선택 알고리듬을 제안한다. 기존 AdaBoost를 이용한 Haar-like feature 선택 알고리듬은 학습 샘플들에 대한 피쳐의 에러만을 고려하여 형태적으로 유사하거나 중복되는 피쳐가 선택되는 경우가 많았다. 제안하는 알고리듬은 피쳐의 형태와 피쳐간의 거리로부터 피쳐의 유사도를 계산하고 이미 선택된 피쳐와 유사도가 큰 피쳐들을 피쳐 세트에서 제거하여 빠르고 효율적인 피쳐 선택이 이루어지도록 하였다. FERET 얼굴 데이터베이스를 사용하여 제안된 알고리듬을 사용하여 학습시킨 분류기와 기존 알고리듬을 사용한 분류기의 성능을 비교하였다. 실험 결과 제안한 피쳐 선택 방법을 사용하여 학습시킨 분류기가 기존 방법을 사용한 분류기보다 향상된 성능을 보였으며, 동일한 성능을 갖도록 학습시켰을 경우 분류기의 피쳐 수가 20% 감소하였다.

Efficient Content-Based Image Retrieval Methods Using Color and Texture

  • Lee, Sang-Mi;Bae, Hee-Jung;Jung, Sung-Hwan
    • ETRI Journal
    • /
    • 제20권3호
    • /
    • pp.272-283
    • /
    • 1998
  • In this paper, we propose efficient content-based image retrieval methods using the automatic extraction of the low-level visual features as image content. Two new feature extraction methods are presented. The first one os an advanced color feature extraction derived from the modification of Stricker's method. The second one is a texture feature extraction using some DCT coefficients which represent some dominant directions and gray level variations of the image. In the experiment with an image database of 200 natural images, the proposed methods show higher performance than other methods. They can be combined into an efficient hierarchical retrieval method.

  • PDF

침입탐지시스템에서 하이브리드 특징 선택에 관한 연구 (A Study on Hybrid Feature Selection in Intrusion Detection System)

  • 한명묵
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 2006년도 춘계학술대회 학술발표 논문집 제16권 제1호
    • /
    • pp.279-282
    • /
    • 2006
  • 네트워크를 기반으로 한 컴퓨터 시스템이 현대 사회에 있어서 더욱 더 불가결한 역할을 하는 것에 따라, 네트워크 기반 컴퓨터 시스템은 침입자의 침입 목표가 되고 있다. 이를 보호하기 위한 침입탐지시스템(Intrusion Detection System : IDS)은 점차 중요한 기술이 되었다. 침입탐지시스템에서 패턴들을 분석한 후 정상/비정상을 판단 및 예측하기 위해서는 초기단계인 특징추출이나 선택이 매우 중요한 부분이 되고 있다. 본 논문에서는 IDS에서 중요한 부분인 feature selection을 Data Mining 기법인 Genetic Algorithm(GA)과 Decision Tree(DT)를 적용해서 구현했다.

  • PDF

수정된 자기 구조화 특징 지도를 이용한 한국어 음소 인식 (Korean Phoneme Recognition using Modified Self Organizing Feature Map)

  • 최두일;이수진;박상희
    • 대한의용생체공학회:학술대회논문집
    • /
    • 대한의용생체공학회 1991년도 추계학술대회
    • /
    • pp.38-43
    • /
    • 1991
  • In order to cluster the Input pattern neatly, some neural network modified from Kohonen's self organizing feature map is introduced and Korean phoneme recognition experiments are performed using the modified self organizing feature map(MSOFM) and the auditory model.

  • PDF

속성추출을 이용한 협동적 추천시스템의 성능 향상 (Performance Improvement of a Collaborative Recommendation System using Feature Selection)

  • 유상종;권영식
    • 산업공학
    • /
    • 제19권1호
    • /
    • pp.70-77
    • /
    • 2006
  • One of the problems in developing a collaborative recommendation system is the scalability. To alleviate the scalability problem efficiently, enhancing the performance of the recommendation system, we propose a new recommendation system using feature selection. In our experiments, the proposed system using about a third of all features shows the comparable performances when compared with using all features in light of precision, recall and number of computations, as the number of users and products increases.