• 제목/요약/키워드: Filtering types

검색결과 267건 처리시간 0.024초

협업필터링에서 고객의 평가치를 이용한 선호도 예측의 사전평가에 관한 연구 (Pre-Evaluation for Prediction Accuracy by Using the Customer's Ratings in Collaborative Filtering)

  • 이석준;김선옥
    • Asia pacific journal of information systems
    • /
    • 제17권4호
    • /
    • pp.187-206
    • /
    • 2007
  • The development of computer and information technology has been combined with the information superhighway internet infrastructure, so information widely spreads not only in special fields but also in the daily lives of people. Information ubiquity influences the traditional way of transaction, and leads a new E-commerce which distinguishes from the existing E-commerce. Not only goods as physical but also service as non-physical come into E-commerce. As the scale of E-Commerce is being enlarged as well. It keeps people from finding information they want. Recommender systems are now becoming the main tools for E-Commerce to mitigate the information overload. Recommender systems can be defined as systems for suggesting some Items(goods or service) considering customers' interests or tastes. They are being used by E-commerce web sites to suggest products to their customers who want to find something for them and to provide them with information to help them decide which to purchase. There are several approaches of recommending goods to customer in recommender system but in this study, the main subject is focused on collaborative filtering technique. This study presents a possibility of pre-evaluation for the prediction performance of customer's preference in collaborative filtering before the process of customer's preference prediction. Pre-evaluation for the prediction performance of each customer having low performance is classified by using the statistical features of ratings rated by each customer is conducted before the prediction process. In this study, MovieLens 100K dataset is used to analyze the accuracy of classification. The classification criteria are set by using the training sets divided 80% from the 100K dataset. In the process of classification, the customers are divided into two groups, classified group and non classified group. To compare the prediction performance of classified group and non classified group, the prediction process runs the 20% test set through the Neighborhood Based Collaborative Filtering Algorithm and Correspondence Mean Algorithm. The prediction errors from those prediction algorithm are allocated to each customer and compared with each user's error. Research hypothesis : Two research hypotheses are formulated in this study to test the accuracy of the classification criterion as follows. Hypothesis 1: The estimation accuracy of groups classified according to the standard deviation of each user's ratings has significant difference. To test the Hypothesis 1, the standard deviation is calculated for each user in training set which is divided 80% from MovieLens 100K dataset. Four groups are classified according to the quartile of the each user's standard deviations. It is compared to test the estimation errors of each group which results from test set are significantly different. Hypothesis 2: The estimation accuracy of groups that are classified according to the distribution of each user's ratings have significant differences. To test the Hypothesis 2, the distributions of each user's ratings are compared with the distribution of ratings of all customers in training set which is divided 80% from MovieLens 100K dataset. It assumes that the customers whose ratings' distribution are different from that of all customers would have low performance, so six types of different distributions are set to be compared. The test groups are classified into fit group or non-fit group according to the each type of different distribution assumed. The degrees in accordance with each type of distribution and each customer's distributions are tested by the test of ${\chi}^2$ goodness-of-fit and classified two groups for testing the difference of the mean of errors. Also, the degree of goodness-of-fit with the distribution of each user's ratings and the average distribution of the ratings in the training set are closely related to the prediction errors from those prediction algorithms. Through this study, the customers who have lower performance of prediction than the rest in the system are classified by those two criteria, which are set by statistical features of customers ratings in the training set, before the prediction process.

Combining Adaptive Filtering and IF Flows to Detect DDoS Attacks within a Router

  • Yan, Ruo-Yu;Zheng, Qing-Hua;Li, Hai-Fei
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제4권3호
    • /
    • pp.428-451
    • /
    • 2010
  • Traffic matrix-based anomaly detection and DDoS attacks detection in networks are research focus in the network security and traffic measurement community. In this paper, firstly, a new type of unidirectional flow called IF flow is proposed. Merits and features of IF flows are analyzed in detail and then two efficient methods are introduced in our DDoS attacks detection and evaluation scheme. The first method uses residual variance ratio to detect DDoS attacks after Recursive Least Square (RLS) filter is applied to predict IF flows. The second method uses generalized likelihood ratio (GLR) statistical test to detect DDoS attacks after a Kalman filter is applied to estimate IF flows. Based on the two complementary methods, an evaluation formula is proposed to assess the seriousness of current DDoS attacks on router ports. Furthermore, the sensitivity of three types of traffic (IF flow, input link and output link) to DDoS attacks is analyzed and compared. Experiments show that IF flow has more power to expose anomaly than the other two types of traffic. Finally, two proposed methods are compared in terms of detection rate, processing speed, etc., and also compared in detail with Principal Component Analysis (PCA) and Cumulative Sum (CUSUM) methods. The results demonstrate that adaptive filter methods have higher detection rate, lower false alarm rate and smaller detection lag time.

수집과 빈도 분석을 이용한 인터넷 게시판의 스팸 메시지 차단 방법 (Spam Message Filtering for Internet Communities using Collection and Frequency Analysis)

  • 김태희;강문설
    • 정보처리학회논문지C
    • /
    • 제18C권2호
    • /
    • pp.61-70
    • /
    • 2011
  • 인터넷 환경의 빠른 발전과 함께 널리 사용되고 있는 인터넷 게시판이 기본적인 의사소통 수단으로 정착되고 있으나, 불특정 다수로부터 게시되는 스팸 메시지의 증가로 피해 규모가 날로 증가하고 있다. 현재 스팸 메일을 차단하기 위한 다양한 차단 방법들이 제안되고 있으나 게시판에 자동으로 등록되고 있는 스팸 메시지를 차단하는 방법에 대한 연구는 미미한 실정이다. 본 논문은 인터넷 게시판에 등록되는 스팸 메시지를 수집하여 메시지의 특성과 빈도를 분석하고 차단 규칙을 생성하여 차단하는 단계로 구성된 게시판 스팸 메시지 차단 방법을 제안하였다. 인터넷 게시판의 데이터베이스에 저장되는 모든 메시지를 대상으로 스팸 메시지를 수집하고, 수집한 스팸 메시지를 분석하여 스팸 메시지를 정의할 수 있는 정규화된 규칙을 생성한 후, 이 규칙을 이용하여 등록된 메시지에 대해 스팸 메시지를 검사하여 차단한다. 제안한 방법은 수집되는 스팸 메시지의 정보를 이용하여 다양한 유형의 스팸 메시지를 차단할 수 있으며, 변화하는 스팸 메시지의 형태에 대해서도 유연하게 대처할 수 있는 구조를 가지고 있다.

GPS 수신기를 위한 3 차원 배열 안테나의 도래각 추정 및 빔 형성 성능 분석 (Performance analysis of DOA estimation and beamforming in 3-dimensional array antenna for GPS receiver)

  • 이종현;김석중;임승각
    • 대한전자공학회논문지TC
    • /
    • 제44권4호
    • /
    • pp.88-94
    • /
    • 2007
  • 본 논문은 GPS 수신기에서 간섭 제거를 통한 성능 개선을 목적으로 3 차원 배열 안테나를 이용한 DOA ( Direction Of Arrival ) 추정과 빔 형성 성능 분석에 관한 것이다. GPS 수신기에 배열 안테나를 이용하면 신호 도래 방향의 DOA 를 추정한 후, 공간 필터링을 이용하여 원하는 방향으로 주빔과 널을 형성하므로서 재머 ( jammer ) 신호를 제거할 수 있으므로 시스템의 성능을 높힐 수 있게된다. 본 논문에서는 5 가지의 3 차원 배열 안테나 구조를 제안한 후 도래 신호의 DOA 를 추정키위한 MUSIC 알고리즘을 적용할 경우 추정 오차 및 빔 형성의 성능을 제시하였다. DOA 성능 분석을 위하여 DOA 추정 오차를 계산하였으며 빔 형성 성능 분석을 BER 을 사용하였다. 특히 빔 형성 성능 분석에서는 다양한 jammer 전력과 GPS 신호의 존재 및 각도 퍼짐등을 고려하였다. 컴퓨터 시뮬레이션의 결과 제안된 3차원 배열 안테나에서 Curved (B) 7-element 안테나가 DOA 추정, 추정 오차 및 BER 특성과 각도 퍼짐에서 다른 배열 안테나보다 우수한 특성을 얻을 수 있었다.

전력계통의 패턴인식형 거리계전기법에 관한 연구 (A Study on the Pattern Recognition based Distance Protective Relaying Scheme in Power System)

  • 이복구;윤석무;박철원;신명철
    • 한국지능시스템학회논문지
    • /
    • 제8권2호
    • /
    • pp.9-20
    • /
    • 1998
  • 본 논문에서는 패턴인식 형태로 구성된 거리계전시스템에 신경회로망을 적용한 새로운 형태의거리계전기법이 제시되었다. 제안된 거리계전기법은 패턴인식 단계인 두개의 블록으로 구성되었다. 첫 단계에서는 과도신호의 특징 파라미터인 기본파성분을 효율적으로 추출하기 위해 신경회로망을 이용한 필터링 방법이 적용되었으며, 두번째 단계에서는 첫단계에서 추출된 기본파성분을 입력으로 고장형태를 신속하고 정확하게 판별 분류 될 수 있도록 신경회로망을 이용한 고장패턴 추정기가 개발적용되었으며, 이울러 고장판별에 따라 고장점을 효율적으로 추정될 수 있도록 하였다. 적용 시스템의 각 단계는 함수 근사화, 보간성능 및 패턴분류 등의 능력이 뛰어난 다층 퍼셉트론의 역전파 학습 알고리즘이 적용되었다. 제신된 기법의 성능을 입증하기 위하여 EMTP 시뮬레이션을 하여 얻은 다양한 과도 고장파형의 계전시호를 활용하여 시험하였으며, 그결과 제시된 기법은 학습되지 않은 임의의 패턴에 대하여 적응성을 가지고 효율적으로 고장점이 추정될 수 있었으며, 고장발생후 3샘플 이내에서 고장형태가 신속하고도 정확하게 판별되었다.

  • PDF

LIDAR 데이터와 수치지도를 이용한 3차원 건물모델링 (3D Building Modeling Using LIDAR Data and Digital Map)

  • 김흥식;장휘정;조우석
    • 대한공간정보학회지
    • /
    • 제13권3호
    • /
    • pp.25-32
    • /
    • 2005
  • 본 논문은 LIDAR 데이터와 수치지도를 이용한 점 기반의 3차원 건물모델링 방법을 제안하는데 목적이 있다. 본 논문에서 제안한 방법은 크게 건물점 추출, 지붕유형 분류, 지붕유형별 3차원 모델링 단계로 나뉜다. 먼저 수치지도의 건물 외곽선과 LIDAR 데이터를 중첩시켜 건물폴리곤 내에 있는 LIDAR 점들 중에서 지면과 벽면 및 수목을 제거하여 건물의 지붕점만을 추출한다. 추출된 건물 지붕점들은 ODR(Orthogonal Distance Regression) 방법을 통해 평면근사하여 점들이 평면상의 점이면 평면형(flat) 지붕으로 분류하고 그렇지 않으면 박공형(gable)과 원통형(arch)으로 근사한 후 평균제곱근오차가 작은 쪽으로 지붕유형을 결정한다. 실험결과 본 연구에서 제안한 방법은 3가지 유형의 단순 지붕유형을 성공적으로 분류하였으며, LiDAR 데이터와 수치지도를 이용한 자동 3차원 건물모델링의 가능성을 제시하였다.

  • PDF

WiseQA를 위한 정답유형 인식 (Recognition of Answer Type for WiseQA)

  • 허정;류법모;김현기;옥철영
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제4권7호
    • /
    • pp.283-290
    • /
    • 2015
  • 본 논문에서는 WiseQA 시스템에서 정답유형을 인식하기 위한 하이브리드 방법을 제안한다. 정답유형은 어휘정답유형과 의미정답유형으로 구분된다. 본 논문은 어휘정답유형 인식을 위해서 질문초점에 기반한 규칙모델과 순차적 레이블링에 기반한 기계학습모델을 제안한다. 의미정답유형 인식을 위해 다중클래스 분류에 기반한 기계학습모델과 어휘정답유형을 이용한 필터링 규칙을 소개한다. 어휘정답유형 인식성능은 F1-score 82.47%이고, 의미정답유형 인식성능은 정확률 77.13%이다. 어휘정답유형 인식성능은 IBM 왓슨과 비교하여, 정확률은 1.0% 저조하고, 재현율은 7.4% 높다.

이벤트 알림 서비스의 구조와 성능분석 (Architecture and Performance Analysis of An Event Notification Service)

  • 한영태;민덕기
    • 한국컴퓨터정보학회논문지
    • /
    • 제10권3호
    • /
    • pp.201-208
    • /
    • 2005
  • 이벤트 알림 서비스는 이벤트 기반의 메시징 서비스 미들웨어로 비즈니스 응용 프로그램, 분산 시스템 관리, 그리고 웹 서비스 통합을 위한 응용 프로그램 영역에서 사용하고 있다. 본 논문에서는 주제 기반의 이벤트 분배 서비스와 다양한 메시지 통신 서비스를 제공하는 이벤트 알림 서비스 아키텍처를 제시한다. 이벤트 분배 서비스는 이벤트들을 비동기적인 방식으로 전송하며 이벤트에 정의된 주제 정보와 시스템의 환경 정보를 활용하여 이벤트 전송이 빠르게 하였다. 또한 이벤트의 내용에 대한 필터링 기능을 포함하고 있다. 메시지 통신 서비스는 다양한 형식의 메시지와 다양한 통신 프로토콜을 지원하기 위한 통신 인프라스트럭처이다. 응용 프로그램의 도메인과 환경에 따라, 통신 인프라스트럭처는 성능과 유용성을 최적화하기 위해 재배치하여 사용할 수 있다. 본 논문에서는 우리가 개발한 이벤트 알림 서비스에 대한 성능 분석한 결과를 다양한 형식의 메시지 형식과 통신 프로토콜을 대상으로 제시한다.

  • PDF

Assessment of Masks Used by Healthcare Workers: Development and Validation of a Mask Qualitative Assessment Tool (MQAT)

  • Gharibi, Vahid;Cousins, Rosanna;Mokarami, Hamidreza;Jahangiri, Mehdi;Keshavarz, Mohammad A.;Shirmohammadi-Bahadoran, Mohammad M.
    • Safety and Health at Work
    • /
    • 제13권3호
    • /
    • pp.364-371
    • /
    • 2022
  • Background: Respiratory masks can provide healthcare workers with protection from biological hazards when they have good performance. There is a direct relationship between the visual specifications of a mask and its efficacy; thus, the aim of this study was to develop tools for qualitative assessment of the performance of masks used by healthcare workers. Methods: A mixed-methods design was used to develop a qualitative assessment tool for medical face masks (MFM) and particle filtering half masks (PFHM). The development of domains and items was undertaken using observation and interviews, the opinions of an expert panel, and a review of texts and international standards. The second phase evaluated the psychometric properties of tools. Finally, the validated Mask Qualitative Assessment Tools (MQAT) were used to assess six samples from 10 brands of the two types of masks. Results: MQAT-MFM and MQAT-PHFM shared 42 items across seven domains: "cleanliness," "design," "marking, labeling and packaging," "mask layers," "mask strap," "materials and construction," and "nose clip." MQAT-MFM included one additional item. MQAT-PHFM included another nine items associated with an eighth "Practical Performance" domain, and the valve version had another additional "Exhalation Valve" domain and six items. The evaluation indicated 80% compliance for MFM and 71% compliance for PFHM. "Marking, labeling and packaging" and "Layers" were associated with the least compliance in both types of masks and should be checked carefully for defining mask quality. Conclusion: MQAT can be used for immediate screening and initial assessment of MFM and PHFM through appearance, simple tools, and visual inspection.

고객의 특성 정보를 활용한 화장품 추천시스템 개발 (Beauty Product Recommendation System using Customer Attributes Information)

  • 김효중;신우식;신동훈;김희웅;김화경
    • 경영정보학연구
    • /
    • 제23권4호
    • /
    • pp.69-86
    • /
    • 2021
  • 인공지능 기술이 발달함에 따라 빅데이터를 활용한 개인화 추천시스템에 대한 관심이 증가하고 있다. 특히 뷰티 제품의 경우 개인의 취향과 더불어 피부 특성 및 민감도에 따라 제품 선호도가 명확히 구분되므로 축적된 고객 데이터를 활용하여 고객 맞춤형 추천서비스를 제공하는 것이 필요하다. 따라서 본 연구에서는 딥러닝 기법을 활용하여 제품 검색 기록과 개인 사용자의 피부 타입과 고민 등의 콘텍스트 정보를 함께 반영한 심층 신경망 기반의 추천시스템 모델을 제시하고자 한다. 본 연구에서는 실제 화장품 검색 플렛폼의 데이터를 활용하여 성능 평가를 실시하였다. 본 연구의 실험 결과, 고객의 콘텍스트 정보를 포함한 모델이 제품 검색 기록만을 활용한 기존의 협업 필터링 모델들 보다 우수한 성능을 보임을 확인하였다.