• 제목/요약/키워드: apriori

검색결과 144건 처리시간 0.027초

한글 워드임베딩과 아프리오리를 이용한 검색 시스템의 질의어 확장 (Query Extension of Retrieve System Using Hangul Word Embedding and Apriori)

  • 신동하;김창복
    • 한국항행학회논문지
    • /
    • 제20권6호
    • /
    • pp.617-624
    • /
    • 2016
  • 한글 워드임베딩은 명사 추출과정을 거치지 않으면, 학습에 필요하지 않은 단어까지 학습하게 되어 효율적인 임베딩 결과를 도출할 수 없다. 본 연구는 한글 워드임베딩, 아프리오리, 텍스트 마이닝을 이용하여, 특정 도메인에서 질의어 확장에 의해 보다 효율적으로 답변을 검색할 수 있는 모델을 제안하였다. 워드임베딩과 아프리오리는 질의어에 대해서 의미와 맥락에 따라 연관 단어를 추출하여, 질의어를 확장하는 단계이다. 한글 텍스트 마이닝은 명사 추출, TF-IDF, 코사인 유사도를 이용하여, 유사답변 추출과 사용자에게 답변하는 단계이다. 제안모델은 특정 도메인의 답변을 학습하고, 연관성 높은 질의어를 확장함으로서 답변의 정확성을 높일 수 있다. 향후 연구과제로서, 데이터베이스에 저장된 사용자 질의를 분석하고, 보다 연관성 높은 질의어를 추출하는 연구가 필요하다.

MIMO Iterative 수신기에서 계층적 변조 특성을 이용한 낮은 복잡도를 가지는 후보 리스트 발생 기법 (A Low Complexity Candidate List Generation for MIMO Iterative Receiver via Hierarchically Modulated Property)

  • 전은성;양장훈;김동구
    • 한국통신학회논문지
    • /
    • 제34권6A호
    • /
    • pp.500-505
    • /
    • 2009
  • 본 논문에서는 QAM 변조의 계층적 변조 특성을 이용하여 Iterative MIMO 수신기에서 LLR(log likelihood ratio)값을 구하기 위한 낮은 복잡도를 가지는 후보 리스트 발생 기법을 소개한다. QAM 변조는 에러에 강인한 HP(high priority) 심볼과 상대적으로 에러에 약한 LP(low priority) 심볼로 분해할 수 있다. 본 논문에서는 HP 심볼에 대해서는 간단한 ZF 수신기의 output 값과 인접 HP 심볼들을 이용하여 먼저 안테나별로 HP 심볼 리스트를 발생하고, 각 HP 심볼 리스트에 대해서 ML(maximum likelihood)의 검파 성능을 가지는 sphere decoder를 사용하여 LP 심볼 리스트를 발생하여 후보 심볼 리스트를 발생하였다. 두 번째 iteration 이후부터는 채널 디코더에서 피드백되는 apriori 값을 이용하여 후보 심볼 리스트를 발생하였다. 실험의 비교군은 MIMO 채널 용량에 근사적으로 접근하는 list sphere decoder(LSD)를 사용하였다. 전산 실험 결과, 제안하는 후보 리스트 발생 기법은 LSD에 비해서 첫 번째 iteration에서는 BER성능이 다소 떨어지나, iteration 이 진행될수록 LSD에 근접하는 성능을 보였으며, 후보 리스트의 발생 시간도 LSD에 비해서 월등히 우수한 성능을 가짐을 볼 수 있었다. 또한 LLR 계산 시 탐색해야 할 후보 리스트의 개수 역시 LSD에 비해서 적은 값을 가지므로, LLR 계산 시 필요한 연산의 복잡도가 낮음을 확인할 수 있었다.

Apriori 알고리즘 기반의 개인화 정보 추천시스템 설계 및 구현에 관한 연구 (A Study on Design and Implementation of Personalized Information Recommendation System based on Apriori Algorithm)

  • 김용
    • 한국비블리아학회지
    • /
    • 제23권4호
    • /
    • pp.283-308
    • /
    • 2012
  • 정보기술과 인터넷의 발전에 따른 정보의 폭발적인 증가와 함께, 이용자에게 있어서 적합한 정보의 획득을 위한 방법이 절실하게 요구되고 있다. 이를 위하여 정보검색 및 여과시스템이 개발 및 발전되어 왔다. 또한 보다 적극적인 서비스를 제공하기 위한 방법으로써 개인화 정보추천서비스에 대한 요구가 높아지고 있다. 본 연구에서는 도서관에서 적극적인 정보서비스를 위한 방법으로 이용자의 관심과 선호도에 적합한 정보를 제공하기 위한 연관규칙 기반의 개인화 정보추천시스템을 설계 및 구현하였다. 이를 위하여 기존의 추천방법에 대한 장단점을 분석하고 기존 추천방법에 대한 문제점을 해결하기 위한 방법으로써 대용량 콘텐츠 및 이용자 환경에서 이용자의 묵시적 정보이용행위에 관한 정보를 포함하고 있는 로그파일을 통하여 연관규칙 생성을 위해 요구되는 항목을 추출 및 변환하여 연관규칙 생성프로그램을 통하여 연관규칙의 생성 및 정보추천을 위한 방법을 제안하였다.

유사도와 연관규칙분석을 이용한 암호화폐 추천모형 (Cryptocurrency Recommendation Model using the Similarity and Association Rule Mining)

  • 김예찬;김진영;김채린;김경재
    • 지능정보연구
    • /
    • 제28권4호
    • /
    • pp.287-308
    • /
    • 2022
  • 최근 비트코인을 필두로한 암호화폐의 폭발적인 성장이 금융 시장의 주요 이슈로 떠오르고 있다. 이에 전 세계적인 암호화폐 투자의 관심이 증가하고 있지만, 24시간 365일 운영되는 시장과 가격 변동성, 그리고 기하 급수적으로 증가하고 있는 암호화폐 종류는 암호화폐 투자자들에게 리스크로 제공되고 있어, 특히 암호화폐 포트폴리오를 구상하는데 있어 추천에 적합하지 않는 암호화폐들을 구분하여 투자자들의 리스크를 감소시킬 수 있는 연구의 필요성이 제기되고 있다. 이에 본 논문은 기존에 있었던 단순히 암호화폐 가격의 미래를 예측하여 수익률을 극대화 하거나, 수익률에 초점을 맞추어 암호화폐 포트폴리오를 구성하는 연구들과 달리, 투자자들의 성향을 반영하고, 투자에 적합한 암호화폐를 머신러닝 기법 중 하나인 Apriori 알고리즘을 활용하여 추천하되, 추천에 적합한 알트코인들을 비트코인의 유사도와 연관규칙을 중심으로 선별하여, 투자자들의 리스크를 감소시킬 수 있는 적합한 추천 방식과 해석을 제시한다.

네트워크 침입 탐지를 위한 Coverage와 Exclusion 기반의 새로운 연관 규칙 마이닝 (A New Association Rule Mining based on Coverage and Exclusion for Network Intrusion Detection)

  • 김태연;한경현;황성운
    • 사물인터넷융복합논문지
    • /
    • 제9권1호
    • /
    • pp.77-87
    • /
    • 2023
  • 네트워크 침입 탐지 작업에 다양한 연관 규칙 마이닝 알고리즘을 적용하는 데에는 두 가지 중요한 문제가 있다. 생성된 규칙 집합의 크기가 너무 커서 IoT 시스템에서 활용하기 어렵고, 거짓 부정/긍정 비율을 제어하기 어렵다. 본 연구에서는 coverage와 exclusion이라는 새로 정의된 척도에 기반을 둔 연관 규칙 마이닝 알고리즘을 제안한다. Coverage는 한 클래스의 트랜잭션에서 패턴이 발견되는 빈도를 나타내고, exclusion은 다른 클래스의 트랜잭션에서 패턴이 발견되지 않는 빈도를 나타낸다. 우리는 KDDcup99라는 공개 데이터 세트를 사용하여 가장 유명한 알고리즘인 Apriori 알고리즘과 실험적으로 제안된 알고리즘을 비교한다. Apriori와 비교하여 제안된 알고리즘은 정확도를 완전히 유지하면서 생성되는 규칙 집합 크기를 최대 93.2%까지 줄인다. 또한, 제안된 알고리즘은 생성된 규칙의 거짓 부정/긍정 비율을 매개변수별로 완벽하게 제어한다. 따라서 네트워크 분석가는 두 가지 문제를 해결함으로써 제안한 연관 규칙 마이닝을 네트워크 침입 탐지 작업에 효과적으로 적용할 수 있다.

데이터마이닝을 활용한 성공적 노후 예측 키워드 분석 (An Analysis on the Predictor Keyword of Successful Aging: Focused on Data Mining)

  • 홍서연
    • 한국콘텐츠학회논문지
    • /
    • 제20권3호
    • /
    • pp.223-234
    • /
    • 2020
  • 본 연구는 Hong(2019)의 연구에서 도출된 한국 노인의 성공적인 노후에 영향을 주는 예측 키워드 32개를 중심으로 데이터마이닝의 Apriori 알고리즘을 활용하여 연관관계 규칙을 분석하였다. 그리고 한국 노인의 성공적 노후에 영향을 주는 예측변수들의 규칙 및 패턴을 파악하기 위한 지표로 지지도, 신뢰도, 향상도를 활용하였다. 본 연구의 분석은 R version 3. 5. 1 프로그램으로 분석을 실시하였으며, arulesViz 패기지와 visNetwork 패키지로 시각화하였다. 연구결과 한국 노인들의 성공적인 노후와 연관성이 높은 예측변수는 '취미', '봉사', '준비', '운동'으로 나타났다. 그리고 한국 노인의 성공적 노후를 고려할 때 가장 우선적으로 고려해야 할 변수는 '취미' 이며 그 다음 '봉사', 준비', 운동'의 순으로 고려해야 한다는 결과를 얻었다.

DISCOVERY TEMPORAL FREQUENT PATTERNS USING TFP-TREE

  • Jin Long;Lee Yongmi;Seo Sungbo;Ryu Keun Ho
    • 대한원격탐사학회:학술대회논문집
    • /
    • 대한원격탐사학회 2005년도 Proceedings of ISRS 2005
    • /
    • pp.454-457
    • /
    • 2005
  • Mining frequent patterns in transaction databases, time-series databases, and many other kinds of databases has been studied popularly in data mining research. Most of the previous studies adopt an Apriori-like candidate set generation-and-test approach. However, candidate set generation is still costly, especially when there exist prolific patterns and/or long patterns. And calendar based on temporal association rules proposes the discovery of association rules along with their temporal patterns in terms of calendar schemas, but this approach is also adopt an Apriori-like candidate set generation. In this paper, we propose an efficient temporal frequent pattern mining using TFP-tree (Temporal Frequent Pattern tree). This approach has three advantages: (1) this method separates many partitions by according to maximum size domain and only scans the transaction once for reducing the I/O cost. (2) This method maintains all of transactions using FP-trees. (3) We only have the FP-trees of I-star pattern and other star pattern nodes only link them step by step for efficient mining and the saving memory. Our performance study shows that the TFP-tree is efficient and scalable for mining, and is about an order of magnitude faster than the Apriori algorithm and also faster than calendar based on temporal frequent pattern mining methods.

  • PDF

GML 문서에서 연관규칙 생성 시스템 구현 (Implementation of Association Rules Creation System from GML Documents)

  • 김의찬;황병연
    • 한국공간정보시스템학회 논문지
    • /
    • 제8권1호
    • /
    • pp.27-35
    • /
    • 2006
  • 지리 정보에 대한 관심이 증가되면서 이러한 연구와 활용 분야도 다양해지고 있다. OGC(Open GIS Consortium)에서는 XML(Extensible Markup Language)을 GIS 분야에 도입한 GML(Geography Markup Language)을 개발하였으며 여러 활용 분야에서 GML을 사용하고 계속적으로 연구되고 있다. 본 논문에서는 기존의 XML 문서를 기반으로 연구되었던 데이터 마이닝 방법 중 하나인 연관규칙 기법(Apriori)을 GML 문서들에 사용하여 의미 있는 규칙을 찾아내려 한다. 규칙을 찾는 방법에는 2가지가 있을 수 있다. 하나는 GML 문서에서 내용만을 뽑아내어 그에 따른 규칙을 찾아내는 방법이고, 다른 하나는 GML 문서에서 사용된 태그와 속성을 기반으로 규칙을 찾아내는 방법이다. 본 논문에서는 2가지 방법을 통해 규칙을 찾는 것에 대하여 기술하고 2가지 방법을 적용한 시스템을 보일 것이다.

  • PDF

웹 로그와 구매 DB를 이용한 개인화 시스템에 관한 연구 (A Study on Personalization System Using Web Log and Purchasing Database)

  • 김영태;이성주
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 2003년도 추계 학술대회 학술발표 논문집
    • /
    • pp.23-26
    • /
    • 2003
  • In this paper, a methodolgy for customizing web pages for indivisual users is suggested. It shows an efficient way to personalize web pages by predicting one's site access pattern. In addition, the prediction can reflect one's tendency after actual purchase. By using the APRIORI algorithm, one of the association rule search methods, the associativity among the purchase items can be inferred. This inferrence is based on the log data in a web server and database about purchase. Finally, a web page which contains the relationship, relative links on other web pages, and inferred items can be generated after this process.

  • PDF

유비쿼터스 환경에서의 매장 추천을 위한 추천시스템 개발

  • 김재경;채경희
    • 한국지능정보시스템학회:학술대회논문집
    • /
    • 한국지능정보시스템학회 2007년도 한국지능정보시스템학회
    • /
    • pp.246-254
    • /
    • 2007
  • 최근 유비쿼터스 환경이 대두됨에 따라 정보의 밀도가 높아지고 있으며, 기업에서는 고객이 제품을 구매함과 동시에 고객의 정보를 저장하여 활용할 수 있게 되었다. 이와 같은 환경은 고객의 요구사항을 사전에 미리 파악하여 적절한 시점과 상황에 맞는 정보를 전달할 수 있도록 하는 추천시스템에 대한 필요성을 증대시켰으며, 다양한 영역에서 추천시스템과 관련된 연구들이 활발하게 이루어지고 있다. 지금까지의 추천시스템은 주로 제품 중심으로 논의되어 왔으나, 유비쿼터스 시장 환경에서는 매장에 대한 논의가 필요하게 되었다. 이는 고객이 다양한 매장을 방문할 수 있으며, 동일한 제품이라도 여러 매장에 동시에 존재할 수 있고, 매장 간의 동선이나 매장의 위치 및 분위기, 제품의 품질이나 가격 등에 대한 개인 선호도에 따라 같은 제품이라도 선호하는 매장은 다를 수 있기 때문이다. 따라서 본 연구에서는 고객의 선호도를 기반으로 유비쿼터스 시장 환경에 적합한 매장 추천시스템을 제안하고자 한다. 매장 추천시스템은 협업 필터링을 기반으로 하고 있으며, Apriori 알고리즘을 이용하여 관련성이 높은 매장들의 집합을 찾아 추천한다. 이 시스템은 기업보다는 고객 중심의 서비스를 제공해 줌으로써 고객의 쇼핑 효율성을 제고시킬 뿐 아니라 장기적인 관점에서 시장 활성화에 기여할 수 있을 것으로 기대한다.

  • PDF