• 제목/요약/키워드: Real-world

검색결과 4,284건 처리시간 0.033초

대구지역 치기공과 학생의 취업률 향상과 치과기공사의 인력수급에 관한 연구 (A Study on the Improvement of Employment Rate of Dental Technology School Graduates in Daegu and the Supply and Demand of Dental Technician Work Forces)

  • 이종도;정영해
    • 대한치과기공학회지
    • /
    • 제31권1호
    • /
    • pp.37-54
    • /
    • 2009
  • The purpose of this thesis is to address the imbalance between supply and demand of dental lab technicians and to propose its solutions by analyzing the improvement of employment rate of graduates of dental technology schools in Daegu area and the supply and demand of the technician workforce. Preliminary and full-scale surveys were performed from Aug. 10 to Oct. 10 in 2008 on 150 junior students of dental technology schools who finished their on-the-job-training and 150 dental technicians who were working for dental laboratory in Daegu by self-assessment questionnaire. Followings are the findings of this study. First, regarding the gender of the dental technicians, 32.7% of respondents were female 67.3% were male. Concerning age, respondents younger than 29 years-old occupied the highest percentage(39.3%). With respect to the lab technology school they graduated, DaeguHealthCollege took the largest proportion of 87.3%. With regard to interpersonal relationship at the school, 58.0% of respondents felt their relationship 'smooth'. Second, about the motive of choosing to be a lab technician, the biggest proportion of the respondents(34.7%) replied that 'because it is professional'. Regarding the degree of satisfaction about the profession, 'so-so' was the answer with the biggest percentage(51.3%) followed by 'satisfied'(32.0%) and 'unsatisfied'(16.7%). It showed that respondents were generally satisfied with their major. Third, regarding relevance of on-the-job-training with 'preparation for the employment', highest percentage of both students and lab technicians(50.0%) replied 'so-so'. With respect to 'necessity of practical education', highest percentage of the students and lab technicians replied 'relating didactic education in college to the real world' with 52.7% and 40.7% respectively. With regard to 'the aim of on-the-sport-training', 'practical training of didactic education' was chosen by 54.0% and 47.3% respectively. Fourth, with regard to the 'types of college education advantageous for the employment', both students and lab technicians groups chose 'practical training' with the highest percentage. Concerning 'helpfulness of clinical training on employment', students answered 'so-so' and 'helpful' by 50.0% and 42.7% respectively and dental technicians replied similarly by 50.0% and 46.0% respectively. Fifth, with regard to the influence of financial factors on the supply and demand of dental technician(question #1), 68.0% of respondents agreed that 'salary plays key role in the supply and demand of the work force'. Concerning the question about working condition, respondents requested better working environment. With reference to interpersonal relationship at the laboratory, respondents replied that interpersonal relationship affects the duration of the employment it was found out that there were many conflicts with colleagues or dental office. Sixth, regarding the satisfaction about their profession according to the characteristics of the respondents more respondents were 'satisfied'(10.30 points) with their profession and 'unsatisfied' were 9.47 points and the difference was statistically significant(p<0.05). According to the findings of this study, practical education on campus and on-the-job-training are as important as didactic education at class due to the characteristics of dental technology major. It was found that more practical training is related to higher employment rate. Therefore, efficiency of on-the-job-training by college education should be increased raise employment rate of the graduates and reduce the unemployment. Up-to-date information needs to be promptly delivered and future vision should be presented to the students to raise their satisfaction about the profession. In addition, to reduce dental technician's frequent change of their workplace after facing with the reality of the profession after graduation, related organizations should make an effort to present better future than now.

  • PDF

추천시스템관련 학술논문 분석 및 분류 (A Literature Review and Classification of Recommender Systems on Academic Journals)

  • 박득희;김혜경;최일영;김재경
    • 지능정보연구
    • /
    • 제17권1호
    • /
    • pp.139-152
    • /
    • 2011
  • 1990년대 중반에 협업 필터링의 출현으로 인하여 추천시스템에 관련된 연구가 늘어나게 되었다. 협업 필터링의 출현 이후 내용 기반 필터링, 협업 필터링과 내용 기반 필터링이 혼합된 하이브리드 필터링 등 새로운 기법들이 출현함으로써 2000년대에는 추천시스템의 연구가 눈에 띄게 증가하였다. 하지만 현재까지 추천시스템에 관련된 문헌들에 대한 리뷰와 분류가 체계적으로 되어있지 않다. 이와 같은 문제에 대한 해결방안으로써, 본 연구에서는 2001년부터 2010년도까지의 추천시스템에 관련된 문헌들 중 MIS Journal Ranking의 125개의 저널에서 추천시스템(Recommender system, Recommendation system), 협업 필터링(Collaborative Filtering), 내용 기반 필터링(Content based Filtering), 개인화 시스템(Personalized system) 등의 5가지 키워드로 제한하여 조사하였다. 총 37개의 저널에서 논문을 검색하였으며, 검색되어진 논문을 분석한 결과 추천시스템과 관련이 없는 논문을 제외한 총 187개의 논문을 선정하여 분석하였다. 이 연구에서는 그러나 컨퍼런스 논문, 석사, 박사학위 논문, 영어로 작성되지 않은 논문, 완성되지 않은 논문 등은 제외하였다. 본 연구에서는 187개의 논문을 분석하여 2001년부터 2010년까지의 각각의 년도 별 추천시스템의 연구에 대한 동향 분석, Journal별 추천시스템의 게재 분류, 추천시스템 어플리케이션의 사용 분야(책, 문서, 이미지, 영화, 음악, 쇼핑, TV 프로그램, 기타)별 분류 및 분석, 추천시스템에 사용된 데이터마이닝 기술(연관 규칙, 군집화, 의사 결정나무, 최근접 이웃 기법, 링크 분석 기법, 신경망, 회귀분석, 휴리스틱 기법)별 분류 및 분석을 수행하였다. 따라서 본 연구에서 제안한 각각의 분류 및 분석 결과들을 통하여 현재까지 추천시스템의 연구에 대한 연구 동향을 파악 할 수 있었으며, 분석결과를 통해 추천시스템에 관심이 있는 연구자와 전문가에게 미래의 추천시스템의 연구에 대한 가이드라인을 제시 할 수 있을 것이라고 기대한다.

구조적 공백과 협업필터링을 이용한 추천시스템 (Recommender Systems using Structural Hole and Collaborative Filtering)

  • 김민건;김경재
    • 지능정보연구
    • /
    • 제20권4호
    • /
    • pp.107-120
    • /
    • 2014
  • 본 연구에서는 사회연결망분석기법 중 하나인 구조적 공백 분석 결과를 이용하여 추천과정에 사용자의 정성적이고 감성적인 정보를 반영할 수 있는 협업필터링 기반의 추천시스템을 제안한다. 협업필터링은 추천기술 중 가장 많이 활용되고 있지만 전통적으로 확장성과 희박성 등의 문제점뿐 만 아니라 사용자-상품 매트릭스의 선호도만을 이용하여 추천을 함으로써 사용자의 정성적이고 감성적인 정보를 추천과정에 반영하지 못한다는 한계점이 있다. 본 연구에서 제안하는 추천시스템은 사회연결망분석에서 중심성 분석과 함께 연결망 내의 주요개체를 탐지할 수 있는 구조적 공백 분석을 이용하여 연결망 내의 대표 사용자들을 추출한 후 이들을 중심으로 군집을 형성한 후 각 군집색인 협업필터링을 수행하는 과정을 통해 전통적인 협업필터링에서 반영하지 못했던 정성적, 감성적 정보를 반영한다. 한편, 군집색인 협업필터링을 수행함으로써 추천의 효율성을 높일 수 있는 장점도 있다. 본 연구에서는 실제 사용자들의 상품에 대한 선호도 평가점수와 사용자들의 사회연결망 정보를 수집하여 실험을 수행하고 전통적인 협업필터링과 다양한 형태의 협업필터링과의 추천성과 비교를 통하여 제안하는 시스템의 유용성을 확인한다. 비교모형으로는 전통적인 협업필터링, 임의 군집색인 기반 협업필터링, k평균 군집색인 기반 협업필터링을 이용한 추천시스템이며, 실험 결과, 제안한 모형이 다른 비교모형에 비해 추천성과의 정확도가 가장 우수하였다. 추천성과의 차이에 대한 통계적 유의성 검정 결과, 제안 모형은 전통적인 협업필터링 기반의 추천시스템과는 통계적으로 유의한 성과 차이가 없었으나, 다른 두 모형에 대해서는 통계적으로 유의한 성과의 차이가 있는 것으로 나타났다.

한국 의료법에서 후견주의 이념의 수용, 변형 그리고 거부 - 치료중단에 대한 법원 판결을 중심으로 - (Acceptance, Modification and Rejection of Paternalism in Korean Medical Law)

  • 김나경
    • 한국발생생물학회지:발생과생식
    • /
    • 제14권2호
    • /
    • pp.143-154
    • /
    • 2010
  • 이 글은 연명치료의 중단에 관해 서로 상반된 결론을 내렸던 보라매병원 판결(대법원 2002도995)과 신촌세브란스병원 판결(대법원 2009다17471)이 전통적으로 의료사회를 지배했던 의사후견주의 혹은 가족주의적 후견주의의 이념을 어떠한 방식으로 수용하거나 변형 또는 거부하고 있는지를 분석한다. 보라매병원 사건에서 법원이 '의사'의 자연법적 의무를 강조한 것은 의사가 자연법 발견의 능력이 있음을 전제하는 전통적인 의사후견주의적 인식에서 출발한 것이긴 하다. 하지만 법원은 종국적으로는 자연법 발견의 최종적 주체를 '법원'으로 상정함으로써 스스로를 환자에 대한 독자적 후견인으로 규정한 셈이 되었다. 뿐만 아니라 법원은 환자 가족의 결정 역시 법원의 자연법적 결정 뒤로 물러나게 함으로써 가족주의적 후견주의로부터 탈피했지만, 법원의 우월성을 드러낼 뿐 가족의 결정이 가질 수 있는 의미를 충분히 존중하지는 못했다. 신촌세브란스병원 사건에서는 이와는 달리 환자의 자기결정권이 갖는 의미가 무엇인지를 좀더 명확히 언급한다. 뿐만 아니라 자기결정권의 행사범위는 '내용적'으로, 그리고 '시간적'으로도 확대된다. 하지만 이 판결 역시 진정한 의미에서의 의료적 자율성에 대한 인식을 충분히 보여주진 못했다. 법원은 의사나 병원윤리위원회의 결정의 중요성을 인식하면서도 행위에 대한 실체적인 판단의 권한을 여전히 유지하고 있는 듯하며, 환자가족의 결정을 중시하긴 하지만 여전히 정황에 대한 (법원의) '객관적' 판단을 강조함으로써 결정주체로서의 권위를 포기하지 않는다.

글로벌 공급사슬에서 경쟁협력 스케줄링을 위한 에이전트 기반 플랫폼 구축 (Development of Agent-based Platform for Coordinated Scheduling in Global Supply Chain)

  • 이정승;최성우
    • 지능정보연구
    • /
    • 제17권4호
    • /
    • pp.213-226
    • /
    • 2011
  • 글로벌 공급사슬 환경에서 글로벌하게 분산 조달, 생산, 유통하게 됨에 따라 전체 공급사슬의 스케줄을 최적화하기 위해서 공급사슬상의 개별 기업 혹은 공장의 스케줄링 최적화뿐만 아니라 각 개별 기업 혹은 공장의 스케줄을 긴밀하게 연계하는 것이 필요하게 되었다. 이는 경쟁과 협력을 동시에 하는 개별 기업 혹은 공장을 개별 에이전트로 보고 각 에이전트간 커뮤니케이션을 통해 개별 에이전트가 관할하는 스케줄러의 스케줄을 조정함으로써 가능해진다. 하지만 전통적인 스케줄링 연구는 개별 스케줄러의 최적화에 집중되어 있고, 에이전트 연구는 스케줄링 도메인에 적용한 예가 제한적이며 이 예도 개별 스케줄러 내의 최적화에 적용하거나 실제 현장 문제가 아닌 실험실 문제 수준에 그치고 있다. 따라서 본 연구에서는 전체 글로벌 공급사슬 스케줄의 최적화를 위해 개별 기업 혹은 공장 스케줄러의 스케줄링을 연계하는 경쟁협력 스케줄링을 위한 에이전트 기반 플랫폼을 구축하였다. 글로벌 공급사슬에서 경쟁협력 스케줄링을 위한 에이전트 기반 플랫폼을 구축하기 위해 첫째, 경쟁협력 스케줄링 분류 체계를 확립하고, 둘째, 경쟁협력 스케줄링을 위한 에이전트를 설계하고, 셋째, 경쟁협력 스케줄링을 위한 지식기반 의사결정 모델을 개발한 후, 넷째 조선산업에 적용 가능한 프로토타입 시스템을 개발했다. 이를 통해 글로벌 공급사슬상의 전체 스케줄의 품질과 에이전트간 커뮤니케이션의 노력에 대한 균형점을 찾을 수 있다. 이를 통해 공급사슬내 개별 기업 혹은 공장의 부분 최적화를 극복할 수 있는 대안을 제시할 것으로 기대한다.

비대칭 오류비용을 고려한 분류기준값 최적화와 SVM에 기반한 지능형 침입탐지모형 (An Intelligent Intrusion Detection Model Based on Support Vector Machines and the Classification Threshold Optimization for Considering the Asymmetric Error Cost)

  • 이현욱;안현철
    • 지능정보연구
    • /
    • 제17권4호
    • /
    • pp.157-173
    • /
    • 2011
  • 최근 인터넷 사용의 증가에 따라 네트워크에 연결된 시스템에 대한 악의적인 해킹과 침입이 빈번하게 발생하고 있으며, 각종 시스템을 운영하는 정부기관, 관공서, 기업 등에서는 이러한 해킹 및 침입에 의해 치명적인 타격을 입을 수 있는 상황에 놓여 있다. 이에 따라 인가되지 않았거나 비정상적인 활동들을 탐지, 식별하여 적절하게 대응하는 침입탐지 시스템에 대한 관심과 수요가 높아지고 있으며, 침입탐지 시스템의 예측성능을 개선하려는 연구 또한 활발하게 이루어지고 있다. 본 연구 역시 침입탐지 시스템의 예측성능을 개선하기 위한 새로운 지능형 침입탐지모형을 제안한다. 본 연구의 제안모형은 비교적 높은 예측력을 나타내면서 동시에 일반화 능력이 우수한 것으로 알려진 Support Vector Machine(SVM)을 기반으로, 비대칭 오류비용을 고려한 분류기준값 최적화를 함께 반영하여 침입을 효과적으로 차단할 수 있도록 설계되었다. 제안모형의 우수성을 확인하기 위해, 기존 기법인 로지스틱 회귀분석, 의사결정나무, 인공신경망과의 결과를 비교하였으며 그 결과 제안하는 SVM 모형이 다른 기법에 비해 상대적으로 우수한 성과를 보임을 확인할 수 있었다.

웹서비스 유사성 평가 방법들의 실험적 평가 (Evaluation of Web Service Similarity Assessment Methods)

  • 황유섭
    • 지능정보연구
    • /
    • 제15권4호
    • /
    • pp.1-22
    • /
    • 2009
  • 월드와이드웹(WWW)은 유용한 정보를 포함하는 자료들의 집합에서 유용한 작업을 수행할 수 있는 서비스들의 집합으로 변화하고 있다. 새롭게 등장하고 있는 웹서비스 기술은 향후 웹의 기술적 변화를 추구하며 최근의 웹의 변화에 중요한 역할을 수행할 것으로 기대된다. 웹서비스는 어플리케이션 간의 통신을 위한 호환성 표준을 제시하며 기업 내/외를 아우를 수 있는 어플리케이션 상호작용 및 통합을 촉진한다. 웹서비스를 서비스 중심 컴퓨팅환경으로서 운용하기 위해서는 웹서비스 저장소는 조직화되어 있어야 할 뿐 아니라, 사용자들의 요구에 맞는 웹서비스 컴포넌트를 찾을 수 있는 효율적인 도구들을 제공하여야 한다. 서비스 중심 컴퓨팅을 위한 웹서비스의 중요성이 증대됨에 따라 웹서비스 발견을 효율적으로 제공할 수 있는 기법의 수요 또한 증대된다. 웹서비스 발견을 위한 많은 기법들이 제안되어 왔지만, 대부분의 선행연구들은 활용하기에는 제대로 발달하지 못하였거나 특정 도메인에 너무 치중하여 일반화하기 어려웠다. 이 논문에서는 군집화기법과 XML기반의 서비스 기술표준인 WSDL의 의미적 가치를 활용하여 다수의 웹서비스를 군집화하는 프레임워크를 제안한다. 웹서비스 발견이라는 연구영역에 최초로 데이터마이닝 기법을 적용한 연구이다. 본 논문에서 제안하는 방식은 여러 흥미로운 요소들이 있다: (1) 서비스 사용자와 제공자들의 사전지식 요구를 최소화한다 (2) 특정 도메인에 과도하게 치중한 온톨로지를 피한다 (3) 웹서비스들 간의 의미론적 관계를 시각화할 수 있다. 이 논문에서 인공신경 정신망 네트워크를 기반으로 하여 프로토타입 시스템을 개발하였으며, 실제 운용되고 있는 웹서비스 저장소로부터 획득한 실제 웹서비스들을 사용하여 제안하는 웹서비스 조직화 프레임워크를 실증적으로 평가하였으며 제안하는 방식의 효용성을 보여주는 실험결과를 보고한다.

  • PDF

내경(內徑) 운기편(運氣篇)의 표(標).본(本).중(中) 개념에 대한 연구(硏究) (A study of conception of pyo(標).bon(本).joong(中) in the part of woongihak(運氣學) in negeong(內徑))

  • 백유상;박찬국
    • 대한한의학원전학회지
    • /
    • 제11권2호
    • /
    • pp.114-134
    • /
    • 1998
  • The conception of pyo(標) bon(本) joong(中) in the part of woongihak(運氣學) of negeong(內徑) one of the important thing that decides the relation between six gi(六氣) and samyum and samyang(三陰三陽) or between each other's of samyum and samyang itself, it says that the relation of Pyo-rce(表裏). So this conception from the ancient times have been used to explain the theory of meridian(經絡) and organs(五臟六腑) and in other important field of oriental medicine - Sanghannon(傷寒論), it became basis of explanation of pcthoiogical principles in the system of six kyung(六徑). At first, the subject or this study is limited to the rament of $\ll$Somun(素問)$\gg$ in order to find the accurate and original meanings of pyo(標) bon(本) joong(中). And the meanings are studied by the way of expanding it's meaning with basic conceptions of woongihak(運氣學) and astronomy included in negeong(內徑). In this study, the results are summarized as the followings. 1. The contents of - the 68th chapter of negeong(內徑), concerning pyo(標) and joong(中) come under chogi(初氣) and joonggi(中氣) of the same chapter, after consideration of astronomical knowledge. And they become active during the period that last about 30days, a haft of one step(一步) of kaekgi(客氣). 2. Bon(本) as a kind of six gi(六氣) that is revealed from internal principle of something, that is to say Ohhaeng(五行), comes mainly under the kaekgi(客氣) of woongihak(運氣學) with the meaning of 'sign' is thai the specific properties of six gi(六氣) are revealed to our sight, so we can feel that through the change of nature, Joong(中) is the other property hidden in the inside of six gi(六氣), that is a portion of original nature(本性) like the bon(本). 3. The relation of pyo(標) and bon(本) is like that bctween the principle hidden inside in all things(理) and it's expression into the real world(氣) also similar to thai of yumyang(陰陽) and ohhaeng(五行). Therefore bon(本), though it means one of the six gi(六氣), hale the property of ohhaeng(五行) and pyo(標) is revealed, with an appearance of samyum-samyang(三陰三陰). 4. pyo(標) and joong(中) are also the both sides of yum(陰) and yang(陰) that revealed under the change of yumyang-ohhaengl(陰陽五行) in the nature. For example, if the one is yang(陰), the other is yum(陰). In the process that the change of all things is revealed out, first the property of pyo(標) appears strongly and then that of joong(中) appears comparatively weakly. But, in spite of the inhibitive relation of yumyang(陰陽), pyo(標) and joong(中) promote each other. 5. Under the course of change. It happens according to the bon(本), the property of ohhaeng(五行) in the case of soyang(少陽) and taeyum(太陰), because the effect of moisture(濕) and fire(火) that makes hyung(形) and gi(氣) is very strong in the universe. In the case of taeyang(太陽) and soyum(少陰), it happens according to the bon(本) and pyo(標) because they hare the polarity of water and fire(火水), at the same time, are not separated each other. In the case of yangmeong(陽明) and gualyum(厥陰), the change appears only according to the joong(中), but not strongly because the phase of yangmeong(陽明) and gualyum(厥陰) is a lull phase processing to the next one.

  • PDF

THE CURRENT STATUS OF BIOMEDICAL ENGINEERING IN THE USA

  • Webster, John G.
    • 대한의용생체공학회:학술대회논문집
    • /
    • 대한의용생체공학회 1992년도 춘계학술대회
    • /
    • pp.27-47
    • /
    • 1992
  • Engineers have developed new instruments that aid in diagnosis and therapy Ultrasonic imaging has provided a nondamaging method of imaging internal organs. A complex transducer emits ultrasonic waves at many angles and reconstructs a map of internal anatomy and also velocities of blood in vessels. Fast computed tomography permits reconstruction of the 3-dimensional anatomy and perfusion of the heart at 20-Hz rates. Positron emission tomography uses certain isotopes that produce positrons that react with electrons to simultaneously emit two gamma rays in opposite directions. It locates the region of origin by using a ring of discrete scintillation detectors, each in electronic coincidence with an opposing detector. In magnetic resonance imaging, the patient is placed in a very strong magnetic field. The precessing of the hydrogen atoms is perturbed by an interrogating field to yield two-dimensional images of soft tissue having exceptional clarity. As an alternative to radiology image processing, film archiving, and retrieval, picture archiving and communication systems (PACS) are being implemented. Images from computed radiography, magnetic resonance imaging (MRI), nuclear medicine, and ultrasound are digitized, transmitted, and stored in computers for retrieval at distributed work stations. In electrical impedance tomography, electrodes are placed around the thorax. 50-kHz current is injected between two electrodes and voltages are measured on all other electrodes. A computer processes the data to yield an image of the resistivity of a 2-dimensional slice of the thorax. During fetal monitoring, a corkscrew electrode is screwed into the fetal scalp to measure the fetal electrocardiogram. Correlations with uterine contractions yield information on the status of the fetus during delivery To measure cardiac output by thermodilution, cold saline is injected into the right atrium. A thermistor in the right pulmonary artery yields temperature measurements, from which we can calculate cardiac output. In impedance cardiography, we measure the changes in electrical impedance as the heart ejects blood into the arteries. Motion artifacts are large, so signal averaging is useful during monitoring. An intraarterial blood gas monitoring system permits monitoring in real time. Light is sent down optical fibers inserted into the radial artery, where it is absorbed by dyes, which reemit the light at a different wavelength. The emitted light travels up optical fibers where an external instrument determines O2, CO2, and pH. Therapeutic devices include the electrosurgical unit. A high-frequency electric arc is drawn between the knife and the tissue. The arc cuts and the heat coagulates, thus preventing blood loss. Hyperthermia has demonstrated antitumor effects in patients in whom all conventional modes of therapy have failed. Methods of raising tumor temperature include focused ultrasound, radio-frequency power through needles, or microwaves. When the heart stops pumping, we use the defibrillator to restore normal pumping. A brief, high-current pulse through the heart synchronizes all cardiac fibers to restore normal rhythm. When the cardiac rhythm is too slow, we implant the cardiac pacemaker. An electrode within the heart stimulates the cardiac muscle to contract at the normal rate. When the cardiac valves are narrowed or leak, we implant an artificial valve. Silicone rubber and Teflon are used for biocompatibility. Artificial hearts powered by pneumatic hoses have been implanted in humans. However, the quality of life gradually degrades, and death ensues. When kidney stones develop, lithotripsy is used. A spark creates a pressure wave, which is focused on the stone and fragments it. The pieces pass out normally. When kidneys fail, the blood is cleansed during hemodialysis. Urea passes through a porous membrane to a dialysate bath to lower its concentration in the blood. The blind are able to read by scanning the Optacon with their fingertips. A camera scans letters and converts them to an array of vibrating pins. The deaf are able to hear using a cochlear implant. A microphone detects sound and divides it into frequency bands. 22 electrodes within the cochlea stimulate the acoustic the acoustic nerve to provide sound patterns. For those who have lost muscle function in the limbs, researchers are implanting electrodes to stimulate the muscle. Sensors in the legs and arms feed back signals to a computer that coordinates the stimulators to provide limb motion. For those with high spinal cord injury, a puff and sip switch can control a computer and permit the disabled person operate the computer and communicate with the outside world.

  • PDF

장바구니 크기가 연관규칙 척도의 정확성에 미치는 영향 (Effect of Market Basket Size on the Accuracy of Association Rule Measures)

  • 김남규
    • Asia pacific journal of information systems
    • /
    • 제18권2호
    • /
    • pp.95-114
    • /
    • 2008
  • Recent interests in data mining result from the expansion of the amount of business data and the growing business needs for extracting valuable knowledge from the data and then utilizing it for decision making process. In particular, recent advances in association rule mining techniques enable us to acquire knowledge concerning sales patterns among individual items from the voluminous transactional data. Certainly, one of the major purposes of association rule mining is to utilize acquired knowledge in providing marketing strategies such as cross-selling, sales promotion, and shelf-space allocation. In spite of the potential applicability of association rule mining, unfortunately, it is not often the case that the marketing mix acquired from data mining leads to the realized profit. The main difficulty of mining-based profit realization can be found in the fact that tremendous numbers of patterns are discovered by the association rule mining. Due to the many patterns, data mining experts should perform additional mining of the results of initial mining in order to extract only actionable and profitable knowledge, which exhausts much time and costs. In the literature, a number of interestingness measures have been devised for estimating discovered patterns. Most of the measures can be directly calculated from what is known as a contingency table, which summarizes the sales frequencies of exclusive items or itemsets. A contingency table can provide brief insights into the relationship between two or more itemsets of concern. However, it is important to note that some useful information concerning sales transactions may be lost when a contingency table is constructed. For instance, information regarding the size of each market basket(i.e., the number of items in each transaction) cannot be described in a contingency table. It is natural that a larger basket has a tendency to consist of more sales patterns. Therefore, if two itemsets are sold together in a very large basket, it can be expected that the basket contains two or more patterns and that the two itemsets belong to mutually different patterns. Therefore, we should classify frequent itemset into two categories, inter-pattern co-occurrence and intra-pattern co-occurrence, and investigate the effect of the market basket size on the two categories. This notion implies that any interestingness measures for association rules should consider not only the total frequency of target itemsets but also the size of each basket. There have been many attempts on analyzing various interestingness measures in the literature. Most of them have conducted qualitative comparison among various measures. The studies proposed desirable properties of interestingness measures and then surveyed how many properties are obeyed by each measure. However, relatively few attentions have been made on evaluating how well the patterns discovered by each measure are regarded to be valuable in the real world. In this paper, attempts are made to propose two notions regarding association rule measures. First, a quantitative criterion for estimating accuracy of association rule measures is presented. According to this criterion, a measure can be considered to be accurate if it assigns high scores to meaningful patterns that actually exist and low scores to arbitrary patterns that co-occur by coincidence. Next, complementary measures are presented to improve the accuracy of traditional association rule measures. By adopting the factor of market basket size, the devised measures attempt to discriminate the co-occurrence of itemsets in a small basket from another co-occurrence in a large basket. Intensive computer simulations under various workloads were performed in order to analyze the accuracy of various interestingness measures including traditional measures and the proposed measures.