• 제목/요약/키워드: Group concept

검색결과 1,645건 처리시간 0.026초

다중 최소 임계치 기반 빈발 패턴 마이닝의 성능분석 (Performance Analysis of Frequent Pattern Mining with Multiple Minimum Supports)

  • 양흥모;윤은일
    • 인터넷정보학회논문지
    • /
    • 제14권6호
    • /
    • pp.1-8
    • /
    • 2013
  • 거대한 데이터베이스로부터 중요하고 의미 있는 정보를 찾아내기 위해 데이터 마이닝 기법들이 사용되며, 패턴 마이닝은 이러한 데이터 마이닝을 위한 중요한 기법 중에 하나이다. 패턴 마이닝은 거대 데이터베이스로부터 유용한 패턴을 찾아내는 기법이며, 패턴 마이닝 분야 중에 하나인 빈발 패턴 마이닝은 데이터베이스에서 최소 임계치 이상의 빈도수를 가지는 빈발 패턴을 마이닝 한다. 전통적인 빈발 패턴 마이닝은 전체 데이터베이스에 대한 단일 최소 임계치를 기반으로 중요 빈발 패턴을 마이닝 한다. 단일 최소 임계치 모델은 데이터베이스 내 모든 아이템이 동일한 특성을 가진다고 암묵적으로 가정한다. 그러나 실제 응용에서는 각 아이템들이 개별적인 특성을 가지고 있을 수 있으며, 따라서 이를 반영한 패턴 마이닝 기법이 요구된다. 데이터베이스 내 아이템들의 이러한 특성이 반영되지 않은 빈발 패턴 마이닝 모델에서, 중요한 희귀 아이템이 포함된 패턴을 마이닝 하기 위해서는 낮은 최소 임계치를 설정해야 한다. 그러나 너무 낮은 최소 임계치는 의미 없는 아이템들을 포함하는 수많은 패턴을 야기한다. 반대로 높은 최소 임계치는 희귀 아이템이 포함된 패턴을 마이닝 하지 못하는 희귀 아이템 문제라 불리는 딜레마가 발생한다. 이러한 문제의 해결을 위한 초기 연구들은 아이템 빈도수에 따라 데이터를 몇 개의 블록으로 분할하거나 관련 희귀 아이템들을 하나의 그룹으로 만드는 방법을 사용한 근사적 접근법을 제안하였다. 그러나 이러한 기법들은 근사적 방법의 적용에 의해 모든 희귀 패턴을 포함한 빈발 패턴을 마이닝 하지 못한다. 다중 최소 임계치를 고려한 패턴 마이닝 모델은 아이템들의 개별적인 특성을 반영하여 희귀 아이템 문제를 해결하기 위해 제안되었다. 다중 최소 임계치 기반의 빈발 패턴 마이닝 모델에서 각 아이템은 MIS (Minimum Item Support)라고 불리는 개별 최소 임계치를 가지며, 아이템들의 데이터베이스 내 빈도수를 기반으로 계산된다. 다중 최소 임계치 모델은 MIS를 통해 수많은 의미 없는 패턴을 생성하지 않고도 손실 없이 모든 희귀 빈발 패턴을 찾아낸다. 한편, 빈발 패턴을 마이닝 하는 과정에서 후보 패턴들이 생성되며, 단일 최소 임계치 모델에서는 각 후보 패턴의 빈도수가 유일한 최소 임계치와 비교된다. 따라서, 희귀 아이템 문제가 발생할 뿐만 아니라 후보 패턴을 구성하는 아이템들의 특성이 고려되지 않는다. 다중 최소 임계치 모델에서는 이 문제를 다루기 위해 후보 패턴을 구성하는 아이템들의 MIS 값 중에서 가장 작은 MIS 값을 해당 후보 패턴의 최소 임계치로 설정하여 패턴 내 아이템들의 특성을 반영한다. 이를 적용하여 효율적으로 희귀 빈발 패턴을 마이닝 하기 위해 트리 구조 기반의 알고리즘은 빈도수 내림차순으로 트리 내 아이템들을 정렬하는 단일 최소 임계치 모델과는 달리 MIS 내림차순으로 아이템들을 정렬하여 마이닝을 수행한다. 본 논문에서는 다중 최소 임계치 기반의 빈발 패턴 마이닝 알고리즘에 대한 특성을 살펴보고, 일반 단일 임계치 기반 알고리즘과의 성능평가를 수행한다. 성능평가는 실행 속도, 메모리 사용량, 그리고 확장성의 관점에서 수행된다. 성능평가 결과, 다중 최소 임계치 기반의 빈발 패턴 마이닝 알고리즘은 희귀 빈발 패턴을 포함한 모든 빈발 패턴을 단일 임계치 기반의 빈발 패턴 마이닝 알고리즘보다 더 빠른 속도로 마이닝 하였으며, 각 아이템의 최소 임계치 정보를 위한 추가적인 메모리를 필요로 하였다. 또한, 비교 알고리즘들은 좋은 확장성 결과를 보였다.

주제 균형 지능형 텍스트 요약 기법 (Subject-Balanced Intelligent Text Summarization Scheme)

  • 윤여일;고은정;김남규
    • 지능정보연구
    • /
    • 제25권2호
    • /
    • pp.141-166
    • /
    • 2019
  • 최근 다양한 매체를 통해 생성되는 방대한 양의 텍스트 데이터를 효율적으로 관리 및 활용하기 위한 방안으로써 문서 요약에 대한 연구가 활발히 진행되고 있다. 특히 최근에는 기계 학습 및 인공 지능을 활용하여 객관적이고 효율적으로 요약문을 도출하기 위한 다양한 자동 요약 기법이(Automatic Summarization) 고안되고 있다. 하지만 현재까지 제안된 대부분의 텍스트 자동 요약 기법들은 원문에서 나타난 내용의 분포에 따라 요약문의 내용이 구성되는 방식을 따르며, 이와 같은 방식은 비중이 낮은 주제(Subject), 즉 원문 내에서 언급 빈도가 낮은 주제에 대한 내용이 요약문에 포함되기 어렵다는 한계를 갖고 있다. 본 논문에서는 이러한 한계를 극복하기 위해 저빈도 주제의 누락을 최소화하는 문서 자동 요약 기법을 제안한다. 구체적으로 본 연구에서는 (i) 원문에 포함된 다양한 주제를 식별하고 주제별 대표 용어를 선정한 뒤 워드 임베딩을 통해 주제별 용어 사전을 생성하고, (ii) 원문의 각 문장이 다양한 주제에 대응되는 정도를 파악하고, (iii) 문장을 주제별로 분할한 후 각 주제에 해당하는 문장들의 유사도를 계산한 뒤, (iv) 요약문 내 내용의 중복을 최소화하면서도 원문의 다양한 내용을 최대한 포함할 수 있는 자동적인 문서 요약 기법을 제시한다. 제안 방법론의 평가를 위해 TripAdvisor의 리뷰 50,000건으로부터 용어 사전을 구축하고, 리뷰 23,087건에 대한 요약 실험을 수행한 뒤 기존의 단순 빈도 기반의 요약문과 주제별 분포의 비교를 진행하였다. 실험 결과 제안 방법론에 따른 문서 자동 요약을 통해 원문 내각 주제의 균형을 유지하는 요약문을 도출할 수 있음을 확인하였다.

Information Privacy Concern in Context-Aware Personalized Services: Results of a Delphi Study

  • Lee, Yon-Nim;Kwon, Oh-Byung
    • Asia pacific journal of information systems
    • /
    • 제20권2호
    • /
    • pp.63-86
    • /
    • 2010
  • Personalized services directly and indirectly acquire personal data, in part, to provide customers with higher-value services that are specifically context-relevant (such as place and time). Information technologies continue to mature and develop, providing greatly improved performance. Sensory networks and intelligent software can now obtain context data, and that is the cornerstone for providing personalized, context-specific services. Yet, the danger of overflowing personal information is increasing because the data retrieved by the sensors usually contains privacy information. Various technical characteristics of context-aware applications have more troubling implications for information privacy. In parallel with increasing use of context for service personalization, information privacy concerns have also increased such as an unrestricted availability of context information. Those privacy concerns are consistently regarded as a critical issue facing context-aware personalized service success. The entire field of information privacy is growing as an important area of research, with many new definitions and terminologies, because of a need for a better understanding of information privacy concepts. Especially, it requires that the factors of information privacy should be revised according to the characteristics of new technologies. However, previous information privacy factors of context-aware applications have at least two shortcomings. First, there has been little overview of the technology characteristics of context-aware computing. Existing studies have only focused on a small subset of the technical characteristics of context-aware computing. Therefore, there has not been a mutually exclusive set of factors that uniquely and completely describe information privacy on context-aware applications. Second, user survey has been widely used to identify factors of information privacy in most studies despite the limitation of users' knowledge and experiences about context-aware computing technology. To date, since context-aware services have not been widely deployed on a commercial scale yet, only very few people have prior experiences with context-aware personalized services. It is difficult to build users' knowledge about context-aware technology even by increasing their understanding in various ways: scenarios, pictures, flash animation, etc. Nevertheless, conducting a survey, assuming that the participants have sufficient experience or understanding about the technologies shown in the survey, may not be absolutely valid. Moreover, some surveys are based solely on simplifying and hence unrealistic assumptions (e.g., they only consider location information as a context data). A better understanding of information privacy concern in context-aware personalized services is highly needed. Hence, the purpose of this paper is to identify a generic set of factors for elemental information privacy concern in context-aware personalized services and to develop a rank-order list of information privacy concern factors. We consider overall technology characteristics to establish a mutually exclusive set of factors. A Delphi survey, a rigorous data collection method, was deployed to obtain a reliable opinion from the experts and to produce a rank-order list. It, therefore, lends itself well to obtaining a set of universal factors of information privacy concern and its priority. An international panel of researchers and practitioners who have the expertise in privacy and context-aware system fields were involved in our research. Delphi rounds formatting will faithfully follow the procedure for the Delphi study proposed by Okoli and Pawlowski. This will involve three general rounds: (1) brainstorming for important factors; (2) narrowing down the original list to the most important ones; and (3) ranking the list of important factors. For this round only, experts were treated as individuals, not panels. Adapted from Okoli and Pawlowski, we outlined the process of administrating the study. We performed three rounds. In the first and second rounds of the Delphi questionnaire, we gathered a set of exclusive factors for information privacy concern in context-aware personalized services. The respondents were asked to provide at least five main factors for the most appropriate understanding of the information privacy concern in the first round. To do so, some of the main factors found in the literature were presented to the participants. The second round of the questionnaire discussed the main factor provided in the first round, fleshed out with relevant sub-factors. Respondents were then requested to evaluate each sub factor's suitability against the corresponding main factors to determine the final sub-factors from the candidate factors. The sub-factors were found from the literature survey. Final factors selected by over 50% of experts. In the third round, a list of factors with corresponding questions was provided, and the respondents were requested to assess the importance of each main factor and its corresponding sub factors. Finally, we calculated the mean rank of each item to make a final result. While analyzing the data, we focused on group consensus rather than individual insistence. To do so, a concordance analysis, which measures the consistency of the experts' responses over successive rounds of the Delphi, was adopted during the survey process. As a result, experts reported that context data collection and high identifiable level of identical data are the most important factor in the main factors and sub factors, respectively. Additional important sub-factors included diverse types of context data collected, tracking and recording functionalities, and embedded and disappeared sensor devices. The average score of each factor is very useful for future context-aware personalized service development in the view of the information privacy. The final factors have the following differences comparing to those proposed in other studies. First, the concern factors differ from existing studies, which are based on privacy issues that may occur during the lifecycle of acquired user information. However, our study helped to clarify these sometimes vague issues by determining which privacy concern issues are viable based on specific technical characteristics in context-aware personalized services. Since a context-aware service differs in its technical characteristics compared to other services, we selected specific characteristics that had a higher potential to increase user's privacy concerns. Secondly, this study considered privacy issues in terms of service delivery and display that were almost overlooked in existing studies by introducing IPOS as the factor division. Lastly, in each factor, it correlated the level of importance with professionals' opinions as to what extent users have privacy concerns. The reason that it did not select the traditional method questionnaire at that time is that context-aware personalized service considered the absolute lack in understanding and experience of users with new technology. For understanding users' privacy concerns, professionals in the Delphi questionnaire process selected context data collection, tracking and recording, and sensory network as the most important factors among technological characteristics of context-aware personalized services. In the creation of a context-aware personalized services, this study demonstrates the importance and relevance of determining an optimal methodology, and which technologies and in what sequence are needed, to acquire what types of users' context information. Most studies focus on which services and systems should be provided and developed by utilizing context information on the supposition, along with the development of context-aware technology. However, the results in this study show that, in terms of users' privacy, it is necessary to pay greater attention to the activities that acquire context information. To inspect the results in the evaluation of sub factor, additional studies would be necessary for approaches on reducing users' privacy concerns toward technological characteristics such as highly identifiable level of identical data, diverse types of context data collected, tracking and recording functionality, embedded and disappearing sensor devices. The factor ranked the next highest level of importance after input is a context-aware service delivery that is related to output. The results show that delivery and display showing services to users in a context-aware personalized services toward the anywhere-anytime-any device concept have been regarded as even more important than in previous computing environment. Considering the concern factors to develop context aware personalized services will help to increase service success rate and hopefully user acceptance for those services. Our future work will be to adopt these factors for qualifying context aware service development projects such as u-city development projects in terms of service quality and hence user acceptance.

몬트리올조약에 있어 국제항공여객운송인의 손해배상책임 (Liability of the Compensation for Damage Caused by the International Passenger's Carrier by Air in Montreal Convention)

  • 김두환
    • 항공우주정책ㆍ법학회지
    • /
    • 제18권
    • /
    • pp.9-39
    • /
    • 2003
  • 프로펠러여객기 운항시대에 만들어졌던 국제항공운송인의 민사책임관계를 규정한 1992년의 바르샤바조약은 1955년의 헤이그 개정의정서, 1961년의 과다라하라조약, 1971년의 과테말라의정서 및 1975년의 몬트리올 제1, 제2, 제3및 제4의 정서 등 한개의 조약과 여섯 개의 의정서 등에 의하여 여러 차례 개정이 되었고 보완되면서 70여 년간 전세계를 지배하여 왔지만 오늘날 초음속(마하)으로 나르고 있는 제트여객기 운항시대에 적합하지 않아 "바르샤바조약체제" 상의 문제점이 많이 제기되어 왔다. 특히 시대에 뒤떨어진 "바르샤바조약체제" 는 2개의 조약과 여섯 개의 의정서로 매우 복잡하게 구성되어 있었으며 항공기사고로 인한 국제항공운송인의 손해배상사건에 있어 배상한도액이 유한책임으로 규정되어 있어 항상 가해자인 항공사와 피해자인 여객들간에 분쟁(소송 등)이 끊이지 않고 있으므로 이를 어느정도 해결하기 위하여 UN산하 ICAO에서는 상기 여러 개 조약과 의정서를 하나의 조약으로 통합(integration)하여 단순화시키고 현대화(modernization)시키기 위하여 20여 년간의 작업 끝에 1999년 5월에 몬트리올에서 새로운 국제항공운송인의 민사책임에 관한 조약(몬트리올 조약)을 제정하였다. "바르샤바조약체제" 를 근본적으로 개혁한 몬트리올 조약은 71개국과 유럽통합지역기구가 서명하였으며 미국을 비롯하여 33개국이 비준하여 2003년 11월 3일부터 전세계적으로 발효되었음으로 이 조약은 앞으로 전세계의 항공운소업계를 지배하게 되리라고 본다. 본 논문에서는 몬트리올 조약의 성립경위와 주요내용(국제항공여객운송인의 손해배상책임: (1)총설, (2)조약의 명칭, (3)조약의 전문, (4)국제항공여객에 대한 책임원칙과 배상액((ㄱ)국제항공여객의 사상에 대한 배상, (ㄴ)국제항공여객의 연착에 대한 배상), (5)손해배상 한도액의 자동조정, (6)손해배상금의 일부전도, (7)손해배상청구소송의 제기관계, (8)국제항공여객의 주거지에서의 재판관할관계, (9)항공계약운송인과 항공실제운송인과의 관계, (10)항공보험)을 요약하여 간략하게 설명하였다. 1999년 몬트리올 조약의 핵심사항은 국제항공운송인의 손해배상책임에 관하여 무한책임을 원칙으로 하되 100,000 SDR까지는 무과실책임주의를 채택하였고 이 금액을 초과하는 부분에 대하여서는 과실추정책임주의를 채택하였음으로 "2단계의 책임제도" 를 도입한 점과 항공기사고로 인한 피해자(여객)는 주소지의 관할법원에 가해자(항공사)를 상대로 손해배상청구소송을 제기할 수 있는 제 5재판관할권을 새로이 도입하였다는 점이다. 현재 우리 나라는 전세계에서 항공여객수송량이 11위 권에 접어들고 있으며 항공화물수송량도 3위 권을 차지하고 있음에도 불구하고 아직도 이 조약에 서명 내지 비준을 하지 않고 있음은 문제점으로 지적될 수가 있음으로 그 해결방안으로 세계의 항공산업선진국들과 어깨를 나란히 하고 상호 협력하기 위하여 조속히 우리 나라도 이 조약에 서명하고 비준하는 것이 필요하다고 본다. 한편 우리 나라와 일본은 국내항공운송에 있어서는 국내에서 항공기사고가 발생하였을 때에 국내항공여객운송인의 민사책임을 규정한 법률이 없기 때문에 항상 항공사 측과 피해자간에 책임원인과 한계 및 손해배상액을 놓고 분규가 심화되어 가고있으며 법원에서 소송이 몇 년씩 걸리어 피해자 보호에 만전을 기 할 수가 없는 실정에 있다. 현재 이와 같은 분규의 신속한 해결을 위하여 국내항공운송약관과 민상법의 규정을 적용 내지 준용하여 처리할 수밖에 없는 실정인데 항공기사고의 특수성을 고려하여 볼 때 여러 가지 문제점이 많이 제기되고 있다. 이와 같은 문제점을 해결하기 위하여 국내항공여객운송인의 책임한계 및 손해배상액을 분명하게 정하고 재판의 공평성과 신속성을 도모하기 위하여서는 항공운송계약 당사자간의 책임관계를 명확하게 규정한 "가칭, 항공운송법" 의 국내입법이 절실히 필요하다고 본다.

  • PDF

온.오프라인 채널에서 지각된 품질이 서비스의 개인가치에 미치는 영향에 관한 연구 -인지욕구의 조정효과를 중심으로- (A Study on Perceived Quality affecting the Service Personal Value in the On-off line Channel - Focusing on the moderate effect of the need for cognition -)

  • 성형석
    • 한국유통학회지:유통연구
    • /
    • 제15권3호
    • /
    • pp.111-137
    • /
    • 2010
  • 본 연구는 서비스 시장에서의 지각된 품질과 개인가치간의 인과적 관계 및 고객의 인지욕구에 따른 온 오프라인상의 조절효과에 대해 실증분석하였으며 이를 통해 개인가치에 대한 서비스 전략과 마케팅 관리의 중요성을 제시하고 있다. 서비스 시장에서 서비스 제공자와 구매자간의 장기적 거래관계의 중요성이 크게 부각됨에 따라 관계구축 및 강화에 매우 중요한 역할을 하는 개인가치에 관한 연구는 학계뿐만 아니라 실무적으로도 고객관계관리의 관점에서 시사하는 바가 크다고 할 수 있다. 실증분석을 위해 대형마트(할인점)와 인터넷 쇼핑몰을 이용하는 고객을 대상으로 설문을 통해 데이터를 수집하였으며 온 오프라인의 비교분석을 통한 차이검증을 위한 인과적 구성모델에 대해 구조방정식 모델분석을 통해 가설검증하였다. 구성모델에 대한 분석결과 물리적 환경, 상호작용 품질, 그리고 결과품질로 구성된 지각된 품질은 안정적 삶, 사회적 인식, 사회적 통합으로 구성된 서비스 개인가치에 통계적으로 매우 유의한 정(+)의 영향을 미치는 것으로 나타났으며 집단간 차이효과분석을 통해서도 온 오프라인에 따른 조정효과는 온라인에서보다는 오프라인에서 더 유의한 것으로 나타났다. 그리고 온라인상에서의 서비스에 대한 인지욕구가 높을 때보다는 오프라인상에서의 서비스에 대한 인지욕구가 높을 때 개인가치에 더 유의한 영향을 미치는 것으로 나타났다. 마지막으로 본 연구의 구성모델에 대한 적합도 역시 수용할만한 수준인 것으로 나타났다.

  • PDF