• 제목/요약/키워드: Data Analyze

검색결과 19,173건 처리시간 0.041초

데이터마이닝을 기반으로 한 웹 전자상거래 서비스 설계 (Design of E-Commerce Service on The Web Based on Data Mining)

  • 천린;김철원
    • 한국전자통신학회논문지
    • /
    • 제15권4호
    • /
    • pp.703-708
    • /
    • 2020
  • 전자상거래의 추진력은 점점 강해지고 있으며 전자 상거래 간의 경쟁은 더욱 치열 해지고 있다. 이러한 데이터를 효과적으로 분석하고 합리적으로 사용하는 방법은 다양한 전자상거래 회사의 경쟁에서 중요한 포인트가 되었다. 본 논문에서는 데이터 마이닝 기술을 사용하여 대규모 웹 데이터베이스에서 중복 데이터를 필터링하고 유용한 데이터를 추출한 다음 다양한 관점에서 분석하여 이 데이터를 전자 상거래 웹 사이트에 합리적이고 효과적으로 적용한다.

Evaluation of Predictive Models for Early Identification of Dropout Students

  • Lee, JongHyuk;Kim, Mihye;Kim, Daehak;Gil, Joon-Min
    • Journal of Information Processing Systems
    • /
    • 제17권3호
    • /
    • pp.630-644
    • /
    • 2021
  • Educational data analysis is attracting increasing attention with the rise of the big data industry. The amounts and types of learning data available are increasing steadily, and the information technology required to analyze these data continues to develop. The early identification of potential dropout students is very important; education is important in terms of social movement and social achievement. Here, we analyze educational data and generate predictive models for student dropout using logistic regression, a decision tree, a naïve Bayes method, and a multilayer perceptron. The multilayer perceptron model using independent variables selected via the variance analysis showed better performance than the other models. In addition, we experimentally found that not only grades but also extracurricular activities were important in terms of preventing student dropout.

삼성 안드로이드 스마트폰의 진단데이터 분석 (Analyze Diagnostic Data from Samsung Android Smartphones)

  • 조형철;김준기;박정흠
    • 정보보호학회논문지
    • /
    • 제34권3호
    • /
    • pp.479-491
    • /
    • 2024
  • 안드로이드 제조사는 전 세계 사용자에게 서비스 품질 개선을 목적으로 진단데이터를 수집한다. 이러한 안드로이드 제조사가 수집하는 진단데이터의 내용과 동작 주기에 대해서는 알려진 바 없다. 우리는 스마트폰 제조사 중 안드로이드 시장에서 가장 높은 점유율을 가진 삼성 스마트폰을 대상으로 진단데이터 수집 행위를 분석하여어떤 진단데이터가 네트워크 패킷을 통해 서버와 통신하는지, 진단데이터 수집을 진행하는 시스템 앱이 어떻게 작동하는지 그리고 진단데이터가 사용자 개인정보를 침해하는지를 분석한다.

특허 출원 분석을 통한 LED 지식 맵 (LED Knowledge Map through a Patent Application)

  • 구영덕;정대현;권영일
    • 한국전자통신학회논문지
    • /
    • 제7권5호
    • /
    • pp.961-966
    • /
    • 2012
  • 본 논문에서는 LED의 지식 맵 구성을 위한 자료 수집 단계로서 특허 출원을 기반으로 데이터를 분석을 위해 국가별 출원 현황, 출원인별 출원 현황을 통하여 주요 특허 포지셔닝을 분석한다. 또한 기술 분야별 특허 출원 현황과 분석하며 출원인 국적별 기술 분포 분석을 통하여 지식 맵 작성을 위한 기본 자료를 제시한다.

소프트웨어 테스트 자료를 활용한 데이터 분석 (The Analysis of Data on the basis of Software Test Data)

  • 정혜정
    • 디지털융복합연구
    • /
    • 제13권10호
    • /
    • pp.1-7
    • /
    • 2015
  • 요즘 많은 사람들이 소프트웨어에 대한 관심이 높아졌다. 이러한 측면에서 본 연구에서는 소프트웨어 품질 평가를 위한 테스트 데이터 분석을 실시하였다. 데이터를 ISO/IEC 9126-2를 기반으로 하여 6가지 품질 특성, 즉 기능성, 신뢰성, 사용성, 유지보수성, 이식성, 효율성적인 측면에서 테스트 데이터를 분류하여 오류발생 빈도에 대한 차이분석을 실시한 결과 차이가 있는 것으로 조사되었다. 또한 소프트웨어를 테스트 하는데 소요되는 시험횟수와 시험날짜도 소프트웨어 종류에 따라서 차이가 있는 것으로 분석되었다. 그리고 각 품질 특성별 테스트 결과를 시험 일수를 예측할 수 있는 융합기술로 이용하기 위해서 회귀분석을 이용해서 가장 영향을 미치는 변인을 조사한 결과 기능성과 효율성이 영향을 미치는 변인으로 조사되었다.

데이터마이닝을 이용한 설문조사 및 분석 (Questionnaire Survey and Analysis Using Data Mining)

  • 박만희;채화성;신완선
    • 산업경영시스템학회지
    • /
    • 제25권5호
    • /
    • pp.46-52
    • /
    • 2002
  • Today's database system needs to collect huge amount of questionnaire that results from development of the information technology by the internet, so it has to be administrable. However, there are many difficulties concerned with finding analytic data or useful information in the high capacity-database. Data mining can solve these problems and utilize the database. Questionnaire analysis that uses data mining has drawn relevant patterns that did not look or was tended to overlook before. These patterns can be applied by a new business rule. The purpose of this research is to analyze the questionnaire results and to present the result that can help to make decision easily with data mining. Recognition and analysis about these techniques of data mining show suitable type of questionnaire survey. This research focus on the form of present composition and the model of suitable questionnaire to analyze the type of it. Also, the comparison between the actual questionnaire result and the conventional statistical analysis is examined.

인공위성 화상자료를 이용한 북한의 간척자원 조사 (Investigation on Tideland Reclamation Projects in North Korea using Satellite Image Data)

  • 조병진;이지근;안기원
    • 한국농공학회:학술대회논문집
    • /
    • 한국농공학회 1999년도 Proceedings of the 1999 Annual Conference The Korean Society of Agricutural Engineers
    • /
    • pp.175-180
    • /
    • 1999
  • The purpose of this study is to investigate on tideland recalamation project as a part of situation on farm land improvement measures in North Korea. By using satelite image data beyond the national boundaries, it makes possbile to analyze tideland reclamation projects, and owing to the developed software and procedure we can analyze data regardless of difference in data acquistion date. Satellite image data LANDSAT JEARS-1 data are mainly used, and analyzing software ER Mapper, ERDAS , IDRISI are used . Reclamation survey result made by the ministry of unification in 1994 were examined by means of remote sensing using satellite image data. The results are ; Completed and/or partly completed project are 24, 596ha and planned are about 142, 223 ha, 166, 819 ha in total. However, they already reported about 300 thousand ha would be reclamined from the sea in early 1980.

  • PDF

A Development of LDA Topic Association Systems Based on Spark-Hadoop Framework

  • Park, Kiejin;Peng, Limei
    • Journal of Information Processing Systems
    • /
    • 제14권1호
    • /
    • pp.140-149
    • /
    • 2018
  • Social data such as users' comments are unstructured in nature and up-to-date technologies for analyzing such data are constrained by the available storage space and processing time when fast storing and processing is required. On the other hand, it is even difficult in using a huge amount of dynamically generated social data to analyze the user features in a high speed. To solve this problem, we design and implement a topic association analysis system based on the latent Dirichlet allocation (LDA) model. The LDA does not require the training process and thus can analyze the social users' hourly interests on different topics in an easy way. The proposed system is constructed based on the Spark framework that is located on top of Hadoop cluster. It is advantageous of high-speed processing owing to that minimized access to hard disk is required and all the intermediately generated data are processed in the main memory. In the performance evaluation, it requires about 5 hours to analyze the topics for about 1 TB test social data (SNS comments). Moreover, through analyzing the association among topics, we can track the hourly change of social users' interests on different topics.

데이터처리전문기관의 역할 및 보안 강화방안 연구: 버몬트주 데이터브로커 비교를 중심으로 (A Study on the Role and Security Enhancement of the Expert Data Processing Agency: Focusing on a Comparison of Data Brokers in Vermont)

  • 김수한;권헌영
    • 한국IT서비스학회지
    • /
    • 제22권3호
    • /
    • pp.29-47
    • /
    • 2023
  • With the recent advancement of information and communication technologies such as artificial intelligence, big data, cloud computing, and 5G, data is being produced and digitized in unprecedented amounts. As a result, data has emerged as a critical resource for the future economy, and overseas countries have been revising laws for data protection and utilization. In Korea, the 'Data 3 Act' was revised in 2020 to introduce institutional measures that classify personal information, pseudonymized information, and anonymous information for research, statistics, and preservation of public records. Among them, it is expected to increase the added value of data by combining pseudonymized personal information, and to this end, "the Expert Data Combination Agency" and "the Expert Data Agency" (hereinafter referred to as the Expert Data Processing Agency) system were introduced. In comparison to these domestic systems, we would like to analyze similar overseas systems, and it was recently confirmed that the Vermont government in the United States enacted the first "Data Broker Act" in the United States as a measure to protect personal information held by data brokers. In this study, we aim to compare and analyze the roles and functions of the "Expert Data Processing Agency" and "Data Broker," and to identify differences in designated standards, security measures, etc., in order to present ways to contribute to the activation of the data economy and enhance information protection.

패키징(Packaging) 분야에서의 빅데이터(Big data) 적용방안 연구 (Study on Application of Big Data in Packaging)

  • 강욱건;고의석;심원철;이학래;김재능
    • 한국포장학회지
    • /
    • 제23권3호
    • /
    • pp.201-209
    • /
    • 2017
  • 패키징 분야도 4차 산업혁명에 발 맞춰 IoT (Internet of Things), 빅데이터, 클라우드 및 소비자 기반 기술 등이 적용되어 스마트 패키징이 등장하고 있다. 정책, 예측, 마케팅, 디자인 등 다양한 분야에서 빅데이터 분석이 활용되고 있지만 패키징 분야에서의 연구는 아직 초보적 수준이다. 따라서 본 연구는 빅데이터를 패키징 분야에 적용하기 위해 선행연구과 관련서적을 통해 빅데이터의 정의와 연구에서 활용되는 데이터 수집, 저장, 분석방법을 정리하였고 패키징 분야에 적용할 수 있는 분석방법을 제시하였다. 오늘날 패키징 분야는 마케팅적 요소를 요구받고 있기 때문에 패키징에 대한 소비자의 인식을 파악할 필요가 있으며 빅데이터의 근원이 되는 5가지 데이터 중 사유데이터(private data)와 커뮤니티 데이터(community data)를 활용하여 소비자와 제품 간의 상호작용 분석하는데 활용하고자 한다. 패키징은 소비자의 관심을 끌기 위한 전략전인 도구로 사용되며 소비자의 구매위험을 줄이는 수단이 되기 때문에 패키징에 대한 소비자의 인식을 분석할 필요가 있다. 본 연구에서는 제품 개선을 위한 문제점 도출 과정에서 의미연결망 분석(Semantic Network Analysis)과 텍스트마이닝(Text mining)을 활용하여 제품을 구성하는 다양한 요소들을 파악하고 패키징 요소의 빈도분석을 거쳐 패키징의 영향력을 확인하는 방안과 저관여 제품을 대상으로 텍스트 마이닝(Text mining)과 오피니언 마이닝(Opinion Mining), 소셜 네트워크 분석(Social Network Analysis)을 통해 패키징에 대한 감정분석을 하여 동일한 제품군에서 소비자가 선호하는 패키징을 도출하는 방안을 제시하였다. 패키징은 제품을 구성하는 많은 요소들 중 하나이기 때문에 패키징이라는 단일 요소의 영향력을 파악하기란 쉽지 않지만 본 연구는 빅데이터를 활용하여 패키징에 대한 소비자의 인식과 감정을 분석하고 제품에서 패키징이 소비자에게 미치는 영향력을 분석할 수 있는 방안을 제시한 데 의의가 있다.