• 제목/요약/키워드: Data Mining Technique

검색결과 638건 처리시간 0.029초

현대 소비자의 공간소비행동에 관한 연구 -소셜미디어 데이터 분석을 중심으로- (A Study on Space Consumption Behavior of Contemporary Consumers -Focusing on Analysis of Social Media Big Data-)

  • 안서영;고애란
    • 한국의류학회지
    • /
    • 제44권5호
    • /
    • pp.1019-1035
    • /
    • 2020
  • This study examines the millennial generation, who express themselves and share information on social media after experiencing constantly changing 'hot places' (places of interest) in contemporary cities, with the goal of analyzing space consumption behaviors. Data were collected via an Instagram crawler application developed with Python 3.4 administered to 19,262 posts using the term 'hot places' from November 1 and December 15, 2019. Issues were derived from a text mining technique using Textom 2.0; in addition, semantic network analysis using Ucinet6 and the NetDraw program were also conducted. The results are as follows. First, a frequency analysis of keywords for hot places indicated words frequently found in nouns were related to food, local names, SNS and timing. Words related to positive emotions felt in experience, and words related to behavior in hot places appeared in predicate. Based on importance, communication is the most important keyword and influenced all issues. Second, the results of visualization of semantic network analysis revealed four categories in the scope of the definition of "hot place": (1) culinary exploration, (2) atmosphere of cafés, (3) happy daily life of 'me' expressed in images, (4) emotional photos.

스마트제조시스템의 설비인자 분석 (Analysis of Equipment Factor for Smart Manufacturing System)

  • 안재준;심현식
    • 반도체디스플레이기술학회지
    • /
    • 제21권4호
    • /
    • pp.168-173
    • /
    • 2022
  • As the function of a product is advanced and the process is refined, the yield in the fine manufacturing process becomes an important variable that determines the cost and quality of the product. Since a fine manufacturing process generally produces a product through many steps, it is difficult to find which process or equipment has a defect, and thus it is practically difficult to ensure a high yield. This paper presents the system architecture of how to build a smart manufacturing system to analyze the big data of the manufacturing plant, and the equipment factor analysis methodology to increase the yield of products in the smart manufacturing system. In order to improve the yield of the product, it is necessary to analyze the defect factor that causes the low yield among the numerous factors of the equipment, and find and manage the equipment factor that affects the defect factor. This study analyzed the key factors of abnormal equipment that affect the yield of products in the manufacturing process using the data mining technique. Eventually, a methodology for finding key factors of abnormal equipment that directly affect the yield of products in smart manufacturing systems is presented. The methodology presented in this study was applied to the actual manufacturing plant to confirm the effect of key factors of important facilities on yield.

DISEASE FORECAST USING MACHINE LEARNING ALGORITHMS

  • HUSSAIN, MOHAMMED MUZAFFAR;DEVI, S. KALPANA
    • Journal of applied mathematics & informatics
    • /
    • 제40권5_6호
    • /
    • pp.1151-1165
    • /
    • 2022
  • Key drive of information quarrying is to digest liked information starting possible information. With the colossal amount of realities kept in documents, information bases, and stores, in the medical care area, it's inexorably significant, assuming excessive, arising compelling resources aimed at examination besides comprehension like information on behalf of the withdrawal of gen that might assistance in independent direction. Classification is method in information mining; it's characterized as per private, passing on item toward a specific course established happening it is likeness toward past instances of different substances trendy the data collection. In pre-owned recycled four Classification algorithm that incorporate Multi-Layer perception, KSTAR, Bayesian Network and PART to fabricate the grouping replicas arranged the malaria data collection and analyze the replicas, degree their exhibition through Waikato Environment for Knowledge Analysis introduced to Java Development Kit 8, then utilizations outfit's technique trendy promoting presentation of the arrangement methodology. The outcome perceived that Bayesian Network return most elevated exactness of 50.05% when working on followed by Multi-Layer perception, with 49.9% when helping is half, then, at that point, Kstar with precision of 49.44%, 49.5% when supporting individually and PART have lesser precision of 48.1% when helping, The exploration recommended that Bayesian Network is awesome toward remain utilized on Malaria data collection in our sanatoriums.

Decision support system for underground coal pillar stability using unsupervised and supervised machine learning approaches

  • Kamran, Muhammad;Shahani, Niaz Muhammad;Armaghani, Danial Jahed
    • Geomechanics and Engineering
    • /
    • 제30권2호
    • /
    • pp.107-121
    • /
    • 2022
  • Coal pillar assessment is of broad importance to underground engineering structure, as the pillar failure can lead to enormous disasters. Because of the highly non-linear correlation between the pillar failure and its influential attributes, conventional forecasting techniques cannot generate accurate outcomes. To approximate the complex behavior of coal pillar, this paper elucidates a new idea to forecast the underground coal pillar stability using combined unsupervised-supervised learning. In order to build a database of the study, a total of 90 patterns of pillar cases were collected from authentic engineering structures. A state-of-the art feature depletion method, t-distribution symmetric neighbor embedding (t-SNE) has been employed to reduce significance of actual data features. Consequently, an unsupervised machine learning technique K-mean clustering was followed to reassign the t-SNE dimensionality reduced data in order to compute the relative class of coal pillar cases. Following that, the reassign dataset was divided into two parts: 70 percent for training dataset and 30 percent for testing dataset, respectively. The accuracy of the predicted data was then examined using support vector classifier (SVC) model performance measures such as precision, recall, and f1-score. As a result, the proposed model can be employed for properly predicting the pillar failure class in a variety of underground rock engineering projects.

빅데이터 기법을 활용한 직업훈련 요구분석 (Analysis of Vocational Training Needs Using Big Data Technique)

  • 성보경;유연우
    • 한국융합학회논문지
    • /
    • 제9권5호
    • /
    • pp.21-26
    • /
    • 2018
  • 본 연구는 고용노동부가 운영하는 직업훈련 통합전산망인 'HRD-NET(http://hrd.go.kr)'을 통해 구직자가 필요로 하는 직업훈련 정보 등이 원활하게 제공되고 있는지를 확인하기 위해 질문게시판을 빅데이터 기법에 가장 최적화된 'R'프로그램을 이용해서 추출하였다. 따라서, 이를 통해 직업훈련제도의 유효성, 적절성, 시각화, 빈도 분석, 연관분석 등을 실시하였으며, 연구결과는 다음과 같다. 첫째, 직업훈련 카드발급 및 동영상 시청, 공인인증서 문제, 등록오류 이 발견되었으며, 둘째, 내일배움카드에 대한 노동관서에서의 관리 및 처리절차가 복잡하고 까다로워 제도개선이 필요한 것으로 나타났다. 또한, 교육훈련의 수강에 있어 훈련직종 및 과정, 훈련기관에 따라서 차등화 된 훈련비 시스템과 환급구조가 애로요인으로 작용하는 것으로 분석되었다. 본 논문 기초로 하여 향후 고용노동부의 훈련시스템 뿐만 아니라 정부부처의 다양한 훈련 전산망시스템에 대한 전반적인 빅데이터 분석을 통한 개선점 등을 연구하고자 한다.

그래프 스트림 처리를 위한 점진적 빈발 패턴 기반 인-메모리 압축 기법 (In-memory Compression Scheme Based on Incremental Frequent Patterns for Graph Streams)

  • 이현병;신보경;복경수;유재수
    • 한국콘텐츠학회논문지
    • /
    • 제22권1호
    • /
    • pp.35-46
    • /
    • 2022
  • 최근 네트워크 기술 발전과 함께 IoT 및 소셜 네트워크 서비스의 활성화로 인해 많은 그래프 스트림 데이터가 생성되고 있다. 본 논문에서는 압축률 및 압축 시간에 대해 중점적으로 연구되던 기존의 압축 기법에 그래프 마이닝을 적용하여 스트림 그래프 환경을 함께 고려한 그래프 압축 기술을 제안한다. 또한, 최신 패턴을 유지하여 실시간으로 변화하는 스트림 그래프에서 압축 효율 및 처리속도를 향상시킨다. 본 논문에서는 그래프 스트림 처리를 위한 점진적 빈발 패턴 기반 압축 기법을 제안하였다. 제안하는 기법의 우수성을 보이기 위해 압축률과 처리시간을 기존기법과 비교하여 성능평가를 수행한다. 제안하는 기법은 그래프 데이터의 크기가 커질 때 중복되는 데이터가 많아져 기존 기법보다 빠른 처리속도를 보인다. 따라서, 빠른 처리가 요구되는 스트림 환경에서 제안하는 기법을 활용할 수 있다.

중소기업 프로파일링 분석을 통한 기술유출 방지 및 보호 모형 연구 (A Study on Empirical Model for the Prevention and Protection of Technology Leakage through SME Profiling Analysis)

  • 유인진;박도형
    • 한국정보시스템학회지:정보시스템연구
    • /
    • 제27권1호
    • /
    • pp.171-191
    • /
    • 2018
  • Purpose Corporate technology leakage is not only monetary loss, but also has a negative impact on the corporate image and further deteriorates sustainable growth. In particular, since SMEs are highly dependent on core technologies compared to large corporations, loss of technology leakage threatens corporate survival. Therefore, it is important for SMEs to "prevent and protect technology leakage". With the recent development of data analysis technology and the opening of public data, it has become possible to discover and proactively detect companies with a high probability of technology leakage based on actual company data. In this study, we try to construct profiles of enterprises with and without technology leakage experience through profiling analysis using data mining techniques. Furthermore, based on this, we propose a classification model that distinguishes companies that are likely to leak technology. Design/methodology/approach This study tries to develop the empirical model for prevention and protection of technology leakage through profiling method which analyzes each SME from the viewpoint of individual. Based on the previous research, we tried to classify many characteristics of SMEs into six categories and to identify the factors influencing the technology leakage of SMEs from the enterprise point of view. Specifically, we divided the 29 SME characteristics into the following six categories: 'firm characteristics', 'organizational characteristics', 'technical characteristics', 'relational characteristics', 'financial characteristics', and 'enterprise core competencies'. Each characteristic was extracted from the questionnaire data of 'Survey of Small and Medium Enterprises Technology' carried out annually by the Government of the Republic of Korea. Since the number of SMEs with experience of technology leakage in questionnaire data was significantly smaller than the other, we made a 1: 1 correspondence with each sample through mixed sampling. We conducted profiling of companies with and without technology leakage experience using decision-tree technique for research data, and derived meaningful variables that can distinguish the two. Then, empirical model for prevention and protection of technology leakage was developed through discriminant analysis and logistic regression analysis. Findings Profiling analysis shows that technology novelty, enterprise technology group, number of intellectual property registrations, product life cycle, technology development infrastructure level(absence of dedicated organization), enterprise core competency(design) and enterprise core competency(process design) help us find SME's technology leakage. We developed the two empirical model for prevention and protection of technology leakage in SMEs using discriminant analysis and logistic regression analysis, and each hit ratio is 65%(discriminant analysis) and 67%(logistic regression analysis).

빅데이터 분석을 통한 데이터 3법 인식에 관한 연구 (A Study on the Perception of Data 3 Act through Big Data Analysis)

  • 오정주;이환수
    • 융합보안논문지
    • /
    • 제21권2호
    • /
    • pp.19-28
    • /
    • 2021
  • 산업의 디지털 전환을 촉진하고 혁신을 가속화하고자 우리나라는 디지털 뉴딜 정책을 추진하고 있다. 그러나 엄격한 기존의 데이터 관련 법제 하에서는 디지털 뉴딜정책을 위한 산업계의 데이터 활용에 여전히 제약이 있는 상황이다. 이러한 문제를 해결하기 위해서 데이터 3법 개정안이 발의되었으나 실제로 산업계의 데이터 이용 활성화에 어떠한 영향을 미칠지에 대한 논의는 아직 부족한 상황이다. 이에 본 연구에서는 데이터 3법에 대한 여론의 인식을 분석하여 데이터 3법 개정안의 시사점을 분석하고자 한다. 이를 위하여 데이터 3법 개정안과 관련 연구동향을 분석하고, 빅데이터 분석 기법을 이용하여 데이터 3법에 대한 인식을 분석하였다. 분석결과에 따르면 데이터 3법은 개정 취지에 부합하게 데이터 산업 활성화를 촉진하는 반면에 특정산업 분야에 치중될 우려가 있는 것으로 나타났다. 본 연구의 결과는 빅데이터 분석을 통해 시행 초기인 데이터 3법의 산업영향에 대한 온라인 인식을 분석함으로써 향후 개선방안에 대한 시사점을 제공한다는 점에서 의의가 있다.

지반변형측정을 위한 TDR기술의 적용 (Application of Time Domain Reflectometry to the Monitoring of Ground Defromation)

  • 이우진;김용진;이원제;이웅주
    • 한국지반환경공학회 논문집
    • /
    • 제4권2호
    • /
    • pp.15-25
    • /
    • 2003
  • TDR기술은 원격감지식 전기적 측정기술로서 여러 가지 물리적 변화량에 대하여 그 변화위치와 상태를 결정하는데 이용되어 왔으며, 미국과 호주 등지의 광산에서 주로 적용되던 TDR기술은 90년대 초반부터 토목공학에 응용되기 시작하였으며 산사태나 암반사면의 변형 파악, 지반의 함수비 변화 모니터링, 지반 오염물질의 종류 및 이동경로의 추정, 지하수위의 변동측정등에 사용되고 있다. 국내에서는 1996년부터 강원도 통리지역, 고사리 일대 등에 산재한 채굴적의 붕락으로 인한 지반침하의 가능성을 판단하기 위해 TDR을 설치/운용한 것이 우리나라 토목분야에서의 최초 적용사례이다. 본 논문에서는 강원도 태백시 추전지역 일대에서 기 개발된 석탄채굴적에 의한 철도선로, 터널 및 도로 등의 변형 안정성을 분석키 위해 TDR기술을 적용한 결과로부터 지반변형 계측기법으로서의 TDR기술의 활용성을 고찰하였다.

  • PDF

공공 빅데이터의 시각화를 위한 InfograaS의 아이디어 제안 (Idea proposal of InfograaS for Visualization of Public Big-data)

  • 차병래;이형호;심수정;김종원
    • 한국항행학회논문지
    • /
    • 제18권5호
    • /
    • pp.524-531
    • /
    • 2014
  • 본 논문에서는 클라우드 컴퓨팅 자원을 이용하여 빅데이터의 일종인 LOD (linked open data)를 가공 및 분석하는 방법을 제안한다. LOD는 공공 데이터를 공유 및 재활용하기 위한 웹기반의 오픈 데이터이다. 특히 BA(business analytics)와 Info-graphic을 위한 시각화 (visualization) 기술을 제공하는 새로운 SaaS (software as a service) 비즈니스 영역을 InforgraaS (Info-graphic as a service)라고 정의한다. 본 연구의 목표는 시각화 및 비즈니스 전문가 없이 비전문가 또는 초보자가 사용할 수 있도록 하는 것이다. 데이터 시각화 (data visualization)는 데이터 분석 결과를 쉽게 이해할 수 있도록 시각적으로 표현하고 전달되는 과정을 말한다. 데이터 시각화의 목적은 챠트와 그래프를 통해 정보를 명확하고 효과적으로 전달하는 것이다. 공공기관의 빅데이터를 클라우드 컴퓨팅 자원과 오픈 소스인 하둡, R, 기계학습, 데이터 마이닝 등을 이용하여 다양한 처리 결과를 이해하기 쉬운 그래픽 또는 챠트로 표현하고 공유한다.