• 제목/요약/키워드: Hot 데이터

검색결과 374건 처리시간 0.028초

데이터 마이닝 기반의 6 시그마 방법론 : 철강산업 적용사례 (A Six Sigma Methodology Using Data Mining : A Case Study of "P" Steel Manufacturing Company)

  • 장길상
    • 한국정보시스템학회지:정보시스템연구
    • /
    • 제20권3호
    • /
    • pp.1-24
    • /
    • 2011
  • Recently, six sigma has been widely adopted in a variety of industries as a disciplined, data-driven problem solving approach or methodology supported by a handful of powerful statistical tools in order to reduce variation through continuous process improvement. Also, data mining has been widely used to discover unknown knowledge from a large volume of data using various modeling techniques such as neural network, decision tree, regression analysis, etc. This paper proposes a six sigma methodology based on data mining for effectively and efficiently processing massive data in driving six sigma projects. The proposed methodology is applied in the hot stove system which is a major energy-consuming process in a "P" steel company for improvement of heat efficiency through reduction of energy consumption. The results show optimal operation conditions and reduction of the hot stove energy cost by 15%.

소셜 네트워크에서 사용자의 영향력을 고려한 핫 토픽 예측 기법 (Hot Topic Prediction Scheme Considering User Influences in Social Networks)

  • 노연우;김대윤;한지은;육미선;임종태;복경수;유재수
    • 한국콘텐츠학회논문지
    • /
    • 제15권8호
    • /
    • pp.24-36
    • /
    • 2015
  • 최근 실시간으로 생성되는 대용량의 SNS 데이터로부터 유의미한 정보를 찾아내고 분석하는 것이 중요해지면서 핫 토픽 검출에 대한 관심도 크게 증가하고 있다. SNS 특성상 사전 확인이 이루어지지 않은 불특정 다수의 글들을 대상으로 하기 때문에 이 글들을 대상으로 핫 토픽을 예측했을 때 결과의 신뢰성이 저하된다는 문제점이 있다. 이를 해결하기 위하여 본 논문에서는 소셜 네트워크에서 사용자의 영향력을 고려한 신뢰성 높은 핫 토픽 예측 기법을 제안한다. 트위터를 기반으로 변형된 TF-IDF 알고리즘을 통하여 순간적으로 많이 이슈화되는 키워드 후보 집합을 추출하고, 트윗에 사용자 영향력을 가중치로 부여함으로써 핫 토픽 예측 결과의 신뢰성을 높인다. 제안하는 기법의 우수성을 보이기 위해 기존 기법과 제안하는 기법의 성능평가를 수행한다. 성능평가 결과, 제안하는 기법은 기존 기법에 비해 정확도, 재현율 모두 향상됨을 확인하였다.

중대형 단일추진제 추력기 성능평가를 위한 진공연소시험설비 개발 (Hot-Fire Test Facility for Medium-scale Monopropellant Thruster Evaluation)

  • 김인태;이준희;이재원;이원복;김수겸;채종원;유명종
    • 한국추진공학회:학술대회논문집
    • /
    • 한국추진공학회 2011년도 제37회 추계학술대회논문집
    • /
    • pp.336-339
    • /
    • 2011
  • 추력기의 개발단계에 있어 시험평가에 필요한 연소시험설비는 가장 중요한 인프라자원 중의 하나이다. 지난 3년여의 기간동안, 한국항공우주연구원과 (주)한화는 최대 200N 레벨까지 시험평가를 수행할 수 있는 진공시험설비를 설계 및 구축 완료하였다. 시험설비는 우주환경을 모사할 수 있는 진공시스템, 연료를 공급해주기 위한 시스템, 데이터 계측 및 제어시스템 등으로 구성된다. 이러한 시험설비의 최종목표는 위성용 추력기뿐만 아니라 발사체 및 달탐사선에 적용가능한 중대형급 추력기를 개발 및 시험평가하기 위함이며 본 논문에 이에 대한 세부내용 및 시험결과를 제시하였다.

  • PDF

전자상거래 시스템에서 빅 데이터의 분석 및 결과 활용에 미치는 영향요소 분석 (Analysis on Major Factors for Analysis & Application of Big Data in Electrical Commercial System)

  • 양후열;나철훈
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2016년도 춘계학술대회
    • /
    • pp.373-375
    • /
    • 2016
  • 전 세계적으로 스마트 환경의 발전에 따라 데이터의 폭발적인 증가로 인해 빅 데이터의 분석이 각광을 받고 있다. 금융, 유통, 제조, 재난 등 빅 데이터의 활용 분야에서 분석 및 활용에 대한 결과 활용이 중요하게 언급되고 있다. 본 연구에서는 전자상거래 시스템에서 빅 데이터의 성숙도 조사 결과를 기반으로 Business Process에 미치는 영향을 분석하여 데이터 분석 및 이의 활용에 미치는 영향 요소를 제시하고자 한다.

  • PDF

나이브 베이즈 분류 기반의 핫 데이터 구분 기법 (Hot Data Identification based on Naive Bayes Classifier)

  • 이혜림;윤이빈;박동철
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2022년도 추계학술발표대회
    • /
    • pp.721-723
    • /
    • 2022
  • 최근 낸드 플래시 메모리 기반의 Solid State Drive(SSD)가 기존 Hard Disk Drive(HDD)를 대신하여 개인용과 산업용으로도 널리 쓰이고 있다. 핫 데이터 구분 기법은 이러한 SSD 의 성능과 수명에 중요한 역할을 하는 Garbage Collection(GC)과 Wear Leveling(WL) 기술의 기반이 된다. 본 논문에서는 핫 데이터를 예측하기 위한 나이브 베이즈 분류 기반의 새로운 핫 데이터 구분 기법을 제안한다. 제안 기법은 워크로드 액세스 패턴의 학습 단계인 초기 단계와 실제 운영 단계를 통해 다시 액세스 될 확률이 높은 데이터를 그렇지 않은 데이터와 효과적으로 구분한다. 다양한 실제 trace 기반 실험을 통해 본 제안 기법이 기존 대표적인 기법보다 평균 19.3% 높은 성능을 확인했다.

맵리듀스의 처리 속도 향상을 위한 데이터 접근 패턴에 따른 핫-데이터 복제 기법 (A Hot-Data Replication Scheme Based on Data Access Patterns for Enhancing Processing Speed of MapReduce)

  • 손인국;류은경;박준호;복경수;유재수
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2013년도 춘계 종합학술대회 논문집
    • /
    • pp.11-12
    • /
    • 2013
  • 최근 대규모 데이터의 처리와 관리를 위한 분산 저장 및 처리 시스템의 연구 및 활용이 중요해지고 있다. 대표적인 분산 저장 및 처리시스템으로써 하둡(Hadoop)이 널리 활용되고 있다. 하둡 분산 파일 시스템을 기반으로 수행되는 맵-리듀스에서 테스크 할당은 데이터의 로컬리티를 고려하여 최대한 가깝게 할당한다. 하지만 맵-리듀스에서의 데이터 분석 작업에서 작업 형태에 따라 빈번하게 요청되는 데이터가 존재한다. 이러한 경우, 해당 데이터의 낮은 로컬리티로 인해 수행시간 증가 및 데이터 전송의 지연의 문제점을 야기 시킨다. 본 논문에서는 맵-리듀스의 처리 속도 향상을 위한 데이터 접근 패턴에 따른 핫-데이터 복제 기법을 제안한다. 제안하는 기법에서는 데이터 접근 패턴에 따라 높은 접근 빈도를 보이는 핫-데이터에 대한 복제본 최적화 알고리즘을 활용하여 데이터 로컬리티를 향상시키고 결과적으로 작업 수행시간을 감소시킨다. 제안하는 기법은 기존 기법에 비해 모든 노드의 데이터 이동이 감소하여 접근빈도의 분포가 균형적인 것을 확인하였다. 성능평가 결과, 기존 기법에 비해 접근 빈도의 부하가 약 8% 감소하는 것을 확인하였다.

  • PDF

토픽모델을 이용한 전력반도체 패키징 기술 동향 연구 (A Study on Technology Trend of Power Semiconductor Packaging using Topic model)

  • 박근서;최경현
    • 마이크로전자및패키징학회지
    • /
    • 제27권2호
    • /
    • pp.53-58
    • /
    • 2020
  • 전기자동차용 전력반도체 패키징 기술에 대한 분석을 수행하였다. 비정형 데이터인 특허들을 수집하여 유효특허를 도출하여 LDA 기법을 적용한 토픽모델링을 수행하였다. 20개의 토픽으로 분류하였고 각 토픽별 추출된 단어를 통해 기술에 대한 정의를 내렸다. 각 토픽의 대한 동향분석을 위해 연도별 빈도수에 대한 회귀분석을 통해 토픽별 Hot토픽과 Cold 토픽을 도출하여 전력반도체 패키징 기술의 동향을 분석하였다. Hot 토픽의 기술로는 내전압에 따른 패키지 구조 기술과 입출력 관련 제어 기술, 방열기술을 도출하였고 Cold 토픽 기술로는 인덕턴스 저감기술이 도출되었다.

니켈 기반 초합금 클래드 판재의 열간 압연 제조 공정 유한요소해석 (Finite Element Analysis of the Hot Rolled Cladding for the Ni-based Superalloy/steel Corrosion-resistant Alloy (CRA) Plate)

  • 김찬양;배성준;이현석;봉혁종;이광석
    • 소성∙가공
    • /
    • 제33권3호
    • /
    • pp.208-213
    • /
    • 2024
  • Ni-based superalloys have exceptional performance in high-temperature strength, corrosion resistance, etc, and it has been widely used in various applications that require corrosion resistance at high-temperature operations. However, the relatively expensive cost of the Ni-based superalloys is one of the major hurdles. The corrosion-resisted alloy(CRA) clad materials can be a cost-effective solution. In this study, finite element analysis of the hot rolling process for manufacturing of the Alloy 625/API X65 steel CRA clad plates is conducted. The stress-strain curves of the two materials are measured in compressive tests for various temperature and strain rate conditions, using the Gleeble tester. Then, strain hardening behavior is modeled following the modified Johnson-Cook model. Finite element analysis of the hot rolled cladding process is performed using this strain rate and temperature dependent hardening model. Finally, the thickness ratio of the CRA and base material is predicted and compared with experimental values.

스캔 통계량을 이용한 암 클러스터 탐색 (Cancer cluster detection using scan statistic)

  • 한준희;이민정
    • Journal of the Korean Data and Information Science Society
    • /
    • 제27권5호
    • /
    • pp.1193-1201
    • /
    • 2016
  • 공간 또는 시공간 데이터에서 다른 지역에 비해 유난히 높은 위험률을 보이는 소위 핫 스팟 (hot spot)으로 불리는 클러스터 (cluster)를 찾으려고 하는 경우가 많다. 기존의 많은 방법들은 이러한 클러스터 패턴이 존재하는지에 대한 해답만 주었지만, 최근의 많은 방법들은 클러스터의 위치, 모양, 크기뿐만 아니라 찾아진 클러스터가 통계적으로 유의한지까지 검정해준다. 본 논문에서는 이러한 다양한 방법 중 가장 많이 사용되는 클러스터 탐색 방법 중 하나인 스캔 통계량을 이용한 방법을 소개하고 그 방법이 구현된 무료 소프트웨어 SaTScan을 이용한 결과를 보여주고 장단점을 논하고자 한다. 미국 국립암센터의 SEER 프로그램에서 제공하는 미국의 각 카운티별 암 사망자 자료 중 2006년 여성 폐암 사망자 데이터를 예시 데이터로 사용하여 스캔 통계량을 이용하여 구한 클러스터 탐색 결과를 제시하고 비슷한 연구를 하고자는 연구자에게 도움을 주고자 한다.

공무원 직무 전문교육 만족도 예측을 위한 딥러닝 기반 회귀 모델 설계 (A Deep Learning-based Regression Model for Predicting Government Officer Education Satisfaction)

  • 오수민;윤성연;박민서
    • 문화기술의 융합
    • /
    • 제10권5호
    • /
    • pp.667-671
    • /
    • 2024
  • 공직자로서의 바람직한 가치관 확립과 공직의 전문성 향상을 위해 공무원의 직무 전문교육이 강조되고 있다. 만족도 높은 맞춤형 직무교육을 제공하기 위해 만족도에 영향을 미치는 요인을 분석한 연구들이 제안되고 있으나, 교육 내용을 활용하여 만족도를 예측한 연구는 부족한 실정이다. 따라서 본 연구는 교육 내용을 함께 고려해 공무원 직무 전문교육 만족도를 예측하는 딥러닝(Deep Learning) 모델을 제안한다. 제안 방법은 공무원 전문 교육과정 정보데이터를 활용한다. 우선 문자형으로 수집된 변수인 교육 대상, 교육 구분, 교육 형태를 원-핫 인코딩(One-hot Encoding)으로 카테고리화(Categorized)한다. 교육을 통해 학습할 수 있는 내용이 문자형으로 저장된 교육 내용을 TF-IDF(Term Frequency-Inverse Document Frequency)으로 수치화한다. 이를 딥러닝 기반의 회귀 모델로 학습하고, 10-겹 교차 검증(10-Fold Cross Validation)으로 모델의 성능을 검증한다. 본 연구의 제안 모델은 테스트 데이터에서 99.87%의 높은 예측 정확도를 보인다. 향후 본 연구를 고려한 맞춤형 교육 추천은 교육 대상에 최적화된 교육을 제공 및 개선하는 데에 도움이 될 것으로 기대한다.