• Title/Summary/Keyword: 데이터 분석론

Search Result 1,370, Processing Time 0.032 seconds

An Operating Methodology of SPC System in LCD Industries (LCD 산업에서 SPC 시스템의 운영방법론)

  • Nam, Ho-Soo;Lee, Hyun-Woo;Choi, B.W.
    • Proceedings of the Korean Operations and Management Science Society Conference
    • /
    • 2005.05a
    • /
    • pp.387-392
    • /
    • 2005
  • 본 논문에서는 LCD 공정관리에서 SPC 시스템의 주요내용 및 운영방법론을 논하고자 한다. 주요내용으로는 실시간 프로세스 모니터링 방법론, 유의차분석 방법론, 이상데이터의 분석, 공정능력의 분석, 관리도 및 결과의 조회 등을 들 수 있다. 또한, TFT-LCD 공정을 크게 Fab 공정인 TFT 공정, LC 공정 및 Module 공정으로 나누어 각 공정에서의 중요한 특성과 관리방법론을 제시하고자 한다.

  • PDF

A Big Data Analysis Methodology for Examining Emerging Trend Zones Identified by SNS Users: Focusing on the Spatial Analysis Using Instagram Data (SNS 사용자에 의해 형성된 트렌드 중심지 도출을 위한 빅 데이터 분석 방법론 연구: 인스타그램 데이터 활용 공간분석을 중심으로)

  • Il Sup Lee;Kyung Kyu Kim;Ae Ri Lee
    • Information Systems Review
    • /
    • v.20 no.2
    • /
    • pp.63-85
    • /
    • 2018
  • Emerging hotspot and trendy areas are formed into alleys and blocks with the help of viral effects among social network services (SNS) users called "Golmogleo." These users search for every corner of the alleys to share and promote their own favorite places through SNS. An analysis of hot places is limited if it is only based on macroeconomic indicators such as commercial area data published by national organizations, large-scale visiting facilities, and commuter figures. Careful analyses based on consumers' actual activities are needed. This study develops a "social big data analysis methodology" using Instagram data, which is one of the most popular SNSs suitable to identify recent consumer trends. We build a spatial analysis model using Local Moran's I. Results show that our model identifies new trend zones on the basis of posting data in Instagram, which are not included in the commercial information prepared by national organizations. The proposed analysis methodology enables better identification of the latest trend areas formulated by SNS user activities. It also provides practical information for start-ups, small business owners, and alley merchants for marketing purposes. This analytical methodology can be applied to future studies on social big data analysis.

Advancing Societal Statistics Processing Methodology through Artificial Intelligence: A Case Study on Household Trend Survey and Time Use Survey (인공지능 기반 사회 통계 생산 방법론 고도화 방안: 가계동향조사와 생활시간조사 사례)

  • Kyo-Joong Oh;Ho-Jin Choi;Ilgu Kim;Seungwoo Han;Kunsoo Kim
    • Annual Conference on Human and Language Technology
    • /
    • 2023.10a
    • /
    • pp.563-567
    • /
    • 2023
  • 본 연구는 한국 통계청이 수행하는 가계동향조사와 생활시간조사에서 자료처리 과정 및 방법을 혁신하려는 시도로, 기존의 통계 생산 방법론의 한계를 극복하고, 대규모 데이터의 효과적인 관리와 분석을 가능하게 하는 인공지능 기반의 통계 생산을 목표로 한다. 본 연구는 데이터 과학과 통계학의 교차점에서 진행되며, 인공지능 기술, 특히 자연어 처리와 딥러닝을 활용하여 비정형 텍스트 분류 방법의 성능을 검증하며, 인공지능 기반 통계분류 방법론의 확장성과 추가적인 조사 확대 적용의 가능성을 탐구한다. 이 연구의 결과는 통계 데이터의 품질 향상과 신뢰성 증가에 기여하며, 국민의 생활 패턴과 행동에 대한 더 깊고 정확한 이해를 제공한다.

  • PDF

BackTranScription (BTS)-based Jeju Automatic Speech Recognition Post-processor Research (BackTranScription (BTS)기반 제주어 음성인식 후처리기 연구)

  • Park, Chanjun;Seo, Jaehyung;Lee, Seolhwa;Moon, Heonseok;Eo, Sugyeong;Jang, Yoonna;Lim, Heuiseok
    • Annual Conference on Human and Language Technology
    • /
    • 2021.10a
    • /
    • pp.178-185
    • /
    • 2021
  • Sequence to sequence(S2S) 기반 음성인식 후처리기를 훈련하기 위한 학습 데이터 구축을 위해 (음성인식 결과(speech recognition sentence), 전사자(phonetic transcriptor)가 수정한 문장(Human post edit sentence))의 병렬 말뭉치가 필요하며 이를 위해 많은 노동력(human-labor)이 소요된다. BackTranScription (BTS)이란 기존 S2S기반 음성인식 후처리기의 한계점을 완화하기 위해 제안된 데이터 구축 방법론이며 Text-To-Speech(TTS)와 Speech-To-Text(STT) 기술을 결합하여 pseudo 병렬 말뭉치를 생성하는 기술을 의미한다. 해당 방법론은 전사자의 역할을 없애고 방대한 양의 학습 데이터를 자동으로 생성할 수 있기에 데이터 구축에 있어서 시간과 비용을 단축 할 수 있다. 본 논문은 BTS를 바탕으로 제주어 도메인에 특화된 음성인식 후처리기의 성능을 향상시키기 위하여 모델 수정(model modification)을 통해 성능을 향상시키는 모델 중심 접근(model-centric) 방법론과 모델 수정 없이 데이터의 양과 질을 고려하여 성능을 향상시키는 데이터 중심 접근(data-centric) 방법론에 대한 비교 분석을 진행하였다. 실험결과 모델 교정없이 데이터 중심 접근 방법론을 적용하는 것이 성능 향상에 더 도움이 됨을 알 수 있었으며 모델 중심 접근 방법론의 부정적 측면 (negative result)에 대해서 분석을 진행하였다.

  • PDF

Data Visualization Analysis Tool for Service Design (서비스디자인을 위한 데이터 시각화 분석 도구)

  • Nam, you-seon;Ha, kwang-soo
    • Proceedings of the Korea Contents Association Conference
    • /
    • 2019.05a
    • /
    • pp.69-70
    • /
    • 2019
  • 서비스디자인 분야의 확장에 따라 서비스디자인 대상이 광범위해지면서 상황에 따른 적절한 방법론 선정이 어려워지고 있다. 본 연구에서는 수집된 다양한 데이터를 유형화하는 단계에서 데이터의 특성에 따라 서비스디자이너의 주관이 개입될 확률이 크다는 문제를 해결하기 위해 분석의 정확성을 높이기 위해 벤 다이어그램 활용을 제안하였다. 그 과정에서 기존에 많이 사용되고 있는 $2{\times}2$ 매트릭스 방법론과 벤 다이어그램을 비교하여 $2{\times}2$ 매트릭스의 한계를 지적하고, 보완된 형태의 벤 다이어그램을 3가지로 제안하고 검증하였다.

  • PDF

Bigdata Analysis Project Development Methodology (빅데이터 분석 프로젝트 수행 방법론)

  • Kim, Hyoungrae;Jeon, Do-hong;Jee, Sunghyun
    • Journal of the Korea Society of Computer and Information
    • /
    • v.19 no.3
    • /
    • pp.73-85
    • /
    • 2014
  • As the importance of big data analysis increases to improve the competitiveness of a corporate, a unified big data project development methodology is required in order to study the problem of a corporate in a systematic way and evaluate the problem w.r.t. a business value after solving the problem. This paper propose Scientific Data Anslysis and Development methodology(SDAD) which are integrated methodology of software development and project management for easier application into a field project. SDAD consisits of 6 stages(problem definition stage, data preparation stage, model design stage, model development stage, result extraction stage, service development state), each stages has detailed processes(47) and productions(93). SDAD, furthermore, unified previous ISP, DW, SW development methodologies in terms of the data analysis and can easily interchange the productions with them. This paper, lastly, introduces a way to assign responsible persons for each process and provide communication procedures in RACI chart to improves the efficiency of the interaction among professionals from different subjects. SDAD is applied to a Bigdata project in Korea Employment Information Services institution and the result turned out to be acceptable when evaluated by the supervision.

A data mining approach for river discharge and water quality in domestic rivers (국내하천 유량 및 수질 변화 분석을 위한 데이터마이닝적 접근)

  • Jungsun Oh
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2023.05a
    • /
    • pp.500-500
    • /
    • 2023
  • 국내하천은 홍수기에 강수량이 집중되고 하상계수가 높으며 평균경사도도 비교적 큰 특징을 지닌다. 따라서 유량이 빠르게 집중될 수 있는 상황이 빈번하게 발생한다. 이러한 특징을 감안하여 하천의 수질을 관리하기 위해서는 유량과 수질의 상호적인 관계를 규명하는 것이 중요하다. 유량과 수질의 관계를 분석하고 예측하는 방법으로는 물리적 예측모형과 확률론적 예측모형을 이용하는 방법이 있다. 물리적 예측모형을 활용하여 하천의 유량 및 수질을 예측하는 방법은 주어진 지형과 시간의 변화에 따른 유량 및 수질 변화를 예측함으로써 특정 상황에서의 수질 변화를 규명하기에 적절하다. 한편, 풍수기, 갈수기 등 전반적인 유량의 변화에 따라 나타나는 수질변화의 특성을 규명하기 위해서는 수질과 유량 간의 상관관계 분석이 필요하다. 수질과 유량 간의 상관관계를 규명하는 목적일 경우, 물리적 예측모형은 효율성이 낮고, 충분한 데이터 확보가 전제된 상태에서의 확률론적 예측모형은 다각도 분석 및 신뢰성 확보가 가능한 장점이 있다. 그 일환으로 본 연구에서는 확률론적 접근에 기반하여 국내하천에서 수질과 유량 간의 관계를 먼저 분석하고자 한다. 데이터 마이닝 결과, 수질변화에 가장 영향이 큰 인자 및 요인이 추출되며, 이는 효과적인 수질관리 방안을 모색하는 데에 활용될 수 있을 것으로 기대된다.

  • PDF

Utilizing Large Language Models(LLM) for Efficient Online Price Index Development and Statistical Data Processing (대규모 언어모델 활용을 통한 통계자료 처리 및 온라인 가격지표 개발 방법론 연구)

  • Kyo-Joong Oh;Ho-Jin Choi;Hyeongak Ahn;Ilgu Kim;Wonseok Cha
    • Annual Conference on Human and Language Technology
    • /
    • 2023.10a
    • /
    • pp.101-104
    • /
    • 2023
  • 본 연구는 현대 사회에서 빅데이터의 중요성이 강조되는 가운데, 온라인 시장의 확장과 소비자들의 다양한 소비 행태 변화를 반영한 가격지표 개발을 목표로 한다. 통계청의 기존 통계조사 방법론에 대한 한계를 극복하고, 온라인 쇼핑몰 데이터에서 필요한 정보를 추출하고 가공하기 위해 대규모 언어 모델(LLM)을 활용한 인공지능 기술을 적용해보고자 한다. 초기 연구 결과로 공개 Polyglot을 활용하여 비정형 자료 처리와 품목분류에 응용해 보았으며, 제한된 학습 데이터를 사용하여도 높은 정확도의 처리 결과를 얻을 수 있었으며, 현재는 적용 품목을 확장하여 더욱 다양한 품목에 방법론을 적용하는 연구를 진행 중이다.

  • PDF

An In-depth Analysis on Traffic Flooding Attacks Detection using Association Rule Mining (연관관계규칙을 이용한 트래픽 폭주 공격 탐지의 심층 분석)

  • Jaehak Yu;Bongsu Kang;Hansung Lee;Jun-Sang Park;Myung-Sup Kim;Daihee Park
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2008.11a
    • /
    • pp.1563-1566
    • /
    • 2008
  • 본 논문에서는 데이터의 전처리과정으로 SNMP MIB 데이터에 대한 속성 부분집합의 선택 방법(attribute subset selection)을 사용하여 특징선택 및 축소(feature selection & reduction)를 실시하였다. 또한 데이터 마이닝의 대표적인 해석학적 분석 모델인 연관관계규칙기법(association rule mining)을 이용하여 트래픽 폭주 공격 및 공격유형별 SNMP MIB 데이터에 내재되어 있는 특징들을 규칙의 형태로 추출하여 분석하는 의미론적 심층해석을 실시하였다. 공격유형에 대한 패턴 규칙의 추출 및 분석은 공격이 발생한 프로토콜에 대해서만 서비스를 제한하고 관리할 수 있는 정책적 근거를 제공함으로써 보다 안정적인 네트워크 환경과 원활한 자원관리를 지원할 수 있다. 본 논문에서 제시한 트래픽 폭주 공격 및 공격유형별 데이터로부터의 자동적 특징의 규칙 추출 및 의미론적 해석방법은 침입탐지 시스템을 위한 새로운 방법론에 모멘텀을 제시할 수 있다는 긍정적인 가능성과 함께 침입탐지 및 대응시스템의 정책 수립을 지원할 수 있을 것으로 기대된다.

Methodology of Local Government Policy Issues Through Big Data Analysis (빅데이터 분석을 통한 지방자치단체 정책이슈 도출 방법론)

  • Kim, Yong-Jin;Kim, Do-Young
    • The Journal of the Korea Contents Association
    • /
    • v.18 no.10
    • /
    • pp.229-235
    • /
    • 2018
  • The purpose of this study is to propose a method to utilize Big Data Analysis to find policy issues of local governments in the reality that utilization of big data becomes increasingly important in efficient and effective policy making process. For this purpose, this study analyzed the 180,000 articles of Suwon city for the past three years and identified policy issues and evaluated policy priorities through IPA analysis. The results of this study showed that the analysis of semi-formal big data through newspaper articles is effective in deriving the differentiated policy issues of different local autonomous bodies from the main issues in the nation, In this way, the methodology of finding policy issues through the analysis of big data suggested in this study means that local governments can effectively identify policy issues and effectively identify the people. In addition, the methodology proposed in this study is expected to be applicable to the policy issues through the analysis of various semi - formal and informal big data such as online civil complaint data of the local government, resident SNS.