• 제목/요약/키워드: SQL 분석

검색결과 234건 처리시간 0.026초

분석 CRM 실무자의 자연어 질의 처리를 위한 기업 데이터베이스 구성요소 인덱싱 방법론 (A PageRank based Data Indexing Method for Designing Natural Language Interface to CRM Databases)

  • 박성혁;황경서;이동원
    • CRM연구
    • /
    • 제2권2호
    • /
    • pp.53-70
    • /
    • 2009
  • 분석 CRM 영역에서는 고객 데이터 분석을 통하여 고객 행동과 관련된 통찰력을 얻는 것이 중요하다. 이러한 분석 과정에서, 사용자 스스로 기업 데이터베이스에서 대용량 고객 이력 데이터를 조회하고 추출하기 위해서는 SQL 을 사용하여 자유롭게 질의구문을 작성할 수 있어야 한다. 그런데 일반 사용자들이 이러한 업무를 수행하고자 할 때, 기업 데이터베이스 구성 요소에 대한 전문적인 지식이 부족하기 때문에 정보 탐색에 있어서 어려움을 겪는다. 이를 해결하기 위한 방안으로 본 연구에서는 사용자가 제공하는 자연어 수준의 질의를 분석하고, 데이터베이스를 구성하는 값을 중심으로 올바른 질의 결과를 제공하기 위한 데이터베이스 구성요소 인덱싱 방법론을 제안한다. 구체적으로 기업 데이터베이스를 구성하는 세 가지 요소인 관계, 속성, 값에 대한 정보를 읽어 들여 요약 정보에 대한 인덱스를 구성한 다음 사용자의 자연어 질의에서 분석된 의미 단위 별로 데이터베이스 요약 정보와 연결해주는 TableRank 기법을 소개한다. 실험용 데이터베이스를 대상으로 테스트를 수행한 결과, 사용자의 자연어 질의 결과가 데이터베이스를 구성하는 값 정보와 연결되는 것이 관찰되었다. 논문의 후반부에서는 자연어 질의를 자동적으로 처리하기 위한 선행 모듈 개발의 시사점을 정리하고, 향후 기업 데이터베이스 자동 검색 시스템으로 발전하기 위한 방안에 대해서도 설명한다.

  • PDF

효율적인 트윗 분석 시스템 설계 및 구현 방법 (An Efficient Method for Design and Implementation of Tweet Analysis System)

  • 최민석
    • 디지털융복합연구
    • /
    • 제13권2호
    • /
    • pp.43-50
    • /
    • 2015
  • 다양한 소셜 네트워크 서비스의 등장과 사용자의 급증으로 소셜 네트워크 상에서 생산되는 데이터가 급증하고 있다. 전파 속도가 빠르고 개인적 성향의 의견들을 많이 포함하고 있는 소셜 네트워크 데이터의 특성으로 이를 분석하여 다양한 방면으로 활용하려는 요구도 증가하고 있다. 이러한 요구에 부응하여 실시간으로 대용량 데이터를 분석 처리하기 위한 다양한 기술 및 서비스들이 등장하고 있지만, 단기간에 적은 비용으로 그것들을 적용하기에는 어려움이 따른다. 본 논문에서는 새로운 기술이나 서비스의 도입 없이 효과적으로 트윗을 분석하기 위한 시스템 설계 및 구현 방법을 제안한다. 리눅스 기반의 호스팅 서버에 MySQL 데이터베이스와 PHP 스크립트를 이용하여 트윗 데이터를 수집하고 분석하는 모니터링 시스템을 구축하여 제안된 방법을 검증하였다.

리눅스에 적용된 해시 및 암호화 알고리즘 분석 (Analysis of the Hashing and Encryption Algorithms Applied to the Linux)

  • 배유미;정성재;소우영
    • 한국항행학회논문지
    • /
    • 제20권1호
    • /
    • pp.72-78
    • /
    • 2016
  • 리눅스는 초창기부터 사용자 패스워드의 암호화를 위해 해시 알고리즘인 MD-5를 사용해 왔다. 최근 보안성이 강화된 패스워드 관리가 요구되면서 엔터프라이즈 리눅스 시스템에서는 MD-5보다 더욱 높은 신뢰성을 보이는 SHA-512 알고리즘을 사용하고 있다. 본 논문에서는 해시 및 암호화 알고리즘의 특징에 대해 비교 분석하고, 리눅스 사용자 정보의 관리 체제에 대해 알아본다. 이러한 분석을 기반으로 사용자 패스워드에 적용된 해시 알고리즘의 보안성에 대해 분석하고, 추가적으로 Apache, PHP, MySQL과 같은 공개 소프트웨어 파일 검증에 사용되는 해시 알고리즘 적용 사례를 분석한다. 마지막으로 관련 보안 도구인 John The Ripper를 분석하여 사용자 패스워드 관리를 통한 시스템 보안 강화 방법을 제시한다.

교육과정체계 수립을 위한 직무분석 시스템 구현 및 적용사레 분석 (System Implementation and Analysis of Job Analysis for University Curriculum)

  • 현승렬;이상정
    • 한국컴퓨터정보학회논문지
    • /
    • 제14권9호
    • /
    • pp.127-134
    • /
    • 2009
  • 대학이나 직업 훈련 교육 기관에서는 주문식 교육의 일환으로 산업체의 요구사항을 충족하는 교육 과정을 개발해서 교육을 실시하는 것이 필요하다. 따라서, 일반화된 교육과정 체계 도출을 위해 현존 직무수행에 필요한 능력을 분석해서 교육과정에 반영할 수 있도록 하는 직무분석 시스템이 요구되고 있다. 본 논문에서는 산업체의 요구에 부응하는 교육과정체계 개발을 위하여 DACUM(Developing A CurriculUM) 프로세스에 기반한 직무자의 작업기술의 확인과 교육과정 로드맵 작성 등의 일련의 프로세스를 구현하고 적용 사례를 분석한다. 제안된 시스템은 Java 와 MS Access 데이터베이스로 구현하고, 인터넷을 통해 MS SQL Server 로 구현된 중앙 데이터베이스에 직접 접속하여 작업이 가능하도록 구현한다.

락의 실제 : 멀티코어 상의 데이터베이스 성능 분석 (Locking in Practice : Performance of a Database System on a Multicore Machine)

  • 한혁
    • 한국콘텐츠학회논문지
    • /
    • 제14권8호
    • /
    • pp.22-29
    • /
    • 2014
  • 락은 멀티프로세서 환경에서 공유 데이터에 대한 접근을 안전하게 하는 잘 알려진 일반적인 방법이다. 1960년대에 상호 배제가 소개된 후에 많은 스핀락 알고리즘이 제안되었고 운영체제나 데이터베이스 시스템에 사용되어 왔다. 이 연구에서 고성능 멀티코어 시스템 상에서 락 알고리즘이 데이터베이스 시스템에 미치는 영향을 측정하였다. 평가를 위해 그 동안 멀티코어 상에서 성능 개선을 위해 재구조화된 최신 MySQL 5.6 및 MySQL에 탑재된 InnoDB 엔진을 사용하였다. InnoDB의 스핀락 함수를 수정하여 다양한 락 알고리즘들을 구현하였고 구현된 락 알고리즘들을 멀티코어 환경에서 평가하였다.

원자로 냉각재 펌프 고장예측진단을 위한 데이터 분석 플랫폼 구축 (Data Analysis Platform Construct of Fault Prediction and Diagnosis of RCP(Reactor Coolant Pump))

  • 김주식;조성한;정래혁;조은주;나영균;유기현
    • 한국IT서비스학회지
    • /
    • 제20권3호
    • /
    • pp.1-12
    • /
    • 2021
  • Reactor Coolant Pump (RCP) is core part of nuclear power plant to provide the forced circulation of reactor coolant for the removal of core heat. Properly monitoring vibration of RCP is a key activity of a successful predictive maintenance and can lead to a decrease in failure, optimization of machine performance, and a reduction of repair and maintenance costs. Here, we developed real-time RCP Vibration Analysis System (VAS) that web based platform using NoSQL DB (Mongo DB) to handle vibration data of RCP. In this paper, we explain how to implement digital signal process of vibration data from time domain to frequency domain using Fast Fourier transform and how to design NoSQL DB structure, how to implement web service using Java spring framework, JavaScript, High-Chart. We have implement various plot according to standard of the American Society of Mechanical Engineers (ASME) and it can show on web browser based on HTML 5. This data analysis platform shows a upgraded method to real-time analyze vibration data and easily uses without specialist. Furthermore to get better precision we have plan apply to additional machine learning technology.

e-로지스틱스에서 효율적인 차량관제를 위한 질의 처리기 구현 (Implementation of Query Processor for Efficient Vehicle Monitoring and Control in e-Logistics)

  • 김동호;김진석;류근호
    • 한국지리정보학회지
    • /
    • 제7권3호
    • /
    • pp.35-47
    • /
    • 2004
  • 최근 부각되고 있는 텔레매틱스와 위치기반서비스의 효율적인 구축을 위해서는 실시간으로 수집되는 방대한 분량의 위치 데이터의 저장, 질의, 프리젠테이션 동을 포함하는 이동체 기술이 필요하다. 특히 물류분야에서 이동중인 차량의 데이터에 대한 효과적인 검색과 분석을 위해서는 응용별 특화된 형태의 데이터를 획득할 수 있는 질의구문이 요구되며, 전통적인 데이터베이스 질의어와 비교할 때 그 구조는 복잡한 양상을 보인다. 이에 대한 효과적인 대안으로는 SQL과 같은 표준화 데이터베이스 언어를 통한 접근을 고려할 수 있다. 따라서 이 논문에서는 e-로지스틱스 기반의 차량관제에서 요구하는 질의에 대하여 SQL를 확장한 이동체 질의어 (MOOU)를 제안하고, 이를 효과적으로 처리하기 위한 질의처리기를 설계 및 구현한다.

  • PDF

반도체 공정의 생산성 향상을 위한 실시간 대용량 데이터의 효율적인 저장 기법 (An Efficient Storing Scheme of Real-time Large Data to improve Semiconductor Process Productivities)

  • 정원일;김환구
    • 한국산학기술학회논문지
    • /
    • 제10권11호
    • /
    • pp.3207-3212
    • /
    • 2009
  • 반도체 산업이 발전함에 따라 생산 효율을 높이기 위해 무인 자동 생산 공정이 요구되고 있다. 이러한 무인자동화 생산 관리 시스템은 생산성 향상을 위해 생산 공정에서 발생하는 대량의 실시간 데이터 분석 및 관리를 필요로 한다. 따라서 실시간으로 발생하는 대용량 데이터를 저장하기 위한 저장 관리 시스템이 요구된다. 기존의 저장 관리 시스템으로 오라클, MY-SQL, MS-SQL 등의 디스크 기반 DBMS가 있다. 하지만 기존의 디스크 기반 DBMS는 반도체 장비로부터 실시간으로 발생하는 대용량 데이터 처리에 한계가 있다. 본 논문에서는 대용량 데이터를 저비용으로 실시간 저장하기 위해 블록 단위 삽입 트랜잭션을 이용한 압축-합병 저장 기법을 제안한다. 제안 기법은 블록 단위 트랜잭션을 이용하여 실시간 데이터를 빠르게 저장하며 데이터를 압축하고 압축된 데이터를 합병하여 저장하기 때문에 보다 적은 디스크 공간을 사용하여 저장할 수 있다. 따라서 반도체 공정에서 빠르게 발생하는 대용량 데이터를 기존 DBMS보다 빠르게 저장이 가능하고 저장 공간 비용을 감소시킨다.

효율적인 검색 인터페이스를 위한 웹 기반 컴퓨터 용어사전의 설계 및 구현 (Design and Implementation of Web-Based Dictionary of Computing for Efficient Search Interface)

  • 황병연;박성철
    • 정보처리학회논문지D
    • /
    • 제9D권3호
    • /
    • pp.457-466
    • /
    • 2002
  • 본 논문에서는 인터넷을 통해 실시간으로 항상 최신의 컴퓨터 용어 검색 서비스를 제공할 수 있는 웹을 기반으로 한 컴퓨터 용어 사전을 설계하고 구현하였다. 본 용어사전은 FOLDOC(Free On-Line Dictionary Of Computing)의 사전을 기본으로 영문 해설을 제공하고 각 용어에 대해 한 명 이상의 번역자가 번역할 수 있도록 함으로써 기존 컴퓨터 사전에서 제공하지 않는 기능을 추가하였다. 그리고 SQL Server DBMS와 SQL을 이용한 다양한 검색 인터페이스(입력 문자로 시작하는 용어 검색, 입력 문자가 해설에 들어간 용어 검색 등)를 제공함으로써 적은 정보만으로도 원하는 용어를 검색할 수 있게 하였다. 본 컴퓨터 용어 사전의 성능 평가를 위해서 FOLDOC Mirror Site의 로그를 분석하여 CPU 부하율을 측정하였다. 실험 결과 본 컴퓨터 용어 사전은 최대 1780여명 이상의 동시 사용자를 수용할 수 있다는 결론을 얻었다.

Azure 클라우드 플랫폼의 가상서버 호스팅을 이용한 데이터 수집환경 및 분석에 관한 연구 (A study on data collection environment and analysis using virtual server hosting of Azure cloud platform)

  • 이재규;조인표;이상엽
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2020년도 제62차 하계학술대회논문집 28권2호
    • /
    • pp.329-330
    • /
    • 2020
  • 본 논문에서는 Azure 클라우드 플랫폼의 가상서버 호스팅을 이용해 데이터 수집 환경을 구축하고, Azure에서 제공하는 자동화된 기계학습(Automated Machine Learning, AutoML)을 기반으로 데이터 분석 방법에 관한 연구를 수행했다. 가상 서버 호스팅 환경에 LAMP(Linux, Apache, MySQL, PHP)를 설치하여 데이터 수집환경을 구축했으며, 수집된 데이터를 Azure AutoML에 적용하여 자동화된 기계학습을 수행했다. Azure AutoML은 소모적이고 반복적인 기계학습 모델 개발을 자동화하는 프로세스로써 기계학습 솔루션 구현하는데 시간과 자원(Resource)를 절약할 수 있다. 특히, AutoML은 수집된 데이터를 분류와 회귀 및 예측하는데 있어서 학습점수(Training Score)를 기반으로 보유한 데이터에 가장 적합한 기계학습 모델의 순위를 제공한다. 이는 데이터 분석에 필요한 기계학습 모델을 개발하는데 있어서 개발 초기 단계부터 코드를 설계하지 않아도 되며, 전체 기계학습 시스템을 개발 및 구현하기 전에 모델의 구성과 시스템을 설계해볼 수 있기 때문에 매우 효율적으로 활용될 수 있다. 본 논문에서는 NPU(Neural Processing Unit) 학습에 필요한 데이터 수집 환경에 관한 연구를 수행했으며, Azure AutoML을 기반으로 데이터 분류와 회귀 등 가장 효율적인 알고리즘 선정에 관한 연구를 수행했다.

  • PDF