• 제목/요약/키워드: 데이터 분석론

검색결과 1,383건 처리시간 0.033초

통신 산업의 고객 분류를 위한 예측 모델 설계 (Design of a Forecasting Model for Customer Classification in the Telecommunication Industries)

  • 이병업;조규하;송석일;유재수
    • 한국콘텐츠학회논문지
    • /
    • 제6권1호
    • /
    • pp.179-189
    • /
    • 2006
  • 최근 데이터 수집 및 저장기술의 발달, 데이터베이스 관리시스템과 데이터웨어하우스 기술의 광범위한 사용은 기업내부의 대량의 데이터를 축적할 수 있도록 하고 있으며, 축적된 데이터는 의사결정에 필요한 새롭고 가치 있는 정보와 지식을 획득할 수 있는 잠재적인 원천으로 인정되고 있다. 본 논문에서는 이동통신업체의 데이터를 가지고 데이터 마이닝 방법론을 이용하여 기존고객을 세분화하기 위한 예측모델을 설계한다. 이를 통해 고객 개개인의 특성에 맞는 마케팅 프로모션을 하게 하고 신규고객을 획득할 때는 신규 고객의 특성을 미리 예측하여 세분화함으로써 고객의 평생가치를 촉진하여 기업과 고객과의 관계성을 높여서 기업은 안정된 고객층으로부터 수익을 창출하고 고객들은 해당 기업으로부터 더 많은 혜택을 받게 하는데 목적이 있다.

  • PDF

비즈니스 데이터 보호를 위한 decision matrix 설계 방법론 및 등급별 보호조치 기준 연구 (The research of Decision Matrix design methodologies for business data protection and protection by data leveling)

  • 신동혁;최진구
    • 융합보안논문지
    • /
    • 제16권4호
    • /
    • pp.3-15
    • /
    • 2016
  • 비즈니스 데이터란 회사 업무 진행 과정 중에 생성, 저장, 이용, 전달되는 모든 온오프라인 형태의 문서 및 전자적 데이터를 의미하며, 영업, 조직, 매출, 마케팅, 배송 관련된 모든 데이터를 의미한다. 대부분의 회사에는 사내 문서 생성 및 보안 관리 가이드에 의거하여 비밀, 대외비의 등급은 이미 존재하나, 실제 사용하고 있는 비즈니스 데이터를 상세히 분석하여 반영할 수 있는 의사결정 기준 수립이 미흡하다. 본 논문에서는 비즈니스 데이터를 분류할 수 있는 정성적, 정량적인 기준(평가 지표)을 수립하기 위한 비즈니스 데이터 decision matrix를 설계할 수 있는 방안을 제시하고, 각 등급별로 보호할 수 있는 기준을 제시해보고자 한다.

병렬 코퍼스 필터링과 한국어에 최적화된 서브 워드 분절 기법을 이용한 기계번역 (Parallel Corpus Filtering and Korean-Optimized Subword Tokenization for Machine Translation)

  • 박찬준;김경민;임희석
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2019년도 제31회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.221-224
    • /
    • 2019
  • 딥러닝을 이용한 Neural Machine Translation(NMT)의 등장으로 기계번역 분야에서 기존의 규칙 기반,통계기반 방식을 압도하는 좋은 성능을 보이고 있다. 본 논문은 기계번역 모델도 중요하지만 무엇보다 중요한 것은 고품질의 학습데이터를 구성하는 일과 전처리라고 판단하여 이에 관련된 다양한 실험을 진행하였다. 인공신경망 기계번역 시스템의 학습데이터 즉 병렬 코퍼스를 구축할 때 양질의 데이터를 확보하는 것이 무엇보다 중요하다. 그러나 양질의 데이터를 구하는 일은 저작권 확보의 문제, 병렬 말뭉치 구축의 어려움, 노이즈 등을 이유로 쉽지 않은 상황이다. 본 논문은 고품질의 학습데이터를 구축하기 위하여 병렬 코퍼스 필터링 기법을 제시한다. 병렬 코퍼스 필터링이란 정제와 다르게 학습 데이터에 부합하지 않다고 판단되며 소스, 타겟 쌍을 함께 삭제 시켜 버린다. 또한 기계번역에서 무엇보다 중요한 단계는 바로 Subword Tokenization 단계이다. 본 논문은 다양한 실험을 통하여 한-영 기계번역에서 가장 높은 성능을 보이는 Subword Tokenization 방법론을 제시한다. 오픈 된 한-영 병렬 말뭉치로 실험을 진행한 결과 병렬 코퍼스 필터링을 진행한 데이터로 만든 모델이 더 좋은 BLEU 점수를 보였으며 본 논문에서 제안하는 형태소 분석 단위 분리를 진행 후 Unigram이 반영된 SentencePiece 모델로 Subword Tokenization를 진행 하였을 시 가장 좋은 성능을 보였다.

  • PDF

시민 니즈와 참여 기반의 스마트시티 문제해결을 위한 빅 데이터 활용 절차에 관한 연구 (A Study on the Procedure of Using Big Data to Solve Smart City Problems Based on Citizens' Needs and Participation)

  • 장혜정
    • 한국정보전자통신기술학회논문지
    • /
    • 제13권2호
    • /
    • pp.102-112
    • /
    • 2020
  • 스마트시티의 목표는 스마트시티의 요소기술을 통해 도시문제를 해결하여 친환경적이고 지속가능한 경제발전 및 시민의 삶의 질을 향상하는 것이라 할 수 있다. 지금까지 스마트시티는 요소기술 중심으로 발전해왔지만 이제는 스마트시티에서 생활을 하는 시민들의 니즈나 참여에 대해 관심을 두어야 할 때이다. 본 논문에서는 시민 니즈와 참여를 기반으로 스마트시티의 문제해결을 위한 빅 데이터 절차를 제시한다. 이를 위하여 지역별 주요산업별 스마트시트 프로젝트 시장과 분야별 스마트시티 시장 영역 발전단계를 살펴본다. 또한 시민 참여에 대한 분야별 정의와 필요성을 이해하고 빅 데이터를 통한 문제해결 방법으로 7단계 빅 데이터 문제해결 프로세스에 접목 방안을 제시한다. 문제해결을 위한 7단계 빅데이터 프로세스는 스마트시티의 각 부문별 정형·비정형 데이터 수집 분석 후 과제를 도출하고 이에 따른 정책 프로그램을 도출하는 방법이다. 이러한 절차에 시민 참여를 이끌어 내기 위하여 비정형 데이터 수집과정에서 디자인싱킹 방법론의 공감단계를 활용한다. 또한 스마트시티 도시문제 해결을 위한 시민 니즈를 찾는 방법으로 비정형 데이터 분석과정에 디자인싱킹 방법론의 문제정의 단계를 접목시켰다.

안전한 데이터베이스 설계를 위한 객체지향 분석·설계 방법론 -역할기반 접근제어를 중심으로- (An Object-Oriented Analysis and Design Methodology for Secure Database Design -focused on Role Based Access Control-)

  • 주경수;우정웅
    • 한국컴퓨터정보학회논문지
    • /
    • 제18권6호
    • /
    • pp.63-70
    • /
    • 2013
  • IT의 발전에 따라 다양하고 복잡한 기능을 가진 응용 시스템들이 요구되고 있다. 이러한 응용 시스템들은 대부분 데이터를 효율적으로 관리하기 위해 데이터베이스를 기반으로 구축된다. 그러나 응용 시스템 개발을 위하여 사용되고 있는 대부분의 객체지향 분석 설계 방법론들은 데이터베이스와의 상호 연관성을 명확하게 제공하지 못하고 있다. 보안과 관련된 요구사항들이 증가되면서 보안에 대한 중요성 역시 점차 증가되고 있다. 하지만 이러한 보안은 대부분 개발 마지막 과정에서 고려되기 때문에 요구사항 분석부터 구현에 이르기까지 시스템 개발 전 주기에 따른 일관된 보안 적용은 어려운 실정이다. 따라서 본 논문에서는 요구사항 분석부터 구현에 이르기까지, 보안이 강조된 '안전한 데이터베이스 설계를 위한 객체지향 분석 설계 방법론'을 제안한다. 제안한 '안전한 데이터베이스 설계를 위한 객체지향 분석 설계 방법론'은 대부분의 객체지향 분석 설계 방법론들이 제시하지 못했던 데이터베이스와의 상호 연관성을 제공할 뿐만 아니라, 보안이 강조된 모델링 언어인 UMLsec을 사용하여 보안이 데이터베이스 설계에 반영토록 하였다. 아울러 보안에 따른 구현을 위하여 관계형 데이터베이스의 역할기반 접근제어(RBAC; Role Based Access Control)를 사용한다.

동적 개인신용평가시스템 (Dynamic Credit Scoring System)

  • 김동완;백승원;주정은;구상회
    • 한국정보기술응용학회:학술대회논문집
    • /
    • 한국정보기술응용학회 2007년도 춘계학술대회
    • /
    • pp.190-197
    • /
    • 2007
  • 외환위기 이후 우리나라 금융기관은 상대적으로 위험성이 높은 기업대출보다, 높은 수익성을 가지는 가계 대출에 관심을 기울이게 되었다. 가계대출이 증가함에 따라 개인신용평가의 중요성이 부각되고, 이에 많은 신용평가시스템이 개발되어 왔다. 하지만 기존의 신용평가시스템은 대출 신청 당시의 데이터 및 과거의 데이터를 가지고 개인의 신용을 평가하기 때문에, 미래 상황에 대한 예측은 고려하지 못한다. 시스템 다이나믹스는 시간의 흐름에 따른 각 요인의 변화를 살펴봄으로써 미래 상황에 대한 예측이 가능한 분석 방법이다. 이에 본 연구에서는 시스템 다이나믹스 방법론을 활용하여 개인 신용 상태에 대한 미래의 동태적인 변화를 예측하여, 그 결과를 반영한 신용평가모델을 개발하고자 한다. 이를 위하여, 먼저 신용평점 영향을 주는 변수들을 선정하고, 이 변수들 간의 인과관계를 밝혀낸 후, 인과관계를 토대로 분석 모델을 구축한 뒤, 컴퓨터 시뮬레이션을 실행함으로써, 대출 희망자의 미래의 신용상태 변화 모양을 예측해 본다. 이러한 시뮬레이션 결과를 신용평가에 반영하게 되면, 금융기관의 신용 대출의 위험을 줄이는 데 기여할 것으로 기대된다.

  • PDF

계층적 SVM을 이용한 전력용 변압기 고장진단 (Fault Diagnosis of Power Transformer Using Hierarchical SVM)

  • 임재윤;이대종;이종필;박재원;지평식
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 2007년도 추계학술대회 논문집 전력기술부문
    • /
    • pp.279-281
    • /
    • 2007
  • 본 논문에서는 계층적 SVM을 이용한 전력용 변압기의 고장진단 기법을 제안한다. 제안된 기법은 전처리 과정, 정상/고장판별 부, 고장원인판별부, 열화추이분석부로 구성된다. 제안한 고장진단과정을 보면, 전처리부에서는 DGA에 의해 얻어진 가스 데이터의 특징벡터를 산출한다. 그 다음단계로 정상/고장 판별부에서는 얻어진 특징벡터를 이용하여 SVM에 의해 정상/고장 여부를 진단한다. 고장원인 판별부에서는 진단하고자 하는 변압기가 고장으로 판정이 난 경우에 다중-클래스 SVM에 의해 고장원인을 판정한다. 또한 정상/고장판별에서 정상이라 판정할 지라도 열화추이분석부에서 FCM에 의해 구축된 고장모델과 정상데이터간의 거리척도를 이용하여 고장추이론 분서한다. 제안된 방법의 유용성을 보이기 위한 실험결과에서 기존의 방법들에 비해서 향상된 진단결과를 보임을 확인하였다.

  • PDF

빅데이터를 활용한 정책분석의 방법론적 함의 : 기회형 창업 관련 소셜 빅데이터 분석 사례를 중심으로 (Methodological Implications of Employing Social Bigdata Analysis for Policy-Making : A Case of Social Media Buzz on the Startup Business)

  • 이영주;김도훈
    • 한국IT서비스학회지
    • /
    • 제15권1호
    • /
    • pp.97-111
    • /
    • 2016
  • In the creative economy paradigm, motivation of the opportunity based startup is a continuous concern to policy-makers. Recently, bigdata anlalytics challenge traditional methods by providing efficient ways to identify social trend and hidden issues in the public sector. In this study the authors introduce a case study using social bigdata analytics for conducting policy analysis. A semantic network analysis was employed using textual data from social media including online news, blog, and private bulletin board which create buzz on the startup business. Results indicates that each media has been forming different discourses regarding government's policy on the startup business. Furthermore, semantic network structures from private bulletin board reveal unexpected social burden that hiders opening a startup, which has not been found in the traditional survey nor experts interview. Based on these results, the authors found the feasibility of using social bigdata analysis for policy-making. Methodological and practical implications are discussed.

OSD 메뉴 자동검증을 위한 작업스케줄링 및 패턴 인식 기법 (Job Scheduling and Pattern Recognition for Auto OSD Verification System)

  • 이진석;김호준
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2006년도 한국컴퓨터종합학술대회 논문집 Vol.33 No.1 (B)
    • /
    • pp.379-381
    • /
    • 2006
  • 본 연구는 디스플레이 제품의 OSD(On Screen Display) 메뉴의 문자 오류 검사 과정을 자동화하는 방법과 FMM 신경망을 이용한 실시간 문자인식 방법을 제안한다. 이는 일반적인 문자인식 문제와는 달리 시스템 환경에 대한 몇 가지 가정과 제약조건을 고려해야 한다. 예컨대 문제의 특성상 카메라 및 TV제어 기기부의 동작과 연동하는 작업 스케줄링 기능과 실시간 분석기능 등의 요건은 시스템개발을 복잡하게 하는 반면, 주어진 OSD 메뉴 데이터로부터 검증과정은 미지 패턴에 대한 인식과정을 단순화하여 일종의 판정(decision) 문제로 고려될 수 있게 한다. 본 연구에서는 디스플레이 제품의 OSD 메뉴와 같이 특수한 구조를 갖는 문서영상에 대한 논리적인 구조분석을 통해서 연속적인 문서영상을 발생시켜서 검증과정을 자동화하는 작업스케줄링 방법을 제안하고 인식의 방법론으로서 수정된 구조의 FMM신경망을 적용한다. 또한 실제 데이터를 사용한 실험결과를 통해 시스템의 유용성을 고찰한다.

  • PDF

FMM 신경망에서 가중치 요소와 하이퍼박스 중첩효과 분석 (Analysis of Weight Factor and Hyperbox Overlapping Effects in FMM Neural Networks)

  • 박현정;김호준
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2005년도 한국컴퓨터종합학술대회 논문집 Vol.32 No.1 (B)
    • /
    • pp.691-693
    • /
    • 2005
  • 본 연구에서는 FMM 신경망의 학습 알고리즘에서 하이퍼박스 확장과정에 수반되는 중첩현상을 분석하고, 이에 대한 축소 과정의 특성과 이를 보완하기 위한 새로운 활성화 함수에 관하여 고찰한다. 하이퍼박스 중첩 영역에 속하는 패턴 데이터는 그 분류 결과가 왜곡될 수 있다. 왜냐하면 학습과정에서 하이퍼박스상의 특징범위는 특징값의 빈도요소를 고려하지 않음으로 인하여 극소수의 비정상적 데이터에 관해서도 동일 수준으로 민감하게 확장되기 때문이다. 본 논문에서는 특징집합에서 가중치와 빈도요소를 반영하는 모델로서 이러한 중첩현상의 영향을 개선하는 방법론을 소개한다. 제안된 이론은 단순화된 패턴집합에 대하여 그 유용성을 이론적으로 고찰하며, 실제 패턴분류 문제에 적용하여 실험적으로 평가한다.

  • PDF