• 제목/요약/키워드: 기계 학습 모델

검색결과 1,145건 처리시간 0.032초

일주기 리듬과 일주기 유형이 경두개 직류전기자극에 의한 뇌기능 변화에 미치는 영향 탐색 (The impact of functional brain change by transcranial direct current stimulation effects concerning circadian rhythm and chronotype)

  • 정다운;유수민;이현수;한상훈
    • 인지과학
    • /
    • 제33권1호
    • /
    • pp.51-75
    • /
    • 2022
  • 경두개 직류전기자극(transcranial Direct Current Stimulation; tDCS)은 지각, 인지, 운동 등의 뇌기능 향상 및 발달 효과가 입증되며, 다양한 분야에서 활용 및 응용되는 비침습적 뇌자극술이다. tDCS 효과는 뇌의 해부학적 구조, 뇌의 노화 정도 등의 뇌신경활성화 특징에 따라 다르게 나타난다는 연구결과들이 보고되고 있다. 일주기 리듬(circadian rhythm)은 대략 하루 주기의 수면과 각성의 생리적 변화패턴을 의미하며 뇌신경활성화 상태는 일주기 리듬에 따라 다르게 나타난다. 일주기 유형(chronotype)은 하루 중에 발현되는 각성도의 크기에 따라 아침의 각성도가 큰 유형은 아침형으로 저녁의 각성도가 큰 유형은 저녁형으로 나누어진다. 본 연구는 일주기 리듬에 의해 변하는 뇌기능 특징이 tDCS 효과에 미치는 영향을 알아보고자 한다. 총 20명의 건강한 성인 대상으로 실험을 진행하였고, 참가자들은 일주기 유형을 분류하기 위해 아침형-저녁형 설문지에 의해 주간형(아침형, 중간형)과 야간형(저녁형)으로 분류했다. 본 실험은 Zoom 프로그램을 이용하여 참가자와 실험자가 온라인으로 만나서 실험을 진행했다. 실험이 확정된 참가자는 실험자로부터 뇌파 기기, 뇌파 데이터를 획득하는 앱이 있는 핸드폰, 핸드폰 거치대, 뇌자극 기기의 사용방법에 대한 설명을 듣고 기기를 테스트해보고 기기를 전달받았다. 기기사용의 어려움을 가진 2명의 참가자는 대면 실험을 진행하여, 실험자가 기기작동을 하여 실험에 참여했다. 일주기 리듬의 상태에 따른 뇌자극 효과를 알아보기 위해 1주일 간격으로 아침과 저녁에 실험했으며, tDCS 자극 전과 후의 신경활성화 반응의 차이를 뇌파를 이용하여 측정하였다. 뇌자극에 의한 뇌기능 변화를 확인하기 위해 자극 전의 뇌파와 자극 후 뇌파가 다른 패턴을 보이며 분류가 잘되는 지를 예측 정확도로 분석했으며, 뇌기능 특징 변화가 일주기 리듬과 일주기 유형에 따라 다르게 나타나는지 확인하기 위해 각 조건의 분류조건(아침/저녁, 주간형/야간형)에서 추출된 주요 EEG 특성을 비교했다. 54개의 뇌파 특성값을 추출하여 SVM(Support Vector Machine) 기계학습 알고리즘으로 분류 모델을 구축하였고, 구축된 모델을 Leave-One-Out 교차검증(Leave-One-Out Cross-Validation)을 사용하여 자극 전과 후의 뇌파 반응을 예측하는지 평가하였고, 분류예측모델의 주요 예측 인자를 확인하는 주요 특성 분석을 진행하였다. 아침과 저녁의 tDCS에 따른 뇌파 특징을 분류하는 예측 정확도는 모두 98%로 나타났으며, 주간형의 아침 자극 조건과 저녁 자극 조건의 예측 정확도는 92%와 96%이며, 야간형의 아침자극 조건과 저녁 자극 조건의 예측 정확도는 모두 94%로 나타났다. 아침 자극 전과 후의 뇌파를 분류하는 상위 3개의 주요 EEG 특성결과는 주간형과 야간형에 따라 다르게 나타났다. 주간형은 좌측 측두 두정엽과 전전두엽의 뇌파 특성값이 나타났으며, 야간형은 측두 두정엽의 뇌파 특성값들만 나타났다. 저녁 자극전과 후의 뇌파를 분류하는 상위 3개의 주요 EEG 특성 결과 또한 주간형과 야간형에 따라 다르게 나타났다. 주간형은 우측 측두 두정엽과 좌측 전두엽의 뇌파 특성값이 나타났으며, 야간형은 측두 두정엽과 전두엽의 뇌파 특성값이 나타났다. 이와 같은 연구결과는 일주기 리듬과 유형에 따라 아침과 저녁의 뇌기능 특징이 다르게 나타나서 뇌자극 효과가 다르게 나타날 수 있음을 확인한 결과이다. 본 연구의 결과는 효과적인 뇌자극을 위해 개인의 뇌신경 활성화 상태 및 특징에 따라서 뇌자극 프로토콜을 조정할 필요성을 제시한다는 데에 의의를 찾을 수 있다.

위성 자료와 수치모델 자료를 활용한 스태킹 앙상블 기반 SO2 지상농도 추정 (Monitoring Ground-level SO2 Concentrations Based on a Stacking Ensemble Approach Using Satellite Data and Numerical Models)

  • 최현영;강유진;임정호;신민소;박서희;김상민
    • 대한원격탐사학회지
    • /
    • 제36권5_3호
    • /
    • pp.1053-1066
    • /
    • 2020
  • 이산화황(SO2)은 대기 중 화학 반응을 통해 2차 대기오염물질을 생성하는 전구체로, 주로 산업활동이나 주거 및 교통 활동 등을 통해 배출된다. 장기간 노출 시 호흡기 질환이나 심혈관 질환 등을 유발하여 인체 건강에 부정적인 영향을 미칠 수 있기 때문에 이에 대한 지속적인 모니터링이 필요하다. 우리나라에서는 SO2에 대해 관측소 기반의 모니터링이 수행되고 있으나 이는 공간적으로 연속적인 정보를 제공하는 데에 한계가 있다. 따라서, 본 연구에서는 위성자료와 수치모델 자료를 융합하여 일별 13시를 타겟으로 하는 1 km의 고해상도로 공간적으로 연속적인 SO2 지상농도를 산출하였다. 2015년 1월부터 2019년 4월까지의 기간 동안 남한 지역에 대하여 스태킹 앙상블 기법을 이용하여 SO2 지상농도 추정 모델을 개발하였다. 스태킹 앙상블 기법이란 여러가지 기계학습 기법을 두 단계로 쌓는 방식으로 융합하여 단일 모델 대비 더 향상된 성능을 도출하는 방법이다. 본 연구에서는 베이스 모델로는 RF (Random Forest)와 XGB (eXtreme Gradient BOOSTing) 기법이, 메타 모델로는 MLR (Multiple Linear Regression) 기법이 사용되었다. 구축된 모델의 교차검증 결과 메타 모델은 상관계수(R) = 0.69와 root-mean-squared-error(RMSE) = 0.0032 ppm의 결과를 보였으며 이는 베이스 모델의 평균 대비 약 25% 향상된 안정성을 보였다. 또한 모델 구축에 사용되지 않은 기간에 대한 예측 검증을 수행하여 모델의 일반화 가능성을 평가하였다. 구축된 모델을 이용하여 남한 지역의 SO2 지상농도 공간분포를 분석한 결과 일반적인 계절성과 배출원의 변화를 잘 반영하는 패턴을 보임을 확인하였다.

SAR 위성 영상을 이용한 수계탐지의 최적 머신러닝 밴드 조합 연구 (Selection of Optimal Band Combination for Machine Learning-based Water Body Extraction using SAR Satellite Images)

  • 전현균;김덕진;김준우;수레시 크리쉬난;김재언;김택인;정승환
    • 한국지리정보학회지
    • /
    • 제23권3호
    • /
    • pp.120-131
    • /
    • 2020
  • 인공위성 영상을 기반으로 한 기계판독(machine interpretation) 원격탐사 수계 탐지는 효율적인 수자원 관리, 가뭄 탐지, 홍수 모니터링 등에 큰 도움이 된다. 따라서 본 연구에서는 머신러닝을 기반으로 한 SAR 위성 영상 기반 수계 탐지를 시행하였다. 그러나 SAR 위성 영상만을 사용하였을 경우 음영 효과 또는 도로 등의 수계와 비슷한 산란특성을 가지는 물체로 인하여 비수계가 수계로 오탐지 될 수 있다. 이러한 오탐지를 줄이기 위하여 목포 지역을 촬영한 Cosmo-SkyMed SAR 위성 영상에 모폴로지(Morphology)의 open 연산을 거친 밴드와 DEM(수치표고모델) 밴드, Curvature(곡률) 밴드를 조합하여 중첩한 8가지 경우에 대하여 의미 분할 기법 머신러닝 모델을 학습시켰다. 8가지 머신러닝 모델에 대한 최종 테스트 결과인 Global Accuracy를 구하였으며, 목포 지역의 토지피복지도와의 일치율 역시 비교하였다. 그 결과 SAR 위성 영상과 모폴로지 open 필터를 적용한 밴드, DEM 밴드, Curvature 밴드를 모두 사용한 경우가 Global Accuracy뿐만 아니라 토지피복지도와의 일치율 역시 가장 높음을 확인할 수 있었다. 이때 Global Accuracy는 95.07%였으며, 토지피복지도와의 일치율은 89.93%로 나타났다.

LDA 기반 은닉 토픽 추론을 이용한 TV 프로그램 자동 추천 (Automatic TV Program Recommendation using LDA based Latent Topic Inference)

  • 김은희;표신지;김문철
    • 방송공학회논문지
    • /
    • 제17권2호
    • /
    • pp.270-283
    • /
    • 2012
  • 다채널 TV, IPTV 및 Smart TV 서비스의 등장으로 인해 수많은 방송 채널과 방대한 TV 프로그램 콘텐츠가 시청자 단말로 제공됨으로써 시청자들은 자신이 원하는 콘텐츠를 쉽게 찾고 소비하는 것이 어려운 TV 시청 환경을 맞게 되었다. 따라서 TV 사용자들에게 자신이 선호하는 콘텐츠를 자동 추천해 줌으로써 원하는 콘텐츠로의 접근성을 증대시키는 것은 미래의 지능형 TV 서비스에 있어서 주요한 이슈이다. 이에 본 논문에서는 사용자의 선호 취향과 대중의 선호취향을 모두 고려한 협업필터링 개념의 통계적 기계학습 기반 TV 프로그램 추천 모델을 제시한다. 이를 위해 시청한 TV 콘텐츠에 대한 선호 토픽을 사용자의 시청 선호도로 보고, 최근 널리 활용되고 있는 LDA(Latent Dirichlet Allocation)모델을 TV 프로그램 추천 모델에 적용하였다. LDA 기반 TV 프로그램 추천 성능을 개선하기 위해 본 논문에서는 TV시청 이용내역 데이터를 기반으로, TV 사용자들의 관심 토픽을 은닉 변수로 하고, TV 사용자들의 관심 토픽에 대한 다양성을 반영하기 위해 은닉 변수의 확률분포 특성을 비대칭 디리클레(Dirichlet) 분포로 모형화하여 실험에 적용하였다. 제안된 LDA 기반 TV 프로그램 자동 추천 방법의 성능을 검증하기 위해, 유사 시청 특성을 갖는 사용자 그룹에 대해 상위 5개의 TV 프로그램을 일주일 단위로 추천하였을 경우 평균 66.5%, 2개월 단위의 추천에 대해서는 평균 77.9%의 precision 추천 성능을 확인할 수 있었다.

딥러닝과 머신러닝을 이용한 아파트 실거래가 예측 (Apartment Price Prediction Using Deep Learning and Machine Learning)

  • 김학현;유환규;오하영
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제12권2호
    • /
    • pp.59-76
    • /
    • 2023
  • 코로나 시대 이후 아파트 가격 상승은 비상식적이었다. 이러한 불확실한 부동산 시장에서 가격 예측 연구는 매우 중요하다. 본 논문에서는 다양한 부동산 사이트에서 자료 수집 및 크롤링을 통해 2015년부터 2020년까지 87만개의 방대한 데이터셋을 구축하고 다양한 아파트 정보와 경제지표 등 가능한 많은 변수를 모은 뒤 미래 아파트 매매실거래가격을 예측하는 모델을 만든다. 해당 연구는 먼저 다중 공선성 문제를 변수 제거 및 결합으로 해결하였다. 이후 의미있는 독립변수들을 뽑아내는 전진선택법(Forward Selection), 후진소거법(Backward Elimination), 단계적선택법(Stepwise Selection), L1 Regularization, 주성분분석(PCA) 총 5개의 변수 선택 알고리즘을 사용했다. 또한 심층신경망(DNN), XGBoost, CatBoost, Linear Regression 총 4개의 머신러닝 및 딥러닝 알고리즘을 이용해 하이퍼파라미터 최적화 후 모델을 학습시키고 모형간 예측력을 비교하였다. 추가 실험에서는 DNN의 node와 layer 수를 바꿔가면서 실험을 진행하여 가장 적절한 node와 layer 수를 찾고자 하였다. 결론적으로 가장 성능이 우수한 모델로 2021년의 아파트 매매실거래가격을 예측한 후 실제 2021년 데이터와 비교한 결과 훌륭한 성과를 보였다. 이를 통해 머신러닝과 딥러닝은 다양한 경제 상황 속에서 투자자들이 주택을 구매할 때 올바른 판단을 할 수 있도록 도움을 줄 수 있을 것이라 확신한다.

CNN-LSTM 조합모델을 이용한 영화리뷰 감성분석 (Sentiment Analysis of Movie Review Using Integrated CNN-LSTM Mode)

  • 박호연;김경재
    • 지능정보연구
    • /
    • 제25권4호
    • /
    • pp.141-154
    • /
    • 2019
  • 인터넷 기술과 소셜 미디어의 빠른 성장으로 인하여, 구조화되지 않은 문서 표현도 다양한 응용 프로그램에 사용할 수 있게 마이닝 기술이 발전되었다. 그 중 감성분석은 제품이나 서비스에 내재된 사용자의 감성을 탐지할 수 있는 분석방법이기 때문에 지난 몇 년 동안 많은 관심을 받아왔다. 감성분석에서는 주로 텍스트 데이터를 이용하여 사람들의 감성을 사전 정의된 긍정 및 부정의 범주를 할당하여 분석하며, 이때 사전 정의된 레이블을 이용하기 때문에 다양한 방향으로 연구가 진행되고 있다. 초기의 감성분석 연구에서는 쇼핑몰 상품의 리뷰 중심으로 진행되었지만, 최근에는 블로그, 뉴스기사, 날씨 예보, 영화 리뷰, SNS, 주식시장의 동향 등 다양한 분야에 적용되고 있다. 많은 선행연구들이 진행되어 왔으나 대부분 전통적인 단일 기계학습기법에 의존한 감성분류를 시도하였기에 분류 정확도 면에서 한계점이 있었다. 본 연구에서는 전통적인 기계학습기법 대신 대용량 데이터의 처리에 우수한 성능을 보이는 딥러닝 기법과 딥러닝 중 CNN과 LSTM의 조합모델을 이용하여 감성분석의 분류 정확도를 개선하고자 한다. 본 연구에서는 대표적인 영화 리뷰 데이터셋인 IMDB의 리뷰 데이터 셋을 이용하여, 감성분석의 극성분석을 긍정 및 부정으로 범주를 분류하고, 딥러닝과 제안하는 조합모델을 활용하여 극성분석의 예측 정확도를 개선하는 것을 목적으로 한다. 이 과정에서 여러 매개 변수가 존재하기 때문에 그 수치와 정밀도의 관계에 대해 고찰하여 최적의 조합을 찾아 정확도 등 감성분석의 성능 개선을 시도한다. 연구 결과, 딥러닝 기반의 분류 모형이 좋은 분류성과를 보였으며, 특히 본 연구에서 제안하는 CNN-LSTM 조합모델의 성과가 가장 우수한 것으로 나타났다.

캠페인 효과 제고를 위한 자기 최적화 변수 선택 알고리즘 (Self-optimizing feature selection algorithm for enhancing campaign effectiveness)

  • 서정수;안현철
    • 지능정보연구
    • /
    • 제26권4호
    • /
    • pp.173-198
    • /
    • 2020
  • 최근 온라인의 비약적인 활성화로 캠페인 채널들이 다양하게 확대되면서 과거와는 비교할 수 없을 수준의 다양한 유형들의 캠페인들이 기업에서 수행되고 있다. 하지만, 고객의 입장에서는 중복 노출로 인한 캠페인에 대한 피로감이 커지면서 스팸으로 인식하는 경향이 있고, 기업입장에서도 캠페인에 투자하는 비용은 점점 더 늘어났지만 실제 캠페인 성공률은 오히려 더 낮아지고 있는 등 캠페인 자체의 효용성이 낮아지고 있다는 문제점이 있어 실무적으로 캠페인의 효과를 높이고자 하는 다양한 연구들이 지속되고 있다. 특히 최근에는 기계학습을 이용하여 캠페인의 반응과 관련된 다양한 예측을 해보려는 시도들이 진행되고 있는데, 이 때 캠페인 데이터의 다양한 특징들로 인해 적절한 특징을 선별하는 것은 매우 중요하다. 전통적인 특징 선택 기법으로 탐욕 알고리즘(Greedy Algorithm) 중 SFS(Sequential Forward Selection), SBS(Sequential Backward Selection), SFFS(Sequential Floating Forward Selection) 등이 많이 사용되었지만 최적 특징만을 학습하는 모델을 생성하기 때문에 과적합의 위험이 크고, 특징이 많은 경우 분류 예측 성능 하락 및 학습시간이 많이 소요된다는 한계점이 있다. 이에 본 연구에서는 기존의 캠페인에서의 효과성 제고를 위해 개선된 방식의 특징 선택 알고리즘을 제안한다. 본 연구의 목적은 캠페인 시스템에서 처리해야 하는 데이터의 통계학적 특성을 이용하여 기계 학습 모델 성능 향상의 기반이 되는 특징 부분 집합을 탐색하는 과정에서 기존의 SFFS의 순차방식을 개선하는 것이다. 구체적으로 특징들의 데이터 변형을 통해 성능에 영향을 많이 끼치는 특징들을 먼저 도출하고 부정적인 영향을 미치는 특징들은 제거를 한 후 순차방식을 적용하여 탐색 성능에 대한 효율을 높이고 일반화된 예측이 가능하도록 개선된 알고리즘을 적용하였다. 실제 캠페인 데이터를 이용해 성능을 검증한 결과, 전통적인 탐욕알고리즘은 물론 유전자알고리즘(GA, Genetic Algorithm), RFE(Recursive Feature Elimination) 같은 기존 모형들 보다 제안된 모형이 보다 우수한 탐색 성능과 예측 성능을 보임을 확인할 수 있었다. 또한 제안 특징 선택 알고리즘은 도출된 특징들의 중요도를 제공하여 예측 결과의 분석 및 해석에도 도움을 줄 수 있다. 이를 통해 캠페인 유형별로 중요 특징에 대한 분석과 이해가 가능할 것으로 기대된다.

영화 리뷰 감성분석을 위한 텍스트 마이닝 기반 감성 분류기 구축 (A Study on Analyzing Sentiments on Movie Reviews by Multi-Level Sentiment Classifier)

  • 김유영;송민
    • 지능정보연구
    • /
    • 제22권3호
    • /
    • pp.71-89
    • /
    • 2016
  • 누구나 본인이 사용한 제품이나, 이용한 서비스에 대한 후기를 자유롭게 인터넷에 작성할 수 있고, 이러한 데이터의 양은 점점 더 많아지고 있다. 감성분석은 사용자가 생성한 온라인 텍스트 속에 내포된 감성 및 감정을 식별하기 위해 사용된다. 본 연구는 다양한 데이터 도메인 중 영화 리뷰를 분석 대상으로 한다. 영화 리뷰를 이용한 기존 연구에서는 종종 리뷰 평점을 관객의 감성으로 동일시하여 감성분석에 이용한다. 그러나 리뷰 내용과 평점의 실제적 극성 정도가 항상 일치하는 것은 아니기 때문에 연구의 정확성에 한계가 발생할 수 있다. 이에 본 연구에서는 기계학습 기반의 감성 분류기를 구축하고, 이를 통해 리뷰의 감성점수를 산출하여 리뷰에서 나타나는 감성의 수치화를 목표로 한다. 나아가 산출된 감성점수를 이용하여 리뷰와 영화 흥행 간의 연관성을 살펴보았다. 감성분석 모델은 지지벡터 분류기와 신경망을 이용해 구축되었고, 총 1만 건의 영화 리뷰를 학습용 데이터로 하였다. 감성분석은 총 175편의 영화에 대한 1,258,538개의 리뷰에 적용하였다. 리뷰의 평점과 흥행, 그리고 감성점수와 흥행과의 연관성은 상관분석을 통해 살펴보았고, t-검정으로 두 지표의 평균차를 비교하여 감성점수의 활용성을 검증하였다. 연구 결과, 본 연구에서 제시하는 모델 구축 방법은 나이브 베이즈 분류기로 구축한 모델보다 높은 정확성을 보였다. 상관분석 결과로는, 영화의 주간 평균 평점과 관객 수 간의 유의미한 양의 상관관계가 나타났고, 감성점수와 관객 수 간의 상관분석에서도 유사한 결과가 도출되었다. 이에 두 지표간의 평균을 이용한 t-검정을 수행하고, 이를 바탕으로 산출한 감성점수를 리뷰 평점의 역할을 할 수 있는 지표로써 활용 가능함을 검증하였다. 나아가 검증된 결론을 근거로, 트위터에서 영화를 언급한 트윗을 수집하여 감성분석을 적용한 결과를 살펴봄으로써 감성분석 모델의 활용 방안을 모색하였다. 전체적 실험 및 검증의 과정을 통해 본 연구는 감성분석 연구에 있어 개선된 감성 분류 방법을 제시할 수 있음을 보였고, 이러한 점에서 연구의 의의가 있다.

한국표준산업분류를 기준으로 한 문서의 자동 분류 모델에 관한 연구 (A Study on Automatic Classification Model of Documents Based on Korean Standard Industrial Classification)

  • 이재성;전승표;유형선
    • 지능정보연구
    • /
    • 제24권3호
    • /
    • pp.221-241
    • /
    • 2018
  • 지식사회에 들어서며 새로운 형태의 자본으로서 정보의 중요성이 강조되고 있다. 그리고 기하급수적으로 생산되는 디지털 정보의 효율적 관리를 위해 정보 분류의 중요성도 증가하고 있다. 본 연구에서는 기업의 기술사업화 의사결정에 도움이 될 수 있는 맞춤형 정보를 자동으로 분류하여 제공하기 위하여, 기업의 사업 성격을 나타내는 한국표준산업분류(이하 'KSIC')를 기준으로 정보를 분류하는 방법을 제안하였다. 정보 혹은 문서의 분류 방법은 대체로 기계학습을 기반으로 연구되어 왔으나 KSIC를 기준으로 분류된 충분한 학습데이터가 없어, 본 연구에서는 문서간 유사도를 계산하는 방식을 적용하였다. 구체적으로 KSIC 각 코드별 설명문을 수집하고 벡터 공간 모델을 이용하여 분류 대상 문서와의 유사도를 계산하여 가장 적합한 KSIC 코드를 제시하는 방법과 모델을 제시하였다. 그리고 IPC 데이터를 수집한 후 KSIC를 기준으로 분류하고, 이를 특허청에서 제공하는 KSIC-IPC 연계표와 비교함으로써 본 방법론을 검증하였다. 검증 결과 TF-IDF 계산식의 일종인 LT 방식을 적용하였을 때 가장 높은 일치도를 보였는데, IPC 설명문에 대해 1순위 매칭 KSIC의 일치도는 53%, 5순위까지의 누적 일치도는 76%를 보였다. 이를 통해 보다 정량적이고 객관적으로 중소기업이 필요로 할 기술, 산업, 시장정보에 대한 KSIC 분류 작업이 가능하다는 점을 확인할 수 있었다. 또한 이종 분류체계 간 연계표를 작성함에 있어서도 본 연구에서 제공하는 방법과 결과물이 전문가의 정성적 판단에 도움이 될 기초 자료로 활용될 수 있을 것으로 판단된다.

기업의 효과적인 소송 대응을 위한 전자증거개시 절차 모델과 대체 기술 (E-Discovery Process Model and Alternative Technologies for an Effective Litigation Response of the Company)

  • 이태림;신상욱
    • 디지털융복합연구
    • /
    • 제10권8호
    • /
    • pp.287-297
    • /
    • 2012
  • 본 논문에서는 미국의 전자증거개시(E-Discovery) 제도의 확산에 따라 국내 도입에 대비하여 표준화 된 업무 수행 절차 확립을 위해 선행 연구가 이루어지고 있는 EDRM(Electronic Discovery Reference Model) 및 The Sedona Conference 프로젝트에 대한 분석을 바탕으로 일반화 된 E-Discovery 프로세스와 세부 절차 별 필수 업무 사항들을 제시한다. 또한 이런 절차들이 실제 소송에 활용됨에 있어서 근본적으로 내포하고 있는 시간과 비용 문제를 해결하기 위한 대체 기술로써 기계 학습, 오픈 소스 형태의 정보 검색 라이브러리, Hadoop 기반의 대용량 데이터 분산 처리 기법 등을 소개하고, E-Discovery 프로세스 상에서의 활용 방안을 제시하여, 관련 서비스 및 솔루션을 개발하고자 하는 벤더들에게 유용한 정보를 제공한다. 이는 또한 제도적 변화에 발맞추어 업무 시스템을 재정비하고자 하는 기업들로 하여금 소송에 보다 효과적으로 대처할 수 있도록 한다.