• 제목/요약/키워드: store value

검색결과 564건 처리시간 0.024초

CNN-LSTM 조합모델을 이용한 영화리뷰 감성분석 (Sentiment Analysis of Movie Review Using Integrated CNN-LSTM Mode)

  • 박호연;김경재
    • 지능정보연구
    • /
    • 제25권4호
    • /
    • pp.141-154
    • /
    • 2019
  • 인터넷 기술과 소셜 미디어의 빠른 성장으로 인하여, 구조화되지 않은 문서 표현도 다양한 응용 프로그램에 사용할 수 있게 마이닝 기술이 발전되었다. 그 중 감성분석은 제품이나 서비스에 내재된 사용자의 감성을 탐지할 수 있는 분석방법이기 때문에 지난 몇 년 동안 많은 관심을 받아왔다. 감성분석에서는 주로 텍스트 데이터를 이용하여 사람들의 감성을 사전 정의된 긍정 및 부정의 범주를 할당하여 분석하며, 이때 사전 정의된 레이블을 이용하기 때문에 다양한 방향으로 연구가 진행되고 있다. 초기의 감성분석 연구에서는 쇼핑몰 상품의 리뷰 중심으로 진행되었지만, 최근에는 블로그, 뉴스기사, 날씨 예보, 영화 리뷰, SNS, 주식시장의 동향 등 다양한 분야에 적용되고 있다. 많은 선행연구들이 진행되어 왔으나 대부분 전통적인 단일 기계학습기법에 의존한 감성분류를 시도하였기에 분류 정확도 면에서 한계점이 있었다. 본 연구에서는 전통적인 기계학습기법 대신 대용량 데이터의 처리에 우수한 성능을 보이는 딥러닝 기법과 딥러닝 중 CNN과 LSTM의 조합모델을 이용하여 감성분석의 분류 정확도를 개선하고자 한다. 본 연구에서는 대표적인 영화 리뷰 데이터셋인 IMDB의 리뷰 데이터 셋을 이용하여, 감성분석의 극성분석을 긍정 및 부정으로 범주를 분류하고, 딥러닝과 제안하는 조합모델을 활용하여 극성분석의 예측 정확도를 개선하는 것을 목적으로 한다. 이 과정에서 여러 매개 변수가 존재하기 때문에 그 수치와 정밀도의 관계에 대해 고찰하여 최적의 조합을 찾아 정확도 등 감성분석의 성능 개선을 시도한다. 연구 결과, 딥러닝 기반의 분류 모형이 좋은 분류성과를 보였으며, 특히 본 연구에서 제안하는 CNN-LSTM 조합모델의 성과가 가장 우수한 것으로 나타났다.

클라우드 환경에서 MongoDB 기반의 비정형 로그 처리 시스템 설계 및 구현 (Design and Implementation of MongoDB-based Unstructured Log Processing System over Cloud Computing Environment)

  • 김명진;한승호;최운;이한구
    • 인터넷정보학회논문지
    • /
    • 제14권6호
    • /
    • pp.71-84
    • /
    • 2013
  • 컴퓨터 시스템 운용 간에 발생하는 많은 정보들이 기록되는 로그데이터는 컴퓨터 시스템 운용 점검, 프로세스의 최적화, 사용자 최적화 맞춤형 제공 등 다방면으로 활용되고 있다. 본 논문에서는 다양한 종류의 로그데이터들 중에서 은행에서 발생하는 대용량의 로그데이터를 처리하기 위한 클라우드 환경 하에서의 MongoDB 기반 비정형 로그 처리시스템을 제안한다. 은행업무간 발생하는 대부분의 로그데이터는 고객의 업무처리 프로세스 간에 발생하며, 고객 업무 프로세스 처리에 따른 로그데이터를 수집, 저장, 분류, 분석하기 위해서는 별도로 로그데이터를 처리하는 시스템을 구축해야만 한다. 하지만 기존 컴퓨팅환경 하에서는 폭발적으로 증가하는 대용량 비정형 로그데이터 처리를 위한 유연한 스토리지 확장성 기능, 저장된 비정형 로그데이터를 분류, 분석 처리할 수 있는 기능을 구현하기가 매우 어렵다. 이에 따라 본 논문에서는 클라우드 컴퓨팅 기술을 도입하여 기존 컴퓨팅 인프라 환경의 분석 도구 및 관리체계에서 처리하기 어려웠던 비정형 로그데이터를 처리하기 위한 클라우드 환경기반의 로그데이터 처리시스템을 제안하고 구현하였다. 제안한 본 시스템은 IaaS(Infrastructure as a Service) 클라우드 환경을 도입하여 컴퓨팅 자원의 유연한 확장성을 제공하며 실제로, 로그데이터가 장기간 축적되거나 급격하게 증가하는 상황에서 스토리지, 메모리 등의 자원을 신속성 있고 유연하게 확장을 할 수 있는 기능을 포함한다. 또한, 축적된 비정형 로그데이터의 실시간 분석이 요구되어질 때 기존의 분석도구의 처리한계를 극복하기 위해 본 시스템은 하둡 (Hadoop) 기반의 분석모듈을 도입함으로써 대용량의 로그데이터를 빠르고 신뢰성 있게 병렬 분산 처리할 수 있는 기능을 제공한다. 게다가, HDFS(Hadoop Distributed File System)을 도입함으로써 축적된 로그데이터를 블록단위로 복제본을 생성하여 저장관리하기 때문에 본 시스템은 시스템 장애와 같은 상황에서 시스템이 멈추지 않고 작동할 수 있는 자동복구 기능을 제공한다. 마지막으로, 본 시스템은 NoSQL 기반의 MongoDB를 이용하여 분산 데이터베이스를 구축함으로써 효율적으로 비정형로그데이터를 처리하는 기능을 제공한다. MySQL과 같은 관계형 데이터베이스는 복잡한 스키마 구조를 가지고 있기 때문에 비정형 로그데이터를 처리하기에 적합하지 않은 구조를 가지고 있다. 또한, 관계형 데이터베이스의 엄격한 스키마 구조는 장기간 데이터가 축적되거나, 데이터가 급격하게 증가할 때 저장된 데이터를 분할하여 여러 노드에 분산시키는 노드 확장이 어렵다는 문제점을 가지고 있다. NoSQL은 관계형 데이터베이스에서 제공하는 복잡한 연산을 지원하지는 않지만 데이터가 빠르게 증가할 때 노드 분산을 통한 데이터베이스 확장이 매우 용이하며 비정형 데이터를 처리하는데 매우 적합한 구조를 가지고 있는 비관계형 데이터베이스이다. NoSQL의 데이터 모델은 주로 키-값(Key-Value), 컬럼지향(Column-oriented), 문서지향(Document-Oriented)형태로 구분되며, 제안한 시스템은 스키마 구조가 자유로운 문서지향(Document-Oriented) 데이터 모델의 대표 격인 MongoDB를 도입하였다. 본 시스템에 MongoDB를 도입한 이유는 유연한 스키마 구조에 따른 비정형 로그데이터 처리의 용이성뿐만 아니라, 급격한 데이터 증가에 따른 유연한 노드 확장, 스토리지 확장을 자동적으로 수행하는 오토샤딩 (AutoSharding) 기능을 제공하기 때문이다. 본 논문에서 제안하는 시스템은 크게 로그 수집기 모듈, 로그 그래프생성 모듈, MongoDB 모듈, Hadoop기반 분석 모듈, MySQL 모듈로 구성되어져 있다. 로그 수집기 모듈은 각 은행에서 고객의 업무 프로세스 시작부터 종료 시점까지 발생하는 로그데이터가 클라우드 서버로 전송될 때 로그데이터 종류에 따라 데이터를 수집하고 분류하여 MongoDB 모듈과 MySQL 모듈로 분배하는 기능을 수행한다. 로그 그래프생성 모듈은 수집된 로그데이터를 분석시점, 분석종류에 따라 MongoDB 모듈, Hadoop기반 분석 모듈, MySQL 모듈에 의해서 분석되어진 결과를 사용자에게 웹 인터페이스 형태로 제공하는 역할을 한다. 실시간적 로그데이터분석이 필요한 로그데이터는 MySQL 모듈로 저장이 되어 로그 그래프생성 모듈을 통하여 실시간 로그데이터 정보를 제공한다. 실시간 분석이 아닌 단위시간당 누적된 로그데이터의 경우 MongoDB 모듈에 저장이 되고, 다양한 분석사항에 따라 사용자에게 그래프화해서 제공된다. MongoDB 모듈에 누적된 로그데이터는 Hadoop기반 분석모듈을 통해서 병렬 분산 처리 작업이 수행된다. 성능 평가를 위하여 로그데이터 삽입, 쿼리 성능에 대해서 MySQL만을 적용한 로그데이터 처리시스템과 제안한 시스템을 비교 평가하였으며 그 성능의 우수성을 검증하였다. 또한, MongoDB의 청크 크기별 로그데이터 삽입 성능평가를 통해 최적화된 청크 크기를 확인하였다.

한국의 세계기록유산 보존 현황 및 과제 (Preservation of World Records Heritage in Korea and Further Registry)

  • 김성수
    • 한국기록관리학회지
    • /
    • 제5권2호
    • /
    • pp.27-48
    • /
    • 2005
  • 이 논문은 한국의 세계기록유산에 대하여 먼저 그 의미와 가치를 재확인하고, 이들 세계기록유산에 대한 보존 관리 및 그 현황을 조사하며, 한국의 기록유산을 디지털화 하는데 있어서의 문제점과 해결책을 모색하고, 추후 한국의 기록유산 중 세계기록유산으로 등록되기를 희망하는 4종의 기록물들에 대한 가치와 의의를 고찰한 연구이다. 본 연구의 상세 사항은 다음과 같다. 첫째, 제2장에서는 한국의 세계기록유산에 대한 가치와 의의를 고찰하였다. 먼저 세계기록유산의 선정기준과 절차 등을 먼저 파악하고, 한국의 세계기록유산인 "훈민정음" "조선왕조실록" "승정원일기" "직지(백운화상초록불조직지심체요절(白雲和尙抄錄佛祖直指心體要節))"에 대하여 각각 그 가치와 의미를 분석하였다. 둘째, 제3장에서는 '한국의 세계기록유산 보존 관리 현황'에서는 세계기록유산을 보존하고 있는 <서울대학교 규장각> <국가기록원 부산기록정보센터> <간송미술관>의 기관별로 그 보존 관리 현황을 고찰하였다. 그 결과, 이 3기관 모두 세계기록유산 보존 관리 현황은 '매우 우수하다'고 평가할 수 있었다. 즉, 1)그 세부적인 보안대책이 완벽하다. 2)그 보존방법에 있어서도 항온 항습의 특별한 서고를 별도로 마련하고, 이 서고 내에서 다시 '오동나무 상자 서장(書欌)'을 설치한 후, 이들 상자와 서장 속에 세계기록유산을 납입하여 보존하고 있다. 3)방화장치와 서고조명 및 소독 등에도 철저를 기하고 있음 등을 파악하였다. 셋째, 제4장에서는 '한국의 기록유산 디지털화 과제'에 대하여 개괄적으로 고찰하였다. 그 결과, 한국 기록유산의 디지털작업 및 DB구축에서 '디지털화 표준'이 가장 중요한 문제이며, 이 문제의 해결을 위해서는 디지털화(Digitization)에 대한 총체적이고 표준적인 시스템의 개발이 시급함을 지적하였다. 그리고 국가기록관리시스템을 개발한 경험이 있는 <국가기록원>과 한국학 고기록물의 디지털화에 많은 관심을 가진 <문화재청>이 공동으로 노력하여, 한국학 관련 기록유산의 디지타이제이션(Digitization)에 대한 총체적이고 표준적인 시스템의 개발이 요구됨을 파악하였다. 넷째, 제5장 '세계기록유산 등록을 추후 희망하는 한국의 기록유산'에서는 한민족의 기록유산 중에서 차후 세계기록유산으로 등재되기를 희망하는 4종 즉, 1)<해인사 고려대장경 경판>, 2)"동의보감", 3)"삼국유사", 4)"무구정광대다라니경"의 기록물에 국한하여, 그 어떤 의미에서 세계적인 가치와 의의가 있는가를 고찰하였다.

온라인 서비스 품질이 고객만족 및 충성의도에 미치는 영향 -항공권 예약.발권 웹사이트를 중심으로- (The Effects of Online Service Quality on Consumer Satisfaction and Loyalty Intention -About Booking and Issuing Air Tickets on Website-)

  • 박종기;고도은;이승창
    • 한국유통학회지:유통연구
    • /
    • 제15권3호
    • /
    • pp.71-110
    • /
    • 2010
  • 본 연구에서는 항공권 예약 발권 웹사이트의 서비스 품질을 측정 뿐만 아니라 서비스 회복도 측정하고자 하였다. 또한 서비스 품질과 서비스 회복이 고객만족 및 충성의도에 미치는 영향관계를 실증하고자 하였다. 온라인 서비스 품질과 온라인 서비스 회복의 측정을 위해 Parasuraman, Zeithaml, & Malhotra(2005)가 개발한 E-S-QUAL과 E-RecS-QUAL을 사용했으며, 했다. E-S-QUAL은 온라인 서비스 품질을 측정하는 도구로써, 효율성, 시스템 이용가능성, 이행성, 프라이버시의 4개 차원 22개 항목으로 구성된다. E-RecS-QUAL은 온라인 서비스 회복을 측정하는 도구로써, 반응, 보상, 접촉의 3개 차원 11개 항목으로 구성된다. 실증분석을 위한 설문조사는 항공사나 여행사의 웹사이트를 통해 국내 외 항공권을 구입해 본 경험이 있는 소비자를 대상으로 실시하였는데, 총 400부가 회수되었고, 이 중 342부를 최종분석에 사용하였다. 실증분석을 위해 AMOS 7.0과 SPSS 15.0을 사용하였다. 먼저, SPSS 15.0을 사용하여, 요인점수를 이용한 회귀분석으로 가설검증을 한 결과, <가설 I-1, 2, 3, 4, II-1, 2, 3, III-1, IV-1>이 전부 채택되었다. 온라인 서비스 품질과 온라인 서비스 회복의 각 차원은 모두 전반적인 서비스 품질에 유의한 영향을 보였고, 전반적인 서비스 품질은 고객만족에 유의한 영향을 미쳤다. 마지막으로 고객만족 역시 충성의도에 유의한 영향을 미치는 것으로 확인되었다. 한편 AMOS 7.0을 사용하여 모형 분석을 하였는데, 모형의 적합도는 가설검증을 하기에 합당한 수치가 나왔다. 이를 토대로 가설검증을 한 결과, <가설 I-1, 3, II-1, 3, III-1, IV-1>은 채택되었고, <가설 I-2, 4, II-2>는 기각되었다. 이 결과는 Parasuraman et al.(2005)이 주장한 것처럼 E-S-QUAL을 나타내는 데는 요인점수를 이용한 회귀분석이 더 적합하다는 것을 보여주는 것이라고 판단된다. 이를 토대로 본 연구의 시사점을 정리하였다.

  • PDF