• 제목/요약/키워드: Library Network

검색결과 727건 처리시간 0.023초

영화 리뷰 감성분석을 위한 텍스트 마이닝 기반 감성 분류기 구축 (A Study on Analyzing Sentiments on Movie Reviews by Multi-Level Sentiment Classifier)

  • 김유영;송민
    • 지능정보연구
    • /
    • 제22권3호
    • /
    • pp.71-89
    • /
    • 2016
  • 누구나 본인이 사용한 제품이나, 이용한 서비스에 대한 후기를 자유롭게 인터넷에 작성할 수 있고, 이러한 데이터의 양은 점점 더 많아지고 있다. 감성분석은 사용자가 생성한 온라인 텍스트 속에 내포된 감성 및 감정을 식별하기 위해 사용된다. 본 연구는 다양한 데이터 도메인 중 영화 리뷰를 분석 대상으로 한다. 영화 리뷰를 이용한 기존 연구에서는 종종 리뷰 평점을 관객의 감성으로 동일시하여 감성분석에 이용한다. 그러나 리뷰 내용과 평점의 실제적 극성 정도가 항상 일치하는 것은 아니기 때문에 연구의 정확성에 한계가 발생할 수 있다. 이에 본 연구에서는 기계학습 기반의 감성 분류기를 구축하고, 이를 통해 리뷰의 감성점수를 산출하여 리뷰에서 나타나는 감성의 수치화를 목표로 한다. 나아가 산출된 감성점수를 이용하여 리뷰와 영화 흥행 간의 연관성을 살펴보았다. 감성분석 모델은 지지벡터 분류기와 신경망을 이용해 구축되었고, 총 1만 건의 영화 리뷰를 학습용 데이터로 하였다. 감성분석은 총 175편의 영화에 대한 1,258,538개의 리뷰에 적용하였다. 리뷰의 평점과 흥행, 그리고 감성점수와 흥행과의 연관성은 상관분석을 통해 살펴보았고, t-검정으로 두 지표의 평균차를 비교하여 감성점수의 활용성을 검증하였다. 연구 결과, 본 연구에서 제시하는 모델 구축 방법은 나이브 베이즈 분류기로 구축한 모델보다 높은 정확성을 보였다. 상관분석 결과로는, 영화의 주간 평균 평점과 관객 수 간의 유의미한 양의 상관관계가 나타났고, 감성점수와 관객 수 간의 상관분석에서도 유사한 결과가 도출되었다. 이에 두 지표간의 평균을 이용한 t-검정을 수행하고, 이를 바탕으로 산출한 감성점수를 리뷰 평점의 역할을 할 수 있는 지표로써 활용 가능함을 검증하였다. 나아가 검증된 결론을 근거로, 트위터에서 영화를 언급한 트윗을 수집하여 감성분석을 적용한 결과를 살펴봄으로써 감성분석 모델의 활용 방안을 모색하였다. 전체적 실험 및 검증의 과정을 통해 본 연구는 감성분석 연구에 있어 개선된 감성 분류 방법을 제시할 수 있음을 보였고, 이러한 점에서 연구의 의의가 있다.

텍스트 마이닝을 이용한 감정 유발 요인 'Emotion Trigger'에 관한 연구 (A Study of 'Emotion Trigger' by Text Mining Techniques)

  • 안주영;배정환;한남기;송민
    • 지능정보연구
    • /
    • 제21권2호
    • /
    • pp.69-92
    • /
    • 2015
  • 최근 소셜 미디어의 사용이 폭발적으로 증가함에 따라 이용자가 직접 생성하는 방대한 데이터를 분석하기 위한 다양한 텍스트 마이닝(text mining) 기법들에 대한 연구가 활발히 이루어지고 있다. 이에 따라 텍스트 분석을 위한 알고리듬(algorithm)의 정확도와 수준 역시 높아지고 있으나, 특히 감성 분석(sentimental analysis)의 영역에서 언어의 문법적 요소만을 적용하는데 그쳐 화용론적 의미론적 요소를 고려하지 못한다는 한계를 지닌다. 본 연구는 이러한 한계를 보완하기 위해 기존의 알고리듬 보다 의미 자질을 폭 넓게 고려할 수 있는 Word2Vec 기법을 적용하였다. 또한 한국어 품사 중 형용사를 감정을 표현하는 '감정어휘'로 분류하고, Word2Vec 모델을 통해 추출된 감정어휘의 연관어 중 명사를 해당 감정을 유발하는 요인이라고 정의하여 이 전체 과정을 'Emotion Trigger'라 명명하였다. 본 연구는 사례 연구(case study)로 사회적 이슈가 된 세 직업군(교수, 검사, 의사)의 특정 사건들을 연구 대상으로 선정하고, 이 사건들에 대한 대중들의 인식에 대해 분석하고자 한다. 특정 사건들에 대한 일반 여론과 직접적으로 표출된 개인 의견 모두를 고려하기 위하여 뉴스(news), 블로그(blog), 트위터(twitter)를 데이터 수집 대상으로 선정하였고, 수집된 데이터는 유의미한 연구 결과를 보여줄 수 있을 정도로 그 규모가 크며, 추후 다양한 연구가 가능한 시계열(time series) 데이터이다. 본 연구의 의의는 키워드(keyword)간의 관계를 밝힘에 있어, 기존 감성 분석의 한계를 극복하기 위해 Word2Vec 기법을 적용하여 의미론적 요소를 결합했다는 점이다. 그 과정에서 감정을 유발하는 Emotion Trigger를 찾아낼 수 있었으며, 이는 사회적 이슈에 대한 일반 대중의 반응을 파악하고, 그 원인을 찾아 사회적 문제를 해결하는데 도움이 될 수 있을 것이다.

텍스트 마이닝을 활용한 신문사에 따른 내용 및 논조 차이점 분석 (A Study on Differences of Contents and Tones of Arguments among Newspapers Using Text Mining Analysis)

  • 감미아;송민
    • 지능정보연구
    • /
    • 제18권3호
    • /
    • pp.53-77
    • /
    • 2012
  • 본 연구는 경향신문, 한겨레, 동아일보 세 개의 신문기사가 가지고 있는 내용 및 논조에 어떠한 차이가 있는지를 객관적인 데이터를 통해 제시하고자 시행되었다. 본 연구는 텍스트 마이닝 기법을 활용하여 신문기사의 키워드 단순빈도 분석과 Clustering, Classification 결과를 분석하여 제시하였으며, 경제, 문화 국제, 사회, 정치 및 사설 분야에서의 신문사 간 차이점을 분석하고자 하였다. 신문기사의 문단을 분석단위로 하여 각 신문사의 특성을 파악하였고, 키워드 네트워크로 키워드들 간의 관계를 시각화하여 신문사별 특성을 객관적으로 볼 수 있도록 제시하였다. 신문기사의 수집은 신문기사 데이터베이스 시스템인 KINDS에서 2008년부터 2012년까지 해당 주제로 주제어 검색을 하여 총 3,026개의 수집을 하였다. 수집된 신문기사들은 불용어 제거와 형태소 분석을 위해 Java로 구현된 Lucene Korean 모듈을 이용하여 자연어 처리를 하였다. 신문기사의 내용 및 논조를 파악하기 위해 경향신문, 한겨레, 동아일보가 정해진 기간 내에 일어난 특정 사건에 대해 언급하는 단어의 빈도 상위 10위를 제시하여 분석하였고, 키워드들 간 코사인 유사도를 분석하여 네트워크 지도를 만들었으며 단어들의 네트워크를 통해 Clustering 결과를 분석하였다. 신문사들마다의 논조를 확인하기 위해 Supervised Learning 기법을 활용하여 각각의 논조에 대해 분류하였으며, 마지막으로는 분류 성능 평가를 위해 정확률과 재현률, F-value를 측정하여 제시하였다. 본 연구를 통해 문화 전반, 경제 전반, 정치분야의 통합진보당 이슈에 대한 신문기사들에 전반적인 내용과 논조에 차이를 보이고 있음을 알 수 있었고, 사회분야의 4대강 사업에 대한 긍정-부정 논조에 차이가 있음을 발견할 수 있었다. 본 연구는 지금까지 연구되어왔던 한글 신문기사의 코딩 및 담화분석 방법에서 벗어나, 텍스트 마이닝 기법을 활용하여 다량의 데이터를 분석하였음에 의미가 있다. 향후 지속적인 연구를 통해 분류 성능을 보다 높인다면, 사람들이 뉴스를 접할 때 그 뉴스의 특정 논조 성향에 대해 우선적으로 파악하여 객관성을 유지한 채 정보에 접근할 수 있도록 도와주는 신뢰성 있는 툴을 만들 수 있을 것이라 기대한다.

캥거루 케어가 미숙아와 어머니에게 미치는 효과 : 체계적 문헌고찰 및 메타분석 (Effects for kangaroo care: systematic review & meta analysis)

  • 임정희;김가은;신영희
    • 한국산학기술학회논문지
    • /
    • 제17권3호
    • /
    • pp.599-610
    • /
    • 2016
  • 본 연구는 미숙아와 어머니를 대상으로 캥거루 케어 효과를 비교하기 위해 수행된 체계적 문헌고찰 및 메타분석 연구이다. 2015년 2월까지 출간된 무작위 임상실험연구를 검토하였으며, 국내문헌은 연구설계수준에 따른 제한 없이 비무작위 임상실험연구를 포함하였다. 문헌은 Ovid-Medline, CINAHL, PubMed와 국내 DB인 KoreaMed, 국립중앙도서관, 국회도서관, 국가과학기술전자도서관, KISS, RISS, 한국의학논문을 통해 ((kangaroo OR KC OR skin-to-skin) AND (care OR contact)) AND (infant OR preterm OR Low Birth Weight OR LBW), ((캥거루 OR 캉가루 OR 캉가루식) AND (케어 OR 간호 OR 관리 OR 돌보기 OR 피부접촉)) 등을 주요어로 조합하여 검색하였으며, 선택배제과정을 거쳐 최종 25편(n=3051)의 문헌이 분석에 포함되었다. 문헌에 대한 질평가는 SIGN에서 제시한 평가도구를 사용하였으며, 질평가 결과는 16편에서 ++, 9편에서 +로 평가되어 전반적으로 비뚤림 위험은 없는 것으로 판단하였다. 미숙아를 대상으로 한 캥거루 케어의 효과에 대한 메타분석 결과, 미숙아 사망률, 중증 감염/패혈증 발생률, 저체온 발생률, 병원입원기간, 모유수유율, 수면상태, 어머니의 불안, 어머니 역할수행 자신감, 어머니 역할수행 만족도에서 통계적으로 유의한 효과가 있었으며, 고체온 발생률, 미숙아의 성장발달(신장, 체중), 모아애착, 우울, 스트레스는 유의미한 차이가 없었다. 국내에서 캥거루 케어에 대한 무작위 임상실험연구 수가 적어 효과크기에 대한 확증적 결과를 얻는 데에는 다소 제한이 있었으므로 향후 이와 관련된 무작위 임상실험연구의 효과검증에 대한 노력이 지속적으로 이루어져야 할 것으로 사료된다.

무릎 골관절염 환자를 대상으로 한 수중 운동과 지상운동 비교: 체계적 문헌고찰 및 메타분석 (Aquatic exercise for the treatment of knee osteoarthritis: a systematic review & meta analysis)

  • 김영일;최효신;한정화;김주영;김가은
    • 한국산학기술학회논문지
    • /
    • 제16권9호
    • /
    • pp.6099-6111
    • /
    • 2015
  • 본 연구는 무릎 골관절염 환자를 대상으로 수중운동과 지상운동의 효과를 비교하기 위해 수행된 체계적 문헌고찰 및 메타분석 연구이다. 문헌은 Ovid-Medline, Cochrane Library CENTRAL, CINAHL과 국내 DB인 RISS와 KISS를 통해 ((osteoarthriti* OR OA) AND (aqua* OR water OR hydrotherap*)), (골관절염 AND 수중운동) 등을 주요어로 조합하여 검색하였으며, 선택배제과정을 거쳐 최종 7편(n=449)의 문헌이 분석에 포함되었다. 문헌에 대한 질 평가는 SIGN의 무작위임상시험평가도구를 사용하였으며, 질 평가 결과는 6편에서 ++, 1편에서 +로 평가되어 전반적으로 비뚤림 위험은 없는 것으로 판단하였다. 메타분석결과 운동 중재 후 수중운동군과 지상운동군의 통증변화에 대한 차이는 Standardized mean difference (SMD) -0.26(95% CI -0.49, -0.03, p=0.03, $I^2=14%$)으로 수중운동군이 지상운동군에 비해 통증이 통계적으로 유의하게 감소하는 것으로 나타났으나, 그 외 두 군간 굴곡 관절가동범위, 신전 관절가동범위, 신체기능, 삶의 질의 SMD는 각각 -0.12(95% CI -0.51, 0.27, p=0.53, $I^2=0%$), -0.04(95% CI -0.55, 0.48, p=0.89, $I^2=43%$), -0.12(-0.44, 0.19, p=0.44, $I^2=0%$), -0.15(-0.54, 0.24, p=0.46, $I^2=0%$)로 두 군간 통계적으로 유의한 차이가 없는 것으로 나타났다. 현재 시점에서 무릎 골관절염환자를 대상으로 수중운동과 지상운동의 효과를 분석한 무작위 대조군 실험 연구 수가 비교적 적어 효과크기에 대한 확증적 결과를 얻는 데에는 다소 제한이 있었으므로 향후 이와 관련된 무작위 임상시험연구와 장기적인 효과검증에 대한 노력이 지속적으로 이루어져야 할 것으로 사료된다.

온톨로지와 토픽모델링 기반 다차원 연계 지식맵 서비스 연구 (A Study on Ontology and Topic Modeling-based Multi-dimensional Knowledge Map Services)

  • 정한조
    • 지능정보연구
    • /
    • 제21권4호
    • /
    • pp.79-92
    • /
    • 2015
  • 미래 핵심 가치 기술 발굴 및 탐색을 위해서는 범국가적인 국가R&D정보와 과학기술정보의 연계 융합이 필요하다. 본 논문에서는 국가R&D정보와 과학기술정보를 온톨로지와 토픽모델링을 사용하여 연계 융합하여 지식베이스를 구축한 방법론을 소개하고, 이를 기반으로 한 다차원 연계 지식맵 서비스를 소개한다. 국가R&D정보는 국가R&D과제와 참여인력, 해당 과제에 대한 성과 정보, 논문, 특허, 연구보고서 정보들을 포함한다. 과학기술정보는 논문, 특허, 동향 등의 과학기술연구에 대한 기술 문서를 일컫는다. 본 논문에서는 지식베이스에서의 지식 처리 및 관리의 효율성을 높이기 위해 Lightweight 온톨로지를 사용한다. Lightweight 온톨로지는 국가R&D과제 참여자와 성과정보, 과학기술정보를 과제-성과 관계, 문서-저자 관계, 저자-소속기관 관계 등의 단순한 연관관계를 이용하여 국가R&D정보와 과학기술정보를 융합한다. 이러한 단순한 연관관계만을 이용함으로써 지식 처리의 효율성을 높이고 온톨로지 구축 과정을 자동화한다. 보다 구체적인 Concept 레벨에서의 온톨로지 구축을 위해 토픽모델링을 활용한다. 토픽모델링을 활용하여 국가R&D정보와 과학기술정보 문서들의 토픽 주제어를 추출하고 각 문서 간 연관관계를 추출한다. 일반적인 Concept 레벨에서의 Fully-Specified 온톨로지를 구축하기 위해서는 거의 100% 수동으로 해야 하기 때문에, 많은 시간과 비용이 소모된다. 본 연구에서는 이러한 수동적인 온톨로지 구축이 아닌 자동화된 온톨로지 구축을 위해 토픽모델링을 활용한다. 토픽모델링을 활용하여 온톨로지 구축에 필요한 문서와 토픽 키워드 간의 관계, 문서 간 의미 상 연관관계를 자동으로 추출한다. 마지막으로, 이와 같이 구축된 지식베이스의 트리플(Triple) 정보를 활용하여, 연구자들의 공동저자관계, 문서간의 공통주제어관계 등을 연구자, 주제어, 기관, 저널 등의 다차원 연관관계를 방사형 네트워크 형식을 이용하여 시각화한 지식맵 서비스들을 소개한다.

모바일 웹을 지원하는 응용 독립적 멀티미디어 적응 프레임워크 (An Application-Independent Multimedia Adaptation framework for the Mobile Web)

  • 전성미;임영환
    • 인터넷정보학회논문지
    • /
    • 제6권6호
    • /
    • pp.139-148
    • /
    • 2005
  • 차세대 웹인 모바일 웹에 대한 멀티미디어 서비스 욕구는 PC수준이 될 것이며, 이를 지원할 수 있는 단말기 제작 기술, 통신 기술, 서비스 및 표준화 노력들이 진행되고 있다. 모바일 웹 환경에서는 다양한 단말기 종류, 네트워크 능력 및 사용자 선호등을 지원하여 멀티미디어 컨텐츠의 적응 서비스가 가능하도록 하여야 한다. 이것은 목적지인 단말기의 하드웨어 사양과 재생서비스 품질의 다양성으로 인하여 멀티미디어 컨텐츠의 재생 서비스 품질이 고정되어 있지 않음을 의미한다. 만일 새로운 사용자가 새로운 종류의 단말기를 통하여 서버의 멀티미디어 컨텐츠를 재생하려고 한다면, 기존 트랜스코더로 멀티미디어 적응이 가능한지 고려하여야 한다. 그런데 현재 사용되는 멀티미디어 적응 라이브러리들은 하나의 라이브러리에 모든 적응 기능을 넣은 중량 트랜스코더의(heavy transcoder) 형태이다. 이러한 중량 트랜스코더로 제한없는 접속(Universal Access)의 도전을 해결하는 것은 너무 복잡하다. 따라서 본 논문에서는 다양한 새로운 모바일 단말기의 서비스 품질을 만족하는 응용 독립적 멀티미디어 적응 프레임워크를 제안한다. 이것은 중량 트랜스코더대신 하나의 트랜스고딩 기능만을 갖는 단위 트랜스코더들의 집합을 갖는다. 또한 종단간 서비스 품질을 만족하도록 단위 트랜스코더들의 동적 연결을 지원하는 트랜스코더 관리자를 포함한다.

  • PDF

M2M 기술을 이용한 스마트 선박 컨테이너 (Smart Ship Container With M2M Technology)

  • 로네쉬 샤르마;이성로
    • 한국통신학회논문지
    • /
    • 제38C권3호
    • /
    • pp.278-287
    • /
    • 2013
  • 현대 정보 기술은 새롭고 개선된 방법으로 여러 산업들에 지속적인 제공을 하고 있다. 본 논문에서 고려한 스마트 컨테이너 공급망 관리는 사물지능(M2M)통신의 급속한 발전과 함께 고성능 센서, 컴퓨터 비전, GPS, GSM을 기반으로 형성된다. 기존 공급망관리는 실시간 컨테이너 추적에 제한이 있다는 문제점을 가지고 있다. 본 논문은 인터럽트 및 보통 정기적인 알림에 대한 컨테이너 식별 시스템과 자동 알림 시스템의 개발과 실시간 컨테이너 공급망관리의 연구 및 구현에 초점을 맞추었다. 첫째, 본 논문은 컨테이너 코드 식별 및 실시간 작업에 대해 컴퓨터 비전 라이브러리와 OCR 엔진을 비주얼 스튜디오 2010으로 구현된 식별 알고리즘을 제안하고 있다. 둘째는 실시간 컨테이너 추적 및 그 시스템의 한계에 대해 제공되는 현재 자동 알림 시스템에 대해 설명한다. 마지막으로 본 논문은 고성능 센서와 컴퓨터 비전과 함께 유비쿼터스 모바일 및 위성 네트워크와 실시간 컨테이너 추적 솔루션의 미래에 도전과 가능성을 요약하였다. 뛰어난 운영 및 보안 공급망관리의 우수한 전송을 제공하기 위해 이러한 모든 구성요소를 결합하였다.

만성요통을 가진 중년 여성의 운동요법에 대한 국내 연구논문 분석 (Analyses of Studies on Exercise Therapy for Middle-Age Women with Chronic Low Back Pain in Korea)

  • 곽혜원;김나현
    • 한국산학기술학회논문지
    • /
    • 제17권6호
    • /
    • pp.389-399
    • /
    • 2016
  • 본 연구의 목적은 최근 10년간(2005-2014) 만성 요통을 가진 중년 여성을 대상으로 국내에서 실시된 운동중재 연구의 현황을 파악하고, 운동 중재 연구의 효과를 알아보기 위해 시도된 것이다. 문헌검색은 한국교육학술정보원(http://www.riss.kr), 국회도서관, 한국학술정보(http://kiss.kstudy.com)와 DBpia(http://www.dbpia.co.kr)를 통해 검색하였다. PRISMA(preferred reporting items for systematic reviews and meta-analysis, 2008) 가이드라인에 따라 자료를 수집한 후 연구자가 원본을 확인하고, 선별하여 총 12편의 논문을 최종 분석하였다. 분석한 논문 중 간호학 전공 논문은 1편이었으며, 11편은 타과 논문이었다. Scottish Intercollegiate Guideline Network의 체크리스트를 참고하여 논문의 질적 평가를 실시하였다. 논문의 질적 평가내용을 종합한 결과, 10점 만점에 8점인 연구가 1편이었으며, 5-6점인 연구는 8편 이었고, 3-4점인 연구가 3편이었다. 운동 중재내용을 분석한 결과 평균 55분을 시행하였으며, 1주일에 평균 3.1회의 빈도로 총 시행횟수는 평균 29.7회로 진행되었다. 연구 결과 요부신경근 조절운동, 요가운동, 수중운동이 중년여성의 요통에 효과가 있는 것으로 나타났으며, 향후 이를 간호학 중재로 활용하여 근거기반 간호실무의 토대를 마련할 수 있을 것이다.

Serratia marcescens에서 cAMP receptor protein(CRP) 유전자의 클로닝 해석 (Analysis and cloning of cAMP receptor protein(CRp) gene in Serratia marcescens)

  • 유주순;김혜선;문종환;정수열;최용락
    • 생명과학회지
    • /
    • 제8권3호
    • /
    • pp.263-271
    • /
    • 1998
  • 전사조절인자로서 잘 알려져 있는 cAMP receptor protein(CRP)은 cAMP와 DNA에 결합하는 특별한 활성을 가지고 있으며, cAMP-CRP complex를 형성하여 수많은 유전자의 발현조절에 관여한다. 이러한 측면에서 cAMP-CRP의 조절은 어떤 면에서 총체적 조절체계라고까지 한다.본 연구는 Serratia 균주에서 crp 유전자의 분자적 특성 및 cAMP에 의한 발현조절을 받는 분자기구를 해석하고자 유전자를 클로닝하고 발현을 확인하였다. MacConkey 배지에서 maltose를 탄소원으로 충분히 이용하지 못하는 대장균 TP2139(${\Delta}crp$,${\Delta}lac$를 숙주로 이용하고, 염색체 DNA를 library로 작성하여 얻은 형질전환체 약 일만개의 콜로니에서 red colony를 나타내는 5종류의 양성 클론을 얻었다. 이들 클론을 Southern 방법으로 확인한 결과 3kh의 단편을 가진 pCKB12클론이 crp유전자를 coding하고 있음을 확인하였다. glpD-lacZ 융합 plasmid인 pLDC6의 BamHI부위에 pCKB12의 3kb 단편을 삽입시킨 재조합 plasmid pLDC6-Scrp를 작성하여, 클로닝된 Serratia의 crp유전자가 대장균에서 유전자 전사조절에 미치는 영향을 확인한 결과 cAMP-CRP 복합체 형성에 의한 전사조절 기능이 확인되어졌다.

  • PDF