• 제목/요약/키워드: 서비스기반

검색결과 18,484건 처리시간 0.044초

국내 홍수회복력 지표 개발과 적용성 및 중요도 평가 (Developing domestic flood resilience indicators and assessing applicability and significance)

  • 김수홍;정기철;강형식;신서영;김지은;박대룡
    • 한국수자원학회논문집
    • /
    • 제57권8호
    • /
    • pp.533-548
    • /
    • 2024
  • 최근 기후변화와 이상기후로 인해 지금까지 경험하지 못했던 극한 강우의 발생이 빈번해지고 있다. 홍수 피해 자체를 완벽히 예측하거나 제거하는 것은 한계가 존재하여 기존의 예방 중심의 대응보다는 신속히 이전의 상태로 복구하거나 더 나은 상태로 개선하는 능력을 의미하는 '회복력(Resilience)' 개념이 중시되고 있다. 본 연구에서는 1) 4R (가외성(Redundancy), 내구성(Robustness), 신속성(Rapidity), 자원부존성(Resourcefulness))을 기반으로 국내 홍수회복력 지표를 개발하였다. 특별재난지역을 대상으로 적용성 평가를 수행하였으며 개발된 홍수회복력 지표의 적합성을 확인하기 위해 다중공선성 분석을 수행하였다. 분석 결과 20개 지표 모두 공차 한계 0.1 이상, VIF (Variance Inflation Factor) 10 미만으로 다중공선성이 존재하지 않아 인자로서의 적합성을 갖는 것으로 판단하였다. 또한 각 지표의 상대적 중요도를 판단하기 위해 AHP 분석 방법을 활용하였다. 분석 결과, 지표별 중요도는 내구성 0.46, 신속성 0.22, 가외성 0.17, 자원동원력이 0.16으로 내구성이 가장 큰 중요도를 나타냈다. 4R의 항목별로 가장 큰 영향을 미친 세부 지표의 경우 내구성은 하천제방 정비, 신속성은 보건의료서비스, 자원동원력은 지방자치단체 재정자립도, 가외성은 배수시설로 나타났다. 본 연구는 특별재난지역을 대상으로 회복력에 영향을 미치는 요인을 분석함으로써 국가에서 홍수의 예방 및 대응을 전략적으로 관리할 수 있는 기초를 마련하였다는 점에서 의의가 있다.

광주시(光州市) 의료시설(醫療施設)의 입지(立地)와 주민(住民)의 효율적(效率的) 이용(利用) (The Location of Medical Facilities and Its Inhabitants' Efficient Utilization in Kwangju City)

  • 전경숙
    • 한국지역지리학회지
    • /
    • 제3권2호
    • /
    • pp.163-193
    • /
    • 1997
  • 복지사회를 지향하는 오늘날, 건강 중진에 직접 관계되는 의료시설의 접근성 문제는 주요 과제이다. 특히 삶의 질이라는 측면에서 질병의 치료 외에 건강진단, 예방과 회복, 요양 및 응급서비스의 비중이 커지고, 인구의 노령화 현상이 진전되면서 의료시설의 효율적인 입지가 주 관심사로 대두되고 있다. 의료시설은 주민의 생존과 직접 관계되는 기본적이고도 필수적인 중심시설로, 지역 주민은 균등한 혜택을 받을 수 있어야 한다. 이를 실현시키기 위해서는 기본적으로는 효율성과 평등성을 기반으로 1차 진료기관이 균등 분포해야 한다. 이에 본 연구에서는, 광주시를 사례지역으로 선정하여 의료시설의 입지와 그에 대한 주민의 효율적 이용에 관하여 분석하였다. 분석에 있어서는 통계자료와 기존의 연구 성과 외에 설문 및 현지조사 자료를 기반으로 시설 측면과 이용자 측면을 동시에 고찰하였다. 우선 의료 환경의 변화 및 의료시설의 변화 과정을 고찰하고, 이어서 의료시설의 유형별 입지 특성과 주민의 분포 특성을 고려한 지역별 의료수준을 분석하였다. 그리고 유형별 의료시설의 이용행태와 그 요인을 구명한 후, 마지막으로 장래 이용 유형의 예측과 문제지역의 추출, 나아가서는 시설의 합리적인 입지와 경영 방향을 제시하였다. 본 연구 결과는, 앞으로 신설될 의료시설의 적정 입지에 관한 기본 자료로서는 물론 지역 주민의 불평등성 해소라는 응용적 측면에서 의의를 지닌다.

  • PDF

온라인 언급이 기업 성과에 미치는 영향 분석 : 뉴스 감성분석을 통한 기업별 주가 예측 (Influence analysis of Internet buzz to corporate performance : Individual stock price prediction using sentiment analysis of online news)

  • 정지선;김동성;김종우
    • 지능정보연구
    • /
    • 제21권4호
    • /
    • pp.37-51
    • /
    • 2015
  • 인터넷 기술의 발전과 인터넷 상 데이터의 급속한 증가로 인해 데이터의 활용 목적에 적합한 분석방안 연구들이 활발히 진행되고 있다. 최근에는 텍스트 마이닝 기법의 활용에 대한 연구들이 이루어지고 있으며, 특히 문서 내 텍스트를 기반으로 문장이나 어휘의 긍정, 부정과 같은 극성 분포에 따라 의견을 스코어링(scoring)하는 감성분석과 관련된 연구들도 다수 이루어지고 있다. 이러한 연구의 연장선상에서, 본 연구는 인터넷 상의 특정 기업에 대한 뉴스 데이터를 수집하여 이들의 감성분석을 실시함으로써 주가의 등락에 대한 예측을 시도하였다. 개별 기업의 뉴스 정보는 해당 기업의 주가에 영향을 미치는 요인으로, 적절한 데이터 분석을 통해 주가 변동 예측에 유용하게 활용될 수 있을 것으로 기대된다. 따라서 본 연구에서는 개별 기업의 온라인 뉴스 데이터에 대한 감성분석을 바탕으로 개별 기업의 주가 변화 예측을 꾀하였다. 이를 위해, KOSPI200의 상위 종목들을 분석 대상으로 선정하여 국내 대표적 검색 포털 서비스인 네이버에서 약 2년간 발생된 개별 기업의 뉴스 데이터를 수집 분석하였다. 기업별 경영 활동 영역에 따라 기업 온라인 뉴스에 나타나는 어휘의 상이함을 고려하여 각 개별 기업의 어휘사전을 구축하여 분석에 활용함으로써 감성분석의 성능 향상을 도모하였다. 분석결과, 기업별 일간 주가 등락여부에 대한 예측 정확도는 상이했으며 평균적으로 약 56%의 예측률을 보였다. 산업 구분에 따른 주가 예측 정확도를 통하여 '에너지/화학', '생활소비재', '경기소비재'의 산업군이 상대적으로 높은 주가 예측 정확도를 보임을 확인하였으며, '정보기술'과 '조선/운송' 산업군은 주가 예측 정확도가 낮은 것으로 확인되었다. 본 논문은 온라인 뉴스 정보를 활용한 기업의 어휘사전 구축을 통해 개별 기업의 주가 등락 예측에 대한 분석을 수행하였으며, 향후 감성사전 구축 시 불필요한 어휘가 추가되는 문제점을 보완한 연구 수행을 통하여 주가 예측 정확도를 높이는 방안을 모색할 수 있을 것이다.

기술혁신역량이 기업의 지식경영성과에 미치는 요인에 관한 연구: 정부 중소벤처기업 R&D사업을 중심으로 (A Study on the Factors Influencing Technology Innovation Capability on the Knowledge Management Performance of the Company: Focused on Government Small and Medium Venture Business R&D Business)

  • 설동철;박철우
    • 벤처창업연구
    • /
    • 제15권4호
    • /
    • pp.193-216
    • /
    • 2020
  • 최근 글로벌 경제의 중장기적 불황과 성장률 하락에 기인하여, 대내외적으로 불투명한 환경하에서 생존하며 발전하기 위한 새로운 대안으로 새로운 서비스와 상품을 탄생시키고 생산방식의 변화와 업무 혁신 등으로 조직의 지속가능성을 높이는 기술혁신에 대한 관심이 날로 높아지고 있다. 이런 분위기 속에서 중소벤처기업의 성장은 국가 경제에 미치는 영향성이 지대하다는 것을 다수가 공감 중이며, 그런 중소벤처기업들이 기업 성과를 높이고 성과의 지속이 가능하도록 구성원들의 기술혁신 역량을 높이기 위한 여러 가지 노력이 지속되고 있다. 본 연구의 목적 역시 중소벤처 기업의 기술혁신 역량이 지식경영의 성과와 어떠한 상관관계를 가지고 있는가를 조사하고 기업의 전략적 활동을 조직화하여 가치 창출에 사용될 자원과 조직 능력을 외부 네트워크로부터 획득하게 하는 네트워크역량이 어떤 역할을 수행하는지에 대해 분석하여 확대 또는 강화해야 하는 영향요인을 정확히 파악하여 내·외부적인 역량을 강화하도록 하는 데 있다. 따라서 본 연구에서는 기술혁신역량이 중소벤처기업의 네트워크역량을 매개로 삼아, 기술혁신역량이 지식경영성과에 정(+)의 영향을 미칠 것이라는 가설을 검증하고자 한다. 기술혁신역량을 기반으로 한 경제활동이 코로나 등으로 불확실성이 높아진 환경에서 새로운 변화에 신속히 대응하며, 장기적 경기 침체 극복은 물론이고 거시적 경제 성장과 발전을 이끌어 조직의 지속적 성장과 생존뿐 아니라, 국가의 새로운 성장 동력이 될 수 있도록 해야 한다. 그리고 조직 내 가장 중요한 지식경영성과의 종속변수 설정을 통해서 본 연구를 진행하였다. 그 결과 기술혁신역량 중 연구개발역량과 학습역량은 재무적성과에 미치는 영향이 없는 것으로 나타났다. 그에 반해 기업혁신 활동은 재무적성과 및 비재무적성과에 모두 정(+)의 영향성을 가진 것으로 나타났다. 기술혁신역량을 활용하여 연구개발 활동을 하는 중소벤처기업 경영에서 무형적이며 비재무적인 요인 영향성이 확인되는 것은 선행연구 중 기업혁신 활동이 재무적성과에 영향성을 미친다는 다수의 연구와는 반대되는 결과이지만 일부 연구와는 유사한 결과이다. 이런 결과도출의 이유로는 조사기업들 다수의 업력이 7년 이상으로 스타트업 기업은 벗어났으나 매출은 100억 이하인 중소벤처기업들로서 매출 수익 일변도의 스타트업 시점과는 달리 연구개발역량과 학습역량이 재무적인 성과보다 무형적 비재무적성과에 긍정적 영향을 많이 끼치기 때문이라고 생각된다. 기업혁신 활동은 재무와 비재무적성과에 모두 긍정적(+)인 영향을 끼치는 것으로 나타났고, 연구개발역량과 학습역량은 네트워크역량을 매개변수로 재무적성과에 정(+)의 영향을 미치는 것으로 나타났다. 또한, 기업혁신 활동은 네트워크역량의 매개변수 영향성이 재무적성과와 비재무적성과 모두에 없는 것으로 나타났으며, 연구개발역량과 학습역량도 비재무적성과에는 영향성이 없었다. 네트워크역량의 매개변수 효과가 나타내는 것은 연구개발역량과 학습역량이 계량적 재무적성과를 도출할 때로 한정됨을 알 수 있다. 이런 결과들을 토대로 추후 연구개발사업의 성과측정에서는 비재무적성과 측정을 강화하도록 하는 정책 시행을 제시하는 바이다.

천연기념물 제374호 제주 평대리 비자나무 숲의 보존·관리방향 설정을 위한 기초연구 (A Basic Study on the Establishment of Preservation and Management for Natural Monument(No.374) Pyeongdae-ri Torreya nucifera forest of Jeju)

  • 이원호;김동현;김재웅;오해성;최병기;이종성
    • 한국전통조경학회지
    • /
    • 제32권1호
    • /
    • pp.93-106
    • /
    • 2014
  • 본 연구는 천연기념물 제374호 제주 평대리 비자나무 숲의 입지환경, 식생자원과 이용 및 관리현황을 조사하고, 현재 적용되는 관리구역에 대한 등급을 설정한 것으로써 다음과 같은 결과를 도출하였다. 첫째, 제주 평대리 비자나무 숲은 토지이용형태가 농업지역으로 변화하면서 대상지 주변지역으로의 개발압력에 의한 영향이 우려되며, 비자나무 숲 내 곶자왈지대는 종 다양성을 확보할 수 있는 기반요소로 원형보존의 관리계획 설정 및 지형의 변화를 야기하는 개발행위는 배제되어야 한다. 둘째, 제주 평대리 비자나무 숲의 소산식물상은 총 91과 263속 353종 41변종 8품종의 402분류군이 조사되었다. 이 중 환경부 지정 법정 멸종위기식물종 중 멸종위기식물 I II급에 해당하는 식물의 분포가 확인되었으나 현재의 서식처 변화 및 종의 병해, 불법 남획 등에 따른 개체 소실에 의해 비자나무 숲 내 종의 절멸 위험도 존재하므로 제주 평대리 비자나무 숲의 관리방안 설정 시 우선적으로 보호되어야 할 대상으로 고려되어야 한다. 셋째, 비자나무가 상관을 대표하는 식생구조를 나타내고 있으나, 노거수 위주의 영속적 관리와 보존전략은 빈약한 연령구조를 야기하였으며, 일부 구역의 인위적 관리에 의한 숲의 건조화, 자연적 천이에 의한 비자나무의 입지 감소 등의 문제점이 발생하는 바, 수목밀도의 조절 및 후계목 증식 등 제주 평대리 비자나무 숲의 특성을 유지할 수 있는 방안의 마련이 필요하다. 넷째, 이용에 따른 탐방로의 훼손이 발견되었으며, 특히 화산송이길의 훼손 및 분담율이 높게 나타났다. 따라서 화산송이의 단순한 보충보다는 현행 탐방로 외에 추가적인 관광루트 개발을 통한 분담율 완화 방안이 고려되어야 한다. 섯째, 제주 평대리 비자나무 숲의 관광요소 중 높은 선호도를 나타내는 식물적 요소는 이용에 관한 압력이 민감하게 작용하고, 비영속적인 특성상 지속적 모니터링이 필요하며, 추가적 관광요소 개발과 동시에 현재 높은 선호도를 나타내는 요소를 적극 활용하는 등의 방안이 마련되어야 한다. 여섯째, 보호강도별 중요도에 따라 I등급 지역은 존속개체군의 유지와 서식처의 훼손을 방지하고, II등급 지역은 연차별 숲의 재생을 위주로 관리방향을 설정하며, III등급 지역은 비자나무 시범림이나 후계목 증식을 위한 지역으로 설정되어야 한다. IV등급 지역은 고유 식생의 교란이 많이 발생하는 곳으로 부분별 휴식년제의 도입이 필요하다. V등급 지역은 비자나무 숲의 관광활용을 위한 서비스 공간 적지에 속한다. 상이한 등급의 지역 인접에 따른 가장자리효과에 대한 방안으로는 상대적으로 등급이 낮은 곳에 환경간섭을 피하기 위한 버퍼존의 설치와 주기적 모니터링이 요구된다.

기업 간 특허인용 관계 결정요인에 관한 연구 : MR-QAP분석 (A Study on the Determinants of Patent Citation Relationships among Companies : MR-QAP Analysis)

  • 박준형;곽기영;한희준;김윤정
    • 지능정보연구
    • /
    • 제19권4호
    • /
    • pp.21-37
    • /
    • 2013
  • 최근 지식기반 사회의 진입과 더불어 지식재산에 대한 관심이 증가하고 있다. 특히 하이테크산업을 이끌고 있는 ICT기업들은 지식재산의 체계적 관리를 위하여 끊임없이 노력하고 있다. 기업의 지적 자본을 대표하는 특허정보가 지속적으로 축적됨에 따라 정량적인 분석이 가능해졌다. 특허정보를 통하여 특허수준부터 기업수준, 산업수준, 국가수준에 이르기 까지 다양한 수준에서의 분석이 가능하다. 특허정보는 기술 현황을 파악하거나 성과에 미치는 영향을 분석하는데 활용되고 있다. 네트워크를 통한 분석은 지식 영향의 흐름을 나타내며, 이를 통하여 기술의 변화를 확인할 수 있을 뿐만 아니라 앞으로의 연구 방향을 예측할 수 있다. 네트워크를 활용한 분석 분야에서는 기업이 차지하는 네트워크상에서의 위치가 기업성과에 미치는 영향을 다각도에서 분석하는 연구가 진행되고 있다. 특허 인용 정보를 활용한 분석은 크게 두 가지로, 인용 횟수를 활용하는 인용지표 분석과 인용관계를 바탕으로 한 네트워크 분석으로 나뉜다. 본 연구는 기업간 규모의 차이가 기업 간 특허 인용 관계에 미치는 영향을 분석하고자 하였다. S&P 500에 등록된 IT 및 통신서비스를 제공하는 74개 기업을 선정하였으며 기업 간 특허 인용 관계를 구하기 위하여 2009년, 2010년의 특허 인용 정보를 수집하여 기업 간 특허 인용 관계를 나타냈다. 또한 기업규모를 대표하는 지표로 기업 총 자산에 대한 정보를 수집하였다. 기업규모에 따라 외부 지식에 대한 의존도가 달라지는 선행연구를 통하여 기업규모가 기업간 특허 인용 관계에 미치는 영향을 알아보고자 하였다. 이에 기업 간 총 자산의 차이에 절대값을 취한 값을 기업 간 거리로 정의하였으며, 기업 간 규모의 단순 차이를 기업 간 계층으로 정의하여 새로운 소시오매트릭스를 생성하였다. 2010년도 기업간 특허 인용 관계를 나타낸 소시오매트릭스를 종속변수로 하였으며, 2009년도 기업 간 특허 인용 네트워크, 기업 간 거리 및 계층을 독립변수로 하여 QAP분석 및 MR-QAP분석을 실시하였다. QAP분석 결과 기업 간 거리와 계층은 특허 인용 관계에 유의한 영향을 미치는 것으로 나타났다. MR-QAP분석에는 2009년도 기업 간 특허 인용 관계와 기업 간 거리만 유의함을 확인할 수 있었다. 특히 2009년도 기업 간 특허 인용 관계가 2010년도 기업 간 특허 인용 관계에 가장 큰 영향력을 행사하는 것을 볼 수 있어 기업 간 특허 인용관계는 연속성이 존재하는 것으로 볼 수 있었다.

빅데이터의 효과적인 처리 및 활용을 위한 클라이언트-서버 모델 설계 (Design of Client-Server Model For Effective Processing and Utilization of Bigdata)

  • 박대서;김화종
    • 지능정보연구
    • /
    • 제22권4호
    • /
    • pp.109-122
    • /
    • 2016
  • 최근 빅데이터 분석은 기업과 전문가뿐만 아니라 개인이나 비전문가들도 큰 관심을 갖는 분야로 발전하였다. 그에 따라 현재 공개된 데이터 또는 직접 수집한 이터를 분석하여 마케팅, 사회적 문제 해결 등에 활용되고 있다. 국내에서도 다양한 기업들과 개인이 빅데이터 분석에 도전하고 있지만 빅데이터 공개의 제한과 수집의 어려움으로 분석 초기 단계에서부터 어려움을 겪고 있다. 본 논문에서는 빅데이터 공유를 방해하는 개인정보, 빅트래픽 등의 요소들에 대한 기존 연구와 사례들을 살펴보고 정책기반의 해결책이 아닌 시스템을 통해서 빅데이터 공유 제한 문제를 해결 할 수 있는 클라이언트-서버 모델을 이용해 빅데이터를 공개 및 사용 할 때 발생하는 문제점들을 해소하고 공유와 분석 활성화를 도울 수 있는 방안에 대해 기술한다. 클라이언트-서버 모델은 SPARK를 활용해 빠른 분석과 사용자 요청을 처리하며 Server Agent와 Client Agent로 구분해 데이터 제공자가 데이터를 공개할 때 서버 측의 프로세스와 데이터 사용자가 데이터를 사용하기 위한 클라이언트 측의 프로세스로 구분하여 설명한다. 특히, 빅데이터 공유, 분산 빅데이터 처리, 빅트래픽 문제에 초점을 맞추어 클라이언트-서버 모델의 세부 모듈을 구성하고 각 모듈의 설계 방법에 대해 제시하고자 한다. 클라이언트-서버 모델을 통해서 빅데이터 공유문제를 해결하고 자유로운 공유 환경을 구성하여 안전하게 빅데이터를 공개하고 쉽게 빅데이터를 찾는 이상적인 공유 서비스를 제공할 수 있다.

K-Means Clustering 알고리즘과 헤도닉 모형을 활용한 서울시 연립·다세대 군집분류 방법에 관한 연구 (A Study on the Clustering Method of Row and Multiplex Housing in Seoul Using K-Means Clustering Algorithm and Hedonic Model)

  • 권순재;김성현;탁온식;정현희
    • 지능정보연구
    • /
    • 제23권3호
    • /
    • pp.95-118
    • /
    • 2017
  • 최근 도심을 중심으로 연립 다세대의 거래가 활성화되고 직방, 다방등과 같은 플랫폼 서비스가 성장하고 있다. 연립 다세대는 수요 변화에 따른 시장 규모 확대와 함께 정보 비대칭으로 인해 사회적 문제가 발생 되는 등 부동산 정보의 사각지대이다. 또한, 서울특별시 또는 한국감정원에서 사용하는 5개 또는 25개의 권역 구분은 행정구역 내부를 중심으로 설정되었으며, 기존의 부동산 연구에서 사용되어 왔다. 이는 도시계획에 의한 권역구분이기 때문에 부동산 연구를 위한 권역 구분이 아니다. 이에 본 연구에서는 기존 연구를 토대로 향후 주택가 격추정에 있어 서울특별시의 공간구조를 재설정할 필요가 있다고 보았다. 이에 본 연구에서는 연립 다세대 실거래가 데이터를 기초로 하여 헤도닉 모형에 적용하였으며, 이를 K-Means Clustering 알고리즘을 사용해 서울특별시의 공간구조를 다시 군집하였다. 본 연구에서는 2014년 1월부터 2016년 12월까지 3년간 국토교통부의 서울시 연립 다세대 실거래가 데이터와 2016년 공시지가를 활용하였다. 실거래가 데이터에서 본 연구에서는 지하거래 제거, 면적당 가격 표준화 및 5이상 -5이하의 실거래 사례 제거와 같이 데이터 제거를 통한 데이터 전처리 작업을 수행하였다. 데이터전처리 후 고정된 초기값 설정으로 결정된 중심점이 매번 같은 결과로 나오게 K-means Clustering을 수행한 후 군집 별로 헤도닉 모형을 활용한 회귀분석을 하였으며, 코사인 유사도를 계산하여 유사성 분석을 진행하였다. 이에 본 연구의 결과는 모형 적합도가 평균 75% 이상으로, 헤도닉 모형에 사용된 변수는 유의미하였다. 즉, 기존 서울을 행정구역 25개 또는 5개의 권역으로 나뉘어 실거래가지수 등 부동산 가격 관련 통계지표를 작성하던 방식을 속성의 영향력이 유사한 영역을 묶어 16개의 구역으로 나누었다. 따라서 본 연구에서는 K-Means Clustering 알고리즘에 실거래가 데이터로 헤도닉 모형을 활용하여 연립 다세대 실거래가를 기반으로 한 군집분류방법을 도출하였다. 또한, 학문적 실무적 시사점을 제시하였고, 본 연구의 한계점과 향후 연구 방향에 대해 제시하였다.

CNN-LSTM 조합모델을 이용한 영화리뷰 감성분석 (Sentiment Analysis of Movie Review Using Integrated CNN-LSTM Mode)

  • 박호연;김경재
    • 지능정보연구
    • /
    • 제25권4호
    • /
    • pp.141-154
    • /
    • 2019
  • 인터넷 기술과 소셜 미디어의 빠른 성장으로 인하여, 구조화되지 않은 문서 표현도 다양한 응용 프로그램에 사용할 수 있게 마이닝 기술이 발전되었다. 그 중 감성분석은 제품이나 서비스에 내재된 사용자의 감성을 탐지할 수 있는 분석방법이기 때문에 지난 몇 년 동안 많은 관심을 받아왔다. 감성분석에서는 주로 텍스트 데이터를 이용하여 사람들의 감성을 사전 정의된 긍정 및 부정의 범주를 할당하여 분석하며, 이때 사전 정의된 레이블을 이용하기 때문에 다양한 방향으로 연구가 진행되고 있다. 초기의 감성분석 연구에서는 쇼핑몰 상품의 리뷰 중심으로 진행되었지만, 최근에는 블로그, 뉴스기사, 날씨 예보, 영화 리뷰, SNS, 주식시장의 동향 등 다양한 분야에 적용되고 있다. 많은 선행연구들이 진행되어 왔으나 대부분 전통적인 단일 기계학습기법에 의존한 감성분류를 시도하였기에 분류 정확도 면에서 한계점이 있었다. 본 연구에서는 전통적인 기계학습기법 대신 대용량 데이터의 처리에 우수한 성능을 보이는 딥러닝 기법과 딥러닝 중 CNN과 LSTM의 조합모델을 이용하여 감성분석의 분류 정확도를 개선하고자 한다. 본 연구에서는 대표적인 영화 리뷰 데이터셋인 IMDB의 리뷰 데이터 셋을 이용하여, 감성분석의 극성분석을 긍정 및 부정으로 범주를 분류하고, 딥러닝과 제안하는 조합모델을 활용하여 극성분석의 예측 정확도를 개선하는 것을 목적으로 한다. 이 과정에서 여러 매개 변수가 존재하기 때문에 그 수치와 정밀도의 관계에 대해 고찰하여 최적의 조합을 찾아 정확도 등 감성분석의 성능 개선을 시도한다. 연구 결과, 딥러닝 기반의 분류 모형이 좋은 분류성과를 보였으며, 특히 본 연구에서 제안하는 CNN-LSTM 조합모델의 성과가 가장 우수한 것으로 나타났다.

주가지수 방향성 예측을 위한 주제지향 감성사전 구축 방안 (Predicting the Direction of the Stock Index by Using a Domain-Specific Sentiment Dictionary)

  • 유은지;김유신;김남규;정승렬
    • 지능정보연구
    • /
    • 제19권1호
    • /
    • pp.95-110
    • /
    • 2013
  • 최근 다양한 소셜미디어를 통해 생성되는 비정형 데이터의 양은 빠른 속도로 증가하고 있으며, 이를 저장, 가공, 분석하기 위한 도구의 개발도 이에 맞추어 활발하게 이루어지고 있다. 이러한 환경에서 다양한 분석도구를 통해 텍스트 데이터를 분석함으로써, 기존의 정형 데이터 분석을 통해 해결하지 못했던 이슈들을 해결하기 위한 많은 시도가 이루어지고 있다. 특히 트위터나 페이스북을 통해 실시간에 근접하게 생산되는 글들과 수많은 인터넷 사이트에 게시되는 다양한 주제의 글들은, 방대한 양의 텍스트 분석을 통해 많은 사람들의 의견을 추출하고 이를 통해 향후 수익 창출에 기여할 수 있는 새로운 통찰을 발굴하기 위한 움직임에 동기를 부여하고 있다. 뉴스 데이터에 대한 오피니언 마이닝을 통해 주가지수 등락 예측 모델을 제안한 최근의 연구는 이러한 시도의 대표적 예라고 할 수 있다. 우리가 여러 매체를 통해 매일 접하는 뉴스 역시 대표적인 비정형 데이터 중의 하나이다. 이러한 비정형 텍스트 데이터를 분석하는 오피니언 마이닝 또는 감성 분석은 제품, 서비스, 조직, 이슈, 그리고 이들의 여러 속성에 대한 사람들의 의견, 감성, 평가, 태도, 감정 등을 분석하는 일련의 과정을 의미한다. 이러한 오피니언 마이닝을 다루는 많은 연구는, 각 어휘별로 긍정/부정의 극성을 규정해 놓은 감성사전을 사용하며, 한 문장 또는 문서에 나타난 어휘들의 극성 분포에 따라 해당 문장 또는 문서의 극성을 산출하는 방식을 채택한다. 하지만 특정 어휘의 극성은 한 가지로 고유하게 정해져 있지 않으며, 분석의 목적에 따라 그 극성이 상이하게 나타날 수도 있다. 본 연구는 특정 어휘의 극성은 한 가지로 고유하게 정해져 있지 않으며, 분석의 목적에 따라 그 극성이 상이하게 나타날 수도 있다는 인식에서 출발한다. 동일한 어휘의 극성이 해석하는 사람의 입장에 따라 또는 분석 목적에 따라 서로 상이하게 해석되는 현상은 지금까지 다루어지지 않은 어려운 이슈로 알려져 있다. 구체적으로는 주가지수의 상승이라는 한정된 주제에 대해 각 관련 어휘가 갖는 극성을 판별하여 주가지수 상승 예측을 위한 감성사전을 구축하고, 이를 기반으로 한 뉴스 분석을 통해 주가지수의 상승을 예측한 결과를 보이고자 한다.