• 제목/요약/키워드: 사전처리

검색결과 2,333건 처리시간 0.029초

사례분석을 통한 효율적 상향수압(Up-Lift Pressure) 처리공법 적용방안에 관한연구 - ◯◯ 상업지역 현장사례 중심으로 - (A Case study and Analysis on the Up-Lift Pressure Treatment Evaluation of Underground Installations for their Efficient Adoption)

  • 고옥렬;권오철;심재광;박태은
    • 한국건축시공학회지
    • /
    • 제9권4호
    • /
    • pp.119-129
    • /
    • 2009
  • 최근의 건축활동은 초고층화 대형화 복잡화 되고 있으며 도심지내에 근접 시공되어 짐에 따라 건축물의 지상층 높이증가와 더불어 지가의 앙등, 토지이용의 극대화로 지하구조물의 중요성이 증가되고 있으며 지하층의 면적 및 층수가 증가되어 가는 추세이다. 이에 따라 지하굴착심도가 깊어지고 있으며 토지 이용의 효율극대화 측면에서 우리나라의 경우 해안매립지등 매립지반에서의 건축활동이 급증하는 추세로 연약지반에 대한 대책과 아울러 지하수위에 대한 영향을 신중하게 검토해야할 필요성이 증대되고 있는 실정이다. 일반적으로 지하굴착 후 시공되는 건축물은 지층의성상과 토질, 수압 등에 대한 고려로 건물의 최하층 바닥슬라브 하부에 위치하게 되는 지하수위와의 수두압차에 의한 정수학적 압력(Hydrostatic Pressure), 즉 부력(Uplift Water Pressure)이 건물저면에 작용하게 되므로, 이러한 부력(浮力)합리적으로 대처할 수 있는 설계 및 시공법의 개발과 이를 적용하기 위한 노력은 지하층공사에 있어서 안전, 공기, 비용, 건축의질 측면에서 필수적이라고 할 수 있다. 그러나 이제까지의 지하층 공사는 부력 처리방법 등에 대한 연구가 미흡하며 기존의 공법 중 대상 프로젝트의 합리적인 수행을 위한 설계초기단계에서의 지반에 대한 사전조사와 면밀한 분석이 이루어지지 않고, 경험에 의존하는 경향이 크다. 본 연구는 상기와 같은 문제점을 바탕으로 O O 건설현장 실 사례를 중심으로 현장은 한강에 인접한 지리적 요인에 의해 지하수위가 한강의 수위와 연계되어 있는바 최초 계획되었던 Rock anchor System 대신 Drain mat System을 적용하여 유입되는 지하수를 유도, 배수함으로써 지하수위에 따른 상향수압을 통제할 수 있는 최적공법 선정을 통해 직접공사비 406,702,000원 및 Life Cycle Cost 차원에서 검토한 결과 건물수명 50년 기준 절감액 운용수익률 년 4% 절감의 효과로 이는 건설초기단계에서의 과다설계에 따른 투입 공사비의 과다책정, 공기의 증가 등에 따른 채산성 문제를 합리적으로 제어하여 건설공사의 원가절감을 위한 성공사례로 평가되고 있다.

폐기물 에너지화가 수도권매립지 매립가스 발생량에 미치는 영향 (Effect of Waste Energy Recovery on SUDOKWON Landfill Gas Generation)

  • 천승규
    • 대한환경공학회지
    • /
    • 제32권10호
    • /
    • pp.942-948
    • /
    • 2010
  • 폐기물을 활용한 고형연료생산 등 에너지화가 매립가스 발생량에 미치는 영향을 예측하기 위하여 2017년부터 2024년까지 수도권매립지 제3매립장을 대상으로 반입폐기물의 에너지화 방법별 $CH_4$ 발생량의 변화를 분석하였다. 분석결과 수도권매립지 제3매립장으로 반입되는 폐기물을 종래와 같이 전량 매립하는 경우 2017년부터 2024년 사이에 예상되는 $CH_4$ 발생량은 생활계 폐기물 $337{\times}10^6\;Nm^3$, 건설폐기물 $178{\times}10^6\;Nm^3$, 배출시설계 폐기물 $11{\times}10^6\;Nm^3$ 등 총 $527{\times}10^6\;Nm^3$으로 예상되었다. 이는 2002년부터 2009년까지 같은 기간 동안 제2매립장에서 발생된 $CH_4$ 발생량의 41.5% 수준이었다. 또한, 생활계 폐기물과 건설폐기물을 MT (Mechanical Treatment)방식으로 고형연료를 생산한 뒤 그 잔재물을 모두 매립할 경우 $CH_4$ 발생량은 생활계 폐기물 $127{\times}10^6\;Nm^3$, 건설폐기물 $28{\times}10^6\;Nm^3$, 배출시설계 폐기물 $4{\times}10^6\;Nm^3$ 등 총 $158{\times}10^6\;Nm^3$로 예상되었다. 한편, 생활계 폐기물을 MT방식으로 처리 후 발생되는 유기성 혼합잔재물을 생물학적으로 처리하여 자원화하는 MBT (Mechanical & Biological Treatment)방식을 도입할 경우 같은 기간 중 총 $CH_4$ 발생량은 $115{\times}10^6\;Nm^3$로 예상되었다. 이는 단순 매립방식의 21.8% 수준이었으며 2002년부터 2009년 사이의 발생량과 비교하면 9.1%에 불과하였다. 본 연구를 통해 폐기물 에너지화에 의해 매립지에서의 $CH_4$ 발생량이 큰 영향을 받게 됨을 알 수 있었다. 따라서 매립가스를 활용한 에너지사업 계획시 합리적 규모설정과, 소량발생 매립가스의 에너지화 기술에 대한 연구와 투자 등 사전대비가 필요하다고 판단된다.

네팔 카트만두 지하수에서 암모늄 제거를 위한 이온 교환 및 역삼투의 기술 및 경제 평가 (Technical and Economical Assessment of Adsorption and Reverse Osmosis for Removal of Ammonia from Groundwater of Kathmandu, Nepal)

  • 팔라비 쿤와르;안재욱;백영빈;윤제용
    • 적정기술학회지
    • /
    • 제6권2호
    • /
    • pp.174-182
    • /
    • 2020
  • 국제 보건기구인 WHO는 식수의 암모니아 농도를 1.5 mg/L로 제한한다. 그러나 카트만두의 지하수 암모니아 농도는 0-120 mg/L로 그 농도가 매우 다양하고 높다(Chapagain et al., 2010). 고농도의 암모니아는 식수의 맛을 변질시키고 악취 문제가 발생하기 때문에 사전 처리가 필요하다. 카트만두에서는 인구의 절반이 식수로 지하수를 사용하고 있지만, 이 문제에 대한 심각성을 인지 못하고 있다. 이를 인지하고 있는 일부 거주자는 시중에서 판매되는 Jar Water를 사용하고 있지만, Jar Water도 WHO 표준을 충족하지 않는다. 따라서, 우리는 카트만두 지역의 고농도의 암모니아 문제를 해결하기 위해 암모니아 제거로 가장 잘 알려진 흡착 및 역삼투(RO) 기술을 사용하여 적합성을 검증하였다. 본 연구는 2 가지 암모니아 농도(15 mg/L 및 50 mg/L)의 카트만두 합성 지하수 조성에서 흡착 및 역삼투 방법의 기술적이고 경제적인 관점에서 성능을 평가했다. 결과적으로, 이온교환수지(IE)를 통한 흡착은 초기 100% 암모니아 제거 성능을 지니며, 이는 암모늄 제거가 최대 90%인 RO에 비해 비교적 우수한 제거 능력을 갖춘 기술임을 확인하였다. 또한 경제적인 측면에서는 흡착기술은 가정에서처럼 낮은 물 소비(<50 L/day)에 적합하지만, RO는 일 물 소비가 높은 곳(>50 L/day) 에서 좀 더 효율적인 기술로 확인되었다. 마지막으로, 이러한 평가결과는 네팔 카트만두에서 지속 가능한 식수 확보를 위해 Jar Water를 구입하는 것보다 적절한 가정 처리 시스템을 설치하는 것이 식수의 질 뿐만 아니라 경제적인 관점에서도 보다 효율적이라고 제안한다.

수면의 질을 측정하기 위한 안대형 생체신호 측정기기 개발 (Development of an Eye Patch-Type Biosignal Measuring Device to Measure Sleep Quality)

  • 안창선;임재관;정봉수;김영주
    • 정보처리학회논문지:컴퓨터 및 통신 시스템
    • /
    • 제12권5호
    • /
    • pp.171-180
    • /
    • 2023
  • 우리나라 3대 수면 질환으로는 코골이, 수면무호흡증, 불면증이 있다. 수면 부족은 만병의 근원이며 수면 부족으로 인한 질병은 심혈관계 질환, 인지장애, 비만, 당뇨, 대장염, 전립선암에 이르기까지 다양하게 나타난다. 수면 관리 중요성을 인식한 정부도 2018년 7월부터 수면다원검사를 국민건강보험 혜택을 적용해서 작은 부담으로 검사를 받아볼 수 있도록 하고 있다. 그럼에도 불구하고 불면증 환자는 시간적·공간적·경제적 부담감을 해소하고 일상생활 속에서 수면의 질을 관리할 필요가 있다. 이러한 문제를 해결하기 위해서 본 논문에서는 병원이 아닌 일상생활 속에서 수면관리에 활용할 수 있는 안대형 생체신호 측정기기를 개발하였다. 측정기기에서는 6개 생체신호(안구동작, 뒤척임, 체온, 산소포화도, 심박수, 오디오)를 측정할 수 있다. 사용되는 센서로는 안구동작, 뒤척임은 자이로스코프센서(MPU9250, InvenSense, 미국)가 사용되었다. 센서값 입력 범위는 258~460°/sec 단위로 조정되며, 입력 범위값 내에서 작동상태를 확인하였다. 체온, 산소포화도, 심박수는 센서(MAX30102, Analog Devices, 미국)를 사용하였다. 체온은 30~45℃ 작동상태를 확인했으며, 산소포화도 사용범위는 미사용상태는 0%이고 사용상태는 20~90%의 작동상태를 확인하였다. 심박수의 범위는 40~180 bpm에서 작동상태를 확인하였다. 오디오 신호는 센서(AMM2742-T-R, PUIaudio, 미국)를 통해서 생체신호를 측정하며 감도는 -42±1 dB이며 주파수 범위는 20~20 kHz에서의 작동상태를 확인하였다. 시스템 구성은 생체신호 측정기기와 데이터수집 장치로 PC 및 모바일 애플리케이션으로 구성되었다. 측정된 데이터는 모바일과 PC로 수집되며 수집된 데이터는 수면의 단계를 판단하고 수면 유도와 수면장애에 대한 사전 선별기능을 진행할 수 있는 기초자료로 사용될 수 있다. 앞으로 간편하게 가정에서 불면증 환자들에게 수면의 질을 측정할 수 있게 되어 불면증 환자들의 치료에 도움이 될 것으로 예상한다.

전이학습 기반 다중 컨볼류션 신경망 레이어의 활성화 특징과 주성분 분석을 이용한 이미지 분류 방법 (Transfer Learning using Multiple ConvNet Layers Activation Features with Principal Component Analysis for Image Classification)

  • 바트후 ?바자브;주마벡 알리하노브;팡양;고승현;조근식
    • 지능정보연구
    • /
    • 제24권1호
    • /
    • pp.205-225
    • /
    • 2018
  • Convolutional Neural Network (ConvNet)은 시각적 특징의 계층 구조를 분석하고 학습할 수 있는 대표적인 심층 신경망이다. 첫 번째 신경망 모델인 Neocognitron은 80 년대에 처음 소개되었다. 당시 신경망은 대규모 데이터 집합과 계산 능력이 부족하여 학계와 산업계에서 널리 사용되지 않았다. 그러나 2012년 Krizhevsky는 ImageNet ILSVRC (Large Scale Visual Recognition Challenge) 에서 심층 신경망을 사용하여 시각적 인식 문제를 획기적으로 해결하였고 그로 인해 신경망에 대한 사람들의 관심을 다시 불러 일으켰다. 이미지넷 첼린지에서 제공하는 다양한 이미지 데이터와 병렬 컴퓨팅 하드웨어 (GPU)의 발전이 Krizhevsky의 승리의 주요 요인이었다. 그러므로 최근의 딥 컨볼루션 신경망의 성공을 병렬계산을 위한 GPU의 출현과 더불어 ImageNet과 같은 대규모 이미지 데이터의 가용성으로 정의 할 수 있다. 그러나 이러한 요소는 많은 도메인에서 병목 현상이 될 수 있다. 대부분의 도메인에서 ConvNet을 교육하기 위해 대규모 데이터를 수집하려면 많은 노력이 필요하다. 대규모 데이터를 보유하고 있어도 처음부터 ConvNet을 교육하려면 많은 자원과 시간이 소요된다. 이와 같은 문제점은 전이 학습을 사용하면 해결할 수 있다. 전이 학습은 지식을 원본 도메인에서 새 도메인으로 전이하는 방법이다. 전이학습에는 주요한 두 가지 케이스가 있다. 첫 번째는 고정된 특징점 추출기로서의 ConvNet이고, 두번째는 새 데이터에서 ConvNet을 fine-tuning 하는 것이다. 첫 번째 경우, 사전 훈련 된 ConvNet (예: ImageNet)을 사용하여 ConvNet을 통해 이미지의 피드포워드 활성화를 계산하고 특정 레이어에서 활성화 특징점을 추출한다. 두 번째 경우에는 새 데이터에서 ConvNet 분류기를 교체하고 재교육을 한 후에 사전 훈련된 네트워크의 가중치를 백프로퍼게이션으로 fine-tuning 한다. 이 논문에서는 고정된 특징점 추출기를 여러 개의 ConvNet 레이어를 사용하는 것에 중점을 두었다. 그러나 여러 ConvNet 레이어에서 직접 추출된 차원적 복잡성을 가진 특징점을 적용하는 것은 여전히 어려운 문제이다. 우리는 여러 ConvNet 레이어에서 추출한 특징점이 이미지의 다른 특성을 처리한다는 것을 발견했다. 즉, 여러 ConvNet 레이어의 최적의 조합을 찾으면 더 나은 특징점을 얻을 수 있다. 위의 발견을 토대로 이 논문에서는 단일 ConvNet 계층의 특징점 대신에 전이 학습을 위해 여러 ConvNet 계층의 특징점을 사용하도록 제안한다. 본 논문에서 제안하는 방법은 크게 세단계로 이루어져 있다. 먼저 이미지 데이터셋의 이미지를 ConvNet의 입력으로 넣으면 해당 이미지가 사전 훈련된 AlexNet으로 피드포워드 되고 3개의 fully-connected 레이어의 활성화 틀징점이 추출된다. 둘째, 3개의 ConvNet 레이어의 활성화 특징점을 연결하여 여러 개의 ConvNet 레이어의 특징점을 얻는다. 레이어의 활성화 특징점을 연결을 하는 이유는 더 많은 이미지 정보를 얻기 위해서이다. 동일한 이미지를 사용한 3개의 fully-connected 레이어의 특징점이 연결되면 결과 이미지의 특징점의 차원은 4096 + 4096 + 1000이 된다. 그러나 여러 ConvNet 레이어에서 추출 된 특징점은 동일한 ConvNet에서 추출되므로 특징점이 중복되거나 노이즈를 갖는다. 따라서 세 번째 단계로 PCA (Principal Component Analysis)를 사용하여 교육 단계 전에 주요 특징점을 선택한다. 뚜렷한 특징이 얻어지면, 분류기는 이미지를 보다 정확하게 분류 할 수 있고, 전이 학습의 성능을 향상시킬 수 있다. 제안된 방법을 평가하기 위해 특징점 선택 및 차원축소를 위해 PCA를 사용하여 여러 ConvNet 레이어의 특징점과 단일 ConvNet 레이어의 특징점을 비교하고 3개의 표준 데이터 (Caltech-256, VOC07 및 SUN397)로 실험을 수행했다. 실험결과 제안된 방법은 Caltech-256 데이터의 FC7 레이어로 73.9 %의 정확도를 얻었을 때와 비교하여 75.6 %의 정확도를 보였고 VOC07 데이터의 FC8 레이어로 얻은 69.2 %의 정확도와 비교하여 73.1 %의 정확도를 보였으며 SUN397 데이터의 FC7 레이어로 48.7%의 정확도를 얻었을 때와 비교하여 52.2%의 정확도를 보였다. 본 논문에 제안된 방법은 Caltech-256, VOC07 및 SUN397 데이터에서 각각 기존에 제안된 방법과 비교하여 2.8 %, 2.1 % 및 3.1 %의 성능 향상을 보였다.

Analysis and Improvement Strategies for Korea's Cyber Security Systems Regulations and Policies

  • Park, Dong-Kyun;Cho, Sung-Je;Soung, Jea-Hyen
    • 시큐리티연구
    • /
    • 제18호
    • /
    • pp.169-190
    • /
    • 2009
  • 21세기 첨단기술을 활용하고 있는 테러집단들이 앞으로 활용할 가능성이 높은 방법 중의 하나가 바로 사이버테러이다. 현실에서는 상상만으로 가능한 일이 사이버 공간에서는 실제로 가능한 경우가 많다. 손쉬운 예로 병원에 입원 중인 요인들의 전산기록 중 혈액형 한 글자만을 임의로 변경하여도 주요 인물에게 타격을 주어 상대편의 체제전복에 영향을 줄 수 있다. 이와 같이 테러분자들이 사이버테러를 선호하는 이유는 다른 물리적인 테러수단 보다 적은 비용으로 큰 효과를 거둘 수 있기 때문이다. 폭탄설치나 인질납치 보다 사이버 테러리스트들은 인터넷으로 언제 어디서나 공격 대상에 침투할 수 있다. 1999년 4월 26일 발생했던 CIH 대란은 여러모로 시사하는 바가 크다. 대만의 대학생이 뚜렷한 목적 없이 만들었던 몇 줄짜리 바이러스 프로그램이 인터넷을 통해 기하급수적으로 퍼져 국내에서만 30만대의 PC를 손상시켰고, 수리비와 데이터 복구에 소요된 비용만 20억원 이상이 소요된 것으로 확인되었다. 전세계적으로 피해액은 무려 2억 5000만 달러로 추정된다. 이와 같은 사이버테러의 위험성에도 불구하고, 국내 사이트의 상당수가 보안조치에 허술한 것으로 알려져 있다. 심지어는 수백만명 이상의 회원이 가입한 사이트를 운영하고 있는 회사마저도 보안조치에는 소홀한 경우가 많다. 사이버테러에 대한 전국가적인 대비가 필요한 때이다. 이러한 맥락에서 본 연구에서는 우리나라 사이버 안전체계의 실태를 법률과 제도적인 시각에서 분석하고, 아울러 개선전략을 제시하였다. 본 연구에서는 제시한 연구결과를 압축하여 제시하면 다음과 같다. 첫째, 현재 우리나라에서는 사이버위기를 국가차원에서 체계적으로 관리할 수 있는 제도와 구체적 방법 절차가 정립되어 있지 않아 테러 등 각종 위기상황 발생시 국가안보와 국익에 중대할 위험과 막대한 손해를 끼칠 우려가 높다. 따라서 사이버공격을 사전에 탐지하여 위기발생 가능성을 조기에 차단하며 위기발생시 국가의 역량을 결집하여 정부와 민간이 참여한 종합적인 국가대응체계를 구축하기 위해서는 법률 제정이 필요하다. 둘째, 국가차원의 사이버 안전의 효율적인 수행을 위해서는 국가사회 전반의 국가 사이버 안전의 기준과 새로운 모범을 제시하는 한편, 각 부처 및 국가사회의 구성요소들에 대해 국가 사이버 안전관리 정책을 집행할 수 있는 국가 사이버 안전관리 조직체계를 구축하는 것이 요구된다. 법률 및 추진체계 등을 통합 정비하여 정보보호 법률 제도 운영의 일관성을 확보함으로써 각종 정보보호 위협에 보다 효과적으로 대응할 수 있을 것이다. 즉 정부는 국가 사이버 안전관리에 관한 주요 정책의 심의 및 기획 조정, 통합된 국가 사이버 위기관리의 기능을 수행하기 위하여 현행 '국가사이버안전센터'의 기능을 확대 강화하는 것이 필요하다. 특히, 국가 사이버 위기와 관련된 정보의 종합적 수집, 분석, 처리의 종합적 기능을 수행하고 각 정보 및 공공 기관을 통할하며 민간부문과의 협조체계를 구축하는 것이 요구된다. 자율적 정보보호 수준제고를 위해 행정기관 공공기관의 정보보호관리체계(ISMS) 인증 제도를 확대하고 행정기관의 정보보호제품 도입 간소화 및 사용 촉진을 위해 행정정보보호용 시스템 선정 및 이용 규정을 신설 주요정보기반으로 지정된 정보기반 운영자, 정보공유 분석센터 등의 침해정보 공유 활성화 규정을 신설 및 정비함으로써 사이버침해로부터 국가 사회 주요시설을 효과적으로 보호할 수 있을 것이다. 끝으로 정부와 민간부분이 공동으로 참여하는 국가차원의 종합적인 대응체계를 구축하여 사이버공격을 사전에 탐지하여 사이버위기 발생 가능성을 조기에 차단하며 위기 발생 시 국가의 역량을 결집하여 신속히 대응할 수 있도록 해야 한다.

  • PDF

오피니언 마이닝을 이용한 지능형 VOC 분석시스템 (Intelligent VOC Analyzing System Using Opinion Mining)

  • 김유신;정승렬
    • 지능정보연구
    • /
    • 제19권3호
    • /
    • pp.113-125
    • /
    • 2013
  • 기업 경영에 있어서 고객의 소리(VOC)는 고객 만족도 향상 및 기업의사결정에 매우 중요한 정보이다. 이는 비단 기업뿐만 아니라 대고객, 대민원 업무를 처리하는 모든 조직에 있어서도 동일하다. 때문에 최근에는 기업뿐만 아니라 공공, 의료, 금융, 교육기관 등 거의 모든 조직이 VOC를 수집하여 활용하고 있다. 이러한 VOC는 방문, 전화, 우편, 인터넷게시판, SNS 등 다양한 채널을 통해 전달되지만, 막상 이를 제대로 활용하기는 쉽지 않다. 왜냐하면, 고객이 매우 감정적인 상태에서 고객의 주관적 의사를 음성 또는 문자로 표출하기 때문에 그 형식이나 내용이 정형화되어 있지 않고 저장하기도 어려우며 또한 저장하더라도 매우 방대한 분량의 비정형 데이터로 남기 때문이다. 본 연구는 이러한 비정형 VOC 데이터를 자동으로 분류하고 VOC의 유형과 극성을 판별할 수 있는 오피니언 마이닝 기반의 지능형 VOC 분석 시스템을 제안하였다. 또한 VOC 오피니언 분석의 기준이 되는 주제지향 감성사전 개발 프로세스와 각 단계를 구체적으로 제시하였다. 그리고 본 연구에서 제시한 시스템의 효용성을 검증하기 위하여 의료기관 홈페이지에서 수집한 4,300여건의 VOC 데이터를 이용하여 병원에 특화된 감성어휘와 감성극성값을 도출하여 감성사전을 구축하고 이를 통해 구현된 VOC분류 모형의 정확도를 비교하는 실험을 수행하였다. 그 결과 "칭찬, 친절함, 감사, 무사히, 잘해, 감동, 미소" 등의 어휘는 매우 높은 긍정 오피니언 값을 가지며, "퉁명, 뭡니까, 말하더군요, 무시하는" 등의 어휘들은 강한 부정의 극성값을 가지고 있음을 확인하였다. 또한 VOC의 오피니언 분류 임계값이 -0.50일 때 가장 높은 분류 예측정확도 77.8%를 검증함으로써 오피니언 마이닝 기반의 지능형 VOC 분석시스템의 유효성을 확인하였다. 그러므로 지능형 VOC 분석시스템을 통해 VOC의 실시간 자동 분류 및 대응 우선순위를 도출하여 고객 민원에 대해 신속히 대응한다면, VOC 전담 인력을 효율적으로 운용하면서도 고객 불만을 초기에 해소할 수 있는 긍정적 효과를 기대해 볼 수 있을 것이다. 또한 VOC 텍스트를 분석하고 활용할 수 있는 오피니언 마이닝 모형이라는 새로운 시도를 통해 향후 다양한 분석과 실용 프레임워크의 기틀을 제공할 수 있을 것으로 기대된다.

CNN-LSTM 조합모델을 이용한 영화리뷰 감성분석 (Sentiment Analysis of Movie Review Using Integrated CNN-LSTM Mode)

  • 박호연;김경재
    • 지능정보연구
    • /
    • 제25권4호
    • /
    • pp.141-154
    • /
    • 2019
  • 인터넷 기술과 소셜 미디어의 빠른 성장으로 인하여, 구조화되지 않은 문서 표현도 다양한 응용 프로그램에 사용할 수 있게 마이닝 기술이 발전되었다. 그 중 감성분석은 제품이나 서비스에 내재된 사용자의 감성을 탐지할 수 있는 분석방법이기 때문에 지난 몇 년 동안 많은 관심을 받아왔다. 감성분석에서는 주로 텍스트 데이터를 이용하여 사람들의 감성을 사전 정의된 긍정 및 부정의 범주를 할당하여 분석하며, 이때 사전 정의된 레이블을 이용하기 때문에 다양한 방향으로 연구가 진행되고 있다. 초기의 감성분석 연구에서는 쇼핑몰 상품의 리뷰 중심으로 진행되었지만, 최근에는 블로그, 뉴스기사, 날씨 예보, 영화 리뷰, SNS, 주식시장의 동향 등 다양한 분야에 적용되고 있다. 많은 선행연구들이 진행되어 왔으나 대부분 전통적인 단일 기계학습기법에 의존한 감성분류를 시도하였기에 분류 정확도 면에서 한계점이 있었다. 본 연구에서는 전통적인 기계학습기법 대신 대용량 데이터의 처리에 우수한 성능을 보이는 딥러닝 기법과 딥러닝 중 CNN과 LSTM의 조합모델을 이용하여 감성분석의 분류 정확도를 개선하고자 한다. 본 연구에서는 대표적인 영화 리뷰 데이터셋인 IMDB의 리뷰 데이터 셋을 이용하여, 감성분석의 극성분석을 긍정 및 부정으로 범주를 분류하고, 딥러닝과 제안하는 조합모델을 활용하여 극성분석의 예측 정확도를 개선하는 것을 목적으로 한다. 이 과정에서 여러 매개 변수가 존재하기 때문에 그 수치와 정밀도의 관계에 대해 고찰하여 최적의 조합을 찾아 정확도 등 감성분석의 성능 개선을 시도한다. 연구 결과, 딥러닝 기반의 분류 모형이 좋은 분류성과를 보였으며, 특히 본 연구에서 제안하는 CNN-LSTM 조합모델의 성과가 가장 우수한 것으로 나타났다.

의존 구문 분석을 이용한 질의 기반 정답 추출 (Query-based Answer Extraction using Korean Dependency Parsing)

  • 이도경;김민태;김우주
    • 지능정보연구
    • /
    • 제25권3호
    • /
    • pp.161-177
    • /
    • 2019
  • 질의응답 시스템은 크게 사용자의 질의를 분석하는 방법인 질의 분석과 문서 내에서 적합한 정답을 추출하는 방법인 정답 추출로 이루어지며, 두 방법에 대한 다양한 연구들이 진행되고 있다. 본 연구에서는 문장의 의존 구문 분석 결과를 이용하여 질의응답 시스템 내 정답 추출의 성능 향상을 위한 연구를 진행한다. 정답 추출의 성능을 높이기 위해서는 문장의 문법적인 정보를 정확하게 반영할 필요가 있다. 한국어의 경우 어순 구조가 자유롭고 문장의 구성 성분 생략이 빈번하기 때문에 의존 문법에 기반한 의존 구문 분석이 적합하다. 기존에 의존 구문 분석을 질의응답 시스템에 반영했던 연구들은 구문 관계 정보나 구문 형식의 유사도를 정의하는 메트릭을 사전에 정의해야 한다는 한계점이 있었다. 또 문장의 의존 구문 분석 결과를 트리 형태로 표현한 후 트리 편집 거리를 계산하여 문장의 유사도를 계산한 연구도 있었는데 이는 알고리즘의 연산량이 크다는 한계점이 존재한다. 본 연구에서는 구문 패턴에 대한 정보를 사전에 정의하지 않고 정답 후보 문장을 그래프로 나타낸 후 그래프 정보를 효과적으로 반영할 수 있는 Graph2Vec을 활용하여 입력 자질을 생성하였고, 이를 정답 추출모델의 입력에 추가하여 정답 추출 성능 개선을 시도하였다. 의존 그래프를 생성하는 단계에서 의존 관계의 방향성 고려 여부와 노드 간 최대 경로의 길이를 다양하게 설정하며 자질을 생성하였고, 각각의 경우에 따른 정답추출 성능을 비교하였다. 본 연구에서는 정답 후보 문장들의 신뢰성을 위하여 웹 검색 소스를 한국어 위키백과, 네이버 지식백과, 네이버 뉴스로 제한하여 해당 문서에서 기존의 정답 추출 모델보다 성능이 향상함을 입증하였다. 본 연구의 실험을 통하여 의존 구문 분석 결과로 생성한 자질이 정답 추출 시스템 성능 향상에 기여한다는 것을 확인하였고 해당 자질을 정답 추출 시스템뿐만 아니라 감성 분석이나 개체명 인식과 같은 다양한 자연어 처리 분야에 활용 될 수 있을 것으로 기대한다.

빅데이터의 효과적인 처리 및 활용을 위한 클라이언트-서버 모델 설계 (Design of Client-Server Model For Effective Processing and Utilization of Bigdata)

  • 박대서;김화종
    • 지능정보연구
    • /
    • 제22권4호
    • /
    • pp.109-122
    • /
    • 2016
  • 최근 빅데이터 분석은 기업과 전문가뿐만 아니라 개인이나 비전문가들도 큰 관심을 갖는 분야로 발전하였다. 그에 따라 현재 공개된 데이터 또는 직접 수집한 이터를 분석하여 마케팅, 사회적 문제 해결 등에 활용되고 있다. 국내에서도 다양한 기업들과 개인이 빅데이터 분석에 도전하고 있지만 빅데이터 공개의 제한과 수집의 어려움으로 분석 초기 단계에서부터 어려움을 겪고 있다. 본 논문에서는 빅데이터 공유를 방해하는 개인정보, 빅트래픽 등의 요소들에 대한 기존 연구와 사례들을 살펴보고 정책기반의 해결책이 아닌 시스템을 통해서 빅데이터 공유 제한 문제를 해결 할 수 있는 클라이언트-서버 모델을 이용해 빅데이터를 공개 및 사용 할 때 발생하는 문제점들을 해소하고 공유와 분석 활성화를 도울 수 있는 방안에 대해 기술한다. 클라이언트-서버 모델은 SPARK를 활용해 빠른 분석과 사용자 요청을 처리하며 Server Agent와 Client Agent로 구분해 데이터 제공자가 데이터를 공개할 때 서버 측의 프로세스와 데이터 사용자가 데이터를 사용하기 위한 클라이언트 측의 프로세스로 구분하여 설명한다. 특히, 빅데이터 공유, 분산 빅데이터 처리, 빅트래픽 문제에 초점을 맞추어 클라이언트-서버 모델의 세부 모듈을 구성하고 각 모듈의 설계 방법에 대해 제시하고자 한다. 클라이언트-서버 모델을 통해서 빅데이터 공유문제를 해결하고 자유로운 공유 환경을 구성하여 안전하게 빅데이터를 공개하고 쉽게 빅데이터를 찾는 이상적인 공유 서비스를 제공할 수 있다.