• 제목/요약/키워드: 식별기술

검색결과 2,087건 처리시간 0.03초

EPB 쉴드 TBM 챔버 내 혼합방법에 따른 배토상태거동에 대한 연구 (A study on the soil conditioning behaviour according to mixing method in EPB shield TBM chamber)

  • 김연덕;황병현;조성우;김상환
    • 한국터널지하공간학회 논문집
    • /
    • 제23권4호
    • /
    • pp.233-252
    • /
    • 2021
  • 본논문은 쉴드 TBM 챔버(Chamber) 내 배토처리 효율성 향상을 위한 연구이다. 현재 국내에서는 TBM 공법을 이용한 시공사례가 증가하는 추세이다. TBM 공법 사용의 증가에 따른 디스크 커터(Disc Cutter), 커터 비트(Cutter bit) 및 세그먼트와 같은 TBM 공법의 연구 또한 증가하는 추세를 보인다. 하지만 챔버와 챔버 내 교반 성능에 대한 연구는 미비한 실정이다. 원활한 배토처리와 굴착토의 거동을 개선하기 위하여 챔버 내 효과적인 믹싱 바 배치에 따른 교반 효율 변화에 대한 연구를 수행하였다. 축소모형 실험은 식별의 용이성을 위하여 색이 다른 플라스틱 소재를 사용하여 지반을 조성하였다. 또한 믹싱 바 배치를 상이하게 하여 4가지 Case로 분류하였으며, 입도분포를 단입도와 다입도로 분류하여 총 8가지의 Case로 실험을 진행하였다. 모든 Case의 커터헤드의 회전속도는 5 RPM으로 동일하며, 실험시간 또한 동일한 조건인 1분 30초로 진행하였다. 교반 효율을 확인하기 위하여 각 Case별 상부, 중부(좌 or 우), 하부 위치의 시료를 채취하여 분석하였다. 축소모형실험 결과 실제 사용되는 Case 1과 Case 1-1보다 새로운 배치방법인 Case 4와 Case 4-1의 교반 효율이 증가하는 양상을 보인다. 그에 따라 챔버 내 믹싱 바 배치를 변경하여 교반 효율을 증가시킬 수 있을 것으로 보이며, 교반 효율증가에 따라 공기 절약에 효과적일 것으로 판단된다. 따라서 본 연구는 국내 쉴드 TBM 공법 활용에 있어 큰 지표로써 작용할 것으로 보인다.

Few-Shot Learning을 사용한 호스트 기반 침입 탐지 모델 (Host-Based Intrusion Detection Model Using Few-Shot Learning)

  • 박대경;신동일;신동규;김상수
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제10권7호
    • /
    • pp.271-278
    • /
    • 2021
  • 현재 사이버 공격이 더욱 지능화됨에 따라 기존의 침입 탐지 시스템(Intrusion Detection System)은 저장된 패턴에서 벗어난 지능형 공격을 탐지하기 어렵다. 이를 해결하려는 방법으로, 데이터 학습을 통해 지능형 공격의 패턴을 분석하는 딥러닝(Deep Learning) 기반의 침입 탐지 시스템 모델이 등장했다. 침입 탐지 시스템은 설치 위치에 따라 호스트 기반과 네트워크 기반으로 구분된다. 호스트 기반 침입 탐지 시스템은 네트워크 기반 침입 탐지 시스템과 달리 시스템 내부와 외부를 전체적으로 관찰해야 하는 단점이 있다. 하지만 네트워크 기반 침입 탐지 시스템에서 탐지할 수 없는 침입을 탐지할 수 있는 장점이 있다. 따라서, 본 연구에서는 호스트 기반의 침입 탐지 시스템에 관한 연구를 수행했다. 호스트 기반의 침입 탐지 시스템 모델의 성능을 평가하고 개선하기 위해서 2018년에 공개된 호스트 기반 LID-DS(Leipzig Intrusion Detection-Data Set)를 사용했다. 해당 데이터 세트를 통한 모델의 성능 평가에 있어서 각 데이터에 대한 유사성을 확인하여 정상 데이터인지 비정상 데이터인지 식별하기 위해 1차원 벡터 데이터를 3차원 이미지 데이터로 변환하여 재구성했다. 또한, 딥러닝 모델은 새로운 사이버 공격 방법이 발견될 때마다 학습을 다시 해야 한다는 단점이 있다. 즉, 데이터의 양이 많을수록 학습하는 시간이 오래 걸리기 때문에 효율적이지 못하다. 이를 해결하기 위해 본 논문에서는 적은 양의 데이터를 학습하여 우수한 성능을 보이는 Few-Shot Learning 기법을 사용하기 위해 Siamese-CNN(Siamese Convolutional Neural Network)을 제안한다. Siamese-CNN은 이미지로 변환한 각 사이버 공격의 샘플에 대한 유사성 점수에 의해 같은 유형의 공격인지 아닌지 판단한다. 정확성은 Few-Shot Learning 기법을 사용하여 정확성을 계산했으며, Siamese-CNN의 성능을 확인하기 위해 Vanilla-CNN(Vanilla Convolutional Neural Network)과 Siamese-CNN의 성능을 비교했다. Accuracy, Precision, Recall 및 F1-Score 지표를 측정한 결과, Vanilla-CNN 모델보다 본 연구에서 제안한 Siamese-CNN 모델의 Recall이 약 6% 증가한 것을 확인했다.

한반도 미세먼지 발생과 연관된 대기패턴 그리고 미래 전망 (Atmospheric Circulation Patterns Associated with Particulate Matter over South Korea and Their Future Projection)

  • 이현주;정여민;김선태;이우섭
    • 한국기후변화학회지
    • /
    • 제9권4호
    • /
    • pp.423-433
    • /
    • 2018
  • 본 연구에서는 고농도 미세먼지의 발생과 연관된 대기패턴을 조사하고, 이를 바탕으로 한반도의 고농도 미세먼지의 발생을 예측할 수 있는 지수를 개발하였다. 또한 개발된 지수를 이용하여 미래의 한반도 고농도 미세먼지 발생과 연관된 대기 패턴의 변화를 살펴보았다. 서울지역 미세먼지 농도의 변동성을 조사하기 위해, 황사 발생 사례일을 제외한 미세먼지 고농도 사례일은 대기환경기준에 따라 24시간 평균 $PM_{10}$ 농도가 $100{\mu}g/m^3$ 이상일 경우로 정의하였다. 미세먼지 연평균 농도는 2001년부터 꾸준히 감소하는 경향을 보이며, 2012년 이후에 감소 추세가 주춤하였으며, $PM_{10}$ 고농도 사례일수도 2003년부터 2016년까지 대체로 감소하였다. 그러나 4일 이상 지속되었던 고농도 사례만을 살펴보면 2001년과 2003년을 제외하고 뚜렷한 감소 경향을 찾아보기 어렵고 전반적인 대기질 향상에도 불구하고 지속적으로 발생하는 것을 알 수 있다. 4일이상 지속되는 고농도 사례는 최근 들어 뚜렷한 경향을 보이지 않고, 기상조건 등의 다른 발생원이 있음을 알 수 있다. 그러므로 고농도 사례에 대한 대기 순환장의 특징을 살펴보기 위해 한반도의 고농도 사례일에 대한 대기패턴의 합성장을 분석하였다. 고농도 사례가 발생하였을 경우, 한반도 상공에 고기압에 위치하면서, 극의 찬 공기의 유입을 차단하며, 상층 동서 방향 바람은 한반도 북쪽으로 흐르게 된다. 따라서 한반도 지역은 차고 건조한 북서풍이 약화되고, 풍속이 감소된다. 이러한 한반도 미세먼지 고농도 사례와 연관된 대기패턴을 바탕으로 겨울철 한반도 $PM_{10}$ 농도를 전망하기 위한 미세먼지 고농도 지수를 정의하여 사용하였다. 먼저 500 hPa 지위고도, 500 hPa 동서 방향 바람 성분, 850 hPa 남북 방향 바람 성분과 $PM_{10}$과의 상관성이 높은 지역에서 각 변수를 영역 평균하고 표준화 과정을 거친 후 각 변수에 대한 지수를 계산하고, 각 지수의 합으로 한반도 미세먼지 고농도 지수 (KPI)를 정의하였다. 한반도 미세먼지 고농도 지수를 CMIP5에 참여하는 10개의 기후모형에 적용하여 미래 한반도의 고농도 미세먼지를 발생시킬 수 있는 대기패턴의 변동성을 살펴보았다. 겨울철 한반도에서 대기의 정체를 유발하여 심한 대기오염을 발생시킬 수 있는 기상 조건의 빈도가 기후변화에 따라 크게 증가하는 것으로 나타났다. 이러한 증가는 한반도 주변의 평균 대기 상태의 변화와 일치한다 (Cai et al, 2017). 이 연구는 $PM_{10}$ 관측자료 기간이 2001년부터 2016년까지의 총 16년 동안의 자료 만을 이용하여 한반도 고농도 미세먼지 발생과 관련된 대기패턴을 분석하였기에 대기오염과 연관된 기상조건을 완벽하게 식별하지는 못하였을 것이다. 향후 연구를 통해서 $PM_{10}$과 더불어 $PM_{2.5}$의 자료를 활용하여 상세한 분석이 필요할 것으로 보인다. 그럼에도 불구하고, 본 연구의 결과는 지구 온실가스 배출로 인한 대기 순환의 변화가 한반도 고농도 미세먼지 발생 사례를 증가시키는 중요한 역할을 할 수 있음을 시사한다. 지구 온난화가 심해진다면, 작은 대기 오염 배출이라도 축적이 되어 고농도 미세먼지 현상이 발생 할 수 있다. 따라서 대기 오염 배출 저감 노력뿐만 아니라, 온실가스 배출량을 줄이기 위한 노력이 동시에 필요할 것으로 사료된다.

변이영역 특이 202개 InDel 마커를 이용한 강원도 육성 콩 품종의 판별 및 염색체 재조합 양상 구명 (Identification and Chromosomal Reshuffling Patterns of Soybean Cultivars Bred in Gangwon-do using 202 InDel Markers Specific to Variation Blocks)

  • 손황배;송윤호;김수정;홍수영;김기덕;구본철;김율호
    • 한국육종학회지
    • /
    • 제50권4호
    • /
    • pp.396-405
    • /
    • 2018
  • 본 연구에서는 dVB 특이적인 202개 InDel 마커를 이용하여 강원도에서 육성된 콩 품종의 바코드 데이터베이스 구축 및 유전분석을 수행하였다. 강원도에서 육성된 품종의 202개 InDel의 다형성을 기존의 147 품종과 비교한 결과 강원도 품종이 명확하게 구분되었다. 이는 식량원에서 개발된 콩 품종 인식 시스템이 강원도 품종의 보급종 체계에서 품종의 균일성과 안정성 평가에 적용 가능함을 나타낸다. 153개 품종의 유전형을 이용하여 집단구조를 분석한 결과, '흑청', '호반', '청아'는 subgroup 1으로, '기찬', '대왕', '햇살', '강일'은 admixture로 구분되었다. 강원도 재래종의 숙기를 앞당기 위하여 subgroup 3의 유전 영역이 도입되었으며, 강원도의 특이 환경 및 기후변화 대응에는 subgroup 4가 주로 이용되었음이 유전분석집단에서 확인되었다. 특히, 다양한 소비자의 욕구를 충족과 함께 지역 환경에 적응성을 높이기 위해서 신품종 육성에 유전구조가 다른 다양한 재래종(혹은 품종)의 유전 영역이 지속적으로 도입되어 admixture 집단이 증가한 것으로 판단된다. 결론적으로 강원도 품종의 바코드 데이터베이스 구축은 품종 식별 정확성과 효율성을 향상시켜 품종의 권리 보호와 함께 종자산업 경쟁력을 보다 높일 수 있을 것으로 기대된다. 향후 dVB에 연관된 양적/질적 형질에 대한 추가 연구와 함께 202개 InDel 마커를 이용하여 실험실 수준에서 교배모부본의 잠재적 가능성을 평가할 수 있기 때문에 품종 육성의 효율을 더욱 높일 수 있을 것이다.

무인기로 취득한 RGB 영상과 YOLOv5를 이용한 수수 이삭 탐지 (Sorghum Panicle Detection using YOLOv5 based on RGB Image Acquired by UAV System)

  • 박민준;유찬석;강예성;송혜영;백현찬;박기수;김은리;박진기;장시형
    • 한국농림기상학회지
    • /
    • 제24권4호
    • /
    • pp.295-304
    • /
    • 2022
  • 본 연구는 수수의 수확량 추정을 위해 무인기로 취득한 RGB 영상과 YOLOv5를 이용하여 수수 이삭 탐지 모델을 개발하였다. 이삭이 가장 잘 식별되는 9월 2일의 영상 중 512×512로 분할된 2000장을 이용하여 모델의 학습, 검증 및 테스트하였다. YOLOv5의 모델 중 가장 파라미터가 적은 YOLOv5s에서 mAP@50=0.845로 수수 이삭을 탐지할 수 있었다. 파라미터가 증가한 YOLOv5m에서는 mAP@50=0.844로 수수 이삭을 탐지할 수 있었다. 두 모델의 성능이 유사하나 YOLOv5s (4시간 35분)가 YOLOv5m (5시간 15분)보다 훈련시간이 더 빨라 YOLOv5s가 수수 이삭 탐지에 효율적이라고 판단된다. 개발된 모델을 이용하여 수수의 수확량 예측을 위한 단위면적당 이삭 수를 추정하는 알고리즘의 기초자료로 유용하게 활용될 것으로 판단된다. 추가적으로 아직 개발의 초기 단계를 감안하면 확보된 데이터를 이용하여 성능 개선 및 다른 CNN 모델과 비교 검토할 필요가 있다고 사료된다.

신세대의 특성에 따른 해군 인력 활용의 과제 - 또 다른 신세대, Z세대 관점에서의 고찰 (A Study on the Utilization of Naval Personnel According to Characteristics of New Generations: Discussion from the Perspective of Generation Z, a Newly Emerging Generation)

  • 민승운;김성열
    • 해양안보
    • /
    • 제4권1호
    • /
    • pp.57-82
    • /
    • 2022
  • 이 논문은 Z세대의 관점에서 현재 해군 인력 활용 체제의 한계점에 관해 탐구하고 개선방안을 고찰하는 논문이다. 밀레니얼 세대에 이어 Z세대가 등장하고 있고, 군 인력구성에서의 비율 또한 점진적으로 증가하고 있다. 해군의 임무 특성상 X세대와 다른 특성을 가진 밀레니얼 세대와 또 다른 특성이 있는 Z세대와의 융합은 필연적으로 고찰해야 하는 과제 중 하나이다. 좁은 함정(艦艇)이라는 공간에는 폭넓은 임무 수행을 위해 수많은 장비를 탑재하고 이를 24시간 동안 동등한 수준의 전투력으로 운영할 많은 수의 승조원이 함께 생활하게 되는데, 이러한 특수한 작전환경에서 승조원 간 세대 갈등은 크나큰 전투력 악화로 이어질 수 있다. 신세대 장병은 이전 세대와 다른 측면에서의 사회적 어려움을 겪고 있고 군에 대한 가치관이 서로 다르기에, 그들 간의 진정한 화합을 위해서는 각 세대의 가치관의 차이점에 대해 자세히 탐구하고 군 조직은 이러한 변화에 대해 적절한 대처를 하고 있는지 검토해 보아야 한다. 이에 따라, 1장과 2장에서 기성세대와 구분되는 밀레니얼 세대와 Z세대의 성장기에 겪었던 환경과 이를 바탕으로 형성된 가치관에 대해 알아보고 세대 간 갈등의 해결 필요성을 제기한다. 3장에서는 군사 강국이 MZ세대와의 공존을 위해 시행 중인 방안 분석을 통해 교훈을 도출한다. 4장에서는 해군만의 특수한 작전 환경에 대해 살펴보고, 현재 한국 해군의 인력 활용의 현주소를 수병, 부사관, 장교, 정책적 차원으로 살펴보면서 세대 간 융합의 장애 요소를 식별하고 이에 대응한 개략적인 해결방안을 제시한다. 5장에서는 세대 간 특성 인식을 통한 진정한 공감의 필요성과 기술 중심군인 해군에게 인력 활용 문제 해결의 중요성을 재고하며 향후 인력 활용 문제 및 세대 간 갈등 문제를 해결한 해군 조직의 기대상에 대해 서술하였다.

  • PDF

입주기업 확대를 통한 광양항 해양산업클러스터 활성화 방안 (A Study on Revitalization of Gwangyang Port Marine Industry Cluster Through Attracting R&D Enterprises)

  • 김보경;이다예;김근섭
    • 한국항만경제학회지
    • /
    • 제39권1호
    • /
    • pp.131-147
    • /
    • 2023
  • 광양항 해양산업클러스터는 현재 실질적으로 운영되는 국내 유일의 해양산업클러스터이나, 개장 이후 다양한 활성화 정책을 추진함에도 불구하고 현재까지 입주율은 낮은 실정이다. 이에 따라 입주기업 활성화를 저해하는 현행 제도의 제약요인을 식별하고 활성화 방안을 마련하는 것이 본 연구의 목적이다. 이를 위해 우선적으로 광양항 해양산업클러스터의 핵심산업인 해운항만물류분야 연구개발(R&D)사업 현황을 분석하고, 광양항 해양산업클러스터 입주가 예상되는 기업을 대상으로 설문조사를 수행하였다. 그 결과 항만·해운분야 R&D 비중이 타 분야 대비 낮고, 국내 연구개발 사업은 민간 중소기업을 중심으로 추진되고 있다. 또한 실증을 위한 항만시설 필요성이 높지 않으며, 광양항에 대한 기업 접근성 부족이 제약요인으로 도출되었다. 이를 바탕으로 본 연구에서는 입주기업 확대를 위한 개선방안을 다음과 같이 4가지로 제시하였다. 첫째, 현재 광양항 해양산업클러스터에 입주가능한 핵심산업을 해운·항만·물류분야에서 해양수산업 전체로 확대하여 해당 산업에서 R&D를 수행하는 기업이 입주할 수 있도록 개선이 필요하다. 두 번째, 현재 기업 입주 자격으로 제시되고 있는 업종코드 변경을 통해 실제 연구개발사업을 수행하는 기업이 등록된 업종을 반영함과 동시에 해양수산업 전체로 확대되는 핵심산업군을 모두 포함할 수 있어야 한다. 따라서 본 연구에서 향후 광양항 해양산업클러스터 입주기업 모집 시 활용할 수 있는 확대된 기업코드를 제시하였다. 세 번째, 현제 광양항 해양산업클러스터는 연 1~2회 입주기업을 모집하는 방식을 취하고 있으나, R&D 수행기업이 실증을 위한 항만 활용 수요가 발생한 시점에 맞추어 유연하게 입주할 수 있도록 해야 하며, 이를 위해 상시모집 체계로 전환을 제시하였다. 마지막으로 입지적으로 낮은 접근성을 극복하기 위해서는 보편적인 재정적 지원보다는 민간기업 또는 중소기업이 실질적으로 필요로 하는 연구개발에 특화된 기술개발 지원사업이 필요하며, 이를 입주 유인책으로 활용해야 한다.

멀티 모달리티 데이터 활용을 통한 골다공증 단계 다중 분류 시스템 개발: 합성곱 신경망 기반의 딥러닝 적용 (Multi-classification of Osteoporosis Grading Stages Using Abdominal Computed Tomography with Clinical Variables : Application of Deep Learning with a Convolutional Neural Network)

  • 하태준;김희상;강성욱;이두희;김우진;문기원;최현수;김정현;김윤;박소현;박상원
    • 한국방사선학회논문지
    • /
    • 제18권3호
    • /
    • pp.187-201
    • /
    • 2024
  • 골다공증은 전 세계적으로 주요한 건강 문제임에도 불구하고, 골절 발생 전까지 쉽게 발견되지 않는 단점을 가지고 있습니다. 본 연구에서는 골다공증 조기 발견 능력 향상을 위해, 복부 컴퓨터 단층 촬영(Computed Tomography, CT) 영상을 활용하여 정상-골감소증-골다공증으로 구분되는 골다공증 단계를 체계적으로 분류할 수 있는 딥러닝(Deep learning, DL) 시스템을 개발하였습니다. 총 3,012개의 조영제 향상 복부 CT 영상과 개별 환자의 이중 에너지 X선 흡수 계측법(Dual-Energy X-ray Absorptiometry, DXA)으로 얻은 T-점수를 활용하여 딥러닝 모델 개발을 수행하였습니다. 모든 딥러닝 모델은 비정형 이미지 데이터, 정형 인구 통계 정보 및 비정형 영상 데이터와 정형 데이터를 동시에 활용하는 다중 모달 방법에 각각 모델 구현을 실현하였으며, 모든 환자들은 T-점수를 통해 정상, 골감소증 및 골다공증 그룹으로 분류되었습니다. 가장 높은 정확도를 갖는 모델 우수성은 비정형-정형 결합 데이터 모델이 가장 우수하였으며, 수신자 조작 특성 곡선 아래 면적이 0.94와 정확도가 0.80를 제시하였습니다. 구현된 딥러닝 모델은 그라디언트 가중치 클래스 활성화 매핑(Gradient-weighted Class Activation Mapping, Grad-CAM)을 통해 해석되어 이미지 내에서 임상적으로 관련된 특징을 강조했고, 대퇴 경부가 골다공증을 통해 골절 발생이 높은 위험 부위임을 밝혔습니다. 이 연구는 DL이 임상 데이터에서 골다공증 단계를 정확하게 식별할 수 있음을 보여주며, 조기에 골다공증을 탐지하고 적절한 치료로 골절 위험을 줄일 수 있는 복부 컴퓨터 단층 촬영 영상의 잠재력을 제시할 수 있습니다.

어체 크기의 자동 식별을 위한 split beam 음향 변환기의 재발 (Development of a split beam transducer for measuring fish size distribution)

  • 이대재;신형일
    • 수산해양기술연구
    • /
    • 제37권3호
    • /
    • pp.196-213
    • /
    • 2001
  • 체장어군탐지기(fish sizing echo sounder) 의송.수파기로서 사용하기 위한 split beam 음향 변환기를 개발하기 위한 시도로서, Dolph Chebyshev배열 기법을 이용하여 36개의 압전 진동소자에 진폭 가중치를 부여한 평면배열 음향 변환기를 설계.제작하고, 이 변환기의 수중음향방사 특성에 대해 분석.고찰한 결과를 요약하면 다음과 같다. 1. split beam 음향 변환기의 4 개의 독립적인 진동자 블록에 대한 수중에서의 평균적인 공진 및 반공진 주파수는 각각 69.8 kHz. 83.0 kHz이었고, 이들 공진과 반공진 주파수에서의 임피던스는 49.2$\omaga$. 704.7$\omaga$이었다. 음향변환기의 4 개의 모든 진동자 블록 (sum beam)에 대한 수중에서의 공진 및 반공진 주파수는 각각 71.4 kHz, 82.1kHz이었고. 이들 공진과 반공진 주파수에서의 임피던스는 15.2$\omaga$, 17.3$\omaga$이었다. 2 split beam 음향 변환기의 4 개의 독립적인 진동자 블록에 대한 최대 송파전압감도(TVR)는 공통적으로 70.0 kHz에서 165.5 dB이었고, -3 dB 점에 대한 송신 주파수 대역폭은 10.0 kHz이었다. 또한. split beam 음향 변환기의 4 개의 조합된 진동자 블록에 대한 최대 수파감도(SRT)는 공통적으로 75.0 kHz에서 -177.5 dB이었고, -3 dB 점에 대한 수신 주파수 대역폭은 10.0 kHz이었다. 3.split beam 음향 변환기의 모든 진동자 블록에 대한 송신 지향성패턴은 원형이었고, -3 dB점에 대한 수평 및 수직방향에 대한 반감각(half beam angle)은 공통적으로 $9.0^\circ$이었다. 또한. 수평방향에 대한 제 1차 부엽 준위는 $22^\circ$$-26^\circ$에서 각각 -19.7 dB. -19.4 dB이었고. 수직방향에 대한 제1차 부엽 준위는 $22^\circ$$-26^\circ$에서 각각 -20.1 dB, -22.0 dB로서 설계 목표치 -20 dB과 매우 유사한 값을 나타내었다. 4.split beam 음향 변환기의 송파응답파형과 수파응답파형은 각각 송신 및 수신 공진주파수 부근인 70.0 kHz와 75.0 kHz에서 전기 입력펄스파형과 가장 유사한 특성을 나타내었다. 5. 본 연구에서 설계, 개발한 split beam 음향 변환기의 성능을 분석하기 위해 반사강도 보정을 위한 지향성손실과 물표의 위치각을 추정하기 위한 실험을 행한 결과 실험적으로 추정한 위치각은 실제적인 위치각과 잘 일치하였다.

  • PDF

사회문제 해결형 기술수요 발굴을 위한 키워드 추출 시스템 제안 (A Proposal of a Keyword Extraction System for Detecting Social Issues)

  • 정다미;김재석;김기남;허종욱;온병원;강미정
    • 지능정보연구
    • /
    • 제19권3호
    • /
    • pp.1-23
    • /
    • 2013
  • 융합 R&D가 추구해야 할 바람직한 방향은 이종 기술 간의 결합에 의한 맹목적인 신기술 창출이 아니라, 당면한 주요 문제를 해결함으로써 사회적 니즈를 충족시킬 수 있는 기술을 개발하는 것이다. 이와 같은 사회문제 해결형 기술 R&D를 촉진하기 위해서는 우선 우리 사회에서 주요 쟁점이 되고 있는 문제들을 선별해야 한다. 그런데 우선적이고 중요한 사회문제를 분별하기 위해 전문가 설문조사나 여론조사 등 기존의 사회과학 방법론을 사용하는 것은 참여자의 선입견이 개입될 수 있고 비용이 많이 소요된다는 한계를 지닌다. 기존의 사회과학 방법론이 지닌 문제점을 보완하기 위하여 본 논문에서는 사회적 이슈를 다루고 있는 대용량의 뉴스기사를 수집하고 통계적인 기법을 통하여 사회문제를 나타내는 키워드를 추출하는 시스템의 개발을 제안한다. 2009년부터 최근까지 3년 동안 10개 주요 언론사에서 생산한 약 백 30만 건의 뉴스기사에서 사회문제를 다루는 기사를 식별하고, 한글 형태소 분석, 확률기반의 토픽 모델링을 통해 사회문제 키워드를 추출한다. 또한 키워드만으로는 정확한 사회문제를 파악하기 쉽지 않기 때문에 사회문제와 연관된 키워드와 문장을 찾아서 연결하는 매칭 알고리즘을 제안하다. 마지막으로 사회문제 키워드 비주얼라이제이션 시스템을 통해 시계열에 따른 사회문제 키워드를 일목요연하게 보여줌으로써 사회문제를 쉽게 파악할 수 있도록 하였다. 특히 본 논문에서는 생성확률모델 기반의 새로운 매칭 알고리즘을 제안한다. 대용량 뉴스기사로부터 Latent Dirichlet Allocation(LDA)와 같은 토픽 모델 방법론을 사용하여 자동으로 토픽 클러스터 세트를 추출할 수 있다. 각 토픽 클러스터는 연관성 있는 단어들과 확률값으로 구성된다. 그리고 도메인 전문가는 토픽 클러스터를 분석하여, 각 토픽 클러스터의 레이블을 결정하게 된다. 이를 테면, 토픽 1 = {(실업, 0.4), (해고, 0.3), (회사, 0.3)}에서 토픽 단어들은 실업문제와 관련있으며, 도메인 전문가는 토픽 1을 실업문제로 레이블링 하게 되고, 이러한 토픽 레이블은 사회문제 키워드로 정의한다. 그러나 이와 같이 자동으로 생성된 사회문제 키워드를 분석하여 현재 우리 사회에서 어떤 문제가 발생하고 있고, 시급히 해결해야 될 문제가 무엇인지를 파악하기란 쉽지 않다. 따라서 제안된 매칭 알고리즘을 사용하여 사회문제 키워드를 요약(summarization)하는 방법론을 제시한다. 우선, 각 뉴스기사를 문단(paragraph) 단위로 세그먼트 하여 뉴스기사 대신에 문단 세트(A set of paragraphs)를 가지게 된다. 매칭 알고리즘은 각 토픽 클러스터에 대한 각 문단의 확률값을 측정하게된다. 이때 토픽 클러스터의 단어들과 확률값을 이용하여 토픽과 문단이 얼마나 연관성이 있는지를 계산하게 된다. 이러한 과정을 통해 각 토픽은 가장 연관성이 있는 문단들을 매칭할 수 있게 된다. 이러한 매칭 프로세스를 통해 사회문제 키워드와 연관된 문단들을 검토함으로써 실제 우리 사회에서 해당 사회문제 키워드와 관련해서 구체적으로 어떤 사건과 이슈가 발생하는 지를 쉽게 파악할 수 있게 된다. 또한 매칭 프로세스와 더불어 사회문제 키워드 가시화를 통해 사회문제 수요를 파악하려는 전문가들은 웹 브라우저를 통해 편리하게 특정 시간에 발생한 사회문제가 무엇이며, 구체적인 내용은 무엇인지를 파악할 수 있으며, 시간 순서에 따른 사회이슈의 변동 추이와 그 원인을 알 수 있게 된다. 개발된 시스템을 통해 최근 3년 동안 국내에서 발생했던 다양한 사회문제들을 파악하였고 개발된 알고리즘에 대한 평가를 수행하였다(본 논문에서 제안한 프로토타입 시스템은 http://dslab.snu.ac.kr/demo.html에서 이용 가능함. 단, 구글크롬, IE8.0 이상 웹 브라우저 사용 권장).