• 제목/요약/키워드: 비정형데이터분석

검색결과 405건 처리시간 0.043초

빅데이터를 활용한 재난전조감지 방안 (The Plan of Sensing of Disaster Signs Analyzing Big Data)

  • 최선화;최승용
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2012년도 학술발표회
    • /
    • pp.801-801
    • /
    • 2012
  • 최근 과학 IT 패러다임은 기존 하드웨어, 소프트웨어 중심에서 폭발적으로 증가하는 데이터를 활용하여 정치 사회 경제 등 제반 이슈와 연계된 분석 예측으로 진화하고 있으며, 모바일 인터넷과 소셜 미디어 등장으로 데이터가 경제적 자산이 되는 빅데이터 시대가 도래하였다. 급속히 변화하고 복잡해진 사회구조와 재난환경으로 인해 인력에만 의존한 재난관리의 사각지대가 대형재난으로 이어질 우려가 크므로 다양한 재난전조(前兆)를 체계적으로 관리하여 선제적으로 예방하는 체계가 필요하다. 본 연구는 인터넷에 존재하는 재난관련 언론보도, 민원, 제보, 소셜 미디어 등의 비정형 데이터와 재난관련 정형 데이터(DB)를 융합 분석하여 재난전조를 사전에 감지하고 위험요소를 신속히 제거하는 빅데이터 기반 재난전조감지 체계를 제안한다. 최근 피해가 급증하고 있는 도시내수침수 피해 위험 예방을 위해 제안한 재난전조감지 체계를 적용하여 피해발생 위험요소 및 전조, 긴급 이슈 등을 감지하는데 활용하는 방안을 제안한다. 이는 전조를 감지하고 사전 침수 피해를 예측하여 피해 최소화 및 복구비용 절감, 저감능력 강화의 효과뿐만 아니라 위험요인 사전 차단 및 확산방지가 가능할 것으로 기대된다.

  • PDF

도심지 홍수 모니터링 향상을 위한 멀티센싱 기기의 현장실증을 통해 수집된 데이터의 활용방안 마련 (Prepare a plan to utilize data collected through field demonstration of multi-sensing devices to improve urban flood monitoring)

  • 정승권;유성종;이수원
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2023년도 학술발표회
    • /
    • pp.19-19
    • /
    • 2023
  • 최근 기후변화에 의해 단기간에 많은 양의 집중호우가 발생하여 도시지역의 침수 피해가 증가하고 있다. 이에 도시지역의 홍수 피해 해결을 위해 도심지 홍수 발생 시 홍수정도 및 상황을 파악할 수 있는 장비가 개발되었으나, 실용화 단계까지는 진행이 미흡한 상황이다. 또한 기존 도시지역 홍수 현상 및 원인을 분석하기 위해 수치모형을 활용하고 있으나, 우수관망의 노후화 및 초기 강우패턴 적용에 대한 정확한 해석결과의 어려워 활용성이 낮다. 또한 홍수정도와 발생상황 인지를 위한 계측 장비의 개발 연구는 지속적으로 진행되고 있으나, 계측 장비의 높은 가격으로 전국적으로 설치 할 수 없는 상황으로 이를 대응하기 위한 별도의 방안 마련이 필요한 실정이다. 이를 위해 본 과제에서는 고성능·저비용 계측센서를 개발하여 실용화 가능성을 높이고, 전국에 산재되어있는 CCTV(교통상황, 방법용 등)의 영상을 활용한 침수상황 인지 기술 개발, 계측 데이터와 모니터링 데이터의 활용을 위한 빅데이터 개방 플랫폼을 구축하여, 상습 침수지역에 대해 실시간 감시가 가능한 계측 시스템의 정형 데이터와 CCTV 및 영상 등 모니터링 장비의 비정형 데이터의 분석 기술을 결합한 새로운 도심지 홍수 감시 기술의 개발을 목표로 한다. 이를 위해 본 연구 1차년도에 지표면 침수심 계측센서와 우수관망 월류심 계측센서를 개발하였으며, 2차년도에는개발된 계측센서의 현장실증을 통해 데이터를 수집한다. 수집된 계측센서 데이터와 비정형(CCTV 영상) 데이터의 AI학습을 통해 분석된 침수심, 침수범위, 침수면적 데이터는 도심지 홍수 정보 프로그램을 통해 표출되며, 최종적으로는 현장 상황을 쉽게 파악 가능한 3D 레이어의 형식으로 표출하고자 한다. 추후 도심지 홍수 정보 프로그램을 통해 표출되는 3D 레이어는 환경부가 추진하는 DT(Digital Twin) 연계 인공지능(AI) 홍수예보 사업과의 연계 시 도심지 홍수 지도 구축을 위한 자료로 활용될 수 있을 것으로 판단된다.

  • PDF

잠재 의미 분석을 적용한 유사 특허 검색 서비스 시스템 (Similar Patent Search Service System using Latent Dirichlet Allocation)

  • 임현근;김재윤;정회경
    • 한국정보통신학회논문지
    • /
    • 제22권8호
    • /
    • pp.1049-1054
    • /
    • 2018
  • 유사 특허를 검색하는 방법으로 기존에는 키워드 검색 방법을 사용하고 최근에는 머신러닝을 활용한 자동분류 방법을 사용하고 있다. 키워드 검색은 데이터 정제를 통해 정형화된 데이터 분석 방법으로 단문일 경우 검색에서는 정확도는 높지만 문서와 같이 여러 단어로 이루어진 장문일 경우 문장에 내포된 의미 분석을 할 수 없었다. 의미 분석 단계에서의 자동 분류 방법은 비정형 데이터 분석 방법으로 여러 단어로 이루어진 문장을 분류하는데 사용되고 있다. 그 동안 두 가지 방법을 결합하여 유사 문서 검색을 하려는 시도가 있었지만 비정형 데이터와 정형 데이터의 동시 사용에는 분석하는 방법이 다르기 때문에 동시 적용에는 알고리즘 상의 문제가 있었다. 이에 본 논문에서는 문서에서 함축된 키워드를 검출하고 잠재 의미 분석(LDA) 방식을 사용하여 사람이 개입하지 않고 문서를 효율적으로 자동분류하고 유사 특허를 검색할 수 있는 방법을 연구하였다.

병원 ERP시스템을 적용한 CEP 기반 실시간 분석시스템 개발 (Development of CEP-based Real Time Analysis System Using Hospital ERP System)

  • 김미진;유윤식;서영우;장종욱
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2015년도 춘계학술대회
    • /
    • pp.290-293
    • /
    • 2015
  • 개개인의 데이터가 비즈니스적으로 중요하지 않을 수 있지만, 대량으로 모으면 그 안에 숨겨진 새로운 정보를 발견할 가능성이 있는 데이터의 집합체로 빅데이터 분석 활용 사례는 점차 늘어나는 추세이다. 빅데이터 분석 기술 중 전통적인 데이터 분석방법인 하둡(Hadoop)은 예전부터 현재에 이르기까지 정형 비정형 빅데이터 분석에 널리 사용되고 있는 기술이다. 하지만 하둡은 배치성 처리 시스템으로 데이터가 많아질수록 응답 지연이 발생할 가능성이 높아, 현재 기업 경영환경과 시장환경에 대한 엄청난 양의 고속 이벤트 데이터에 대한 실시간 분석이 어려운 상황이다. 본 논문에서는 급변하는 비즈니스 환경에 대한 대안으로 오픈소스 CEP(Complex Event Processing)기반 기술을 사용하여 초당 수백에서 수십만건 이상의 이벤트 스트림을 실시간으로 지연 없이 분석가능하게 하는 실시간 분석 시스템을 개발하여 병원 ERP시스템에 적용하였다.

  • PDF

빅데이터 분석 도구 R 언어를 이용한 비정형 데이터 시각화 (Visualizing Unstructured Data using a Big Data Analytical Tool R Language)

  • 남수태;진금회;신성윤;진찬용
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2021년도 춘계학술대회
    • /
    • pp.151-154
    • /
    • 2021
  • 빅데이터 분석은 데이터 저장소에 저장된 대용량 데이터 속에서 의미 있는 새로운 상관관계, 패턴, 추세를 발견하여 새로운 가치를 창출하는 과정이다. 또한 대부분의 빅데이터 분석 기술 방법들은 기존 통계학과 전산학에서 사용되던 데이터 마이닝, 기계 학습, 자연 언어 처리, 패턴 인식 등이 이에 해당된다. 그리고 빅데이터 분석 도구인 R언어를 이용하여 전-처리된 텍스트 데이터를 이용하여 다양한 시각화 함수를 통해 분석결과를 표현할 수 있다. 본 연구에서 사용된 데이터는 한국정보통신학회 학회지 논문 중에서 2021년 3월호 논문 21편을 대상으로 분석을 하였다. 최종 분석결과는 가장 많이 언급된 키워드는 "데이터"가 305회로 1위를 차지하였다. 따라서 이러한 분석결과를 바탕으로 연구의 한계와 이론적 실무적 시사점을 제시하고자 한다.

  • PDF

웹 미디어 데이터를 이용한 이슈 예측 시스템 설계 (Designing issue prediction system using web media data)

  • 윤현노;문남미
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2019년도 춘계학술발표대회
    • /
    • pp.501-503
    • /
    • 2019
  • IT 기술의 발달에 따라 다양한 웹 미디어의 데이터가 기하급수적으로 증가하고 있으며 이는 비정형 형태의 빅 데이터로 활용도가 매우 높다. 그 중 인터넷 뉴스나 SNS 등은 시간의 흐름에 따라 다양한 이슈들이 서로 영향을 주며 발생, 결합, 분화, 소멸된다. 본 논문에서는 인터넷상에서 발생하는 비정형 데이터들을 수집하여 텍스트 마이닝을 통해 글의 주요이슈 키워드, 카테고리, 날짜 등을 추출한다. 추출한 데이터를 일정 기간별로 나누어 이슈 매핑을 통해 이슈간의 상관관계를 분석한다. 나아가 LSTM 또는 GRU를 이용한 딥러닝을 통해 앞으로의 이슈를 예측하는 시스템 설계를 제안한다.

빅데이터기반의 로그분석을 통한 통합 관리 솔루션 개발 (Development of integrated management solution through log analysis based on Big Data)

  • 강선경;이현창;신성윤
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2017년도 추계학술대회
    • /
    • pp.541-542
    • /
    • 2017
  • 본 논문에서는 복잡하고 다양한 클라우드 환경을 통합하여 간편하게 운영할 수 있는 통합관리 솔류션을 개발하고자 한다. 이는 빅데이터 기반의 정형로그데이터와 비정형로그데이터를 수집하고 분석하여 실시간으로 통합 모니터링이 가능하여 사용자와 관리자가 편리하게 문제를 해결할 수 있다는 장점을 가지고 있다. Hypervisor 로그패턴 분석 기술을 통해 기존의 복잡하고 다양한 클라우드 환경을 좀 더 효율적으로 운용 관리할 수 있는 솔루션이라 하겠다.

  • PDF

뉴스 데이터 기반 농업 가뭄 전조 감지 및 확산 분석 (Detection and spread of agricultural drought warning based on news data)

  • 김민진;남원호;양미혜;이지완;김성준
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2023년도 학술발표회
    • /
    • pp.339-339
    • /
    • 2023
  • 2018년도 연강수량은 1,386.9 mm로 평년 수준의 비가 내렸으나, 7-8월에 발생한 폭염 및 가뭄으로 인해 강원, 전남, 경북, 충남 지역에서 밭작물 중심으로 22,767 ha 피해가 발생하였다. 2019년도 연강수량은 1,171.9 mm로 평년보다 약 10% 적은 수준의 비가 내렸으며, 동일시기에 인천, 강원, 충남 지역에서 논·밭작물 중심으로 3,112 ha 피해가 발생하였다. 기후변화로 인해 강수량이 지역별로 편중되어 국지적 가뭄이 빈발하여 지역별로 가뭄의 영향, 피해, 체감 정도가 상이한 양상을 보이고 있다. 가뭄을 사전에 방지하기 위해서는 가뭄 모니터링과 선제적 대응이 중요하며, 현재 가뭄의 특징, 상황 등의 목적에 따라 다양한 형태의 가뭄 모니터링 시스템이 개발되고 있다. 가뭄의 피해와 영향 정도는 지역 간의 차이가 나타나 지역별로 가뭄을 체감하는 정도가 다르기 때문에 하나의 결과로 나타내기에는 어려움이 있다. 따라서, 가뭄의 발생 시기와 확산 정도를 분석하여 특보 발효 시점과 가뭄 대응 방안에 대한 기준 마련이 중요하다. 본 연구는 현대 사회에서 가장 중요한 요소로써 활용되고 있는 빅데이터 중 비정형 데이터로 분류되는 뉴스데이터와 논·밭의 가뭄을 나타내는 농업 가뭄과 관련된 데이터를 활용하여 농업 가뭄의 전조를 파악해보고자 한다. 2018년부터 2019년까지 전국을 대상으로 농업 가뭄에 관한 키워드 선정 후, 웹 크롤링을 통해 뉴스데이터를 수집해 논 가뭄과 밭 가뭄을 구별하여 각 지역에서 최초로 가뭄 기사가 발행된 시기와 지역별 기사의 빈도를 산출하였다. 뉴스데이터의 농업 가뭄 전조 감지 가능성을 파악하기 위해 국가가뭄정보통계집에서 논 물마름 시기와 밭 시듦 시기 자료를 활용하였다. 가뭄 피해 발생시기와 관련 기사 발행 시기 비교, 농업용수 대상 비상용수 지원 자료를 활용하여 실제 농업 가뭄확산 감지 여부를 분석하여 농업 가뭄 관련 뉴스데이터 간의 상관성을 분석하였다.

  • PDF

감성분석 연구 동향 (Sentimental Analysis Research Trends)

  • 이정훈
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2018년도 춘계학술발표대회
    • /
    • pp.358-361
    • /
    • 2018
  • 비정형 데이터 증가로 텍스트 마이닝을 사용해 데이터를 분석하는 연구가 주목받고 있다. 감성분석은 단어와 문맥을 분석하여 텍스트의 감정을 파악하는 기술이다. 본 논문에서는 감성분석 연구 동향, 적용분야, 방법론에 관해 분석하고 기술하려 한다. 감성분석은 2001년 채팅의 감정을 분석하면서 시작되었고, 2008년부터 본격적으로 연구가 진행되었다. 감성분석은 SNS, 상품 후기, 영화평, 뉴스 기사 등 다양한 데이터에 적용되고 있으며, 사회이슈 찬반 분석과 장소 선호도 분석 등 다양한 연구에서 사용되었다. 감성분석 방법은 감성사전을 이용하는 방식과 기계학습을 사용하는 방식으로 나누어지며 분석 방법을 발전시키기 위한 연구가 진행되고 있다.

R과 분석 알고리즘을 활용한 기업의 성장성 예측에 관한 연구 (A Study of Prediction on Company's Growth with R and Analysis Algoritnm)

  • 강희석;김경수;류지승;이가연;이민정
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2017년도 추계학술발표대회
    • /
    • pp.428-431
    • /
    • 2017
  • 기업의 성장성과 기업 주식가치를 매출, 매출원가, 영업이익율 등의 정형데이터와 경제, 경영관련 뉴스 등 비정형 데이터를 토대로 다양한 알고리즘을 활용해 분석하고, 그 결과의 유의성을 검증한다. 주성분회귀분석, 인공신경망, 나이브 베이지안 분류자, 긍/부정 사전분석 모델을 통해 분석된 결과를 검토하여 각 분석모델 별 성능을 확인하고, 기업 성장성 예측을 위해 활용 가능한 모델과 필요한 데이터를 제시한다.