• 제목/요약/키워드: 사건 추출

검색결과 174건 처리시간 0.024초

실시간 이슈 탐지를 위한 일반-급상승 단어사전 생성 및 매칭 기법 (A Generation and Matching Method of Normal-Transient Dictionary for Realtime Topic Detection)

  • 최봉준;이한주;용우석;이원석
    • 한국차세대컴퓨팅학회논문지
    • /
    • 제13권5호
    • /
    • pp.7-18
    • /
    • 2017
  • 트위터는 사용자들에게 정보를 받거나 교환하는 채널로써의 역할이 활발히 이루어지고 있고 새로운 사건이 발생했을 때 빠르게 반응하기 때문에 지진이나 홍수, 자살 등의 새로운 사건을 탐지하는 센서역할로 활용할 수 있다. 그리고 사건을 탐지하기 위해서 우선적으로 관련된 트윗 추출이 필수적이다. 하지만 관련된 트윗을 찾기 위해 관련 키워드를 포함한 트윗을 추출하기 때문에 해당 키워드가 없지만 의미적으로 사건과 관련이 있는 트윗은 찾지 못하는 문제점이 있다. 또한 기존의 연구들은 디스크에 저장된 데이터에 대한 분석이 주를 이루고 있어 원하는 결과를 얻기 위해서는 데이터를 수집하여 저장하고 분석에 이르기까지 오랜 시간이 소모된다. 이러한 문제점을 해결하기 위해 본 연구에서는 실시간 이슈 탐지를 위한 일반-급상승 단어 사전 생성 및 매칭 기법을 제안한다. 데이터 스트림 인메모리 기반으로 일반-급상승 단어 사전을 생성 및 관리하기 때문에 새로운 사건을 빠르게 학습하고 대응할 수 있다. 또한 분석을 원하는 주제의 일반 사전과 급상승 사전을 동시에 관리하기 때문에 기존의 방법으로 찾지 못하는 트윗을 검출해 낼 수 있다. 본 연구를 통해 빠른 정보와 대응이 필요한 분야에 즉시적으로 활용할 수 있다.

스토리텔링 콘텐츠의 효과적인 관리를 위한 영화 스토리 발단부의 자동 경계 추출 (Extracting Beginning Boundaries for Efficient Management of Movie Storytelling Contents)

  • 박승보;유은순;정재은
    • 지능정보연구
    • /
    • 제17권4호
    • /
    • pp.279-292
    • /
    • 2011
  • 영화는 스토리를 전달하는 대표적인 매체 중의 하나이며 영화 속 스토리는 인물, 사건, 배경의 유기적인 연결을 통해 진행된다. 소설과 같이 스토리를 지닌 다른 매체와 마찬가지로 영화 역시 서사 구조를 갖고 있다. 즉 등장인물 간의 갈등과 해결이 인과 관계에 따라 전개된다. 영화의 서사구조는 아리스토텔레스의 3막 구조를 가지며 6단계로 세분화 될 수 있다. 전통적인 3막 구조는 발단부, 중반부, 결말부로 구성된다. 발단부는 영화에 등장하는 인물이나 배경을 소개하고 사건의 실마리와 갈등을 암시하는 장치들을 제시한다. 중반부는 내외적인 요인들에 의해 사건이 발전하고 갈등과 긴장을 고조시키는 부분이다. 결말부에서는 사건이 해결되면서 스토리의 주제 및 작가의 메시지가 전달된다. 특히 발단부는 스토리 진행을 위해 등장인물의 성격을 설정하고 배경을 지시하는 등의 다양한 정보가 노출되는 부분이기 때문에 영화의 축약이나 등장인물들의 중요한 정보를 추출할 수 있는 중요한 부분이다. 따라서 영화의 스토리를 추출할 경우 서사구조에 따라 가중치를 다르게 부여할 필요가 있다. 본 논문에서는 등장인물 수를 누적한 그래프를 이용하여 발단부와 중반부의 경계를 추출하는 방법을 제시한다. 발단부에서는 주요 등장인물이 소개되고 이들 간의 갈등이 암시되거나 사건의 실마리가 제시된다. 따라서 주요 등장인물의 등장이 마무리되는 장면에서 일정 장면이 진행된 이후의 장면이 발단부와 중반부의 경계가 된다. 주요 등장인물은 주인공과 적대자, 그리고 주인공과 적대자를 보조해 주는 각각의 보조자(조연)로 구성되기 때문에 등장인물 수 누적 그래프에서 주요 등장인물의 등장이 마무리되는 장면을 찾기 위해서는 단역을 제거하여야 한다. 또한 주요 등장인물이 더 이상 등장하지 않는 변곡점을 찾는 방법이 필요하다. 이를 위해 본 논문에서는 단역이 제거된 등장인물 수 누적 그래프를 그린 후 변곡점을 찾는 방법을 제안한다. 실제 발단부와 중반부의 경계는 주요 등장인물의 출현이 마무리 된 후 갈등과 사건의 실마리가 암시되는 추가적인 장면이 진행된 후에 나타난다. 따라서 다수의 영화를 통해 추가적인 장면의 개수를 설정하는 실험을 진행할 것이다.

시간적 분해에 기반한 F0 궤적 모델에 관한 연구 (F0 Contour Model based on Temporal Decomposition)

  • 변효진;김연준;오영환
    • 한국음향학회지
    • /
    • 제18권8호
    • /
    • pp.75-83
    • /
    • 1999
  • 본 논문에서는 음성합성의 억양 제어를 위한 새로운 F0 궤적 모델을 제안한다. 제안한 모델은 발성된 문장의 F0 궤적을 중첩가산되는 사건들로 분해하고, 각 사건들을 가우시안 종모양의 사건함수로 모델링한다. 그리고 제안한 모델을 위한 파라미터 추정 알고리즘을 제시한다. 제안한 모델은 특정한 음운론적 지식에 기반하지 않았으며, F0 궤적의 분석단계와 합성단계에 모두 사용 가능하다. 제안한 모델의 성능평가를 위해 다양한 장르에서 추출한 여러 형태의 500문장의 코퍼스를 구축하고, 이를 전문 아나운서에게 발성하게 하여 구축한 음성코퍼스로 실험한 결과, 원음성의 F0 궤적과 제안한 모델에 의해 합성된 F0 궤적의 평균 제곱 오류근이 7.87Hz이었다.

  • PDF

엘리베이터 내에서 폭행 및 폭력사건에 관한 연구 (A Study on Assault and Violence in Elevator)

  • 신성윤;신광성;이종찬;박상준;이양원;이현창
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2012년도 추계학술대회
    • /
    • pp.60-62
    • /
    • 2012
  • 폭행은 상대방보다 우월적인 힘을 가지고 상대방의 신체에 접촉하는 것을 말 한다. 즉, 주먹으로 상대를 가격하는 행위이다. 본 논문에서는 엘리베이터 내에서 발생하는 이러한 폭력 및 폭행 사건을 장면 전환 검출 기법인 컬러 히스토그램을 이용하여 추출하도록 한다.

  • PDF

한국형 표준원전 화재사건에 대한 2단계 PSA 불확실성 분석

  • 김시달;안광일;박수용;김동하;진영호
    • 한국원자력학회:학술대회논문집
    • /
    • 한국원자력학회 1998년도 춘계학술발표회논문집(1)
    • /
    • pp.881-886
    • /
    • 1998
  • 한국형 표준 원진(울진 원전 3,4호기)화해 사건에 대한 2 단계 확률론적 안전성평가 (Level 2PSA) 에서 격납건물 파손모드에 큰 영향을 준다고 판단되는 현상들에 대한 불확실성 분석을 수행하였다. 불확실성 분석 대상은 주로 민감도분석 및 기존 2단계 PSA수행결과 중요한 인자로 선정된 8가지 주요 현상들로 국한하였다. 수행 방법은 성층화 추출방식 (Latin Hypercube Sampling)으로부터 발생된 1000개의 표본을 사용하였고, 분석결과는 두가지 불확실성 측도로 제시하였으며, 사용된 코드는 2 단계 PSA 분석용 전산코드인 CONPAS 이다. 불확실성 관리측면에서. 제일 불확실성이 높은 격납건물 파손모드인 원자로 공동바닥관통의 불확실성 인자를 줄이기 위해서는 CR-EJECT 현상에 대한 불확실성 을 줄여야 할 것이다.

  • PDF

자동 인덱싱에 기반한 뉴스 비디오 검색 시스템의 설계 및 구현 (Design and Implementation of the News Video Retrieval System based on Automatic Indexing)

  • 이종구;양명섭;유철중;장옥배
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제5권1호
    • /
    • pp.43-52
    • /
    • 1999
  • 현재 사용하는 순차적인 뉴스 비디오 검색 방법은 많은 시간을 소비한다는 문제점을 가지고 있다. 따라서 , 본 논문에서는 이러한 문제점을 해결하기 위해서 뉴스 비디오를 내용(뉴스 사건)단위별로 검색할수 있는 자동 인덱스 모듈과 원격 검색 브라우저 모듈을 제시한다. 인덱싱 모듈은 기본적으로 이미지 프로세싱을 기반으로 하여 뉴스 앵커를 검출하고 뉴스 아이템을 분할한다. 인덱싱 구성요소는 뉴스 비디오 내용에 대한 대표영상(뉴스아이콘)과 부가적인 정보를 포함하는 뉴스 자막으로 구성하였다. 검색 브라우저 모듈은 추출된 인덱싱 요소를 아이콘하여 뉴스사건 단위로 내용을 검색할수 있도록 설계하였다. 본 연구의 결과는 매일 발생되는 뉴스를 자동 인덱싱하여 사용자에게 뉴스서비스의 효율적인 적용이 기대된다.

차량 번호판 인식을 이용한 증인 확보 블랙박스 (Black-box for Obtaining Witnesses Using Vehicle License Plate Recognition)

  • 문영찬;박재민;고영웅
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2012년도 추계학술발표대회
    • /
    • pp.841-843
    • /
    • 2012
  • 본 논문에서는 안드로이드 기반의 태블릿 PC 환경에서 차량사고 발생 시 번호판 인식을 통하여 해당 사건의 증인을 확보 할 수 있는 증인 확보용 블랙박스 시스템을 제안한다. 이 방법은 기존의 블랙박스 기능에 추가적으로 영상에서 추출한 자동차들의 번호판을 인식하여 번호판 정보를 로그데이터로 저장하는 방식을 사용한다. 이로 인해 차량 사고에 대한 증인을 확보할 수 있는 시스템을 제공함으로써 사건에 대한 사용자의 불리한 입장을 완화 시켜줄 수 있는 객관적 데이터를 제공 및 저장하는 것을 목표로 한다.

이용자 기반의 비디오 키프레임 자동 추출을 위한 뇌파측정기술(EEG) 적용 (Toward a Key-frame Extraction Framework for Video Storyboard Surrogates Based on Users' EEG Signals)

  • 김현희;김용호
    • 한국문헌정보학회지
    • /
    • 제49권1호
    • /
    • pp.443-464
    • /
    • 2015
  • 본 연구는 뇌파측정기술(EEG)과 사건관련유발전위 P3b를 활용하여 이용자의 인지적 반응을 측정한 후 비디오 키프레임을 자동으로 추출할 수 있는지의 가능성을 조사해 보았다. 20명의 피험자들을 대상으로 뇌파를 측정하고 분석한 결과, 적합 이미지 자극 시 좌측 두정엽 영역이 우측 두정엽 영역보다 더 활성화되며, 좌우측간 두정엽 영역의 활성화 정도가 유의한 차이를 보였다. 비적합 이미지 자극 시에는 좌측 두정엽 영역이 적합 이미지보다 덜 활성화되고, 두정엽 영역의 좌우간 활성화도 유의한 차이가 없는 것으로 나타났다. 이외에, 모든 채널의 평균값(MGFP1)의 잠재기, 채널 동시성 패턴 등에서도 두 자극간에 차이를 보여 뇌파측정기술에 기반한 키프레임 자동 추출이 가능한 것으로 확인되었다.

텍스트 마이닝 및 자동 추론 기반 생물학 지식 발견 시스템을 위한 확률 기반 필터링 (Probabilistic filtering for a biological knowledge discovery system with text mining and automatic inference)

  • 이희진;박종철
    • 한국컴퓨터정보학회논문지
    • /
    • 제17권2호
    • /
    • pp.139-147
    • /
    • 2012
  • 본 논문에서는 텍스트 마이닝을 통해 생물학 문헌에서 분자 수준의 사건(event) 정보를 자동으로 추출하고, 이들 사건 정보를 기반으로 새로운 생물학 지식을 자동 추론하는 텍스트 마이닝 - 추론 통합 구조의 시스템을 다룬다. 이러한 통합 구조의 지식 발견 시스템은 미리 추출되어 데이터베이스에 등록된 정보만을 입력으로 사용하는 시스템들에 비하여 최신 정보를 보다 빨리 사용할 수 있고, 미리 정의된 형식 이외의 다양한 정보를 사용할 수 있다는 장점이 있다. 반면, 텍스트 마이닝 정보 추출 결과를 그대로 사용하기 때문에 텍스트 마이닝 모듈(module)의 성능에 따라 전체 시스템의 효용성이 크게 저하될 수도 있다는 문제가 있다. 본 논문에서는 확률 기반 필터링(filtering) 방법을 제안하여, 텍스트 마이닝 결과 중 양성 오류(false positive)를 효과적으로 제거함으로써 전체 지식 발견 시스템의 정확도 및 효용성을 높이고자 한다. 본 논문에서 제안한 확률 기반 필터링 방법은 기준(baseline) 방법으로 사용된 횟수 기반 필터링 방법보다 높은 성능을 보였다.

비정형 보안 인텔리전스 보고서 기반 토픽 자동 추출 모델 (Topic Automatic Extraction Model based on Unstructured Security Intelligence Report)

  • 허윤아;이찬희;김경민;임희석
    • 한국융합학회논문지
    • /
    • 제10권6호
    • /
    • pp.33-39
    • /
    • 2019
  • 지능형 사이버 공격 기법이 다양화됨에 따라 보안 침해 사건, 글로벌 범죄 등의 사건 발생이 증가하고 있다. 지능형 공격을 예측하고 대응하기 위해서는 공격 기법의 특성, 수법, 유형을 파악해야 한다. 이를 위해 수많은 보안 기업 회사에서는 다양한 공격 기법을 빠르게 파악하고 더 큰 피해를 막기 위해 보안 인텔리전스 보고서를 배포한다. 하지만 각 기업에서 배포하는 보고서에 대한 형식이 맞춰져 있지 않으며, 대량의 비정형 보안 인텔리전스 보고서가 배포되고 있다. 본 논문은 비정형한 보안 인텔리전스 보고서에 대한 문제점을 고려하여 정형화된 데이터로 추출하는 방안을 제안한다. 또한, 대량의 보안 인텔리전스 보고서를 파악하기 위해 소요되는 시간을 줄이고자 대량의 보고서를 주제별로 분류할 수 있는 보안 인텔리전스 보고서 토픽 자동 추출 모델을 제안한다.