• Title/Summary/Keyword: 자동정보 추출

Search Result 1,995, Processing Time 0.025 seconds

Automatic Detection of Anchorperson Shots for News Video Abstraction (뉴스 동영상 요약을 위한 앵커 장면 자동 추출 알고리즘)

  • 정진국;이태연;낭종호;김경수;하명환;정병희
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2001.10b
    • /
    • pp.274-276
    • /
    • 2001
  • 최근 많이 사용되는 대용량의 뉴스 비디오의 편리한 검색 및 관리 방법이 필요하게 되면서 뉴스 비디오 데이터를 자동으로 분석하여 저급 수준의 정보로부터 고급 수준의 내용 정보를 자동으로 추출하는 기술이 필요하게 되었다. 특히 뉴스를 요약하는데 있어서는 이런 기술이 더 유용하게 쓰일 수 있다. 앵커, 그래픽, 인터뷰, 기자보도, 회견/연설 장면 등이 뉴스 비디오의 고급 수준 내용 정보가 될 수 있는데 그 중에서도 앵커 장면은 뉴스의 기사를 나누는 고급 수준의 정보로서 중요한 의미를 갖게 된다. 본 논문에서는 이러한 앵커 장면을 자동으로 추출하는 방법을 제안한다. 앵커 장면의 공통된 특징을 이용하여 검출하게 되는데 첫 번째 특징은 한 뉴스 프로그램을 진행하는 앵커는 동일하다는 점이고 두 번째 특징은 동일한 스튜디오 안이라는 점이다. 본 논문에서는 앵커를 판별하는 방법으로 얼굴의 검출방법과 옷 색깔의 히스토그램 비교방법을 이용한다. 본 논문의 알고리즘을 여러 개의 KBS 9시 뉴스 비디오 데이터에 적용하여 실험한 결과 Recall과 Precision 모두 96% 이상 나오는 것을 알 수 있었다.

  • PDF

Implementation and Model to Automatically Generate an Ontology for Korean (한국어에 적합한 자동 온톨로지 생성을 위한 모델 제안 및 구현)

  • Jung, Young-Giu;Park, Mi-Sung;Choi, Jae-Hyuk;Lee, Sang-Jo
    • Annual Conference on Human and Language Technology
    • /
    • 2003.10d
    • /
    • pp.173-176
    • /
    • 2003
  • 본 논문은 언어학적 데이터로부터 자동으로 온톨로지를 생성하기 위한 모델을 제안하고 이를 구현한다. 모델 제안을 위해 온톨로지의 기본 구성 요소인 개념과 관계를 정의하고 이러한 개념과 관계 객체를 자동으로 추출하는 알고리즘을 제안한다. WordNet을 이용하여 개념을 자동으로 추출하고, 추출된 개념들간의 관계는 한국어의 구문적 특성을 이용하여 관계의 기본 형태를 정의하고 이를 기반으로 관계를 추출한다. 본 논문은 특허문서에서 전기통신기술문서를 대상으로 구현했으며, 제안된 알고리즘을 다른 영역으로 확장하여 이를 검증할 것이다.

  • PDF

Human Body Tracking And Transmission System Suitable for Mobile Devices (모바일 기기에 적합한 인체 추적 및 전송 시스템)

  • Kwak, Nae-Joung;Song, Teuk-Sob
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2011.06c
    • /
    • pp.437-439
    • /
    • 2011
  • 본 논문에서는 카메라에서 입력되는 영상에서 객체의 특징 자동 추출하고 모바일 기기로 전송하여 인체의 움직임을 표현하는 시스템을 제안한다. 제안시스템은 연속된 입력영상에서 인체의 실루엣과 조인트를 자동추출하고 조인트를 추적함으로 객체를 추적한다. 추출된 특징은 객체의 각 연결점의 위치정보로 사용되며 특징을 중심으로 블록매칭 알고리즘을 적용하여 특징의 위치정보를 추적하고 모바일기기로 정보를 전송한다. 모바일 기기에서는 전송된 조인트 정보를 이용하여 인체의 움직임을 재현한다. 제안방법을 실험 동영상에 적용한 결과 인체의 실루엣과 조인트를 자동 검출하며 추출된 조인트로 인체의 매핑이 효율적으로 이루어졌다. 또한 조인트의 추적이 매핑된 인체에 반영되어 인체의 움직임도 적절히 표현되었다.

A study on the Auto-extraction of Land Characterictics Using a GSIS (GSIS를 이용한 토지 특성의 자동추출에 관한 연구)

  • Park, Sung-Kyu;Lim, Seoung-Hyeon;Park, Jung-Nam;Cho, Gi-Sung
    • Journal of Korean Society for Geospatial Information Science
    • /
    • v.6 no.2 s.12
    • /
    • pp.59-67
    • /
    • 1998
  • This study deals with a auto-extraction of land characteristics using a GSIS. Major algorithm and a evaluation program was developed to automate the entire Process of land characteristics survey Through the automatic extraction of land information. To establish such a process, a method was provided to automatically extract detailed land information such as the shape, height, direction, road contact conditions, which could not be available in previous studies. The results showed that the adoption of such a automated process could lead the whole works related to the official land-value evaluation and securing residential complex to be more efficient and cost-saving in a scientific way comparing with existing process.

  • PDF

Abnormal Region Extraction of Brain MR Images Using Mean of White-grey Matter Thickness (회백질 두께 평균치를 이용한 뇌 MR영상의 비정상 영역 추출)

  • 조경은;채정숙;조형제
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2001.10b
    • /
    • pp.466-468
    • /
    • 2001
  • 의료 영상 처리 기술은 질병의 진단 및 치료를 위한 계획이나 방법을 결정하는데 있어 매우 중요한 역할을 하고 있으며 의료 영상 시스템과 같은 활용 분야에서는 질병이 있는 환자의 자동 진단을 위한 연구도 활발하게 이루어지고 있다. 여기서는 뇌 MR영상에서의 질병을 자동 진단할 수 있는 방법에 관한 연구를 한다. 뇌 MR영상에서의 질병 진단을 위한 단계로서 필수적으로 이루어져야 하는 단계가 비정상 영역의 추출 단계이다. 이 논문에서는 뇌의 질병 진단에 사용할 수 있는 자료를 제공하기 위한 전처리 단계로서 질병이 있는 환자의 뇌 영상에서 비정상적인 영역 추출 방법을 제안한다. 일반적으로 비정상적인 영역의 명암간 분포는 회백질 영역의 분포와 유사하나 두께 차이로서 구분이 가능하다. 여기서는 이 정보를 활용하여 정상인의 뇌영상에 대해서 회백질의 평균 두께 분포를 구하여 테스트로 입력되어지는 영상에서 회백질의 평균 두께 이상의 영역만을 남김으로서 질병이 있는 환자의 뇌 영상에서 비정상적인 영역을 추출할 수 있음을 보인다. 또한 추출되어진 비정상 영역에 대해서 진단에 필요한 인자를 자동으로 측정하였고 뇌경색, 뇌종양 환자를 포함한 63명의 뇌 MR 영상 시리즈에 대해서 실험하여 비교적 정확한 추출결과를 유도할 수 있었음을 확인하였다.

  • PDF

A Method for Automatic Extract ion of Term Definition from Text (텍스트로부터 용어 정의문의 자동 추출 방법)

  • Shin, Hyo-Shik;Kim, Jae-Ho;Lee, Hae-Yun;Choi, Key-Sun
    • Annual Conference on Human and Language Technology
    • /
    • 2002.10e
    • /
    • pp.292-299
    • /
    • 2002
  • 본 연구는 텍스트 코퍼스로부터 용어의 정의를 자동으로 추출하여 용어의 자동 추출기술과 통합하여 다목적의 용어뱅크를 구축하기 위한 목적으로부터 출발하였다. 지식정보의 확산에 따라 기존 전문분야 용어집에 수록되지 알은 용어의 수는 폭발적으로 증가하고 있다. 기존의 용어집 혹은 용어사전의 디지털화만으로는 새로운 전문용어의 포괄성에서 한계가 있는 것이다. 정보의 획득이라는 면에서 보면 이러한 한계를 극복하고 모든 용어에 대해서 즉시적으로 용어의 정의를 제공받는 것이 바람직하다. 자동으로 구축된 용어집의 응용은 여러 가지로 기대된다. 새로운 용어에 대한 의미 파악을 위해서는 물론, 확장된 전문용어집의 작성이나 전문분야 온톨로지의 구축 등에도 이용될 수 있다.

  • PDF

설계 패턴의 자동 추출을 위한 역공학에 관한 연구

  • 황하진;차정은;김행곤
    • Proceedings of the Korea Association of Information Systems Conference
    • /
    • 1997.10a
    • /
    • pp.83-88
    • /
    • 1997
  • 시스템 성능을 개선하고 변화하는 환경에 적응하기 위해서는 기존 시스템을 실험, 분석함으로써 정확한 이해를 획득하고 나아가 재사용 자원으로 활용할 수 있는 소프트웨어 역공학이 필요하다. 또한 설계 문제의 추상화와 특정 영역의 일반적인 해결책에 대한 정보 표현 및 그 관계는 패턴 형식을 통해 효과적으로 나타낼 수 있다. 즉, 시스템의 설계 구조 를 추출하여 시스템 분석과 설계를 향상시키고 표준화 된 설계 용어 및 컴퍼넌트 관계 구조 를 통해 재사용을 용이하게 하는 설계 패턴 추출을 위한 역공학은 중요하다. 따라서 본 논 문에서는 기존 코드에서 설계 패턴 추출을 위한 역공학 적용의 타당성과 설계 패턴 자동 추 출을 위한 몇 개의 알고리즘을 살펴보고 간단히 적용시켜 본다.

  • PDF

Text Undestanding System for Summarization (텍스트 이해 모델에 기반한 정보 검색 시스템)

  • Song, In-Seok;Park, Hyuk-Ro
    • Annual Conference on Human and Language Technology
    • /
    • 1997.10a
    • /
    • pp.1-6
    • /
    • 1997
  • 본 논문에서는 인지적 텍스트 이해 모형을 제시하고 이에 기반한 자동 요약 시스템을 구현하였다. 문서는 정보의 단순한 집합체가 아닌 정형화된 언어 표현 양식으로서 단어의 의미적 정보와 함께 표현 양식, 문장의 구조와 문서의 구성을 통해 정보를 전달한다. 요약 목적의 텍스트 이해 및 분석 과정을 위해 경제 분야 기사 1000건에 대한 수동 요약문을 분석, 이해 모델을 정립하였고. 경제 분야 기사 1000건에 대한 테스트 결과를 토대로 문장간의 관계, 문서의 구조에서 요약 정보 추출에 사용되는 정보를 분석하였다. 본 텍스트 이해 모형은 단어 빈도수에 의존하는 통계적 모델과 비교해 볼 때, 단어 간의 관련성을 찾아내고, 문서구조정보에 기반한 주제문 추출 및 문장간의 관계를 효과적으로 사용함으로서 정보를 생성한다. 그리고 텍스트 이해 과정에서 사용되는 요약 지식과 구조 분석정보의 상관관계를 체계적으로 연결함으로서 자동정보 추출에서 야기되는 내용적 만족도 문제를 보완한다.

  • PDF

A study on the Automatic Generation of Conversational QA Corpora (대화형 질의응답 말뭉치 자동 생성에 대한 연구)

  • Hwang, Seonjeong;Lee, Gary Geunbae
    • Annual Conference on Human and Language Technology
    • /
    • 2021.10a
    • /
    • pp.133-138
    • /
    • 2021
  • 최근 다양한 분야에서 자동 고객 응대 시스템을 도입하고 있으며 이에 따른 대화형 질의응답 시스템 연구의 필요성이 증가하고 있다. 본 논문에서는 새로운 도메인의 대화형 질의응답 시스템 구축에 필요한 말뭉치를 자동으로 생성하는 대화형 질의-응답 생성 시스템을 소개한다. 또한 이전 대화 내용을 고려하여 문서로부터 사용자의 다음 질문 대상이 될만한 응답 후보를 추출하는 맥락 관련 응답 추출 과제와 이에 대한 성능 평가 지표인 Sequential F1 점수를 함께 제안한다. 대화형 질의응답 말뭉치인 CoQA에 대해 응답 후보 추출 실험을 진행한 결과 기존의 응답 추출 모델보다 우리의 맥락 관련 응답 추출 모델이 Sequential F1 점수에서 31.1 높은 성능을 보였다. 또한 맥락 관련 응답 추출 모듈과 기존에 연구된 대화형 질의 생성 모듈을 결합하여 개발한 대화형 질의-응답 생성 시스템을 통해 374,260 쌍의 질의-응답으로 구성된 대화형 질의응답 말뭉치를 구축하였다.

  • PDF

Translation Dictionary Tuning System By using of Auto-Evaluation Method (자동 평가 방법을 이용한 번역 지식 튜닝 시스템)

  • Park, Eun-Jin;Jin, Yun;Kwon, Oh-Woog;Wu, Ying-Shun;Kim, Young-Kil
    • Annual Conference on Human and Language Technology
    • /
    • 2011.10a
    • /
    • pp.147-150
    • /
    • 2011
  • 본 논문에서는 병렬 말뭉치에서 오류가 있을 것으로 추정되는 문장을 자동 추출하여, 다수의 번역 사전 구축 작업자가 자동 번역시스템을 직접 사용하면서 번역 사전을 튜닝하는 방법에 대하여 제안하고자 한다. 작업자는 병렬 말뭉치의 대역문을 이용하여 자동 번역 결과의 BLEU를 측정하고, 사전 수정 전과 후의 BLEU 차이를 정량적으로 제시해 줌으로써 양질의 번역 사전을 구축하도록 하였다. 대량의 번역 사전이 이미 구축된 자동 번역시스템에서 추가적인 성능향상을 위해 대량의 말뭉치에서 미등록어, 번역패턴 등을 추출하여, 대량으로 구축하는 기존 방법에 비해 사전 구축 부작용이 적으며, 자동번역 성능향상에 더 기여하는 것을 실험을 통해 증명하였다. 이를 위해 본 논문에서는 중한 자동 번역시스템을 대상으로, 중국어 문장 2,193문장에 대해, 사전 구축 작업자 2명이 2주간 튜닝한 결과와 15만 말뭉치에서 추출한 미등록어 후보 2만 엔트리를 3명의 사전 구축 작업자가 미등록어 선별, 품사 및 대역어 부착한 결과 7,200 엔트리를 대상으로 자동평가를 실시하였다. 실험결과 미등록어 추가에 의한 BLEU 성능향상은 +3인데 반해, 약 2,000문장 튜닝 후 BLEU를 +12 향상시켰다.

  • PDF