• 제목/요약/키워드: 정보단서

검색결과 314건 처리시간 0.024초

기계학습 기반 경쟁자 자동추출 방법 (Competitor Extraction based on Machine Learning Methods)

  • 이충희;김현진;류법모;김현기;서영훈
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2012년도 제24회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.107-112
    • /
    • 2012
  • 본 논문은 일반 텍스트에 나타나는 경쟁 관계에 있는 고유명사들을 경쟁자로 자동 추출하는 방법에 대한 것으로, 규칙 기반 방법과 기계 학습 기반 방법을 모두 제안하고 비교하였다. 제안한 시스템은 뉴스 기사를 대상으로 하였고, 문장에 경쟁관계를 나타내는 명확한 정보가 있는 경우에만 추출하는 것을 목표로 하였다. 규칙기반 경쟁어 추출 시스템은 2개의 고유명사가 경쟁관계임을 나타내는 단서단어에 기반해서 경쟁어를 추출하는 시스템이며, 경쟁표현 단서단어는 620개가 수집되어 사용됐다. 기계학습 기반 경쟁어 추출시스템은 경쟁어 추출을 경쟁어 후보에 대한 경쟁여부의 바이너리 분류 문제로 접근하였다. 분류 알고리즘은 Support Vector Machines을 사용하였고, 경쟁어 주변 문맥 정보를 대표할 수 있는 언어 독립적 5개 자질에 기반해서 모델을 학습하였다. 성능평가를 위해서 이슈화되고 있는 핫키워드 54개에 대해서 623개의 경쟁어를 뉴스 기사로부터 수집해서 평가셋을 구축하였다. 비교 평가를 위해서 기준시스템으로 연관어에 기반해서 경쟁어를 추출하는 시스템을 구현하였고, Recall/Precision/F1 성능으로 0.119/0.214/0.153을 얻었다. 제안 시스템의 실험 결과로 규칙기반 시스템은 0.793/0.207/0.328 성능을 보였고, 기계 학습기반 시스템은 0.578/0.730/0.645 성능을 보였다. Recall 성능은 규칙기반 시스템이 0.793으로 가장 좋았고, 기준시스템에 비해서 67.4%의 성능 향상이 있었다. Precision과 F1 성능은 기계학습기반 시스템이 0.730과 0.645로 가장 좋았고, 기준시스템에 비해서 각각 61.6%, 49.2%의 성능향상이 있었다. 기준시스템에 비해서 제안한 시스템이 Recall, Precision, F1 성능이 모두 대폭적으로 향상되었으므로 제안한 방법이 효과적임을 알 수 있다.

  • PDF

객체 특징점 모델링을 이용한 시멘틱 단서 기반 영상 분류 (Semantic Cue based Image Classification using Object Salient Point Modeling)

  • 박상혁;변혜란
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제16권1호
    • /
    • pp.85-89
    • /
    • 2010
  • 대부분의 영상들은 여러 객체 영역들의 시각적인 특징과 각각의 의미들의 조합으로 구성되어 있다. 그러나 일반적으로 영상 처리를 위한 컴퓨터 시스템들은 영상을 특정 객체 영역의 의미 정보 단위로 해석하지 못하기 때문에 사람이 영상을 인지하는 것과 의미적인 차이(semantic gap)가 발생한다. 본 논문에서는 이러한 문제점을 극복하기 위하여 각 객체 영역 단위에서 추출한 고유한 특징점들을 고차원의 의미 정보로 모델링하여 영상을 분류하는 방법을 제안한다. 제안하는 방법은 객체 단위로 추출된 고유한 특징점들의 의미 정보를 특정 객체 영역을 인식하기 위한 의미 단서로 이용한다. 이를 통하여 기존의 영상 분류 방법들에 비하여 인간의 인지 능력과 유사하고 보다 효율적으로 영상을 분류할 수 있는 장점이 있다. 실험 결과는 다양한 카테고리 종류의 영상에 대하여 제안하는 방법의 효과적인 분류 성능을 보여준다.

술어기반 문형정보를 이용한 자동요약시스템에 관한 연구 (A Study on an Automatic Summarization System Using Verb-Based Sentence Patterns)

  • 최인숙;정영미
    • 정보관리학회지
    • /
    • 제18권4호
    • /
    • pp.37-55
    • /
    • 2001
  • 본 연구에서는 특정 주제분야의 텍스트를 대표할 수 있는 단어술어를 추출하고 기본문형을 형성 한 후 각 단서술어의 기본문형을 실례화하여 연결함으로써 요약문을 작성하는 자동요약시스템의 모형을 설계하고 구현하였다. 시스템은 학습과정과 요약과정을 구분되며, 학습과정에서는 술어와 격조사를 출현빈도를 이용하여 주제분야 텍스트집단을 대표하는 단어술어와 필수격 조사를 추출한 뒤 단어술어가 이루는 문장의 기본문형을 형성한다. 요약과정에서 실례화 규직을 요약 대상 문장의 구문 분석 결과에 적용하여 기본문형의 격조사와 결합될 논항을 찾아 단문을 생성하고 연결하여 요약문을 완성한다. ‘화재’및‘강도’와 관련된 신문기사를 대상으로 실험을 수행하였으며, 작성된 요약문은 단어술어가 포함된 주요 문장에서 추출한 필수 정보항목과 술어를 중심으로 생성된 문장들로서 문장간의 연결이 자연스러울 뿐 아니라 텍스트의 전체적인 의미를 표현할 수 있었다. 또한, 통계적 기법을 이용한 학습을 통해 주제영역의 확장이 가능하였다.

  • PDF

자동차 융합 정보통신 장치들의 보안 기술 현황 및 발전 방향

  • 윤겸주;박대혁
    • 정보보호학회지
    • /
    • 제24권2호
    • /
    • pp.21-27
    • /
    • 2014
  • 사용자의 편리함과 유익함 뒤에는 높은 위험성이 공존한다. 특히 자동차의 경우에는 빠른 속도로 장소를 이동할 수 있다는 장점이 있지만, 사고 발생 시에 생명을 위협할 만큼의 위험을 가지고 있다. 자동차 사고 발생 후에는 시시비비를 가리기 위해서 많은 분쟁이 발생하는 것이 일반적인 판례였다. 자동차용 블랙박스는 자동차 사고 발생 시에 정확한 현장의 영상, 음성 및 기타 센서 정보를 기록한다. 이를 이용해서 전후좌우, 차량의 상태를 분석하여 사건 발생의 실마리를 찾을 수 있는 중요한 단서로 사용된다. 하지만, 아직은 블랙박스 영상만으로는 법적인 자료로 사용될 수는 없다. 즉, 법적인 자료로 채택되기 위한 기밀성과 무결성 측면에서 약점을 가지고 있다. 이에 따라서 기록된 정보를 암호화하고, 접근 자에 대한 기록을 남기는 기능이 연구 및 표준화 제정되고 있다. 차량 내외에서 수집된 정보에 암호화를 적용하여 이종 기기간 데이터 공유를 차단하고, 자동차 정보기기 보안 인증서를 가지고 있는 단체를 통하여 보안키를 이용하여 정보를 활용하기 위한 시스템이 구성되고 있다. 이를 통하여 자동차 융합 정보통신 장치들로부터 기록된 정보를 법적인 객관적 근거로 활용할 수 있도록 자동차용 정보통신 기기들이 기밀성과 무결성을 준수할 수 있도록 발전할 것이다.

무제한 정보 추출을 이용한 지식베이스 확장 (Incremental Ontology Building Using Open Information Extraction)

  • 김병수;이근배
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2014년도 제26회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.228-232
    • /
    • 2014
  • 지식 베이스(Knowledge Base)는 주어진 질의 문에 대한 잠재적인 답과 답에 대한 단서가 될 수 있는 구조화된 형태의 정보를 포함하고 있기 때문에 질의응답 시스템에서 매우 중요하다. 하지만 비록 DBpedia, Freebase, YAGO 등과 같이 이용 가능한 여러 개의 지식 베이스가 존재함에도 불구하고 이러한 지식 베이스에 포함되어 있는 정보는 웹(Web)상에 존재하는 정보에 비하면 매우 제한적이다. 본 논문에서는 무제한 정보 추출 기술을 이용하여 정형화되지 않은 텍스트로부터 트리플(Triple)을 추출하고, 추출된 트리플의 각 개체 및 관계 어휘를 대상 온톨로지(Ontology) 상의 어휘에 사상시킴으로써 지식 베이스를 확장 시키는 방법을 제안한다. 이를 통하여 무제한 정보 추출 방법과 명확화(Disambiguation) 기술이 지식 베이스를 확장시키는데 어떻게 사용될 수 있고, 어떠한 요소가 전체 시스템의 주된 성능 저하를 일으키며 개선되어야 하는지 알아보도록 한다.

  • PDF

질의응답 시스템을 위한 술어정보 기반 질의분석 (Predicate-based Question Analysis for Korean Question-Answering System)

  • 김원남;신승은;서영훈
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2004년도 제16회 한글.언어.인지 한술대회
    • /
    • pp.296-300
    • /
    • 2004
  • 질의 응답 시스템이 정확한 정답을 제시하기 위해서는 사용자가 요구하는 정답의 유형을 결정할 필요가 있다. 질의분석의 일반적인 접근법으로는 의문사 정보, 규칙 그리고 통계 정보에 기반한 방법들이 있다. 본 논문에서는 술어정보를 이용한 질의분석을 제안한다. 먼저 의문사 정보를 이용하여 상위정답유형을 결정하고 질의문의 술어 정보와 구문 구조 정보를 이용하여 초점단어(focus word)를 추출한다. 초점단어란 정답유형을 결정하는데 단서가 되는 단어로써, 추출된 초점단어에 의해 75개의 하위정답유형 중 하나가 결정된다. 실험에 앞서 정답 유형별로 6개의 상위범주와 75개의 하위범주를 정의하였으며, 실험에는 학습 데이터의 일부와 일반 Web에서 수집한 테스트 데이터가 사용되었다. 실험결과 상위범주는 97.6%, 하위범주는 77.8%의 정확도를 보였으며 초점단어는 92.5%의 정확도를 보였다.

  • PDF

인과관계 정보 구성 체계를 활용한 디지털 증거 식별/분류 연구 (Digital Evidence Identification/Classification Study Using Causal Information Organization System)

  • 정종진;박종빈;김경원;이지현
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2023년도 추계학술발표대회
    • /
    • pp.236-239
    • /
    • 2023
  • 본 논문에서는 디지털증거 분석을 위해 확보한 증거파일 들로부터 범죄 정황에 해당하는 단어 및 어휘를 추출하여 해당 범죄를 인과관계 분석을 하기 위해 핵심 단서와 원인을 효과적으로 파악하기 위해 필요한 인과정보를 제안한다. 이 정보들은 개체명 인식 및 분류를 할 수 있도록 구성되어 범죄 관계인, 관계인간 관계, 범죄 수법과 범죄관련 정보를 추출하고 유형화하여, 향후 해당 범죄에 대한 인과 분석 기법을 활용한 범죄 예방 분석과 수사에 기여할 수 있도록 도움을 준다.

멀티미디어 환경에서의 어포던스에 관한 연구 -모바일 게임을 중심으로- (Affordance in Multimedia environment with emphasis on Mobile Games)

  • 김희종;류시천
    • 스마트미디어저널
    • /
    • 제1권1호
    • /
    • pp.72-79
    • /
    • 2012
  • 본 논문은 멀티미디어 환경에서 사용편의성 증진 방안을 모색하고자 진행되었다. 인터넷 보급 확산과 정보통신기술의 발달로 인하여 우리는 다양하고 방대한 멀티미디어 컨텐츠를 쉽게 접할 수 있게 되었으나 상대적으로 사용자 입장에서의 사용편의성 문제는 여전히 해결하기 어려운 과제로 남아있다. 이에 관한 가장 큰 이유 중의 하나는 인터페이스가 사용자에게 직관적으로 사용 방법을 알려주지 못하기 때문이다. 이에 본 논문에서는 최근 제품디자인 분야에서 언급되는 '어포던스'의 개념을 멀티미디어 분야에 새롭게 적용하는 방안을 모색하였고 이를 토대로 '과업 수행의 단서' 라는 개념에서 어포던스 활용에 관한 문제에 접근하였다. 사용자 심층 인터뷰를 통한 가설의 검증, 과업의 위계와 종류에 따른 어포던스 탐색, 사용자의 숙련도 및 성별별 집중 과업, 모바일게임 장르별 집중 과업 등이 논의되었다. 본 연구를 통하여 '과업 수행의 단서'로서의 어포던스 개념을 멀티미디어 환경에 적용하여 사용편의성 증진을 모색할 수 있음을 알게 되었다.

  • PDF

저비트율 멀티채널 오디오 부호화 (Low-bitrate Multichannel Audio Coding)

  • 장인선;서정일;백승권;강경옥
    • 방송공학회논문지
    • /
    • 제10권3호
    • /
    • pp.328-338
    • /
    • 2005
  • 멀티채널 오디오 컨텐츠에 대한 사용자의 욕구가 증가하고 있는 가운데 서비스를 위한 저비트율 멀티채널 오디오 부호화 기술에 대한 표준화가 진행되고 있다. 본 논문에서는 협대역폭 채널환경에 적합한 고압축율의 멀티채널 오디오 부호화 기술인 음원위치단서 부호화 기술(Sound Source Location Cue Coding; SSLCC)을 제안하고, SSLCC가 기존 BCC (Binaural Cue Coding)의 압축 성능을 향상시키기 위하여 단서로 이용한 VSLI (Virtual Source Location Information)를 설명한다. 또한 객관적 평가로 기존의 BCC 시스템과의 평균 비트율을 비교하고, MUSHRA (Multi-Stimulus test with Hidden Reference and Anchor) 방법을 이용한 주관 청취 평가를 수행하여 제안된 SSLCC 부호화 기법의 우수성을 확인하였다.

iOS5 신규 애플리케이션의 스키마 분석을 통한 포렌식 정보 획득 연구 (A Study on Forensic Information Aquisition with Schema Analysis for Newly Added Applications in iOS5)

  • 이규원;양승제;장태주;윤영태;손기욱
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2012년도 춘계학술발표대회
    • /
    • pp.62-65
    • /
    • 2012
  • iOS5 소프트웨어가 업데이트되면서 기존과 비교하여 많은 새로운 기능들이 추가되었다. 이 기능들 중에는 사용자로 하여금 메시지와 계정 정보 등 포렌식 관점에서 중요한 정보들이 저장될 수 있는 애플리케이션들이 존재한다. 포렌식 수사에서 애플리케이션에 저장된 정보들은 사건 해결을 위한 중요한 단서가 되기도 한다. 따라서 본 논문에서는 iOS5에 새롭게 추가된 기능들 중에서 포렌식 정보들이 저장될 수 있는 애플리케이션들을 선별하고 스키마 분석 및 질의를 통하여 그 정보들을 획득 할 수 있음을 증명한다.