• Title/Summary/Keyword: 대상 추출

Search Result 5,731, Processing Time 0.038 seconds

An Automatic Expansion of Sentiment Lexicon by Using Corpus (코퍼스를 이용한 감성 사전 자동 확장)

  • Lee, Kong Joo;Seo, Hyung-Won;Kim, Jae-Hoon
    • Annual Conference on Human and Language Technology
    • /
    • 2010.10a
    • /
    • pp.158-161
    • /
    • 2010
  • 본 연구에서는 기본 감성 사전과 대량의 코퍼스를 이용하여 대상 코퍼스에서 사용하는 확장된 감성 표현을 자동으로 추출하는 방법을 제안한다. 대상 코퍼스로는 방송사들이 운영하는 시청자 게시판의 게시글을 대상으로 하였다. 이와 같은 방법으로 대상 코퍼스에서 사용하는 구체적인 감성 패턴들을 추출할 수 있었다.

  • PDF

The content-based ultrasound image retrieval by wavelet transform and spatial histogram (웨이브릿 변환과 공간 히스토그램을 이용한 초음파 영상 내용기반 검색)

  • 김범수;곽동민;원종운;김남철;박길흠
    • The Journal of Korean Institute of Communications and Information Sciences
    • /
    • v.25 no.12B
    • /
    • pp.2085-2093
    • /
    • 2000
  • 본 논문에서는 초음파 영상의 대한 내용기반 검색을 위한 초음파 영상의 특징 추출방법과 추출된 특징들을 이용한 검색 방법에 대해 제안한다. 내용기반 초음파 영상 검색을 위한 특징들로 공간영역에서 히스토그램과 웨이브릿 변환후 각 부대역에서 통계적 특성을 추출한다. 웨이브릿 변환 영역에서 추출된 특성은 질의 영상과 유사한 영상의 특성 벡터 거리가 평균 특성 벡터 거리보다 작다는 특성을 가진다. 이러한 특성을 이용하여 일차 검색을 수행하여 그 결과를 공간영역의 히스토그램을 이용한 이차 검색을 위한 후보로 사용함으로써 이차 검색의 대상이 줄어들게 된다. 히스토그램을 이용한 검색은 대상이 많을수록 오류를 범할 가능성이 높아짐으로 검색대상을 줄인다는 것은 매우 중요한 일이다. 또한 히스토그램을 사용함으로써 영상내 의학적 객체의 이동이나 회전에 무관하게 검색을 수행할 수 있다.

  • PDF

Knowledge Representation of Concept Word Using Cognitive Information in Dictionary (사전에 나타난 인지정보를 이용한 단어 개념의 지식표현)

  • Yun, Duck-Han;Ock, Cheol-Young
    • Annual Conference on Human and Language Technology
    • /
    • 2004.10d
    • /
    • pp.118-125
    • /
    • 2004
  • 인간의 언어지식은 다양한 개념 관계를 가지며 서로 망(network)의 모습으로 연결되어 있다. 인간의 언어지식의 산물 중에서 가장 체계적이며 구조적으로 언어의 모습을 드러내고 있는 결과물이 사전이라고 할 수 있다. 본 논문에서는 이러한 사전 뜻풀이 말에서 개념 어휘와 자동적인 지식획득을 통하여 의미 정보를 구조적으로 추출한다. 이러한 의미 정보가 추출되면서 동시에 자동적으로 개념 어휘의 의미 참조 모형이 구축된다. 이러한 것은 사전이 표제어 리스트와 표제어를 기술하는 뜻풀이말로 이루어진 구조의 특성상 가능하다. 먼저 172,000여 개의 사전 뜻풀이말을 대상으로 품사 태그와 의미 태그가 부여된 코퍼스에서 의미 정보를 추출하는데, 의미분별이 처리 된 결과물을 대상으로 하기 때문에 의미 중의성은 고려하지 않아도 된다. 추출된 의미 정보를 대상으로 정제 작업을 거쳐 정보이론의 상호 정보량(Ml)을 이용하여 개념 어휘와 의미 정보간에 연관도를 측정한 후, 개념 어휘간의 유사도(SMC)를 구하여 지식표현의 하나로 연관망을 구축한다.

  • PDF

A Syntax-Based Hybrid System for Korean Open Information Extraction (구문 분석 결과를 이용한 한국어 무제한 정보추출)

  • Kim, Byungsoo;Yu, Hwanjo;Lee, Gary Geunbae
    • Annual Conference on Human and Language Technology
    • /
    • 2015.10a
    • /
    • pp.41-45
    • /
    • 2015
  • 무제한 정보추출은 주로 영어를 대상으로 연구가 진행 되었지만, 최근에는 영어가 아닌 다른 언어에 대한 적용이 시도되고 있다. 본 논문에서는 관계 어휘의 유형을 동사형과 명사형 2가지로 정의하고, 각 유형별로 구문 분석 결과 기반의 서로 다른 방법론을 적용하는 한국어 대상 무제한 정보추출 시스템을 소개한다. 동사형 관계 어휘에 대해서는 의존 관계 기반의 추출 규칙을 적용하고, 명사형 관계 어휘에 대해서는 대량의 말뭉치로부터 자동으로 학습한 의존 관계 구조 기반의 추출 패턴을 적용한다. 임의의 100개 문장에 대해서 수행한 결과는 산출된 전체 트리플에 대해 0.8이상의 정밀도를 보임으로써 본 논문에서 제안하는 방법의 효용성을 증명하였다.

  • PDF

Learning-based Automatic Keyphrase Indexing from Korean Scientific LIS Articles (자동색인을 위한 학습기반 주요 단어(핵심어) 추출에 관한 연구)

  • Kim, Hea-Jin;Jeoung, Yoo-Kyung
    • Proceedings of the Korean Society for Information Management Conference
    • /
    • 2017.08a
    • /
    • pp.15-18
    • /
    • 2017
  • 학술 데이터베이스를 통해 방대한 양의 텍스트 데이터에 대한 접근이 가능해지면서, 많은 데이터로부터 중요한 정보를 자동으로 추출하는 것에 대한 필요성 또한 증가하였다. 특히, 텍스트 데이터로부터 중요한 단어나 단어구를 선별하여 자동으로 추출하는 기법은 자료의 효과적인 관리와 정보검색 등 다양한 응용분야에 적용될 수 있는 핵심적인 기술임에도, 한글 텍스트를 대상으로 한 연구는 많이 이루어지지 않고 있다. 기존의 한글 텍스트를 대상으로 한 핵심어 또는 핵심어구 추출 연구들은 단어의 빈도나 동시출현 빈도, 이를 변형한 단어 가중치 등에 근거하여 핵심어(구)를 식별하는 수준에 그쳐있다. 이에 본 연구는 한글 학술논문의 초록으로부터 추출한 다양한 자질 요소들을 학습하여 핵심어(구)를 추출하는 모델을 제안하였고 그 성능을 평가하였다.

  • PDF

Information Extraction form newspaper article by recognizing 5W1H elements (신문기사에서 육하원칙 중심의 정보 추출)

  • 이현주;김계성;구상옥;이상조
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2001.04b
    • /
    • pp.361-363
    • /
    • 2001
  • 본 논문은 신문 기사문에 특정적인 정보 추출의 내용과 방법을 제안한다. 신문 기사에서 이용자가 원하는 정보 추출의 내용으로 육하원칙을 중심으로 한 다섯 가지 정보를 제시하였으며, 이를 추출하기 위해 통계적인 기법을 주로 이용하고 부분적으로 언어적 지식을 이용하였다. 본 논문에서는 비교적 문서의 길이가 짧은 신문기사문을 요약 대상으로 하므로 단락이나 문장이 아닐 절 이하 단위로 추출하며, 중심절을 추출한 뒤 그 절과의 관계를 통해 나머지 정보들을 추출함으로써 추출되는 내용이 유사하거나 산만하지 않기 때문에 이 추출 정보로 요약문을 생성할 경우에 긴밀한 요약문을 생성할 수 있다.

  • PDF

Extraction of Spatial Information of Facility Using Multiple Photographic Analysis (다중사진 해석에 의한 시설물 공간정보 추출)

  • 손덕재;이승환
    • Proceedings of the Korean Association of Geographic Inforamtion Studies Conference
    • /
    • 2003.04a
    • /
    • pp.400-405
    • /
    • 2003
  • 본 연구에서는 기존 지형도나 준공도면 자료에서 상세정보가 누락되거나 갱신이 이루어지지 않아 시설물관리체계에 필요한 수치지도의 체계적인 구축이 요구되는 지역에 적용할 수 있도록 지상사진, 항공사진 등 영상자료에 다양한 사진해석 기법을 적용하여 수치지도를 생성하고 공간 및 속성정보를 추출하였다. 본 연구에서는 다중사진 촬영에 의하여 대상물의 3차원 모델과 3차원 사진영상모델을 생성하였다. 또한, 소축척 항공사진을 이용하여 대상지역의 벡터라이징을 실행한 결과, 각 건물과 도로시설물의 위치와 형태 등 공간정보의 추출이 가능하였다.

  • PDF

A Hybrid Approach for Automated Building Area Extraction from High-Resolution Satellite Imagery (고해상도 위성영상을 활용한 자동화된 건물 영역 추출 하이브리드 접근법)

  • An, Hyowon;Kim, Changjae;Lee, Hyosung;Kwon, Wonsuk
    • Journal of the Korean Society of Surveying, Geodesy, Photogrammetry and Cartography
    • /
    • v.37 no.6
    • /
    • pp.545-554
    • /
    • 2019
  • This research aims to provide a building area extraction approach over the areas where data acquisition is impossible through field surveying, aerial photography and lidar scanning. Hence, high-resolution satellite images, which have high accessibility over the earth, are utilized for the automated building extraction in this study. 3D point clouds or DSM (Digital Surface Models), derived from the stereo image matching process, provides low quality of building area extraction due to their high level of noises and holes. In this regards, this research proposes a hybrid building area extraction approach which utilizes 3D point clouds (from image matching), and color and linear information (from imagery). First of all, ground and non-ground points are separated from 3D point clouds; then, the initial building hypothesis is extracted from the non-ground points. Secondly, color based building hypothesis is produced by considering the overlapping between the initial building hypothesis and the color segmentation result. Afterwards, line detection and space partitioning results are utilized to acquire the final building areas. The proposed approach shows 98.44% of correctness, 95.05% of completeness, and 1.05m of positional accuracy. Moreover, we see the possibility that the irregular shapes of building areas can be extracted through the proposed approach.

Comparative Analysis of Extracted Snow Cover Area Using Terra MODIS and NOAA AVHRR Imageries for ChungJu Dam Watershed (Terra MODIS 및 NOAA AVHRR 위성영상을 이용한 충주댐 유역의 적설분포 추출 결과 비교분석)

  • Hong, Woo-Yong;Shin, Hyung-Jin;Ha, Rim;Kim, Seong-Joon
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2008.05a
    • /
    • pp.1092-1096
    • /
    • 2008
  • 최근 국내에서 저해상도 위성영상을 이용한 적설 분포의 추출연구가 융설과 관련된 수문학적 연구에 이용되기 시작하였다. 한반도와 같이 넓은 지역을 대상으로 추출하는 과정에서 대기에 의한 방해가 너무 큰 영상은 구름 아래 지표면의 정보를 얻을 방법이 없어 해당 날짜의 영상을 제외 할 수밖에 없는 문제가 생긴다. 본 연구에서는 센서의 특성과 영상의 촬영 시간, 그리고 촬영 각도가 달라 서로 다른 대기의 영향을 받는 Terra MODIS 위성영상과 NOAA AVHRR 위성영상을 이용하여 각각의 적설 분포를 추출하는 방법을 비교 연구함으로써 영상을 분석하는데 있어 구름의 영향을 최소화 하고자 하였다. 2004년부터 2006년까지 겨울철의 적설이 발생한 기간을 대상으로 총 3개년의 영상을 분석한 결과를 바탕으로 두 영상으로부터 추출된 적설분포의 차이를 우리나라의 충주댐 유역을 중심으로 비교하였다. 밴드별 파장대의 반사 특성을 이용한 MODIS snow cover와 임계값을 선정하여 구하는 NOAA AVHRR는 서로 다른 적설분포를 보였다고 판단되며, 이는 해상도와 영상 합성, snow cover 추출 알고리즘의 차이 및 대기 현상의 영향 등으로 인하여 추출면적 값이 차이를 보이는 것이라 생각된다. 두 영상에 의한 추출면적의 비교분석 결과, 적설분포의 추출에 있어서 두 영상을 서로 절충하여 사용할 수 있다고 판단된다.

  • PDF

Extracting Multi-type Elements Consisting of Multi-words from Sentences (문장으로부터 여러 단어로 구성된 여러 유형의 요소 추출)

  • Yang, Seon;Ko, Youngjoong
    • Annual Conference on Human and Language Technology
    • /
    • 2014.10a
    • /
    • pp.73-77
    • /
    • 2014
  • 문장을 대상으로 특정 응용 분야에 필요한 요소를 자동으로 추출하는 정보 추출(information extraction) 과제는 자연어 처리 및 텍스트 마이닝의 중요한 과제 중 하나이다. 특히 추출해야할 요소가 한 단어가 아닌 여러 단어로 구성된 경우 추출 과정에서 고려되어야할 부분이 크게 증가한다. 또한 추출 대상이 되는 요소의 유형 또한 여러 가지인데, 감정 분석 분야를 예로 들면 화자, 객체, 속성 등 여러 유형의 요소에 대한 분석이 필요하며, 비교 마이닝 분야를 예로 들면 비교 주체, 비교 상대, 비교 술어 등의 요소에 대한 분석이 필요하다. 본 논문에서는 각각 여러 단어로 구성될 수 있는 여러 유형의 요소를 동시에 추출하는 방법을 제안한다. 제안 방법은 구현이 매우 간단하다는 장점을 가지는데, 필요한 과정은 형태소 부착과 변환 기반 학습(transformation-based learning) 두 가지이며, 파싱 혹은 청킹 같은 별도의 전처리 과정도 거치지 않는다. 평가를 위해 제안 방법을 적용하여 비교 마이닝을 수행하였는데, 비교 문장으로부터 각자 여러 단어로 구성될 수 있는 세 가지 유형의 비교 요소를 자동 추출하였으며, 실험 결과 정확도 84.33%의 우수한 성능을 산출하였다.

  • PDF