• Title/Summary/Keyword: 반자동 구축

Search Result 108, Processing Time 0.022 seconds

A Korean Product Review Analysis System Using a Semi-Automatically Constructed Semantic Dictionary (반자동으로 구축된 의미 사전을 이용한 한국어 상품평 분석 시스템)

  • Myung, Jaeseok;Lee, Dongjoo;Lee, Sang-Goo
    • Annual Conference on Human and Language Technology
    • /
    • 2007.10a
    • /
    • pp.68-75
    • /
    • 2007
  • 웹 2.0 시대에 사용자가 작성한 리뷰는 다양한 활용성을 갖는 가치있는 데이터이다. 특히 온라인 쇼핑몰에서의 상품평은 사용자의 구매 결정에 직접적인 영향을 미치는 중요한 정보이다. 본 논문에서는 실제 쇼핑몰 사이트에 있는 상품평을 분석하여 각 상품의 특징과 이에 대한 사용자의 의견을 요약하는 상품평 분석 시스템을 설계하고 구현하였다. 각 상품평을 분석하는 과정에서는 자연언어처리 기법과 의미 사전을 사용한다. 의미 사전에는 상품의 특징을 표현하는 어휘와 각 어휘들의 극성(Polarity) 정보들을 반자동으로 정의할 수 있도록 구현하였다. 이에 더하여 문맥에 따라 다른 의미를 갖는 어휘에 대한 처리 방법에 대해서도 논의한다. 실험은 2개 상품 분류의 63개 실제 리뷰를 대상으로 수행하였으며 결과로 평균 88.94%의 정확률, 47.92%의 재현율을 나타냈다.

  • PDF

Improving Quality of Training Corpus for Named Entity Recognition Using Heuristic Rules (휴리스틱을 이용한 개체명 인식 학습 말뭉치 품질 향상)

  • Lee, Seong-Hee;Song, Yeong-Kil;Kim, Hark-Soo
    • Annual Conference on Human and Language Technology
    • /
    • 2015.10a
    • /
    • pp.202-205
    • /
    • 2015
  • 개체명 인식은 문서에서 개체명을 추출하고 추출된 개체명의 범주를 결정하는 작업이다. 기존의 지도 학습 기법을 이용한 개체명 인식을 위해서는 개체명 범주가 수동으로 부착된 대용량의 학습 말뭉치가 필요하며, 대용량의 말뭉치 구축은 인력과 시간이 많이 들어가는 일이다. 본 논문에서는 학습 말뭉치 구축비용을 최소화하고 초기 학습 말뭉치의 노이즈를 제거하여 말뭉치의 품질을 향상시키는 방법을 제안한다. 제안 방법은 반자동 개체명 사전 구축 방법으로 구축한 개체명 사전과 원거리 감독법을 사용하여 초기 개체명 범주 부착 말뭉치를 구축한다. 그리고 휴리스틱을 이용하여 초기 말뭉치의 노이즈를 제거하여 학습 말뭉치의 품질을 향상시키고 개체명 인식의 성능을 향상시킨다. 실험 결과 휴리스틱 적용을 통해 개체명 인식의 F1-점수를 67.36%에서 73.17%로 향상시켰다.

  • PDF

Construction of 3D Digital Maps Using 3D Symbols (3차원 심볼을 활용한 3차원 수치지도 제작에 관한 연구)

  • Park, Seung-Yong;Lee, Jae-Bin;Yu, Ki-Yun;Kim, Yong-Il
    • Journal of the Korean Society of Surveying, Geodesy, Photogrammetry and Cartography
    • /
    • v.24 no.5
    • /
    • pp.417-424
    • /
    • 2006
  • Despite of many researches related to create 3D digital maps, it is still time-consuming and costly because a large part of 3D digital mapping is conducted manually. To circumvent this limitation, we proposed methodologies to create 3D digital maps with 3D symbols automatically. For this purpose, firstly, the 3D symbol library to represent 3D objects as 3D symbols was constructed. In this library, we stored the attribute and geometry information of 3D objects which define types and shapes of symbols respectively. These information were used to match 3D objects with 3D symbols and extracted from 2D digital maps and LiDAR(Light Detection and Ranging) data. Then, to locate 3D symbols into a base map automatically, we used predefined parameters such as the size, the height, the rotation angle and the center of gravity of 3D objects which are extracted from LiDAR data. Finally, the 3D digital map in urban area was constructed and the results were tested. Through this research, we can identify that the developed algorithms can be used as effective techniques for 3D digital mapping.

Semi-Automatic Method for Constructing 2D and 3D Indoor GIS Maps based on Point Clouds from Terrestrial LiDAR (지상 라이다의 점군 데이터를 이용한 2차원 및 3차원 실내 GIS 도면 반자동 구축 기법 개발)

  • Hong, Sung Chul;Jung, Jae Hoon;Kim, Sang Min;Hong, Seung Hwan;Heo, Joon
    • Journal of Korean Society for Geospatial Information Science
    • /
    • v.21 no.2
    • /
    • pp.99-105
    • /
    • 2013
  • In rapidly developing urban areas that include high-rise, large, and complex buildings, indoor and outdoor maps in GIS become a basis for utilizing and sharing information pertaining to various aspects of the real world. Although an indoor mapping has gained much attentions, research efforts are mostly in 2D and 3D modeling of terrain and buildings. Therefore, to facilitate fast and accurate construction of indoor GIS, this paper proposes a semi-automatic method consisting of preprocessing, 2D mapping, and 3D mapping stages. The preprocessing is designed to estimate heights of building interiors and to identify noise data from point clouds. In the 2D mapping, a floor map is extracted with a tracing grid and a refinement method. In the 3D mapping, a 3D wireframe model is created with heights from the preprocessing stage. 3D mesh data converted from noise data is combined with the 3D wireframe model for detail modeling. The proposed method was applied to point clouds depicting a hallway in a building. Experiment results indicate that the proposed method can be utilized to construct 2D and 3D maps for indoor GIS.

Domain-specific Ontology Construction by Terminology Processing (전문용어의 처리에 의한 도메인 온톨로지의 구축)

  • 임수연;송무희;이상조
    • Journal of KIISE:Software and Applications
    • /
    • v.31 no.3
    • /
    • pp.353-360
    • /
    • 2004
  • Ontology defines the terms used in a specific domain and the relationships between them and represents them as hierarchical taxonomy. The present paper proposes a semi-automatic domain-specific ontology construction method based on terminology Processing. For this purpose, it presents an algorithm to extract terminology according to the noun/suffix pattern of terminology in domain texts and find their hierarchical structure. The experiment was carried out using pharmacy-related documents. As singleton terminology with noun/suffix were identified, the average accuracy was 92.57%. In case of multi-word terminology, the average accuracy was 66.64%. The constructed ontology forms natural semantic clusters with based on suffices and semantic information, so can be utilized in approaches to specific knowledge such as information look-up or as the base of inference to improve searching abilities.

Construction of Evaluation-Annotated Datasets for EA-based Clothing Recommendation Chatbots (패션앱 후기글 평가분석에 기반한 의류 검색추천 챗봇 개발을 위한 학습데이터 EVAD 구축)

  • Choi, Su-Won;Hwang, Chang-Hoe;Yoo, Gwang-Hoon;Nam, Jee-Sun
    • Annual Conference on Human and Language Technology
    • /
    • 2021.10a
    • /
    • pp.467-472
    • /
    • 2021
  • 본 연구는 패션앱 후기글에 나타나는 구매자의 의견에 대한 '평가분석(Evaluation Analysis: EA)'을 수행하여, 이를 기반으로 상품의 검색 및 추천을 수행하는 의류 검색추천 챗봇을 개발하는 LICO 프로젝트의 언어데이터 구축의 일환으로 수행되었다. '평가분석 트리플(EAT)'과 '평가기반요청 쿼드러플(EARQ)'의 구성요소들에 대한 주석작업은, 도메인 특화된 단일형 핵심어휘와 다단어(MWE) 핵심패턴들을 FST 방식으로 구조화하는 DECO-LGG 언어자원에 기반하여 반자동 언어데이터 증강(SSP) 방식을 통해 진행되었다. 이 과정을 통해 20여만 건의 후기글 문서(230만 어절)로 구성된 EVAD 평가주석데이터셋이 생성되었다. 여성의류 도메인의 평가분석을 위한 '평가속성(ASPECT)' 성분으로 14가지 유형이 분류되었고, 각 '평가속성'에 연동된 '평가내용(VALUE)' 쌍으로 전체 35가지의 {ASPECT-VALUE} 카테고리가 분류되었다. 본 연구에서 구축된 EVAD 평가주석 데이터의 성능을 평가한 결과, F1-Score 0.91의 성능 평가를 획득하였으며, 이를 통해 향후 다른 도메인으로의 확장된 적용 가능성이 유효함을 확인하였다.

  • PDF

Information Extraction Based on Property Patterns to Construct a Knowledgebase for Encyclopedia Person Domain (인물 백과사전 지식베이스 구축을 위한 속성패턴기반 정보추출)

  • 왕지현;김현진;장명길
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2004.10a
    • /
    • pp.793-795
    • /
    • 2004
  • 본 논문은 인물 도메인의 백과사전 지식베이스를 구축하기 위하여 백과사전 본문의 자연어 문장으로부터 인물 표제어의 특징을 잘 나타내는 속성 값을 인식하여 추출하는 방법에 관하여 기술한다. 속성은 인물 공통 및 세부 분야별로 총 52개의 속성을 정의하였고 이를 태그셋으로 정의하여 1천 문서의 백과사전 인물 속성태깅코퍼스를 구축하였다. 속성태깅코퍼스로부터 반자동으로 약 1천 8백여 개의 속성패턴을 추출하였고 백과사전 인물 표제어 24,848개에 대해 속성패턴을 적용하여 지식베이스를 구축하였다. 추출성능은 f-score 0.68의 결과를 나타내었다.

  • PDF

A Semi-Automatic Semantic Mark Tagging System for Building Dialogue Corpus (대화 말뭉치 구축을 위한 반자동 의미표지 태깅 시스템)

  • Park, Junhyeok;Lee, Songwook;Lim, Yoonseob;Choi, Jongsuk
    • KIPS Transactions on Software and Data Engineering
    • /
    • v.8 no.5
    • /
    • pp.213-222
    • /
    • 2019
  • Determining the meaning of a keyword in a speech dialogue system is an important technology for the future implementation of an intelligent speech dialogue interface. After extracting keywords to grasp intention from user's utterance, the intention of utterance is determined by using the semantic mark of keyword. One keyword can have several semantic marks, and we regard the task of attaching the correct semantic mark to the user's intentions on these keyword as a problem of word sense disambiguation. In this study, about 23% of all keywords in the corpus is manually tagged to build a semantic mark dictionary, a synonym dictionary, and a context vector dictionary, and then the remaining 77% of all keywords is automatically tagged. The semantic mark of a keyword is determined by calculating the context vector similarity from the context vector dictionary. For an unregistered keyword, the semantic mark of the most similar keyword is attached using a synonym dictionary. We compare the performance of the system with manually constructed training set and semi-automatically expanded training set by selecting 3 high-frequency keywords and 3 low-frequency keywords in the corpus. In experiments, we obtained accuracy of 54.4% with manually constructed training set and 50.0% with semi-automatically expanded training set.

A CONSTRUCTION OF A SEMI-AUTOMATIC TELESCOPE FOR ECLIPSE TIMING OBSERVATIONS OF ECLIPSING BINARY STARS (식쌍성의 극심시각 관측을 위한 소형 반자동 망원경 관측시스템의 구성)

  • 이충욱;박성수;김천휘;변용익
    • Journal of Astronomy and Space Sciences
    • /
    • v.20 no.2
    • /
    • pp.143-152
    • /
    • 2003
  • We constructed the photometric observation system with a small semi-automatic telescope for the systematic observations of eclipse timings of eclipsing binary stars. The system is consisted of a Paramount GT-1100s mount system, a Celestron 14 optical system, and a SBIG ST-8 camera. We developed the OBSTOOL S/W which controls the telescope and the CCD camera using the COM(Component Object Model) supported by the softwares, The Sky and MaximDL. The system performs photometric observations of a variable, comparison and check stars by moving the telescope to the chosen star separately in a similar way such as the method of photoelectric observation. We wrote pert scripts which enable a data handling pipeline for the obtained data to be classified by each of date, object and filter. And thus the images are easily preprocessed using the IRAF S/W package. Eclipse light curves of some eclipsing binary stars observed with this system are presented.

Robust Detection Deep Learning Model in the Various Exterior Wall Cracks (다양한 외벽 균열에 강인한 딥러닝 검출 모델 개발)

  • Kim, Gyeong-Yeong;Lee, Ho-Ryeong;Kim, Dong-Ju
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2021.07a
    • /
    • pp.53-56
    • /
    • 2021
  • 국내 산업화가 들어선 후 산업화 당시 지었던 낙후된 건물의 증가에 따라 구조물의 손상 조사 및 검사 방법의 수요가 늘어나고 있다. 일반적으로 구조물의 손상은 전문 검사원이 현장에서 직접 측량도구와 시각적인 방식으로 검사한다. 그러나 전문 검사원들이 직접 조사하는 수고에 비해 균열을 검사하는 방식 자체가 단순하고, 일반 사람이 검사하기에는 객관성이 떨어지는 한계가 있어 균열을 자동적으로 검출함으로써 객관성과 편의성을 보장할 기술이 필요하다. 본 연구에서는 이미지 기반으로 다양한 환경에서의 외벽 균열을 검출할 수 있는 딥러닝 모델 개발을 소개한다. 균열 검출을 위해 다양한 외벽 균열 관련 데이터셋을 확보 및 구축하고 각 데이터셋의 검출 정보를 보완할 반자동(semi-auto) 라벨링 작업을 수행하였다. 두 번째로 기존 높은 검출 성능을 보였던 모델들을 선정 및 비교하여 YOLO v5 모델을 최종적으로 선정하였고, 도메인이 각각 다른 데이터셋에 대한 교차 학습을 통해 각 데이터셋의 mAP의 편차가 31%에서 11%로 좁히는 작업을 수행하였다. 이를 통해 실제 상황에서의 균열 영상에서 균열을 검출할 수 있는 측량 시스템을 개발함으로써 실질적인 검사의 도구로 활용될 수 있길 기대한다.

  • PDF