• Title/Summary/Keyword: 자동정보 추출

Search Result 1,996, Processing Time 0.029 seconds

Extracting Implicit Customer Viewpoints from Product Review Text (상품 평가 텍스트에 암시된 사용자 관점 추출)

  • Jang, Kyoungrok;Lee, Kangwook;Myaeng, Sung-Hyon
    • Annual Conference on Human and Language Technology
    • /
    • 2013.10a
    • /
    • pp.53-58
    • /
    • 2013
  • 온라인 소비자들은 amazon.com과 같은 온라인 상점 플랫폼에 상품 평가(리뷰: review) 글을 남김으로써 대상 상품에 대한 의견을 표현한다. 이러한 상품 리뷰는 다른 소비자들의 구매 결정에도 큰 영향을 끼친다는 관점에서 볼 때, 매우 중요한 정보원이라고 할 수 있다. 사람들이 남긴 의견 정보(opinion)를 자동으로 추출하거나 분석하고자 하는 연구인 감성 분석(sentiment analysis)분야에서 과거에 진행된 대다수의 연구들은 크게는 문서 단위에서 작게는 상품의 요소(aspect) 단위로 사용자들이 남긴 의견이 긍정적 혹은 부정적 감정을 포함하고 있는지 분석하고자 하였다. 이렇게 소비자들이 남긴 의견이 대상 상품 혹은 상품의 요소를 긍정적 혹은 부정적으로 판단했는지 여부를 판단하는 것이 유용한 경우도 있겠으나, 본 연구에서는 소비자들이 '어떤 관점'에서 대상 상품 혹은 상품의 요소를 평가했는지를 자동으로 추출하는 방법에 초점을 두었다. 본 연구에서는 형용사의 대표적인 성질 중 하나가 자신이 수식하는 명사의 속성에 값을 부여하는 것임에 주목하여, 수식된 명사의 속성을 추출하고자 하였고 이를 위해 WordNet을 사용하였다. 제안하는 방법의 효과를 검증하기 위해 3명의 평가자를 활용하여 실험을 하였으며 그 결과는 본 연구 방향이 감성분석에 있어 새로운 가능성을 열기에 충분하다는 것을 보여주었다.

  • PDF

Automatic Tagging for Social Images using Convolution Neural Networks (CNN을 이용한 소셜 이미지 자동 태깅)

  • Jang, Hyunwoong;Cho, Soosun
    • Journal of KIISE
    • /
    • v.43 no.1
    • /
    • pp.47-53
    • /
    • 2016
  • While the Internet develops rapidly, a huge amount of image data collected from smart phones, digital cameras and black boxes are being shared through social media sites. Generally, social images are handled by tagging them with information. Due to the ease of sharing multimedia and the explosive increase in the amount of tag information, it may be considered too much hassle by some users to put the tags on images. Image retrieval is likely to be less accurate when tags are absent or mislabeled. In this paper, we suggest a method of extracting tags from social images by using image content. In this method, CNN(Convolutional Neural Network) is trained using ImageNet images with labels in the training set, and it extracts labels from instagram images. We use the extracted labels for automatic image tagging. The experimental results show that the accuracy is higher than that of instagram retrievals.

Method for Detecting Errors of Korean-Chinese MT Using Parallel Corpus (병렬 코퍼스를 이용한 한중 기계번역 오류 탐지 방법)

  • Jin, Yun;Kim, Young-Kil
    • Annual Conference on Human and Language Technology
    • /
    • 2008.10a
    • /
    • pp.113-117
    • /
    • 2008
  • 본 논문에서는 패턴기반 자동번역시스템의 효율적인 번역 성능 향상을 위해 병렬 코퍼스(parallel corpus)를 이용한 오류 자동 탐지 방법을 제안하고자 한다. 번역시스템에 존재하는 대부분 오류는 크게 지식 오류와 엔진 오류로 나눌 수 있는데 통상 이런 오류는 이중 언어가 가능한 훈련된 언어학자가 대량의 자동번역 된 결과 문장을 읽음으로써 오류를 탐지하고 분석하여 번역 지식을 수정/확장하거나 또는 엔진을 개선하게 된다. 하지만, 이런 작업은 많은 시간과 노력을 필요로 하게 된다. 따라서 본 논문에서는 병렬 코퍼스 중의 목적 언어(Target Language) 문장 즉, 정답 문장과 자동번역 된 결과 문장을 다양한 방법으로 비교하면서 번역시스템에 존재하고 있는 지식 및 엔진 오류를 자동으로 탐지하는 방법을 제안한다. 제안한 방법은 한-중 자동번역시스템에 적용하여 그 정확률과 재현률을 측정하였으며, 자동적으로 오류를 탐지하여 추출 할 수 있음을 증명하였다.

  • PDF

The Study on Development of Automatic Main Reinforcement Placing System of Columns for RC Structures based on Parametric Technology (파라메트릭 기술기반 철근콘크리트 구조물의 기둥부재 주철근 자동배근시스템 구축에 관한 연구)

  • Cho, Young-Sang;Hong, Seong-Uk;Kim, Yu-Ri;Lee, Je-Hyuk
    • Proceedings of the Computational Structural Engineering Institute Conference
    • /
    • 2010.04a
    • /
    • pp.484-487
    • /
    • 2010
  • 본 논문에서는 BIM(Building Information Modeling)의 핵심기술인 파라메트릭 기술을 기반으로 하여 철근콘크리트 구조물의 기둥부재 주철근 자동배근시스템을 구축함으로써 기존 프로그램에서 사용자가 직접 입력해야하는 변수의 수를 최소화하고 사용성과 정확성을 높이는 것을 목적으로 한다. 기존 철근배근 형상 자동 모델링에서 기둥철근의 자동 모델링은 기둥단면이 변하는 부분에서의 철근 배근과 정착 및 이음길이를 고려하지 않고 있다. 만약 고려하더라도 이용자가 직접 입력하는 방식이기 때문에 규모가 큰 건물일 경우 방대한 정보의 처리 미숙으로 인해 정확한 모델링을 기대하기 어려운 실정이다. 본 연구에서는 기둥 부재에 대하여 대상 건물을 선정하고 구조해석 모델링을 구축한 후 구조해석 결과 데이터베이스를 추출하여 얻은 정보와 건축구조설계기준에 따른 정착 및 이음 길이 산정에 관한 알고리즘을 구축하여 철근배근 형상 자동화 모듈에 적용하여 배근 자동 설계 및 자동 형상화 모듈을 생성하였다.

  • PDF

Automatically Registering Schedules from SMS Messages on Handheld Devices (휴대전화에서 단문 메시지로부터 일정 자동 등록)

  • Kim, Jae-Hoon;Kim, Hyung-Chul
    • Korean Journal of Cognitive Science
    • /
    • v.22 no.1
    • /
    • pp.1-18
    • /
    • 2011
  • With rapid spread of handheld devices like cellular or smart phones, a short message service (SMS) comes on the public as a communication means. SMS is very cheap and can be easily written down on the storage in order not to forget it, hence it is widely used to inform schedules (time and place). In this paper, we develop a system for automatically registering schedules extracted from SMS text messages. SMS text messages are very short and concise, but include a lot of Internet words like slangs and abbreviations. These have made it difficult to extract information on schedules from them. Also handheld devices have some limitations on computing power and storage and then applying general natural language processing modules like morphological analysis to the devices are somewhat hard. To relax these burdens, we extract schedule informations from SMS messages using machine learning methods like condition random field (CRF) without using any language processing modules and register the informations on the schedule management system of handheld devices. Our proposed automatic schedule registration system has implemented on Samsung Omnia phone for experiments.

  • PDF

Contextual Advertisement System based on Document Clustering (문서 클러스터링을 이용한 문맥 광고 시스템)

  • Lee, Dong-Kwang;Kang, In-Ho;An, Dong-Un
    • The KIPS Transactions:PartB
    • /
    • v.15B no.1
    • /
    • pp.73-80
    • /
    • 2008
  • In this paper, an advertisement-keyword finding method using document clustering is proposed to solve problems by ambiguous words and incorrect identification of main keywords. News articles that have similar contents and the same advertisement-keywords are clustered to construct the contextual information of advertisement-keywords. In addition to news articles, the web page and summary of a product are also used to construct the contextual information. The given document is classified as one of the news article clusters, and then cluster-relevant advertisement-keywords are used to identify keywords in the document. We could achieve 21% precision improvement by our proposed method.

Development of Configuration Evaluator for Basic Software in AUTOSAR (AUTOSAR Basic Software 모듈의 설정을 평가하는 도구 개발)

  • Hong, Seung-An;Lim, Hyoung-Joo;Kwon, Gi-Hwon;Nam, Hyeon-Sun;Han, Tae-Man
    • Annual Conference of KIPS
    • /
    • 2010.11a
    • /
    • pp.299-302
    • /
    • 2010
  • 본 논문에서는 차량 전장용 소프트웨어의 일부인 Basic Software(BSW) 모듈 설정이 AUTOSAR 표준을 따르는 지를 평가하는 도구를 설명한다. 평가 도구는 크게 평가 속성 추출 부분과 속성 평가 부분으로 구분된다. 평가 속성 추출 부분에서는 AUTOSAR에서 제공하는 BSW 메타 모델로부터 평가 속성을 정의하는 데 사용되는 정보를 자동으로 추출하며 속성 평가 부분에서는 앞에서 추출한 정보를 이용하여 평가 속성을 정의한 후 사용자가 설정한 BSW 사용자 설정 모델에 대해서 평가를 자동으로 수행한다. 한편 평가 속성을 정의하는 데 BSW 메타 모델과 BSW 사용자 설정 모델이 이용된다. 이 두 모델은 XML 구조를 따르고 있으며 이 두 모델로부터 필요한 정보를 얻기 위해서는 XML 탐색이 요구된다. 이를 위해서 우리는 XML 질의어 중 하나인 XPath를 사용하였으며 BSW 메타 모델과 BSW 사용자 설정 모델로부터 평가에 필요한 정보를 얻을 수 있었다. 또한 평가 속성을 정의하는 데에도 XPath 를 사용하였으며 XPath로 정의한 평가 속성을 이용하여 우리는 BSW 사용자 설정 모델을 평가할 수 있었다.

Web Document-based Associate Knowledge Extraction Method : Applying to Bioinformatics (웹 도큐먼트 기반 연관 지식 추출 기법 : 생명정보분야에의 적용)

  • 문현정;김교정
    • Journal of Internet Computing and Services
    • /
    • v.2 no.5
    • /
    • pp.9-19
    • /
    • 2001
  • In this paper. we develop associate knowledge extraction method for finding and expanding user preference knowledge automatically from web document database. To reflect user interest or preferences, agent explores and extracts relevant information to central term involving the intent of users from the example documents. To do so, we apply association rule exploration data-mining method to the extraction of the relevant objects in the web documents. Also, to give the weighted-value to the extracted and relevant information, we present associate tag block-based weighting method. We applied to bioinformatics above associate knowledge extraction method to find related keywords.

  • PDF

Full-automatic high-level concept extraction for image using domain ontologies (온톨로지를 이용한 이미지의 고수준 의미 정보 자동 추출 기법)

  • Park Kyung-Wook;Lee Dong-Ho
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2005.11b
    • /
    • pp.88-90
    • /
    • 2005
  • 최근 인터넷의 급속한 성장은 이미지와 같은 멀티미디어 정보의 급격한 증가를 가져왔다. 따라서 사용자로 하여금 원하는 이미지를 검색하는데 있어서 좀 더 효율적이고 정확한 검색 방법의 필요성이 대두되어 왔다. 일반적으로 이미지 검색 방법에는 키워드 기반 방식과 내용 기반 방식이 존재한다. 그러나 위 두 방법은 지금의 대용량 이미지 데이터베이스 검색에 있어서 여러 문제점들을 가지고 있다. 특히, 키워드 기반 방식을 보완하기 위해서 제안되어진 내용 기반 방식의 경우, 사람이 인식할 수 있는 의미 정보가 아닌 시각 정보만을 이용하기 때문에 시맨틱 갭(semantic gap) 문제가 발생하게 된다. 본 논문에서는 이미지 객체의 시각 정보들에 대한 중간 의미값으로 구성된 시각 정보 온톨로지와 동물에 대한 분류 정보를 표현하고 있는 동물 온톨로지를 구축하고, 이를 이용하여 이미지로부터 .고수준의 의미 정보를 완전 자동으로 추출하는 효율적인 방법을 제안한다.

  • PDF

A Study on Face Component Extraction for Automatic Generation of Personal Avatar (개인아바타 자동 생성을 위한 얼굴 구성요소의 추출에 관한 연구)

  • Choi Jae Young;Hwang Seung Ho;Yang Young Kyu;Whangbo Taeg Ken
    • Journal of Internet Computing and Services
    • /
    • v.6 no.4
    • /
    • pp.93-102
    • /
    • 2005
  • In Recent times, Netizens have frequently use virtual character 'Avatar' schemes in order to present their own identity, there is a strong need for avatars to resemble the user. This paper proposes an extraction technique for facial region and features that are used in generating the avatar automatically. For extraction of facial feature component, the method uses ACM and edge information. Also, in the extraction process of facial region, the proposed method reduces the effect of lights and poor image quality on low resolution pictures. this is achieved by using the variation of facial area size which is employed for external energy of ACM. Our experiments show that the success rate of extracting facial regions is $92{\%}$ and accuracy rate of extracting facial feature components is $83.4{\%}$, our results provide good evidence that the suggested method can extract the facial regions and features accurately, moreover this technique can be used in the process of handling features according to the pattern parts of automatic avatar generation system in the near future.

  • PDF