• 제목/요약/키워드: Semantic Classification Model

검색결과 112건 처리시간 0.032초

전공분류표, 사용자 프로파일, LSI를 이용한 검색 모델 (Retrieval Model using Subject Classification Table, User Profile, and LSI)

  • 우선미
    • 정보처리학회논문지D
    • /
    • 제12D권5호
    • /
    • pp.789-796
    • /
    • 2005
  • 현재 대부분의 도서관 정보검색 시스템들은 키워드 정합매칭(exacting matching) 방법으로 검색 서비스를 제공하고 있으므로, 검색 결과의 양이 방대하고 비적합한 결과가 많이 포함되어 있다. 따라서 본 논문에서는 키워드기반 검색 엔진의 단점을 보완하고 현재 도서관 검색 환경을 고려하여 보다 적합한 결과를 사용자에게 신속하게 제공하기 위하여 전공분류표와 사용자 프로파일을 이용한 검색 모델 SULRM(Retrieval Model using Subject Classification Table, User Profile & LSI)을 제안한다. SULRM은 키워드 검색 결과로 얻은 자료들을 분류된 자료의 경우와 미분류된 자료의 경우로 나누어, 분류된 자료의 경우에는 전공분류표를 생성하여 자료 필터링을 수행하고, 미분류된 자료의 경우에는 사용자 프로파일과 LSI(Latent Semantic Indexing)을 이용하여 자료의 순위를 결정해서 사용자에게 제시한다. 실험평가는 우리 대학의 디지털 도서관을 실험환경으로 하여 필터링 방법, 사용자 프로파일 갱신 방법, 그리고 문서순위결정 방법의 성능을 측정한다.

Operational Experience in DB "TERMIN"

  • Shaburova, Natalya N.
    • Journal of Information Science Theory and Practice
    • /
    • 제7권3호
    • /
    • pp.21-30
    • /
    • 2019
  • Information about the formation and filling (in 2014 to 2016) of a terminological dictionary on electronics and radioengineering and collective work (in 2017 to 2018) with a data bank "TERMIN" is presented in this article. In purpose of creating an instrument of navigating the modern scientific-technical space a net of terms with set semantic links is described. This set is based on the analysis of terms' definitions (each term is checked for inclusion in the definitions of all other terms; the definitions were borrowed from reputable reference editions: encyclopedias, dictionaries, reference books). The created model of a system that consists of different information sources, in which it (information) is indexed by the terminology of Russian State Rubricator of Scientific and Technical Information rubrics and/or keywords, is described. There is an access for the search in all these sources in the system. Searching inquiries are referred to in the language of these rubrics or formulated by arbitrary terms. The system is to refer to information sources and give out relevant information. In accordance with this model, semantic links of various types, which allow expanding a search at different modalities of query, should be set among data bank terms. Obtained links will have to increase semantic matching, i.e., they can provide actual understanding of the meaning of the information that is being sought.

전자 카탈로그를 위한 의미적 분류 모형 (A Semantic Classification Model for e-Catalogs)

  • 김동규;이상구;전종훈;최동훈
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제33권1호
    • /
    • pp.102-116
    • /
    • 2006
  • 전자 카탈로그는 시장 참여자들이 제공하는 상품과 서비스에 대한 정보를 가지고 있으며 결과적으로 전자 상거래의 근간을 형성하고 있다. 카탈로그의 관리는 여러 가지 요소에 의해 복잡해지는데, 상품 분류는 이들의 핵심 요소이다. 분류 계층 구조는 지출 분석, 관세 규제의 실행, 상품의 식별 등을 위해 활용된다. 이와 같이 상품 분류 체계는 상품 데이타베이스의 설계에 토대가 되고, 상품 정보의 활용 및 관리의 거의 모든 면에서 중심적 역할을 한다. 그러나, 데이타 모형, 연산, 의미론 등의 측면에서 상품 분류에 대한 형식적인 연구는 거의 없었다. 분류에 관한 논리적 모형의 부재는 분류에 대해서뿐만 아니라 일반적인 상품 데이타베이스에 대해서도 비일관성 및 비융통성 등 많은 문제를 야기시킨다. 상품 정보의 효율적이고 편리한 활용을 위해 각 사용자의 관점에 따른 다양한 뷰를 제공할 필요가 있다. 새로운 상품이 출현하고 기존 상품이 사라짐에 따라 분류체계도 이에 따라 일관성을 유지하면서 변경 및 진화해야 한다. 또한 이질적인 다른 분류체계와 매핑되거나 병합될 필요가 있으며, 이 때 정보의 손실을 줄이는 것이 중요하다. 이들 요구사항에 대해, 분류체계는 제한된 시간 및 비용 내에서 수용할 수 있도록 충분히 동적이어야 한다. 그러나, UNSPSC 및 eClass와 같이 현재 널리 사용중인 분류체계는 이러한 동적인 특성에 대한 요구사항을 만족시키지 못한다. 이 논문에서 우리는 상품 분류 체계의 의미를 이해하고, 기존의 분류 체계의 이면에 있는 의미를 포획하여 표현할 수 있는 방법으로 의미적 분류 모형을 제시하고자 한다. 상품 정의는 재료, 시간, 장소 등의 속성과 무결성 조건과 같은 많은 의미를 지니고 있다. 상품 데이타베이스의 동적 특성 및 이에 대한 기존코드 기반 분류 체계의 한계점을 분석하고, 제안된 의미적 분류 모형이 상품 데이타베이스의 동적 특성에 관한 요구사항을 만족시킨다는 것을 설명한다. 이 모형은 상품 클래스를 명시적이고 형식적으로 정의할 수 있는 수단을 제공하며, 상품 클래스간의 관계를 그래프로 구성한다. 이 모형은 분류 체계의 매핑을 용이하게 하며, 선행 연구에 의해 제기된 요구 사항 및 문제를 해결한다고 믿는다.

자동문서분류를 위한 텐서공간모델 기반 심층 신경망 (A Tensor Space Model based Deep Neural Network for Automated Text Classification)

  • 임푸름;김한준
    • 데이타베이스연구회지:데이타베이스연구
    • /
    • 제34권3호
    • /
    • pp.3-13
    • /
    • 2018
  • 자동문서분류(Text Classification)는 주어진 텍스트 문서를 이에 적합한 카테고리로 분류하는 텍스트 마이닝 기술 중의 하나로서 스팸메일 탐지, 뉴스분류, 자동응답, 감성분석, 쳇봇 등 다양한 분야에 활용되고 있다. 일반적으로 자동문서분류 시스템은 기계학습 알고리즘을 활용하며, 이 중에서 텍스트 데이터에 적합한 알고리즘인 나이브베이즈(Naive Bayes), 지지벡터머신(Support Vector Machine) 등이 합리적 수준의 성능을 보이는 것으로 알려져 있다. 최근 딥러닝 기술의 발전에 따라 자동문서분류 시스템의 성능을 개선하기 위해 순환신경망(Recurrent Neural Network)과 콘볼루션 신경망(Convolutional Neural Network)을 적용하는 연구가 소개되고 있다. 그러나 이러한 최신 기법들이 아직 완벽한 수준의 문서분류에는 미치지 못하고 있다. 본 논문은 그 이유가 텍스트 데이터가 단어 차원 중심의 벡터로 표현되어 텍스트에 내재한 의미 정보를 훼손하는데 주목하고, 선행 연구에서 그 효능이 검증된 시멘틱 텐서공간모델에 기반하여 심층 신경망 아키텍처를 제안하고 이를 활용한 문서분류기의 성능이 대폭 상승함을 보인다.

표준시방서 기반의 의미론적 분석을 반영한 건설 현장 사진 자동 분류 모델 개발 (Development of an Automatic Classification Model for Construction Site Photos with Semantic Analysis based on Korean Construction Specification )

  • 박민건;김경환
    • 한국건설관리학회논문집
    • /
    • 제25권3호
    • /
    • pp.58-67
    • /
    • 2024
  • 4차 산업 시대에서의 데이터는 산업의 생산성을 높이는 데 매우 중요한 역할을 하고 있다. 활용 가능한 데이터가 부족한 건설산업의 디지털화 수준을 높이기 위해서 본 연구에서는 건설 현장 사진을 공종별로 분류하는 모델을 연구하였다. 이미지만을 가지고 분류하는 기존의 이미지 분류 모델과 달리, 본 연구는 표준시방서에서 객체와 공종 간의 중요도를 추출하여 이를 분류 과정에 반영하는 방식으로 공종에 대한 의미론적인 분석을 포함한 분류 모델을 제안하였다. 객체와 공종 간의 중요도는 사진 내에서 탐지한 객체와 표준시방서의 정보를 연결하여 추출한 후 모델에 반영하였고, 이러한 방식으로 개발된 모델을 분류 프로그램에 적용하여 실제 실무에서의 유용성을 확인해 보았다. 제안한 모델은 결과에 해석가능성과 신뢰도를 높여주는 것뿐만 아니라 현장 기사들이 사진을 분류하는데 용이성을 주게 되며, 이러한 연구의 결과는 건설산업의 디지털화에 기여할 수 있을 것이다.

상품 데이터베이스의 동적 특성을 지원하는 분류 모형 (A Classification Model Supporting Dynamic Features of Product Databases)

  • 김동규;이상구;최동훈
    • 정보처리학회논문지D
    • /
    • 제12D권1호
    • /
    • pp.165-178
    • /
    • 2005
  • 상품 분류체계는 상품 데이터베이스를 설계하는 토대이며 전자상거래에서 상품 정보의 관리 및 활용에 관한 거의 모든 면에서 중심적 역할을 한다. 상품 정보의 효율적이고 편리한 활용을 위해 각 사용자의 관점에 따른 다양한 뷰를 제공할 필요가 있다. 새로운 상품이 출현하고 기존 상품이 사라짐에 따라 분류체계도 이에 따라 일관성을 유지하면서 변경 및 진화해야 한다. 또한 이질적인 다른 분류체계와 매핑되거나 병합될 필요가 있으며, 이 때 정보의 손실을 줄이는 것이 중요하다. 이들 요구사항에 대해, 분류체계는 제한된 시간 및 비용 내에서 수용할 수 있도록 충분히 동적이어야 한다. 그러나, UNSPSC 및 eCl@ss와 같이 현재 널리 사용중인 분류체계는 이러한 동적인 특성에 대한 요구사항을 만족시키지 못한다. 상품 정보는 재료, 시간, 장소 통의 속성과 무결성 조건과 같은 많은 의미를 지니고 있다. 이 논문에서는 상품 데이터베이스의 동적 특성 및 이에 대한 기존 코드 기반 분류 체계의 한계점을 분석하고, [1]에서 제안된 의미적 분류 모형이 상품 데이터베이스의 동적 특성에 관한 요구사항을 만족시킨다는 것을 설명한다. 이 모형은 상품 클래스를 명시적이고 형식적으로 정의할 수 있는 수단을 제공하며, 상품 클래스 간의 관계를 그래프로 구성한다.

딥러닝 기반 실내 디자인 인식 (Deep Learning-based Interior Design Recognition)

  • 이원규;박지훈;이종혁;정희철
    • 대한임베디드공학회논문지
    • /
    • 제19권1호
    • /
    • pp.47-55
    • /
    • 2024
  • We spend a lot of time in indoor space, and the space has a huge impact on our lives. Interior design plays a significant role to make an indoor space attractive and functional. However, it should consider a lot of complex elements such as color, pattern, and material etc. With the increasing demand for interior design, there is a growing need for technologies that analyze these design elements accurately and efficiently. To address this need, this study suggests a deep learning-based design analysis system. The proposed system consists of a semantic segmentation model that classifies spatial components and an image classification model that classifies attributes such as color, pattern, and material from the segmented components. Semantic segmentation model was trained using a dataset of 30000 personal indoor interior images collected for research, and during inference, the model separate the input image pixel into 34 categories. And experiments were conducted with various backbones in order to obtain the optimal performance of the deep learning model for the collected interior dataset. Finally, the model achieved good performance of 89.05% and 0.5768 in terms of accuracy and mean intersection over union (mIoU). In classification part convolutional neural network (CNN) model which has recorded high performance in other image recognition tasks was used. To improve the performance of the classification model we suggests an approach that how to handle data that has data imbalance and vulnerable to light intensity. Using our methods, we achieve satisfactory results in classifying interior design component attributes. In this paper, we propose indoor space design analysis system that automatically analyzes and classifies the attributes of indoor images using a deep learning-based model. This analysis system, used as a core module in the A.I interior recommendation service, can help users pursuing self-interior design to complete their designs more easily and efficiently.

온톨로지 통합 분류와 온톨로지 기반의 PLM Object 의미적 통합 (Classification of Ontology Integration and Ontology-based Semantic Integration of PLM Object)

  • 곽정애;용환승;최상수
    • 한국CDE학회논문집
    • /
    • 제13권3호
    • /
    • pp.163-174
    • /
    • 2008
  • In this paper, for integrating of data on car parts we model information of parts that PDM system manages. Ontology of car parts applies existing ontology mapping research to integrate into car ontology. We propose a method for semantic integration of PLM object of MEMPHIS based on the integrated ontology. Through our method, we introduce C# ontology model to apply existing C# applications with ontology. We also classify ontology integration into three through examples and explain them. While semantically integrating PLM objects based on the integrated ontology, we explain the need for change of PLM object type and describe the process of change for PLM object type by examples.

절 경계와 트리 거리를 사용한 2단계 부분 의미 분석 시스템 (A Two-Phase Shallow Semantic Parsing System Using Clause Boundary Information and Tree Distance)

  • 박경미;황규백
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제16권5호
    • /
    • pp.531-540
    • /
    • 2010
  • 본 논문은 최대 엔트로피 모형에 기반한 두 단계 부분 의미 분석 방법을 제안한다. 먼저, 의미 논항의 경계를 인식하고, 그 다음 단계에서 확인된 논항에 적절한 의미역을 할당한다. 두 단계 부분 의미 분석에서는 두 번째 단계인 논항 분류가 논항 확인 단계의 결과에 기반하여 수행되기 때문에 논항 확인의 성능이 매우 중요하다. 본 논문은 논항 확인의 성능을 향상시키기 위하여 논항 확인의 전처리 단계에 구문 지식을 통합한다. 구체적으로, 절 인식 결과로부터 술어의 인접절 및 상위절들을 확인하고, 구문 분석 결과로부터 술어의 부모 노드로부터 구문 구성 요소의 부모 노드까지의 트리 거리를 추출하여 전처리 단계에서 활용한다. 실험을 통해, 구문 지식을 활용하는 것이 부분 의미 분석 성능에 기여함과 제안하는 두 단계 방법이 한 단계 방법보다 우수한 성능을 낼 수 있음을 보인다.

Arabic Stock News Sentiments Using the Bidirectional Encoder Representations from Transformers Model

  • Eman Alasmari;Mohamed Hamdy;Khaled H. Alyoubi;Fahd Saleh Alotaibi
    • International Journal of Computer Science & Network Security
    • /
    • 제24권2호
    • /
    • pp.113-123
    • /
    • 2024
  • Stock market news sentiment analysis (SA) aims to identify the attitudes of the news of the stock on the official platforms toward companies' stocks. It supports making the right decision in investing or analysts' evaluation. However, the research on Arabic SA is limited compared to that on English SA due to the complexity and limited corpora of the Arabic language. This paper develops a model of sentiment classification to predict the polarity of Arabic stock news in microblogs. Also, it aims to extract the reasons which lead to polarity categorization as the main economic causes or aspects based on semantic unity. Therefore, this paper presents an Arabic SA approach based on the logistic regression model and the Bidirectional Encoder Representations from Transformers (BERT) model. The proposed model is used to classify articles as positive, negative, or neutral. It was trained on the basis of data collected from an official Saudi stock market article platform that was later preprocessed and labeled. Moreover, the economic reasons for the articles based on semantic unit, divided into seven economic aspects to highlight the polarity of the articles, were investigated. The supervised BERT model obtained 88% article classification accuracy based on SA, and the unsupervised mean Word2Vec encoder obtained 80% economic-aspect clustering accuracy. Predicting polarity classification on the Arabic stock market news and their economic reasons would provide valuable benefits to the stock SA field.