• 제목/요약/키워드: formal classification

검색결과 100건 처리시간 0.019초

WordNet기반의 형식개념분석기법을 이용한 사용자태그 분류체계의 구축 (Construction of Hierarchical Classification of User Tags using WordNet-based Formal Concept Analysis)

  • 황석형
    • 한국컴퓨터정보학회논문지
    • /
    • 제18권10호
    • /
    • pp.149-161
    • /
    • 2013
  • 본 논문에서는, 어휘정보를 체계화한 워드넷(WordNet)을 토대로 형식개념분석기법(Formal Concept Analysis)을 사용하여 폭소노미 사용자들의 태그데이터를 분석하여 사용자태그의 분류체계를 구축하기 위한 기법을 제안하였다. 또한, 제안된 기법을 지원하기 위한 도구(TagLighter)의 개발에 대하여 설명하고, 그 유용성을 확인하기 위하여 Bibsonomy.org의 사용자 태그데이터를 대상으로 실시한 실험결과를 기술하였다. TagLighter에 의해 구축된 사용자태그 분류계층구조는 사용자태그에 대한 보다 상세한 이해를 제공하기 때문에, 폭소노미기반 시스템에서의 정보검색과 데이터 분석에 유용하다. 본 논문의 연구결과는, 폭소노미기반의 웹서비스와 소셀네트워크시스템, 시맨틱웹 어플리케이션 등을 대상으로 하는 웹데이터 마이닝분야에 응용할 수 있다.

구간데이터분석을 위한 형식개념분석기반의 분류 (A FCA-based Classification Approach for Analysis of Interval Data)

  • 황석형;김응희
    • 한국컴퓨터정보학회논문지
    • /
    • 제17권1호
    • /
    • pp.19-30
    • /
    • 2012
  • 다양한 정보기기와 소셜네트워크시스템, 그리고, 클라우드컴퓨팅환경 등과 같은 인터넷기반의 인프라를 토대로 분산화되고 공유가능한 데이터가 폭발적으로 증가하고 있다. 최근에는 데이터에 내재되어 있는 유용한 정보와 지식을 추출하고 분석 및 분류하기 위한 데이터분석 및 마이닝기법으로서, 이진데이터 또는 다치데이터에 관한 형식개념분석기법에 관한 연구가 활발하게 진행되어 다양한 분야에서 성공적으로 활용되고 있다. 그러나, 각 속성들이 구간값을 갖는 형태로 이루어진 구간데이터의 분석에 대한 형식개념분석에 관한 연구는 많이 수행되지 못하였다. 본 논문에서는, 구간데이터를 분석하기 위하여 형식개념분석기법을 기반으로 하는 새로운 분류기법을 제안한다. 또한, 구간데이터의 이진화, 개념추출 및 개념계층구조 구축 등, 본 논문에서 제안한 새로운 분류기법을 지원하기 위한 도구(iFCA)의 구축에 관하여 소개하고, 마지막으로, 몇가지 실세계의 데이터를 대상으로 한 실험결과를 토대로, 본 논문에서 제안하는 분류기법의 유용성에 대해서 설명한다.

형식적 및 비형식적 어휘 정보를 반영한 문장 감정 분류 (A Sentence Sentiment Classification reflecting Formal and Informal Vocabulary Information)

  • 조상현;강행봉
    • 정보처리학회논문지B
    • /
    • 제18B권5호
    • /
    • pp.325-332
    • /
    • 2011
  • 최근 트위터, 페이스북과 같은 소셜 네트워크 서비스(Social Network Service : SNS)가 활성화됨에 따라 서비스 사용자들에 의해 작성된 막대한 텍스트들로부터 의미 있는 정보를 찾기 위한 연구가 많은 주목을 받고 있다. 특히 문장에 담겨 있는 감정은 활용 범위가 매우 넓은 정보로서 문장에 대한 감정을 분류하는 일은 매우 유용한 일이라고 할 수 있다. 본 논문에서는 문장의 감정을 분류하기 위해 문장에 포함되어 있는 형식적 어휘 정보와 이모티콘이나 인터넷 용어와 같은 온라인상에서 많이 이용되는 다양한 형태의 비형식적 어휘 정보를 이용한 새로운 문장 감정 분류 방법을 제안한다. 기존에는 문장의 감정을 분류하기 위해 사전을 기반으로 한 형식적 어휘 정보를 이용했지만, 최근 인터넷 사용자들은 인터넷 용어나 이모티콘과 같은 비형식적 어휘를 많이 사용해 기존의 형식적 어휘 정보만으로는 정확한 감정 분류가 어렵다. 제안한 방법은 형식적 어휘 정보와 비형식적 어휘 정보를 이용해 다양한 형태의 어휘를 포함하는 인터넷 상의 문장들에 대해 보다 정확한 감정 분류 결과를 보여준다. 또한, 같은 어휘라도 도메인별로 다른 감정을 나타내는 경우가 많으므로 제안한 방법에서는 도메인별로 다른 감정 어휘정보를 이용했다. 각 감정 어휘 정보를 통해 특징벡터로 표현된 문장은 Support Vector Machine(SVM) 분류 방법을 통해 감정을 분류하고 그 성능을 평가했다.

인간 가치 유형에 기반한 캐릭터 분석 방법론 제안 (Character Analysis Method based on the Value Type of the Human)

  • 송민호
    • 한국콘텐츠학회논문지
    • /
    • 제17권9호
    • /
    • pp.650-660
    • /
    • 2017
  • 본 연구는 지금까지의 서사 양식에 등장했던 캐릭터의 성격 유형론을 정리하여, 기존의 캐릭터의 성격 유형론이 갖고 있는 문제점을 정리하고 새로운 분류 가능성을 제안하기 위한 것이다. 지금까지 서사 이론에서 캐릭터 유형의 분류는 크게 서사 내에서의 역할이라는 형식적인 분류와 인간의 내적 자질에 근거한 내용적인 분류, 그리고 그 두 가지 분류 기준이 착종된 보완적 분류로 이루어져 있었다. 기존 캐릭터 분류 유형이 담고 있는 문제는 바로 인간의 내적 자질에 근거한 내용적인 분류의 유용성에 비해 실질적으로 분류가 어렵다는 점이다. 반면 서사 내 등장인물의 역할에 따른 분류는 그 분류가 형식적이기 때문에 서사론의 발전상 중요하게 다뤄져 왔지만, 그다지 실질적인 분석 방법론으로 기능하기는 어려웠다. 본 연구는 이러한 문제를 해결하기 위한 시론적인 성격으로, 샬롬 슈워츠의 인간의 가치 유형을 도입하여, 인간의 가치 유형과 인간의 역할을 상호 관련시켜 새로운 캐릭터 분석 방법의 가능성을 제안하고자 한다. 슈워츠의 가치 유형 연구는 인간의 행동의 동기를 파악하는 데 매우 효과적인 방법론으로, 등장인물의 지향성을 분석하는 데 큰 의미가 있을 것이다.

Classification and Verification of Semantic Constraints in ebXML BPSS

  • Kim, Jong-Woo;Kim, Hyoung-Do
    • 한국전자거래학회:학술대회논문집
    • /
    • 한국전자거래학회 2004년도 e-Biz World Conference
    • /
    • pp.318-326
    • /
    • 2004
  • The ebXML (Electronic Business using eXtensible Markup Language) Specification Schema is to provide nominal set of specification elements necessary to specify a collaboration between business partners based on XML. As a part of ebXML Specification Schema, BPSS (Business Process Specification Schema) has been provided to support the direct specification of the set of elements required to configure a runtime system in order to execute a set of ebXML business transactions. The BPSS is available in two stand-alone representations, a UML version and an XML version. Due to the limitations of UML notations and XML syntax, however, current ebXML BPSS specification is insufficient to specify formal semantic constraints of modeling elements completely. In this study, we propose a classification schema for the BPSS semantic constraints and describe how to represent those semantic constraints formally using OCL (Object Constraint Language). As a way to verify a Business Process Specification (BPS) with the formal semantic constraint modeling, we suggest a rule-based approach to represent the formal constraints and to use the rule-based constraints specification to verify BPSs in a CLIPS prototype implementation.

  • PDF

중국 스트리트 패션에 나타난 지역적 특성 -2008년 F/W, 엔지, 베이징, 상하이를 중심으로- (Regional Characteristics of Street Fashion In China -Focused on Yanji, Beijing, Shanghai in 2008 F/W-)

  • 김찬주;유혜경
    • 한국의류학회지
    • /
    • 제34권10호
    • /
    • pp.1581-1595
    • /
    • 2010
  • This paper investigates the regional characteristics of street fashion in China. Yanji, Beijing, Shanghai were chosen as three different cities in terms of location, weather, population, and industrial structure. A total of 592 pictures were collected through an internet and fashion magazine search for street fashion in Beijing and Shanghai in addition photos were taken for those in Yanji. Pictures of each city were classified into groups based on overall images covering top, bottom, and accessories to identify the characteristics of style in each group. The classification process included 2 stages. In the first stage, it produced 2 groups: formal and casual. The second stage divided formal into business formal and retro formal; casual was divided into II sub-groups that were easy, sporty, feminine, sexy, ethnic, girlish, nippon, trendy, bulky, military, and mixed. Easy casual showed the highest frequency for 3 cities and military style showed the lowest. Shanghai showed higher frequency in sporty, trendy, and military style than other cities. Each style exposed the similarities and differences in the cities that reflected different regional characteristics.

비격식 문서 분류 성능 개선을 위한 LDA 단어 분포 기반의 자질 확장 (Feature Expansion based on LDA Word Distribution for Performance Improvement of Informal Document Classification)

  • 이호경;양선;고영중
    • 정보과학회 논문지
    • /
    • 제43권9호
    • /
    • pp.1008-1014
    • /
    • 2016
  • 트위터, 페이스북, 온라인 고객 리뷰 등은 신문기사처럼 정제된 글이 아닌 자유롭게 기술되는 비격식(informal) 텍스트 문서에 속한다. 이러한 비격식 문서에서 일관된 규칙이나 패턴을 찾는 일은 격식(formal) 문서 경우에 비해 용이하지 않기 때문에, 비격식 문서 분석을 위해서는 성능 개선을 위한 추가적인 접근 방법 필요다고 판단된다. 본 연구에서는 대표적 비격식 문서인 트위터 데이터를 열 가지 카테고리로 분류함에 있어 LDA(Latent Dirichlet allocation) 단어 분포를 사용하여 자질(feature)을 교정하고 확장한다. 토픽별로 상위에 랭크된 단어 자질들을 기반으로 다른 단어 자질들을 분해 및 병합하는 방식으로 유용한 자질 집합을 반복적으로 확장시킨다. 이렇게 생성된 자질로 문서 분류를 수행한 결과 자질 확장 이전에 비해 마이크로 평균 F1-score 7.11%p의 성능 개선 효과를 확인할 수 있었다.

그라스만의 수학 인식과 벡터공간의 일반화 (Grassmann's Mathematical Epistemology and Generalization of Vector Spaces)

  • 이희정;신경희
    • 한국수학사학회지
    • /
    • 제26권4호
    • /
    • pp.245-257
    • /
    • 2013
  • Hermann Grassmann classified mathematics and extended the dimension of vector spaces by using dialectics of contrasts. In this paper, we investigate his mathematical idea and its background, and the process of the classification of mathematics. He made a synthetic concept of mathematics based on his idea of 'equal' and 'inequal', 'discrete' and 'indiscrete' mathematics. Also, he showed a creation of new mathematics and a process of generalization using a dialectic of contrast of 'special' and 'general', 'real' and 'formal'. In addition, we examine his unique development in using 'real' and 'formal' in a process of generalization of basis and dimension of a vector space. This research on Grassmann will give meaningful suggestion to an effective teaching and learning of linear algebra.

ebXML 비즈니스 프로세스 명세를 위한 의미 제약의 모델링과 검증 (Modeling and Validation of Semantic Constraints for ebXML Business Process Specifications)

  • 김종우;김형도
    • Asia pacific journal of information systems
    • /
    • 제14권1호
    • /
    • pp.79-100
    • /
    • 2004
  • As a part of ebXML(Electronic Business using eXtensible Markup Language) framework, BPSS(Business Process Specification Schema) has been provided to support the direct specification of the set of elements required to configure a runtime system in order to execute a set of ebXML business transactions. The BPS,' is available in two stand-alone representations, a UML version and an XML version. Due to the limitations of UML notations and XML syntax, however, current ebXML BPSS specification fails to specify formal semantic constraints completely. In this study, we propose a constraint classification scheme for the BPSS specification and describe how to formally represent those semantic constraints using OCL(Object Constraint Language). As a way to validate p Business Process Specification(BPS) with the formal semantic constraints, we suggest a rule-based approach to represent the formal constraints and demonstrate its detailed mechanism for applying the rule-based constraints to the BPS with a prototype implementation.

Analyzing RDF Data in Linked Open Data Cloud using Formal Concept Analysis

  • Hwang, Suk-Hyung;Cho, Dong-Heon
    • 한국컴퓨터정보학회논문지
    • /
    • 제22권6호
    • /
    • pp.57-68
    • /
    • 2017
  • The Linked Open Data(LOD) cloud is quickly becoming one of the largest collections of interlinked datasets and the de facto standard for publishing, sharing and connecting pieces of data on the Web. Data publishers from diverse domains publish their data using Resource Description Framework(RDF) data model and provide SPARQL endpoints to enable querying their data, which enables creating a global, distributed and interconnected dataspace on the LOD cloud. Although it is possible to extract structured data as query results by using SPARQL, users have very poor in analysis and visualization of RDF data from SPARQL query results. Therefore, to tackle this issue, based on Formal Concept Analysis, we propose a novel approach for analyzing and visualizing useful information from the LOD cloud. The RDF data analysis and visualization technique proposed in this paper can be utilized in the field of semantic web data mining by extracting and analyzing the information and knowledge inherent in LOD and supporting classification and visualization.