• 제목/요약/키워드: 구조적 분류

검색결과 3,016건 처리시간 0.034초

식품정보 메타데이터 개발을 위한 연구 (A Study on Meta Data Development of Food Information)

  • 양혜정;이정률
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2011년도 춘계 종합학술대회 논문집
    • /
    • pp.389-390
    • /
    • 2011
  • 본 논문의 목적은 효과적인 식품정보 분류 체계 구축 및 관리를 위하여 식품정보의 메타데이터를 구축하고자 하는 것이다. 메타데이터는 데이터에 대한 데이터를 의미하며, 데이터의 분류체계, 구조, 내용요약을 함축적 의미로 표현하는 데이터이다. 이러한 메타데이터를 이용하여 식품정보를 체계적으로 분류하여 식품정보 조회, 분석, 활용을 위한 체계를 구축하였고, 식품정보에 대한 접근성을 향상시켰다. 따라서 본 논문을 통하여 식품정책, 식품산업, 식품기술 개발에 효과적인 정보를 제공하여 식품정보의 활용성 증대 및 효과적인 분류를 가능케 하였다.

  • PDF

다중 문서에서 구조 정보를 이용한 XML 조인 질의 처리 (XML Join Query Processing using Structured Information from Multiple Documents)

  • 정성호;김병곤;정헌석;이재호;임해철
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 가을 학술발표논문집 Vol.29 No.2 (1)
    • /
    • pp.100-102
    • /
    • 2002
  • XML 문서에 대한 다양한 질의를 위해서 W3C에서는 XQL, XML-QL, XML-GL, XQUERY와 같은 질의어를 제안하였다. 이들 질의어는 다양한 질의 유형의 분류와 표현은 가능하나, 조인 질의의 경우 단순 조인 질의만을 지원할 뿐, XML 문서의 구조나 텍스트 정보의 유사성을 이용한 보다 다양한 조인 질의에 대한 연구가 미비하였다. 본 논문에서는 다중 문서에 대한 조인 질의를 체계적이고 효과적으로 표현하기 위해, 문서에 대한 조인 질의를 여러 타입으로 분류하였다. 또한 효율적인 질의처리를 위하여 다양한 일반 조인 질의 및 정보검색 기능을 지원하는 유사성 조인 연산자(similarity join operator), 순수 구조 기반 조인을 지원하는 구조 조인 연산자(structured join operator)를 지원하도록 XML 질의어인 QUILT를 확장하였다. 특히, 구조 정보만을 이용한 질의시 구조의 깊이(depth)정보를 이용하여 사용자의 요구에 맞게 질의 검색 범위를 설정하고, XML 문서에 대한 질의 문을 좀더 간결하게 표현할 수 있도록 설계하였다.

  • PDF

문서의 의미적 구조정보를 이용한 특허 문서 분류 (Patent Document Categorization based on Semantic Structural Information)

  • 김재호;최기선
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2005년도 제17회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.28-34
    • /
    • 2005
  • 특허 검색은 수많은 특허 문서 중에서 특정 해당분야의 문서 집합 내에서 검색을 수행하기 때문에 정확한 특허 분류에 크게 의존하게 된다. 이러한 특허 분류의 중요성에 덧붙여, 특허 문서의 수가 빠르게 증가하게 되면서 특허를 자동으로 분류하려는 요구가 더욱 필요하게 되었다. 특허문서는 일반문서와는 달리 구조화되어 있기 때문에 특허분류를 하기 위해서는 이러한 점이 고려되어야 한다. 본 논문에서는 k-NN 방법을 이용하여 일본어 특허 문서를 자동으로 분류하는 방법을 제안한다. 훈련집합으로부터 유사문서를 검색할 때, 구조화되어 있는 특허 문서의 특징을 이용한다. 문서 전체가 아닌 (기존 기술), (응용 분야), (해결하고자 하는 문제), (문제를 해결하려는 방법) 등의 세분화된 요소끼리 비교하여 유사성을 계산한다. 특허 문서에는 사용자가 정의한 많은 의미 요소가 있기 때문에 먼저 이들을 군집화한 후에 이용한다. 실험 결과 제안한 방법이 특허문서를 그대로 이용하는 것보다는 74%, 특허문서에 나타난 <요약>, <청구항>, <상세한 설명>의 큰 구조 정보를 이용하는 것보다는 4%의 성능 향상을 가져왔다.

  • PDF

국내 생물산업의 구조분해분석 (An Input-output Structural Decomposition Analysis of Korean Biotechnology Industry)

  • 정미애;허은녕
    • KSBB Journal
    • /
    • 제18권5호
    • /
    • pp.356-362
    • /
    • 2003
  • 생물공학기술을 이용하여 제품과 서비스를 창출하는 산업을 생물산업이라고 한다. 우리나라는 1999년부터 산업자원부가 생물산업의 범위를 8개 부문으로 분류하고 있으나 산업분류와 제품 분류, 기술 분류의 기준이 섞여 있어 통계자료를 이용한 현황 파악이 어려운 실정이다. 본 연구에서는 국내 생물산업의 현황 파악을 위해 한국생물산업협회의 매출조사자료를 근거로 하였다. 국내 생물산업제품의 상당수가 기존 산업의 수요구조를 따르는 것으로 가정하고 1985-90-95년의 접속불변산업연관표에서 국내 생물산업분야를 생물의약분야, 생물화학분야, 바이오식품분야, 생물농업분야, 생물공정 및 환경분야의 6개 분야로 분류ㆍ선정하였다. 1985년에서 1995년 기간의 최종재수요구조, 중간재 수요구조, 수입구조 등의 변화가 산출액 변화에 미친 기여도를 분석하기위해 변화요인을 크게 경제성장에 의한 효과와 수요구조변화에 의한 효과로 나눈 후 수요구조변화에 Syrquin 구조분해모형을 이용하였다. 분석결과 생물산업의 세부 각 분야들은 다양한 성장배경을 가지고 있으며 바이오식품과 생물농업분야를 제외한 생물산업분야는 사회적 수요가 성장을 이끌어왔음을 확인하였다. 또한 각 분야별 민간수요변화에 대한 대응과 수입ㆍ수출구조의 개선이 산업 성장에 필요함을 알 수 있었다.

메가프로젝트를 위한 업무분류체계기준(WBS Basis) 개발 (Development of Work Breakdown Structure Basis for Mega-Project)

  • 이희덕;서용칠;이승훈;우유미
    • 한국건설관리학회:학술대회논문집
    • /
    • 한국건설관리학회 2008년도 정기학술발표대회 논문집
    • /
    • pp.441-444
    • /
    • 2008
  • 메가프로젝트(Mega-Project)는 다양한 유형의 시설군을 복합 개발하는 건설사업으로서 규모가 크고 복잡한 경우가 많기 때문에 종합적인 사업관리에 어려움이 따른다. 따라서 메가프로젝트는 기존의 단위프로젝트 수준이 아닌 프로그램 수준에서의 관리체계를 필요로 하며 그에 적합한 업무분류체계(WBS)를 구축해야 한다. 업무분류체계는 사업관리를 위한 전체적인 구조를 수립하는 기반으로서, 현재 프로그램 관리 수준의 업무분류체계의 기준이 갖추어지지 않은 상황이다. 이에 본 연구에서는 메가프로젝트를 위한 업무분류체계기준(WBS Basis)를 개발하여 메가프로젝트의 업무분류체계 구축을 지원하고자 한다. 메가프로젝트 생애주기에 포함되는 전체 시설군, 업무 및 용역, 기록문서, 정보 등을 대상으로 하였으며, 기존 사례분석과 관련 분류체계들을 바탕으로 초안을 작성하였다. 이후 현장시험을 통한 검증을 거쳐 최종 업무분류체계기준을 완성하였고 분류내용과 활용방안을 소개한다.

  • PDF

연관규칙을 이용한 뉴스기사의 계층적 자동분류기법 (Hierarchical Automatic Classification of News Articles based on Association Rules)

  • 주길홍;신은영;이주일;이원석
    • 한국멀티미디어학회논문지
    • /
    • 제14권6호
    • /
    • pp.730-741
    • /
    • 2011
  • 인터넷과 컴퓨터 기술이 발전함에 따라 정보의 양이 폭발적으로 증가하였으며 사용자의 다양한 요구가 생겨나게 되었다. 이로 인해 대용량의 문서를 효과적으로 분류하기 위한 다양한 방법의 연구가 필요하게 되었다. 기존의 문서 범주화는 분서의 분류를 위해 연관된 문서의 키워드를 중심으로 하는 방법을 사용하였다. 그러나 본 논문에서는 연관규칙을 이용하여 범주 내의 문서들 간에 연관성 있는 키워드들의 집합을 추출하고 각 범주 별로 의미적으로 대표성을 가진 키워드들로 분류 규칙을 생성한다. 또한 효율적인 키워드 생성을 위한 데이터 전처리 방안을 제시하고, 새로운 문서 범주를 예측한다. 프로파일의 분류성능을 높이기 위한 분류함수를 설계하고 실험을 통하여 성능을 측정한다. 마지막으로 평면적인 범주 구조에서 확장하여 계층적인 분류체계 구조에서도 적용할 수 있는 자동분류 방안을 제시한다.

온톨로지 기반의 지식맵 서비스 시스템의 설계 및 구현

  • 김정민;박철만;정준원;이한준;정호영;민경섭;김형주
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 봄 학술발표논문집 Vol.30 No.1 (A)
    • /
    • pp.527-529
    • /
    • 2003
  • 지식관리시스템의 지식 분류 체계가 지식맵이며 이 지식맵을 이용하여 지식 서비스가 제공된다. 그러나 현재의 지식맵은 비표준적인 지식 네트웍 구조와 정적인 분류체계라는 문제를 가진다. 문제 해결 방법은 지식맵에 온틀로지를 적용해서 표준성, 의미 기반의 지식 네트웍 구조. 동적인 지식분류, 자동화된 지식서비스를 제공하는 새로운 개념의 지식맵을 구현하는 것이다. 본 논문에서는 토픽맵 모델을 기반으로 온톨로지를 생성, 저장, 검색하는 효율적인 온톨로지 관리 시스템인 K-Box를 구현하였다. K-Box는 온톨로지 관리를 위한 기본적인 기능들을 제공하며, 이질적인 저장소들을 일관된 인터페이스로 접근할 수 있도록 함으로써 저장 장치 독립성을 제공하였다. 또한, 저장 관리되는 모든 온톨로지들의 무결성을 보장하기 위한 새로운 기법과 사용자 관심을 중심으로 한 온톨로지 검색 지원을 위한 방법을 제안하였다. 마지막으로, 우리는 여러 온톨로지들을 적용해 봄으로써 K-Box 시스템이 효율적으로 사용 가능함을 확인하였다.

  • PDF

설계패턴의 효율적 분류와 관리 (Efficient Classification and Management of Design Patterns)

  • 한정수;김귀정
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2004년도 추계 종합학술대회 논문집
    • /
    • pp.389-394
    • /
    • 2004
  • 본 논문에서는 디자인 패턴을 분류하기 위해 패턴구조의 특성을 가지고 분류하였다. 그리고 클러스터링에 의한 분류는 패싯 분류에 의한 방법보다 높은 정확도를 보여주었다. 따라서 자동화된 분류방법인 클러스터링 알고리즘을 사용하여 디자인 패턴을 분류하는 것이 효과적이라 할 수 있다. 디자인 패턴의 분류는 검색 시 유사한 패턴들이 같은 카테고리에 저장이 되므로 유사패턴을 비교하여 사용할 수 있으며, 패턴 클러스터링에 의해 분류되고, 패턴의 링크정보를 이용하여 저장하므로 저장소를 효율적으로 관리할 수 있다.

  • PDF

포섭 구조기반 OVR SVM 결합을 통한 다중부류 암 분류 (Multi-class Cancer Classification by Integrating OVR SVMs based on Subsumption Architecture)

  • 홍진혁;조성배
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2006년도 한국컴퓨터종합학술대회 논문집 Vol.33 No.1 (A)
    • /
    • pp.37-39
    • /
    • 2006
  • 지지 벡터 기계(Support Vector Machine; SVM)는 기본적으로 이진분류를 위해 고안되었지만, 최근 다양한 분류기 생성전략과 결합전략이 고안되어 다중부류 분류에도 적용되고 있다. 본 논문에서는 OVR(One-Vs-Rest) 전략으로 생성된 SVM을 NB(Naive Bayes) 분류기를 이용하여 동적으로 구성함으로써, OVR SVM을 이용한 다중부류 분류 시스템에서 자주 발생하는 동점을 효과적으로 해결하는 방법은 제안한다. 이 방법을 유전발현 데이터를 이용한 다중부류 암 분류에 적용하였는데, 고차원의 데이터로부터 NB 분류기 구축에 유용한 유전자를 선택하기 위해 Pearson 상관계수를 사용하였다. 14개의 암 유형과 16,063개의 유전발현 수준을 가지는 대표적인 다중부류 암 분류 데이터인 GCM 암 데이터에 적용하여 제안하는 방법의 유용성을 확인하였다.

  • PDF