• Title/요약/키워드: 의미적 유사도

Search Result 1,585, Processing Time 0.032 seconds

Measuring Web Page Similarity using Tags (태그를 이용한 웹 페이지간의 유사도 측정 방법)

  • Kang, Sang-Wook;Lee, Ki-Yong;Kim, Hyeon-Gyu;Kim, Myoung-Ho
    • Journal of KIISE:Databases
    • /
    • v.37 no.2
    • /
    • pp.104-112
    • /
    • 2010
  • Social bookmarking is one of the most interesting trends in the current web environment. In a social bookmarking system, users annotate a web page with tags, which describe the contents of the page. Numerous studies have been done using this information, mostly on enhancing the quality of web search. In this paper, we use this information to measure the semantic similarity between two web pages. Since web pages consist of various types of multimedia data, it is quite difficult to compare the semantics of two web pages by comparing the actual data contained in the pages. With the help of social bookmarks, this comparison can be performed very effectively. In this paper, we propose a new similarity measure between web pages, called Web Page Similarity Based on Entire Tags (WSET), based on social bookmarks. The experimental results show that the proposed measure yields more satisfactory results than the previous ones.

Design of Content-based Image Retrival System using Multilevel Metadata (다계층 메타데이타 기반 이미지 내용검색 시스템 설계)

  • 신용수;홍성용;나연묵
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2002.10c
    • /
    • pp.142-144
    • /
    • 2002
  • 대부분의 내용기반 이미지 검색 시스템은 이미지의 특징 벡터인 색상, 모양, 그리고 질감에 의해서 유사한 이미지를 검색하는 기법을 제공하고 있다. 최근 이러한 내용기반 이미지 검색 기술은 의료 영상 이미지와 같은 다양한 분야에 적용되고 있으며, 이에 따라서 의료 이미지를 분석하여 저장, 검색하기 위한 데이터베이스 시스템이 증가하고 있다. 그러나, 대량의 이미지로부터 원하는 이미지를 검색하기 위해서는 이미지의 메타데이타를 효율적으로 표현해야 하며, 의미성과 이미지의 특징 데이터를 통합적으로 저장 관리 할 수 있는 이미지 데이터베이스를 설계하고 구축해야만 한다. 본 논문에서는 기존의 내용기반 이미지 검색 기법을 살펴보고. 이미지를 내용기반으로 분류하고 저장할 수 있는 데이터베이스 시스템을 설계하여 효율적인 의미기반 검색을 지원말 수 있는 모델을 제시한다. 다계층 메타데이타 레이어 구조로 이미지에 대한 개념 지식 모델을 표현하고, 이미지내의 객체를 메타데이타로 표현하여 분류할 수 있는 모델을 제안한다. 또한, 이미지 내용검색을 지원하기 위한 시스템 구조를 설계하고, 메타데이타가 저장되기 위한 관계형 모델을 스타 스키마의 형태로 제시한다. 제안된 방법은 의미적인 이미지 내용 검색 방법의 지원에 활용될 수 있다.

  • PDF

Tag Ranking System based on Semantic Similarity of Tag-pair (태그쌍의 의미유사도 기반 태그 랭킹 시스템)

  • Lee, Si-Hwa;Hwang, Dae-Hoon
    • Journal of Korea Multimedia Society
    • /
    • v.16 no.11
    • /
    • pp.1305-1314
    • /
    • 2013
  • The existing tag based system deducts a retrieval result with low accuracy through the usage of a single tag matching by using tags tagged in contents. And the system doesn't provide effectively contents related information which the tags have, as the users place tags on contents without considering the priority and associative relation between tags. For a solve of above problems, this paper suggests a tag ranking system which extracts semantic similarity between tags and re-ranks the tags tagged in contents. In order to evaluate the performance of suggested system, this paper experiments and compares the ranking result of this paper's tag ranking system with the result of baseline method using tags tagged in images and frequency method adapting tag co-appearance frequency.

Development and application of cohesive sediment transport model (점착성 유사의 이동 모형화 및 적용)

  • Son, Min-Woo;Lee, Guan-Hong
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2011.05a
    • /
    • pp.331-335
    • /
    • 2011
  • 흔히 진흙으로 불리는 점착성 유사는 모래 등의 비점착성 유사와는 다른 특성을 보인다. 가장 큰 특징은 점착력에 의해 서로 엉겨 붙어 큰 덩어리(플럭)를 형성하고 다시 큰 플럭이 파괴되는 과정인 응집현상(Flocculation Process)을 보인다는 것이다. 이 응집현상의 과정을 통해 플럭은 크기 및 밀도를 지속적으로 변화시킨다. 크기 및 밀도의 변화는 플럭의 침강속도를 변화시켜 점착성 유사의 부유, 퇴적, 이송, 확산의 과정에 직접적인 영향을 미친다. 응집현상은 플럭의 침강속도 뿐 아니라 부피농도와 질량농도 사이의 비선형적 관계를 야기하여 흐름 운동량 방정식 유도, 난류의 모형화 등에서도 비점착성 유사와 다른 방향으로 진행된다. 점착성 유사가 우세한 지역의 또 다른 특성은 자기하중에 의한 압밀현상에 따라 발생하는 가변적인 한계소류력이다. 따라서 점착성 유사의 이동을 모형화 하는 과정에서는 가변적인 침식율의 가정 등을 통해 이에 대한 고려가 반드시 이루어져야 한다. 흐름의 운동량 방정식 및 난류 모형에서는 플럭의 부피 농도와 질량농도가 각 항의 물리적 의미에 부합하도록 개별적으로 선택 및 적용되어야 질량보존의 문제 등으로 발생할 수 있는 계산상의 오류를 배제할 수 있다. 적용 결과, 점착성 유사가 우세한 지역에서 나타나는 높은 부유 및 흐름정체기에서의 부유사 존재 등의 특성이 점착성 유사 이동을 위한 모형에서 보다 합리적으로 계산된다는 사실이 확인되었다. 그리고 비점착성 유사에 적합한 이동 모형이 점착성이 우세한 지역에 적용될 경우, 상황에 따라 유사량을 과대 및 과소 산정할 수 있다는 결론이 도출되었다. 조류의 영향이 존재하는 하구부의 경우에는 조류의 형태와 비대칭성에 따라 유사량의 차이가 큰 것으로 나타났다. 조류의 형태는 주로 하구부의 지형에 의해 결정되므로 준설, 매립, 확폭 등과 같은 하구부에서의 사업이 진행되는 경우, 유사량 변화에 대한 고려가 반드시 이루어져야 할 것으로 판단된다.

  • PDF

Hierarchical Overlapping Document Clustering for Efficient Categorization of Semantic Information (의미정보의 효율적인 분류를 위한 계층적 중복 문서 클러스터링)

  • 강동혁;주길홍;이원석
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2001.10a
    • /
    • pp.175-177
    • /
    • 2001
  • 기존의 문서 클러스터링 알고리즘은 모든 문서가 각각 하나의 클러스터에만 할당되도록 설계되어 문서에 여러 개의 주제가 포함되어 있을지라도 문서는 유사도 비교에 의해 오직 하나의 플러스터에 포함된다는 단점이 있다. 본 연구에서는 이러한 문서 플러스터링 방법의 한계를 파악하기 위해 문서가 여러 개의 클러스터에 포함될 수 있는 계층적 중복 문서 클러스터링을 제안한다. 또한, 문서 클러스터링의 정확도를 높이기 위해서 불용어 제거 알고리즘을 이용해 불용어를 제거하여 클러스터링에 사용되는 키워드를 선별하고, 단어가중치 산출을 위한 TF*NHDF 공식을 제안한다.

  • PDF

A Study on the Integration of Similar Sentences in Atomatic Summarizing of Document (자동초록 작성시에 발생하는 유사의미 문장요소들의 통합에 관한 연구)

  • Lee, Tae-Young
    • Journal of the Korean Society for Library and Information Science
    • /
    • v.34 no.2
    • /
    • pp.87-115
    • /
    • 2000
  • The effects of the Case, Part of Speech, Word and Clause Location, Word Frequency etc. were studied in discriminating the similar sentences of the Korean text. Word Frequency was much related to the discrimination of similarity and Tilte word and Functional Clause were little, but the others were not. The cosine coefficient and Salton'similarity measurement are used to measure the similarity between sentences. The change of clauses between each sentence is also used to unify the similar sentences into a represenative sentence.

  • PDF

Similar Verb Words Extraction based on their Case Frame Structure (격틀 구조에 기반한 유사 동사 추출)

  • Cho, Junghyun;Jung, Hyunki;Kim, Yu-Seop
    • Annual Conference on Human and Language Technology
    • /
    • 2009.10a
    • /
    • pp.219-224
    • /
    • 2009
  • 한국어 Propbank를 구축하기 위해서는 유사 동사를 군집화하고 군집에 포함되는 동사들의 구문 및 의미 특성을 모아놓은 정보가 필요하다. 본 연구에서는 이러한 군집화의 초기 단계로써 개별 동사들의 격틀 구조에 기반하여 동사간의 유사도를 추정하여 유사 동사를 추출하고자 하였다. 본 연구는 개별 동사의 격틀 정보를 추출하기 위하여 세종 계획의 용언 사전과 KAIST 언어자원의 동사 격틀 사전을 활용하였다. 또한 격틀을 세분화하여 보다 상세한 격틀 정보를 생성하기 위하여 격틀이 가지고 있는 논항의 특성을 활용하였다. 동사의 유사도를 측정하기 위하여 개별 동사들은 벡터로 표현하였고, 벡터의 원소는 해당 동사가 다른 동사와 세분화된 격틀을 공유하는 정도로 하였다. 실험에서는 두 용언 사전에서 개별적으로 위의 과정을 진행하여 각 동사와 유사한 동사들을 추출하였다.

  • PDF

A Hot Coil Quality Design Su, pp.rt System using Case Based Reasoning (사례기반추론을 이용한 열연제품 품질설계지원시스템)

  • 고영관;박상혁;서민수;임여종
    • Journal of Intelligence and Information Systems
    • /
    • v.3 no.1
    • /
    • pp.101-109
    • /
    • 1997
  • 철강제품의 품질설계란 제품의 주문요구조건을 만족시키기 위해 제품의 성분 및 생산공정을 결정하는 과정을 의미한다. 본 연구에서는 품질설계업무를 지원하기 위한 시스템을 개발하였다. 설계업무의 특성을 고려하여 과거사례를 설계에 이용하기 위해, 사례기반추론(Case-based Reasoning)접근방법을 이용하였다. 본 연구에서는 또한 유사사례의 효율적 검색을 위해 품질설계 문제에 적합한 유사성척도를 제안하고 있으며, 문제에 적합한 유사성척도를 제안하고 있으며, 문제에 적합한 지식관리 방법 및 설계조정 방법을 개발하였다.

  • PDF

Study of the Simulation of VoIP Traffic Generation with Considering Self-Similiarity (자기유사성을 고려한 VoIP 트래픽 생성 시뮬레이션 방법 의 연구)

  • 김윤배;이계신;김재범
    • Proceedings of the Korea Society for Simulation Conference
    • /
    • 2004.05a
    • /
    • pp.25-29
    • /
    • 2004
  • VoIP는 인터넷 프로토콜(IP)를 이용하여 음성을 데이터 packet처럼 전송하는 것을 의미한다. 최근 VoIP 기술의 도입으로 기존 망 성능 관리에 대한 관심이 높아지고 있다. 보다 원활한 기술 구현을 위해서는 VoIP 트래픽에 대한 체계적인 분석과 위험성 검증을 할 수 있는 도구가 필요하다. 또한 기존의 트래픽 시뮬레이션 기법에서 실제 망에서의 자기유사성을 적용한 사례가 적다는 것 또한 본 연구가 행하여진 동기이다. 본 연구에서는 자기유사성을 반영하여 소량의 샘플을 갖고 전체 VoIP 망 트래픽을 생성할 수 있는 방법론을 개발하고자 시도하였다.

  • PDF

Design and Implementation of Computational Model Simulating Language Phenomena in Lexical Decision Task (어휘판단 과제 시 보이는 언어현상의 계산주의적 모델 설계 및 구현)

  • Park, Kinam;Lim, Heuiseok;Nam, Kichun
    • The Journal of Korean Association of Computer Education
    • /
    • v.9 no.2
    • /
    • pp.89-99
    • /
    • 2006
  • This paper proposes a computational model which can simulate peculiar language phenomena observed in human lexical decision task. The model is designed to mimic major language phenomena such as frequency effect, lexical status effect, word similarity, and semantic priming effect. The experimental results show that the propose model replicated the major language phenomena and performed similar performance with that of human in LDT.

  • PDF