• 제목/요약/키워드: 의미적 유사도

검색결과 1,585건 처리시간 0.03초

A Multimedia Data Search System using Indexing Agent (인덱싱 에이전트를 이용한 멀티미디어 데이터 검색시스템)

  • Ko, Jae-Woon
    • Proceedings of the KAIS Fall Conference
    • /
    • 한국산학기술학회 2010년도 춘계학술발표논문집 1부
    • /
    • pp.487-490
    • /
    • 2010
  • 비디오 데이터를 효율적으로 처리하기 위해서는 비디오 데이터가 가지고 있는 내용에 대한 정보를 데이터베이스에 저장하고 사용자들의 다양한 질의를 처리할 수 있는 의미기반 검색 기법이 요구된다. 기존의 내용기반 비디오 검색 시스템들은 주석기반 검색 또는 특징기반 검색과 같은 단일 방식으로만 검색을 하므로 검색 효율이 낮을 뿐 아니라 완전한 자동 처리가 되지 않아 시스템 관리자나 주석자의 많은 노력을 요구한다. 본 논문에서는 주석기반 검색과 특징기반 검색을 이용하여 대용량의 비디오 데이터에 대한 사용자의 다양한 의미검색을 지원하는 에이전트 기반에서의 자동화되고 통합된 비디오 의미기반 검색 시스템을 제안한다. 사용자의 기본적인 질의와 질의에 의해 추출된 키 프레임의 이미지를 선택함으로써 에이전트는 추출된 키 프레임의 주석에 대한 의미를 더욱 구체화시킨다. 또한, 사용자에 의해 선택된 키 프레임은 질의 이미지가 되어 제안하는 특징기반 검색기법을 통해 가장 유사한 키 프레임을 검색한다. 따라서 의미기반 검색을 통해 비디오 데이터의 검색의 효율을 높일 수 있도록 시스템을 설계한다.

  • PDF

Selecting Model of Head in Support Verb Constructions for Phrase-Pattern-based Korean-to-English Machine Translation (구 단위 패턴 기반 한영 기계 번역에서의 기능동사 구문의 중심어 선택 모델)

  • Kim, Hae-Gyung;Chae, Young-Soog;Choi, Key-Sun
    • Annual Conference on Human and Language Technology
    • /
    • 한국정보과학회언어공학연구회 1999년도 제11회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.203-208
    • /
    • 1999
  • 한국어는 잉여성과 중의성의 범 언어적인 특징과 함께 다른 언어에 비해 주어의 생략이 두드러지며 어순이 자유롭기 때문에 구문 형식의 지배를 덜 받는다는 개별적인 특성을 지닌다. 이러한 특성으로 인해 기계번역의 패턴을 추출할 때 서로 유사 가능성이 있는 패턴에 대한 고려가 없이는 같은 의미의 서로 다른 여러 개의 패턴을 모두 하나의 패턴으로 처리하는 오류를 범할 위험이 있다. 본 연구에서 사용되는 구 단위 패턴은 동사구, 명사구, 형용사구 그리고 부사구를 중심으로 한국어 패턴, 패턴 대표 카테고리, 한국어 패턴의 중심어 및 제약조건 대역영어패턴 의미코드로 나뉜다. 범 언어적인 특성의 한국어와 영어간 격차를 해소하기 위해 각각의 명사에 의미코드를 사용하여 다중 언어기반 체계를 구축하였으며. 한국어의 개별적인 특성으로 인해 발생하는 문제를 해소하기 위해 중심어 부과 자질을 사용하였다. 중심어 부과 자질에 있어서, 특히 술어기능명사를 중심어로 하는 기능동사 '하-' 구문은 다른 동사 구문의 형식과는 달리 논항의 수와 형태를 동사가 아닌 명사가 수행하게 된다. 이러한 특징에 대한 변별적인 자질 부여는 구문의 형태-통사적 특징 뿐만이 아니라 의미적인 고유의 특성까지도 잘 뒷받침하면서 패턴 추출에 월등한 효율성을 제시할 수 있다. 향후 이에 대한 연구는 전반적인 기능동사 구문뿐만이 아니라 개별적인 특징을 보이는 모든 구문에 대한 연구로 확대되어 패턴 기반 기계번역의 패턴 추출에 기본적인 정보의 역할을 담당해야 할 것이다.

  • PDF

Study for Evaluation of Discharge and Sediment Considering of Characterastics of River Basin (하천 유역 특성을 고려한 유량 및 유사량 산정에 관한 연구)

  • Shin, Han-Man;Choi, Gye-Woon;Kim, Gwang-Nam;Jung, Jae-Kwang
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 한국수자원학회 2011년도 학술발표회
    • /
    • pp.347-347
    • /
    • 2011
  • 하천에서의 유사량의 추정은 하천유사 해결을 위한 자료획득이 기본이고, 하천내의 수리구조물의 설계 및 유지관리, 하천개수 및 하도의 안정, 홍수터 관리, 저수지의 설계 및 운영 등 하천계획에 필요한 기본적 요소 중 하나이다. 유사량을 추정하는 방법은 Einstein(1950) 공식이나 Toffaleti(1968) 공식 등과 같은 하천 유사량 공식을 이용한 간접적인 계산방법과 현장 실측을 통한 직접적인 방법이 있다. 그러나 유사량 공식을 이용한 추정은 아직도 그 신뢰성이 떨어지며, 대부분의 기존 유사량 공식들이 하상토 유사량을 위주로 추정하여, 소류사가 지배적인 경우에는 이런 공식들을 이용하여도 어느 정도 신뢰성이 확보되는 결과를 얻을 수 있을 것으로 판단되나, 부유사가 지배적인 하천의 경우 정확도가 많이 떨어지는 것으로 알려져 있다. 따라서, 현재까지 가장 신뢰할 수 있는 방법은 현장실측에 의한 방법이며, 유사량 공식은 부득이한 경우에만 이용하는 것이 바람직하다. 실측 유사량 산정을 위하여 하천 규모에 따라 구분하였으며, 국가하천인 경우 임진강을 대상으로 민간인 출입이 가능한 구간(L = 84.5km), 중소규모하천인 경우 안성천 수계의 황구지천과 인천의 계양천을 대상으로 하였고, 임진강의 경우에는 부유사의 대부분이 이토나 점토로 구성되어 있고 중 상류에서 하상재료의 구성이 대체로 호박돌이나 암반으로 이루어진 부분이 많아 주로 모래로 이루어진 충적하천에서 이용되는 수정 Einstein(1955) 방법에 의한 총 유사랑 추정은 의미가 없기 때문에(한국건설기술연구원, 1992) 본 조사에서는 임진강의 총유사량을 부유사양으로 간주하였으며 다른 유사량 공식을 이용한 부유사량과 비교를 통하여 공식을 제안하였다. 유사량 측정은 하천별로 2007년부터 2009년까지 평수기와 홍수기로 구분하여 측정하였으며, 수리량과 하상토자료를 이용하여 종유사량을 산정하는 Einstein(1950) 공식, Rijn(1984) 공식, Toffaleti(1968) 공식, Shen & Hung(1971) 공식, Yang(1973) 공식, Yang(1979)공식, Ackers & White(1973) 공식, Engelud & Hansen(1967) 공식, Ranga Raju(1981) 공식을 이용하여 결과 값을 비교하였다.

  • PDF

A Study on Similarity Calculation Method Between Research Infrastructure (국가연구시설장비의 유사도 판단기법에 관한 연구)

  • Kim, Yong Joo;Kim, Young Chan
    • KIPS Transactions on Software and Data Engineering
    • /
    • 제7권12호
    • /
    • pp.469-476
    • /
    • 2018
  • In order to jointly utilize research infrastructure and to build efficient construction, which are essential in science and technology research and development process. Although various classification methods have been introduced for efficient utilization of registered information, functions that can be directly utilized such as similar research infrastructure search is not yet been implemented due to limitations of collection information. In this study, we analyzed the similar search technique so far, presented the methodology for the calculation of similarity of research infrastructure, and analyzed the learning result. Study suggested that a technique can be use to extract meaningful keywords from information and analyze the similarity between the research infrastructure.

Design and Implementation of Similar Document Merging System (유사 문서 병합 시스템의 설계 및 구현)

  • Park, Woo-Ri;Kwon, In-Teak;Kim, Jong-Ik
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 한국정보과학회 2011년도 한국컴퓨터종합학술대회논문집 Vol.38 No.1(C)
    • /
    • pp.164-167
    • /
    • 2011
  • 인터넷의 지속적인 발전에 따라 다양한 출처와 경로를 통해 많은 정보가 빠른 속도로 생산, 확산되고 있다. 이로 인해 중복되거나 유사한 정보들이 빈번하게 발생되고 있으며, 이러한 문제를 해결하기 위한 내용이 유사한 문서를 찾는 연구들이 많이 진행되고 있다. 유사 문서 병합에서 유사 문서를 판별하기 위해 문서 간 공통된 단어의 비율을 이용한다. 하지만 동일한 단어가 다양한 형태로 표현될 수 있어 공통된 단어의 비율만을 가지고 유사 문서를 판단하기 어렵다. 본 논문에서는 유사한 의미를 갖는 단어들을 동일한 단어로 변환하여 유사 문서들을 병합하는 시스템을 제안하고 구현 사항에 대해 설명한다.

Product Planning using Similarity Analysis Technique Based on Word2Vec Model (Word2Vec 모델 기반의 유사도를 이용한 상품기획 모델)

  • Ahn, Yeong-Hwi;Park, Koo-Rack
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 한국컴퓨터정보학회 2021년도 제63차 동계학술대회논문집 29권1호
    • /
    • pp.11-12
    • /
    • 2021
  • 소비자가 남긴 댓글이나 상품평은 상품기획의 주요 정보가 될 수 있다. 본 논문에서는 버티컬 무소음 마우스 7,300개에 대한 온라인 댓글을 딥러닝 기술인 Word2Vec을 이용하여 유사도 분석을 시행하였다. 유사도 분석결과 클릭 키워드에 대한 장점으로 소리(.975), 버튼(.972), 무게(.971)가 분석되었으며 단점은 가볍다(.959)이었다. 이는 구매 상품에 대한 소비자의 의견, 태도, 성향 및 서비스에 대한 포괄적인 의견들을 데이터화 하여 상품의 특징을 분석할 수 있는 의미있는 과정 이라고 볼 수 있다. 상품기획 프로세스에 딥러닝 기술을 통한 소비자의 감성분석자료 포함시키는 전략을 적용한다면 상품기획의 시간과 비용투자의 경제성을 높일 수 있고 나아가 빠르게 변화하는 소비자의 요구사항을 적기에 반영할 수 있을 것으로 생각된다.

  • PDF

Based on Semantic Web Service A Community Information Retrieval System (시맨틱 웹 서비스 기반 커뮤니티 정보 검색 시스템)

  • Kim, Tae-Hwan;Jeon, Ho-Chul;Choi, Joong-Min
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 한국정보과학회 2008년도 한국컴퓨터종합학술대회논문집 Vol.35 No.1 (C)
    • /
    • pp.299-304
    • /
    • 2008
  • 웹 기반 자료들이 폭발적으로 증가함에 따라 적합한 자료들에 보다 효과적으로 접근할 수 있는 방법이 요구되고 있다. 이러한 새로운 방법들 중의 하나로 제한 검색이 점보 검색 분야에서 제시되었다. 제한 검색은 현재 입력한 검색어의 검색결과를 줄이고자 할 때 이용하는 검색방식으로 전체 문장을 포함하는 자료나 출판 년도, 특정 저널로 제한하여 검색할 수 있으며 일반적인 검색어로 검색할 경우 제한을 주어 결과물을 최대한 줄일 수 있도록 지원하고 있다. 하지만 이러한 검색 방법은 검색의 범위를 URL에 의해 명시되는 사이트 또는 도메인들로만 제한할 수 있을 뿐이며 의미적으로 관련된 사이트들로 제한할 수 없다. 본 논문에서는 정보의 공유를 목적으로 하는 커뮤니티를 시맨틱 웹 서비스(Semantic Web Services) 기술을 이용하여 플랫폼에 상관없이 사용자 검색 질의와 가장 유사한 커뮤니티를 의미적으로 식별해 내고 커뮤니티 내의 정보 중 질의와 관련된 정보를 검색결과로 도출할 수 있는 구조를 제안한다.

  • PDF

Automatic Generic Summarization Based on Non-negative Semantic Variable Matrix (비음수 의미 가변 행렬을 기반으로 한 자동 포괄적 문서 요약)

  • Park Sun;Lee Ju-Hong;Ahn Chan-Min;Park Tae-Su;Kim Deok-Hwan
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 한국정보과학회 2006년도 한국컴퓨터종합학술대회 논문집 Vol.33 No.1 (A)
    • /
    • pp.391-393
    • /
    • 2006
  • 인터넷의 급속한 확산과 대량 정보의 이동은 문서의 요약을 더욱 필요로 하고 있다. 본 논문은 비음수 행렬 인수분해로(NMF, non-negative matrix factorization) 얻어진 비음수 의미 가변 행렬(NSVM, non-negative semantic variable matrix)을 이용하여 자동으로 포괄적 문서요약 하는 새로운 방범을 제안하였다. 제안된 방법은 인간의 인식 과정과 유사한 비음수 제약을 사용한다. 이 결과 잠재의미색인에 비해 더욱 의미 있는 문장을 선택하여 문서를 요약할 수 있다. 또한, 비지도 학습에 의한 문서요약으로 사전 전문가에 의한 학습문장이 필요 없으며, 적은 계산비용을 통하여 쉽게 문장을 추출할 수 있는 장점을 갖는다.

  • PDF

A Study on Color Image Grouping Method based on Color Objects (객체가 있는 칼라 영상에 대찰 객체별 그룹핑 방법에 대한 연구)

  • 김성영;박창민;권규복;김민환
    • Proceedings of the Korea Multimedia Society Conference
    • /
    • 한국멀티미디어학회 2001년도 춘계학술발표논문집
    • /
    • pp.128-132
    • /
    • 2001
  • 본 논문에서는 객체가 포함되어 있는 칼라 영상들의 집합으로부터 유사한 시각적 특징을 가진 캑체를 공통적으로 포함하는 영상들을 추출하여, 전체 영상들을 소수의 그룹으로 묶을 수 있는 방법을 제안한다. 먼저 영상에 포함된 객체는 주로 영상의 내부 위치에 나타난다는 사실에 착안하여, 영상의 경계와 접하지 않는 비경계 영역들을 병합하여 객체가 포함된 영역으로 간주한다. 그러나, 병합된 내부 영역에는 객체가 아닌 영역들도 포함하고 있을 수 있으므로, 칼라 히스토그램만을 이용하여 내부 영역에 대한 특징으로 이용한다. 이러한 내부 영역의 칼라 특징들이 분포하는 형상을 분석하여 밀집도가 높은 클러스터를 그룹으로 추출한다. 이때, 밀집도는 일반적으로 사용하는 공간적인 분포 대신에 히스토그램 인터섹션에 의한 유사도를 이용하여 정의한다. 즉, 서로 유사도가 놓은 것들이 집중되어 분포되어 있는 경우에 밀집도가 높은 클러스터로 간주하여 추출하는 방법을 사용한다. 클러스터의 형상 및 개수를 자동적으로 결정할 수 있는 방법도 제안한다. 실험에 의해, 추출한 클러스터의 칼라 영상들이 동일한 객체를 포함하고 있음을 알 수 있었으나, 향후 보다 안정화된 방법의 개발이 필요하다. 아울러, 클러스터별로 객체의 의미를 부여할 수 있는 방법론의 개발도 필요함을 알 수 있었다.

  • PDF

Empirical Research on Segmentation Method for Korean Dependency Parsing (한국어 의존 구문 분석의 분석 단위에 관한 실험적 연구)

  • Lee, Jinu;Jo, Hye Mi;Bock, Suyeon;Shin, Hyopil
    • Annual Conference on Human and Language Technology
    • /
    • 한국정보과학회언어공학연구회 2021년도 제33회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.427-432
    • /
    • 2021
  • 현재 한국어 의존 구문 분석의 표준은 어절 단위로 구문 분석을 수행하는 것이다. 그러나 의존 구문 분석의 분석 단위(어절, 형태소)에 대해서는 현재까지 심도 있는 비교 연구가 진행된 바 없다. 본 연구에서는 의존 구문 분석의 분석 단위가 자연어 처리 분야의 성능에 유의미한 영향을 끼침을 실험적으로 규명한다. STEP 2000과 모두의 말뭉치를 기반으로 구축한 형태소 단위 의존 구문 분석 말뭉치를 사용하여, 의존 구문 분석기 모델 및 의존 트리를 입력으로 활용하는 문장 의미 유사도 분석(STS) 및 관계 추출(RE) 모델을 학습하였다. 그 결과, KMDP가 기존 어절 단위 구문 분석과 비교하여 의존 구문 분석기의 성능과 응용 분야(STS, RE)의 성능이 모두 유의미하게 향상됨을 확인하였다. 이로써 형태소 단위 의존 구문 분석이 한국어 문법을 표현하는 능력이 우수하며, 문법과 의미를 연결하는 인터페이스로써 높은 활용 가치가 있음을 입증한다.

  • PDF