• 제목/요약/키워드: 의미적 유사도

검색결과 1,583건 처리시간 0.035초

의미 기반 검색을 위한 이미지 내용 모델링 (Image Content Modeling for Meaning-based Retrieval)

  • 나연묵
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제30권2호
    • /
    • pp.145-156
    • /
    • 2003
  • 현존하는 대부분의 내용 기반 이미지 검색 시스템은 칼라, 모양, 텍스처 특징을 이용한 유사도-기반 검색에 초점을 맞추고 있다. 신경과학 이미지 데이타베이스의 경우, 이미지에 대한 전역적 평균 특징 값을 기반으로 한 유사 이미지의 검색이 임상 병리학자들에게는 전혀 도움이 되지 않는 다는 것을 발견하였다. 신경과학 데이터베이스 상의 이미지에 대한 실용적인 내용 기반 검색을 실현하기 위해서는 이미지의 내부 내용이나 의미를 표현하는 일이 필요하다. 본 논문에서는 이러한 이미지들에 대해 보다 유용한 검색을 지원하기 위하여 이미지 내용과 그에 관련된 개념 지식을 표현하는 방법을 제시한다. 또한 객체지향 메시지 경로 식을 이용하여 이러한 고급 검색을 지원하기 위한 연산의 의미를 기술한다. 제안된 기법은 유연하고 확장 가능하므로 보다 강화된 내용 검색을 위해 이미지 내용에 대한 보다 많은 의미를 점진적으로 추가해 나갈 수 있다.

계량화된 지식 추상화 계층을 이용한 협력적 질의 처리 (Cooperative Query Answering Using the Metricized Knowledge Abstraction Hierarchy)

  • 신명근
    • 한국컴퓨터정보학회논문지
    • /
    • 제11권3호
    • /
    • pp.87-96
    • /
    • 2006
  • 데이터베이스 시스템에서 협력적 질의응답이란 질의 내용과 정확히 일치하는 자료뿐만 아니라 좀 더 넓은 인근 범위의 자료 또는 근사적인 자료를 검색해 주는 것을 말한다. 협력적 질의응답은 질의 분석, 질의 유연화, 유연화된 질의에 따른 근사적 자료 제공의 세 단계로 이루어져 있다. 질의 유연화를 수행하기 위해 의미적 관계를 표현하는 지식추상화 방법과 자료 사이의 정량적인 유사도를 거리로 표현하는 방법들이 지식표현 방법으로 사용된다. 본 논문에서는 보다 효과적으로 질의 유연화 단계를 지원하기 위해, 다단계 데이터 추상화 계층과 거리 척도를 지원하는 계량화된 지식추상화 계층(MKAH: Metricized Knowledge Abstraction Hierarchy)을 제안한다. MKAH는 카테고리화 될 수 있는 자료에 대해 질의 유연화를 효과적으로 지원하며 두 값 사이의 정량적인 의미상의 유사도를 제공하여, 질의 결과에 순위가 매겨질 수 있도록 한다. MKAH의 실용성과 효율성을 검증하기 위하여 경력직 검색 분야에 대한 원형 시스템을 구현해보았다. 다양한 실험을 통하여 MKAH가 풍부한 의미 표현이 가능하면서 질적으로도 높은 거리 척도를 제공해 준다는 것을 보였다. 그 결과 MKAH를 채택하는 도메인은 다른 정량적인 숫자 도메인과 호환될 수 있다는 점과, 큰 규모의 시스템을 만드는 데에도 장점이 있음을 확인하였다.

  • PDF

안정하도 평가 및 설계 방법의 개선과 적용 (Improvement and Application of Stable Cannel Analysis and Design)

  • 장은경;지운;안명희
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2017년도 학술발표회
    • /
    • pp.14-14
    • /
    • 2017
  • 안정하도란 하도형성유량이 발생하는 조건에 대해 단면내에서 발생하는 유사량과 유입되는 유사량이 평형상태를 유지하는 단면을 의미하며, 안정하도 평가 및 설계란 현재 단면을 안정하도 단면과 비교하여 평가하거나 안정하도를 만족하는 하상경사와 하폭, 수심을 도출하는 과정을 의미한다. 이러한 안정하도 평가 및 설계는 하천을 정비하거나 복원하는 과정에서 장기적인 하상 평형상태를 고려하기 위해 적용할 수 있으며, 하상 침식 혹은 퇴적에 대해 지점별 평가방법으로 활용 할 수 있다. 안정하도 단면은 상류에서 유입되는 유사량과 대상구간의 발생 유사량의 평형조건에 의해 결정되기 때문에 유입되는 유사량 자료의 정확성과 대상구간 발생 유사량 산정의 정확도가 전체 평가 결과의 신뢰도에 가장 중요한 요소로 작용한다. 그러나 현재까지 활용되어 온 안정하도 단면 계산 방법의 경우 대상구간 발생 유사량 결정을 위한 유사이송공식의 선택이 특정 공식으로 한정되어있어 국내 하상과 적합한 유사이송공식의 적용이 매우 제한적이었다. 따라서 본 연구에서는 이러한 기존의 안정하도 평가 및 설계 방법을 개선하기 위해 다양한 유사이송공식의 적용이 가능한 안정하도 평가 모델의 알고리즘을 제시하였으며, 관련 분야의 실무자가 쉽게 활용 할 수 있도록 사용자 친화적인 사용자 친화적인 안정하도 평가 및 설계 프로그램(Stable Channel Analysis and Design, SCAD)을 개발하였다. 본 연구에서는 기존의 안정하도 단면 계산 방법인 Copeland 방법을 분석하여 새로운 알고리즘을 개발하였으며, 단면 유사량 분석 계산과정에서 자갈하상 공식을 포함한 총 다섯 가지의 유사이송공식을 새롭게 추가하였다. 개발된 SCAD 프로그램은 정확도 및 적용성 향상을 위해 청미천과 내성천 모래하상 구간 그리고 원주천 자갈하상 구간에 대해 시험계산을 수행하였고 평가 결과를 프로그램 개선을 위해 적극 활용하였다. 또한 웹 포팅 프로그램 구축을 통해 다양한 사용자가 특정 웹사이트에서 프로그램에 쉽게 접근할 수 있도록 하였다. 본 연구에서는 개선된 안정하도 평가 및 설계 프로그램을 활용하여 다양한 유사이송공식 선택에 따른 안정하도 산정 결과 값의 변화를 분석하고 그 범위를 정량적으로 제시하였다.

  • PDF

준구조 퍼지 논리를 위한 대수적 크립키형 의미론 (Algebraic Kripke-style semantics for substructural fuzzy logics)

  • 양은석
    • 논리연구
    • /
    • 제19권2호
    • /
    • pp.295-322
    • /
    • 2016
  • 이 글에서 우리는 유니놈에 기반한 퍼지 논리를 위한 대수적 크립키형 의미론을 다룬다. 이를 위하여 먼저 유니놈에 기반한 논리체계들을 위한 대수적 의미론을 재고한다. 다음으로 유니놈에 기반한 체계들의 일반적 구조에서 다양한 종류의 일반적 대수적 크립키형 의미론을 소개하고 그것들을 대수적 의미론과 연관 짓는다. 마지막으로 우리는 유사하게 특수한 대수적 의미론을 소개하고 이를 또한 대수적 의미론과 연관 짓는다.

  • PDF

반복적 알고리즘을 이용한 온톨로지 매핑 (An iterative algorithm for Ontology mapping)

  • 안진현;최기선
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2009년도 제21회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.14-18
    • /
    • 2009
  • 온톨로지 매핑은 서로 다른 온톨로지에 있는 클래스가 유사한 개념을 표현한 것인지 판단하는 문제이다. 클래스 유사도를 계산 하는 방법에는 클래스의 이름 어휘 유사도, 의미 유사도, 클래스 관계/속성 유사도 그리고 클래스 상하위 관계 유사도 등이 제안되었다. 본 논문에서는 이러한 클래스 유사도를 계산하기 위한 반복적 유사도 계산 알고리즘을 제안한다. 매 반복 단계마다 모든 클래스 쌍의 유사도를 전부 갱신 하는 방법과 유사도가 최대인 쌍만 선택적으로 갱신 하는 방법을 비교 실험하였다. 실험 결과 유사도가 최대인 쌍만 업데이트하는 방법의 성능이 좋았고 소요시간도 적었다.

  • PDF

재난안전 사회관심 분석을 위한 언어모델 활용 정보 네트워크 구축 (A Language Model based Knowledge Network for Analyzing Disaster Safety related Social Interest)

  • 최동진;한소희;김경준;배은솔
    • 한국재난정보학회:학술대회논문집
    • /
    • 한국재난정보학회 2022년 정기학술대회 논문집
    • /
    • pp.145-147
    • /
    • 2022
  • 본 논문은 대규모 텍스트 데이터에서 이슈를 발굴할 때 사용되는 기존의 정보 네트워크 또는 지식 그래프 구축 방법의 한계점을 지적하고, 문장 단위로 정보 네트워크를 구축하는 새로운 방법에 대해서 제안한다. 먼저 문장을 구성하는 단어와 캐릭터수의 분포를 측정하며 의성어와 같은 노이즈를 제거하기 위한 역치값을 설정하였다. 다음으로 BERT 기반 언어모델을 이용하여 모든 문장을 벡터화하고, 코사인 유사도를 이용하여 두 문장벡터에 대한 유사성을 측정하였다. 오분류된 유사도 결과를 최소화하기 위하여 명사형 단어의 의미적 연관성을 비교하는 알고리즘을 개발하였다. 제안된 유사문장 비교 알고리즘의 결과를 검토해 보면, 두 문장은 서술되는 형태가 다르지만 동일한 주제와 내용을 다루고 있는 것을 확인할 수 있었다. 본 논문에서 제안하는 방법은 단어 단위 지식 그래프 해석의 어려움을 극복할 수 있는 새로운 방법이다. 향후 이슈 및 트랜드 분석과 같은 미래연구 분야에 적용하면, 데이터 기반으로 특정 주제에 대한 사회적 관심을 수렴하고, 수요를 반영한 정책적 제언을 도출하는데 기여할 수 있을 것이다

  • PDF

유사도 통합에 관한 연구 (A Study on Integrating Similarities)

  • 김선경;박지수;손진곤
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2020년도 추계학술발표대회
    • /
    • pp.53-56
    • /
    • 2020
  • 유사도는 두 객체의 비슷한 정도를 실수로 나타낸 것이며 반대 개념인 다른 정도를 나타내는 것을 거리라 한다. 실세계에서 정확히 같은 것은 존재하기 힘들기 때문에 많은 응용 분야에서 유사도나 거리를 이용한다. 거리 중 대표적인 것으로 유클리드 공간에서 두 점 사이의 직선거리이다. 이 거리를 유클리드 거리라고 한다. 코사인 유사도는 벡터 공간에서 두 벡터 사이각의 코사인 값이다. 이외에도 용도에 따라 다양한 거리 또는 유사도가 연구되고 있다. 수학적으로 유사도는 이변수 함수로 나타낸다. 앞선 연구에서 민코프스키는 맨하탄 거리, 유클리드 거리 등을 매개변수 p를 이용하여 하나의 식으로 통합하였다. 이러한 유사도 통합은 유사도에 대한 새로운 통찰력을 제공하고 또 다른 응용을 제공한다. 본 논문은 기존 유사도의 의미를 개관하고 추가적인 매개변수를 도입하여 민코프스키 거리와 코사인 유사도를 통합한 식을 제시한다.

술어-논항 구조의 패턴 유사도를 활용한 혼합 커널 기반 관계 추출 (Relation Extraction based on Composite Kernel using Pattern Similarity of Predicate-Argument Structure)

  • 정창후;전홍우;최윤수;송사광;최성필
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2011년도 한국컴퓨터종합학술대회논문집 Vol.38 No.1(C)
    • /
    • pp.276-279
    • /
    • 2011
  • 문서 내에 존재하는 개체 간의 관계를 자동으로 추출할 때 다양한 형태의 문서 분석 결과를 활용할 수 있다. 본 논문에서는 기존에 개발되어 비교적 높은 성능을 보여준 트리 커널의 구절 구조 유사성 정보와 두 개체 사이의 유의미한 연관관계를 표현하는 술어-논항 구조 패턴의 유사성 정보를 활용하는 혼합 커널을 제안한다. 구문적 구조를 이용하는 기존의 트리 커널 기법에 술어와 논항 간의 의미적 구조를 활용하는 술어-논항 구조 패턴 유사도 커널을 결합하여 상호보완적인 혼합 커널을 구성하였고, 실험을 통하여 개발된 커널의 성능을 측정하였다. 실험 결과 구절 구조 정보를 이용하는 트리 커널만을 단독으로 사용했을 때보다 술어-논항 구조의 패턴 정보를 결합한 혼합 커널을 사용했을 때에 더 좋은 성능을 보이는 것을 확인할 수 있었다. 이는 관계 인스턴스에 대한 구절 구조 정보뿐만 아니라 개체 간의 유의미한 연관관계를 표현해주는 술어-논항 구조 패턴 또한 관계 추출 작업에 매우 유용한 정보임을 입증하고 있다.

의미 확산을 이용한 잠재 의미 색인 방법 (Latent Semantic Indexing Using Semantic Diffusion)

  • 김진화;김용혁
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2010년도 한국컴퓨터종합학술대회논문집 Vol.37 No.1(C)
    • /
    • pp.16-21
    • /
    • 2010
  • 잠재 의미를 색인하는 것은 문서 색인에 있어서 그 색인 품질에 주요한 요인을 차지한다. 본 논문에서 살펴보는 의미 확산 방법은 문서 집합에 나타나는 단어들의 의미적 연관성을 바탕으로 활성화 작용 모델(spreading activation model)을 구축하고 색인 대상 문서의 단어 분포를 출발점으로 삼아, 그 모델 안에서 의미적으로 수렴할 수 있도록 랜덤 워크 방법(random walk method)1)을 수정한 변형 방법을 이용해 확률을 확산시킨다. 이 방법은 단어 사이의 연관성을 따라 탐색하며 동의어와 다의어 등 단순 단어 일치로는 알 수 없는 의미적 유사 단어들이 의미 있는 확률 분포를 갖게 한다. 이는 단어들의 의미 분포를 가중치 그래프를 통해 보다 합리적으로 다루게 된다. 실험에서는 문서 분류를 시행하여 평균 정확도 및 정확도-재현율 곡선을 산출하였고, 비교 실험을 통해서 전반적인 우수성을 관찰할 수 있었다.

  • PDF

플랜트 설비 문서로부터 설비사양 추출 및 유사설비 사양 교차 검증 접근법 (A Method for Extracting Equipment Specifications from Plant Documents and Cross-Validation Approach with Similar Equipment Specifications)

  • 이재현;최승언;서효원
    • 한국산업정보학회논문지
    • /
    • 제29권2호
    • /
    • pp.55-68
    • /
    • 2024
  • 플랜트 엔지니어링 기업은 서로 다른 공종별 부서에서 플랜트 공정/설비/파이프/계장 등 각 관련 분야의 요구사항 문서를 작성하거나 참조하게 된다. 공정 관련 요구사항 문서는 공정에 대한 설명과 함께 이를 운영할 설비 또는 관련 시설의 요구사항들을 포함한다. 각 공종별 문서에 기술된 설비 또는 부품에 관련된 요구사항과 사양 정보는 문서의 작성자와 검토자들이 다르기 때문에 상호 간에 불일치가 발생할 가능성이 있다. 이 사항들에 대한 일치성을 확인하는 것은 전체 플랜트 설계 정보의 신뢰도를 높일 수 있다. 하지만, 문서의 양이 방대하고 서로 다른 문서들에 동일한 설비 부품에 대한 요구사항들이 일반 문장 형태로 흩어져 있기에 이를 사람이 추적하여 관리하는 것은 한계가 있다. 본 논문에서는 서로 다른 문서들 내에 기술된 요구사항 문장들을 분석하여 설비 또는 설비 부품과 관련된 요구사항 문장의 유사도를 계산하여 의미적으로 동일한 문장을 찾아내는 방법을 제안한다. 요구사항 문장의 유사도를 계산하기 위하여 의미적으로 요구사항의 중심이 되는 부품과 속성을 개체명 인식 방법을 활용하여 찾아내고, 찾아진 부품과 속성들의 유사도를 계산하여 두문장이 의미적으로 동일함을 판단하는 방법을 제안한다. 플랜트 현장에서 사용하는 문서의 문장들을 예제로 하여 제안하는 방법을 설명하고 실험 결과를 설명한다.