• 제목/요약/키워드: 의미적 유사도

검색결과 1,585건 처리시간 0.028초

언어간 의미 점화 효과 (Cross-linguistic Semantic Priming Effects in Visual Word Recognition)

  • 최원일;오현금;남기춘
    • 한국인지과학회:학술대회논문집
    • /
    • 한국인지과학회 2002년도 춘계학술대회
    • /
    • pp.157-162
    • /
    • 2002
  • 본 연구는 영어 단어 재인 과정에서 나타나는 한국인의 어휘 수준과 의미 수준 양상을 알아보기 위해 실시되었다 이를 위해 본 연구에서는 세 종류의 실험을 시행하였는데, 첫 번째 실험에서는 한국어 처리 기제와 영어 처리 기제의 독립 여부를 알아보기 위하여 한국어로는 여러 의미를 갖지만 영어로는 한 가지 의미만을 가지는 영어단어를 점화 자극으로 하고, 한국어와는 관련된 의미를 갖지만 영어와는 무관련한 한국어 단어를 목표 자극으로 사용하여(예, bridge-팔)언어간 의미 점화 어휘판단 과제를 시행하였다. 두 번째 실험에서는 비교적 개념 구조가 한국어와 영어에서 유사하다고 생각되어지는 외래어를 자극으로 사용하여 언어간(예, elevator-승강기), 언어 내(예, 엘리베이터-승강기) 어휘판단과제를 실시하였다. 연구 결과 첫 번째 실험에서는 유의미한 점화효과가 나타나지 않았고, 두 번째 실험에서는 언어간에는 SOA에 따라서 결과가 달랐고, 언어 내에는 촉진적 점화효과가 나타났다 이러한 결과는 영어의 일반 어휘에 대한 의미 표상 체계는 독립적으로 존재하였고, 외래어와 같이 특수한 어휘에 대해서는 다른 표상 체계를 갖고 있는 것으로 나타났다

  • PDF

XML문서의 자동변환을 위한 스키마 매칭 알고리즘 (A Schema Matching Algorithm for an Automated Transformation of XML Documents)

  • 이준승;이경호
    • 한국멀티미디어학회논문지
    • /
    • 제7권9호
    • /
    • pp.1195-1207
    • /
    • 2004
  • 스키마 매칭은 XML문서의 자동 변환을 위한 전처리 과정으로서 필수적이다. 스키마 매칭에 관한 기존 연구는 의미적으로 대응 가능한 모든 매칭관계를 고려하기 때문에 다대다의 대응관계를 추출한다. 이에 명확한 매칭관계를 필요로하는 XML문서의 자동변환에는 적합하지 않다. 본 논문에서는 스키마 사이의 일대일 대응관계를 추출할 수 있는 효율적인 스키마 매칭 알고리즘을 제안한다. 제안된 알고리즘은 두 단계로 구성된다. 먼저 단발노드 사이의 언어적 유사도와 데이터타입 유사도를 이용하여 후보매칭을 계산한다. 계산된 후보매칭의 경로유사도 비교를 통해 일대일 매칭을 추출하게 된다. 특히 제안된 방법은 보다 정교한 수준의 스키마 매칭을 위하여 축약어 사전, 동의어 사전, 그리고 도메인 온탈로지에 기반한다. 제안된 알고리즘의 성능을 평가하기 위해서 전자상거래 분야에서 사용 중인 스키마를 대상으로 실험한 결과, 평균적으로 97%의 정확률을 보여 기존 연구보다 우수하였다.

  • PDF

개념적 거리와 밀도를 이용한 웹 문서 검색 (Web Document Retrieval based on Conceptual Distance and Density)

  • 황희철;최창;김판구
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2006년도 춘계학술발표대회
    • /
    • pp.817-820
    • /
    • 2006
  • 최근 인터넷 기술의 비약적인 발전으로 웹상에 많은 양의 정보가 존재하고, 많은 사람들이 이를 검색하고 활용하게 되었다. 그러나 기존의 검색방식은 단순히 텍스트 매칭(Text matching) 방법을 사용하고 있어 많은 자료들 사이에서 자신이 원하는 자료를 찾는데 어려움이 있다. 이에 본 논문에서는 검색할 자료의 정보를 바탕으로 그와 유사한 자료를 검색해주는 웹 문서 검색 시스템을 제안하고자 한다. 이를 위해 울산대학교 어휘 지능망인 U-WIN을 기반으로 개념적 밀도와 단어 간의 유사성 측정을 이용하여 의미적인 검색이 되도록 하였다.

  • PDF

유사비디오 데이터의 공통 정보 마이닝을 위한 압축 기법 (Compression Methods for Knowledge Discovery of Similar Video Data)

  • 박동철;장중혁;이원석
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 2002년도 춘계학술발표논문집(상)
    • /
    • pp.118-123
    • /
    • 2002
  • 산업정보사회가 발달함에 따라 다양한 형태의 비디오 데이터들이 여러 분야에서 대량으로 생성되고 있다. 이에 따라 이들의 가공을 통해 비디오에 나타난 의미 정보를 추출하려는 다양한 접근들이 시도되고 있으며, 최근 들어 데이터 마이닝을 이용한 기법에 대한 관심들이 증대되고 있다. 그러나 기존의 연구 대상에서 비디오 데이터를 기본으로 하여 지식 정보를 추출하기 위한 시도는 시공간적으로 방대한 비디오 데이터의 특징으로 인해 소극적으로 접근되어왔다. 본 논문에서는 유사한 비디오들로부터 효과적으로 비디오 데이터를 압축하고 특성을 추출하며 클러스터링을 통하여 형태론적인 비디오 정보로부터 직접 의미 있는 패턴을 추출하는 방법을 제안한다. 이를 위해 관심 영역 제한방법, 최소 반복도 제한방법 및 키 프레임 추출 방법 등이 포함된다. 최종적으로 실험용 비디오에 대한 마이닝 결과를 생성하고 최초의 트랜잭션과의 정확도를 비교하여 본 논문에서 제시한 기법들을 검증하였다.

  • PDF

객체 지향 클래스 계층 구조 재구성 방법 (Restructuring Method for Object-Oriented Class Hierarchy)

  • 정계동;최영근
    • 한국정보처리학회논문지
    • /
    • 제5권5호
    • /
    • pp.1185-1203
    • /
    • 1998
  • 객체 지향 시스템에서 클래스 추가 및 삭제로 인하여 클래스간의 새로운 관계를 유지할 수 있는 클래스 계층 구조의 변경이 필요하다. 그러나 기존의 방법에서는 클래스 계층 구조 변경시 부모 클래스와 자식 클래스 사이의 의미를 파악하기 어려워 많은 추가적인 분석 비용이 소요된다. 본 논문에서는 클래스간의 유사성을 측정하여 새로운 관계성 분류 방법을 통해 의미적 변화에 따른 수정 방법을 제시한다. 즉, 이 방법은 클래스들의 유사성을 측정하여 관계성을 기준 하여 무관 관계, 동일 관계, 포함 관계, 부분 집합 관계로 구분하여 클래스 계층 구조를 재구성한다. 본 논문에서 제시하는 방법은 클래스 계층 구조 변경시 클래스간의 의미 오류 가능성을 최소화 할 수 있도록 한다. 또한 다양한 그래픽 및 텍스트 처리를 통하여 사용자에게 재사용의 편리성 및 이해성을 높일 수 있도록 하였다.

  • PDF

구매이력 데이터에서 상품 분류 체계를 고려한 시퀀스 유사도 측정 기법 (A Sequence Similarity Measure Considering the Product Taxonomy in Transaction Data)

  • 양유정;이기용
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2019년도 춘계학술발표대회
    • /
    • pp.367-370
    • /
    • 2019
  • 본 논문은 구매이력 데이터에서 상품간의 분류 체계를 고려하여 시퀀스 간의 유사도를 계산하는 새로운 방법을 제안한다. 시퀀스란 두 항목간의 순서가 존재하는 데이터를 의미한다. 항목 간의 선후관계가 중요한 시퀀스 데이터에서는 두 시퀀스 간의 유사도를 정확히 정의하는 것이 중요하다. 본 논문에서는 대표적인 시퀀스 유사도 측정 알고리즘인 편집 거리 알고리즘을 활용하여 구매이력 데이터에서 시퀀스 간의 유사도를 정의한다. 상품은 상품의 특성에 따라 항목 분류 체계에서 여러 범주로 분류된다. 이 경우 기존의 편집 거리 알고리즘에서 문자의 일치유무에 따라 단순히 0 또는 1을 부여하는 것은 부정확하다. 따라서 본 논문은 편집 거리 알고리즘의 수정 연산 중 대체 연산 비용 계산 시 항목 분류 트리를 사용하여 연산 비용이 0 에서 1 사이의 값을 가지도록 세분화하였다. 실험 결과 제안 방법은 대체 연산 비용 계산 시 두 문자가 다르면 단순히 1 을 부여하는 기존의 편집 거리 알고리즘에 비해 시퀀스 간의 유사도를 더 정확하게 계산함을 확인하였다.

술어-논항 구조의 패턴 유사도를 결합한 혼합 커널 기반관계 추출 (Relation Extraction based on Composite Kernel combining Pattern Similarity of Predicate-Argument Structure)

  • 정창후;최성필;최윤수;송사광;전홍우
    • 인터넷정보학회논문지
    • /
    • 제12권5호
    • /
    • pp.73-85
    • /
    • 2011
  • 문헌에 존재하는 핵심개체 간의 관계를 자동으로 추출할 때 다양한 형태의 문서 분석 결과를 활용할 수 있다. 본 논문에서 는 기존에 개발되어 비교적 높은 성능을 보여준 합성곱 구문 트리 커널의 구절 구조 유사성 정보와 두 개체 사이의 유의미한 연관관계를 표현해주는 술어-논항 구조 패턴의 유사성 정보를 동시에 활용하는 혼합 커널을 제안한다. 구문적 구조를 이용하는 기존의 합성곱 구문 트리 커널에 술어와 논항 간의 의미적 구조를 활용하는 술어-논항 구조 패턴 유사도 커널을 결합하여 상호보완적인 혼합 커널을 구성하였고, 다양한 테스트컬렉션 기반의 실험을 통하여 개발된 커널의 성능을 측정하였다. 실험결과 구절 구조 정보를 이용하는 합성곱 구문 트리 커널만을 단독으로 사용했을 때보다 술어-논항 구조의 패턴 정보를 결합한 혼합 커널을 사용했을 때에 더 좋은 성능을 보이는 것을 확인할 수 있었다. 또한 기존의 시스템보다 우수한 성능을 보이는 것도 함께 확인할 수 있었다.

용언의 구문관계를 이용한 명사 분류 (Clustering Noun Using Syntactic Relations)

  • 김현진;박세영;장명길;박재득;박동인
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1997년도 제9회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.111-115
    • /
    • 1997
  • 자연언어를 처리하는 응용시스템에서는 의미적으로 유사한 집합으로 분류된 단어들을 이용하는 것이 필요하다. 특히 한국어에서는 명사마다 함께 쓰이는 용언들이 제한되어 있다. 이 논문에서는 문장에서 용언과 명사의 구문 관계로 추출되는 정보를 이용하여 명사를 분류하는 방법을 제시한다. 또한 실제 코퍼스에서 추출된 명사들을 중심으로 의미적 집합으로 묶는 작업을 하고, 각 의미군마다 특징적인 구문 정보를 적용하여 자동 명사 추출에서 나타나는 모호성 해소에도 이용하였다. 용언의 구문관계 추출은 기존 연구된 용언 하위 분류 연구를 이용하였고, 코퍼스를 통해 얻은 명사와 용언을 이용하여 수정 및 보완하였다. 실험 코퍼스는 1만 문장 가량의 구문 구조가 부착된 코퍼스(Tree Tagged Corpus)를 이용하였다.

  • PDF

Word2Vec를 이용한 단어 의미 모호성 해소 (Word Sense Disambiguation using Word2Vec)

  • 강명윤;김보겸;이재성
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2015년도 제27회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.81-84
    • /
    • 2015
  • 자연어 문서에 출현하는 단어에는 중의적 단어가 있으며, 이 단어에서 발생되는 의미 모호성은 대개 그 문맥에 따라 해소된다. 의미 모호성 해소 연구 중, 한국어 단어 공간 모델 방법은 의미 태그 부착 말뭉치를 이용하여 단어의 문맥 정보를 구축하고 이를 이용하여 모호성을 해결하는 연구로서 비교적 좋은 성능을 보였다. 본 연구에서는 Word2Vec를 이용하여 기존 연구인 한국어 단어 공간 모델의 단어 벡터를 효과적으로 축소할 수 있는 방법을 제안한다. 세종 형태 의미 분석 말뭉치로 실험한 결과, 제안한 방법이 기존 성능인 93.99%와 유사한 93.32%의 정확률을 보이면서도 약 7.6배의 속도 향상이 있었다.

  • PDF

단어 의미 모호성 해소를 위한 군집화된 의미 어휘의 품질 향상 (Improving Clustered Sense Labels for Word Sense Disambiguation)

  • 박정연;신형진;이재성
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2022년도 제34회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.268-271
    • /
    • 2022
  • 단어 의미 모호성 해소는 동형이의어의 의미를 문맥에 맞게 결정하는 일이다. 최근 연구에서는 희소 데이터 처리를 위해 시소러스를 사용해 의미 어휘를 압축하고 사용하는 방법이 좋은 성능을 보였다[1]. 본 연구에서는 시소러스 없이 군집화 알고리즘으로 의미 어휘를 압축하는 방법의 성능 향상을 위해 두 가지 방법을 제안한다. 첫째, 의미적으로 유사한 의미 어휘 집합인 범주(category) 정보를 군집화를 위한 초기 군집 생성에 사용한다. 둘째, 다양하고 많은 문맥 정보를 학습해 만들어진 품질 좋은 벡터를 군집화에 사용한다. 영어데이터인 SemCor 데이터를 학습하고 Senseval, Semeval 5개 데이터로 평가한 결과, 제안한 방법의 평균 성능이 기존 연구보다 1.5%p 높은 F1 70.6%를 달성했다.

  • PDF