• Title, Summary, Keyword: 벡터 공간 모델

Search Result 246, Processing Time 0.04 seconds

Semantic Extention Search for Documents Using the Word2vec (Word2vec을 활용한 문서의 의미 확장 검색방법)

  • Kim, Woo-ju;Kim, Dong-he;Jang, Hee-won
    • The Journal of the Korea Contents Association
    • /
    • v.16 no.10
    • /
    • pp.687-692
    • /
    • 2016
  • Conventional way to search documents is keyword-based queries using vector space model, like tf-idf. Searching process of documents which is based on keywords can make some problems. it cannot recogize the difference of lexically different but semantically same words. This paper studies a scheme of document search based on document queries. In particular, it uses centrality vectors, instead of tf-idf vectors, to represent query documents, combined with the Word2vec method to capture the semantic similarity in contained words. This scheme improves the performance of document search and provides a way to find documents not only lexically, but semantically close to a query document.

A Study on the Validation of Vector Data Model for River-Geospatial Information and Building Its Portal System (하천공간정보의 벡터데이터 모델 검증 및 포털 구축에 관한 연구)

  • Shin, Hyung-Jin;Chae, Hyo-Sok;Hwang, Eui-Ho
    • Journal of the Korean Association of Geographic Information Studies
    • /
    • v.17 no.2
    • /
    • pp.95-106
    • /
    • 2014
  • In this study, the applicability of a standard vector model was evaluated using RIMGIS vector data and a portal based river-geospatial information web service system was developed using XML and JSON based data linkage between the server and the client. The RIMGIS vector data including points, lines, and polygons were converted to the Geospatial Data Model(GDM) developed in this study and were validated by layers. After the conversion, it was identified that the attribute data of a shape file remained without loss. The GeoServer GDB(GeoDataBase) that manages a DB in the portal was developed as a management module. The XML-based Geography Markup Language(GML) standards of OGC was used for accessing to and managing vector layers and encoding spatial data. The separation of data content and expression in the GML allowed the different expressions of the same data, convenient data revision and update, and enhancing the expandability. In the future, it is necessary to improve the access, exchange, and storage of river-geospatial information through the user's customized services and Internet accessibility.

A Tensor Space Model based Semantic Search Technique (텐서공간모델 기반 시멘틱 검색 기법)

  • Hong, Kee-Joo;Kim, Han-Joon;Chang, Jae-Young;Chun, Jong-Hoon
    • The Journal of Society for e-Business Studies
    • /
    • v.21 no.4
    • /
    • pp.1-14
    • /
    • 2016
  • Semantic search is known as a series of activities and techniques to improve the search accuracy by clearly understanding users' search intent without big cognitive efforts. Usually, semantic search engines requires ontology and semantic metadata to analyze user queries. However, building a particular ontology and semantic metadata intended for large amounts of data is a very time-consuming and costly task. This is why commercialization practices of semantic search are insufficient. In order to resolve this problem, we propose a novel semantic search method which takes advantage of our previous semantic tensor space model. Since each term is represented as the 2nd-order 'document-by-concept' tensor (i.e., matrix), and each concept as the 2nd-order 'document-by-term' tensor in the model, our proposed semantic search method does not require to build ontology. Nevertheless, through extensive experiments using the OHSUMED document collection and SCOPUS journal abstract data, we show that our proposed method outperforms the vector space model-based search method.

Segmentation and Compression Techniques for 3D Animation Models (삼차원 애니메이션 모델의 분할 및 부호화 방법)

  • 안정환;임동근;호요성
    • Proceedings of the IEEK Conference
    • /
    • /
    • pp.353-356
    • /
    • 2000
  • 최근 복잡한 실제 사물을 가상 공간상에 표현하기 위해 삼차원 모델을 많이 이용하고 있다. 기존의 삼차원 데이터 처리는 주로 정지 모델에 대해 기하학 정보와 위상학 정보를 표현하거나 다중 해상도(Level of Details, LOD)로 나타내는데 역점을 두었다. 그러나 네트웍을 통한 가상 공간에서 삼차원 애니메이션에 대한 응용이 점차 늘어남에 따라 이러한 데이터를 효율적으로 압축하여 전송하거나 저장할 필요가 생겼다 본 논문에서는 삼차원 애니메이션 모델의 공간적 또는 시간적 상관 관계를 이용하여 삼차원 모델 정보를 부호화하는 방법을 제안한다. 먼저 주어진 모델의 움직임을 분석하고 이를 (r,θ,ø)의 구 좌표계로 변환한 후 (θ,ø)의 분포에 따라 모델을 분할(Segmentation)한다. 그리고 움직임 벡터는 Affine 변환을 이용하여 삼차원 공간에서의 움직임을 정의한다. Key프레임에 해당하는 정지 모델의 기하학 정보와 위상학 정보를 압축하고, LOD 기술을 적용하여 손실 혹은 무손실로 부호화하여 전송한다. 또한 Key프레임 사이의 화면에서는 선형 또는 비선형 보간법으로 각 분할 부분을 복원하고, 이를 조합하여 전체적인 삼차원 모델을 복원한다.

  • PDF

Extraction of Spatial Information of Facility Using Multiple Photographic Analysis (다중사진 해석에 의한 시설물 공간정보 추출)

  • 손덕재;이승환
    • Proceedings of the Korean Association of Geographic Inforamtion Studies Conference
    • /
    • /
    • pp.400-405
    • /
    • 2003
  • 본 연구에서는 기존 지형도나 준공도면 자료에서 상세정보가 누락되거나 갱신이 이루어지지 않아 시설물관리체계에 필요한 수치지도의 체계적인 구축이 요구되는 지역에 적용할 수 있도록 지상사진, 항공사진 등 영상자료에 다양한 사진해석 기법을 적용하여 수치지도를 생성하고 공간 및 속성정보를 추출하였다. 본 연구에서는 다중사진 촬영에 의하여 대상물의 3차원 모델과 3차원 사진영상모델을 생성하였다. 또한, 소축척 항공사진을 이용하여 대상지역의 벡터라이징을 실행한 결과, 각 건물과 도로시설물의 위치와 형태 등 공간정보의 추출이 가능하였다.

  • PDF

Comparison of Feature Extraction Methods for the Telephone Speech Recognition (전화 음성 인식을 위한 특징 추출 방법 비교)

  • 전원석;신원호;김원구;이충용;윤대희
    • The Journal of the Acoustical Society of Korea
    • /
    • v.17 no.7
    • /
    • pp.42-49
    • /
    • 1998
  • 본 논문에서는 전화망 환경에서 음성 인식 성능을 개선하기 위한 특징 벡터 추출 단계에서의 처리 방법들을 연구하였다. 먼저, 고립 단어 인식 시스템에서 채널 왜곡 보상 방 법들을 단어 모델과 문맥 독립 음소 모델에 대하여 인식 실험을 하였다. 켑스트럼 평균 차 감법, RASTA 처리, 켑스트럼-시간 행렬을 실험하였으며, 인식 모델에 따른 각 알고리즘의 성능을 비교하였다. 둘째로, 문맥 독립 음소 모델을 이용한 인식 시스템의 성능 향상을 위하 여 정적 특징 벡터에 대하여 주성분 분석 방법(principal component analysis)과 선형 판별 분석(linear discriminant analysis)과 같은 선형 변환 방법을 적용하여 분별력이 높은 벡터 공간으로 변환함으로써 인식 성능을 향상시켰다. 또한 선형 변환 방법을 켑스트럼 평균 차 감법과 결합하여 더욱 뛰어난 성능을 보여주었다.

  • PDF

Text Clustering Algorithm Based on Ontology Concepts Combination (온톨로지 개념 합병 기반 문서 군집화 기법)

  • Guan, XiangDong;Kim, Woosaeng
    • Proceedings of the Korean Institute of Information and Commucation Sciences Conference
    • /
    • /
    • pp.722-724
    • /
    • 2012
  • 문서 군집화를 통하여 문서를 효율적으로 조직, 관리, 검색 할 수 있다. 일반적으로 문서 군집화는 많은 단어와 개념들을 포함하고 있기 때문에 차원이 큰 벡터 공간 모델에서 군집화를 수행한다. 본 논문에서 문서 집합에 대응하는 온톨로지를 이용하여 문서 벡터 공간의 차원을 줄여 효율적으로 군집화하는 방법을 제안하고, 실험을 통하여 기존 방법보다 우수함을 보인다.

  • PDF

A research on utilizing direction vector and course recommendation system adapting dynamic environment for multi agents strategy (멀티에이전트 전략을 위한 방향벡터 활용과 동적 환경에 적응하는 경로 추천시스템에 관한 연구)

  • Yoon, Seok-Hyun
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • /
    • pp.381-384
    • /
    • 2011
  • 본 논문은 사용자 및 동적환경의 변화를 파악하고 분석된 정보를 바탕으로 최적화된 경로를 제공하기 위한 시스템을 멀티에이전트를 이용하여 해결하고자 하였다. 멀티에이전트를 통해 설정된 목표를 찾아가는 먹이추적 문제에 적용하였고 현실 세계와 흡사한 무한 공간 환경에서 알고리즘의 성능을 실험하였다. 적용된 환경의 모델은 순환구조(circular)형 격자 공간이라는 새로운 실험 공간으로 방향 벡터 함수 알고리즘을 통해 새롭게 멀티에이전트의 목표를 획득하기 위한 해법이다. 기존의 연구와 비교하여 먹이의 효율적 포획, 에이전트간의 충돌문제 해결에 대한 새로운 해법을 제시할 수 있었다.

  • PDF

Outer-line measurement for 3D reconstruction of huge structures (거대한 구조물의 3차원 영상 재구성을 위한 외곽선 길이 정보 추출)

  • Jeon, Byung-Seung;Park, Jung-Min;Kim, Young-Joong;Ko, Han-Seok;Hwang, In-Joon;Lim, Myo-Taeg
    • Proceedings of the KIEE Conference
    • /
    • /
    • pp.280-281
    • /
    • 2008
  • 본 논문은 큰 구조물의 3파인 영상 재구성을 위해서 획득한 2차원 영상에서 특징점을 찾아 선으로 조합한 후 선 길이 정보를 추출하는 방법을 제안한다. 거대한 구조물의 외곽선 길이 정보 추출을 위해서는 광각 카메라에 의한 영상을 획득한다. 영상에서의 외곽선들은 모델의 기울어진 정보와 형태, 모델의 크기 등을 결정하게 되는데 광각카메라 사용에 의하여 배럴왜곡, 원근투영왜곡 등이 발생한다. 외곽선 정보 추출의 순서는 먼저모델의 2차원영상을 획득하고 이로부터 왜곡이 보정된 그레이영상을 획득한다. 이 그레이영상에서 잡음을 제거하고 특징점을 찾기 위하여 SUSAN 알고리즘을 사용한다. SUSAN알고리즘 기법은 적은 계산량과 잡음에 매우 강한 장점이 있어서 영상에서의 특징점을 얻기 위한 효과적인 기법이다. 특징점을 3차원 벡터공간에서 맵핑시킨 후 X, Y, Z 좌표축으로 점과 선으로 나타내고 시작점과 끝점의 좌표를 이용하여 벡터 길이를 얻는다. 이러한 벡터 데이터와 3차원 영상 재구성을 위한 라이브러리인 OpenGL을 사용하여 3차원 공간에 거대한 구조물들을 재구성하는 소프트웨어를 개발하였다.

  • PDF

Implementation of the Voice Conversion in the Text-to-speech System (Text-to-speech 시스템에서의 화자 변환 기능 구현)

  • Hwang Cholgyu;Kim Hyung Soon
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • /
    • pp.33-36
    • /
    • 1999
  • 본 논문에서는 기존의 text-to-speech(TTS) 합성방식이 미리 정해진 화자에 의한 단조로운 합성음을 가지는 문제를 극복하기 위하여, 임의의 화자의 음색을 표현할 수 있는 화자 변환(Voice Conversion) 기능을 구현하였다. 구현된 방식은 화자의 음향공간을 Gaussian Mixture Model(GMM)로 모델링하여 연속 확률 분포에 따른 화자 변환을 가능케 했다. 원시화자(source)와 목적화자(target)간의 특징 벡터의 joint density function을 이용하여 목적화자의 음향공간 특징벡터와 변환된 벡터간의 제곱오류를 최소화하는 변환 함수를 구하였으며, 구해진 변환 함수로 벡터 mapping에 의한 스펙트럼 포락선을 변환했다. 운율 변환은 음성 신호를 정현파 모델에 의해서 모델링하고, 분석된 운율 정보(피치, 지속 시간)는 평균값을 고려해서 변환했다. 성능 평가를 위해서 VQ mapping 방법을 함께 구현하여 각각의 정규화된 켑스트럼 거리를 구해서 성능을 비교 평가하였다. 합성시에는 ABS-OLA 기반의 정현파 모델링 방식을 채택함으로써 자연스러운 합성음을 생성할 수 있었다.

  • PDF