• 제목/요약/키워드: Vocabulary Recognition

검색결과 221건 처리시간 0.024초

21세기 다차원 커뮤니케이션과 매체예술의 문제 (The Problem of multi-dimension communication and 21st century Media Art)

  • 박기웅
    • 조형예술학연구
    • /
    • 제3권
    • /
    • pp.5-32
    • /
    • 2001
  • At the beginning of 21st Century, human desire of communication is forwarding to the Cosmos The way of Communication is going to be not by simple methodology but by the complicated methodology with high technology. It will not be monologue communication but be interactive communication, that will make intelligence Infra, which could be able to communicate from the location of information is present to which is not present; and the multi-media which will be able to solve the technical problems of these communication; will be developed continually. In the genre of plastic art, there are no exception in these changedness. More developed and proceed to develope intermedia could be able of intercommunication. The more development of technology could be able to the more development of new plastic art. Furthermore the development of science make the genre of art to be changed. There are no exception of this changedness in any part of society, The art always has been guided by the person who has proceeding idea for new value. The 21st century plastic art will be in the procedure of the intercommunication. Human-being's concern is to communicate with Universe, and that will be multi-dimension$(4{\cdot}5{\cdot}6{\cdot}7{\cdots}dimension)$ communication beyond our usual recognition. To conjoin this, the possibility of cyber space expressing is going to be considered, and the way is being done by the development of the Media Art, which is able to go and back to the cyber-space. And the message will be so complicate beyond our recognition. Because we will need to communicate with various newly-built vocabulary, so we need to magnify the repertories of new vocabulary.

  • PDF

마코프 체인 밀 음절 N-그램을 이용한 한국어 띄어쓰기 및 복합명사 분리 (Korean Word Segmentation and Compound-noun Decomposition Using Markov Chain and Syllable N-gram)

  • 권오욱
    • 한국음향학회지
    • /
    • 제21권3호
    • /
    • pp.274-284
    • /
    • 2002
  • 한국어 대어휘 연속음성인식을 위한 텍스트 전처리에서 띄어쓰기 오류는 잘못된 단어를 인식 어휘에 포함시켜 언어모델의 성능을 저하시킨다. 본 논문에서는 텍스트 코퍼스의 띄어쓰기 교정을 위하여 한국어 음절 N-그램을 이용한 자동 띄어쓰기 알고리듬을 제시한다. 제시된 알고리듬에서는 주어진 입력음절열은 좌에서 우로의 천이만을 갖는 마코프 체인으로 표시되고 어떤 상태에서 같은 상태로의 천이에서 공백음절이 발생하며 다른 상태로의 천이에서는 주어진 음절이 발생한다고 가정한다. 마코프 체인에서 음절 단위 N-그램 언어모델에 의한 문장 확률이 가장 높은 경로를 찾음으로써 띄어쓰기 결과를 얻는다. 모든 공백을 삭제한 254문장으로 이루어진 신문 칼럼 말뭉치에 대하여 띄어쓰기 알고리듬을 적용한 결과 91.58%의 어절단위 정확도 및 96.69%의 음절 정확도를 나타내었다. 띄어쓰기 알고리듬을 응용한 줄바꿈에서의 공백 오류 처리에서 이 알고리듬은 91.00%에서 96.27%로 어절 정확도를 향상시켰으며, 복합명사 분리에서는 96.22%의 분리 정확도를 보였다.

디자인 조형언어에 대한 소비자의 감성적 인지특성 (Characteristic on the emotional recognition of consumer about the formative language)

  • 민경택;허성철
    • 감성과학
    • /
    • 제12권1호
    • /
    • pp.87-96
    • /
    • 2009
  • 디자인 조형화 과정에 있어서 최근에는 소비자들의 참여가 점차 늘어나고 있는 추세이며, 소비자들은 제품의 형태에 대한 직접적인 평가나 제안을 하기도 하며, 기업에서도 이러한 소비자들의 참여를 유도하기 위한 다양한 방안을 제시하고 있다. 하지만 근본적으로 제품의 형태를 다루는 데에 있어서 소비자와 디자이너는 어느 정도의 시각 차이를 가지고 있으며, 이는 곧 제품 조형화 과정에 있어서 소비자와 디자이너의 효과적인 커뮤니케이션에 방해요소로 작용하고 있다. 이를 해결하기 위해 소비자와 디자이너의 제품 형태에 대한 감성반응에 대한 특징을 통해 소비자의 감성반응을 이끌어 낼 수 있는 효과적인 가이드라인을 알아보는 방법을 연구하였다. 이러한 소비자와 디자이너의 제품 형태에 대한 감성반응을 알아보기 위한 실험을 진행하였는데, 먼저 제품 형태 기반의 감성 이미지 어휘에 대한 정립을 진행하였다. 정립된 이미지 어휘를 기반으로 각각 소비자와 디자이너에게 동일한 실험을 진행하였다. 실험 결과, 소비자와 디자이너의 형태에 대한 감성 반응은 유의한 성향을 띄게 되는데 이 때 디자이너가 소비자에 비해 보다 극적인 반응을 나타내는 특징이 나타났다.

  • PDF

문장음성인식을 위한 VCCV 기반의 언어모델과 Smoothing 기법 평가 (Language Model based on VCCV and Test of Smoothing Techniques for Sentence Speech Recognition)

  • 박선희;노용완;홍광석
    • 정보처리학회논문지B
    • /
    • 제11B권2호
    • /
    • pp.241-246
    • /
    • 2004
  • 본 논문에서는 언어모델의 언어처리 단위로 VCCV(vowel consonant consonant vowel) 단위를 제안하구 기존의 언어처리 단위인 어적 형태소 단위와 비교한다. 어절과 형태소는 어휘수가 많고 높은 복잡도를 가진다. 그러나 VCCV 단위는 작은 사전과 제한된 어휘를 가지므로 복잡도가 적다. 언어모델 구성에 smoothing은 반드시 필요하다. smoothing 기법은 정확한 확률 예측이 불확실한 데이터가 있을 때 더 나은 확률 예측을 위해 사용된다. 본 논문에서는 형태소, 어절, VCCV 단위에 대해 언어모델을 구성하여 복잡도를 계산하였다. 그 결과 VCCV 단위의 복잡도가 형태소나 어절보다 적게 나오는 것을 볼 수 있었다. 복잡도가 적게 나온 VCCV를 기반으로 N-gram을 구성하고 Katz. Witten-Bell, absolute, modified Kneser-Ney smoothing 등의 방법을 이용한 언어 모델에 대해 평가하였다. 그 결과 VCCV 단위의 언어모델에 적합한 smoothing 기법은 modified Kneser-Ney 방법으로 평가되었다.

신경학적 손상에 의한 언어장애인 음성 인식률 개선(H/W, S/W)에 관한 연구 (A Study on Improving Speech Recognition Rate (H/W, S/W) of Speech Impairment by Neurological Injury)

  • 이형근;김순협;양기웅
    • 한국정보통신학회논문지
    • /
    • 제23권11호
    • /
    • pp.1397-1406
    • /
    • 2019
  • 신경학적 손상에 의한 언어장애인/비장애인 간의 일상적인 휴대폰 통화시 신경학적 손상으로 인한 발음의 정확도와 언어장애인의 발음 특징이 결합되어 원활한 의사소통을 저해하는 경우가 많다. 이러한 문제점을 개선하기 위하여 제한하는 방법은 언어장애인 특성에 맞춘 단어의 모호성(out of vocabulary) 개선과, 언어 장애인 구강 특성에 따른 어려운 발성 부분을 인위적으로 보정해주는 유도선이 포함된 MEMS(Micro Electro-mechanical System) Microphone 장치 개선이다. S/W적 개선은 도치기능이 포함된 결정트리이며, 연속어 특성을 감안하여 개선된 matrix-vector rnn 방법을 제시하였다. H/W와 S/W 특성을 감안하여 유사 사전을 만들어 원활한 의사소통을 위한 말명료도 향상에 기여하였다.

한국어 연결단어의 이음소 인식과 어절 형성에 관한 연구 (A Study on the Diphone Recognition of Korean Connected Words and Eojeol Reconstruction)

  • 김경선;정홍
    • 한국음향학회지
    • /
    • 제14권4호
    • /
    • pp.46-63
    • /
    • 1995
  • 본 논문에서는 시간지연신경망을 이용한 한국어 무제한 어휘 연결단어 인식 시스템에 대해 기술하였다. 인식단위로는 인접한 두음소의 천이과정을 포한하는 이음소 (diphone)를 사용하였으며 그 개수는 329개이다. 한국어 연결단어 인식과정은 음성신호의 특징 추출 과정, 이음소 인식과정과 후처리 과정의 세 단계로 구분된다. 특징 추출 단계에서는 입력 음성의 이음소 구간을 분리하여 16차의 필터밸크 (filter-bank) 계수를 구한다. 이음소 인식은 3단계의 계층적 구조로 이루어졌으며 총 30개의 시간지연신경망을 이용해 이음소를 인식한다. 특히, 사용된 시간지연신경망은 인식률을 높이기 위하여 기존의 시간 지연신경망 구조를 변경하였다. 후처리 단계는 음소 천이확률과 음소 혼동확률을 이용한 이음소 오인식 수정과정과 인식된 이음소를 결합하여 어절을 형성하는 과정으로 이루어진다.

  • PDF

한국어 방송 음성 인식에 관한 연구 (A Study on the Korean Broadcasting Speech Recognition)

  • 김석동;송도선;이행세
    • 한국음향학회지
    • /
    • 제18권1호
    • /
    • pp.53-60
    • /
    • 1999
  • 이 논문은 한국 방송 음성 인식에 관한 연구이다. 여기서 우리는 대규모 어휘를 갖는 연속 음성 인식을 위한 방법을 제시한다. 주요 관점은 언어 모델과 탐색 방법이다. 사용된 음성 모델은 기본음소 Semi-continuous HMM이고 언어 모델은 N-gram 방법이다. 탐색 방법은 음성과 언어 정보를 최대한 활용하기 위해 3단계의 방법을 사용하였다. 첫째로, 단어의 끝 부분과 그에 관련된 정보를 만들기 위한 순방향 Viterbi Beam탐색을 하였으며, 둘째로 단어 의 시작 부분과 그에 관련된 정보를 만드는 역방향 Viterbi Beam탐색, 그리고 마지막으로 이들 두 결과와 확률적인 언어 모델을 결합하여 최종 인식결과를 얻기 위해 A/sup */ 탐색을 한다. 이 방법을 사용하여 12,000개의 단어에 대한 화자 독립으로 최고 96.0%의 단어 인식률과 99.2%의 음절 인식률을 얻었다.

  • PDF

효율적인 하드웨어 구조의 Viterbi Scorer를 이용한 실시간 격리단어 인식 시스템의 구현 (A Real-Time Implementation of Isolated Word Recognition System Based on a Hardware-Efficient Viterbi Scorer)

  • 조윤석;김진율;오광석;이황수
    • The Journal of the Acoustical Society of Korea
    • /
    • 제13권2E호
    • /
    • pp.58-67
    • /
    • 1994
  • HMM을 이용한 알고리즘은 대용량 음성인식 시스템을 비롯하여 많은 시스템에 적용되어 왔다. 음성인식 시스템을 범용의 프로세서들을 가지고 구현할 경우 많은 계산량과 데이터들로 말미암아 실시간의 성능을 얻을 수 없다. 따라서 실시간 음성인식을 위해서는 인식을 가속화 시키기 위한 전용 하드웨어를 개발하는 것이 요구되어진다. 본 논문에서는 HMM을 이용한 격리단어 인식 시스템을 구현하는 내용을 다루고 있다. 음성인식 시스템은 호스트 컴퓨터와 DSP 보드 그리고 프로토타입 Viterbi scoring 보드로 이루어져 있다. 음성신호로부터 특징 벡터를 추출하는 과정은 DSP 보드에서 이루어지고, Viterbi scoring 보드는 세 개의 field-programmable gate array 칩들을 사용하여 설계되었다. Viterbi scoring 보드는 하드웨어적으로 효율적인 Viterbi scoring 구조를 채택하고 있고 음성인식을 위한 Viterbi 알고리즘을 수행한다. 제작된 시스템은 10MHz로 동작하고, 한 프레임 즉 10ms 동안에 100.000 스테이트를 처리할 수 있다.

  • PDF

지식 그래프와 딥러닝 모델 기반 텍스트와 이미지 데이터를 활용한 자동 표적 인식 방법 연구 (Automatic Target Recognition Study using Knowledge Graph and Deep Learning Models for Text and Image data)

  • 김종모;이정빈;전호철;손미애
    • 인터넷정보학회논문지
    • /
    • 제23권5호
    • /
    • pp.145-154
    • /
    • 2022
  • 자동 표적 인식(Automatic Target Recognition, ATR) 기술이 미래전투체계(Future Combat Systems, FCS)의 핵심 기술로 부상하고 있다. 그러나 정보통신(IT) 및 센싱 기술의 발전과 더불어 ATR에 관련이 있는 데이터는 휴민트(HUMINT·인적 정보) 및 시긴트(SIGINT·신호 정보)까지 확장되고 있음에도 불구하고, ATR 연구는 SAR 센서로부터 수집한 이미지, 즉 이민트(IMINT·영상 정보)에 대한 딥러닝 모델 연구가 주를 이룬다. 복잡하고 다변하는 전장 상황에서 이미지 데이터만으로는 높은 수준의 ATR의 정확성과 일반화 성능을 보장하기 어렵다. 본 논문에서는 이미지 및 텍스트 데이터를 동시에 활용할 수 있는 지식 그래프 기반의 ATR 방법을 제안한다. 지식 그래프와 딥러닝 모델 기반의 ATR 방법의 핵심은 ATR 이미지 및 텍스트를 각각의 데이터 특성에 맞게 그래프로 변환하고 이를 지식 그래프에 정렬하여 지식 그래프를 매개로 이질적인 ATR 데이터를 연결하는 것이다. ATR 이미지를 그래프로 변환하기 위해서, 사전 학습된 이미지 객체 인식 모델과 지식 그래프의 어휘를 활용하여 객체 태그를 노드로 구성된 객체-태그 그래프를 이미지로부터 생성한다. 반면, ATR 텍스트는 사전 학습된 언어 모델, TF-IDF, co-occurrence word 그래프 및 지식 그래프의 어휘를 활용하여 ATR에 중요한 핵심 어휘를 노드로 구성된 단어 그래프를 생성한다. 생성된 두 유형의 그래프는 엔터티 얼라이먼트 모델을 활용하여 지식 그래프와 연결됨으로 이미지 및 텍스트로부터의 ATR 수행을 완성한다. 제안된 방법의 우수성을 입증하기 위해 웹 문서로부터 227개의 문서와 dbpedia로부터 61,714개의 RDF 트리플을 수집하였고, 엔터티 얼라이먼트(혹은 정렬)의 accuracy, recall, 및 f1-score에 대한 비교실험을 수행하였다.

후지쯔에 있어서의 음성 자동인식의 현상과 장래 (Automatic Speech Recognition Research at Fujitsu)

  • 나라 야스히로;기무라 신타;김경호
    • 한국음향학회지
    • /
    • 제10권1호
    • /
    • pp.82-91
    • /
    • 1991
  • 본 논문에서는, 후지쯔의 음성 자동인식 관련 제품 개발의 역사, 현재의 상품, 그리고 앞으로의 연구 개발에 대해서 소개한다. 현재는 4,000단어로 부터 12,000단어를 인식하는 특정 화자형의 F2360, 17단어를 인식하는 불특정 화자형의 F2355 L/S를 판매하고 있으며, 앞으로의 연구 개발로는 음소 변형에 적극적으로 대처하고, 자연적인 발성을 인식하기 위한 기초 기술을 개발할 계획에 있다. 인식할 단어의 문자 표기에 음향 segment 변형 규칙을 적용하여 음향 segment network를 자동 생산하여서 입력 음성과의 조합을 행한다. 이 기초 기술을 대어휘 단어 음성 인식에 응용하기 위해서 필요한 단어 후보 선택 방식, 문절 발성을 문장 입력에 응용하기 위한 문절 후보 생성 방식과 문 검사 방식에 대해서도 서술한다.

  • PDF