• 제목/요약/키워드: ASR system

검색결과 108건 처리시간 0.026초

바이모달 음성인식기의 시각 특징 추출을 위한 색상 분석자 SVM을 이용한 입술 위치 검출 (Lip Detection using Color Distribution and Support Vector Machine for Visual Feature Extraction of Bimodal Speech Recognition System)

  • 정지년;양현승
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제31권4호
    • /
    • pp.403-410
    • /
    • 2004
  • 바이모달 음성인식기는 잡음 환경하 음성인식 성능을 향상하기 위해 고안되었다. 바이모달 음 성인식기에 있어 영상을 통한 시각 특징 추출은 매우 중요한 역할을 하며 이를 위한 입술 위치 검출은 시각 특징 추출을 위한 중요한 선결 과제이다 본 논문은 색상분포와 SVM을 이용하여 시각 특징 추출을 위한 입술 위치 검출 방법을 제안하였다. 제안된 방법은 얼굴색/입술 색상 분포를 학습하여 이로부터 입술의 초기 위치를 빠르게 찾아내고 SVM을 이용하여 입술의 정확한 위치를 찾음으로써 정확하고 빠르게 입술의 위치를 찾도록 하였으며 실험을 통해 바이모달 인식기에 적용하기에 적합함을 알 수 있었다.

가변 신뢰도 문턱치를 사용한 미등록어 거절 알고리즘에 대한 연구 (A Study on Out-of-Vocabulary Rejection Algorithms using Variable Confidence Thresholds)

  • 방기덕;강철호
    • 한국멀티미디어학회논문지
    • /
    • 제11권11호
    • /
    • pp.1471-1479
    • /
    • 2008
  • 본 논문에서는 음성인식 분야에서 많이 사용되고 있는 가변어휘 단어 인식 시스템에서 미등록어에 대한 거절 성능을 향상시키는 방법을 제안한다. 거절 기능을 구현하는 방식은 핵심어 검출(keyword spotting)방식과 발화검증(utterance verification)으로 구분이 된다. 발화 검증 방식은 각 음소마다 이와 유사한 반음소모델(anti-phoneme model)을 생성한 후 정상적인 음소 모델과 반음소 모델의 유사도를 비교하여 결정하는 방식이다. 본 논문에서는 화자가 발성할 때마다 구해지는 화자확인 확률값을 신뢰도 문턱치를 결정할 때 적용하는 방법에 대하여 제안하였다. 제안한 방법을 사용하였을 때, 사무실 환경에서 CA(Correctly Accepted for keyword)가 94.23%, CR(Correctly Rejected for out-of-vocabulary)이 95.11%로 나타났고, 잡음 환경에서는 CA가 91.14%, CR이 92.74%로 나타나서 성능이 향상됨을 확인할 수 있었다.

  • PDF

Developing an Embedded Method to Recognize Human Pilot Intentions In an Intelligent Cockpit Aids for the Pilot Decision Support System

  • 차우창
    • 대한인간공학회지
    • /
    • 제17권3호
    • /
    • pp.23-39
    • /
    • 1998
  • Several recent aircraft accidents occurred due to goal conflicts between human and machine actors. To facilitate the management of the cockpit activities considering these observations. a computational aid. the Agenda Manager (AM) has been developed for use in simulated cockpit environments. It is important to know pilot intentions performing cockpit operations accurately to improve AM performance. Without accurate knowledge of pilot goals or intentions, the information from AM may lead to the wrong direction to the pilot who is using the information. To provide a reliable flight simulation environment regarding goal conflicts. a pilot goal communication method (GCM) was developed to facilitate accurate recognition of pilot goals. Embedded within AM, the GCM was used to recognize pilot goals and to declare them to the AM. Two approaches to the recognition of pilots goals were considered: (1) The use of an Automatic Speech Recognition (ASR) system to recognize overtly or explicitly declared pilot goals. and (2) inference of covertly or implicitly declared pilot goals via the use of an intent inferencing mechanism. The integrated mode of these two methods could overcome the covert goal mis-understanding by use of overt GCM. And also could it overcome workload concern with overt mode by the use of covert GCM. Through simulated flight environment experimentation with real pilot subjects, the proposed GCM has demonstrated its capability to recognize pilot intentions with a certain degree of accuracy and to handle incorrectly declared goals. and was validated in terms of subjective workload and pilot flight control performance. The GCM communicating pilot goals were implemented within the AM to provide a rich environment for the study of human-machine interactions in the supervisory control of complex dynamic systems.

  • PDF

국내의 갈릴레오 탐색구조 지상시스템 개발 방안에 관한 연구 (Study on Development Method for Galileo/SAR Ground System in Korea)

  • 주인원;이상욱;김재훈
    • 한국위성정보통신학회논문지
    • /
    • 제2권1호
    • /
    • pp.35-40
    • /
    • 2007
  • COSPAS-SARSAT 시스템은 위성체와 지상 설비를 이용하여 항공기 또는 선박 등이 조난 시에 탐색구조 (SAR: Search and Rescue) 활동을 도울 수 있도록 조난경보와 위치정보를 제공하는 시스템이다. COSPAS-SARSAT 서비스의 경우, 조난신호 접수에서 구조시작까지 평군 1사간 이상이 소요되고, 위치정확도가 5Km 정도로 범위가 넓은 편이다. 이러한 문제점을 개선하기 위해서 중궤도 위성을 이용한 차세대 탐색구조 시스템 개발이 추진 중에 있으며 EU에서 2011년 FOC(Full Operation Capability)를 목표로 개발중인 갈릴레이 항법위성 프로젝트의 경우 SAR 중계기를 탐재하여 탐색구조 서비스를 제공할 계획에 있다. 갈릴레오 탐색구조(SAR/Galileo)서비스는 수 m급의 위치정확도, 10분 이내의 조난신호 접수에서 구조까지 소요실간. 및 조난자에게 회신링크 서비스 제공 등 보다 향상된 탐색구조 성능을 제공하기 위해 개발 중에 있으므로, 갈릴레오 위성 서비스가 시작되면 탐색구조시스템 체계에 보다 신속하고 정확한 구조가 가능할 것으로 예상된다. 우리나라도 날로 더해가는 다양한 재난에 대한 인명구조를 신속하고 효과적으로 대처하기 위해 차세대 갈릴레오 탐색구조 지상국 도입이 필요하며, 탐색구조 단말기를 포함한 지상국 인프라의 구축 등 갈릴레오 탐색구조 지상시스템 개발 방안에 관한 연구는 매이 시기적절하고 중요한 연구이다. 본 논문은 우리나라가 차세대9 갈릴레오 탐색구조 지상시스템 개발을 위해 필요한 갈릴레오 프로젝트의 참여절차 및 참여전략을 수립하고, 현실적으로 개발이 가능한 개발 범위를 도출하며 개발을 위한 추진체계에 대해서 제안한다.

  • PDF

차량에서의 음성인식율 향상을 위한 전처리 기법 (Preprocessing Technique for Improvement of Speech Recognition in a Car)

  • 김현태;박장식
    • 한국콘텐츠학회논문지
    • /
    • 제9권1호
    • /
    • pp.139-146
    • /
    • 2009
  • 본 논문에서는 차량에서의 자동 음성인식 시스템과 같이 신호대잡음비가 낮은 잡음 환경에서의 음성인식에 적합한 변형된 스펙트럼 차감법을 제안한다. 기존의 스펙트럼 차감법은 스펙트럼에서 낮은 신호대 잡음비(SNR)를 갖는 부분은 감쇄되고, 신호대잡음비가 높은 부분은 강조되는 신호대잡음비에 의존한다. 그러나 이러한 구성은 높은 신호대잡음비를 갖는 환경에서는 적절하나 차량 환경과 같이 낮은 신호대잡음비를 나타내는 환경에서는 매우 부적절하다. 제안하는 방법은 낮은 신호대잡음비를 갖는 잡음 환경을 위해 음성우세영역을 강조하여 불필요하게 음성영역이 과차감되지 않도록 방지한다. 차량용 음성명령어 어휘를 대상으로 한 실험 결과에서 제안하는 방법이 기존의 방법에 비해 우수한 것을 확인하였다.

Cancer Incidence in Southwest of Iran: First Report from Khuzestan Population-Based Cancer Registry, 2002-2009

  • Talaiezadeh, Abdolhassan;Tabesh, Hamed;Sattari, Alireza;Ebrahimi, Shahram
    • Asian Pacific Journal of Cancer Prevention
    • /
    • 제14권12호
    • /
    • pp.7517-7522
    • /
    • 2013
  • Background: Cancer incidence rates are increasing particularly in developing countries. It is crucial for policy makers to know basic cancer epidemiology in each region to design comprehensive prevention plans. There have hitherto been no population-based data available for cancer in Khuzestan province. The present report is a first from the regional population-based cancer registry for the period of 2002-2009. Materials and Methods: Data were collected retrospectively reviewing all new cancer patients whom were registered in Khuzestan province cancer registry during an 8-year period (2002-2009). All cases were coded based on the ICD-O-3 coding system and collected data were computerized using SPSS (Chicago, IL) software, version 11.5. The age standardized incidence rates (ASRs) per 100,000 person-year for all cancers were computed using the indirect method of standardization to the world population. Results: During the 8-year study period, 16,801 new cancer cases were registered. Based on the computed ASRs, the five most frequent malignancies in females were breast (26.4 per 100,000), skin (13.6), colorectal (5.72), stomach (4.31) and bladder(4.07) and in males, the five most frequent were skin (16.0 per 100,000), bladder (10.7),prostate (7.64), stomach (7.17), and colorectal (6.32).The ASR for all malignancies in women was 92.5 per 100,000, and that for men was 87.4. Conclusions: The observed patterns from the analysis of Khuzestan cancer registry data will lead to better understanding of the epidemiology of various malignancies in this part ofthe country and consequently provide a useful guide for authorities to make efficacious decisions and policies about a cancer control program for south-west Iran.

Adapting the Australian System: Is an Organised Screening Program Feasible in Malaysia? - An Overview of the Cervical Cancer Screening in Both Countries

  • Abdul Rashid, Rima Marhayu;Dahlui, Maznah;Mohamed, Majdah;Gertig, Dorota
    • Asian Pacific Journal of Cancer Prevention
    • /
    • 제14권3호
    • /
    • pp.2141-2146
    • /
    • 2013
  • Cervical cancer is the third most common form of cancer that strikes Malaysian women. The National Cancer Registry in 2006 and 2007 reported that the age standardized incidence (ASR) of cervical cancer was 12.2 and 7.8 per 100,000 women, respectively. The cumulative risk of developing cervical cancer for a Malaysian woman is 0.9 for 74 years. Among all ethnic groups, the Chinese experienced the highest incidence rate in 2006, followed by Indians and Malays. The percentage cervical cancer detected at stage I and II was 55% (stage I: 21.0%, stage II: 34.0%, stage III: 26.0% and stage IV: 19.0%). Data from Ministry of Health Malaysia (2006) showed a 58.9% estimated coverage of pap smear screening conducted among those aged 30-49 years. Only a small percentage of women aged 50-59 and 50-65 years old were screened, 14% and 13.8% coverage, respectively. Incidence of cervical cancer was highest (71.6%) among those in the 60-65 age group (MOH, 2003). Currently, there is no organized population-based screening program available for the whole of Malaysia. A pilot project was initiated in 2006, to move from opportunistic cervical screening of women who attend antenatal and postnatal visits to a population based approach to be able to monitor the women through the screening pathway and encourage women at highest risk to be screened. The project was modelled on the screening program in Australia with some modifications to suit the Malaysian setting. Substantial challenges have been identified, particularly in relation to information systems for call and recall of women, as well as laboratory reporting and quality assurance. A cost-effective locally-specific approach to organized screening, that will provide the infrastructure for increasing participation in the cervical cancer screening program, is urgently required.

손실 데이터 이론을 이용한 강인한 음성 인식 (Robust Speech Recognition Using Missing Data Theory)

  • 김락용;조훈영;오영환
    • 한국음향학회지
    • /
    • 제20권3호
    • /
    • pp.56-62
    • /
    • 2001
  • 본 논문에서는 손실이 발생하는 상황에서 높은 인식률을 유지하기 위해서 손실 데이터 이론을 음성 인식기에 적용하였다 손실 데이터 이론은 일반적으로 이용되는 통계적 정합 방법인 은닉 마코프 모델 (HMM: hidden Markov model) 중 연속 Gaussian확률 밀도 함수를 이용하여 음성 특징들의 출력 확률을 나타내는 경우에 쉽게 적용할 수 있다는 장점을 갖고 있다. 손실 데이터 이론의 방법 중 계산량이 적고 인식기에 적용이 쉬운 주변화(marginalization)방법을 사용하였으며 특징 벡터의 특정 차수나 시간열의 손실 검출 방법은 음성 신호의 에너지와 주위 배경 잡음의 에너지의 차이가 임계치보다 작게 되는 부분을 찾는 주파수 차감 방법을 이용하였다. 본 논문에서 제안한 손실 영역의 신뢰도 평가는 분석 구간이 모음일 확률을 계산해서 비교적 잉여 정보가 많이 포함된 모음화된 구간의 손실만을 처리하도록 하였다. 제안한 방법을 사용하여 여러 잡음 환경에 대해서 기존의 손실 데이터 처리 방법만을 사용한 경우보다 452 단어의 화자독립 단어 인식 실험을 수행한 결과 오류율측면에서 평균적으로 약 12%의 성능 향상을 얻을 수 있었다.

  • PDF

Epidemiological Trends of Histopathologically WHO Classified CNS Tumors in Developing Countries: Systematic Review

  • Khan, Ishaq;Bangash, Mohammed;Baeesa, Saleh;Jamal, Awatif;Carracedo, Angel;Alghamdi, Fahad;Qashqari, Hanadi;Abuzenadah, Adel;AlQahtani, Mohammed;Damanhouri, Ghazi;Chaudhary, Adeel;Hussein, Deema
    • Asian Pacific Journal of Cancer Prevention
    • /
    • 제16권1호
    • /
    • pp.205-216
    • /
    • 2015
  • Background: Many developing countries are lagging behind in reporting epidemiological data for individual central nervous system (CNS) tumors. This paper aimed to elicit patterns for the epidemiology of individual World Health Organization (WHO) classified CNS tumors in countries registered by WHO as "developing". Materials and Methods: Cyber search was carried out through 66 cancer networks/registries and 181 PubMed published papers that reported counts of CNS tumors for the period of 2009-2012. The relationship between the natural log of incidence Age Standardized Rate (ASR) reported by Globocan and Latitude/ Longitude was investigated. Results: Registries for 21 countries displayed information related to CNS tumors. In contrast tends for classified CNS tumor cases were identified for 38 countries via 181 PubMed publications. Extracted data showed a majority of unclassified reported cases [PubMed (38 countries, 45.7%), registries (21 countries, 96.1%)]. For classified tumors, astrocytic tumors were the most frequently reported type [PubMed (38 countries, 1,245 cases, 15.7%), registries (21 countries, 627 cases, 1.99%]. A significant linear regression relationship emerged between latitudes and reported cases of CNS tumors. Conclusions: Previously unreported trends of frequencies for individually classified CNS tumors were elucidated and a possible link of CNS tumors occurrence with geographical location emerged.

잡음 환경에 효과적인 음성인식을 위한 특징 보상 이득 기반의 음성 향상 기법 (Speech enhancement method based on feature compensation gain for effective speech recognition in noisy environments)

  • 배아라;김우일
    • 한국음향학회지
    • /
    • 제38권1호
    • /
    • pp.51-55
    • /
    • 2019
  • 본 논문에서는 잡음 환경에 강인한 음성 인식 성능을 위해 특징 보상 이득을 이용한 음성 향상 기법을 제안한다. 본 논문에서는 변분모델 생성 기법을 채용한 병렬 결합된 가우스 혼합 모델(Parallel Combined Gaussian Mixture Model, PCGMM) 기반의 특징 보상 기법으로부터 계산할 수 있는 특징 보상 이득을 이용하는 음성 향상 기술을 제안한다. 불일치 환경 음성 인식 시스템 적용 환경에서 본 논문에서 제안하는 기법이 실험 결과에서 기존의 전처리 기법 및 이전 연구에서 제안된 특징 보상 기반의 음성 향상 기법에 비해 다양한 잡음 및 SNR(Signal to Noise Ratio) 조건에서 월등한 인식 성능을 나타내는 것을 확인한다. 또한 잡음 모델 선택 기법을 적용함으로써 음성 인식 성능을 유사한 수준으로 유지하면서 계산량을 대폭적으로 감축할 수 있다.