• 제목/요약/키워드: 음운 오류

검색결과 48건 처리시간 0.025초

예외 단어 선별 작업을 이용한 자동 발음열 생성 시스템의 성능향상에 관한 연구

  • 안주은;김선희;김순협
    • 대한음성언어의학회:학술대회논문집
    • /
    • 대한음성언어의학회 2003년도 제19회 학술대회
    • /
    • pp.142-142
    • /
    • 2003
  • 본 연구는 텍스트 분석 기반 자동 발음열 생성 시스템의 성능을 향상시킬 수 있는 방법으로 예외 단어 선별 작업을 제안한다. 제안하는 자동 발음열 생성 시스템은 형태음운 규칙 적용, 예외 규칙 적용, 일반음운 규칙 적용의 순서로 이루어진다. 이 때 예외 규칙은 예외사전을 검색하여 해당 어휘가 있을 때에만 적용하게 되는데, 예외 단어는 일정한 예외 환경에서만 나타난다. 본 시스템의 예외 사전에 있는 예외 단어는 5만여 어휘 연세사전에서 예외 환경에 해당하는 28,486개의 어휘 중, 총 2,931개의 예외 단어를 선별하였다. 본 시스템의 성능 평가는 ETRI 2,385, PBS 1,637 어절을 사용하였는데 실험 결과 각각 99.8%, 99.9%의 정확도를 보였고, 0.1% 의 오류는 예외 규칙 중에 하나인 어휘적 경음화 현상에서 나타났다. 따라서 예외 사전을 보다 정확하게 만드는 방법인, 예외 단어 선별 작업을 통해 본 시스템의 성능을 향상시킬 수 있다. (중략)

  • PDF

음절 복원 알고리즘을 이용한 핵심어 오류 보정 시스템 (Key-word Error Correction System using Syllable Restoration Algorithm)

  • 안찬식;오상엽
    • 한국컴퓨터정보학회논문지
    • /
    • 제15권10호
    • /
    • pp.165-172
    • /
    • 2010
  • 어휘 인식 시스템의 오류 보정방법으로는 오류 패턴매칭 기반 방법과 어휘의미 패턴 기반방법이있으며, 이들 방법에서는 오류 보정을 위해 핵심어를 의미적으로 분석하지 못하는 문제점을 가지고 있다. 이를 개선하기 위해 본 논문에서는 음절 복원 알고리즘을 이용한 핵심어 오류 보정 시스템을 제안한다. 인식된 음소 열을 의미 분석 과정을 거쳐 음소가 갖는 의미를 파악하고 음절 복원 알고리즘을 통해 음운 변동이 적용되기 이전의 문자열로 복원하므로 핵심어를 명확히 분석하고 오인식을 줄일 수 있다. 시스템 분석을 위해 음소 유사율과 신뢰도를 이용하여 오류 보정율을 구하였으며, 어휘 인식 과정에서 오류로 판명된 어휘에 대하여 오류 보정을 수행하였다. 에러 패턴 학습을 이용한 방법과 오류 패턴 매칭 기반 방법, 어휘 의미 패턴 기반 방법의 성능 평가 결과 3.0%의 인식 향상율을 보였다.

학습을 통한 발음 변이 규칙 유도 및 적응을 이용한 영역 의존 발음 사전 자동 생성 (Automatic Generation of Domain-Dependent Pronunciation Lexicon with Data-Driven Rules and Rule Adaptation)

  • 전재훈;정민화
    • 한국인지과학회:학술대회논문집
    • /
    • 한국인지과학회 2005년도 춘계학술대회
    • /
    • pp.233-238
    • /
    • 2005
  • 본 논문에서는 학습을 이용한 발음 변이 모델링을 통해 특정 영역에 최적화된 발음 사전 자동 생성의 방법을 제시하였다. 학습 방법을 이용한 발음 변이 모델링의 오류를 최소화 하기 위하여 본 논문에서는 발음 변이 규칙의 적응 기법을 도입하였다. 발음 변이 규칙의 적응은 대용량 음성 말뭉치에서 발음 변이 규칙을 유도한 후, 상대적으로 작은 용량의 음성 말뭉치에서 유도한 규칙과의 결합을 통해 이루어 진다. 본 논문에서 사용된 발음 사전은 해당 형태소의 앞 뒤 음소 문맥의 음운 현상을 반영한 발음 사전이며, 학습 방법으로 얻어진 발음 변이 규칙을 대용량 문자 말뭉치에 적용하여 해당 형태소의 발음을 자동 생성하였다. 발음 사전의 평균 발음의 수는 적용된 발음 변이 규칙의 확률 값들의 한계 값 조정에 의해 이루어졌다. 기존의 지식 기반의 발음 사전과 비교 할 때, 본 방법론으로 작성된 발음 사전을 이용한 대화체 음성 인식 실험에서 0.8%의 단어 오류율(WER)이 감소하였다. 또한 사전에 포함된 형태소의 평균 발음 변이 수에서도 기존의 방법론에서 보다 5.6% 적은 수에서 최상의 성능을 보였다.

  • PDF

연속 음성 문자열에 대한 한국어 띄어쓰기 시스템 (Korean Spacing System for Continuous Speech Characters)

  • 김계성;이현주;김성규;최재혁;이상조
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1998년도 제10회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.391-395
    • /
    • 1998
  • 대용량의 연속된 음성을 인식하는 데에는 형태소 사이의 음운변동과 언절과 어절 사이의 불일치 등으로 인한 어려움이 따른다. 그러므로 언어학적인 지식을 이용한 자연어 처리 기술과의 결합이 필수적이라 할 수 있다. 본 논문에서는 문장 단위의 연속 음성 문자열을 올바른 어절로 띄어주는 시스템을 제안한다. 먼저 띄어쓰기 발음열 사전을 이용하여 어절의 경계를 추정한다. 이 때 보다 정확한 띄어쓰기 위치를 추정하기 위하여 2음절 이상의 최장 조사 어미와 음절 분리가능빈도가 이용된다. 이렇게 해서 분리된 어절들은 음절 복원기를 거친 뒤, 형태소 분석을 행하여 올바른 어절인지를 검사한다. 분석에 실패한 어절은 띄어쓰기 오류 유형에 따라 교정을 한 후 형태소 분석을 재시도한다. 제안한 시스템을 테스트해 본 결과 96.8%의 정확도를 보였다. 본 시스템은 음운 변동 처리기와 함께 말소리를 음성 그대로 인식하는 인식기의 후처리로 이용할 수 있을 것이다.

  • PDF

미등록어 거절을 이용한 오류 보정 방법 개선 시스템 (Error Correction Methode Improve System using Out-of Vocabulary Rejection)

  • 안찬식;오상엽
    • 디지털융복합연구
    • /
    • 제10권8호
    • /
    • pp.173-178
    • /
    • 2012
  • 어휘 인식을 위한 모델 생성에서 준비하지 않은 트라이폰이 생성된다. 이는 모델 파라미터의 초기 추정치를 생성하지 못하는 원인으로 어휘 모델을 구성할 수 없는 단점으로 나타난다. 결과적으로 가우시안 모델의 정교함이 떨어지게 되어 인식률을 저하시키게 된다. 이를 개선하기 위한 방법으로 미등록 어휘 거절 알고리즘을 이용한 오류 보정 시스템을 제안한다. 이 방법은 어휘 인식 모델 생성 시 등록되지 않은 어휘를 거절하여 인식률을 향상시킨다. 또한 확률 분포를 이용하여 어휘 분석과 의미를 파악하고 음운 변동이 적용되기 전의 문자열로 복원시킨다. 시스템 분석은 음소 유사율과 신뢰도를 이용하여 오류 보정율을 확인하였고 성능 평가를 위해 에러 패턴, 오류 패턴, 의미 패턴 방법을 이용하여 평가하였다. 성능 평가 결과 2.8%의 오류 보정률의 향상을 보였다.

노년층과 청년층의 상위범주어 과제 수행력 비교 (Comparison of Performance on Superordinate Word Tasks in Elderly and Young Adults)

  • 김형무;윤지혜
    • 재활복지
    • /
    • 제20권4호
    • /
    • pp.229-246
    • /
    • 2016
  • 본 연구에서는 노년층 40명과 청년층 43명을 대상으로 상위범주어 선택과제를 실시하여 정반응 및 반응시간을 비교하였고, 상위범주어 쓰기과제를 실시하여 정반응 및 오류양상의 차이를 비교하였다. 분석결과, 첫째, 상위범주어 선택 및 쓰기 과제 모두 노년층은 청년층 보다 정반응수가 더 적었다. 둘째, 노년층은 상위범주어 선택과제에서의 반응시간이 유의미하게 느렸다. 셋째, 상위범주어 쓰기과제의 오류양상에서는 노년층은 무관오류보다 연관 오류를 더 빈번하게 보였다. 노년층이 선택과제와 쓰기과제에서 더 낮은 정반응 수를 보인 결과는 정상적인 노화가 진행되면서 의미어휘사전 내 정보 간의 연결이 약화되거나 활성화가 저하되기 때문이라고 볼 수 있다. 반응시간이 긴 이유는 노화에 따른 뇌의 신경생리적 변화와 인지처리 속도 저하에 기인할 수 있다. 목표 상위범주어와 연관된 단어를 산출하는 오류를 보인 것은 비록 노년층이 단어를 완벽히 산출할 수는 없을지라도 목표 단어의 어휘집에 접근하여 의미적으로 연관된 단어를 에둘러 산출하고 목표단어가 가지고 있는 특성들에 대해 우회적으로 설명하는 방식을 취하고 있음을 시사한다.

원자로내 용융물 재배치시 용기 하부의 온도 거동

  • 강경호;김종환;김상백;김희동;김현섭;허훈
    • 한국원자력학회:학술대회논문집
    • /
    • 한국원자력학회 1997년도 춘계학술발표회논문집(1)
    • /
    • pp.581-586
    • /
    • 1997
  • 중대사고시 노심의 손상에 의한 노심용융물이 원자로 용기 하부 반구로 재배치될 때 고온의 노심용융물에 의한 열적 부하로 원자로 용기의 파손을 일으키게 된다. 원자로 용기하부 반구 내에서의 노심용융물의 열적 거동 및 하부 반구에 대한 열적 부하에 대한 분석은 용융물의 성분 및 재배치 과정의 복잡성 등으로 인한 실험적 모사의 한계성 및 현상 분석의 난이함에도 불구하고 기존 원자로의 중대사고에 대한 안전 여유도의 제고와 이에 따른 노내외 사고 관리 전략의 수립을 위하여 연구의 필요성이 제기된다. 본 연구에서는 노심용융물 냉각연구(SONATA-IV)의 예비 실험으로 노심용융물의 상사물로 $Al_2$O$_3$/Fe Thermite 용융물을 이용하여 실제 원자로 용기 하부 반구를 1/8 로 선형 축소한 반구형 실험 용기로 주입하는 실험을 수행하였다. 아울러 원자로 용기 하부 반구로 재배치된 노심용융물에 의한 열적, 기계적 부하에 대한 분석을 수행하기 개발된 유한 요소 프로그램인 CALF (Computer Analysis for Lower Head Failure ) 코드를 이용한 하부 반구의 열적 거동에 대한 해석 결과를 정리하였다. 용융물 주입 실험 결과 용융물 주입과 동시에 하부 반구에 직경 5cm 크기의 하부 반구 파손이 발생하였다. 이는 고온 용융물에 의한 제트류(Jet Impingement)의 효과로 생각된다 동일한 조건에서 CALF 코드로 하부 반구의 열적 거동을 분석하였는데, 실험과는 달리 하부 반구의 파손이 발생하지 않았다 이같은 해석 결과는 용융물의 제트류 효과가 존재하지 않는다면 고온의 용융물이 하부 반구 내로 재배치되더라도 하부 반구의 파손이 발생하지 않는다는 것을 보여준다.>$_3$ 흡착제 제조시 TiO$_2$ 함량에 따른 Co$^{2+}$ 흡착량과 25$0^{\circ}C$의 고온에서 ZrO$_2$$Al_2$O$_3$의 표면에 생성된 코발트 화합물을 XPS와 EPMA로 부터 확인하였다.인을 명시적으로 설명할 수 있다. 둘째, 오류의 시발점을 정확히 포착하여 동기가 분명한 수정대책을 강구할 수 있다. 셋째, 음운 과 정의 분석 모델은 새로운 언어 학습시에 관련된 언어 상호간의 구조적 마찰을 설명해 줄 수 있다. 넷째, 불규칙적이며 종잡기 힘들고 단편적인 것으로만 보이던 중간언어도 일정한 체계 속에서 변화한다는 사실을 알 수 있다. 다섯째, 종전의 오류 분석에서는 지나치게 모국어의 영향만 강조하고 다른 요인들에 대해서는 다분히 추상적인 언급으로 끝났지만 이 분석을 통 해서 배경어, 목표어, 특히 중간규칙의 역할이 괄목할 만한 것임을 가시적으로 관찰할 수 있 다. 이와 같은 오류분석 방법은 학습자의 모국어 및 관련 외국어의 음운규칙만 알면 어느 학습대상 외국어에라도 적용할 수 있는 보편성을 지니는 것으로 사료된다.없다. 그렇다면 겹의문사를 [-wh]의리를 지 닌 의문사의 병렬로 분석할 수 없다. 예를 들어 누구누구를 [주구-이-ν가] [누구누구-이- ν가]로부터 생성되었다고 볼 수 없다. 그러므로 [-wh] 겹의문사는 복수 의미를 지닐 수 없 다. 그러면 단수 의미는 어떻게 생성되는가\ulcorner 본 논문에서는 표면적 형태에도 불구하고 [-wh]의미의 겹의문사는 병렬적 관계의 합성어가 아니라 내부구조를 지니지 않은 단순한 단어(minim

  • PDF

발전소의 사고 또는 비정상 조건으로 원자로용기내의 증기 또는 수소기체가 발생시 이를 제거하기 위한 설계 분석

  • 민경성;이세용
    • 한국원자력학회:학술대회논문집
    • /
    • 한국원자력학회 1996년도 춘계학술발표회논문집(2)
    • /
    • pp.141-147
    • /
    • 1996
  • 1979년 3월 Three Mile Island 2 (TMI-2) 발전소에서 사고가 발생했을 때 원자로용기내에 생성된 수소기체로 인하여 운전원은 원자로용기의 수위를 정확히 측정할 수 없었으며, 이로 인하여 사고상태를 신속히 파악하지 못하였다. TMI 사고이후 미국 원자력규제위원회 NRC는 이 같은 문제점을 해결하고자 미국내 모든 원전에서 사고 또는 비정상 조건이 발생할 경우에 원자로 용기 수위에 대하여 운전원이 신뢰성을 갖을 수 있는 후속조치를 수행토록 요구하였다. 또한 미국의 대표적인 전력연구소인 EFRI에서는 개량형 경수로 (Advanced Light Water Reactor : ALWR) 설계 요건으로 이러한 설계가 반영되도록 요건화 하였다.[1]. 본 논문에서는 2,825 MWt급 한국형 표준원전을 대상으로 EPRI에서 요구한 설계요건에 따라 TMI 2 발전소에서와 같은 사고로 인하여 수소기체가 발생했을 경우와 발전소가 비정상 상태로 인하여 증기가 발생했을 경우에, 이를 신속히 제거하여 운전원이 원자로용기의 수위를 정확히 감지할 수 있도록 하는 설계 방안을 검토하였다. 따라서, 설계방안으로 원자로용기에 모인 증기 또는 수소기체를 계통중 가장 높은 위치에 있으며, 계통구성 기기중 유일하게 2상을 유지하고 있는 가압기로 배출시키고자 두 기기간에 연결관을 설치하는 방안에 대해서 분석하였다. 원자로용기 상부해드와 가압기를 연결하는 방안은 여러가지가 있으나, 검토한 결과 한국형 표준원전에서는 연결관을 가압기 상부해드보다 4m 높게하여 원자로용기 상부해드와 연결하는 방안이 EPRI의 설계요건을 만족하면서 기존설계에 영향을 가장 적게 미치는 적합한 설계방안으로 분석되었다.크다는 단점이 있다.TEX>$_2$O$_3$ 흡착제 제조시 TiO$_2$ 함량에 따른 Co$^{2+}$ 흡착량과 25$0^{\circ}C$의 고온에서 ZrO$_2$$Al_2$O$_3$의 표면에 생성된 코발트 화합물을 XPS와 EPMA로 부터 확인하였다.인을 명시적으로 설명할 수 있다. 둘째, 오류의 시발점을 정확히 포착하여 동기가 분명한 수정대책을 강구할 수 있다. 셋째, 음운 과 정의 분석 모델은 새로운 언어 학습시에 관련된 언어 상호간의 구조적 마찰을 설명해 줄 수 있다. 넷째, 불규칙적이며 종잡기 힘들고 단편적인 것으로만 보이던 중간언어도 일정한 체계 속에서 변화한다는 사실을 알 수 있다. 다섯째, 종전의 오류 분석에서는 지나치게 모국어의 영향만 강조하고 다른 요인들에 대해서는 다분히 추상적인 언급으로 끝났지만 이 분석을 통 해서 배경어, 목표어, 특히 중간규칙의 역할이 괄목할 만한 것임을 가시적으로 관찰할 수 있 다. 이와 같은 오류분석 방법은 학습자의 모국어 및 관련 외국어의 음운규칙만 알면 어느 학습대상 외국어에라도 적용할 수 있는 보편성을 지니는 것으로 사료된다.없다. 그렇다면 겹의문사를 [-wh]의리를 지 닌 의문사의 병렬로 분석할 수 없다. 예를 들어 누구누구를 [주구-이-ν가] [누구누구-이- ν가]로부터 생성되었다고 볼 수 없다. 그러므로 [-wh] 겹의문사는 복수 의미를 지닐 수 없 다. 그러면 단수 의미는 어떻게 생성되는가\ulcorner 본 논문에서는 표면적 형태에도 불구하고

  • PDF

Mid-loop 운전중 RHR 기능 상실사고시 최대압력 및 보조급수 공급 여유시간 분석

  • 김원석;정영종;장원표
    • 한국원자력학회:학술대회논문집
    • /
    • 한국원자력학회 1996년도 춘계학술발표회논문집(2)
    • /
    • pp.473-480
    • /
    • 1996
  • 영광 3/4호기 mid-loop 운전중 잔열제거(RHR) 기능 상실사고시 열수력적 현상을 최적 전산코드인 CATHARE2를 이용하여 해석하였다. 이러한 사고시 열수력적 현상은 일,이차측 냉각재 방출유로와 계통내 비응축성 가스의 거동에 의해 크게 영향을 받는다. 본 연구에서는 2개의 경우를 모의하였는데, 하나는 계통내 방출유로가 있는 경우이며 다른 하나는 방출유로가 없는 경우를 계산하였다. 이 때 사용된 가정은 다음과 같다. (가) 계통은 부분충수 운전 상태로 상부에 비응축성 가스나 증기로 가득 차 있다. (나) 증기발생기는 1대만이 이용 가능하고 이차측은 습식보관 상태이며, 보조급수는 공급되지 않고 이차측 압력은 대기압 상태이다 (다) 사고는 원자로 정지후 2일후 발생한다. 이와같은 조건하에서 사고시 계통 최대압력은 방출유로가 있는 경우 사고후 6,000 초에 0.27 MPa이며, 방출유로를 통한 유량은 총 2.4 kg/s이다. 이 방출유량을 외삽하여 계통수위가 고온관 바닦까지 도달하는데 걸린 시간은 사고후 약 5.67시간이다. 증기발생기 U-튜브를 통한 열전달에 의해 이차측 증기 발생으로 이차측 수위가 하락하면 증기발생기 reflux cooling은 제한을 받을 수 있다. 이 경우 이차측 수위가 U-튜브의 active 영역 상부까지 도달하는데 걸리는 시간은 사고후 약 10시간으로 계산되었다. 그러므로 이 경우 보조급수 공급 여유시간보다 노심 노출시간이 더 빨리 도달하여 노심을 손상시킨다. 사고시 수위지시계는 계통감압에 큰 영향을 주지 못하기 때문에 가능한 빨리 닫아 계통 inventory를 유지하는 것이 이차측 보조급수공급보다 우선한다.합한 설계방안으로 분석되었다.크다는 단점이 있다.TEX>$_2$O$_3$ 흡착제 제조시 TiO$_2$ 함량에 따른 Co$^{2+}$ 흡착량과 25$0^{\circ}C$의 고온에서 ZrO$_2$$Al_2$O$_3$의 표면에 생성된 코발트 화합물을 XPS와 EPMA로 부터 확인하였다.인을 명시적으로 설명할 수 있다. 둘째, 오류의 시발점을 정확히 포착하여 동기가 분명한 수정대책을 강구할 수 있다. 셋째, 음운 과 정의 분석 모델은 새로운 언어 학습시에 관련된 언어 상호간의 구조적 마찰을 설명해 줄 수 있다. 넷째, 불규칙적이며 종잡기 힘들고 단편적인 것으로만 보이던 중간언어도 일정한 체계 속에서 변화한다는 사실을 알 수 있다. 다섯째, 종전의 오류 분석에서는 지나치게 모국어의 영향만 강조하고 다른 요인들에 대해서는 다분히 추상적인 언급으로 끝났지만 이 분석을 통 해서 배경어, 목표어, 특히 중간규칙의 역할이 괄목할 만한 것임을 가시적으로 관찰할 수 있 다. 이와 같은 오류분석 방법은 학습자의 모국어 및 관련 외국어의 음운규칙만 알면 어느 학습대상 외국어에라도 적용할 수 있는 보편성을 지니는 것으로 사료된다.없다. 그렇다면 겹의문사를 [-wh]의리를 지 닌 의문사의 병렬로 분석할 수 없다. 예를 들어 누구누구를 [주구-이-ν가] [누구누구-이- ν가]로부터 생성되었다고 볼 수 없다. 그러므로 [-wh] 겹의문사는 복수 의미를 지닐 수 없 다. 그러면 단수 의미는 어떻게 생성되는가\

  • PDF

4세 말소리발달 선별검사 개발과 한국어말소리분석도구(Korean Speech Sound Analysis Tool, KSAT)의 활용 (Developing the speech screening test for 4-year-old children and application of Korean speech sound analysis tool (KSAT))

  • 김수진;장기완;장문수
    • 말소리와 음성과학
    • /
    • 제16권1호
    • /
    • pp.49-55
    • /
    • 2024
  • 본 연구는 4세 아동에 대한 말소리발달 평가를 위해 세 문장 따라말하기 선별검사를 개발하고 또래와 비교할 수 있는 규준을 제공하기 위한 것이다. 이를 위해 4세 전반과 후반 각각 24명씩 총 48명의 아동에게 선별검사를 실시하였다. 선별검사 결과는 기존의 말소리장애 평가 검사 결과와 .7의 상관을 보였다. 선별검사를 통해 구한 음운발달 지표와 오류패턴에서 4세 전반과 후반으로 나눈 두 집단에 차이가 있는지 비교하였다. 후반 아동의 발달지표가 높은 것으로 나왔지만 통계적으로 유의한 차이는 없었다. 모든 분석은 한국어말소리분석도구(Korean Speech Sound Analysis Tool, KSAT)를 사용하였으며, 자동분석 결과와 임상가의 수동분석 내용을 비교하였다. 자동분석과 수동분석의 오류패턴분석 일치도는 93.63%였다. 본 연구의 의의는 유도 문장수준에서 세 문장 따라말하기 선별검사의 4세 아동의 말소리 규준을 제시했다는 것과 KSAT의 임상과 연구 현장에서 적용 가능성을 검토하였다는 것이다.