• 제목/요약/키워드: Tran-scription

검색결과 5건 처리시간 0.02초

BackTranScription (BTS)기반 제주어 음성인식 후처리기 연구 (BackTranScription (BTS)-based Jeju Automatic Speech Recognition Post-processor Research)

  • 박찬준;서재형;이설화;문현석;어수경;장윤나;임희석
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2021년도 제33회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.178-185
    • /
    • 2021
  • Sequence to sequence(S2S) 기반 음성인식 후처리기를 훈련하기 위한 학습 데이터 구축을 위해 (음성인식 결과(speech recognition sentence), 전사자(phonetic transcriptor)가 수정한 문장(Human post edit sentence))의 병렬 말뭉치가 필요하며 이를 위해 많은 노동력(human-labor)이 소요된다. BackTranScription (BTS)이란 기존 S2S기반 음성인식 후처리기의 한계점을 완화하기 위해 제안된 데이터 구축 방법론이며 Text-To-Speech(TTS)와 Speech-To-Text(STT) 기술을 결합하여 pseudo 병렬 말뭉치를 생성하는 기술을 의미한다. 해당 방법론은 전사자의 역할을 없애고 방대한 양의 학습 데이터를 자동으로 생성할 수 있기에 데이터 구축에 있어서 시간과 비용을 단축 할 수 있다. 본 논문은 BTS를 바탕으로 제주어 도메인에 특화된 음성인식 후처리기의 성능을 향상시키기 위하여 모델 수정(model modification)을 통해 성능을 향상시키는 모델 중심 접근(model-centric) 방법론과 모델 수정 없이 데이터의 양과 질을 고려하여 성능을 향상시키는 데이터 중심 접근(data-centric) 방법론에 대한 비교 분석을 진행하였다. 실험결과 모델 교정없이 데이터 중심 접근 방법론을 적용하는 것이 성능 향상에 더 도움이 됨을 알 수 있었으며 모델 중심 접근 방법론의 부정적 측면 (negative result)에 대해서 분석을 진행하였다.

  • PDF

Back TranScription(BTS)기반 데이터 구축 검증 연구 (A Study on Verification of Back TranScription(BTS)-based Data Construction)

  • 박찬준;서재형;이설화;문현석;어수경;임희석
    • 한국융합학회논문지
    • /
    • 제12권11호
    • /
    • pp.109-117
    • /
    • 2021
  • 최근 인간과 컴퓨터의 상호작용(HCI)을 위한 수단으로 음성기반 인터페이스의 사용률이 높아지고 있다. 이에 음성인식 결과에 오류를 교정하기 위한 후처리기에 대한 관심 또한 높아지고 있다. 그러나 sequence to sequence(S2S)기반의 음성인식 후처리기를 제작하기 위해서는 데이터 구축을 위해 human-labor가 많이 소요된다. 최근 기존의 구축 방법론의 한계를 완화하기 위하여 음성인식 후처리기를 위한 새로운 데이터 구축 방법론인 Back TranScription(BTS)이 제안되었다. BTS란 TTS와 STT 기술을 결합하여 pseudo parallel corpus를 생성하는 기술을 의미한다. 해당 방법론은 전사자(phonetic transcriptor)의 역할을 없애고 방대한 양의 학습 데이터를 자동으로 생성할 수 있기에 데이터 구축에 있어서 시간과 비용을 단축할 수 있다. 본 논문은 기존의 BTS 연구를 확장하여 어떠한 기준 없이 데이터를 구축하는 것보다 어투와 도메인을 고려하여 데이터 구축을 해야함을 실험을 통해 검증을 진행하였다.

한국어 음성인식 후처리기를 위한 학습 데이터 자동 생성 방안 (Automatic Generation of Training Data for Korean Speech Recognition Post-Processor)

  • 구선민;박찬준;문현석;서재형;어수경;허윤아;임희석
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2022년도 제34회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.465-469
    • /
    • 2022
  • 자동 음성 인식 (Automatic Speech Recognition) 기술이 발달함에 따라 자동 음성 인식 시스템의 성능을 높이기 위한 방법 중 하나로 자동 후처리기 연구(automatic post-processor)가 진행되어 왔다. 후처리기를 훈련시키기 위해서는 오류 유형이 포함되어 있는 병렬 말뭉치가 필요하다. 이를 만드는 간단한 방법 중 하나는 정답 문장에 오류를 삽입하여 오류 문장을 생성하여 pseudo 병렬 말뭉치를 만드는 것이다. 하지만 이는 실제적인 오류가 아닐 가능성이 존재한다. 이를 완화시키기 위하여 Back TranScription (BTS)을 이용하여 후처리기 모델 훈련을 위한 병렬 말뭉치를 생성하는 방법론이 존재한다. 그러나 해당 방법론으로 생성 할 경우 노이즈가 적을 수 있다는 관점이 존재하다. 이에 본 연구에서는 BTS 방법론과 인위적으로 노이즈 강도를 추가한 방법론 간의 성능을 비교한다. 이를 통해 BTS의 정량적 성능이 가장 높은 것을 확인했을 뿐만 아니라 정성적 분석을 통해 BTS 방법론을 활용하였을 때 실제 음성 인식 상황에서 발생할 수 있는 실제적인 오류를 더 많이 포함하여 병렬 말뭉치를 생성할 수 있음을 보여준다.

  • PDF

홍삼의 각 부위에서 추출된 Panaxadiol분획의 함량비에 따른 유해산소제거효소(Cu/Zn Superoxide Dismutase) 유도효과 (Effect of the Contents Ratio of Panaxadiol Ginsenosides Extracted from Various Compartment of Ginseng on the Transcription of Cu/Zn Superoxide Dismutase Gene)

  • 장문석;최강주;노현모
    • Journal of Ginseng Research
    • /
    • 제23권1호
    • /
    • pp.44-49
    • /
    • 1999
  • 유해산소제거효소는 세포내에서 생성되는 유해산소를 산소와 과산화 수소로 바꿈으로서 유해산소의 농도를 낮은 수준으로 유지하여 세포를 유해산소의 독성으로부터 보호하는 기능을 담당하고 있다. 이전의 연구에서 파낙사다이올(PD)와 진세노사이드 $Rb_2$가 전사조절인자 AP2를 유도하여 유해산소 제거효소의 전사조절부위 내의 AP2결합부위를 통해 유해산소제거효소의 함량증대를 유도함을 보고한 바 있다. 이를 토대로 본 연구에서는 인삼의 각부위에서 추출된 조사포닌으로 panaxadiol(PD)와 panaxatriol(PT)의 성분함유비가 다른 시료를 이용하여 이들이 유해산소제거효소의 발현 유도성에 미치는 영향을 조사하였다. 이를 조사하기위해 유해산소제거효소의 전사조절부위를 클로람페니콜 아세틸트란스퍼라제의 구조유전자와 융합시킨 벡터를 인간의 간세포에 도입하여 활성도를 측정하였다. 그 결과, PD 성분의 함량비증가에 비례적으로 유해산소제거효소의전사가 증대 되었다. 또한 동일한 결과로서, PD 대 PT의 함량비가 약 2.6으로 PD의 함량이 가장높은 세세미 (finely-hairy root) 추출분획에서 유해산소제거 효소의 전사촉진이 대조군에 비해 3배이상 촉진됨을 관찰할수 있었다. 이상의 결과는 PD계의 분획이 유해산소제거효소의 유도성효과를 나타냄을 시사하고 있으며, 유해산소제거효소의 유도물질로서 PD분획과 세세미 추출물이 유용하게 이용될수있음을 제시하고 있다.

  • PDF

단핵구세포주 THP-1의 분화과정에서 Ref-1의 역할 (The Role of Ref-1 in the Differentiation Process of Monocytic THP-1 Cells)

  • 김다솔;김강미;김관회;박영철
    • 생명과학회지
    • /
    • 제34권4호
    • /
    • pp.271-278
    • /
    • 2024
  • Redox factor (Ref)-1은 세포질과 핵을 오가며 산화환원(redox) 환경에 민감한 transcription factors의 조절과 손상된 DNA의 교정 등 다양한 기능을 수행하는 단백질이다. 하지만, 단핵구(monocyte)의 대식세포(macrophage)로의 분화과정에서 Ref-1의 역할은 잘 알려져 있지 않다. 본 연구에서는 인간 단핵구세포주 THP-1을 이용하여 Ref-1의 단핵구 분화과정에 미치는 영향을 조사하였다. 분화제 phorbol 12-myristate 13-acetate (PMA)는 시간이 지날수록 세포의 부착능을 증가시키고 포식기능의 현저한 증가를 보이지만, Ref-1의 세포 내 양을 현저히 감소시켰다. Ref-1의 억제제인 E3330와 siRNA 기법을 이용한 Ref-1 knock- down은 PMA에 의한 세포 부착능과 막표면 분화인자의 발현을 현저히 감소시켰다. 이는 PMA에 자극을 받은 THP-1 세포의 분화 초기과정에는 Ref-1의 역할이 절대적으로 필요하다는 것을 의미한다. 단핵구 분화과정에서 Ref-1의 작용기전을 조사하기 위하여, PMA로 자극한 THP-1 세포의 세포질과 핵에서 Ref-1의 분포를 조사하였다. 놀랍게도, PMA 자극은 Ref-1을 빠르게 핵으로 이동하는 결과를 나타내었다. Ref-1의 핵으로의 이동이 단핵구 분화에 필요함을 증명하기 위하여, nuclear localization sequence (NLS)가 제거된 Ref-1 vector를 사용하였다. 그 결과, 핵으로의 이동이 제한된 ∆NLS Ref-1의 과발현은 PMA 자극에 의한 막표면 단백질의 발현 억제와 포식기능의 현저한 감소를 보였다. 이를 종합하면, Ref-1은 분화제 자극에 의한 분화 유도 초기과정에 핵으로 이동하여 다양한 분화인자의 발현에 관여하는 것으로 보인다.