• 제목/요약/키워드: 언어복원

검색결과 93건 처리시간 0.027초

연속 음성 문자열에 대한 한국어 띄어쓰기 시스템 (Korean Spacing System for Continuous Speech Characters)

  • 김계성;이현주;김성규;최재혁;이상조
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1998년도 제10회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.391-395
    • /
    • 1998
  • 대용량의 연속된 음성을 인식하는 데에는 형태소 사이의 음운변동과 언절과 어절 사이의 불일치 등으로 인한 어려움이 따른다. 그러므로 언어학적인 지식을 이용한 자연어 처리 기술과의 결합이 필수적이라 할 수 있다. 본 논문에서는 문장 단위의 연속 음성 문자열을 올바른 어절로 띄어주는 시스템을 제안한다. 먼저 띄어쓰기 발음열 사전을 이용하여 어절의 경계를 추정한다. 이 때 보다 정확한 띄어쓰기 위치를 추정하기 위하여 2음절 이상의 최장 조사 어미와 음절 분리가능빈도가 이용된다. 이렇게 해서 분리된 어절들은 음절 복원기를 거친 뒤, 형태소 분석을 행하여 올바른 어절인지를 검사한다. 분석에 실패한 어절은 띄어쓰기 오류 유형에 따라 교정을 한 후 형태소 분석을 재시도한다. 제안한 시스템을 테스트해 본 결과 96.8%의 정확도를 보였다. 본 시스템은 음운 변동 처리기와 함께 말소리를 음성 그대로 인식하는 인식기의 후처리로 이용할 수 있을 것이다.

  • PDF

Generative Adversarial Networks의 응용 현황 (Applications of Generative Adversarial Networks)

  • 김동욱;김세송;정승원
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2017년도 추계학술발표대회
    • /
    • pp.807-809
    • /
    • 2017
  • Generative adversarial networks (GAN)에 대한 간략하게 설명하고, MNIST (숫자 손 글씨 데이터 셋)를 이용한 간단한 실험을 통해 GAN 구조 구조의 이해를 돕는다. 그리고 GAN이 어떻게 응용이 되고있는지 다양한 논문들을 통해 살펴본다. 본 고에서는 GAN 논문들을 크게 이미지 스타일 변경, 3D 오브젝트 추정, 손상된 이미지 복원, 언어의 시각화, 기타 등으로 분류하였다.

Fischbein의 직관에 기초한 독립성에 관한 확률지도 (Instruction of Statistical Independence Based on Intuitions Classified by Fischbein)

  • 조차미
    • 대한수학교육학회지:학교수학
    • /
    • 제10권3호
    • /
    • pp.319-337
    • /
    • 2008
  • 일상어로서의 언어적 개념에 의해 형성된 독립에 대한 직관은 수학에서의 독립성에 대한 새로운 개념체계를 확립하는 데 있어 도움을 주거나 방해를 한다. 다시 말해 이러한 갈등을 동반하는 직관은 독립성을 설명을 설명하는데 원동력이 되기도 하나 때로는 오개념을 유발하는 장애요인이기도 하다. 본 논문의 목적은 이러한 원동력이 되는 직관과 장애가 되는 직관을 구분하여 학생들이 직관을 바르게 사용하도록 하는 데 있다. 이로써 독립의 언어적 해석의 개입으로 인해 발생하는 잘못된 직관에 의한 오개념을 오히려 드러내어 가르칠 필요가 있음을 제안하였다. 또한 시행의 독립성과 사건의 독립성의 명확한 구분이 필요하다는 것을 제안하였으며, 복원추출과 비복원 추출이 사건의 독립과 종속의 대표적인 예로 특정화되어서는 안 되는 것을 반례를 통해 보였다. 본 논문에서의 직관의 분석은 Fischbein이 분류한 직관을 바탕으로 하였으며 독립성의 개념에 적용되는 직관을 구체적으로 Fischbein의 직관과 대응시켜 분석하였다.

  • PDF

웹용 영한 기계번역을 위한 문서 전처리기의 설계 및 구현 (A Preprocessor for English-to-Korean Machine Translation of Web Pages)

  • 안동언;유홍진;서진원;이영우;정성종;여상화;김태완;박동인
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1997년도 제9회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.249-254
    • /
    • 1997
  • 영어 웹 문서를 한국어로 기계번역을 하기 위해서는 HTML 태그를 번역 대상 문장과 분리하는 처리가 필요하다. HTML 태그를 단순히 제거하는 것이 아니라 대상 문장의 기계번역이 종료된 후에 같은 형태의 한국어 웹 문서로 복원하기 위한 방안이 마련 되어야 한다. 또한 문서 전처리기에서는 영어 형태소해석기의 성능을 높이기 위하여 번역 단위가 되는 문장의 인식 및 분리, 타이틀의 처리, 나열된 단어의 처리, 하이픈 처리, 고유명사 인식, 특수 문자 처리, 대소문자 정규화, 날짜 인식 등을 처리하여 문서의 정규화를 수행한다.

  • PDF

에서로-웹/$EK^{TM}$: 영한 웹 문서 번역 시스템 (FromTo-$Web/EK^{TM}$: English-to-Korean Machine Translation System for HTML Documents)

  • 심철민;여상화;정한민;김태완;박동인;권혁철
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1997년도 제9회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.277-282
    • /
    • 1997
  • 최근 들어 웹 상의 문서를 번역해 주는 번역 시스템이 상용화되고 있다. 일반 문서와 달리 웹 문서는 HTML 태그를 포함하고 있어 번역 시스템에서 문장 단위로 분리하는데 어려움이 있다. 또한 그 대상 영역이 제한되지 않으므로 미등록어 및 구문 분석 실패에 대한 대처 기능이 필요하다. 따라서 웹 문서의 번역 품질이 일반 문서 번역에 비해 현저히 떨어지게 된다. 이 논문에서는 HTML 태그를 보유한 영어 웹 문서를 대상으로 하는 번역 시스템인 "에서로-웹/EK"에 대해 기술한다. 에서로-웹/EK는 HTML 문서의 특성을 고려하여 태그를 분리, 복원하는 태그 관리자를 별도로 가진다. 또한 태그를 유지하면서 영어에서 한국어로 변환되는 과정에서 발생하는 어휘 분리, 어휘 통합, 어순 변환 둥의 다양한 변환 현상을 처리한다. 이 시스템은 변환 방식에 기반한 번역 시스템으로서 영어 해석, 영한 변환, 한국어 생성의 단계를 거친다. 구현된 시스템은 Netscape와 DDE(Dynamic Data Exchange) 방식으로 연동하여 HTML 문서를 번역한다.

  • PDF

백과사전 질의응답을 위한 격틀 기반 의존관계 분석 (Dependency Relation Analysis using Case Frame for Encyclopedia Question-Answering System)

  • 임수종;정의석;장명길
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2004년도 제16회 한글.언어.인지 한술대회
    • /
    • pp.167-172
    • /
    • 2004
  • 백과사전에서 정답을 찾기 위한 정보 중의 하나로 구조분석 정보를 이용하기 위하여 의존 관계 분석을 통해 정확한 구조분석에 대한 연구를 하였다. 정답을 찾기 위한 대상이 되는 용언과 논항의 관계를 파악하기 위해 먼저 의존관계 분석의 모호성 정도를 줄이기 위해 문장을 구묶음으로 나누었고 나눠진 구묶음에서 중심어와 중심어에 해당하는 의미코드를 추출하였다. 이렇게 구분된 구묶음 간의 의존관계를 파악하기 위하여 주로 격틀과 의미코드에 의존하는 의미자질, 거리 자질, 격관계 자질, 절형태 자질을 이용하여 의존관계 모호성을 해소하였다. 백과사전의 특성상 생략되는 성분과 연속 동사 처리를 하여 보다 정확하게 백과사전 QA시스템에서 정답을 찾을 수 있는 정보를 제공하도록 하였다. 실험결과 동사구와 명사구의 의존관계는 89.43의 성능을 보였고 의존관계에 격을 부여한 경우는 78.40%의 정확율, 백과사전 후처리에 해당하는 복원은 68.23의 성능을 보인다.

  • PDF

문장틀 기반 Sequence to Sequence 구어체 문장 문법 교정기 (Template Constrained Sequence to Sequence based Conversational Utterance Error Correction Method)

  • 정지수;원세연;서혜인;정상근;장두성
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2022년도 제34회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.553-558
    • /
    • 2022
  • 최근, 구어체 데이터에 대한 자연어처리 응용 기술이 늘어나고 있다. 구어체 문장은 소통 방식 등의 형태로 인해 정제되지 않은 형태로써, 필연적으로 띄어쓰기, 문장 왜곡 등의 다양한 문법적 오류를 포함한다. 자동 문법 교정기는 이러한 구어체 데이터의 전처리 및 일차적 정제 도구로써 활용된다. 사전학습된 트랜스포머 기반 문장 생성 연구가 활발해지며, 이를 활용한 자동 문법 교정기 역시 연구되고 있다. 트랜스포머 기반 문장 교정 시, 교정의 필요 유무를 잘못 판단하여, 오류가 생기게 된다. 이러한 오류는 대체로 문맥에 혼동을 주는 단어의 등장으로 인해 발생한다. 본 논문은 트랜스포머 기반 문법 교정기의 오류를 보강하기 위한 방식으로써, 필요하지 않은 형태소인 고유명사를 마스킹한 입력 및 출력 문장틀 형태를 제안하며, 이러한 문장틀에 대해 고유명사를 복원한 경우 성능이 증강됨을 보인다.

  • PDF

아마겟돈을 지나서 - 여호와의 증인이 말하는 지상낙원은 상상할 수 있는 것인가? - (Beyond Armageddon: Is the Jehovah's Witnesses' Paradise Earth Conceivable?)

  • 조지 크리사이드
    • 대순사상논총
    • /
    • 제32집
    • /
    • pp.237-267
    • /
    • 2019
  • 이 논문은 여호와의 증인을 특별히 언급하면서 지상낙원을 상상하는 문제를 고찰한다. 여호와의 증인과 기독교의 개신교 전통, 특히 그리스도 재림설과 미국의 근본주의와의 관계에 대한 설명 후, 워치타워 조직의 몇 가지 핵심 교리가 확인되며, 특히 미래의 지상낙원에 대한 그들의 믿음을 확인할 수 있다. 여호와의 증인은 복원주의 운동으로서, 지상의 복원된 낙원을 찾아, 그들이 본래의 형태로 삼는 것으로 진정한 기독교를 복원시키려고 노력한다. 또한, 지상낙원에서의 물리적 수용 가능성, 동물의 위상, 가정생활, 언어, 기술 등에 대해 논의하고자 한다. 마지막으로, 근본적으로 다른 세계관을 가지고 있는 대순진리회의 지상천국과 간략하게 비교하며, 그러한 차이점이 대순진리회 등 한국의 자생종교에 비해 여호와의 증인이 한국에서 제한된 성공을 거둔 이유를 설명하는 데 도움을 줄 수 있다고 결론지었다.

쑤저우 정원의 세계유산 OUV와 보호관리의 운영방식 (An Outstanding Universal Value and the Management of Historic Gardens in Suzhou, China)

  • 박희성
    • 한국전통조경학회지
    • /
    • 제37권1호
    • /
    • pp.76-84
    • /
    • 2019
  • 본 연구는 쑤저우 정원의 세계유산 가치와 정원유산 보호관리의 운영방식 고찰을 목적으로 진행하였으며 연구 결과는 다음과 같다. 첫째, 세계유산으로서 쑤저우 정원은 중국 역사의 독보적 계층인 문인의 취향과 생활상이 양쯔강 동쪽 하구 지역의 자연환경과 얼마나 훌륭하게 교융하고 있는지 보여줌으로써 OUV를 증명하였다. 더하여 고유한 중국의 정원술과 정원을 매개로 한 국제문화의 교류 현상을 보여주었다. 둘째, 정원의 진정성 있는 복원은 가까운 과거에 남긴 기록물이 있었기에 가능한 일이었다. 동시대의 언어로 서술하고 사진이나 드로잉 등의 매체를 이용한 이미지를 통해 유산의 묘사한 20세기 기록물은 정원 복원에 결정적 역할을 하였다. 셋째, 1950년대부터 시작된 쑤저우 정원의 보호관리는 건물 등의 구성요소 복원, 식물소재 및 식재술의 복원, 수목의 기록조사를 통한 목록 작성, 현판, 가구 등의 소품 정비, 수질개선과 수경관 복원사업까지 단계적으로 상세하게 진행되었다. 넷째, 세계유산 등재 이후부터는 정원의 보호관리가 두 방향으로 진행되었다. 하나는 행정 관리체계의 재편과 정원 관련 법제의 제정을 통해 등재유산을 엄격하게 보호관리하고 있는 것이고 다른 하나는 역사정원을 쑤저우시의 도시기본계획과 도시 정체성 확립에 활용하고 있다는 것이다. 보호부터 합리적 이용에 이르기까지 세분된 보전원칙과 전면보호와 정비보호, 유적지 보호와 같이 보호의 강도를 구분함으로써 보전 유산의 범주를 크게 확장시켰다.

TMS320C6701 DSP를 이용한 MPEG-4 오디오 HVXC 코덱의 실시간 구현 (Real-time Implementation of HVXC codec conforming to MPEG-4 audio using TMS320C6701 DSP)

  • 강경옥;홍진우;김진웅;나훈;정대권
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 1999년도 학술대회
    • /
    • pp.261-266
    • /
    • 1999
  • 본 논문에서는 인터넷 폰이나 디지털 이동통신에서와 같이 낮은 비트율이 요구되는 응용분야에서 사용될 수 있는 HVXC 부호화 및 복호화 알고리즘을 TMS320C6701 160MHz DSP를 사용하여 실시간 동작을 구현한 내용을 기술한다. 사용한 최적화 방법으로는 기본적으로 연산 시간이 많이 소요되는 함수 루틴에 대한 C 언어레벨의 최적화 및 어셈블리어 레벨의 최적화를 수행하였고, TMS320C6701 DSP 내부 프로그램 메모리를 프로그램 캐쉬로 사용하였다. 또한, 계산량이 많은 부분과 테이블 참조가 필요한 연산을DSP의 내부 데이터 메모리 영역에서 수행하여 소요시간을 단축하였으며, 음성신호 및 비트스트림의 입출력에는 background DMA(direct memory access) 방식을 이용하였다. 이와 같은 최적화결과 2kbps 및 4kbps의 비트율에서 압축 및 복원을 실시간으로 수행할 수 있다.

  • PDF