• 제목/요약/키워드: 번역어

검색결과 263건 처리시간 0.029초

한국어 구문분석에서 사동/피동문 분석을 위한 보조용언의 처리 (Treatment of Auxiliary verbs in analysis of Korean causative/passive sentence.)

  • 이현주;김계성;조준모;이상조
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1996년도 제8회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.497-506
    • /
    • 1996
  • 한국어에서 보조용언은 본용언에 연속적으로 연결되어 나타나서 많은 문법적 기능을 담당하고 화자의 양태 관계를 나타낸다. 그 중에서 사동 보조 용언과 파동 보조 용언이 본용언에 결합되었을 때는 본용언의 하위 범주화 값이 달라지며 문장에서 각 성분들의 의미역할이 바뀌게 된다. 따라서 자연어 이해와 기계번역의 질적 향상을 위해 이들에 대한 정확한 분석이 요청된다. 본 논문에서는 한국어 구문분석에서 보조 용언 처리의 한 부분으로서 사동 보조 용언 '-게 하-'로 실현되는 사동문과 피동보조 용언 '-아/어 지-'로 실현되는 피동문의 구문분석 방법을 제안한다. 사동문에서는 오분석을 막기 위해 사동 보조 용언이 아닌 '-게 하-' 구성을 구별해 내고, 피동문에서는 '-아/어 지-'를 피동보조용언과 기동상으로 분리시킨다. 그리고 이들 보조 용언으로 실현되는 사동/피동문을 격표지 정보와 사동문 분석 규칙, 피동문 분석규칙을 이용하여 사동/피동문이 가지는 의미특성을 나타낸 구문분석 결과를 제시한다.

  • PDF

시소러스를 기반으로 하는 자동색인 시스템에 관한 연구 (The Development of an Automatic Indexing System based on a Thesaurus)

  • 임형묵;정상철
    • 인지과학
    • /
    • 제4권1호
    • /
    • pp.213-242
    • /
    • 1993
  • 그동안 자동색인 기법에 대해서는 단일어 색인,구색인,시소러스 기반 색인 등의 연구가 이루어져 왔는데,단일어 색인 기법이 단일어에 기초한 단순한 색인 방법 임에도 불구하고 다른 두가지 기법보다 일반적으로 우수하다고 알려져왔다. 시소러스 기반 색인은 이중에서도 검색효율이 낮은 것으로 알려져 왔는데,이는 일반적으로 시소러스가 포함하고 있는 색인용어들이 한정되어 있어 색인하려는 자료들이 이색인 용어에 부합(match)되지 않을 경우 색인 자체가 이루어 지지 않기 때문이다. 본 연구에서는 시소러스 기반 색인이 지금까지 기법으로는 검색효율이 좋지 않지만 실제 전문 색인들이 하는 색인과 매우 유사하다는 장범에 기초하여,입력 자료를 구문분석하고,분석된 자료들과 색인용어들을 정확부합(exact match)이 아닌 부분부합(partial match)을 통하여 색인 함으로써 검색효율이 우수한 시소러스기반 자동 색인 시스템을 개발하고자 한다. 본 연구에서 개발된 색인 시스템이 THINS는 우선 시소러스를 트리형태로 구성하고 입력자료들을 KAIST에서 개발한 언어번역기 MATES/EK를 통하여 구문분석한 후 명사구들만 뽑아낸다.그다음 명사구에 있는 용어들중 불용어를 제거하고 스테밍작업을 진행한후 생기는 형태를 색인 용어들과 부분부합 과정을 반복하여,유사한 색인 용어들과 가능하면 색인이 되도록 한다. 본 연구에서는 CACM 데이타 집합을 가지고 본 시소러스 기반 색인 시스템과 단일어 색인방식을 혼성지식기반 시스템인 HYKIS에서 성능을 평가하였다.이 성능평가에서 시소러스를 기반으로 하는 색인 시스템이 단일어 색인방식보다 회상도에서는 8-9%떨어지지만 정확도에서는 10%정도 높은 결과를 나타내었다.그러나 이는 기존의 시소러스 기반시스템이 단일어 색인 방식보다 정확도가 25%-30%정도 떨어진다는 것을 비추어 볼때 기존의 방식보다 우수한 것이라 평가된다.또한 CACM 에서 제공하는 시소러스인 CRCS 가 1000여개의 색인어밖에 포함하고 있어 매우 불완전한 것이라는 것을 고려하면,THINS가 최근에 개발되고 있는 시소러스와 접속된다면 매우 우수한 검색효율을 내리라 사료된다.

언어표현 기반의 북미 정상회담에 관한 한미 신문사설의 비교 (A Comparison between Korean and English News Editorials with Focus on U.S.-North Korea Summit Based on Expressive Language)

  • 노보경;반현
    • 문화기술의 융합
    • /
    • 제5권3호
    • /
    • pp.125-130
    • /
    • 2019
  • 2019년 하노이에서 열린 체 2차 북미회담은 공동 합의를 도출하지 못한 채 결렬되었다. 본 논문은 마틴과 화이트(2005)의 평가어 체계를 근간으로 총 8개의 사설들, 구체적으로는 4개의 주요 미국 언론들의 사설들과 4개의 한국 언론들의 사설들을 평가어들을 포함한 언어적 표현들을 중심으로 분석하였다. 분석 결과 뉴욕타임즈, USA투데이, 워싱턴 포스트, 월스트리트 저널의 사설들 중 월스트리트 저널을 제외한 3개의 언론들은 모두 회담 결렬의 원인을 트럼프 대통령 개인으로 귀속시키며 부정적 평가어로 입장을 전달함을 알 수 있었다. 그러나 4개의 신문 사설에서는 한반도의 비핵화나 평화에 대한 우려에 대한 내용을 담고 있지 않았다. 반면 한국의 언론들은 모두 회담 결렬의 원인보다는 향후 방향에 대해 중점을 두고 있었는데, 두 언론은 부정적 행위평가어를 이용하여 문제점과 우려를 제기했지만, 다른 두 언론은 한겨레신문과 경향신문은 향후 대응과 입장에 중심을 두었고 부정적 평가어보다는 당부와 조언의 언어적 자원을 활용하고 있음이 밝혀졌다. 이를 통해, 담론 소비에 있어 양국의 언론들은 각자의 입장을 전달하는 데 있어 부정적인 평가어를 선호한다는 점, 그리고 기대와 당부를 전달할 때는 평가어보다는 보조 용언과 같은 언어적 표현을 사용한다는 것을 알 수 있었다.

한국인의 공감 측정 도구에 관한 연구 (RELIABILITY AND VALIDITY OF A KOREAN EMPATHY CONSTRUCT HATING SCALE)

  • KIM, MOON SIL
    • 대한간호학회지
    • /
    • 제18권1호
    • /
    • pp.26-33
    • /
    • 1988
  • 내담자와 상담자간의 관계형성 추진에 관한 연구가 C. Rogers에 의해 시작된 이래, 돕는자 또는 상담자가 가져야 할 주요 조건으로서 공감, 존중, 온정, 확고부동함, 진지성, 자기노출, 직면반응 등을 들고 있으며 이중 둘 또는 세 요소 등을 선택하여 그 효과를 보고 있으나 역시 가장 주요한 요소로써는 공감을 들고 있다. 공감에 관한 연구는 그 본질의 정서적 측면, 인지적 측면 또는 복합적인 측면을 강조하면서 시도되고 있으나 간호원은 돕는자로써 환자의 문제해결을 위한 전수자적 역할을 해야한다는 점을 고려할때 간호현상에서의 공감에 관한 연구는 복합적인 측면을 강조하는 공감이 어 야 한다고 생각한다. 간호학자들도 간호원의 돕는 행위중 주요 요소로써 공감을 들고 있으며 특히 Lamonica는 공감측정을 위한 도구를 개발하였으며 공감이란 환자가 간호원이 환자의 입장을 이해하고 도와준다는 사실을 인지하고 그 고마움을 표현하는 것을 의미한다고 하였다. 본 연구자는 간호원-환자간의 촉진적 관계형성을 위한 교육내용 개발에 대한 기본 연구로써 한국인의 공감 정도를 측정할 수 있는 도구개발의 중요성을 느껴 Lamonica 의 공감측정 도구를 번역하게 되었다. 본 연구의 구체적인 목적은 미국문화권에서 사용되는 공감측정 도구가 한국인에게 적합하고 의미있게 번역되었는지를 확인하고 또한 한국인이 인지한 공감에 대한 탐색을 하는데 있다. 위 목적달성을 위하여 횡문화적 연구과정을 통한 개념분석, 도구 개발에 대한 통계분석을 시도하였다. 한국인의 공감 개념 분석을 위하여 미국 텍사스 오스틴에 있는 한국인에게 공감의 뜻, 동의어, 어떤 경우에 공감을 느꼈는지, 어떤 경우에 비공감적임을 느꼈는지를 물은 결과 한국인이 갖는 공감의 의미는 미국인의 것과 유사하지만 그 표현방법의 차이가 있음을 알게 되었다. 따라서 두 국가에서 사용되는 공감의 의미가 유사하고 또한 간호학자인 Lamonica가 개발한 공감측정 도구를 한국인에게 사용하는데 무리가 없을 것으로 판단되었다. 도구의 번역은 텍사스 주립대학 박사과정 지원생인 임상 심리 학자에게 의뢰하고 그 정확성을 판단하기 위해 인간을 대상으로 하는 학문을 연구하는 한국인(간호학, 사회학, 신문방송, 광고학, 심리학 전공)에게 그 정확성 유무를 물어 최고 27점, 최하 9점중 22점 미만인 문항에 대해서는 미국 간호학자와 의논하여 수정ㆍ보완하였다. 그 후 일반인으로 간주되는 한국인에게 그 도구의 이해 여부를 확인한 후 통계분석을 시도하였다. 대상자는 미국 텍사스 오스틴에 거주하면서 한국을 떠난지 3년 미만인 성인 45명을 대상으로 하였다. 2차에 걸친 자료수집 과정상 5명의 자료는 분석 불가능하다고 판단되어 총 40명의 자료를 spss- X를 이용하여 cronbach's alpha, test-retest stability, intercorrelation matrix 분석을 통한 결과는 다음과 같다. 1) cronbach's alpha는 1차 .9353 2차 .9666으로써 문항의 동질성을 보였고, 3, 4주 간격으로 행한 test-retest stability는 .7619(p=000)이였다. 2) 반면에 intercorrelation matrix에서는 역관계 또는 무관계를 보였으며 84문항중 26문항의 item-to-total correlation값이 .35미만이었고 이 중 16문항은 .30 미만이었다. 이들을 제외한 68문항과 58문항의 각각의 item-to-total correlation간은 .96이었고 test retest stability 역시 .76으로써 84문항 전체에 관한 값과 유사하였다. 3) 역상관 또는 무상관의 값을 보인 문항을 미국 간호학자와 재검토한 결과 본래 문항에서의 단어 의미가 복합적이거나 불분명한 것이었고 또는 미국 문화권에서 사용되는 특이한 용어임을 알 수 있었다. 따라서 한국인 공감 측정 도구의 타당성을 높이기 위해 역통역을 시도하였다. 그후 공감에 관한 연구를 하고 있는 미국 학자에게 그 정확성을 판단하여 최종적으로 58문항이 한국인 공감측정 도구로서 적합하다는 판단을 하였다. 위 결과를 통한 결론 및 제언은 다음과 같다. 인간의 행위는 조건화된 문화권에 따라 다를 수 있으며, 이것은 같은 현상을 인지하는데도 영향을 미치게 되며 본 연구와 같이 어떤 현상에 대한 횡문화적 연구는 그 행위를 이해하는데 도움을 준다. 그러나 한국에서 간호에 대한 연구가 한국적 토착화 과정에 있으므로 그 연구 방법이나 도구사용이 서구의 것을 도입해야 하는 입장을 고려할 때 도구번역 과정은 원래의 의미나 함축성을 내포한 번역이어야 하며 소홀히 해서는 안될 과정임을 재확인되었다. 또한 추후 연구로써 다양한 계층의 다수를 대상으로 한 한국인 공감 측정 도구의 타당성을 재확인해야 하며 요인분석을 시도할 필요성이 있다고 사려된다.

  • PDF

문장 내 영 조응어 해석을 위한 영대명사의 조응성 결정 (Anaphoricity Determination of Zero Pronouns for Intra-sentential Zero Anaphora Resolution)

  • 김계성;박성배;박세영;이상조
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제37권12호
    • /
    • pp.928-935
    • /
    • 2010
  • 문서에서 생략된 요소가 지시하는 대상을 식별해 내는 작업은 기계 번역, 정보추출 등과 같은 자연언어처리 분야의 다양한 응용들을 위해 필요하다. 문장에서 생략된 요소들은 영조응사, 영대명사 등으로 불리며, 지시(reference)의 한 유형으로 간주되고 있지만, 모든 영형이 문서에서 명확하게 언급된 지시 대상을 지시하지는 않는다. 이에 영형의 조응성을 결정하려는 연구가 최근 진행되고 있으며, 본 논문에서는 한국어에서 가장 빈번하게 나타나는 영형 주어(subject zero pronouns)의 문장 내 조응성 결정에 초점을 맞춘다. 주어진 영형과 선행사 후보들 간의 쌍대 비교(pairwise comparison)에 기반한 기존 연구와 달리, 본 논문은 비조응적 혹은 문장 간에서 해결 가능한 영형이 나타난 절의 구조를 직접 학습함으로써 영형의 문장 내 조응성을 결정한다. 실험에서 제안한 방법은 베이스라인보다 나은 성능을 보였으며, 영형의 조응성 결정은 향후 영형 조응어 해석에 긍정적인 영향을 줄 수 있을 것으로 기대된다.

BackTranScription (BTS)기반 제주어 음성인식 후처리기 연구 (BackTranScription (BTS)-based Jeju Automatic Speech Recognition Post-processor Research)

  • 박찬준;서재형;이설화;문현석;어수경;장윤나;임희석
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2021년도 제33회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.178-185
    • /
    • 2021
  • Sequence to sequence(S2S) 기반 음성인식 후처리기를 훈련하기 위한 학습 데이터 구축을 위해 (음성인식 결과(speech recognition sentence), 전사자(phonetic transcriptor)가 수정한 문장(Human post edit sentence))의 병렬 말뭉치가 필요하며 이를 위해 많은 노동력(human-labor)이 소요된다. BackTranScription (BTS)이란 기존 S2S기반 음성인식 후처리기의 한계점을 완화하기 위해 제안된 데이터 구축 방법론이며 Text-To-Speech(TTS)와 Speech-To-Text(STT) 기술을 결합하여 pseudo 병렬 말뭉치를 생성하는 기술을 의미한다. 해당 방법론은 전사자의 역할을 없애고 방대한 양의 학습 데이터를 자동으로 생성할 수 있기에 데이터 구축에 있어서 시간과 비용을 단축 할 수 있다. 본 논문은 BTS를 바탕으로 제주어 도메인에 특화된 음성인식 후처리기의 성능을 향상시키기 위하여 모델 수정(model modification)을 통해 성능을 향상시키는 모델 중심 접근(model-centric) 방법론과 모델 수정 없이 데이터의 양과 질을 고려하여 성능을 향상시키는 데이터 중심 접근(data-centric) 방법론에 대한 비교 분석을 진행하였다. 실험결과 모델 교정없이 데이터 중심 접근 방법론을 적용하는 것이 성능 향상에 더 도움이 됨을 알 수 있었으며 모델 중심 접근 방법론의 부정적 측면 (negative result)에 대해서 분석을 진행하였다.

  • PDF

정보검색을 위한 외래어 자동표기 모델 (Automatic Foreign Word Transliteration Model for Information Retrieval)

  • 이재성;최기선
    • 한국정보관리학회:학술대회논문집
    • /
    • 한국정보관리학회 1997년도 제4회 학술대회 논문집
    • /
    • pp.17-24
    • /
    • 1997
  • 조사에 따르면 한글 문서에서 사용되는 단어 중 외래어 또는 영어가 포함된 단어가 약 26%정도를 차지하고 있으며, 이는 정보검색의 중요 색인어로 사용된다(권윤형 1996). 그러나 이들 단어들은 서로 같은 단어인데도 영어로 표기되기도 하고 이형의 외래어들로 표기되기도 하여, 정보검색의 효율을 떨어뜨리고 있다. 본 논문에서는 영어 단어와 그에 대응되어 표기되는 외래어들을 찾기 위한 한 단계로서, 영어를 한글로 음차(transliteration)하여 자동표기하는 통계적 모델을 제안하고 실험한다. 제안된 모델은 통계적 기계번역 방식과 그의 한 방법인 문서 정렬(text alignment) 방식에 근거하고 있다. 특히 이 모델에서는 효과적으로 발음의 단위를 분리한 다음 정렬을 하여. 전체적인 계산량을 줄이고 성능도 향상시켰다. 음차표기는 피봇방식과 직접방식의 두가지로 구현하였다. 피봇방식은 영어에서 발음을 생성한 후, 그 발음을 다시 한글로 표기하는 방식이고, 직접방식은 직접 영어 단어에서 한글 표기로 포기하는 방식이다. 두 방식을 제안된 모델을 이용하여 비교 테스트한 결과 직접방식이 보다 정확하게 표준 외래어로 표기하였다.

  • PDF

재난문자에서의 외국어 제공 현황 (Status of Providing Foreign Languages in Disaster Warning Text Message)

  • 이현지;변윤관;장석진;최성종;표경수
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2019년도 추계학술대회
    • /
    • pp.140-142
    • /
    • 2019
  • 이 연구에서는 재난문자에서의 외국어 제공 현황에 대해 알아보았다. 우선, 뉴스를 분석한 결과, 외국인들은 국내 재난문자의 문제점으로 한국어라는 언어 제공 한정을 꼽았다. 다음으로, 미국은 WEA 규정에 따라 영어 외에 스페인어로 된 경고 메시지를 지원해야 하는 것으로 나타났다. WEA에서의 다국어 제공을 위한 다양한 노력도 하고 있었다. 마지막으로, 일본은 이동통신사 차원에서 다국어 재난문자를 지원하고 있는 것으로 나타났다. NTT DOCOMO는 외국인을 위해 일본어 재난문자를 영어, 중국어, 한국어로 번역해 주는 기능을 제공하고 있었다. KDDI도 NTT DOCOMO가 제공하는 언어 외에 포르투칼어, 스페인어도 제공하고 있었다.

  • PDF

문형 정보를 이용한 한국어 구문 분석 (Korean Syntax Analysis Using Sentence Pattern Information)

  • 한용기;황이규;이용석
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1995년도 제7회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.23-29
    • /
    • 1995
  • 대부분의 한국어 구문 분석은 용언과 명사구 사이의 하위범주화 정보를 이용하여 용언에 대한 명사구의 문법적 역할을 밝히는 방향으로 구문 분석을 시도하였다. 여기에 이용된 용언의 하위 범주화 정보가 단지 자릿수 서술어나 형용사, 자동사, 타동사 등으로 분류하는 수준이었기 때문에 구문 모호성이 많이 발생하고 틀린 문장이 구문적으로 옳기 때문에 옳은 문장으로 인식되는 경우가 발생하였다. 이러한 문제점을 해결하기 위하여 본 논문에서는 한국어의 용언에 따른 문장 형태(문형)를 세분류하고 문장에 필수적으로 나타나는 명사구(NP[case])와 수의적으로 나타나는 명사구(NP[case])를 분류하여 분석을 시도하였다. 확장된 PATR II로 문법을 기술하여 동적인 파싱을 쉽게 제어할 수 있도록 하였다. 문형 정보는 한국어의 기본 구조를 자연스럽게 표현할 수 있기 때문에 그 자체를 기계번역을 위한 한국어 문법으로 설정하는 것이 타당하다고 생각된다.

  • PDF

한국어 문장으로부터 개념단위의 추출과 지식베이스의 구축 (The Conceptual Unit Extraction and Knowledge Base Construction from Korean Sentence)

  • 한광록;이주근
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1989년도 한글날기념 학술대회 발표논문집
    • /
    • pp.247-251
    • /
    • 1989
  • 본 논문은 한국어를 대상으로 하는 자연언어 처리 시스템을 개발하는데 있어서 기초가 되는 지식베이스의 구축에 대하여 논한다. 한국어의 일반문에서 단문을 분리해 내기 위하여 형태소 해석의 결과로부터 도출한 구 단위를 한-일 기계번역 시스템의 구문, 의미 해석기(VCPN) 을 적용하여 절단위로 결합한다. 그리고 이들 단위절에 대하여 대명사의 조응관계, 생략에의 재생을 위한 추론, 부정어, 시제일치 등을 처리하여 논리적 지식베이스를 구성하는 방법을 제안한다. 본 논문은 입력문장에 제한을 두지 않고 단문으로부터 장문에 이르기까지 광범위한 일반문을 대상으로 하여 Horn Clause 이론을 확장한다.

  • PDF