• 제목/요약/키워드: English-Korean Bilingual Terminologies

검색결과 2건 처리시간 0.018초

단어 단위의 추정 정렬을 통한 영-한 대역어의 자동 추출 (An Automatic Extraction of English-Korean Bilingual Terms by Using Word-level Presumptive Alignment)

  • 이공주
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제2권6호
    • /
    • pp.433-442
    • /
    • 2013
  • 기계번역 시스템 구축에 가장 필수적인 요소는 번역하고자 하는 언어간의 단어쌍을 담고 있는 대역어 사전이다. 대역어 사전은 기계번역뿐만 아니라 서로 다른 언어간의 정보를 교환하는 모든 응용프로그램의 필수적인 지식원(knowledge source)이다. 본 연구에서는 문서 단위로 정렬된 병렬 코퍼스와 기본적인 대역어 사전을 이용하여 영-한 대역어를 자동으로 추출하는 방법에 대해 소개한다. 이 방법은 수집된 병렬 코퍼스의 크기에 영향을 받지 않는 방법이다. 문서 단위로 정렬된 병렬 코퍼스로부터 문장 단위의 정렬을 수행하고 다시 단어 단위의 정렬을 수행한 후, 정렬이 채 되지 않은 부분에 대해 추정 정렬을 수행한다. 추정 정렬에는 문장에서의 위치, 다른 단어와의 관계, 두 언어간의 언어적 정보등 다양한 정보가 사용된다. 이렇게 추정 정렬된 단어쌍으로부터 영-한 대역어를 추출할 수 있다. 약 1,000개로 구성된 병렬 코퍼스로부터 추출한 영-한 대역어는 71.7%의 정확도를 얻을 수 있었다.

KDC 제4판 언어 및 문학류 전개의 개선방안 (Suggestions for the Gasses Language and Literature of the 4th Edition of Korean Decimal Classification)

  • 오동근;배영활;여지숙
    • 한국문헌정보학회지
    • /
    • 제42권4호
    • /
    • pp.141-157
    • /
    • 2008
  • 이 연구에서는 KDC 제4판 언어류와 문학류의 분류항목들을 개선하기 위해, 언어류와 문학류의 본표 항목과 조기표 항목을 분석하여 개선을 위한 구체적인 방안을 제시하였다. 그 개선방안은 한국문학과 영미문학의 시대구분을 위한 새로운 분류항목의 설정, 불합리하게 설정된 언어정책 및 언어행정의 해당언어의 역사 아래로의 이치, 각국 언어 및 문학의 부적합한 명칭표기의 조정, 표준구분의 적용과 의미파악에 어려움이 있는 주기에 대한 추가주기의 설정 및 보완, 2개국어사전의 분류규정의 변경, 한국 현대소설의 주제세분을 비롯해 영국문학과 미국문학의 구분을 위한 선택조항의 적용, 그리고 기타 아시아 제어 아래의 드라비다어와 기타 제어 아래의 켈트어, 셈어족, 함어족 하위 분류항목 등 세분전개가 불필요한 항목의 주기화 등으로 요약할 수 있다.