• Title/Summary/Keyword: 국어

Search Result 918, Processing Time 0.023 seconds

Development of Korean Language Regulation Retrieval System (국어 어문 규정 검색 프로그램 개발)

  • 오형진;이신원;두길수;정성종;안동언
    • Proceedings of the IEEK Conference
    • /
    • 2002.06c
    • /
    • pp.103-106
    • /
    • 2002
  • 국어 어문 규정 검색 프로그램은 21세기 세종계획 프로젝트의 한민족 언어 정보화 분과에서 개발한 것으로, 한글 맞춤법, 표준어 규정, 외래어 표기법, 국어의 로마자 표기법 등의 어문 규정과 검색어에 대한 어문 규정 설명을 HTML 문서로 보여준다. 본 논문에서는 국어 어문 규정을 검색하기 위한 데이터베이스의 구조와 국민 어문 규정 검색 프로그램의 검색 방법에 대해서 논한다.

  • PDF

인터뷰 - 박찬익 (주)박이정출판사 대표이사

  • Im, Nam-Suk
    • 프린팅코리아
    • /
    • v.14 no.10
    • /
    • pp.72-75
    • /
    • 2015
  • (주)박이정출판사(대표이사 박찬익)는 국어국문학 전문 출판사로, 1896년 문을 연 이래 1500여종의 국어학, 고전문학 관련 전문서적을 펴냈다. 그중 항가연구, 역대한국문법대계 등은 우리 문학과 국어학 발전에 있어 큰 획을 그은 책이다. 박찬익 대표를 만나 책에 대한 이야기를 나눴다.

  • PDF

발족 열달 째 맞는 국립국어연구원 안병희원장

  • Kim, Ji-Won
    • The Korean Publising Journal, Monthly
    • /
    • s.92
    • /
    • pp.4-5
    • /
    • 1991
  • 국립국어연구원이 가장 정열을 쏟는 사업은 "종합국어대사전"의 편찬이다. 안병희원장은 이 사전이 통일을 앞두고 남북한언어의 깊은 골을 메우는 기초공사로서의 의의를 갖는다는 데 비중을 두는데, 일단 올해는 기초자료 확보에 진력하기로 하고 내년부터 본격착수에 들어가 2001년에 완간시킨다는 장기계획을 세워두고 있다.

  • PDF

Design of Multilingual Thesaurus (다국어 시소러스의 설계)

  • 최석두;조혜민
    • Proceedings of the Korean Society for Information Management Conference
    • /
    • 2001.08a
    • /
    • pp.5-10
    • /
    • 2001
  • 둘 이상의 언어를 포함하고, 그 중 참조하는 언어를 중심으로 용어관계를 표시할 수 있는 다국어 시소러스의 개념구조에 대하여 논하였다. 아울러, 우리말을 기준어로 삼고, 기본요건, 구조화, 용어관계, 동형이의어, 표시방법, 배열 등에 대한 예시와 함께 다국어 시소러스의 설계방안을 제시하였다.

  • PDF

Keyword Extraction for Korean Language Q&A (국어정보 질의응답을 위한 키워드 추출)

  • Jong, Jong-Seok;Lee, Su-In;Lee, Hyun-A
    • Annual Conference on Human and Language Technology
    • /
    • 2015.10a
    • /
    • pp.213-215
    • /
    • 2015
  • 국립국어원 온라인가나다에서 제공되는 질의응답 문서를 이용한 국어정보에 대한 Q&A시스템은 언어 자체에 대한 질문과 답변의 특성으로 조사나 어미로 끝나는 표현이 주어로 등장하는 등의 특이한 문장이 자주 나타난다. 이러한 이유로 형태소 분석을 거쳐 명사를 키워드로 추출하는 일반적인 키워드 추출 방식은 좋은 성능을 얻기 어렵다. 본 논문에서는 국어정보 질의응답 문서의 특징에 맞는 키워드 추출 방법을 제안한다. 제안하는 방식에서는 문장 단위로 분할된 결과에서 연결어미로 문장을 추가로 분할한 뒤에 조사 앞에 나타나는 단어열을 키워드로 추출한다. 덧붙여 다자비교형 질의에서의 키워드 추출을 위해 편집거리를 이용한 키워드 추출 방법을 제안한다.

  • PDF

ColBERT with Adversarial Language Adaptation for Multilingual Information Retrieval (다국어 정보 검색을 위한 적대적 언어 적응을 활용한 ColBERT)

  • Jonghwi Kim;Yunsu Kim;Gary Geunbae Lee
    • Annual Conference on Human and Language Technology
    • /
    • 2023.10a
    • /
    • pp.239-244
    • /
    • 2023
  • 신경망 기반의 다국어 및 교차 언어 정보 검색 모델은 타겟 언어로 된 학습 데이터가 필요하지만, 이는 고자원 언어에 치중되어있다. 본 논문에서는 이를 해결하기 위해 영어 학습 데이터와 한국어-영어 병렬 말뭉치만을 이용한 효과적인 다국어 정보 검색 모델 학습 방법을 제안한다. 언어 예측 태스크와 경사 반전 계층을 활용하여 인코더가 언어에 구애 받지 않는 벡터 표현을 생성하도록 학습 방법을 고안하였고, 이를 한국어가 포함된 다국어 정보 검색 벤치마크에 대해 실험하였다. 본 실험 결과 제안 방법이 다국어 사전학습 모델과 영어 데이터만을 이용한 베이스라인보다 높은 성능을 보임을 실험적으로 확인하였다. 또한 교차 언어 정보 검색 실험을 통해 현재 검색 모델이 언어 편향성을 가지고 있으며, 성능에 직접적인 영향을 미치는 것을 보였다.

  • PDF

21st Century Sejong Modern Korean Corpora: Results and Expectations (21세기 세종계획 현대국어 기초말뭉치: 성과와 전망)

  • Kim, Hung-Gyu;Kang, Beom-Mo;Hong, Jungha
    • Annual Conference on Human and Language Technology
    • /
    • 2007.10a
    • /
    • pp.311-316
    • /
    • 2007
  • 현대국어 기초말뭉치는 방법론 및 표준화 연구, 그리고 소프트웨어 개발과 더불어 21세기 세종계획 국어기초자료 구축 사업의 일환으로 개발되었다. 현대국어 기초말뭉치 개발에서는 세종말뭉치 통합분 12,000만 어절을 후처리하고, 원시말뭉치 6,200만 어절, 형태분석 말뭉치 1,500만 어절, 형태의미분석 말뭉치 1,250만 어절, 구문분석 말뭉치 80만 어절을 신규 구축 완료하였으며, 이 중 일부 말뭉치에 대한 정제 작업이 2007년 말까지 완료될 예정이다. 방법론 및 표준화 연구에서는 말뭉치 구축 방법론과 분석표지 표준화, 말뭉치 활용 연구가 진행되었고, 이 밖에도 소프트웨어 개발 사업에서는 말뭉치 구축 및 활용에 필요한 도구를 개발하였다. 이 논문은 21세기 세종계획 국어기초자료 구축 사업의 연구 성과를 현대 국어 기초말뭉치를 중심으로 소개하고 향후 전망을 논의하는 것이 목적이다.

  • PDF

Building and Analysis of Semantic Network on S&T Multilingual Terminology (과학기술 전문용어의 다국어 의미망 생성과 분석)

  • Jeong, Do-Heon;Choi, Hee-Yoon
    • Journal of Information Management
    • /
    • v.37 no.4
    • /
    • pp.25-47
    • /
    • 2006
  • A terminology system capable of providing interpretations and classification information on a multilingual science and technology(S&T) terminology is essential to establish an integrated search environment for multilingual S&T information systems. This paper aims to build a base system to manage an integrated information system for multilingual S&T terminology search. It introduces a method to build a search system for S&T terminologies internally linked through the multilingual semantic network and a search technique on the multiple linked nodes. In order to provide a foundation for further analysis researches, it also attempts to suggest a basic approach to interpret terminology clusters generated with those two search methods.

Design and Implementation of Multilingual support method for 3-tiered softwares (3-TIER 구조 소프트웨어의 다국어 지원 방식의 설계와 구현)

  • Koh, Jeong-Gook
    • Journal of Korea Multimedia Society
    • /
    • v.15 no.2
    • /
    • pp.266-272
    • /
    • 2012
  • Multilingual support of software is necessary for entering global market. 3-tier architecture is a solution for problems of 2-tier architecture. It divides an application into a client-tier and an application-tier, and presentation logic and database are connected by middleware. The advantage of 3-tier architecture is the enhanced performance through load balancing, scalability, easier maintenance and reusability. This paper proposes a multilingual support method that utilizes common resource files for 3-tier enterprise softwares, applies the proposed method to development of multilingual version of billing solution, and verify the usefulness of it. It is easy for development and maintenance of software, the addition of language supported. Proposed method holds a resource file for each language and provides a multilingual support class library. Therefore this method reduces a waste of memory and disk space. Deployment of a class library into an application tier makes development and maintenance of software, the addition of new language supported easy. To avoid inappropriate modification of a resource file, a multilingual support class library is provided in a dll file.