• Title/Summary/Keyword: 국어

Search Result 918, Processing Time 0.027 seconds

A Study of different Combination of contemporary Korean Idiomatic Phrase (현대 국어 관용구의 결합 관계 고찰)

  • Lee, Hee-Ja
    • Annual Conference on Human and Language Technology
    • /
    • 1994.11a
    • /
    • pp.333-352
    • /
    • 1994
  • 이 글은 그 동안 '숙어' 또는 '관용어'라는 이름 하에 별 다른 구별 없이 일괄적으로 다루어져 왔던 현대 국어 관용구를 그의 형태적 통사적 의미론적 결합 관계의 특성에 따라 재분류하여 그들의 특성과 하위 분류 등을 밝혀 보았다. 즉, 관용구를 그 내적구조의 특성, 구성요소들 사이의 의미상의 관련성의 긴밀도, 어휘와의 정도에 따라, 어휘화된 정도가 가장 높고 긴밀도에 있어서도 가장 높고 내적구성에 있어서도 여러 가지 특성을 보이는 것을 '숙어'라 하고, 그 이외의 것을 '연어'라 했다. '연어'가 생겨난 요인에 따라 '형태적 연어'와 '통사적 연어', '의미적 연어'로 나누었다. 이러한 분류는 국어 관용구의 특성을 밝혀 줄 수 있을 뿐만 아니라, 이에 더 나아가 각 관용구의 특성에 따른 올바른 기술을 통해 국어의 특수한 어휘 결합에 대한 보다 나은 이해를 꾀할 수 있다고 본다.

  • PDF

A Parser for Noun's Definition in Korean Dictionary (국어사전의 명사 뜻풀이말 Parser)

  • Hur, Jeong;Kim, Jun-Soo;Lee, Soo-Kwang;Ok, Chul-young
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2000.04b
    • /
    • pp.321-323
    • /
    • 2000
  • 국어 사전은 자연 언어 처리에서 필요로 하는 많은 정보를 구조적으로 포함하고 있으므로, 사전으로부터 다양한 언어 지식을 자동으로 획득할 수 있는 방법이 필요하다. 본 연구는 이러한 자동 지식 획득을 위한 기본적인 도구로서 국어 사전의 뜻풀이말 파서를 구현하는 것을 목적으로 한다. 이를 위해서 우선 국어 사전의 뜻풀이말을 대상으로 일정한 수준의 구문 부착 말뭉치를 구축하고, 이 말뭉치로부터 통계적인 방법에 기반하여 문법 규칙과 확률을 자동으로 추출한다. 본 연구는 이를 응용한 확률적 차트 파서를 구현하는 것이다. 그 결과 고려대 태거보다 11.61%의 정확률 향상을 보였는데, 이로써 구문 구조 정보가 품사 태깅에도 유용함을 알 수 있었다.

  • PDF

Unicode and Code Conversion for Sejong 21 Raw Corpus (21세기 세종계획 원시 말뭉치의 유니코드와 코드 변환)

  • Kang, Seung-Shik
    • Annual Conference on Human and Language Technology
    • /
    • 2009.10a
    • /
    • pp.262-265
    • /
    • 2009
  • 21세기 세종계획은 국어정보화를 위한 범국가적 사업으로서 국어 기초 자원을 구축하는데 매우 큰 기여를 하였으며, 그 주요 결과물로 배포된 세종 말뭉치는 많은 연구자들에게 꼭 필요한 가치있는 결과물이다. 이처럼 소중한 국어 자원을 실제 연구자들이 활용하고자 할 때 불편함을 느끼는 경우가 있는데 그 이유는 균형 말뭉치의 구축이라는 말뭉치의 특성 및 원문 자료의 내용을 최대한 보존하기 위한 노력의 일환으로 사용자 정의 영역에 정의된 문자들이 다수 포함되어 있기 때문이다. 본 논문에서는 자연언어 처리, 정보검색 분야 연구자들이 세종계획 최종 결과물 중에서 원시 말뭉치를 활용하는데 있어서 말뭉치에 사용된 문자코드의 유형을 중심으로 코드 변환 문제점과 그 해결 방안을 모색하고자 한다.

  • PDF

The POS Elderly: Semi-automatic annotation tool for Historical Korean (형태소 깎는 노인: 국어사 자료를 위한 형태분석 보조기)

  • Kim, Migyeong;Park, Suzi;Lee, Sana
    • Annual Conference on Human and Language Technology
    • /
    • 2016.10a
    • /
    • pp.39-43
    • /
    • 2016
  • '형태소 깎는 노인'은 국어사 자료를 처리하는 고성능 자동 형태분석기의 개발이 난항을 겪고 있는 상황에서 수동으로 형태분석 작업을 하는 연구자들을 지원하기 위하여 개발된 형태분석 보조기이다. 인간과 기계의 분업을 통해 인간의 피로를 최대한 줄이고, 단순 반복 형태에 대해서는 정답을 확실하게 제안할 수 있다는 것이 특징이다. 국어사 자료에는 한국어 정보처리를 위해 필요한 어휘 사전이 없으므로, 문법형태소 사전을 만들어 이를 단서로 조사/어미부와 어간부를 구분하도록 하였다. 이를 통해 구축된 소규모 형태분석 말뭉치들이 장기적으로는 자동 형태분석기의 성능 개선에 일조할 수 있을 것으로 기대한다.

  • PDF

Corpus Construction of National Assembly Minutes Summarization for Korean Abstractive Meeting Minutes Summarization (한국어 회의록 생성 요약을 위한 국회 회의록 요약 말뭉치 구축 연구)

  • Younggyun Hahm;Yejee Kang;Seoyoon Park;Yongbin Jeong;Hyunbin Seo;Yiseul Lee;Hyejin Seo;Saetbyol Seo;Hansam Kim
    • Annual Conference on Human and Language Technology
    • /
    • 2022.10a
    • /
    • pp.192-197
    • /
    • 2022
  • 요약 연구의 주류는 아직 문서를 대상으로 하지만, 최근에는 회의 요약 연구에 대한 관심이 크게 높아지고 있다. 본 연구는 국립국어원 국어 빅데이터 구축 사업의 일환으로 국내에서 아직 연구되지 않은 국회 회의록 생성 요약에 대해 연구를 진행하였으며, 국회 회의록에 대한 생성 요약 데이터세트를 구축하였다. 또한 생성 요약 모델을 통해 구축된 데이터세트에 대한 정량 및 정성적 평가를 진행함으로써 국회 회의록 요약 데이터세트에 대한 평가 및 향후 생성 요약과 회의록 요약의 연구 방향을 모색하였다.

  • PDF

북녘 사람들은 어떤 국어사전을 쓰나

  • Sin, Hyeon-Suk
    • The Korean Publising Journal, Monthly
    • /
    • s.244
    • /
    • pp.4-5
    • /
    • 1998
  • 북한의 국어사전은 주체성과 인민성, 현대성.과학성.규범성의 원칙에 따라 편찬되고 있다. 사회.정치.사상성이 사전의 올림말을 선정.배열하는 데 크게 반영되는가 하면, 다듬어 쓸 말과 쓰지 말아야 할 것을 강조한 규범성도 강조되고 있다.

  • PDF

한힌샘 주시경선생의 생애와 학문세계

  • Park, Yeong-Hwan
    • The Korean Publising Journal, Monthly
    • /
    • s.92
    • /
    • pp.12-13
    • /
    • 1991
  • 주시경은 국어의 연구와 운동을 병행했다는 점에서 대개 국엉ㄴ구에만 그친 다른 학자들과 구별된다. 그는 연구에 매진했을 뿐 아니라 끊임없이 후학들에게 자신이 고구한 바를 가르쳤으며, 나아가 겨레에게 국어에 대한 올바른 이해와 사랑의 정신을 심어주기 위해 애썼다.

  • PDF

Research on Automatic Translation of Standard Language through Contemplation of Korean Destruction Phenomena in Internet Media Language (인터넷 매체 언어의 국어 파괴 현상의 고찰을 통한 표준어 자동 번역 기술에 대한 연구)

  • Park, Jang-Hyuk;Jung, Jae-Hun;Kim, Sin-Ryeong;Kim, Young-Gon
    • The Journal of the Institute of Internet, Broadcasting and Communication
    • /
    • v.16 no.1
    • /
    • pp.273-281
    • /
    • 2016
  • In this paper, we consider the discussion of the breakdown phenomenon of korean language that is displayed in the language of the Internet media, as a technical improvement approach to this, and to provide an automatic translation technology of standard language. The collected through real life surveys and experience and damage case regarding language breakdown phenomena in the FGI (Focussed Group Interview), and presents the results of the analysis, based on the analysis result data, we defined the index of language destroyed (degree of Korean destruction). The limit of the national language break or automatic translation technology standard language marked with translation errors that have to be minimized, the efficiency of the automatic translation technology standard language which may be utilized as a measure to get the maximum, and presented through the Internet media texts 2,480 pieces of analysis. Automatic translation technology of the standard language and was also measured the proposed language destroyed in this paper, we implemented in the form of a REST API using the Java language, was confirmed to work on the Web browser.

Design and Implementation of IMAP Server Supporting E-mail Address Internationalization(EAI) in a Mobile Environment (모바일 환경에서 다국어 전자 우편 주소 지원을 위한 IMAP 서버 설계 및 구현)

  • Lee, Jin-Kyu;Kim, Kyongsok
    • KIPS Transactions on Computer and Communication Systems
    • /
    • v.4 no.10
    • /
    • pp.343-348
    • /
    • 2015
  • Due to the need for multilingual e-mail address, EAI Working Group of the IETF has created a wide range of standards associated with e-mail address internationalization(EAI) since 2006. One of the authors and colleagues designed and implemented the mail server, SMTPUTF8, that supports EAI RFC protocols. SMTPUTF8 mail server is composed of new SMTP and POP3 servers supporting EAI RFC protocols. However, SMTPUTF8 did not include a new IMAP server supporting EAI RFC protocol. Recently many people are using smart phones to read and send e-mail messages in a mobile environment. IMAP server is more useful than POP3 server in a mobile environment. Therefore, in this paper, the authors have designed and implemented IMAP server and client app that complies with the IMAP standard (RFC) published by EAI WG of IETF to support multilingual e-mail address. This IMAP server is added to the SMTPUTF8 mail server so that users can access e-mail messages via IMAP client app in a mobile environment.

An Analysis of High School Korean Language Instruction Regarding Universal Design for Learning: Social Big Data Analysis and Survey Analysis (보편적 학습설계 측면에서의 고등학교 국어과 교수 실태: 소셜 빅데이터 및 설문조사 분석)

  • Shin, Mikyung;Lee, Okin
    • Journal of the Korea Academia-Industrial cooperation Society
    • /
    • v.21 no.1
    • /
    • pp.326-337
    • /
    • 2020
  • This study examined the public interest in high school Korean language instruction and the universal design for learning (UDL) using the social big data analysis method. The observations from 10,339 search results led to the conclusion that public interest in UDL was significantly lower than that of high school Korean language instruction. The results of the Big Data Association analysis showed that 17.22% of the terms were found to be related to "curriculum." In addition, a survey was conducted on a total of 330 high school students to examine how their teachers apply UDL in the classroom. High school students perceived computers as the most frequently used technology tool in daily classes (38.79%). Teacher-led lectures (52.12%) were the most frequently observed method of instruction. Compared to the second-year and third-year students, the first-year students appreciated the usage of technology tools and various instruction mediums more frequently (ps<.05). Students were relatively more positive in their response to the query on the provision of multiple means of representation. Consequently, the lesson contents became easier to understand for students with the availability of various study methods and materials. The first-year students were generally more positive towards teachers' incorporation of UDL.