• 제목/요약/키워드: 한글 학습

검색결과 879건 처리시간 0.025초

우리나라 2011 초등수학 교육과정 등재용어의 조성에 관한 연구 (A study on compositions of listed terms in 2011 elementary mathematics curriculum in Korea)

  • 박교식;권석일
    • 대한수학교육학회지:수학교육학연구
    • /
    • 제22권3호
    • /
    • pp.429-444
    • /
    • 2012
  • 본 연구에서는 초등학교 수학 교수 학습에서 중요한 위치를 차지하는 수학 용어에 체계적으로 접근하기 위한 시도의 한 가지로, 2011 등재용어의 조성에 관해 논의한다. 이를 위해 등재용어를 세 관점에서 분류하여, 분류 결과로부터 초등학교 수학 교수 학습을 위한 시사점을 찾는다. 먼저 용어에 대한 일차적 분류로서 학년군별 및 영역별 분류, 조어 및 일상어별 분류, 그리고 한글, 한자어, 영어별 분류를 시도한다. 다음으로는 용어의 연결성에 주목하는 분류로서 핵을 갖는 용어와 그렇지 않은 용어를 구별하고, 이 과정에서 용어집합을 제시한다. 마지막으로 용어를 그 역할과 기능에 따라 대상 용어, 조작 용어, 관계 용어, 측도 용어, 상태 용어, 도표 용어, 기명 용어로 분류한다. 이러한 결과를 바탕으로 수학 교수 학습과 관련하여 다음의 제언을 한다. 첫째, 등재용어의 상당수가 조어이면서 한자어라는 것을 고려해야 한다. 둘째, 용어의 상호연결성을 고려해야 한다. 셋째, 용어의 역할과 기능이 다양하다는 것을 고려해야 한다.

  • PDF

생성형 대규모 언어 모델과 프롬프트 엔지니어링을 통한 한국어 텍스트 기반 정보 추출 데이터셋 구축 방법 (A Study on Dataset Generation Method for Korean Language Information Extraction from Generative Large Language Model and Prompt Engineering)

  • 정영상;지승현;권다롱새
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제12권11호
    • /
    • pp.481-492
    • /
    • 2023
  • 본 연구는 생성형 대규모 언어 모델을 활용하여 텍스트에서 정보를 추출하기 위한 한글 데이터셋 구축 방법을 탐구한다. 현대 사회에서는 혼합된 정보가 빠르게 유포되며, 이를 효과적으로 분류하고 추출하는 것은 의사결정 과정에 중요하다. 그러나 이에 대한 학습용 한국어 데이터셋은 아직 부족하다. 이를 극복하기 위해, 본 연구는 생성형 대규모 언어 모델을 사용하여 텍스트 기반 제로샷 학습(zero-shot learning)을 이용한 정보 추출을 시도하며, 이를 통해 목적에 맞는 한국어 데이터셋을 구축한다. 본 연구에서는 시스템-지침-소스입력-출력형식의 프롬프트 엔지니어링을 통해 언어 모델이 원하는 결과를 출력하도록 지시하며, 입력 문장을 통해 언어 모델의 In-Context Learning 특성을 활용하여 데이터셋을 구축한다. 생성된 데이터셋을 기존 데이터셋과 비교하여 본 연구 방법론을 검증하며, 관계 정보 추출 작업의 경우 KLUE-RoBERTa-large 모델 대비 25.47% 더 높은 성능을 달성했다. 이 연구 결과는 한국어 텍스트에서 지식 요소를 추출하는 가능성을 제시함으로써 인공지능 연구에 도움을 줄 것으로 기대된다. 더욱이, 이 방법론은 다양한 분야나 목적에 맞게 활용될 수 있어, 다양한 한국어 데이터셋 구축에 잠재력을 가진다고 볼 수 있다.

효과적인 아동용 WBI를 위한 한글 타이포그래피의 가해성 분석과 활용 (Usage and Analysis on Readability of Korean Typography in WBI for Children)

  • 한정혜;김용대
    • 정보교육학회논문지
    • /
    • 제6권3호
    • /
    • pp.328-337
    • /
    • 2002
  • 멀티미디어 교육용 컨텐츠의 디자인적 측면에서 아동과 교사간에는 지식과 감성이 서로 다르기 때문에 교사의 설계모델이 아동의 인지모델과 다를 수 있고 이는 곧 교육용 컨텐츠의 효과에 영향을 미친다. 한글 타이포그래피가 위주인 교육용 컨텐츠의 학습효과는 글꼴, 줄 간격, 글꼴크기, 사용자 나이뿐만 아니라, 웹기반 컨텐츠의 경우에는 모니터라는 출력장치 등 여러 요인에 의해 영향을 받을 수 있다. 따라서 본 연구에서는 교육용 컨텐츠의 중요한 부분이라 할 수 있는 타이포그래피의 정보 전달속도에 대한 가해성을 중심으로, 효과적인 아동용 WBI를 위한 타이포그래피에 대하여 독서속도 측정법을 이용하여 실험연구를 실시하였다. 아동용 WBI 타이포그래피의 가해성에 유의한 영향을 미치는 요인으로는 글꼴, 나이(학년), 성별이었는데, 산세리프체 종류와 고학년, 여자아동이 높은 가해성을 갖는 것으로 나타났다. 보다 아동에게 효과적인 WBI를 위하여, 산세리프체 중 "굴림체"외에도 아동에게 좋은 가해성과 심미적으로도 선호되는 탈네모틀 글꼴 "엽서체"를 고려한 타이포그래피를 CSS로 제시함으로써 초등현장에서 활용할 수 있도록 하였다.

  • PDF

공간 빅데이터를 활용한 지방도 포장보수 우선지역 예측 서비스 (Priority Area Prediction Service for Local Road Packaging Maintenance Using Spatial Big Data)

  • 이민영;최지우;김인영;손수진;최인호
    • 지능정보연구
    • /
    • 제29권3호
    • /
    • pp.79-101
    • /
    • 2023
  • 전라북도의 지방도 포장보수 이력 관리 현황은 현장 건설사의 포장보수 후 성과품에만 의존하여 엑셀, 한글 문서로만 관리되고 있는 실정이며, 덧씌우기 예산 등은 매년 불규칙적인 투입으로 안정적인 도로 관리 불가한 현황이다. 그에 따라 지방도의 체계적인 유지관리 방안 필요하다. 해당 논문에서는 도로 파손과 관련이 있는 데이터 및 도로 환경과 관련이 있는 데이터를 수집 및 가공하여, 도로 파손이 발생할 수 있는 위험지역을 도출하였다. 해당 예측 결과 지역을 현장검수하여 해당 방법론의 유효성을 파악하였다. 국토부에 따르면 일반국도의 도로 파임 발생 건수는 18년도에 약 4만7천건, 19년도에 약 3만8천 건이며 도로 파임 피해 소송건수는 18년도에 93건, 19년도에 119건으로 증가했다. 일반국도의 경우 도로 파임 발생 건수가 18년도에 비해 줄었으나 이는 도로 포장 보수 등을 진행하면서 발생 건수가 줄어든 것이라고 한다. 전라북도의 지방도의 포장보수 우선순위를 분석하기 위해 연구를 진행하기 위해, 엑셀, 한글 문서로만 관리되는 지방도 포트홀 상습발생지, 덧씌우기 사업구간, 긴급 보수구간위치와 같은 보수 이력데이터를 데이터화 하여, 분석하고, 보수 이력 데이터에서 벗어나 지방도의 체계적인 유지관리를 개선한다. 더 나아가, 도로와 관련된 다양한 현황데이터를 활용하여 공간 융합 데이터를 구축하고, 머신러닝 학습 데이터 및 예측에 필요한 데이터 형태로 가공하였다. 해당 공간 빅데이터를 사용하여 지방도 유지관리가 필요한 우선지역을 예측하고 도로포장 유지관리 우선순위 예측하였으며, 해당 결과를 활용하여 도로관리 예산 및 정책 수립에 활용하려 한다.

대학의 식물형태학 분야에서 사용하는 유관속조직의 구조에 관한 용어의 분석 (Analysis of Some Korean Terminologies on the Structures of Vascular Tissues in Plant Morphology)

  • 이규배
    • 한국과학교육학회지
    • /
    • 제27권9호
    • /
    • pp.919-929
    • /
    • 2007
  • 본 연구는 우리나라 대학의 식물형태학 분야에서 사용하는 유관속조직의 구조에 관한 용어들 가운데,교재 또는 저술자에 따라 다르게 번역되어 쓰이고 있는 한글 용어들의 합리적인 표기를 제안하기 위한 것이다. 대학에서 교재로 사용되는 일반생물학,일반식물학,식물형태학 등 14종의 교재에서 서로 다르게 표기되어 있는 대표적인 12개 용어의 어원과 정의를 조사 분석한 결과 제시된 한글 용어의 표기는 다음과 같다. 즉 목부(木部,물관부)의 구조에 관한 용어로서 "apotracheal parenchyma"는 "도관분리형유조직(導管分離形柔祖熾)" 으로 표기하고, "paratracheal parenchyma"는 "도관연접형유조직(導管連接形柔組織)"으로,"tylose"는 "전충체(塡充體)"로 표기하는 것이 적합하다. 벽공(壁孔)의 구조에 관한 용어로서 "simple pit"는 "단순벽공(單純壁孔)"으로 표기하고, "bordered pit"는 "유연벽공(有緣壁孔)"으로,"aspirated bordered pit"는 "흡착유연벽공(吸着有緣壁孔)"으로,"pit aperture"는 "벽공구(壁孔口)"로 표기하는 것이 합당하다. 그러고 중심주(中心柱)의 구조에 관한 용어로서 "haplostele"은 "단순중심주(單純中心柱)"로 표기하고, "actinosteIe"은 "방사중심주(放射中心柱)"로, "plectostele"은 "습곡중심주(褶曲中心柱)"로,"solenosteIe"은 "통로중심주(通路中心柱)"로 표기하는 것이 합리적이다. 이러한 연구를 통해서 식물학 분야를 가르치는 교수자와 배우는 학습자들 사이에 생물학적 개념을 올바르게 전달하고 이해를 증진시킬 수 있을 것으로 기대된다.

딥러닝 학습을 이용한 한글 글꼴 자동 제작 시스템에서 글자 쌍의 매핑 기준 평가 (Evaluation of Criteria for Mapping Characters Using an Automated Hangul Font Generation System based on Deep Learning)

  • 전자연;지영서;박동연;임순범
    • 한국멀티미디어학회논문지
    • /
    • 제23권7호
    • /
    • pp.850-861
    • /
    • 2020
  • Hangul is a language that is composed of initial, medial, and final syllables. It has 11,172 characters. For this reason, the current method of designing all the characters by hand is very expensive and time-consuming. In order to solve the problem, this paper proposes an automatic Hangul font generation system and evaluates the standards for mapping Hangul characters to produce an effective automated Hangul font generation system. The system was implemented using character generation engine based on deep learning CycleGAN. In order to evaluate the criteria when mapping characters in pairs, each criterion was designed based on Hangul structure and character shape, and the quality of the generated characters was evaluated. As a result of the evaluation, the standards designed based on the Hangul structure did not affect the quality of the automated Hangul font generation system. On the other hand, when tried with similar characters, the standards made based on the shape of Hangul characters produced better quality characters than when tried with less similar characters. As a result, it is better to generate automated Hangul font by designing a learning method based on mapping characters in pairs that have similar character shapes.

인간의 정보처리 방법에 기반한 특징추출 및 필기체 문자인식에의 응용 (Feature extraction motivated by human information processing method and application to handwritter character recognition)

  • 윤성수;변혜란;이일병
    • 인지과학
    • /
    • 제9권1호
    • /
    • pp.1-11
    • /
    • 1998
  • 본 논문에서는 인간의 정보처리 과정에 관한 심리학적 실험에 바탕을 두고 인간이 사용하고 있는 것으로 생각되는 특징을 이용하여 이를 문자 인식에 적용하였다. 인간의 경우 화소단위의 정보뿐만 아니라 일정지역의 정보를 함께 처리하는 경향이 있다. 그러므로 일정지역에 대한 정보를 표시하는 영역 특징을 정의하고 정의된 이 영역 특징과 기존의 화소단위 특징들을 결합하였다. 사용한 특징으로는 영역 특징에 기반 한 초등 적 분석결과, 영역특징을 포함한 망 특징, 교차거리와 특징 그리고 기울기 특징들이다. 성능 평가 실험은 필기 한글자모, 숫자 그리고 대소영문자를 대상으로 하였으며, 인식기는 역전과 학습 방법을 이용한 신경망 인식기를 사용하였다. 각각의 인식 결과는 90.27∼93.25%, 98.00% 그리고 79.73∼85.75였다. 영역 특징과 유사한 UDLRH 특징을 대상으로 비교한 결과 전체적으로 1∼2% 정도 인식률 향상이 있었으며 인간이 판단하기에 보다 납득하기 쉬운 오 인식 성향을 보였다.

  • PDF

통계와 규칙을 이용한 강인한 품사 태거 (Robust Part-of-Speech Tagger using Statistical and Rule-based Approach)

  • 심준혁;김준석;차정원;이근배
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1999년도 제11회 한글 및 한국어 정보처리 학술대회 및 제1회 형태소 분석기 및 품사태거 평가 워크숍
    • /
    • pp.60-75
    • /
    • 1999
  • 품사 태깅은 자연 언어 처리의 가장 기본이 되는 부분으로 상위 자연 언어 처리 부분인 구문 분석, 의미 분석의 전처리로 사용되고, 독립된 응용으로 언어의 정보를 추출하거나 정보 검색 등의 응용에 사용되어 진다. 품사 태깅은 크게 통계에 기반한 방법, 규칙에 기반한 방법, 이 둘을 모두 이용하는 혼합형 방법 등으로 나누어 연구되고 있다. 포항공대 자연언어처리 연구실의 자연 언어 처리 엔진(SKOPE)의 품사 태깅 시스템 POSTAG는 미등록어 추정이 강화된 혼합형 품사 태깅 시스템이다 본 시스템은 형태소 분석기, 통계적 품사 태거, 에러 수정 규칙 후처리기로 구성되어 있다. 이들은 각각 단순히 직렬 연결되어 있는 것이 아니라 형태소 접속 테이블을 기준으로 분석 과정에서 형태소 접속 그래프를 생성하고 처리하면서 상호 밀접한 연관을 가진다. 그리고, 미등록어용 패턴사전에 의해 등록어와 동일한 방법으로 미등록어를 처리함으로써 효율적이고 강건한 품사 태깅을 한다. 한편, POSTAG에서 사용되는 태그세트와 한국전자통신연구원(ETRI)의 표준 태그세트 간에 양방향으로 태그세트 매핑을 함으로써, 표준 태그세트로 태깅된 코퍼스로부터 POSTAC를 위한 대용량 학습자료를 얻고 POSTAG에서 두 가지 태그세트로 품사 태깅 결과 출력이 가능하다. 본 시스템은 MATEC '99'에서 제공된 30000어절에 대하여 표준 태그세트로 출력한 결과 95%의 형태소단위 정확률을 보였으며, 태그세트 매핑을 제외한 POSTAG의 품사 태깅 결과 97%의 정확률을 보였다.

  • PDF

트리 구조를 이용한 수식 인식 연구 (A Study on Equation Recognition Using Tree Structure)

  • 박병준;김현식;김완태
    • 한국정보전자통신기술학회논문지
    • /
    • 제11권4호
    • /
    • pp.340-345
    • /
    • 2018
  • 수식은 일반 문장에 비해 복잡한 구조와 다양한 문자와 기호가 사용되어 단순한 키보드 입력만으로는 모든 문자 집합을 입력할 수 없어 한글이나 워드 같은 문서편집기 내에서도 자체적으로 구현된 수식 편집기를 사용하고 있다. 수식을 올바르게 표현하기 위해 구문을 해석할 수 있는 의미가 될 수 있는 사전 학습 정보가 필요하다. 문자가 입력되더라도 크기와 위치 서로간의 관계에 따라 다른 수식으로 표현될 수 있기 때문이다. 즉 표현될 위치와 크기 등 문자와 기호들 간의 상호관계를 고려하여 수식의 형태를 트리 모델로 표현한다. 문자인식 응용의 한 분야로 문자나 기호(부호)를 인식하는 기술을 이미 널리 알려졌지만, 수식을 입력과 해석하는 방법은 일반적인 텍스트에 비해 복잡한 분석 과정이 필요하다. 본 논문에서는 수식의 문자를 인식하고 표현되는 위치와 크기의 결정을 빠르게 해석하는 수식 인식기를 구현하였다.

뉴스 댓글의 감정 분류를 위한 자질 가중치 설정 (Feature Weighting for Opinion Classification of Comments on News Articles)

  • 이공주;김재훈;서형원;류길수
    • Journal of Advanced Marine Engineering and Technology
    • /
    • 제34권6호
    • /
    • pp.871-879
    • /
    • 2010
  • 본 논문은 뉴스 기사의 댓글에 대한 사용자의 감정을 분류하는 시스템을 제안한다. 제안된 시스템은 댓글의 문서 분류 시스템으로 기계학습에 기반을 두고 있다. 댓글은 일반적인 문서와 달리 본문을 가지고 있으며 본문의 내용이 독자의 감정에 영향을 줄 수 있다. 본 논문에서는 이와 같은 댓글의 특성과 여러 가지 자원을 이용하여 감정 분류를 위한 자질을 제안하고 이들의 가중치 설정 방법을 제안한다. 실험을 통해 이러한 가중치 설정 방법이 한글 뉴스의 댓글에 대한 감정을 분류하는데 효과적임을 알 수 있었다. 또한 댓글과 같이 많은 오류를 포함하는 문서에 대해서 문자 단위의 2음절과 3음절 자질도 충분히 이용 가치가 있음을 확인할 수 있었다. 향후에 뉴스 기사의 댓글뿐 아니라 상품 댓글 등 일반적인 감정 분석에 적용할 계획이다.