• 제목/요약/키워드: 어휘 통계

검색결과 121건 처리시간 0.022초

수능 영어 문항 유형간 응집력과 어휘정보 분석 (An Analysis of Cohesion and Word Information among English CSAT Question Types)

  • 최민주;김정렬
    • 한국콘텐츠학회논문지
    • /
    • 제17권12호
    • /
    • pp.378-385
    • /
    • 2017
  • 본 연구는 대학수학능력시험 영어영역 읽기지문의 문항 유형별 응집력과 어휘정보를 파악하기 위해 코퍼스 기반 분석을 실시하였다. 본 연구에서는 한국교육과정평가원에서 제시하는 여섯 가지의 문항유형을 세가지의 범주, 즉 맥락읽기, 세부읽기, 간접쓰기로 나누어 분석하였다. 이를 위해 처음 수능이 실시된 1994학년도부터 2017학년도까지의 수능 영어영역의 읽기지문의 코퍼스를 구축한 후, 코메트릭스 3.0을 활용하여 해당 코퍼스를 분석하여 각 문항들의 응집력과 어휘정보의 차이를 살펴보았다. 연구 결과 표층응집성 지표에서는 명사중복 측정치와 어간중복 측정치에서 통계적으로 유의미한 차이를 보였다. 연결사 지표에서는 역접의 연결사와 추가의 연결사에서 통계적으로 유의미한 차이를 보였다. 어휘정보 지표의 결과에서는 대명사의 발생정도, 습득나이 측정치, 내용어의 구체성 측정치, 심상성 측정치, 유의미성 측정치에서 통계적으로 유의미한 차이를 보였다. 이러한 문항유형간 응집력과 어휘정보 분석에 대한 정보는 교과서 집필 및 수능시험 출제에 활용될 수 있을 것이며, 학생들이 직접적으로 활용할 수 있는 읽기전략으로 활용 될 것으로 기대된다.

문장 길이 축소를 이용한 구 번역 테이블에서의 병렬어휘 추출 성능 향상 (Performance Improvement of Extracting Bilingual Term from Phrase Table using Sentence Length Reduction)

  • 정선이;이공주
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2013년도 제25회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.120-125
    • /
    • 2013
  • 본 연구는 대량의 특정 도메인 한영 병렬 말뭉치에서 통계 기반 기계 번역 시스템을 이용하여 병렬어휘를 효과적으로 추출해 낼 수 있는 방법에 관한 것이다. 통계 번역 시스템에서 어족이 다른 한국어와 영어간의 문장은 길이 및 어순의 차이로 인해 용어 번역 시 구절 번역 정확도가 떨어지는 문제점이 발생할 수 있다. 또한 문장 길이가 길어짐에 따라 이러한 문제는 더욱 커질 수 있다. 본 연구는 이러한 조건에서 문장의 길이가 축소된 코퍼스를 통해 한정된 코퍼스 자원 내 구 번역 테이블의 병렬어휘 추출 성능이 향상될 수 있도록 하였다.

  • PDF

한글의 감성공학 분석에 관한 연구 -제목용 글자 24point를 중심으로- (A Study on the Gamsung Engineering Analysis of the Korean Character - Focused on the 24 point Display Type Korean Character -)

  • 최동찬;박영택
    • 한국감성과학회:학술대회논문집
    • /
    • 한국감성과학회 2000년도 추계학술대회 논문집
    • /
    • pp.13-19
    • /
    • 2000
  • 본 연구에서는 시각 표시정보 중에서 제목용 한글에 대하여 감성어휘들을 조사하고, 의미분별법을 이용하여 한글의 설계요소들과 감성어휘들간의 관계를 다변량 통계방법을 통하여 분석하였다. 제목용 글자는 가로와 세로의 크기가 동일한 정체 중 크기가 24poin1인 낱 글자와 두 글자 단어를 이용하였다. 한글의 설계요소는 네모 형태이면서 글자 줄기에 세리프가 있는 명조 설계요소, 직각 형태인 고딕 설계요소, 둥근 형태인 굴림 설계요소와 탈 네모 형태이면서 세리프가 있는 공한 설계요소로 한정하였다. 총 420명(남자 210명, 여자 210명)의 피실험자를 대상으로 하여, 각 설계요소별로 요인분석을 통한 의미공간과 요인과 감성어휘 간의 관계를 파악하였다. 그리고 설계요소별로 23개의 감성어휘에 대한 감성차이와 남녀 간의 감성차이를 파악하기 위하여 ANOVA와 T-TEST 분석을 하였다.

  • PDF

7학년 국어교과서의 어휘 통계조사 -노미숙, 김태철 교과서를 중심으로- (Statistical Survey of Vocabulary in Korean Textbook for 7th-Grade -Focus on the No's and the Kim's Textbooks-)

  • 김철수
    • 한국콘텐츠학회논문지
    • /
    • 제14권4호
    • /
    • pp.491-499
    • /
    • 2014
  • 본 연구는 중학교 7학년 국어교과서 4종에 나타나는 어휘들에 대한 통계(음절 개수, 음절 종류, 음절 출현 빈도, 어절 개수, 어절 종류, 어절 평균 길이, 어절 출현 빈도 등)를 조사하였다. 전체 한글 음절 개수는 286,801개, 한글 음절 종류는 1,350개, 음절 평균 출현빈도는 212.4회이다. 어절 개수는 109,393개, 어절 종류는 29,356개, 어절 평균 출현빈도는 3.7회이다. 평균 음절 길이는 2.7음절이며, 한글 어절 중 가장 긴 어절길이는 8이다.

한국어 어휘 중의성 해소에서 어휘 확률에 대한 효과적인 평가 방법 (An Effective Estimation method for Lexical Probabilities in Korean Lexical Disambiguation)

  • 이하규
    • 한국정보처리학회논문지
    • /
    • 제3권6호
    • /
    • pp.1588-1597
    • /
    • 1996
  • 본 논문은 한국어 어휘 중의성 해소(lexical disambiguation)에서 어휘 확률 (lexical probability) 평가방법에 대해 기술하고 있다. 통계적 접근 방법의 어휘 중 의성 해소에서는 일반적으로 말뭉치(corpus)로부터 추출된 통계 자료에 기초하여 어 휘 확률과 문맥 확률(contextual probability)을 평가한다. 한국어는 어절별로 띄어 쓰기가 이루어지므로 어절 단위로 어휘 확률을 적용하는 것이 바람직하다. 하지만 한 국어는 어절의 다양성이 심하기 때문에 상당히 큰 말뭉치를 사용하더라도 어절 단위 로는 어휘 확률을 직접 평가할 수 없는 경우가 다소 있다. 이러한 문제점을 극복하기 위해 본 연구에서는 어휘 분석 측면에서 어절의 유사성을 정의하고 이에 기반을 둔 한국어 어휘 확률 평가 방법을 제안한다. 이 방법에서는 어떤 어절에 대해 어휘 확률 을 직접 평가할 수 없는 경우 이와 어휘 분석이 유사한 어절들을 통해 간접적으로 평 가한다. 실험결과 제안된 접근방법이 한국어 어휘 중의성 해소에 효과적인 것으로 나 타나고 있다.

  • PDF

문법성과 어휘 응집성 기반의 영어 작문 평가 시스템 (An English Essay Scoring System Based on Grammaticality and Lexical Cohesion)

  • 김동성;김상철;채희락
    • 인지과학
    • /
    • 제19권3호
    • /
    • pp.223-255
    • /
    • 2008
  • 본 논문에서 우리는 문장의 문법성과 텍스트의 어휘 응집성 측정을 위주로 하는 영어 작문 자동평가시스템을 소개하려고 한다. 문법 검사를 위해서는 링크 파서를 사용하고 어휘 연쇄를 측정하기 위해서는 로제 시소러스를 사용한다. 자동 평가 시스템의 채점 신뢰도를 측정하기 위해서 자동 채점과 수동 채점의 결과를 통계적으로 비교한다. 카파 통계와 다국면 Rasch 모형에 따른 분석 결과 자동 채점은 수동 채점과 유사성이 크며 수동 채점과 비교해서 신뢰성에 특별한 문제가 없다는 결론을 내리게 된다. 본 연구의 가장 큰 의의는 다양한 종류의 기술과 도구를 바탕으로 신뢰할 만한 수준의 영작문 자동 평가 시스템을 개발했다는 것이다. 평가 대상이 문장 단위를 넘어 선 텍스트 단위이며, 단어나 문법 등의 형식적 측면만 검사하는 것이 아니라 내용적 측면도 평가한다.

  • PDF

정서 어휘에 반영된 선율 특성에 적합한 화음 구성과 전개 (Harmonic Compositions and Progressions for Tonal Characteristics Based on Emotion Vocabulary)

  • 이수연;정현주
    • 한국융합학회논문지
    • /
    • 제8권9호
    • /
    • pp.265-270
    • /
    • 2017
  • 본 연구의 목적은 정서 어휘에 반영된 선율에 적합한 화음 구성과 전개의 특성을 조사하는 것이다. 이를 위해 연구 1에서는 8명의 음악중재전문가를 대상으로 질문지를 이용하여 정서 어휘의 의미와 선율을 반영하는 화음 구성과 전개를 작곡하고 근거에 대해 서술하게 하였다. 자료 분석은 화음 구성 비율을 백분율로 환산하여 정서 어휘별로 비교하고, 유사한 답변의 내용을 추출하였다. 연구 2에서는 124명의 음악치료와 음악전공자를 대상으로 연구 1의 결과에 따른 정서 어휘별 화음 구성과 전개의 적합성을 조사하고, 타당도의 통계학적 유의성을 검증하였다. 연구 결과, 기쁨의 어휘는 장화음, 주화음, 연속적인 화음 변화, 화남의 어휘는 단화음, 증화음, 9 11화음, 미해결된 7화음의 전개, 슬픔의 어휘는 단화음, 감화음, 반음계 전개의 사용 비율이 높았다. 타당도 검증 결과, 기쁨(97.2), 화남(75), 슬픔(80.6)으로 나타나 기쁨의 어휘에서만 유의성이 높았다(p<.005). 본 연구의 결과는 노래의 선율 창작시 가사가 전달하는 정서적 측면을 효율적으로 표현하기 위한 화음 사용의 근거자료를 제시한다.

한국어 다(多)음절 단어재인에서의 어휘접근단위 (Unit of Lexical Access in Korean Polysyllabic Word Recognition)

  • 임형욱;임희석;권유안;남기춘
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2004년도 제16회 한글.언어.인지 한술대회
    • /
    • pp.229-231
    • /
    • 2004
  • 본 연구는 다(多)음절 한국어 단어재인에서의 어휘접근단위(unit of lexical access)를 알아보고자 했다. 이를 위해 Taft(1987)가 영어 어휘접근단위를 알아보고자 했을 때 사용한 실험 패러다임을 이용하였다. 실험 결과 반응시간에서는 조건간 통계적으로 유의미한 차이를 보이지 않았지만, BOSS 조건의 반응시간이 짧은 경향성을 보였고, 반응률에 있어서도 BOSS를 지지하는 결과를 보여주었다. 물론, 반응 오류가 많은 등 Taft(1987)의 패러다임을 한국어에 적용하기에 부적절했던 점이 있었지만, 적어도 다음절 단어 어휘접근 시 BOSS가 역할을 하고 있다는 것은 알아 볼 수 있었다.

  • PDF

머신러닝 포키즈를 이용한 초등 AI 교육과 글쓰기 교육을 연계한 어휘력 향상 수업설계 (Vocabulary Improvement Class Design Linking Elementary School AI Education and Writing Education using 'Machine Learning for Kids')

  • 김지송;이명숙
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2021년도 제64차 하계학술대회논문집 29권2호
    • /
    • pp.719-722
    • /
    • 2021
  • 최근 인공지능의 새로운 기술들이 하루가 다르게 발전하고 있다. 이에 본 연구에서는 인공지능 교육과 글쓰기 교육을 연계하여 초등학생들의 어휘력 향상을 위한 수업을 설계하고자 한다. 그 방법으로는 본 수업에 앞서 어휘 10문제를 테스트하여 실험에 참가하기 전의 어휘력을 점검한다. 그 후 머신러닝 포키즈를 이용하여 여러 감정에 해당되는 단어들을 다양하게 훈련하도록 하였고, 그 후 관련된 어휘 10문제를 다시 테스트 하였다. 실험 결과 실험에 참가하기 전에는 100점 만점에 58.8점으로 나왔으나 훈련 후의 결과는 평균 68점으로 모든 학생의 성적이 좋아지는 결과를 얻을 수 있었다. 어휘력 문항수가 적은 점과 10명의 실험참가자로 일반화할 수 없는 한계가 있다. 향후 초등교재 한권을 선정하여 어휘를 모두 분석한 후 가장 많이 등장하는 어휘를 골라내어 테스트하여 좀 더 통계적으로 의미 있는 분석을 하고자 한다.

  • PDF

애플리케이션을 활용한 한국어 어휘 학습의 효과 -초급 한국어 학습자들을 중심으로- (Effect of Learning Korean Vocabulary with the Use of Mobile Applications -focused on Korean beginner learners-)

  • 이바른
    • 한국콘텐츠학회논문지
    • /
    • 제22권5호
    • /
    • pp.37-47
    • /
    • 2022
  • 본 연구는 초급 한국어 학습자들의 어휘 학습에 대한 인식과 애플리케이션 클래스카드를 활용한 어휘 학습을 일반적으로 쓰면서 외우는 어휘 학습 방법과 비교하여 효과를 살펴보는 것에 목적이 있다. 이를 위해 D대학교 한국어교육원 1, 2급 초급 한국어 학습자 24명을 대상으로 통제 집단 12명, 실험 집단 12명으로 나눈 후 어휘 평가지를 통하여 두 집단의 학습 전, 후 성취도를 살펴보았다. 실험 결과에 따르면 애플리케이션 클래스카드를 활용하여 어휘 학습을 한 학습자들의 어휘 점수가 크게 향상되었고 통계적으로 유의미한 결과를 보여 클래스카드를 활용한 어휘 학습의 효과성을 입증하였다. 또한 설문 조사를 통해 학습자들이 애플리케이션 클래스카드를 활용한 어휘 학습에 대한 거부감을 느끼지 않으며 쉽게 어휘를 공부할 수 있는 어휘 학습 방안 중 하나로 생각하고 있어 애플리케이션을 활용한 어휘 학습이 학습자들의 학습 성취도와 정의적인 측면에도 긍정적인 영향을 미치는 것을 알 수 있었다. 본 연구는 애플리케이션을 활용한 어휘 학습의 효과를 입증함으로써 학습자들의 흥미도와 어휘력을 높일 수 있는 어휘 학습 방안을 제안했다는 것에 의의가 있다.