• 제목/요약/키워드: 단어산출

검색결과 84건 처리시간 0.026초

통계적기법에 의한 한글자동색인의 연구 (A Study on Automatic Indexing of Korean Texts based on Statistical Criteria)

  • 우동진
    • 정보관리학회지
    • /
    • 제4권1호
    • /
    • pp.47-86
    • /
    • 1987
  • 본 연구는 한글자동색인에 관한 연구로 한국전자통신연구소의 DOCUMENT Data Base로부터 299개 문헌의 제목과 초록을 무작위로 추출하여 단어분리를 시도하고, 분리된 단어군, 인식어를 제외한 단어군, 인식어와 불용어를 제외한 단어군, 그리고 인식어와 불용어를 제외하고 복합어를 구성하여 포함한 단어군 등 4개의 시험군을 설정한 후, 파오의 전환점 산출기과 스파크죤스의 역문헌 가중기법, 살톤의 문헌분리 가중기법을 적용하여 색인어를 선정하고 이를 비교 평가하여 한글문헌의 자동색인 방안을 모색하였다.

  • PDF

한국어 어말어미 산출관련 대뇌 활성화 (Cerebral activation related with morphological priming effect in production of Korean Endings)

  • 황유미;신정무;임수미;류근택;강현수;이광오;남기춘
    • 한국인지과학회:학술대회논문집
    • /
    • 한국인지과학회 2005년도 춘계학술대회
    • /
    • pp.273-277
    • /
    • 2005
  • 본 연구는 한국어 어말어미 산출시 나타나는 대뇌 활성화 영역을 살펴보기 위하여 실시되었다. 두 가지 실험이 실시되었다 실험 1은 어말어미의 기본형을 주고 이를 의문형, 명령형으로 산출하는 고립단어 실험을 실시하였다. 통제 조건으로 모음변환조건(C1)과 아라비아문자보기(C2)를 사용하였다. 실험 1의 결과 ‘어말어미-C1’ 조건에서 좌반구의 측두엽과 전두엽부분의 의 활성화 superior temporal gyrus와 inferior frontal gyrus의 활성화가 관찰되었다. ‘어말어미-C2’ 의 조건에서 우반구에서 후두엽의 활성화와 좌반구에서의 후두엽, 전두엽, lingual G, Cuneus, fusiform G, inferior occipital G에서의 활성화를 관찰할 수 있었다. 실험 2는 명령형과 의문형 어미의 형태점화효과와 관련된 대뇌 활성화 영역을 관찰하기 위하여 Er-fMRI 기법을 이용하여 실시되었다. 실험 조건은 어미동일조건, 어간반복조건, 무관련 조건으로 구성되었다. 피험자들은 점화자극이 제시된 후 신호가 제시되고 나오는 표적단어를 의문형 또는 명령으로 산출하도록 하는 과제를 실시하였다. 뇌 활성화 영역을 분석한 결과 의문형과 명령형을 산출할 때의 활성화 영역에서 $^{\ast}^{\ast}^{\ast}$를 볼 때의 영역을 빼기 (substraction)한 결과 공통적으로 좌반구 브로카 영역이 활성화되었고, 의문형과 명령형 안에서 어미동일조건에서 무관련 조건을 뺀 경우에는 좌반구의 superior temporal G 영역의 활성화가 관찰되었다. 이들 결과를 종합해 볼 때 어말어미 산출 그 자체와 직접 관련되는 영역으로는 좌반구의 측두엽과 전두엽 부분이 관찰되었다. 특히 한국어 어말어미 산출시 나타나는 형태점화 양상과 관련된 대뇌영역으로 발견된 브로카 영역에서의 활성화는 어미 변환과 관련된 영역이라기보다는 산출시 관련되는 articulation, motor coordinate관련 영역으로 추정되고, 측두엽의 활성화는 형태소, 의미 관련 지식의 data base로 추정된다. 또한 우반구 전두엽 부분에서 관찰된 활성화는 억제관련 영역으로 짐작된다.

  • PDF

언어 산출 과정의 몇 가지 특성: - 지식 유형, 텍스트 유형, 산출양식이 언어 산출에 미치는 효과 (Some Characteristics of Language Production Processes: The Effects of Knowledge Types, Text Types, and Production Modes)

  • 노영희;이정모
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1993년도 제5회 한글 및 한국어정보처리 학술대회
    • /
    • pp.241-247
    • /
    • 1993
  • 이 연구에서는 지식 유형, 텍스트 유형 및 언어 산출 양식이 언어 산출 과정에 미치는 효과를 알아보았다. 본 연구에서는 산출할 말글에 대한 1) 사전정보를 대형(거시적) 의미구조, 소형(미시적) 의미구조, 관련 단어들의 모음의 세 지식 유령에 의해 조작하고, 2) 산출할 말글 유형을 이야기 말글과 논술 말글의 두 유형으로 변화하고, 3) 언어 산출 양식을 말하기, 펜으로 쓰기, 컴퓨터로 쓰기의 세 양식으로 변화하였을 때에, 언어 산출 과정에 어떠한 처리 부담이 가하여지는가를 3개의 실험을 통하여 연구하였다.

  • PDF

문장으로부터 여러 단어로 구성된 여러 유형의 요소 추출 (Extracting Multi-type Elements Consisting of Multi-words from Sentences)

  • 양선;고영중
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2014년도 제26회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.73-77
    • /
    • 2014
  • 문장을 대상으로 특정 응용 분야에 필요한 요소를 자동으로 추출하는 정보 추출(information extraction) 과제는 자연어 처리 및 텍스트 마이닝의 중요한 과제 중 하나이다. 특히 추출해야할 요소가 한 단어가 아닌 여러 단어로 구성된 경우 추출 과정에서 고려되어야할 부분이 크게 증가한다. 또한 추출 대상이 되는 요소의 유형 또한 여러 가지인데, 감정 분석 분야를 예로 들면 화자, 객체, 속성 등 여러 유형의 요소에 대한 분석이 필요하며, 비교 마이닝 분야를 예로 들면 비교 주체, 비교 상대, 비교 술어 등의 요소에 대한 분석이 필요하다. 본 논문에서는 각각 여러 단어로 구성될 수 있는 여러 유형의 요소를 동시에 추출하는 방법을 제안한다. 제안 방법은 구현이 매우 간단하다는 장점을 가지는데, 필요한 과정은 형태소 부착과 변환 기반 학습(transformation-based learning) 두 가지이며, 파싱 혹은 청킹 같은 별도의 전처리 과정도 거치지 않는다. 평가를 위해 제안 방법을 적용하여 비교 마이닝을 수행하였는데, 비교 문장으로부터 각자 여러 단어로 구성될 수 있는 세 가지 유형의 비교 요소를 자동 추출하였으며, 실험 결과 정확도 84.33%의 우수한 성능을 산출하였다.

  • PDF

노화에 따른 구체명사와 추상명사의 단어정의하기 능력 변화 (Age-related Changes in Word Defining Abilities in Concrete and Abstract Nouns with Normal Elderly)

  • 김수련;김향희
    • 재활복지
    • /
    • 제21권3호
    • /
    • pp.187-207
    • /
    • 2017
  • 본 연구는 일반노년층을 대상으로 단어정의하기 과제를 실시하여, 노화에 따른 구체명사와 추상명사의 단어정의하기 능력 변화를 살펴보았다. 대상자는 55~64세, 65~74세, 75~84세, 85세 이상의 네 개 연령집단으로 분류된 총 382명의 일반노인들이었다. 5개의 구체명사와 5개의 추상명사로 구성된 단어정의하기 과제를 실시하여, 단어정의 점수, 주요의미/부수의미의 개수 및 비율, 오류유형을 분석하였다. 연구 결과 구체명사의 정의점수, 주요의미/부수의미의 개수 및 비율은 네 집단 간 차이가 모두 유의하였다. 추상명사의 경우, 높은 연령집단인 75~84세와 85세 이상 집단 간 차이를 제외한 모든 연령집단 간 차이가 통계적으로 유의하였다. 오류의 산출빈도는 85세 이상 집단에서 급격한 증가를 보였으며 오류유형의 산출비율은 55~64세, 65~74세 집단에서 개인적 경험 오류, 75~84세 집단에서 목표어휘 반복 오류, 85세 이상 집단에서 무반응 오류가 가장 높았다. 이러한 결과는 구체명사와 추상명사 모두 노화가 진행됨에 따라 의미망 내에서의 어휘 및 의미자질들의 확산적 활성화가 제한되어 주요의미와 부수의미의 개수가 감소하고 이로 인해 단어에 대한 정의 내용 또한 빈약해진다는 것을 의미한다. 또한 연령이 높은 집단일수록 의미망 내에서 목표어휘와 가까운 거리에 있는 주요의미의 비율이 증가하였다. 본 연구는 다양한 연령대의 노인집단을 대상으로 단어정의하기 능력을 살펴보아, 노화에 따른 언어능력 특성을 제시하였다는 점에 의의가 있다.

3-5세 일반아동의 말소리에 대한 융합적 분석: 단어와 자발화를 중심으로 (Convergent Analysis on the Speech Sound of Typically Developing Children Aged 3 to 5 : Focused on Word Level and Connected Speech Level)

  • 김윤주;박현주
    • 한국융합학회논문지
    • /
    • 제9권6호
    • /
    • pp.125-132
    • /
    • 2018
  • 본 연구는 단어 및 자발화 평가를 통해 학령전 아동의 말소리 산출 특성과 평가 관련 양상을 살펴보고자 하였다. 이를 위해 3-5세 일반아동 72명(연령별 각각 24명)을 대상으로 아동용발음검사(APAC)를 실시하고, 연령과 성별에 따른 자음정확도와 명료도의 차이, 자음정확도와 명료도 간 상관관계, 자음 위치 및 조음 방법에 따른 말소리 오류 패턴을 분석하였다. 연구 결과, 자음정확도와 명료도는 연령에 따라 증가하였으나 성별에 따른 차이는 없었고, 상관관계는 5세 집단에서 통계적으로 유의했으며, 말소리 오류 패턴 또한 두 평가에서 다르게 나타났다. 본 연구 결과는 아동의 말소리 산출이 언어단위에 따라 다르게 나타나기에, 이들의 말소리 능력을 적절히 파악하려면 단어뿐 아니라 자발화 평가가 병행되어야 함을 보여주었다. 이는 단어에 대한 자음정확도만으로 언어장애 등급을 판정하는 현재 기준에 대한 재검토와 추가적인 연구가 필요함을 시사한다.

단어 동시출현관계로 구축한 계층적 그래프 모델을 활용한 자동 키워드 추출 방법 (Automatic Keyword Extraction using Hierarchical Graph Model Based on Word Co-occurrences)

  • 송광호;김유성
    • 정보과학회 논문지
    • /
    • 제44권5호
    • /
    • pp.522-536
    • /
    • 2017
  • 키워드 추출은 주어진 문서로부터 문서의 주제나 내용에 관련된 단어들을 추출해내는 방법으로 대량의 문서를 다루는 텍스트마이닝 연구들이 전처리에서 공통적으로 거치는 대표 자질 추출에서 중요하게 활용될 수 있다. 본 논문에서는 하나의 문서의 주제에 적합한 키워드를 추출하기 위해 문서에 출현한 단어들 사이의 동시출현관계, 동시출현 단어 쌍 사이의 출현 종속 관계, 단어들 사이의 공통 부분단어 관계 등의 다양한 관계들을 특징으로 활용하여 구축한 계층적 그래프 모델을 제안하고, 그래프를 구성하는 정점(Vertex)들의 중요도를 평가할 때 입력 간선(Edge)에 의한 영향뿐만 아니라 출력 간선에 의한 영향도 고려한 새로운 중요도 산출 방법을 제안하며, 이를 토대로 점진적으로 키워드를 추출해내는 방안을 제안한다. 그리고 제안한 방법의 정확성과 주제적 포괄성 검증을 위해 다양한 분야의 주제를 가진 문서 데이터에 다양한 평가방법을 적용해 기존의 방법보다 전체적으로 더 나은 성능을 보임을 확인하였다.

문장 따라말하기 과제에서 3~7세 아동의 말소리발달 (Phonological development of children aged 3 to 7 under the condition of sentence repetition)

  • 김수진;박나래;장문수;김영태;신문자;하지완
    • 말소리와 음성과학
    • /
    • 제12권1호
    • /
    • pp.85-95
    • /
    • 2020
  • 아동이 산출하는 말소리를 평가할 때 단어와 문장을 유도하여 산출한 말소리를 분석하고, 자발화를 이용하여 분석하기도 한다. 단어 검사와 자발화 검사의 한계를 보완할 수 있는 평가 방법으로 문장 따라말하기 과제가 있다. 문장 따라말하기 과제를 통한 아동의 말소리 평가는 자발화와 유사한 특성을 보이면서 단어와 같이 제한된 시간 안에 다양한 음소를 평가할 수 있다. 본 연구에서는 다양한 모음문맥에서 자음을 배치하고 모든 음소가 3회 이상의 출현 기회를 가질 수 있도록 계획된 11개의 문장 따라말하기를 통해 연령과 성별에 따라서 단어단위 음운지표와 개정자음정확도의 발달을 살펴보았다. 전국에 거주하는 3세부터 7세까지 아동 535명을 대상으로 UTAP2에 새롭게 포함된 11개 문장 따라말하기 과제를 실시하였다. 말소리발달을 평가할 수 있는 지표 PCC-R, PWC, PMLU, PWP을 구하였다. 아동은 연령별 6개월 단위로 10개의 집단을 구분하고 각 지표에 대해 연령집단과 성별에 따른 차이를 분석하였다. 연구 결과, 모든 지표에서 연령이 증가함에 따라 수치가 상승하였으며 연령집단 간 차이는 유의하였다. 성별에 따른 차이와 연령과 성별의 상호작용효과는 유의하지 않은 것으로 나타났다. 본 연구는 전국에서 자료를 수집하였고, 연령집단을 6개월로 나누어 보았으며, 집단별 데이터를 충분히 수집하였다는 점과 단어와 자발화 검사의 한계점을 보완할 수 있는 문장 따라말하기라는 새로운 말소리 평가 방법의 연령별 준거 자료를 제시하였다는 측면에서 의의가 있다.

보완대체의사소통(AAC) 글자판의 단어예측기능에 대한 뇌병변장애인 대상의 사용성 평가 (A Usability Testing of the Word-Prediction Function of the AAC Keyboard for the People with Cerebral Palsy)

  • 이희연;홍기형
    • 재활복지공학회논문지
    • /
    • 제9권3호
    • /
    • pp.209-214
    • /
    • 2015
  • 본 연구의 목적은 (1) 구어로 의사소통을 하는데 어려움을 가지고 있는 뇌병변장애인을 대상으로 보완대체의사소통 글자판의 단어예측기능이 문장산출 속도에 미치는 영향 및 (2) 단어예측기능의 필요성, 편의성, 만족도 등을 조사하는 것이다. 총 10명의 성인 뇌병변장애인들이 평가에 참여하였고, 한국형 하이테크 AAC 기기인 마이토키스마트의 글자판에 탑재된 단어예측기능이 평가도구로 사용되었다. 참가자들은 제시되는 문장을 단어예측기능과 낱글자 직접입력방식을 각각 사용하여 음성출력한 후에, 단어예측기능의 필요성, 사용 편의성 및 만족도를 5점 척도로 평가하도록 요청되었고, 자유 피드백을 통해 기타 의견들을 조사하였다. 연구결과, 문장예측기능을 사용했을 때의 문장생성속도가 낱글자입력방식을 사용했을 때보다 평균적으로 빠르게 나타났으나 통계적으로 유의한 차이는 나타나지 않았다. 이는 참가자들이 새로운 실험도구를 충분히 연습하고 학습할 적응기간이 부족했기 때문인 것으로 보인다. 참가자들의 문장예측기능에 대한 필요성, 편의성, 만족도 등은 전반적으로 긍정적인 응답을 나타냈다.

  • PDF

우리나라 아동의 지역별 말소리 발달 차이 (Regional differences in Korean children's development of speech production)

  • 신문자;하지완;김영태;김수진
    • 말소리와 음성과학
    • /
    • 제11권3호
    • /
    • pp.57-67
    • /
    • 2019
  • 본 연구의 목적은 우리나라 아동들의 말소리산출 발달에 지역적 차이가 존재하는지를 알아보고자 하는 것이다. 2세 후반부터 7세에 해당하는 전라, 서울경기, 경상, 충청 지역의 아동 619명이 본 연구에 참여하였고, 대상자들에게 우리말 조음음운평가2의 단어수준 검사를 진행하였다. 수집된 데이터에 대해 지역 및 연령에 따른 단어단위정확률(PWC), 평균음운길이(PMLU), 단어단위근접률(PWP), 전체 자음정확도(Total PCC), UTAP 자음정확도(UTAPPCC)를 비교 분석하였다. 연구결과 단어단위 지표인 PWC, PMLU, PWP에서는, 2세 후반의 경우 경상도 지역에서, 3세 초반의 경우 전라도와 충청도 지역에서 서울경기 지역보다 수행력이 유의하게 낮았다. 그러나 3세 후반부터는 어떤 단어단위 지표에서도 지역 간 차이가 관찰되지 않았다. 분절음 차원의 지표인 PCC에서는, 2세 후반의 경우 Total PCC에서 경상도와 충청도가, UTAP PCC에서 충청도가 서울경기 지역보다 수행력이 유의하게 떨어졌고, 3세 초반의 경우 두 지표 모두에서 전라도와 충청도가 서울경기보다 수행력이 유의하게 떨어졌다. 그러나 3세 후반부터는 Total PCC와 UTAP PCC 모두에서 지역 간 차이가 나타나지 않았다. 이러한 결과는 어린 연령의 경우 말소리산출 능력에 국내의 지역 간 차이가 존재하며, 그 차이가 특정 지역의 특성이라기보다는 서울과 지방의 차이로 설명될 수 있음을 시사한다.