• 제목/요약/키워드: 언어적 특징

검색결과 806건 처리시간 0.022초

자유대화의 음향적 특징 및 언어적 특징 기반의 성인과 노인 분류 성능 비교 (Comparison of Classification Performance Between Adult and Elderly Using Acoustic and Linguistic Features from Spontaneous Speech)

  • 한승훈;강병옥;동성희
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제12권8호
    • /
    • pp.365-370
    • /
    • 2023
  • 사람은 노화과정에 따라 발화의 호흡, 조음, 높낮이, 주파수, 언어 표현 능력 등이 변화한다. 본 논문에서는 이러한 변화로부터 발생하는 음향적, 언어적 특징을 기반으로 발화 데이터를 성인과 노인 두 그룹으로 분류하는 성능을 비교하고자 한다. 음향적 특징으로는 발화 음성의 주파수 (frequency), 진폭(amplitude), 스펙트럼(spectrum)과 관련된 특징을 사용하였으며, 언어적 특징으로는 자연어처리 분야에서 우수한 성능을 보이고 있는 한국어 대용량 코퍼스 사전학습 모델인 KoBERT를 통해 발화 전사문의 맥락 정보를 담은 은닉상태 벡터 표현을 추출하여 사용하였다. 본 논문에서는 음향적 특징과 언어적 특징을 기반으로 학습된 각 모델의 분류 성능을 확인하였다. 또한, 다운샘플링을 통해 클래스 불균형 문제를 해소한 뒤 성인과 노인 두 클래스에 대한 각 모델의 F1 점수를 확인하였다. 실험 결과로, 음향적 특징을 사용하였을 때보다 언어적 특징을 사용하였을 때 성인과 노인 분류에서 더 높은 성능을 보이는 것으로 나타났으며, 클래스 비율이 동일하더라도 노인에 대한 분류 성능보다 성인에 대한 분류 성능이 높음을 확인하였다.

구 단위 패턴 기반 한영 기계 번역에서의 기능동사 구문의 중심어 선택 모델 (Selecting Model of Head in Support Verb Constructions for Phrase-Pattern-based Korean-to-English Machine Translation)

  • 김혜경;채영숙;최기선
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1999년도 제11회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.203-208
    • /
    • 1999
  • 한국어는 잉여성과 중의성의 범 언어적인 특징과 함께 다른 언어에 비해 주어의 생략이 두드러지며 어순이 자유롭기 때문에 구문 형식의 지배를 덜 받는다는 개별적인 특성을 지닌다. 이러한 특성으로 인해 기계번역의 패턴을 추출할 때 서로 유사 가능성이 있는 패턴에 대한 고려가 없이는 같은 의미의 서로 다른 여러 개의 패턴을 모두 하나의 패턴으로 처리하는 오류를 범할 위험이 있다. 본 연구에서 사용되는 구 단위 패턴은 동사구, 명사구, 형용사구 그리고 부사구를 중심으로 한국어 패턴, 패턴 대표 카테고리, 한국어 패턴의 중심어 및 제약조건 대역영어패턴 의미코드로 나뉜다. 범 언어적인 특성의 한국어와 영어간 격차를 해소하기 위해 각각의 명사에 의미코드를 사용하여 다중 언어기반 체계를 구축하였으며. 한국어의 개별적인 특성으로 인해 발생하는 문제를 해소하기 위해 중심어 부과 자질을 사용하였다. 중심어 부과 자질에 있어서, 특히 술어기능명사를 중심어로 하는 기능동사 '하-' 구문은 다른 동사 구문의 형식과는 달리 논항의 수와 형태를 동사가 아닌 명사가 수행하게 된다. 이러한 특징에 대한 변별적인 자질 부여는 구문의 형태-통사적 특징 뿐만이 아니라 의미적인 고유의 특성까지도 잘 뒷받침하면서 패턴 추출에 월등한 효율성을 제시할 수 있다. 향후 이에 대한 연구는 전반적인 기능동사 구문뿐만이 아니라 개별적인 특징을 보이는 모든 구문에 대한 연구로 확대되어 패턴 기반 기계번역의 패턴 추출에 기본적인 정보의 역할을 담당해야 할 것이다.

  • PDF

IT 인물 관련 텍스트 정보의 효율적인 검색을 위한 Sub-language의 속성 연구 (Studies on the linguistic properties of the IT-People documents for an efficient Information Retrieval)

  • 고승희;김소연;천승미;남지순;김권양;박세영
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2007년도 제19회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.241-249
    • /
    • 2007
  • 본 연구는 IT 인물 관련 텍스트 정보의 효율적인 검색을 위하여 문서 내에서 인물과 관련된 정보를 담고 있는 문장들이 어떠한 특징을 가지고 실현되는가를 살펴보고 언어적 속성을 어떻게 구조화하고 형식화할 것인가를 논의하는 것을 목적으로 한다. 언어적 속성 분석을 위해서 전자신문 내에서 인물 관련 코퍼스를 수집하고 이들의 분석을 통해 다음과 같이 문제가 되는 특징들을 확인하였다. 즉 외래어 음차 표기문제, 복합명사 및 명사구 그리고 서술 명사적 표현의 문제 등으로 요약된다. IT라는 특정 영역에 대해 텍스트 내에서의 어휘-통사적 패턴을 분석하고 언어적 특징에 대한 효율적 기술을 위해서는 LGG 부분 문법 그래프 모델을 활용하도록 한다. 본 연구는 특정 영역인 IT 관련 문서에서 자연언어 텍스트를 대상으로 정보 검색할 때 문제가 되는 다양한 언어학적 현상들을 다루며, 향후보다 확장된 영역에서의 효율적 언어 처리에 대한 방법론적 대안을 제시할 수 있을 것으로 기대된다.

  • PDF

R의 객체지향성에 대하여

  • 이윤동
    • 한국통계학회:학술대회논문집
    • /
    • 한국통계학회 2005년도 추계 학술발표회 논문집
    • /
    • pp.1-3
    • /
    • 2005
  • 통계 소프트웨어 R은 여러 가지 특징을 가진 도구이다. S라는 전산언어를 기반으로 하고 이에 수학함수와 통계함수, 그리고 그래픽함수들이 결합되어 편리한 계산 작업 환경을 제공하고 있다. R이 기반으로 하고 있는 S언어에는 문법적, 의미론적 특징이 잘 어울려 있다. S언어의 주요 특징 중 하나는 객체지향성이다. 본 연구에서는 R의 특징인 객체지향성과 그 의미에 대하여 살펴보게 된다.

  • PDF

언어적 특징을 반영한 한국어 프레임넷 확장 및 개선 (Expansion and Improvement of Korean FrameNet utilizing linguistic features)

  • 김정욱;최기선
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2016년도 제28회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.85-89
    • /
    • 2016
  • 프레임넷 (FrameNet) 프로젝트는 버클리에서 1997년에 처음 제안했으며, 최근에는 다양한 언어적 특징을 반영하여 여러 국가에서 사용되고 있다. 하지만 문장의 프레임을 분석하는 것은 자연언어처리 전문가들이 많은 시간을 들여야 한다. 이 때문에, 한국어 프레임넷을 처음 만들 때는 충분한 훈련을 받은 번역가들이 영어 프레임넷의 문장들과 그 주석 정보들을 직접 번역하는 방법을 사용했다. 결과적으로 상대적으로 적은 비용이 들지만, 여전히 한 문장에 여러 번 등장하는 프레임 정보를 모두 번역하고 에러를 분석해야 했기에 많은 노력이 들어갔다. 본 연구에서는 일본어와 한국어의 언어적 유사성을 사용하여 비교적 적은 비용으로 한국어 프레임넷을 확장하는 방법을 제시한다. 또한 프레임넷에 친숙하지 않은 사용자가 더욱 쉽게 프레임 정보를 활용할 수 있도록 PubAnnotation 기술을 도입하고 "조사"라는 특성을 고려한 Valence pattern 분류를 통해 한국어 공개 프레임넷 사이트를 개선하였다.

  • PDF

연주자의 의도와 청자 간의 음악 연주를 통한 정서 전달 (Emotional Expression in Musical Performance)

  • 김종완;한광희
    • 한국HCI학회:학술대회논문집
    • /
    • 한국HCI학회 2007년도 학술대회 2부
    • /
    • pp.439-444
    • /
    • 2007
  • 정서 전달에는 언어적 의사소통뿐만 아니라 비언어적 의사소통이 거론되곤 한다. 하지만 지금까지의 비언어적 의사소통 연구는 대부분 언어의 음향학적 연구나 얼굴표정 연구에 국한되었다. 또한 음악의 정서에 대한 연구는 음악적 구조 혹은 스타일과 여러 성격적 특질 및 행동 간의 관계, 혹은 생리적 효과 등 어떤 음악(what music)이 특정한 효과를 일으키느냐에 중점을 두고 있었다. 따라서 본 연구에서는 Gabrielsson & Juslin(1996)의 연구에 의거, 음악을 통하여 작곡가가 아닌 연주자의 의도된 정서가 청자에게 얼마나 잘 지각될 수 있는지 알아보고자 하였다. 봉 녕구의 가설은 다음과 같다; 첫째, 연주자의 정서적 의도는 음악의 모든 물리적 변인에 영향을 준다; 둘째, 청자는 의도된 정서를 지각하는 데 일반적으로 성공적이다; 셋째, 특정 정서는 다른 정서보다 더 잘 구분된다. 본 연구에 사용된 곡은 학습 효과를 배제하기 위하여 새롭게 전문 작곡가에 의해 작곡되었으며, 전문 연주자는 동일한 곡을 7종류의 정서(행복한, 슬픈, 화난, 두려운, 다정한, 엄숙한, 정서 표현 없음)를 표현하도록 연주하였다. 하나의 완전한 음악을 표현하기 위하여 각 곡은 멜로디(악기구성: 일렉트릭 기타, 베이스, 그랜드 피아노)와 리듬(드럼)을 포함하였다. 실험참가자는 각 곡을 듣고 7개의 정서 종류 각각에 점수를 평정하였다. 그 결과 이전 연구와 마찬가지로 청자는 연주자의 의도된 정서를 일반적으로 지각하는 데 성공하였으며 7개의 정서 중 특징적인 정서("행복한", "슬픈", "화난", "다정한") 는 다른 정서 보다 더 잘 구별되었다. 본 연구에 사용된 "두려운" 정서 곡의 음향분석 결과 소리 강도의 큰 변산이 특징이었다. 이는 이전 연구에서 "두려운" 정서의 특징인 타이밍의 큰 변산과 함께, "두려운" 정서가 '불규칙적이거나 변화가 커서 예측하기 어려운' 속성을 지니고 있음을 시사한다. 또한 "다정한" 정서에 대해서 본 연구에서는 다른 모든 정서와 유의미한 차이를 보인 반면, 이전 연구에서는 "슬픈"과 유의미한 차이가 없었다. 이는 본 연구에 쓰인 "다정한" 정서의 곡은 리듬 패턴을 다른 정서 버전과는 다르게 보사노바 리듬을 사용하였다. 이전 연구와는 다르게 빠른 템포였음에도 불구하고 구별이 잘 된 이유는 이와 같이 장르 특징적인 영향이 컸기 때문이라고 할 수 있다. 이는 연주자나 음악 스타일 자체의 성격이 정서 판단에 있어 큰 영향을 준다는 사실을 시사한다. 종합적으로 음악을 통한 정서 전달에 있어 연주자, 청자, 악기, 음악 스타일의 차이가 영향을 줄 수 있다는 사실을 확인하였으며 이러한 결과는 Scherer & Oshinsky(1977)가 언급하였듯 음악 연주가 다른 비언어적 의사소통 방법과 공유하는 특징이 있음을 시사한다.

  • PDF

언어적 특징을 반영한 한국어 프레임넷 확장 및 개선 (Expansion and Improvement of Korean FrameNet utilizing linguistic features)

  • 김정욱;최기선
    • 한국어정보학회:학술대회논문집
    • /
    • 한국어정보학회 2016년도 제28회 한글및한국어정보처리학술대회
    • /
    • pp.85-89
    • /
    • 2016
  • 프레임넷 (FrameNet) 프로젝트는 버클리에서 1997년에 처음 제안했으며, 최근에는 다양한 언어적 특징을 반영하여 여러 국가에서 사용되고 있다. 하지만 문장의 프레임을 분석하는 것은 자연언어처리 전문가들이 많은 시간을 들여야 한다. 이 때문에, 한국어 프레임넷을 처음 만들 때는 충분한 훈련을 받은 번역가들이 영어 프레임넷의 문장들과 그 주석 정보들을 직접 번역하는 방법을 사용했다. 결과적으로 상대적으로 적은 비용이 들지만, 여전히 한 문장에 여러 번 등장하는 프레임 정보를 모두 번역하고 에러를 분석해야 했기에 많은 노력이 들어갔다. 본 연구에서는 일본어와 한국어의 언어적 유사성을 사용하여 비교적 적은 비용으로 한국어 프레임넷을 확장하는 방법을 제시한다. 또한 프레임넷에 친숙하지 않은 사용자가 더욱 쉽게 프레임 정보를 활용할 수 있도록 PubAnnotation 기술을 도입하고 "조사"라는 특성을 고려한 Valence pattern 분류를 통해 한국어 공개 프레임넷 사이트를 개선하였다.

  • PDF

LL 언어의 특징화 (Characterization of LL languages)

  • 이경옥
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제29권1_2호
    • /
    • pp.126-131
    • /
    • 2002
  • 주어진 문법이 LL 언어를 생성하는가의 문제를 LL 변환 가능성의 관점에서 조사한다. LL 변환 가능 문법을 특징짓기 위해 기존의 방법은 비결정적인(nondeterministic) 복잡한 파서의 생성을 필요로 한다. 이에 기존 방법으로는 LL 언어의 본질에 대한 직관적인 이해가 어렵다. 이 단점을 극복하고자 본 논문에선 파서의 생성 없이 문법 자체의 분석을 통한 문법 유도(derivation)에 근거한 특징화를 제시한다. 새로운 특징화는 LL 언어의 본질에 대한 직관적인 이해를 도울 수 있다.

다중스레드 모델의 스레드 코드를 자바 바이트 코드로 변환하기 위한 번역기 설계 (Design of Translator for generating Java Bytecode from Thread code of Multithreaded Models)

  • 김기태;이갑래;양창모;유원희
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 봄 학술발표논문집 Vol.27 No.1 (A)
    • /
    • pp.68-70
    • /
    • 2000
  • 다중스레드 모델은 데이터플로우 모델의 내부적인 병렬성, 비동기적 자료 가용성과 폰 노이만 모델의 실행 지역성을 결합하여 병렬처리 시스템의 성능을 향상 시켰다. 이 모델은 프로그램의 실행을 위하여 컴파일러에 의해 생성된 스레드를 수행하며, 스레드의 생성 방법에 따라 자원 활용 빈도나 동기화 빈도와 같은 스레드의 질이 결정 되는 특징이 있다. 하지만 다중스레드 모델은 실행 모델이 특정 플랫폼에 제한되는 단점을 가지고 있다. 이에 반해 자바는 플랫폼에 독립적인 특징을 가지고 있어 다중스레드 모델의 스레드 코드를 실행 단위인 자바 언어로 변환하면 다중스레드 모델의 특징을 여러 플랫폼에서 수정 없이 사용할 수 있게 된다. 자바는 원시 언어를 중간 언어 형태의 바이트 코드로 변환하여 각 아키텍처에 맞게 설계된 자바 가상 머신이 설치된 시스템에서 자바 언어를 수행한다. 이러한 자바 언어의 바이트 코드는 번역기의 중간 언어와 같은 역할을 수행하고, 자바 가상 머신은 번역기의 후위부와 같은 역할을 한다. 본 논문은 다중스레드 코드가 플랫폼에 독립적인 특성을 갖출 수 있도록 다중스레드 코드를 자바 가상 머신에서 실행 가능하도록 한다. 즉, 다중스레드 모델의 스레드 코드를 자바 바이트 코드로 변환하는 번역기를 설계, 구현하고, 자바 가상 머신의 실행을 분석한다.

  • PDF

한글 프로그래밍 언어(한글 포트란)의 설계에 관한 연구

  • 정순영;허용도;백두권;황종선
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1990년도 제2회 한글 및 한국어정보처리 학술대회
    • /
    • pp.32-38
    • /
    • 1990
  • 한글 프로그래밍 언어는 새로운 개념에 의해 설계되어야 하는데 그에 따른 많은 문제점이 발생하게 된다. 따라서 한글 프로그래밍 언어를 설계할 때 문제가 되는 한글의 구조적 특징, 동사가 문장의 마지막 뒤에 나오는 Postfix 적 특징, 한글의 특이한 데이타 구조 및 조사라는 첨가어가 붙으므로 인한 렉시칼 문제점등을 구조적으로 분석하고 여기에 맞는 한글 프로그래밍 언어를 개발하여야 한다. 그러나 이러한 모든 조건에 맞는 한글 프로그래밍 언어를 개발하는 것은 쉬운 일이 아니며 상당한 시간을 요하는 일이므로 본 논문에서는 과학기술용에 가장 많이 사용되는 FORTRAN 언어를 택하여 일차적으로 그 명령어를 한글화하였다.

  • PDF