• 제목/요약/키워드: 음절수

검색결과 314건 처리시간 0.028초

뉴스 댓글의 감정 분류를 위한 자질 가중치 설정 (Feature Weighting for Opinion Classification of Comments on News Articles)

  • 이공주;김재훈;서형원;류길수
    • Journal of Advanced Marine Engineering and Technology
    • /
    • 제34권6호
    • /
    • pp.871-879
    • /
    • 2010
  • 본 논문은 뉴스 기사의 댓글에 대한 사용자의 감정을 분류하는 시스템을 제안한다. 제안된 시스템은 댓글의 문서 분류 시스템으로 기계학습에 기반을 두고 있다. 댓글은 일반적인 문서와 달리 본문을 가지고 있으며 본문의 내용이 독자의 감정에 영향을 줄 수 있다. 본 논문에서는 이와 같은 댓글의 특성과 여러 가지 자원을 이용하여 감정 분류를 위한 자질을 제안하고 이들의 가중치 설정 방법을 제안한다. 실험을 통해 이러한 가중치 설정 방법이 한글 뉴스의 댓글에 대한 감정을 분류하는데 효과적임을 알 수 있었다. 또한 댓글과 같이 많은 오류를 포함하는 문서에 대해서 문자 단위의 2음절과 3음절 자질도 충분히 이용 가치가 있음을 확인할 수 있었다. 향후에 뉴스 기사의 댓글뿐 아니라 상품 댓글 등 일반적인 감정 분석에 적용할 계획이다.

한국어 마찰음 /ㅅ,ㅆ/의 지속시간에 영향을 미치는 요인에 관한 연구 (A study on the duration of Korean fricatives /s, s'/ and factors that Influence their duration)

  • 송윤경
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1999년도 학술발표대회 논문집 제18권 2호
    • /
    • pp.333-336
    • /
    • 1999
  • 본 연구의 목적은 한국어 마찰음 /ㅅ, ㅆ/가 지속시간에 있어서 유의미한 차이를 가지고 있는가를 관찰하고, 나아가 지속시간에 영향을 미치는 요인에 어떠한 것이 있는가를 기술하는 데에 있다. 이러한 결과는 음성합성을 위한 기초자료로 이용될 수 있을 것이다. 분석 결과, /ㅅ/보다 /ㅆ/가 더 긴 지속시간을 가졌으며 마찰음을 선행하는 음소의 성질, 단어에서 마찰음이 가지는 음절 위치, 그리고 마찰음 앞에서 끊어읽기가 이루어졌는가의 여부가 지속시간에 영향을 미치는 요인으로 작용하였다.

  • PDF

Sub-word 단위 HMM을 이용한 한국어 대용량 어휘 인식 (Large Vocabulary Speech Recognition Using Sub-word Unit HMM)

  • 김홍수;이상운;이건웅;홍재근
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2000년도 제13회 신호처리 합동 학술대회 논문집
    • /
    • pp.167-170
    • /
    • 2000
  • 일반적인 한국어 대용량 어휘인식에 사용되는 triphone 모델은 한국어의 특성을 잘 표현한다는 장점이 있으나 인식시간이 길어지게 된다. 이러한 triphone 모델의 단점을 극복하기 위해 음절단위 HMM 모델을 사용하는 방법이 있는데 이 모델은 인식시간을 줄일 수 있으나 triphone 모델에 비해서 인식률이 낮다. 본 논문에서는 음성 인식시간을 단축시키고 조음현상을 고려하기 위하여 초성과 종성 자음은 각각의 biphones으로 나타내고 중성 모음은 1개의 monophone으로 나타내는 모델을 제안하였다. PBW445 음성 데이터베이스에 대한 실험결과, 제안한 인식모델이 triphone 모델에 가까운 인식률을 나타내었으며, 인식시간을 크게 단축하였다.

  • PDF

한국어 문장에 나타난 초점의 운율적 특징 (Prosodic Realization of Focus in Korean Sentences)

  • 유정
    • 한국언어정보학회:학술대회논문집
    • /
    • 한국언어정보학회 2003년도 학술대회 발표논문집
    • /
    • pp.52-57
    • /
    • 2003
  • 문장 안에서 새로운 정보를 닫고 있는 초점이 실제 말소리에서 드러나는 특징을 연구하였다. 초점과 초점 주변의 초분절소(suprasegmental, 강세, 길이, 성조)를 분석한 결과, 초점 보다 초점 앞의 강세구 길이가 크게 늘어나는 것을 관찰하였는데, 이때 강세구 전체 길이 보다 마지막 음절의 길이가 두드러지게 길게 발음되었다. 또한, 초점 앞에서 문장 단위의 끊어 읽기가 나타나는 것을 발견하였다. 인구어와는 달리 초점에 강세를 동반한다는 특징을 찾아볼 수는 없었다.

  • PDF

한글 음절 분류를 통한 입 모양 궤적 생성 (Mouth Shape Trajectory Generation Using Hangul Phoneme Analysis)

  • 박유신;김종수;김태용;최종수
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2003년도 신호처리소사이어티 추계학술대회 논문집
    • /
    • pp.53-56
    • /
    • 2003
  • In this paper, we propose a new method which generates the trajectory of the mouth shape for the characters by the user inputs. It is based on the character at a basis syllable and can be suitable to the mouth shape generation. In this paper, we understand the principle of the Korean language creation and find the similarity for the form of the mouth shape and select it as a basic syllable. We also consider the articulation of this phoneme for it and create a new mouth shape trajectory and apply at face of an 3D avatar.

  • PDF

Ramp Edge Detection을 이용한 끝점 검출과 음절 분할에 관한 연구 (A Study on Endpoint Detection and Syllable Segmentation System Using Ramp Edge Detection)

  • 유일수;홍광석
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2003년도 하계종합학술대회 논문집 Ⅳ
    • /
    • pp.2216-2219
    • /
    • 2003
  • Accurate speech region detection and automatic syllable segmentation is important part of speech recognition system. In automatic speech recognition system, they are needed for the purpose of accurate recognition and less computational complexity, In this paper, we Propose improved syllable segmentation method using ramp edge detection method and residual signal Peak energy. These methods were used to ensure accuracy and robustness for endpoint detection and syllable segmentation system. They have almost invariant response to various background noise levels. As experimental results, we obtained the rate of 90.7% accuracy in syllable segmentation in a condition of accurate endpoint detection environments.

  • PDF

Structural SVM을 이용한 한국어 자동 띄어쓰기 (Automatic Korean Word Spacing using Structural SVM)

  • 이창기;김현기
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2012년도 한국컴퓨터종합학술대회논문집 Vol.39 No.1(B)
    • /
    • pp.270-272
    • /
    • 2012
  • 본 논문에서는 띄어쓰기가 완전히 무시된 한국어 문장의 띄어쓰기 문제를 위해 structural SVM을 이용한 한국어 띄어쓰기 방법을 제안한다. Structural SVM은 기존의 이진 분류 SVM을 sequence labeling 등의 문제에 적용할 수 있도록 확장된 것으로, 이 분야에 띄어난 성능을 보이는 것으로 알려진 CRF와 비슷하거나 더 높은 성능을 보이고 있다. 본 논문에서는 약 2,600만 어절의 세종 코퍼스 원문을 학습 데이터로 사용하고, 약 29만 어절의 ETRI 품사 부착 코퍼스를 평가 데이터로 사용하였다. 평가 결과 음절단위의 정확도는 99.01%, 어절단위의 정확도는 95.47%를 보였다.

움직임 관련 EEG 신호를 이용한 한국어 생성기 설계 (Design of Korean Generator Using Movement Related EEG Signal)

  • 이새벽;임희석
    • 한국산학기술학회:학술대회논문집
    • /
    • 한국산학기술학회 2009년도 춘계학술발표논문집
    • /
    • pp.162-165
    • /
    • 2009
  • 본 논문에서는 뇌-컴퓨터 인터페이스(Brain-Computer Interface) 기술을 중 움직임과 관련된 EEG(Electroencephalograph)신호를 이용하여 한국어를 생성하기 위한 시스템 설계 방법을 제안한다. 뇌-컴퓨터 인터페이스의 정보변환율(Information Transfer Rate)향상을 위하여 바이오피드백 방법과 기계학습 방법을 동시에 적용시킬 수 있는 방법과 움직임 관련 SMR(Sensorimotor Rhythm)과 한국어 음절, 어절 예측을 기술을 사용하여 ALS환자 혹은 운동능력이 없는 사람들을 위한 한국어 생성을 위한 설계 방법에 대해서 연구하였다.

  • PDF

강의실의 실내흡음력 증가에 따른 한국어 및 중국어의 음성요해도 비교 (Comparison of the Korean and Chinese Speech Intelligibility with Increasing Sound Absorption in a Classroom)

  • 딩웨이;박찬재;한찬훈
    • 한국음향학회지
    • /
    • 제31권3호
    • /
    • pp.129-141
    • /
    • 2012
  • 본 논문은 강의실의 실내흡음력이 증가함에 따라 발생하는 물리적 음명료도 (D50, STI)의 변화가 한국어와 중국어의 주관적 음이해도 (음성요해도)에 미치는 영향을 조사하였다. 이를 위해 중규모 강의실에서 흡음재를 설치하기 전과 후의 물리적 음향성능을 측정하고, 음절요해도 테스트 법을 사용해 음성요해도를 평가하였다. 음성요해도 평가시 한국어와 중국어의 두 가지 언어를 대상으로 진행함으로써 두 언어의 특성에 따른 음성요해도의 차이를 비교하였다. 실험결과 흡음재를 설치함에 따라 물리적 음명료도가 증가하였으며, 음성요해도 또한 증가함을 알 수 있었다. 또한 동일한 조건에서 음절요해도 테스트를 수행한 결과 한국어보다 중국어의 음성요해도가 더 높은 것으로 평가되었으며 이것은 한국어와 중국어의 발음특성의 차이에 기인한 것으로 사료된다. 한편 물리적 음명료도와 주관적 음명료도의 상관관계 분석결과 ($R^2$) D50의 경우 한국어는 0.696, 중국어는 0.707로 나타났으며 STI의 경우 한국어는 0.651, 중국어는 0.665로 매우 높은 상관관계가 있음을 알 수 있었다.

KFL중국인학습자들의 한국어 동형다의 종결어미 발화문에 대한 원어민화자의 지각 평가 양상 (Perceptive evaluation of Korean native speakers on the polysemic sentence final ending produced by Chinese Korean learners)

  • 윤영숙
    • 말소리와 음성과학
    • /
    • 제12권4호
    • /
    • pp.27-36
    • /
    • 2020
  • 본 논문은 중국인 한국어학습자들이 발화한 한국어 동형다의 종결어미 '-(으)ㄹ 걸' 대한 한국어 원어민화자들의 지각양상을 분석하고 이를 바탕으로 '-(으)ㄹ 걸'의 청지각적 의미 변별에 결정적인 역할을 하는 운율변수를 한국어 교육적 관점에서 분석하는 데 목적이 있다. 동형다의 종결어미는 하나의 형태로 두 개 이상의 의미를 전달하는 종결어미를 일컫는다. 지금까지 외국인학습자들을 대상으로 한 동형다의 종결어미에 대한 연구는 외국인학습자들의 발화문을 원어민 화자의 발화문과 비교·분석하여 음운론적·음성학적 유사점과 차이점을 분석하여 발화정확도나 오류유형을 측정하는 데 집중되었다. 이로 인해 원어민화자와의 유사성과 차이점이 '-(으)ㄹ 걸'의 의미 판별에 실제로 유의미한 작용을 하는지에 대한 청지각적 연구는 이루어지지 못했다. 본 연구에서는 중국인 한국어학습자들의 동형다의 종결어미 문장이 한국어 원어민화자들에게 어떤 양상으로 지각되는지 분석하여 동형다의 종결어미 억양교육에 필요한 운율 규범을 상정해 보고자 한다. 본 연구의 실험자료 산출에는 한국어 숙달도 중·고급에 해당하는 10명의 중국인 한국어학습자들이, 지각 실험에는 20대의 한국인 원어민화자들이 참가하였다. 분석 자료는 '-(으)ㄹ 걸'이 추측으로 사용된 두 문장과 후회로 사용된 두 문장이다. 10명의 중국인화자들이 4개의 실험문장을 4회 반복 발화분이 지각실험 자료로 사용되었다. 지각실험참가자들은 실험 자료를 들으면서 문장 경계성조의 억양에만 의존하여 '-(으)ㄹ 걸'의 의미와 정확성 정도를 판별하였다. 25명의 청취실험자들의 지각실험 결과를 바탕으로 정확한 추측, 추측, 모호함, 후회, 정확한 후회로 지각된 문장들의 운율변수, 즉 경계성조, 경계성조의 기울기, 경계음절과 선행음절 간 피치편차, 경계음절의 피치레벨을 측정하였다. 통계분석 결과 상기된 모든 운율변수가 '-(으)ㄹ 걸'의 의미변별과 유의미한 관련이 있음을 알 수 있었다. 즉 운율변수가 커질수록 추측으로 작아질수록 후회문장으로 지각됨을 관찰할 수 있었다. 그러나 로지스틱 회귀분석을 통해 의미변별에 가장 핵심적인 역할을 수행하는 운율변수는 피치편차임을 알 수 있었다. 이러한 결과는 '(으)ㄹ 걸'의 발화에서 마지막 두 음절의 피치 조절로 두 의미를 변별하여 발화할 수 있음을 의미하며 '-(으)ㄹ 걸'의 억양교육에서 보다 객관적이고 유의미한 규범적 운율 요소로 적용될 수 있을 것이다.