• 제목/요약/키워드: Sentence Frequency

검색결과 140건 처리시간 0.027초

질의응답 시스템에서 처음 보는 단어의 역문헌빈도 기반 단어 임베딩 기법 (Inverse Document Frequency-Based Word Embedding of Unseen Words for Question Answering Systems)

  • 이우인;송광호;심규석
    • 정보과학회 논문지
    • /
    • 제43권8호
    • /
    • pp.902-909
    • /
    • 2016
  • 질의응답 시스템은 사용자의 질문에 대한 답을 찾아주는 시스템으로, 기존의 검색엔진이 사용자의 질의에 대해 관련된 문서의 링크만을 찾아주는 반면 질문에 대한 최종적인 답을 찾아준다는 차이점이 있다. 특정 분야에 국한되지 않고 다양한 질문을 처리해주는 오픈 도메인 질의응답 시스템에 필요한 연구들이 최근 자연어 처리, 인공지능, 데이터 마이닝 등 학계의 다양한 분야들에서 뜨거운 관심을 받고 있다. 하지만 관련 연구에서는 학습 데이터에는 없었던 단어들이 질문에 대한 정확한 답과 유사한 오답을 구별해내는데 결정적인 역할을 할 수 있음에도, 이러한 처음 보는 단어들을 모두 단일 토큰으로 치환해버리는 문제가 있다. 본 논문에서는 문맥 정보를 통해 이러한 모르는 단어에 대한 벡터를 계산하는 방법을 제안한다. 그리고 역문헌빈도 가중치를 활용하여 문맥정보를 더 효율적으로 처리하는 모델을 제안한다. 또한 풍부한 실험을 통해 질의응답 시스템의 모델 학습 속도 및 정확성이 기존 연구에 비해 향상됨을 확인하였다.

통 문장 암기와 짝 활동을 통한 한국어말하기 향상 융합전략 (A Convergence Strategy of Improving Korean Speaking Skills through Memorizing Whole Sentence and Pair Works)

  • 류자미;오성록
    • 한국융합학회논문지
    • /
    • 제7권2호
    • /
    • pp.77-84
    • /
    • 2016
  • 이 논문에서는 외국학생들이 한국어를 배울 때 통 문장암기방법과 짝 활동이 말하기능력향상에 효과가 있는지를 알아보고자 했다. 먼저 통 문장암기방법에 대한 효과를 다루고 있는 논문의 선행연구를 살펴보았고, 이 연구에서 활용한 학습자의 활동은 주로 외국학생끼리 짝 활동이므로 이에 대한 방법을 설명하였다. 이 활동은 수업시간에 학습자의 한국어 사용빈도를 높이고자 시도했고, 동시에 학습자간에 지속적인 학습을 서로 돕도록 의도했다. 이 융합교수접근법에 힘입어 수업시간에 학습자들의 한국어 활용빈도가 크게 향상되었다. 이는 각 짝을 중국학생과 베트남학생으로 구성하였기 때문에 학습자들은 한국어를 사용할 수밖에 없었기 때문이었다. 이 활동을 통해 학습자들은 서로 격려하고 도움을 줌으로써 외국어학습을 지속적으로 하게하는 동기부여나 힘을 얻을 수 있었다고 설문과 인터뷰에서 밝혔다. 특히 설문조사에서 학생들은 이 융합교수법에 대해 참여 학습자 거의 모두가 만족했음을 보여주었다.

동일 후적자가 산출하는 기관식도 발성($PROVOX^{(R)}$ 발성)과 식도 발성에 대한 음향학적 및 공기역학적 특성 비교 (The Comparison of the Acoustic and Aerodynamic Characteristics of $PROVOX^{(R)}$ Voice and Esophageal Voice Produced by the Same Laryngectomee)

  • 표화영;최홍식;임성은;최성희
    • 음성과학
    • /
    • 제5권1호
    • /
    • pp.121-139
    • /
    • 1999
  • Our experimental subject was a laryngectomee who had undergone total laryngectomy with $PROVOX^{(R)}$ insertion, and learned esophageal speech after the surgery, so he could produce both $PROVOX^{(R)}$ voice and esophageal voice. With this subject's production of $PROVOX^{(R)}$ and esophageal voice, we are to compare the acoustic and aerodynamic characteristics of the two voices, under the same physical conditions of the same person. As a result, the fundamental frequency of esophageal voice was 137.2 Hz, and that of $PROVOX^{(R)}$ was 97.5 Hz. $PROVOX^{(R)}$ voice showed lower jitter, shimmer and NHR than esophageal voice, which means that $PROVOX^{(R)}$ voice showed better voice quality than esophageal voice. In spectrographic analysis, the formation of formants and pseudoformants were more distinct in esophageal voice and several temporal aspects of acoutic features such as VOT and closure duration were more similar with normal voice in $PROVOX^{(R)}$ voice. During the sentence utterance, esophageal voice showed longer pause or silence duration than $PROVOX^{(R)}$ voice. Maximum phonation time and mean flow rate of $PROVOX^{(R)}$ voice were much longer and larger than esophageal voice, but mean and range of sound pressure level, subglottic pressure and voice efficiency were similar in the two voices. Glottal resistance of esophageal voice was much larger than $PROVOX^{(R)}$ voice which showed still larger glottal resistance than normal voice.

  • PDF

WV-BTM: SNS 단문의 주제 분석을 위한 토픽 모델 정확도 개선 기법 (WV-BTM: A Technique on Improving Accuracy of Topic Model for Short Texts in SNS)

  • 송애린;박영호
    • 디지털콘텐츠학회 논문지
    • /
    • 제19권1호
    • /
    • pp.51-58
    • /
    • 2018
  • SNS의 사용자와 데이터량이 폭발적으로 증가함에 따라, SNS 빅 데이터를 기반으로 한 연구들이 활발히 진행되고 있다. 특히 소셜 마이닝 분야에서는 비 분류된 대용량 SNS 텍스트 데이터로부터 각 텍스트 별 유사성을 파악하고, 그로부터 트렌드를 추출하기 위해 대표적인 토픽 모델 기법인 LDA를 사용한다. 그러나 LDA는 단문 데이터에 대하여 비 빈발 단어 출현으로 인한 의미 희박성(semantic sparsity)으로 인해 양질의 주제 추론이 어렵다는 한계를 가진다. BTM 연구는 이와 같은 LDA의 한계점을 두 단어의 조합을 통해 개선하였으나, BTM 또한 조합된 단어 중 높은 빈도수의 단어에 더 큰 영향을 받아 각 주제와의 연관성을 고려한 가중치 계산이 불가능하다는 한계점을 지닌다. 본 논문은 단어 간의 의미적 연관성을 반영함으로써 기존 연구 BTM의 정확도를 개선하는 방안을 모색한다.

한국어 병렬문의 통사, 의미, 문맥 분석을 위한 결합범주문법 (Combinatory Categorial Grammar for the Syntactic, Semantic, and Discourse Analyses of Coordinate Constructions in Korean)

  • 조형준;박종철
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제27권4호
    • /
    • pp.448-462
    • /
    • 2000
  • 자연언어처리에 있어서 병렬구문은 분석의 복잡성, 단어의 애매성, 서술어 생략 등에 따른 처리의 어려움을 내포하고 있다. 본 논문에서는 한국어에서 발생하는 병렬문의 통사적 특징을 능력문법 (competence grammar)의 입장에서 접근하고 분석된 결과를 기반으로 하여 한국어 병렬문 해석을 위한 결합범주문법 (Combinatory Categorial Grammar)을 제안한다. 제안된 결합범주문법을 사용해서 병렬문에 대한 각각 다른 수준의 통사적, 의미적, 문맥적 정보들이 사전에 어휘적으로 통합될 수 있고 통합된 정보를 이용하여 통사적, 의미적, 문맥적 분석들이 각각 다른 수준의 처리를 거치지 않고 동시에 점진적으로 유도될 수 있음을 보인다. 유도된 정보들을 통해 일반적으로 한국어 병렬문의 주된 기능이라고 생각되는 두 문장이 가지는 정보를 대조, 비교하는 기능이 표현될 수 있음을 보인다. 말뭉치를 분석하여 병렬문이 한국어 처리에서 차지하는 비중과 제시한 문법으로 처리할 수 없는 문형들에 대한 논의를 제공한다.

  • PDF

Effects of Injection Laryngoplasty with Hyaluronic Acid in Patients with Vocal Fold Paralysis

  • Kim, Geun-Hyo;Lee, Jae-Seok;Lee, Chang-Yoon;Lee, Yeon-Woo;Bae, In-Ho;Park, Hee-June;Lee, Byung-Joo;Kwon, Soon-Bok
    • Osong Public Health and Research Perspectives
    • /
    • 제9권6호
    • /
    • pp.354-361
    • /
    • 2018
  • Objectives: The purpose of this study was to explore the effects of injection laryngoplasty (IL) with hyaluronic acid in patients with vocal fold paralysis (VFP). Methods: A total of 50 patients with VFP participated in this study. Pre- and post-IL assessments were performed, which included analyzing the sustained vowel /a/ phonation, and the patient reading 1 Korean sentence from the "Walk" passage that comprised 25 syllables in 10 words. To investigate the effect of IL on vocal fold function, acoustic analysis (acoustic voice quality index, cepstral peak prominence, maximum phonation time, speaking fundamental frequency) was conducted and auditory-perceptual (grade and overall severity), visual judgment (gap), and self-questionnaire (voice handicap index-10) assessments were performed. Results: The patients with VFP showed statistically significant differences between pre-and post-IL assessments for acoustic and auditory-perception, visual judgment, and self-questionnaire assessments. Conclusion: The patients with VFP showed positive change in vocal fold function between pre- and post-IL measurements. The findings showed that IL with hyaluronic acid is an effective method to improve vocal fold function in patients with VFP.

의미연결망 분석을 활용한 영화 리뷰 시각화 (A Visualization of Movie Reviews based on a Semantic Network Analysis)

  • 김슬기;김장현
    • 한국정보통신학회논문지
    • /
    • 제23권1호
    • /
    • pp.1-6
    • /
    • 2019
  • 본 연구는 <네이버 영화> 페이지의 리뷰 데이터를 수집하여, 출현 빈도가 높은 단어를 중심으로 영화 관람객의 반응을 시각화하는 작업을 수행하였다. 이를 위해 총 6편의 영화를 선정하여 데이터 수집 및 정제과정을 거쳤으며, 의미연결망 분석(Semantic network analysis)을 활용하여 단어 간 관계성을 파악하고자 하였다. 데이터 시각화 작업에는 UCINET과 함께 패키지화된 NetDraw가 사용되었다. 본 연구의 시사점은 문장으로 작성된 영화 관람객의 리뷰를 키워드 중심으로 시각화하여, 소비자들의 반응을 한 눈에 확인하는 리뷰 인터페이스 구현이 가능한지 탐색하였다는 점이다. 본 연구를 통해 영화 리뷰를 구성하는 키워드를 시각화하고, 리뷰 내용에서 영화별 특성의 차이를 확인하였다는 점에서 본 연구가 의미를 가진다고 하겠다. 후속 연구는 보다 많은 영화의 리뷰를 활용할 필요성이 제기되며, 각 영화별 리뷰의 수도 비슷한 양으로 맞추어 연구에 활용해야 할 것이다.

네트워크 기반 대한민국 역대 대통령 취임사 분석 (Analysis of Inauguration Address of Previous Korean Presidents Based on Network)

  • 김학용
    • 한국콘텐츠학회논문지
    • /
    • 제21권11호
    • /
    • pp.11-19
    • /
    • 2021
  • 대통령 취임사는 국가 비전을 제시하고 대통령의 정치철학, 정책기조와 방향을 국민들에게 전달할 수 있는 매우 유용한 수단이다. 이런 이유로 취임사를 분석하는 것은 해당 대통령을 이해하고 그 시대를 파악하는데 도움을 줄 것이다. 대통령 취임사는 다양한 학문분야에서 분석할 수 있지만, 본 연구에서는 취임사를 하나의 콘텐츠로 보고 네트워크를 기반으로 분석하고자 하였다. 취임사에 등장하는 단어의 빈도수를 중심으로 분석하는 단어구름이 널리 사용되지만 네트워크를 기반으로 분석하면 문장 속에 들어있는 맥락을 도출할 수 있기 때문에 유용한 방법이 될 것이다. 대한민국 역대 대통령 취임사 전체 네트워크를 구축하고 구조인자를 제시하였다. 네트워크로부터 도출한 핵심단어 및 단어구름의 핵심단어를 비교분석하여 대통령의 정책 방향 등을 도출하였다. 대통령 각각의 취임사 네트워크를 구축하여 핵심단어 및 네트워크의 구조인자인 근접 중심성을 비교 분석하여 취임사의 특성을 제시하였다. 네트워크 기반 역대 대통령 취임사 분석은 궁극적으로 대통령의 이해와 평가를 위한 자료로 활용할 수 있을 것으로 기대한다.

키워드 분석을 활용한 한·중 모바일 결제 서비스에 대한 소비자 반응 탐색적 분석 -카카오페이와 알리페이를 중심으로- (Exploratory Analysis of Consumer Responses to Korea-China Mobile Payment Service using Keyword Analysis -Focus on Kakao Pay and Alipay-)

  • 가정;윤동화;안진현
    • 한국산학기술학회논문지
    • /
    • 제22권6호
    • /
    • pp.514-523
    • /
    • 2021
  • 최근 모바일 간편 결제 서비스의 확산은 사람들의 삶에 점점 더 많은 영향을 미치고 있다. 중국과 한국의 모바일 간편 결제 서비스에 대한 연구 증가를 통해 향후 모바일 간편 결제 서비스의 지속적인 발전이 매우 중요함을 알 수 있다. 본 논문은 소셜미디어 상에서 소비자의 카카오페이와 알리페이에 대한 반응의 차이를 알아보기 위해 카카오페이와 알리페이가 언급된 네이버 블로그 글을 수집하고 텍스트마이닝 기법을 활용해 키워드 분석을 했다. 품사별 키워드 빈도수 분석을 하였고 한 문장에 동시에 언급되는 공기어 빈도수 분석을 했다. 특히, 카카오페이와 알리페이를 언급한 글에서 공통적으로 언급된 단어를 추출하고 그에 대해 같이 언급된 단어들을 분석함으로써 같은 주제에 대해 어떤 다른 반응을 보이는지를 살펴봤다. 분석 결과 카카오페이의 신뢰성에 대한 소비자들의 우려가 존재했고 알리페이의 혜택에 대한 소비자들의 반응이 부정적이었다. 이러한 분석 결과를 토대로, 모바일 결제 서비스가 경쟁력을 갖추기 위해서는 다양한 부가 서비스를 추가하거나 보안 문제를 해결하는 노력을 할 필요가 있다는 점을 도출할 수 있다.

어선용 무선설비의 통합운용을 위한 LAN 기반 MFD 인터페이스 (LAN Based MFD Interface for Integrated Operation of Radio Facilities using Fishery Vessel)

  • 주인웅;강인숙;김정연;이성렬;최조천
    • 한국항행학회논문지
    • /
    • 제26권6호
    • /
    • pp.496-503
    • /
    • 2022
  • 어업인의 감소와 단독조업 어선이 증가되는 현실에서, 어선의 해상안전을 위한 항해 및 무선설비의 의무장비는 계속 증가되어 왔다. 따라서 협소한 조타실에는 항해, 통신, 어로 등의 많은 장비가 설치되므로 혼잡한 상태이며, 다수의 모니터가 전면에 배치되므로 해상견시 능력을 저하시키는 요인으로 된다. 문제의 해결책으로 디지털선택호출-초단파대무선설비(VHF-DSC), 선박자동 식별장치(AIS), 어선위치발신장치(V-Pass) 등의 무선설비를 LAN 기반으로 하나의 MFD(multi function display)에 통합하여 운용하는 인터페이스를 구현하였다. 또한, MFD와 무선설비들 간의 연동으로 데이터의 교환을 위하여 IEC61162-450의 UDP 패킷과 IEC61162 센텐스를 적용하였고, 장비와 기능별로 필요한 메시지를 추가로 정의하였다. 통합된 MFD 모니터는 메뉴방식으로 쉽게 조작되며, 해상안전 관련 조난 및 긴급통신 기능과 장비별 메시지전송 상태의 확인으로 인터페이스 성능을 평가하였다.