• 제목/요약/키워드: Speech Recording

검색결과 97건 처리시간 0.02초

Research on Developing a Conversational AI Callbot Solution for Medical Counselling

  • Won Ro LEE;Jeong Hyon CHOI;Min Soo KANG
    • 한국인공지능학회지
    • /
    • 제11권4호
    • /
    • pp.9-13
    • /
    • 2023
  • In this study, we explored the potential of integrating interactive AI callbot technology into the medical consultation domain as part of a broader service development initiative. Aimed at enhancing patient satisfaction, the AI callbot was designed to efficiently address queries from hospitals' primary users, especially the elderly and those using phone services. By incorporating an AI-driven callbot into the hospital's customer service center, routine tasks such as appointment modifications and cancellations were efficiently managed by the AI Callbot Agent. On the other hand, tasks requiring more detailed attention or specialization were addressed by Human Agents, ensuring a balanced and collaborative approach. The deep learning model for voice recognition for this study was based on the Transformer model and fine-tuned to fit the medical field using a pre-trained model. Existing recording files were converted into learning data to perform SSL(self-supervised learning) Model was implemented. The ANN (Artificial neural network) neural network model was used to analyze voice signals and interpret them as text, and after actual application, the intent was enriched through reinforcement learning to continuously improve accuracy. In the case of TTS(Text To Speech), the Transformer model was applied to Text Analysis, Acoustic model, and Vocoder, and Google's Natural Language API was applied to recognize intent. As the research progresses, there are challenges to solve, such as interconnection issues between various EMR providers, problems with doctor's time slots, problems with two or more hospital appointments, and problems with patient use. However, there are specialized problems that are easy to make reservations. Implementation of the callbot service in hospitals appears to be applicable immediately.

동료 장학 모임에 참여한 과학교사의 경험 사례 연구 (A Case Study on the Experience of Science Teacher Participating in Peer Coaching Meetings)

  • 정행남;최병순
    • 한국과학교육학회지
    • /
    • 제33권1호
    • /
    • pp.63-78
    • /
    • 2013
  • 이 연구의 목적은 수업개선을 위해 동료장학 모임에 참여한 과학교사가 어떤 경험 과정을 거치는지 탐색하고, 각 경험 과정에 어떤 요인이 작용하는가를 살펴보는 것이었다. 이를 위해, 동료장학 모임 과정 녹음과 수업 촬영, 면담으로 자료를 수집하였고, 모든 자료를 전사 후 분석하였다. 연구 결과, K 교사는 동료장학 모임 초반, CoRe를 개발하면서 동료교사들과의 어색함을 깨고 동료들과의 공감대를 형성하였으나, 자신의 수업에 대한 논의에서 동료교사들의 논의를 수용하기 보다는 자기방어적인 태도를 보였다. 그러나 동료장학이 점차 진행되면서 자신의 이전 수업에 대한 반성적 성찰, 다른 참여교사의 수업에 대한 논의, 동료장학이 수업을 평가하는 것이 아니라 수업을 개선하려는 것이라는 인식을 통해서 자신의 수업을 객관적인 시각으로 바라보게 되었고, 이를 통해 동료장학 모임에서 나온 논의를 인정하고 수용하려는 태도를 보였다. K 교사의 반성적 성찰은 수업 개선을 위한 노력의 핵심 요소로 작용하였는데, 그는 동료교사들과 함께 수업분석을 통한 구체적인 대안을 모색하면서, 사소한 언어 습관이나 말의 속도, 발음에서부터 학생과의 상호작용, 수업의 구조화까지 교수 실행에 큰 변화를 보였다. 그러나 교육과정이나 평가에 관한 지식에는 큰 변화를 보이지 않았는데, 이는 그가 일반계 고등학교 교사로서 강한 성적향상 교수 지향을 가지고 있었기 때문으로 판단된다. 이와 같이, 동료장학은 K교사의 교수 방법이나 전략에는 큰 영향을 미쳤으나 그의 견고한 성적향상 교수 지향이 PCK 하위 요소의 균형 있는 발달을 저해함을 알 수 있었다.

Electrognathography를 이용한 측두하악장애환자의 저작양태에 관한 연구 (A Study of the Chewing Patterns in Patients with Temporomandibular Disorders by Electrognathography)

  • Moon-Gyu Kim;Kyung-Soo Han
    • Journal of Oral Medicine and Pain
    • /
    • 제20권2호
    • /
    • pp.291-306
    • /
    • 1995
  • Mandibular movement is composed of border movement and functional movement. Border movement such as maximal mouth opening, hinge opening ad lateral eccentric movement has good reproducibility, but functional movement such as chewing, swallowing and speech has also reproducibility. Especially for chewing movement, individual reproducibility has been confirmed by many studies. Study of chewing pattern is still in controversy. In new approach for raising the diagnostic value, numeric parameters and morphologic characteristics could be used for evaluation of chewing pattern. This study was performed to investigate the differences between chewing pattern in controls and in patients with temporomandibular disorders. Sixty-three patients with temporomandibular disorders participated in this study, and they were divided into unilaterally affected subjects or bilaterally affected subjects. Then unilaterally affected subjects were classified into closed lock group, disk displacement with reduction group, and degenerative joint disease group. For recording of chewing pattern, subjects were asked to chew one piece of presoftened chewing gum on both sides, and the chewing movement was recorded with the Electrognatho- Graphy(Bio-Research Associates Inc., U.S.A.). Tooth contact pattern for occlusal stability (Total left-right statistics )was also recorded with T-Scan(Tekscan Co., U.S.A.). The dta related to chewing pattern and total left-right statistics were statistically analyzed by SAS/stat program. The obtained results were as follows : 1. In patient group, mean value of A-P distance and the ratio of A-P distance to vertical distance were larger than control group, but the value of lateral distance in affected side and the closing velocity in unaffected side were smaller than that of control group, respectively. 2. In case of unilateral affected patients, chewing pattern of other side had tendency to restricted movement and slow velocity in closed lock group or degenerative joint disease group than control group or disk displacement with reduction group. 3. In bilateral degenerative joint disease patients, contralateral side had tendency to large range of motion and slow chewing velocity than preferred chewing side. 4. The patients with restricted mouth opening below than 35mm had higher value of total left-right statistics than patient group mouth opening above 35mm. Also closed lock group had higher total left-right statistics than disk displacement with reduction group, degenerative joint disease group and control group. 5. There was some difference in morphologic characteristics of chewing pattern between in control group and in affected side of unilateral patient group, but no difference between control group and unaffected side of unilateral patient group. 6. There were positive correlations between vertical distance and A-P distance, between vertical distance and chewing velocity, between A-P distance and chewing velocity, and between opening velocity and closing velocity in unilateral affected patients.

  • PDF

스펙트로그램을 이용한 내전형 연축성 발성 장애와 근긴장성 발성 장애의 감별 (Differentiation of Adductor-Type Spasmodic Dysphonia from Muscle Tension Dysphonia Using Spectrogram)

  • 노승호;김소연;조재경;이상혁;진성민
    • 대한후두음성언어의학회지
    • /
    • 제28권2호
    • /
    • pp.100-105
    • /
    • 2017
  • Background and Objectives : Adductor type spasmodic dysphonia (ADSD) is neurogenic disorder and focal laryngeal dystonia, while muscle tension dysphonia (MTD) is caused by functional voice disorder. Both ADSD and MTD may be associated with excessive supraglottic contraction and compensation, resulting in a strained voice quality with spastic voice breaks. The aim of this study was to determine the utility of spectrogram analysis in the differentiation of ADSD from MTD. Materials and Methods : From 2015 through 2017, 17 patients of ADSD and 20 of MTD, underwent acoustic recording and phonatory function studies, were enrolled. Jitter (frequency perturbation), Shimmer (amplitude perturbation) were obtained using MDVP (Multi-dimensional Voice Program) and GRBAS scale was used for perceptual evaluation. The two speech therapist evaluated a wide band (11,250 Hz) spectrogram by blind test using 4 scales (0-3 point) for four spectral findings, abrupt voice breaks, irregular wide spaced vertical striations, well defined formants and high frequency spectral noise. Results : Jitter, Shimmer and GRBAS were not found different between two groups with no significant correlation (p>0.05). Abrupt voice breaks and irregular wide spaced vertical striations of ADSD were significantly higher than those of MTD with strong correlation (p<0.01). High frequency spectral noise of MTD were higher than those of ADSD with strong correlation (p<0.01). Well defined formants were not found different between two groups. Conclusion : The wide band spectrograms provided visual perceptual information can differentiate ADSD from MTD. Spectrogram analysis is a useful diagnostic tool for differentiating ADSD from MTD where perceptual analysis and clinical evaluation alone are insufficient.

  • PDF

사상체질음성분석기(四象體質音聲分析機)(PSSC)를 통한 한국인 성인남성(成人男性)의 체질별(體質別) 음향특성연구(音響特性硏究) - 단문(短文)을 중심으로 - (A Study on the Characteristics of the Korean Adult Male Sound According to Sasang Constitution Using PSCC with a Sentence)

  • 최재완;송학수;한동윤;조성언;왕향란;전종원;김달래;유준상
    • 사상체질의학회지
    • /
    • 제18권3호
    • /
    • pp.64-74
    • /
    • 2006
  • 1. Objectives and Methods A Study on the Characteristics of the Korean Adult Male Sound according to Sasang Constitution using PSSC with a Sentence. Sasang Constitutional Medicine(SCM) is the one of the traditional Korean Medicine. It classifies people into four categories like Taeyangin, Soyangin, Taeumin and Soeumin. The rule to classify is Appearance and Body Shape, Facial Appearance and Speech, Character and Talents and Diseases and Medications. This study was done to investigate the relationships between Voice and Sound parameters using PSSC(Phonetic System of Sasang Constitution) in a sentence. Experimental Participants were 195 Korean adult males including 1 Taeyangin, 37 Soyangin, 105 Taeumin and 52 Soeumin. Sasang Constitutional specialist used PSSC and Korean Medical Diagnosis to classify participants into four constitution. 2. Results In Pitch segment, Soyangin's Center freq.(4) was significantly high compared with Taeyangin and Taeumin groups. Soyangin's and Soeumin's Center freq.(6) was significantly high compared with Taeyangin and Taeumin groups. In APQ segment and Octave segment, there were no significant differences among four groups. In Shimmer segment, Taeumin's F Shimmer(1) and F Shimmer(2) were significantly high compared with Taeyangin and Soyangin groups. In Energy segment, Taeyangin's 2k-4k total sum, 2k-4k dev., C dev., C# dev. and D S.D. were significantly high compared with other groups. In Recording time segment, there was no significant difference among four groups. More Taeyangin cases and the other parameters are needed to determine constitution using PSSC and to make PSSC effective. 3. Conclusions From above result, there is the possibility of efficiency standard guide for constitution diagnosis by analyzation og voice.

  • PDF

기록학적 관점에서의 구술의 의미와 역할에 관한 연구 (A Study on the Meanings and Roles of Oral History from a Perspective of Archival Science)

  • 김명훈
    • 기록학연구
    • /
    • 제24호
    • /
    • pp.73-112
    • /
    • 2010
  • 최근 녹음 및 녹화기술의 진전은 문자화된 기록만이 아닌 음성이나 영상 역시 행위의 증거 및 기억의 보존 도구로 활용할 수 있게 해주었다. 이러한 경향에 보조를 맞추어 기록학 영역에서는 기록으로서의 구술이 지닌 중요성을 인식하고 구술채록 사업을 활발히 수행하고 있다. 하지만 기록보존기관에서의 구술채록은 아직 정체성 정립이 요원한 실정이다. 기록학은 현재의 삶의 모습을 기록을 통해 미래에 전승하는 과업을 모토로 한다는 점에서, 구술채록 역시 여타 학문분야에서 사료의 생성 및 연구 목적을 위해 수행되는 구술채록과는 다른 특성을 도출할 필요가 있다. 더불어 기록학은 수많은 기록 중 맥락을 지닌 행위의 증거를 평가하여 현재의 사회상 및 집단 기억을 형성시키는 분야라는 점에서, 구술채록에 앞서 기록학 고유의 구술 정체성 정립이 선행되어야 한다. 이에 본고에서는 기록학적 관점에서의 구술이 지닌 의미와 역할을 분석하고자 한다. 기록학에서는 그동안 실증주의의 뿌리 깊은 영향 속에 문자화된 기록 위주로 학문적 이론 및 방법론을 개발시켜왔다. 하지만 '말'을 통한 기록의 생성 및 보존이 가능해진 지금, 기억 및 사회상을 보존해 전승하는 또 하나의 방식으로 구술에 주목해야 할 필요가 있다. 이에 본고에서는 기록보존기관에서의 구술채록 정체성을 정립시키기 위한 일환으로, 기록학적 관점에서의 구술이 지닌 의미 및 역할을 분석할 것이다.

소설과 영화 『희망 L'Espoir』의 서사담론 (The Narrative Discourse of the Novel and the Film L'Espoir)

  • 오세정
    • 비교문화연구
    • /
    • 제48권
    • /
    • pp.289-323
    • /
    • 2017
  • 앙드레 말로의 소설 "희망 L'Espoir"은 스페인 내란전쟁에 직접 참전한 경험을 바탕으로 이 사건의 전말을 논픽션으로 제시하는 르포타주문학의 특성을 보유하며, 영화 "희망 L'Espoir"은 이 소설을 각색하여 르포타주문학에 상응하는 세미다큐멘터리로 제작된다. 세미다큐멘터리 영화는 사회적 현상이나 사건에 대한 리얼리티를 추구하는 영화장르이다. 이처럼 소설과 영화 "희망 L'Espoir"은 각각 서로 다른 장르임에도 불구하고 창작활동이 밀접한 관련성을 맺고 있으며 서사적 연계성도 상당하다. 그러므로 소설과 영화 "희망 L'Espoir"에 대하여 주네트의 서사이론에 의거한 서사담론의 숙고는 연구의 당위성을 보유한다. 모든 종류의 이야기는 서사물 속에서 스토리시간과 담화시간이 서로 다른 이중적 시간을 보유한다. 왜냐하면 서사물 속에서 하나의 사건은 다른 것들보다 먼저 제시되거나 나중에 나타낼 수도 있고, 사건을 길게 혹은 짧게 이야기 할 수 있으며, 사건을 한 번 또는 여러 번 되풀이해 환기시킬 수 있기 때문이다. 이처럼 사건이 발생하는 시간과 이 사건을 기록하는 시간이 서로 다른 두 개의 시간성을 분석한 것이 순서, 지속, 빈도이다. 이러한 순서, 지속, 빈도의 시간성은 이야기의 흐름을 조절하는 극적 템포를 의미하기 때문에 편집적인 개념으로써 소설과 영화 "희망 L'Espoir"에서 나타나고 있다. 그것은 이야기를 배열하고 요약하며, 삭제하는 시간의 대응으로 호기심과 충격을 야기하는 미학적 담론이다. 또한 화법과 서술태는 텍스트에서 화자 또는 서술자의 위치와 시점의 문제를 명확하게 구분하기 위해 주네트가 제기한 개념이다. '누가 이야기하느냐'와 '누가 보느냐'하는 문제를 구분하는 것은 텍스트의 서술자와 텍스트의 시점이 동일하지 않기 때문이다. '누가 이야기하느냐'의 문제는 누가 이야기의 서술을 담당하고 있는가를 말한다. 그러나 '누가 보느냐'하는 문제는 이야기에서 누구의 시각에 의해 서술되고 있는 것인가의 문제와 관련된다. 소설 "희망 L'Espoir"에서는 제로초점과 내적 초점화를 통한 시점의 변화가 등장하며, 이것은 영화 "희망 L'Espoir"에서 다중촬영이 연계되고 있다. 또한 이야기의 메타적 서술로서 이야기의 액자구조가 소설과 영화 "희망 L'Espoir"에서 모두 서술태의 형태로 동일하게 재현된다. 그러므로 소설과 영화 "희망 L'Espoir"에서 서사담론의 의미는 텍스트와 화자, 수용자 사이에 이야기를 소통하는 양상이다.