통합 검색 | Korea Science

Lexicon transducer를 적용한 conformer 기반 한국어 end-to-end 음성인식 (Conformer with lexicon transducer for Korean end-to-end speech recognition)

손현수;박호성;김규진;조은수;김지환
- 한국음향학회지
- /
- 제40권5호
- /
- pp.530-536
- /
- 2021
최근 들어 딥러닝의 발달로 인해 Hidden Markov Model(HMM)을 사용하지 않고 음성 신화와 단어를 직접 매핑하여 학습하는 end-to-end 음성인식 방법이 각광을 받고 있으며 그 중에서도 conformer가 가장 좋은 성능을 보이고 있다. 하지만 end-to-end 음성인식 방법은 현재 시점에서 어떤 자소 또는 단어가 나타날지에 대한 확률에 대해서만 초점을 두고 있다. 그 이후의 디코딩 과정은 현재 시점에서 가장 높은 확률을 가지는 자소를 출력하거나 빔 탐색을 사용하며 이러한 방식은 모델이 출력하는 확률 분포에 따라 최종 결과에 큰 영향을 받게 된다. 또한 end-to-end 음성인식방식은 전통적인 음성인식 방법과 비교 했을 때 구조적인 문제로 인해 외부 발음열 정보와 언어 모델의 정보를 사용하지 못한다. 따라서 학습 자료에 없는 발음열 변환 규칙에 대한 대응이 쉽지 않다. 따라서 본 논문에서는 발음열 정보를 담고 있는 Lexicon transducer(L transducer)를 이용한 conformer의 디코딩 방법을 제안한다. 한국어 데이터 셋 270 h에 대해 자소 기반 conformer의 빔 탐색 결과와 음소 기반 conformer에 L transducer를 적용한 결과를 비교 평가하였다. 학습자료에 등장하지 않는 단어가 포함된 테스트 셋에 대해 자소 기반 conformer는 3.8 %의 음절 오류율을 보였으며 음소 기반 conformer는 3.4 %의 음절 오류율을 보였다.
https://doi.org/10.7776/ASK.2021.40.5.530 인용 PDF KSCI

평생교육의 비교교육학적 접근: 가능성과 한계 (A Comparative Pedagogical Approach to Lifelong Education: Possibilities and Limitations)

최돈민
- 비교교육연구
- /
- 제28권3호
- /
- pp.291-307
- /
- 2018
평생학습의 가치가 부각 되면서 각국은 평생학습의 시스템을 구축하는 데 노력을 경주하고 있다. 이러한 경향에 따라 논문에서는 평생학습 참여율, 학습성과, 학습지원 인프라, 학습비 지원, 평생학습 결과 인정 등을 국제 비교하고자 한다. 비교교육학적 접근을 위하여 Bray와 Thomas(1995)의 비교교육학적 프레임인 지리적/지역 수준, 비지정학적 인구 통계학 집단, 사회와 교육측면의 큐브를 활용하였다. 우리나라의 평생학습 참여율은 2017년 34.4%로 OECD국가 평균 46%보다 낮다. 성인의 역량을 측정하는 PIAAC 조사에서는 언어능력, 수리력, 컴퓨터 기반 문제해결력 3영역 모두 OECD국가 평균보다 낮았다. 사전학습 인증에서 EU국가는 EQF를 개발하여 모든 비형식, 무형식 학습의 결과에 가치를 부여하고 있다, 반면 한국은 학점은행제에 의하여 자격을 학점은행제 학점으로 인정하고 있다. 평생학습의 국제비교는 한 국가의 평생학습의 실태를 진단하고 향후 평생학습 정책을 수립하는데 중요한 자료로 활용될 수 있다, 유럽의 시민사회 형성과 맥락을 같이 하였다. 따라서 평생학습의 비교교육학적 접근은 근대국가의 형성 과정과 특성 등 역사적 맥락과 사회경제적 성격, 인구 동태 등에 따라 다르다는 것을 견지할 필요가 있다.
https://doi.org/10.20306/kces.2018.28.3.291 인용

The Application of Fuzzy Logic to Assess the Performance of Participants and Components of Building Information Modeling

Wang, Bohan;Yang, Jin;Tan, Adrian;Tan, Fabian Hadipriono;Parke, Michael
- Journal of Construction Engineering and Project Management
- /
- 제8권4호
- /
- pp.1-24
- /
- 2018
In the last decade, the use of Building Information Modeling (BIM) as a new technology has been applied with traditional Computer-aided design implementations in an increasing number of architecture, engineering, and construction projects and applications. Its employment alongside construction management, can be a valuable tool in helping move these activities and projects forward in a more efficient and time-effective manner. The traditional stakeholders, i.e., Owner, A/E and the Contractor are involved in this BIM system that is used in almost every activity of construction projects, such as design, cost estimate and scheduling. This article extracts major features of the application of BIM from perspective of participating BIM components, along with the different phrases, and applies to them a logistic analysis using a fuzzy performance tree, quantifying these phrases to judge the effectiveness of the BIM techniques employed. That is to say, these fuzzy performance trees with fuzzy logic concepts can properly translate the linguistic rating into numeric expressions, and are thus employed in evaluating the influence of BIM applications as a mathematical process. The rotational fuzzy models are used to represent the membership functions of the performance values and their corresponding weights. Illustrations of the use of this fuzzy BIM performance tree are presented in the study for the uninitiated users. The results of these processes are an evaluation of BIM project performance as highly positive. The quantification of the performance ratings for the individual factors is a significant contributor to this assessment, capable of parsing vernacular language into numerical data for a more accurate and precise use in performance analysis. It is hoped that fuzzy performance trees and fuzzy set analysis can be used as a tool for the quality and risk analysis for other construction techniques in the future. Baldwin's rotational models are used to represent the membership functions of the fuzzy sets. Three scenarios are presented using fuzzy MEAN, AND and OR gates from the lowest to intermediate levels of the tree, and fuzzy SUM gate to relate the intermediate level to the top component of the tree, i.e., BIM application final performance. The use of fuzzy MEAN for lower levels and fuzzy SUM gates to reach the top level suggests the most realistic and accurate results. The methodology (fuzzy performance tree) described in this paper is appropriate to implement in today's construction industry when limited objective data is presented and it is heavily relied on experts' subjective judgment.
https://doi.org/10.6106/JCEPM.2018.8.4.001 인용 PDF HTML

AI기반 콜센터 실시간 상담 도우미 시스템 개발 - N은행 콜센터 사례를 중심으로 (Development of AI-based Real Time Agent Advisor System on Call Center - Focused on N Bank Call Center)

류기동;박종필;김영민;이동훈;김우제
- 한국산학기술학회논문지
- /
- 제20권2호
- /
- pp.750-762
- /
- 2019
기업의 대고객 접점으로써 콜센터의 중요성은 커지고 있다. 하지만, 콜센터는 상담사의 지식 부족과 업무 부적응에 따른 잦은 이직으로 인해 상담사 운영이 어렵고, 이로 인한 고객 서비스 품질 저하의 문제를 안고 있다. 이에 본 연구에서는 상담사에게 업무 지식에 대한 부하를 줄이고 서비스 품질을 향상 시키기 위해 음성 인식 기술과 자연어 처리 및 질의응답을 지원하는 AI 기술과 PBX, CTI 등의 콜센터 정보시스템을 결합하여 실시간으로 상담사에게 고객의 질의 내용에 대한 답변을 제공해주는 "실시간 상담 도우미" 시스템 개발 방안에 대해 N은행 콜센터 사례를 통해 연구하였다. 사례연구 결과, 실시간 통화 분석을 위한 음성인식 시스템의 구성방안과, 질의응답 시스템의 자연어처리 성능 향상을 위한 말뭉치 구축 방안을 확인 할 수 있었으며, 특히 개체명 인식기의 경우 도메인에 맞는 말뭉치 학습 후 정확도가 31% 향상됨을 확인하였다. 또한, 상담 도우미 시스템을 적용한 후 상담 도우미의 답변에 대한 상담사들의 긍정적 피드백 비율이 93.1%로써 충분히 상담사 업무에 도움을 주고 있음을 확인하였다.
https://doi.org/10.5762/KAIS.2019.20.2.750 인용 PDF KSCI HTML

음성특징의 거리 개념에 기반한 한국어 모음 음성의 시각화 (Speech Visualization of Korean Vowels Based on the Distances Among Acoustic Features)

복거철
- 한국정보전자통신기술학회논문지
- /
- 제12권5호
- /
- pp.512-520
- /
- 2019
음성을 시각적으로 표현하는 것은 외국어를 습득하는 과정의 학습자나 음성을 직접 들을 수 없는 청각장애자에게 매우 유용하며 기존에 다수의 연구가 이루어졌다. 그러나 기존의 연구들은 발음의 특징을 단지 컬러로 표현한다든가 입모양을 3차원 그래픽으로 표현하거나 입과 구강의 변화하는 형태를 애니메이션으로 보여 주는 방식에 머물러 있다. 따라서 이런 방식을 사용하는 학습자들은 자신의 발음이 표준 발음과 얼마나 멀리 떨어져 있는지 알 수가 없고 더 나아가서 학습 중에 스스로 교정을 해 나가는 시스템을 개발하기가 기술적으로 어려운 단점이 있다. 이를 극복하기 위해 본 논문에서는 음성 간의 상대적 거리를 토대로 음성을 시각화하는 모델을 제시하고, 이를 한국어 모음에 적용하여 모음의 음성적 특징을 이용한 시각화의 구체적인 구현 방법을 제시한다. 음성데이터에서 F1, F2, F3의 세 개의 포먼트를 구하고 이들 특징벡터를 코호넨 자기조직화맵 알고리즘으로 2차원 화면에 사상하여 각 음성을 화면 위의 각 점에 대응하여 표현하였다. 제안하는 시스템의 실제적인 구현은 인터넷에 공개된 음성처리 공개소프트웨어를 사용하고 한국인 교사의 표준 발음과 한국어를 배우고 있는 외국인 유학생의 음성을 이용하여 음성특징의 상호간 거리를 구하였으며, 사용자 인터페이스는 자바스크립트를 이용하여 구현하였다.
https://doi.org/10.17661/jkiiect.2019.12.5.512 인용 PDF KSCI

온라인 방송의 뉴스기사 유형에 대한 분석 -네이버 뉴스스탠드의 방송사 홈페이지를 중심으로- (Analysis of the Types of News Stories on the Online Broadcast -Focusing upon the Broadcasting Websites of NAVER Newsstand-)

박광순
- 디지털융복합연구
- /
- 제19권3호
- /
- pp.177-185
- /
- 2021
본 연구는 네이버 뉴스스탠드의 9개 방송사 홈페이지 뉴스기사에 대한 분석을 통해 온라인 방송의 뉴스기사 유형은 어떻게 구성되고 있는가를 파악하기 위해 실시되었다. 분석을 위해 1개 방송 당 30일 분량으로 9개 방송을 대상으로 총 270일간의 샘플을 선정하였다. 분석방법은 방송사 간 차이검정을 위해 일원분산분석(One-way ANOVA) 기법을 이용하였다. 분석은 언어구성에 의한 뉴스기사 유형, 기사내용에 따른 장르 유형 등을 중심으로 이루어졌다. 분석결과 오프라인 방송에서는 모든 프로그램이 비디오기사 유형으로 제작·송신되고 있는 것에 반해 온라인 방송에서는 약 50% 정도가 사진기사와 텍스트기사로 구성되었다. 온라인 신문에서 비디오기사나 컴퓨터 그래픽을 이용한 동영상 중심의 새로운 기사 유형을 제작·공급하고 있으나 온라인 방송에서는 신문의 주요 기사유형인 사진과 텍스트기사를 적극적으로 활용하고 있었다. 이 같은 결과를 통해 온라인 미디어 환경에서의 미디어 간 경계가 더욱 불분명해지고 있으며, 방송기사 유형의 올드화 현상을 파악할 수 있었다.
https://doi.org/10.14400/JDC.2021.19.3.177 인용 PDF KSCI

에지 컴퓨팅 환경에서의 상황인지 서비스를 위한 팻 클라이언트 기반 비정형 데이터 추상화 방법 (Fat Client-Based Abstraction Model of Unstructured Data for Context-Aware Service in Edge Computing Environment)

김도형;문종혁;박유상;최종선;최재영
- 정보처리학회논문지:컴퓨터 및 통신 시스템
- /
- 제10권3호
- /
- pp.59-70
- /
- 2021
최근 사물인터넷의 발전으로 사용자 주변 상황을 인지하여 맞춤형 서비스를 제공하는 상황인지 시스템에 대한 관심이 증가되고 있다. 기존의 상황인지 시스템은 사용자 주위에서 생성되는 데이터를 분석하여 사용자 주변 상황을 표현하는 상황 정보로 추상화하는 기술이 사용되었다. 하지만 증가하는 사용자의 서비스 요구 사항에 따라 다양한 종류의 비정형 데이터의 사용이 증가하고, 사용자 주변에서 수집되는 데이터의 양이 많아지면서 비정형 데이터의 처리와 상황인지 서비스의 제공에 어려움이 있다. 이러한 사항은 딥러닝 응용에서 비정형 구조의 입력 데이터가 많이 사용되는 데서 찾아볼 수 있다. 기존 연구에서는 에지 컴퓨팅 환경에서 다양한 딥러닝 모델을 활용해 비정형 데이터를 상황 정보로 추상화하는 연구가 진행되었으나, 수집-전처리-분석 등과 같은 추상화 과정 간의 종속성으로 인해 제한된 종류의 딥러닝 모델만이 적용 가능하기 때문에 시스템의 기능적 확장성이 고려되어야 한다. 이에 본 논문은 에지 컴퓨팅 환경에서 딥러닝 기술을 활용한 비정형 데이터 추상화 과정의 기능적 확장성을 고려한 비정형 데이터 추상화 방법을 제안한다. 제안하는 방법은 데이터 처리가 분산되어 있는 에지 컴퓨팅 환경에서 수집과 전처리 과정을 수행할 수 있는 팻 클라이언트 기술을 사용하여 추상화 과정의 수집-전처리 과정과 분석 과정을 분리하여 수행하는 것이다. 또한 분리된 추상화 과정을 관리하기 위해 수집-전처리 과정을 수행하는 데 필요한 정보를 팻 클라이언트 프로파일로 제공하고, 분석 과정에 필요한 정보를 분석 모델 설명 언어(AMDL) 프로파일로 제공한다. 두 가지 프로파일을 통해서 추상화 과정을 독립적으로 관리하여 상황인지 시스템의 기능적 확장성을 제공한다. 실험에서는 차량 출입 통제 알림 서비스를 위한 차량 이미지 인식 모델을 대상으로 팻 클라이언트 프로파일과 AMDL 프로파일의 예제를 통해 시스템의 기능적 확장성을 보이고, 비정형 데이터의 추상화 과정별 세부사항을 보인다.
https://doi.org/10.3745/KTCCS.2021.10.3.59 인용 PDF KSCI

대공제압(SEAD) 임무에서의 전자전 효과도 분석을 위한 DEVS기반 시뮬레이터 개발 (Development of a DEVS Simulator for Electronic Warfare Effectiveness Analysis of SEAD Mission under Jamming Attacks)

송해상;구정;김탁곤;최영훈;박경태;신동조
- 한국시뮬레이션학회논문지
- /
- 제29권4호
- /
- pp.33-46
- /
- 2020
전자전은 상대방 전자전 무기체계나 장비에 대한 교란, 무력화, 공격 및 파괴를 목적으로 한다. 대공제압(SEAD: Suppression of Enemy Air Defense) 임무는 적의 방공망에 대한 무력화, 파괴, 혹은 일시적 기능 저하를 목적으로 하며, 전자전을 수행하는 대표적인 임무이다. 본 연구는 SEAD 임무의 효과도 분석을 위하여 DEVS(Discrete Event Systems Specification) 기반의 시뮬레이터를 개발하고 사례 분석을 통해 유용성을 입증한다. SEAD 임무는 SSJ(Self Screening Jamming), SOJ(Stand Off Jamming) 상황 하에서 적 지역으로 침투하여 HARM(High Speed Anti Radiation Missile)을 발사하는 단계까지로 한다. SAM의 대응은 SSJ, SOJ에 의해 성능의 저하가 초래되는 상태에서 임무를 수행하는 것으로 가정한다. 시뮬레이터는 전자전 장비의 제원(파라미터)과 운용전술(파리미터 혹은 알고리즘)의 조합이 임무효과도에 미치는 영향을 분석하는 것을 목적으로 하였다.
https://doi.org/10.9709/JKSS.2020.29.4.033 인용 PDF KSCI

방송CG 활용 사례 분석과 그래픽디자이너의 역할에 관한 연구 (A Study on the use Case Analysis of Broadcasting CG and the role of Graphic Designer)

조풍연
- 한국콘텐츠학회논문지
- /
- 제21권12호
- /
- pp.728-737
- /
- 2021
그동안 방송CG는 해체·변화·왜곡의 과정을 거듭하면서, 방송프로그램에서의 방송CG는 '시간성'과 '조형성'이라는 확대된 배경을 활용한다. 이를 통해 전달하고자 하는 의미를 입체적으로 표현함으로써 인간의 공감각에 호소하는 시청각적 언어를 창조하는 것이다. 방송CG가 단순한 지시적, 정보 전달적인 방송그래픽의 운용을 넘어, 가독성과 조형성을 고려한 영상의 순수한 미적가치와 감성을 증대시키고, 이를 통한 방송프로그램의 시청각정보 완성미를 도출하며 매우 중요한 요소로 작용한다. 따라서 본 논문에서는 기존의 지역방송사에서의 방송CG제작과 활용방법에서 나타난 결과물들을 살펴보고 방송프로그램 유형별 사례분석 통해 그동안 불가피하게 직면했던 지역 방송사들의 CG제작 및 활용의 한계점들을 파악하고, 이를 보완하기 위한 절충선이 되는 모델을 도출하고자 한다. 그리고 지역 방송프로그램에 보다 적극적이고 실용적으로 적용될 수 있는 방안을 제시하고자 한다. 이러한 문제해결을 위해 본 연구에서는 먼저 "방송프로그램에서의 방송CG제작 활용 사례분석"에 대해서 살펴보고, 그 다음으로 "지역 방송사들의 방송CG제작 방법과 활용의 문제점 파악을 통해 보다 효율적인 방송CG제작기법 및 적극적인 활용방법 등을 제언"하고자 한다. 또한 본 연구의 결과가 지역방송사들의 방송프로그램제작의 기술적인 관점과 방송CG제작을 담당하고 있는 방송그래픽디자이너들에게 새로운 역할과 실용적인 방송CG제작모델 정립에 기여할 것으로 기대된다.
https://doi.org/10.5392/JKCA.2021.21.12.728 인용 PDF KSCI HTML

노화 및 인지 능력에 따른 인지반응시간 비교 (Comparison of Cognitive Response Time according to Ageing and Cognitive Ability)

김은미;김정완
- 재활치료과학
- /
- 제10권4호
- /
- pp.81-94
- /
- 2021
목적 : 반응시간은 인지 능력과 노화에 대한 연구에서 중요한 역할을 한다. 본 연구는 컴퓨터 프로그램을 이용한 인지반응시간(Cognitive response time: CRT) 검사를 실시하여 정보처리에 대한 인지 능력의 영향을 확인하는 것을 목적으로 한다. 연구방법 : 대구 및 경북 지역에 거주하고 있는 65~79세의 일반 노인(Normal elderly: NE) 30명과 기억성 경도인지장애(Amnestic mild cognitive impairment: aMCI) 노인 30명을 대상으로 하였다. 결과 분석은 통계 분석 프로그램 R 4.0.2(University of Auckland, Auckland, New Zealand)를 사용하였다. 결과 : CRT 검사의 세 개 하위 영역에서의 총 반응시간은 집단 및 연령에 따라 유의한 차이를 보였고, 오류율은 일부 하위 영역에서 연령 또는 집단에 따라 유의한 차이를 보였다. aMCI 집단의 CRT 검사 수행력은 전반적인 인지 및 기억 검사의 수행력과 유의한 상관성을 갖는 것으로 나타났다. 결론 : 인지반응시간을 측정하는 CRT 검사를 통해 노화 및 인지 능력에 따른 정보처리과정과 처리속도의 변별적 수행을 관찰할 수 있었다. 또한, 이 검사의 수행력이 전반적인 인지 및 기억 검사와 유의한 상관성을 갖고 있음을 확인하였다. 따라서 지역사회 일반 노인의 초기 인지장애를 예측하는 간편 도구로써 CRT 검사가 의미있게 사용될 수 있기를 기대한다.
https://doi.org/10.22683/tsnr.2021.10.4.081 인용 PDF KSCI

검색결과 3,794건 처리시간 0.027초

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

자세히 찾기

이미지 검색 (β)