• 제목/요약/키워드: Speech development

검색결과 605건 처리시간 0.036초

키워드 분석을 활용한 한·중 모바일 결제 서비스에 대한 소비자 반응 탐색적 분석 -카카오페이와 알리페이를 중심으로- (Exploratory Analysis of Consumer Responses to Korea-China Mobile Payment Service using Keyword Analysis -Focus on Kakao Pay and Alipay-)

  • 가정;윤동화;안진현
    • 한국산학기술학회논문지
    • /
    • 제22권6호
    • /
    • pp.514-523
    • /
    • 2021
  • 최근 모바일 간편 결제 서비스의 확산은 사람들의 삶에 점점 더 많은 영향을 미치고 있다. 중국과 한국의 모바일 간편 결제 서비스에 대한 연구 증가를 통해 향후 모바일 간편 결제 서비스의 지속적인 발전이 매우 중요함을 알 수 있다. 본 논문은 소셜미디어 상에서 소비자의 카카오페이와 알리페이에 대한 반응의 차이를 알아보기 위해 카카오페이와 알리페이가 언급된 네이버 블로그 글을 수집하고 텍스트마이닝 기법을 활용해 키워드 분석을 했다. 품사별 키워드 빈도수 분석을 하였고 한 문장에 동시에 언급되는 공기어 빈도수 분석을 했다. 특히, 카카오페이와 알리페이를 언급한 글에서 공통적으로 언급된 단어를 추출하고 그에 대해 같이 언급된 단어들을 분석함으로써 같은 주제에 대해 어떤 다른 반응을 보이는지를 살펴봤다. 분석 결과 카카오페이의 신뢰성에 대한 소비자들의 우려가 존재했고 알리페이의 혜택에 대한 소비자들의 반응이 부정적이었다. 이러한 분석 결과를 토대로, 모바일 결제 서비스가 경쟁력을 갖추기 위해서는 다양한 부가 서비스를 추가하거나 보안 문제를 해결하는 노력을 할 필요가 있다는 점을 도출할 수 있다.

A.I.에이전트와의 보이스 인터랙션 : 국내외 IT회사 사례연구 (Voice Interactions with A. I. Agent : Analysis of Domestic and Overseas IT Companies)

  • 이서영
    • 한국엔터테인먼트산업학회논문지
    • /
    • 제15권4호
    • /
    • pp.15-29
    • /
    • 2021
  • 인공지능 에이전트는 4차 산업혁명의 핵심 기술이고, 현재 많은 기업들이 AI 음성 인식 비서를 탑재 출시함으로써 산업 내 치열한 경쟁을 벌이고 있다. 애플, 마이크로소프트, 구글, 아마존, 삼성 등 고객 충성도를 확보하고 있으며 자사 하드웨어 제품을 내놓고 있는 기업의 경우, AI 비서 서비스를 자사 제품에 적용함으로써 고객 충성도를 높이고, 시장 점유율 역시 극대화뿐 아니라 향후 음성 인터페이스 플랫폼 시장 장악력을 확대하고 있다. 본 연구는 인공지능분야의 해외 및 국내 주요 기업들의 현황을 분석하고 보이스 UI 개발과 혁신 수용 관점에서 사용자 만족을 위한 기술 발전 방향에 초점을 맞추어 미래 전략 방향을 제언했다. B2B 기술적인 측면에서는 음성 인식률을 높이고 하드웨어향상, 자연언어 처리기술 및 빅데이터 및 인공지능 접목한 혁신 기술의 데이터가 쌓인 클라우드 컴퓨팅 활용뿐 아니라 및 Open A.I.언어 인공지능인 GPT-3의 활용 및 사용성, 유용성, 감성 측면에서 사용자 만족을 높일 필요가 있다. 본 연구는 산업계와 학계에 실무적, 이론적 함의를 준다.

좌표계산을 통해 동영상의 안면 특징점 분석을 중심으로 한 웹 기반 발표 태도 교정 프로그램 개발 (Development of a Web-based Presentation Attitude Correction Program Centered on Analyzing Facial Features of Videos through Coordinate Calculation)

  • 권기현;안수호;박찬정
    • 한국콘텐츠학회논문지
    • /
    • 제22권2호
    • /
    • pp.10-21
    • /
    • 2022
  • 학생들의 취업을 위한 면접 발표와 회사에서의 프로젝트 결과 발표 등과 같은 형식적인 발표 태도가 개선되려면 동료나 교수자의 관찰에 의한 방법 이외에 자동화된 방법은 드물다. 기존 연구에 따르면, 발표자의 안정적인 발화와 시선 처리가 발표에서의 전달력에 영향을 미친다고 한다. 또한, 본인 발표에 대한 적절한 피드백이 발표자의 발표 역량을 늘이는 효과가 있다는 연구도 있다. 본 연구에서는 이와 같은 교정의 긍정적 측면을 고려하여 대학생들의 잘못된 발표 습관과 태도를 동영상의 안면 분석을 통해 지능적으로 교정해 주는 프로그램을 개발하고 성능을 분석하였다. 개발하는 프로그램은 웹 기반으로 군말 사용 여부를 확인하고 안면 인식과 발표 내용 텍스트화를 통해 개발되었다. 이를 위해 군말 분류 인공지능 모델을 개발하였고, 동영상 객체 추출 후, 좌표에 기반으로 얼굴 특징점을 인식하였다. 이후 4,000개 안면 데이터를 이용해 Teachable Machine에서 안면 인식한 경우와 본 연구의 알고리즘 성능을 비교·분석하였다. 프로그램을 이용해 발표 태도를 자기스스로 교정하여 발표자들에게 도움을 준다.

The Role of Fundamentalization of Education in Improving the Future Specialists Professional Training with Usage of Multimedia Technologies

  • Palshkov, Kostiantyn;Kochubei, Olena;Tsokur, Olga;Tiahur, Vasyl;Tiahur, Liubomyra;Filimonova, Tetiana;Kuzminskyi, Anatolii
    • International Journal of Computer Science & Network Security
    • /
    • 제22권9호
    • /
    • pp.95-102
    • /
    • 2022
  • The article considers the fundamentalization of education in improving the future specialists professional training with usage of multimedia technologies by various scientists. Various points of view and approaches to defining the concepts of fundamentalization of education and multimedia technologies are identified. The concept of fundamentalization of professional training of a future specialist is based on the goals and functions of fundamentalization and - on the ways and means of achieving it, etc. Most authors agree only in their views that the fundamentalization of education is aimed at improving the quality of education and the education of the individual. Others involve the formation of a culture and worldview, increasing the creative and intellectual potential, forming the professional competence of a specialist and the potential for further education, and so on. The term multimedia refers to interactive systems that provide processing of moving and still video images, animated graphics, high-quality audio and speech. It is found out that professional training of a specialist by means of multimedia technologies includes not only the activities of the teacher and student, which form the learning process, but also the independent activity of the subject, self-development, assimilation of experience by the subject through analysis, comprehension and transformation of the field of activity in which he is included. It is revealed through the implementation of which approaches to the fundamentalization of higher professional education, it becomes possible to fully present theoretical training courses and effectively pass practical training by students, which contributes to improving the quality of training of future specialists in higher education institutions. Theoretical analysis of scientific views indicates a fairly serious attention of scientists to the problem of professional readiness of specialists and the possibility of higher educational institutions in preparing for it. At the same time, professional readiness is considered from different positions: as an active state of a person, which manifests itself in activity; as a result of activity; as goals of activity; as a quality that characterizes the attitude to solving professional problems and social situations; as a prerequisite for purposeful activity; as a form of activity of the subject; as an integral formation of personality; as a component of socio-professional culture; as a complex professionally significant neoplasm of the individual.

시각장애인을 위한 CNN 기반의 점자 변환 및 음성 출력 장치 설계 (Design of CNN-based Braille Conversion and Voice Output Device for the Blind)

  • 박승빈;김봉현
    • 사물인터넷융복합논문지
    • /
    • 제9권3호
    • /
    • pp.87-92
    • /
    • 2023
  • 시대가 발전함에 따라 정보가 다양해지고 이를 얻는 방법도 다양해진다. 살아가면서 얻는 정보의 양 중 약 80%는 시각적 감각으로 습득한다. 하지만 시각장애인들은 시각 자료를 해석하는 능력이 제한된다. 그래서 점자라는 시각장애인용 문자가 등장했다. 그러나 시각장애인들의 점자 해독률은 5%에 불과하며 시간에 지남에 따라 다양한 형태의 플랫폼이나 자료를 원하는 시각장애인들의 요구가 늘어나면서 시각장애인들을 위한 개발 및 물품 제작이 이루어지고 있다. 물품 제작의 예로는 점자 도서를 들 수 있는데 이 점자 도서는 장점보단 단점이 많아 보이고 비장애인과 다르게 아직도 정보 접근에 대해서는 많이 어려운 것이 사실이다. 본 논문에서는 시각장애인이 정보를 기존의 방법보다 쉽게 얻을 수 있도록 CNN 기반 점자 변환 및 음성 출력 장치를 설계하였다. 이 장치는 점자로 되어 있지 않고 점자로 제작이 되지 않은 책, 텍스트 이미지나 손글씨 이미지 등을 카메라 인식을 통해 점자로 변환할 수 있도록 하고, 점자로 변환 후 시각장애인들의 요구에 따라서 음성으로 변환해 출력할 수 있는 기능을 설계해 시각장애인들이 정보를 얻을 수 있게 도와주어 삶의 질을 높이고자 한다.

특허 데이터 기반 생성형 AI 기술 동향 분석 (Analysis of Generative AI Technology Trends Based on Patent Data)

  • 유성무;송태원;이민정;최윤주;설순욱
    • 한국정보전자통신기술학회논문지
    • /
    • 제17권1호
    • /
    • pp.1-9
    • /
    • 2024
  • 본 논문은 특허 출원 문서를 기초로 하여 생성형 AI 기술의 동향을 분석한다. 이를 위해 2003년부터 2023년까지 한국, 미국, 유럽에서 출원된 생성형 AI 관련 특허 5,433건을 선별하고, 국가별, 기술 분야별, 연도별, 출원인별 데이터를 분석하고 시각적으로 제시함으로써 시사점을 찾고 기술 흐름을 확인하고자 한다. 분석 결과, 이미지 분야의 특허가 36.9%로 가장 많고 지속적으로 출원 건수가 상승하고 있지만, 문장/문서나 음악/음성 분야는 2019년 이후로 출원이 감소하거나 유지되고 있다. 가장 많은 특허를 출원한 기업은 한국 기업이지만 상위 5개 출원인 중 4개가 미국 기업이며 모든 기업이 미국에 가장 많은 특허를 출원하고 있어 생성형 AI는 미국 시장을 중심으로 성장하고 경쟁하고 있음을 확인하였다. 논문의 분석 결과는 향후 생성형 AI 연구 개발과 지식 재산 확보 전략을 수립하는 데 활용될 수 있을 것으로 기대된다.

한국형 멀티모달 몽타주 앱을 위한 생성형 AI 연구 (Research on Generative AI for Korean Multi-Modal Montage App)

  • 임정현;차경애;고재필;홍원기
    • 서비스연구
    • /
    • 제14권1호
    • /
    • pp.13-26
    • /
    • 2024
  • 멀티모달 (multi-modal) 생성이란 텍스트, 이미지, 오디오 등 다양한 정보를 기반으로 결과를 도출하는 작업을 말한다. AI 기술의 비약적인 발전으로 인해 여러 가지 유형의 데이터를 종합적으로 처리해 결과를 도출하는 멀티모달 기반 시스템 또한 다양해지는 추세이다. 본 논문은 음성과 텍스트 인식을 활용하여 인물을 묘사하면, 몽타주 이미지를 생성하는 AI 시스템의 개발 내용을 소개한다. 기존의 몽타주 생성 기술은 서양인들의 외형을 기준으로 이루어진 반면, 본 논문에서 개발한 몽타주 생성 시스템은 한국인의 안면 특징을 바탕으로 모델을 학습한다. 따라서, 한국어에 특화된 음성과 텍스트의 멀티모달을 기반으로 보다 정확하고 효과적인 한국형 몽타주 이미지를 만들어낼 수 있다. 개발된 몽타주 생성 앱은 몽타주 초안으로 충분히 활용 가능하기 때문에 기존의 몽타주 제작 인력의 수작업을 획기적으로 줄여줄 수 있다. 이를 위해 한국지능정보사회진흥원의 AI-Hub에서 제공하는 페르소나 기반 가상 인물 몽타주 데이터를 활용하였다. AI-Hub는 AI 기술 및 서비스 개발에 필요한 인공지능 학습용 데이터를 구축하여 원스톱 제공을 목적으로 한 AI 통합 플랫폼이다. 이미지 생성 시스템은 고해상도 이미지를 생성하는데 사용하는 딥러닝 모델인 VQGAN과 한국어 기반 영상생성 모델인 KoDALLE 모델을 사용하여 구현하였다. 학습된 AI 모델은 음성과 텍스트를 이용해 묘사한 내용과 매우 유사한 얼굴의 몽타주 이미지가 생성됨을 확인할 수 있다. 개발된 몽타주 생성 앱의 실용성 검증을 위해 10명의 테스터가 사용한 결과 70% 이상이 만족한다는 응답을 보였다. 몽타주 생성 앱은 범죄자 검거 등 얼굴의 특징을 묘사하여 이미지화하는 여러 분야에서 다양하게 사용될 수 있을 것이다.

Why A Multimedia Approach to English Education\ulcorner

  • Keem, Sung-uk
    • 대한음성학회:학술대회논문집
    • /
    • 대한음성학회 1997년도 7월 학술대회지
    • /
    • pp.176-178
    • /
    • 1997
  • To make a long story short I made up my mind to experiment with a multimedia approach to my classroom presentations two years ago because my ways of giving instructions bored the pants off me as well as my students. My favorite ways used to be sometimes referred to as classical or traditional ones, heavily dependent on the three elements: teacher's mouth, books, and chalk. Some call it the 'MBC method'. To top it off, I tried audio-visuals such as tape recorders, cassette players, VTR, pictures, and you name it, that could help improve my teaching method. And yet I have been unhappy about the results by a trial and error approach. I was determined to look for a better way that would ensure my satisfaction in the first place. What really turned me on was a multimedia CD ROM title, ELLIS (English Language Learning Instructional Systems) developed by Dr. Frank Otto. This is an integrated system of learning English based on advanced computer technology. Inspired by the utility and potential of such a multimedia system for regular classroom or lab instructions, I designed a simple but practical multimedia language learning laboratory in 1994 for the first time in Korea(perhaps for the first time in the world). It was high time that the conventional type of language laboratory(audio-passive) at Hahnnam be replaced because of wear and tear. Prior to this development, in 1991, I put a first CALL(Computer Assisted Language Learning) laboratory equipped with 35 personal computers(286), where students were encouraged to practise English typing, word processing and study English grammar, English vocabulary, and English composition. The first multimedia language learning laboratory was composed of 1) a multimedia personal computer(486DX2 then, now 586), 2) VGA multipliers that enable simultaneous viewing of the screen at control of the instructor, 3) an amplifIer, 4) loud speakers, 5)student monitors, 6) student tables to seat three students(a monitor for two students is more realistic, though), 7) student chairs, 8) an instructor table, and 9) cables. It was augmented later with an Internet hookup. The beauty of this type of multimedia language learning laboratory is the economy of furnishing and maintaining it. There is no need of darkening the facilities, which is a must when an LCD/beam projector is preferred in the laboratory. It is headset free, which proved to make students exasperated when worn more than- twenty minutes. In the previous semester I taught three different subjects: Freshman English Lab, English Phonetics, and Listening Comprehension Intermediate. I used CD ROM titles like ELLIS, Master Pronunciation, English Tripple Play Plus, English Arcade, Living Books, Q-Steps, English Discoveries, Compton's Encyclopedia. On the other hand, I managed to put all teaching materials into PowerPoint, where letters, photo, graphic, animation, audio, and video files are orderly stored in terms of slides. It takes time for me to prepare my teaching materials via PowerPoint, but it is a wonderful tool for the sake of presentations. And it is worth trying as long as I can entertain my students in such a way. Once everything is put into the computer, I feel relaxed and a bit excited watching my students enjoy my presentations. It appears to be great fun for students because they have never experienced this type of instruction. This is how I freed myself from having to manipulate a cassette tape player, VTR, and write on the board. The student monitors in front of them seem to help them concentrate on what they see, combined with what they hear. All I have to do is to simply click a mouse to give presentations and explanations, when necessary. I use a remote mouse, which prevents me from sitting at the instructor table. Instead, I can walk around in the room and enjoy freer interactions with students. Using this instrument, I can also have my students participate in the presentation. In particular, I invite my students to manipulate the computer using the remote mouse from the student's seat not from the instructor's seat. Every student appears to be fascinated with my multimedia approach to English teaching because of its unique nature as a new teaching tool as we face the 21st century. They all agree that the multimedia way is an interesting and fascinating way of learning to satisfy their needs. Above all, it helps lighten their drudgery in the classroom. They feel other subjects taught by other teachers should be treated in the same fashion. A multimedia approach to education is impossible without the advent of hi-tech computers, of which multi functions are integrated into a unified system, i.e., a personal computer. If you have computer-phobia, make quick friends with it; the sooner, the better. It can be a wonderful assistant to you. It is the Internet that I pay close attention to in conjunction with the multimedia approach to English education. Via e-mail system, I encourage my students to write to me in English. I encourage them to enjoy chatting with people all over the world. I also encourage them to visit the sites where they offer study courses in English conversation, vocabulary, idiomatic expressions, reading, and writing. I help them search any subject they want to via World Wide Web. Some day in the near future it will be the hub of learning for everybody. It will eventually free students from books, teachers, libraries, classrooms, and boredom. I will keep exploring better ways to give satisfying instructions to my students who deserve my entertainment.

  • PDF

극소 저체중 출생아에서 청력 손상에 영향을 미치는 요인: 1,500 g미만의 청력 검사 결과 (Risk Factors for Hearing Loss in Very Low Birth Weight Infants: Results of Hearing Test in Infants <1,500 g)

  • 성민정;한영미;박경희;이일우;변신연
    • Neonatal Medicine
    • /
    • 제18권2호
    • /
    • pp.328-336
    • /
    • 2011
  • 목적: 양측 고도 난청은 신생아 집중치료실에서 치료를 하였던 신생아나 미숙아인 경우 위험률이 증가한다. 이에 저자들은 1,500 g 미만으로 출생한 미숙아를 대상으로 난청을 유발할 수 있는 인자들을 알아보고자 하였다. 방법: 2008년 12월부터 2011년 2월까지 부산대학교 어린이병원 신생아 중환자실에 입원한 1,500 g 미만의 미숙아 65명을 대상으로 난청의 위험 인자들의 의무 기록을 후향적으로 조사하였다. 청력 검사는 교정 연령 37주 이상이 되었을 때 ABR로 시행하였으며, 처음 검사에서 정상 청력인 환아와 난청인 환아로 분류하였다. 결과: 65명의 환아 중에서 34명은 정상으로 나왔고, 31명은 난청을 보였다(47.7%). 난청을 보인 환아 중에서 일상 생활에 지장을 주는 중도 이상의 난청을 가진 환아는 10명(15.4%) 이었다. 이들의 위험인자를 비교해본 결과 비정상군에서 청력 검사를 시행했던 시기가 늦었고, 출생 체중이 적었으며, 기계 환기를 했던 기간이 길었고, 생후 1주일간 동맥혈 가스 분석 결과 최저 산소 분압이 낮았고, 이뇨제의 누적 용량이 의미 있게 많았다 (P<0.05). 이 위험 인자를 경도 난청과 중/고도 난청/농으로 나누고 출생 체중으로 보정한 다인자 분석을 하니 5분 Apgar 점수가 증가할 때마다 중/고도 난청/농의 가능성은 낮아지고 (OR=0.34, 95% CI: 0.13-0.89), 기계 환기의 기간이 길어질 때마다 중/고도 난청/농의 가능성은 증가하였다(OR=1.06, 95% CI: 1.01-1.12). 31명의 난청 환아 중에 추적 검사를 시행한 17명 중 16명이 호전을 보였고(94.1%), ABR로 재검을 한 8명 중 7명은 호전이 될 때까지 평균 5.6개월이 소요되었으며, 1명만이 양측 농으로 나와 보청기를 착용하였다. 결론: 1,500 g 미만의 미숙아에게 처음 시행한 청력 선별 검사에서 중도 이상의 난청에 영향을 미치는 인자들은 낮은 5분 Apgar점수와 장기간의 인공 호흡기 사용이었고, 대부분이 5-6개월 이내에 청력에 호전을 보여 수개월간은 추적 검사를 시행하면서 회복되기를 기다려도 될 것으로 생각된다.

변조 이음향방사(DPOAE)를 이용한 고위험군 신생아 청각선별검사 (Neonatal hearing screening in a neonatal intensive care unit using distortion product otoacoustic emissions)

  • 김도영;김성신;김창휘;김시찬
    • Clinical and Experimental Pediatrics
    • /
    • 제49권5호
    • /
    • pp.507-512
    • /
    • 2006
  • 목 적 : 신생아 난청은 신생아 1,000명당 1-3명에서 발생하며 조기에 발견하여 중재하지 않으면 유소아의 언어 습득과 발달 지연에 영향을 미친다. 저자들은 신생아 고위험군을 대상으로 청각 선별검사로서 DPOAE를 이용하여 난청의 유병률과 위험 인자와의 관련성에 대해 조사하였다. 방 법 : 2001년 5월부터 2004년 12월까지 순천향대학교 부천 병원 신생아 집중치료실에 입원하여 청각 선별검사로 변조 이음향방사를 시행받은 871명을 대상으로 의무기록을 후향적으로 검토하였다. 변조 이음향방사에서 통과된 경우 Pass 군으로, 통과되지 못한 경우를 Refer 군으로 나누어 출생 체중, 재태 기간, 산모의 위험 인자, 가족력, 인공호흡기 사용, 빌리루빈 수치, 이독성 약물의 사용 등 청각에 영향을 미치는 인자에 대해 연구하였다. 결 과 : 총 871명 중 106명(12.1%)이 Refer 군으로 우측 이상이 36명(4.1%), 좌측 이상이 23명(2.6%), 양측 이상이 47명(5.4%)이었다. Refer군 106명 중 20명(18.9%)이 3개월 후 변조 이음향방사를 재시행 하였으며 40명(37.7%)에서 ABR를 시행하였다. 총 871명 중 Pass 군과 Refer 군 사이에 성별, 출생 장소(본원 및 외부병원), 청각장애의 가족력, 재태 연령에 따른 출생 체중(부당 경량아, 부당 중량아, 적정 체중아), 산모의 위험 인자(임신성 고혈압, 임신성 당뇨, 조기 양막 파수), 빌리루빈 수치 및 gentamicin 사용 등의 인자와는 유의한 차이가 없었다. 총 871명 중 Pass 군과 Refer 군 사이에 출생 체중 1,500 g 미만, 재태 연령 37주 이하, 심폐 소생술 시행, 낮은 Apgar 점수(1분에 5점 이하, 5분에 6점 이하), 두경부 이상(구개순, 구개열, 이개 앞 피부 돌출), 인공호흡기 사용, 패혈증, vancomycin 사용 등의 인자에서 유의한 차이(P<0.05)를 보였다. 결 론 : 60 dB 이상의 난청이 18명(2%)에서 관찰되었으며 이는 전체 신생아 유병률(1-3명/1,000명)보다 높은 수치이다. 그러므로 신생아 집중치료실 입원 환자에게는 청각 선별검사를 반드시 시행하여야 하며 변조 이음향방사가 선별검사의 방법으로 이용될 수 있다. 또한 이번 연구를 기초로 하여 전체 신생아를 대상으로 한 신생아 청각 선별검사의 보편화 할 것을 추천하며 이상이 있는 경우 더욱 적극적인 추적 관찰이 필요할 것으로 사료된다.