• Title/Summary/Keyword: 음성의 다양화

Search Result 301, Processing Time 0.029 seconds

NGN 환경에서의 개방형 서비스 표준화 동향 (The Standardization Trend of Open Services in NGN Environment)

  • 이원석;이강찬;이승윤
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2006년도 춘계종합학술대회
    • /
    • pp.978-980
    • /
    • 2006
  • 차세대 통신망으로 각광받고 있는 NGN(Next Generation Network)은 일반전화망, 비동기식전송방식(ATM), 프레임릴레이, 전용망, 무선통신망 등 모든 통신 네트워크를 패킷 기반의 공통망으로 통합하는 개념이며, NGN의 가장 큰 특징은 통합화와 패킷화. 음성과 데이터, 영상을 동시에 수용하며 인터넷전화, 멀티미디어 메시징 등과 같은 다양한 부가서비스를 효율적으로 제공할 수 있다는 것이다. 이러한 NGN 환경에서는 전송층에서 제공하는 서비스, 응용층에서 제공하는 서비스 등 상당히 많은 서비스들이 정의되고 있으며, 앞으로 점점더 많은 서비스들이 생겨날 것이다. 또한, NGN 환경에서 새로운 서비스의 개발은 처음부터 개발하는 것이 아니라, 기존의 NGN의 서비스들을 재사용하여 새로운 서비스로 개발되는 형태가 이상적이며, 이러한 것들이 서로다른 통신망, 플렛폼, 프로그래밍 언어 등의 상이한 환경에 존재한 서비스들을 통합해야 한다. 본 논문에서는 NGN 환경에 대한 국제 표준화를 추진하고 있는 ITU-T SG13(Study Group 13)의 활동 중 개방형 서비스와 관련된 표준화 동향을 설명한다.

  • PDF

소셜챗봇 구축에 필요한 관계성 추론을 위한 텍스트마이닝 방법 (Identifying Social Relationships using Text Analysis for Social Chatbots)

  • 김정훈;권오병
    • 지능정보연구
    • /
    • 제24권4호
    • /
    • pp.85-110
    • /
    • 2018
  • 챗봇은 음성, 이미지, 비디오 또는 텍스트와 같은 다양한 매채를 이용하여 대화가 가능한 대화형 어시스턴트이자 인공지능을 기반으로 사용자의 질문에 답하거나 문제를 해결할 수 있는 사용자 친화적 프로그램이다. 하지만 현재 챗봇은 사용자가 요청한 작업을 정확하게 수행하는 기술적측면에 초점이 맞추어져 있으며, 개인화된 대화로 사용자와 챗봇간의 관계성 구축에는 제한적이어서 일부 사례에도 불구하고 소셜챗봇이 되기에는 미흡한 상태이다. 만약 인간의 사회성을 나타내는 특징 중 하나인 관계성을 챗봇이 인식하여 알맞게 대화를 하여 문제를 해결할 수 있다면, 개인화된 대화를 할 수 있을 뿐만 아니라 인간과 유사한 대화를 할 수 있을 것이다. 본 연구의 목적은 사용자가 입력한 내용을 기반으로 챗봇과 사용자 간의 관계성을 추론하고 대화 상황에 맞게 대화 상대가 적절한 대화를 수행 할 수 있는 텍스트 분석 방법을 제안하는 것이다. 본 연구의 실험 및 평가를 하기 위하여 실제 SNS대화 내용을 사용하였다. 분석결과 개인정보 보호를 위해 사용자의 개인 프로필 정보가 제외된 방법에서도 우수한 결과를 나타내어 소셜 챗봇에 적합한 방법으로 검증되었다.

전산화단층촬영 관상동맥조영술: 분획혈류예비력과 심근관류 영상 (Beyond Coronary CT Angiography: CT Fractional Flow Reserve and Perfusion)

  • 김문영;양동현;추기석;이활
    • 대한영상의학회지
    • /
    • 제83권1호
    • /
    • pp.3-27
    • /
    • 2022
  • 심장 전산화단층촬영은 비약적인 기술발전과 다양한 연구 결과를 바탕으로 심혈관위험 계층화와 치료 결정을 위한 관상동맥 질환의 진단과 예후 평가성능이 입증되었다. 전산화단층촬영 관상동맥조영술은 폐쇄성 관상동맥 질환에 대한 음성 예측도가 높아서 침습적 혈관조영술의 빈도를 줄일 수 있는 관상동맥 질환 관련 검사의 관문으로 부상했지만, 진단특이도가 상대적으로 낮다. 하지만 심장 전산화단층촬영을 이용한 분획혈류예비력과 심근관류를 분석하여 관상동맥 질환의 혈역학적 유의성을 확인하는 기능적 평가를 통해 그 한계를 극복할 수 있다. 최근에는 이를 보다 객관적이고 재현 가능하도록 인공지능을 접목하는 연구들이 활발히 진행되고 있다. 본 종설에서는 심장 전산화단층촬영의 기능적 영상화 기법들에 대해 알아보고자 한다.

딥러닝 기반의 딥 클러스터링 방법에 대한 분석 (Analysis of deep learning-based deep clustering method)

  • 권현;이준
    • 융합보안논문지
    • /
    • 제23권4호
    • /
    • pp.61-70
    • /
    • 2023
  • 클러스터링은 데이터의 정답값(실제값)이 없는 데이터를 기반으로 데이터의 특징벡터의 거리 기반 등으로 군집화를 하는 비지도학습 방법이다. 이 방법은 이미지, 텍스트, 음성 등 다양한 데이터에 대해서 라벨링이 없이 적용할 수 있다는 장점이 있다. 기존 클러스터링을 하기 위해 차원축소 기법을 적용하거나 특정 특징만을 추출하여 군집화하는 방법이 적용되었다. 하지만 딥러닝 기반 모델이 발전하면서 입력 데이터를 잠재 벡터로 표현하는 오토인코더, 생성 적대적 네트워크 등을 통해서 딥 클러스터링의 기술이 연구가 되고 있다. 본 연구에서, 딥러닝 기반의 딥 클러스터링 기법을 제안하였다. 이 방법에서 오토인코더를 이용하여 입력 데이터를 잠재 벡터로 변환하고 이 잠재 벡터를 클러스터 구조에 맞게 벡터 공간을 구성 및 k-평균 클러스터링을 하였다. 실험 환경으로 pytorch 머신러닝 라이브러리를 이용하여 데이터셋으로 MNIST와 Fashion-MNIST을 적용하였다. 모델로는 컨볼루션 신경망 기반인 오토인코더 모델을 사용하였다. 실험결과로 k가 10일 때, MNIST에 대해서 89.42% 정확도를 가졌으며 Fashion-MNIST에 대해서 56.64% 정확도를 가진다.

한국형 멀티모달 몽타주 앱을 위한 생성형 AI 연구 (Research on Generative AI for Korean Multi-Modal Montage App)

  • 임정현;차경애;고재필;홍원기
    • 서비스연구
    • /
    • 제14권1호
    • /
    • pp.13-26
    • /
    • 2024
  • 멀티모달 (multi-modal) 생성이란 텍스트, 이미지, 오디오 등 다양한 정보를 기반으로 결과를 도출하는 작업을 말한다. AI 기술의 비약적인 발전으로 인해 여러 가지 유형의 데이터를 종합적으로 처리해 결과를 도출하는 멀티모달 기반 시스템 또한 다양해지는 추세이다. 본 논문은 음성과 텍스트 인식을 활용하여 인물을 묘사하면, 몽타주 이미지를 생성하는 AI 시스템의 개발 내용을 소개한다. 기존의 몽타주 생성 기술은 서양인들의 외형을 기준으로 이루어진 반면, 본 논문에서 개발한 몽타주 생성 시스템은 한국인의 안면 특징을 바탕으로 모델을 학습한다. 따라서, 한국어에 특화된 음성과 텍스트의 멀티모달을 기반으로 보다 정확하고 효과적인 한국형 몽타주 이미지를 만들어낼 수 있다. 개발된 몽타주 생성 앱은 몽타주 초안으로 충분히 활용 가능하기 때문에 기존의 몽타주 제작 인력의 수작업을 획기적으로 줄여줄 수 있다. 이를 위해 한국지능정보사회진흥원의 AI-Hub에서 제공하는 페르소나 기반 가상 인물 몽타주 데이터를 활용하였다. AI-Hub는 AI 기술 및 서비스 개발에 필요한 인공지능 학습용 데이터를 구축하여 원스톱 제공을 목적으로 한 AI 통합 플랫폼이다. 이미지 생성 시스템은 고해상도 이미지를 생성하는데 사용하는 딥러닝 모델인 VQGAN과 한국어 기반 영상생성 모델인 KoDALLE 모델을 사용하여 구현하였다. 학습된 AI 모델은 음성과 텍스트를 이용해 묘사한 내용과 매우 유사한 얼굴의 몽타주 이미지가 생성됨을 확인할 수 있다. 개발된 몽타주 생성 앱의 실용성 검증을 위해 10명의 테스터가 사용한 결과 70% 이상이 만족한다는 응답을 보였다. 몽타주 생성 앱은 범죄자 검거 등 얼굴의 특징을 묘사하여 이미지화하는 여러 분야에서 다양하게 사용될 수 있을 것이다.

생물학적 토양 지표로서의 모재별 미생물의 다양성과 복원율 (Microbial Diversity, Survival and Recovery as Bioindicators in Soils from Different Parent Materials in Korea)

  • 서장선;권장식;김상효
    • 한국토양비료학회지
    • /
    • 제35권4호
    • /
    • pp.243-252
    • /
    • 2002
  • 토양생태계는 정량화하기 어려운 다양한 규칙이 다중적으로 조화되어 끊임없이 변하고있어 어떤 현상을 획일적으로 평가하기 어렵다. 그러나, 미생물은 환경에 대한 감수성이 빨라 토양의 생물적인 특성 변화를 가장 먼저 나타내기 때문에, 미생물은 생태계의 가변적 변동상의 지표가 될 수 있다. 또한 토양에 생명력을 부여해주는 기능을 가지고 있어 토양미생물의 작용 및 기능 평가는 토양 건전성 관리에 있어 중요한 역할을 한다. 따라서 본 연구는 생물학적 토양 건전성 평가 지표요인 개발하고자 주요 모재별 미경지 토양의 생물학적 토양특성을 평가하고자 수행하였다. 주요 모재별 미경지 토양의 미생물 밀도는 현무암유래 토양에서 낮고 석회암유래 토양에서 높은 경향이었으나, 그람 음성균은 비슷한 수준을 유지하고 있었다. 토양 건조처리시 미생물의 생존율은 형광성 Pseudomonas속이 0.1%로 가장 낮았으나 고온성 Bacillus속과 호알카리성균은 90%이상으로 높았다. 토양미생물체량과 미생물 유fo 유기탄소량 간에는 정의 상관관계를 나타냈으며, 토양 건조처리 효과는 토양별 9.7~95.0% 범위로 평균 39.8%였다. 건토를 재습윤하였을 때 중온성 Bacillus속은 원래 균수보다 높게 복원되는 토양이 많았다. 토양 pH는 미생물수 복원율에 정의 영향을 주었다. 건토의 재습윤화에 의한 토양 미생물체량 복원율은 평균 65.3%였으며, 재습윤토의 미생물체 복원량과 형광성 Pseudomonas속간에 유의한 정의 상관관계가 있었다.

시각적 교통약자를 위한 길안내 데이터 모델 구축에 관한 연구 (A Study on Configuration of the Road Guide Data Model for Visually Impaired Pedestrian)

  • 박성호;권재현;이지선
    • 한국측량학회지
    • /
    • 제40권2호
    • /
    • pp.119-133
    • /
    • 2022
  • 측량, 지도, 통신 기술의 발달로 다양한 길안내 앱 및 차량용 내비게이션 등이 개발 및 보급되었다. 그 결과, 보행 및 운전 전반에 널리 활용되며 많은 도움을 주고 있으나 여전히 사회적 약자의 일상 편의를 향상시키는데 있어서는 한계가 존재한다. 이는 일반 길안내 앱이나 내비게이션이 일반인의 보행이나 차량을 중심으로 서비스되고 있어 시각장애인이 이동 시 혼란을 유발하거나 위험 요소가 되는 정보를 제공하지 못하는데 따른 것이다. 이에 본 연구에서는 시각장애인과 같이 보행(이동)에 제약을 받는 교통약자를 대상으로 한 공간정보 기반 서비스를 구현하기 위한 데이터 구축 방안을 모색하고자 하였다. 이를 위해 공간정보 데이터를 기반으로 시각장애인의 보행과 관련되어 요구되는 항목과 구성요소를 선정하고, 이를 기반으로 상용 앱(app)에 접목할 수 있는 보행용 길안내 네트워크를 구성·분석하였다. 그 결과, 공간정보 기반의 점자블럭(점형/선형), 음향신호기, 버스정류장, 볼라드 등의 추가적인 시각장애인용 컨텐츠 정보가 확보될 경우 교통약자의 독립적인 보행을 위한 길안내 서비스가 가능하다는 결론을 도출했다. 또한, 길안내를 위한 데이터 모델을 정립하고 이를 기반으로 초기 버전의 모바일 앱을 구현했으며, 시각장애인을 대상으로 한 검증을 통해 시각장애인용 컨텐츠 정보 제공이 보행 시 유용함을 확인했다. 보다 안정적인 보행을 지원하기 위해서는 타 기관 또는 여러 부처에서 제공되는 공간정보 자료의 DB (DataBase)화 및 활용이 필요하며, 동시에 ICT (Information and Communications Technologies)기술 접목을 통해 다양한 센서 및 음성기술 등을 연계·활용한 고도화 방안도 모색되어야 할 것으로 판단된다.

스마트기기에서 시각장애인을 위한 카메라기반 인식 소프트웨어 인터페이스의 접근성 연구 (A Study for the Accessibility of Camera-Based Mobile Applications on Touch Screen Devices for Blind People)

  • 최윤정;홍기형
    • 한국HCI학회논문지
    • /
    • 제7권2호
    • /
    • pp.49-56
    • /
    • 2012
  • 장애물 인식, 위치 확인, 색상 인식과 같은 스마트기기의 카메라를 활용한 시각 장애인을 위한 소프트웨어는 시각장애인의 삶의 질을 크게 향상시킬 수 있다. 그러나 기존의 카멜 기반 다양한 인식 소프트웨어들은 터치스크린에서의 시각장애인 접근성 요구사항을 제대로 반영하지 못하여 실제 시각 장애인이 사용에 있어 불편함이 있다. 본 연구에서는 최근 급속히 확산되고 있는 터치스크린 기반의 스마트 기기에서 카메라 기반 소프트웨어의 시각장애인 인터페이스의 접근성 요구사항을 도출하였다. 접근성 요구사항 도출을 위하여 상호작용 흐름이 서로 다른 3 가지 시험 인터페이스를 색상인식 응용으로 구현하여 시각 장애인을 대상으로 사용성 평가를 실시하였다. 평가 결과 크게 5 가지 접근성 요구사항을 도출하였다. (1)상호작용의 횟수가 적은 인터페이스를 선호한다. (2)사용자에게 각 화면 페이지마다 음성 도움말을 제공하기보다 초기의 음성 도움말을 제공하는 것이 더 중요하다. (3)사용자는 카메라를 수동으로 작동하는 것을 선호하며, 자동 모드를 선택할 수 있도록 지원하여야 한다. (4)운영체제 자체 접근성 기능은 카메라기반 애플리케이션이 실행 중인 동안 비활성화 해야 한다. (5)화면 경계에 대한 촉감 피드백이 필요하다. 도출한 요구사항을 반영한 시각장애인용 색상인식 소프트웨어의 인터페이스를 설계, 구현하고 이를 10명의 시각 장애인을 대상으로 도출한 접근성 요구사항이 유용함을 검증하였다.

  • PDF

Effect of low temperature microwave irradiation on tunnel layer of charge trap flash memory cell

  • 홍은기;김소연;조원주
    • 한국진공학회:학술대회논문집
    • /
    • 한국진공학회 2016년도 제50회 동계 정기학술대회 초록집
    • /
    • pp.261-261
    • /
    • 2016
  • 플래시 메모리 (flash memory)는 DRAM(dynamic racdom access memory)이나 SRAM(static random access memory)에 비해 소자의 구조가 매우 단순하기 때문에 집적도가 높아서 기기의 소형화가 가능하다는 점과 제조비용이 낮다는 장점을 가지고 있다. 또한, 전원을 차단하면 정보가 사라지는 DRAM이나 SRAM과 달리 전원이 꺼지더라도 저장된 정보가 지워지지 않는다는 특징을 가지고 있어서 ROM(read only memory)과 정보의 입출력이 자유로운 RAM의 장점을 동시에 가지기 때문에 활용도가 크다. 또한, 속도가 빠르고 소비전력이 작아서 USB 드라이브, 디지털 TV, 디지털 캠코더, 디지털 카메라, 휴대전화, 개인용 휴대단말기, 게임기 및 MP3 플레이어 등에 널리 사용되고 있다. 특히, 낸드(NAND)형의 플래시 메모리는 고집적이 가능하며 하드디스크를 대체할 수 있어 고집적 음성이나 화상 등의 저장용으로 많이 쓰이며 일정량의 정보를 저장해두고 작업해야 하는 휴대형 기기에도 적합하며 가격도 노어(NOR)형에 비해 저렴하다는 장점을 가진다. 최근에는 smart watch, wearable device 등과 같은 차세대 디스플레이 소자에 대한 관심이 증가함에 따라 투명하고 유연한 메모리 소자에 대한 연구가 다양하게 진행되고 있으며 유리나 플라스틱과 같은 기판 위에서 투명한 플래시 메모리를 형성하는 기술에 대한 관심이 높아지고 있다. 전하트랩형 (charge trap type) 플래시 메모리는 플로팅 게이트형 플래시 메모리와는 다르게 정보를 절연막 층에 저장하므로 인접 셀간의 간섭이나 소자의 크기를 줄일 수 있기 때문에 투명하고 유연한 메모리 소자에 적용이 가능한 차세대 플래시 메모리로 기대되고 있다. 전하트랩형 플래시메모리는 정보를 저장하기 위하여 tunneling layer, trap layer, blocking layer의 3층으로 이루어진 게이트 절연막을 가진다. 전하트랩 플래시 메모리는 게이트 전압에 따라서 채널의 전자가 tunnel layer를 통해 trap layer에 주입되어 정보를 기억하게 되는데, trap layer에 주입된 전자가 다시 채널로 빠져나가는 charge loss 현상이 큰 문제점으로 지적된다. 따라서 tunnel layer의 막질향상을 위한 다양한 열처리 방법들이 제시되고 있으며, 기존의 CTA (conventional thermal annealing) 방식은 상대적으로 높은 온도와 긴 열처리 시간을 가지고, RTA (rapid thermal annealing) 방식은 매우 높은 열처리 온도를 필요로 하기 때문에 플라스틱, 유리와 같은 다양한 기판에 적용이 어렵다. 따라서 본 연구에서는 기존의 열처리 방식보다 에너지 전달 효율이 높고, 저온공정 및 열처리 시간을 단축시킬 수 있는 마이크로웨이브 열처리(microwave irradiation, MWI)를 도입하였다. Tunneling layer, trap layer, blocking layer를 가지는 MOS capacitor 구조의 전하트랩형 플래시 메모리를 제작하여 CTA, RTA, MWI 처리를 실시한 다음, 전기적 특성을 평가하였다. 그 결과, 마이크로웨이브 열처리를 실시한 메모리 소자는 CTA 처리한 소자와 거의 동등한 정도의 우수한 전기적인 특성을 나타내는 것을 확인하였다. 따라서, MWI를 이용하면 tunnel layer의 막질을 향상시킬 뿐만 아니라, thermal budget을 크게 줄일 수 있어 차세대 투명하고 유연한 메모리 소자 제작에 큰 기여를 할 것으로 예상한다.

  • PDF

VoIP 네트워크 내의 Fraud와 SIM Box Fraud 검출 방법에 대한 연구 (Study on Fraud and SIM Box Fraud Detection Method in VoIP Networks)

  • 이정원;엄종훈;박태흠;김승호
    • 한국통신학회논문지
    • /
    • 제40권10호
    • /
    • pp.1994-2005
    • /
    • 2015
  • 다양한 기술들이 하나로 융합된 VoIP(Voice over Internet Protocol) 서비스는 IP 망을 통해 음성뿐만 아니라 멀티미디어 서비스와 각종 부가서비스를 제공한다. 현재 대역폭 사용효율과 저비용성 등의 장점들 때문에 기존 PSTN 전화에서 VoIP 시스템으로 비즈니스가 전환되고 있다. 이러한 것이 가능한 이유는 기존의 회선교환 네트워크를 대신하여 디지털화된 정보가 IP 패킷 형태로 여러 계층의 컴퓨터로 구성된 패킷교환망을 통해 전달되기 때문이다. 반면에 이러한 형태의 시스템들이 기존 IP네트워크 환경에서의 취약점과 융합되어 발생되는 신규 취약점 등에 의해서 각종 Fraud가 발생하고 있다. 2012년 상반기 Fraud call의 46%가 VoIP 전화기에서 만들어지고 있다는 조사 결과도 있듯이 Fraud Call의 피해는 상당하다. 따라서 Fraud에 대한 손실예방을 위해 대책마련이 필요하다. 특히, Fraud Call의 피해는 주로 국제 통화를 이용할 때 과금 피해로 나타나고 있어, 이와 관련된 SIM Box에 의한 Toll Bypass Fraud에 대한 분석과 이를 검출할 수 있는 방안마련이 요구된다. 일반적으로는 DPI(Deep Packet Inspection)를 기반으로 주요 Signature 또는 통계정보를 이용한 다양한 검출 방안이 제안되었으나, Fraudster 역시 이를 회피하기 위해 다양한 방법을 사용하고 있다. 특히, VoIP에서 Call Setup과 Termination과정을 수행하는 SIP Signal을 암호화 하거나 여러 경로로 전송하는 방식을 사용함으로써 감지를 회피하고 있다. 본 논문은 Fraud call의 감지 회피를 효과적으로 방지할 수 있도록 VoIP 트래픽의 특성과 VoIP Fraud 중 SIM Box Fraud의 행위분석을 결합한 방법론을 제안한다. 또한 제안된 방법론을 적용하여 Toll Bypass Fraud와 관련된 VoIP 서비스 제공자의 장비를 검출하는 방법을 제시한다.