• Title/Summary/Keyword: 음성다중

Search Result 350, Processing Time 0.027 seconds

Design and Implementation of a Location-Aware Tour Guide System for a Palace (위치-인식 기반 덕수궁 관광 가이드 시스템의 설계 및 구현)

  • Park, Da-Jung;Hwang, Sang-Hee;Kim, Ah-Reum;Chang, Byeong-Mo
    • Journal of Internet Computing and Services
    • /
    • v.9 no.2
    • /
    • pp.131-138
    • /
    • 2008
  • The goal of our research is to develop a smart location-based self guided lour assistant as a context-aware real world application. As a context-aware tourist guide application, we hove been developing a PDA-based location-aware tourist guide application for the old palace Deoksugung in the center of Seoul. It will guide visitors to the palace with information about: current location, attractions nearby, and details about specific buildings. Rich multimedia support has been incorporated into the system to provide extra features to enhance the self-guided tour.

  • PDF

Bidirectional Bus-type WDM-EPON system over Single strand fiber using the same wavelength for each channel for Metro Ethernet (메트로 이더넷용 상하향 동일 파장의 단심 양방향 버스형 WDM-EPON 시스템)

  • 박노욱;전만식;서준혁;김건우;김영필;이종훈;송재원;강승민
    • Proceedings of the Optical Society of Korea Conference
    • /
    • 2003.02a
    • /
    • pp.312-313
    • /
    • 2003
  • 최근 인터넷 트래픽의 증가와 음성, 데이터, 동영상과 같은 다양한 멀티미디어 서비스의 영향으로 가입자망의 고속화가 요구되고 있다. 인터넷 트래픽을 효율적으로 가입자에게 제공하기 위해서는 광을 이용한 통신이 이루어져야 한다. 이를 위하여 다양한 기술들이 제시되고 있으며, 경제적인 측면과 구성의 용이성을 고려한 광 가입자망인 PON(Passive Optical Network)에 대한 관심이 고조되고 있다. 본 논문에서는 파장 분할 다중화 방식으로 단심 상하향 동일파장을 사용하여 소요되는 광섬유의 비용을 반으로 줄이고, 채널당 전송용량을 두 배로 높일 수 있는 매트로 이더넷용 단심 양방향 버스형 WDM-EPON 시스템에 대한 연구를 하고자 한다. (중략)

  • PDF

Development of intelligent IoT control-related AI distributed speech recognition module (지능형 IoT 관제 연계형 AI 분산음성인식 모듈개발)

  • Bae, Gi-Tae;Lee, Hee-Soo;Bae, Su-Bin
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2017.11a
    • /
    • pp.1212-1215
    • /
    • 2017
  • 현재 출시되는 AI스피커들의 기능들을 재현하면서 문제점을 찾아서 보완하고 특히 우리나라 1인 가구의 급격한 증가로 인한 다양한 사회 문제들의 해소 방안으로 표정인식을 통해 먼저 사용자에게 다가가는 감정적인 대화가 가능한 인공지능 서비스와 인터넷 환경에 무관한 홈 IoT 제어 그리고 시각데이터 제공이 가능한 다중 AI 스피커를 제작 하였다.

Korean Multiple Sensibility Analysis Technique of SNS Unstructured Data (SNS 비정형 데이터의 한국어 다중감성 분석 기법)

  • Kim, So-Yeon;Yu, Heonchang
    • Proceedings of The KACE
    • /
    • 2018.08a
    • /
    • pp.147-149
    • /
    • 2018
  • 음성인식, 행동패턴인식, 텍스트마이닝 등 사람의 자연스러운 사회적인 활동을 통해 감성을 분석하려는 연구는 지속적으로 증가하고 있다. 특히 SNS는 현대사회에서 없어서는 안 될 소통의 도구로 자리 잡았기 때문에 SNS의 비정형데이터를 이용한 감성분석은 마케팅 분야에서 중요한 활용도구로 사용되고 있다. 이러한 추세에 따라 한국어에 대한 감성인식 역시 다방면으로 분석, 활용되고 있고 한국어의 어순과 표현방식, 중의성, 방언 등의 몇 가지 특징으로 인해 영어와는 다른 방식으로의 접근방식에 대한 필요성이 많은 연구에서 논의되고 있다. 따라서, 이 연구에서는 이러한 한국어의 특징을 수용하여 분석할 수 있도록 시계열 분석에 유용한 LSTM과 중복단어에 대한 가중치를 적용하여 한국어 감성분석을 진행해보고자 한다.

  • PDF

다중모드 다층 셀 지원 차세대 클라우드 기지국 시스템 연구

  • Park, Sun-Gi;Yu, Byeong-Han;Sin, Yeon-Seung;Gwon, Dong-Seung
    • Information and Communications Magazine
    • /
    • v.31 no.3
    • /
    • pp.85-95
    • /
    • 2014
  • 통신 사업자들은 과거에 통신 사업자 주도의 Walled Garden 형태의 제한적인 컨텐츠 서비스 제공 및 음성 중심의 시대에서 트래픽의 증가에 비례하는 수익의 증가를 경험하였다. 그러나 스마트폰의 보급과 함께 사용자들이 필요한 컨텐츠에 직접 접속하는 개방형 서비스의 수용 및 데이터 중심의 시대로 전환되면서 통신 사업자의 수익은 처리 트래픽의 증가에 비례 하지 않고 정체되어 있고 모바일 데이터 폭증에 따른 망 인프라 투자 및 유지보수 비용을 계속 늘려야 하는 상황에 직면하게 되었다. 본 고에서는 통신 사업자들의 이러한 국면을 타개하기 위한 제도적, 사업적 그리고 기술적인 해결책 중에서 기술적인 측면의 한 분야로 평가되고 있는 클라우드 기지국 전반에 대하여 살펴본다.

Removal of Heterogeneous Candidates Using Positional Accuracy Based on Levenshtein Distance on Isolated n-best Recognition (레벤스타인 거리 기반의 위치 정확도를 이용하여 다중 음성 인식 결과에서 관련성이 적은 후보 제거)

  • Yun, Young-Sun
    • The Journal of the Acoustical Society of Korea
    • /
    • v.30 no.8
    • /
    • pp.428-435
    • /
    • 2011
  • Many isolated word recognition systems may generate irrelevant words for recognition results because they use only acoustic information or small amount of language information. In this paper, I propose word similarity that is used for selecting (or removing) less common words from candidates by applying Levenshtein distance. Word similarity is obtained by using positional accuracy that reflects the frequency information along to character's alignment information. This paper also discusses various improving techniques of selection of disparate words. The methods include different loss values, phone accuracy based on confusion information, weights of candidates by ranking order and partial comparisons. Through experiments, I found that the proposed methods are effective for removing heterogeneous words without loss of performance.

Learning/Training System Supporting Real Time Video Chatting on Web-based 3D Virtual Space (웹 기반 3차원 가상 공간에서 실시간 화상 대화 지원 학습/훈련 시스템)

  • 정헌만;탁진현;이세훈;왕창종
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2000.10b
    • /
    • pp.571-573
    • /
    • 2000
  • 기존 분산 가상환경 시스템에서는 참여자들 사이의 언어 외적인 의사교환을 지원하기 위해 참여자의 아바타에 몸짓이나 얼굴 표정 등을 표현할 수 있도록 애니메이션 가능한 아바타를 사용한다. 하지만 아바타 애니메이션으로 참여자의 의사 및 감정 표현을 표현하는데는 한계가 있다. 따라서, 이 논문에서는 가상 환경 내의 다중 사용자들의 의사 교환 및 감정 표현을 극대화할 수 있는 방법으로 실시간 화상 대화 가상 환경 학습.훈련 시스템을 설계하였다. 설계한 시스템은 학습 참여자의 화상 및 음성 스트림을 전달함으로써 기존 응용들에 비해 풍부한 의사 교환을 지원하고, 가상 공간에서 학습에 필요한 다양한 모듈들을 포함하고 있다.

  • PDF

The Flexible Proactive Password Checking Methods using Neural Network (신경 망을 이용한 유연한 프로액티브 패스워드 체킹 방법)

  • 박신혜;김원일;김동규
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2003.04a
    • /
    • pp.356-358
    • /
    • 2003
  • 다중 사용자 환경에서 컴퓨터 시스템 보안을 위한 사용자 인증(user authentication)은 패스워드 (password), 토큰(token), 스마트 카드(smart card), 지문(fingerprint), 음성(voiceprint) 등 다양한 정보들을 통하여 시스템에 접근하는 사용자의 신원을 확인하고, 인증되지 않은 사용자의 접근을 제한한다. 이들 중 가장 보편적으로 사용되는 패스워드 기반 사용자 인증은 구현이 쉽고, 관리 비용이 적게 든다는 장점이 있다. 패스워드 기반 사용자 인증에서 패스워드의 선택은 시스템의 보안을 위하여 매우 중요하다. 따라서 시스템 관리 차원에서 사용자의 패스워드를 검사할 필요가 있다. 본 논문에서는 패스워드를 추측하기 쉬운 패스워드와 추측하기 어려운 패스워드로 분류하는 근거가 되는 여러 가지 패스워드들에 대한 특징들 중, 패스워드에 대한 언어적인 정보를 구별할 수 있는 특징을 제안한다. 또한 이를 신경망(neural network)을 사용하여 구현함으로써 보안 시스템의 특성에 따라 패스워드의 적합성 여부를 유연하게 조정할 수 있는 프로액티브 패스워드 체킹 방법을 제안한다.

  • PDF

Performance Analysis of a Packet Voice Multiplexer Using the Overload Control Strategy by Bit Dropping (Bit-dropping에 의한 Overload Control 방식을 채용한 Packet Voice Multiplexer의 성능 분석에 관한 연구)

  • 우준석;은종관
    • The Journal of Korean Institute of Communications and Information Sciences
    • /
    • v.18 no.1
    • /
    • pp.110-122
    • /
    • 1993
  • When voice is transmitted through packet switching network, there needs a overload control, that is, a control for the congestion which lasts short periods and occurrs in local extents. In this thesis, we analyzed the performance of the statistical packet voice multiplexer using the overload control strategy by bit dropping. We assume that the voice is coded accordng to (4,2) embedded ADPCM and that the voice packet is generated and transmitted according to the procedures in the CCITT recomendation G. 764. For the performance analysis, we must model the superposed packet arrival process to the multiplexer as exactly as possible. It is well known that interarrival times of the packets are highly correlated and for this reason MMPP is more suited for the modelling in the viewpoint of accuracy. Hence the packet arrival process in modeled as MMPP and the matrix geometric method is used for the performance analysis. Performance analysis is similar to the MMPP IG II queueing system. But the overload control makes the service time distribution G dependent on system status or queue length in the multiplexer. Through the performance analysis we derived the probability generating function for the queue length and using this we derived the mean and standard deviation of the queue length and waiting time. The numerical results are verified through the simulation and the results show that the values embedded in the departure times and that in the arbitrary times are almost the same. Results also show bit dropping reduces the mean and the variation of the queue length and those of the waiting time.

  • PDF

Cell Coverage Based on Calculation of the Voice-Data Erlang Capacity in a WCDMA Reverse Link with Multi-rate Traffic (WCDMA 역방향 링크에서 다중속도 트래픽에 따른 음성/데이터 얼랑용량 계산과 셀 커버리지)

  • Kwon, Young-Soo;Han, Tae-Young;Kim, Nam
    • The Journal of Korean Institute of Electromagnetic Engineering and Science
    • /
    • v.15 no.4
    • /
    • pp.387-396
    • /
    • 2004
  • A scheme to evaluate the number of users and cell coverage of a WCDMA supporting multi-rate traffic is newly presented through calculation of the realizable Erlang capacity from a derived blocking probability and the path loss from the COST231 Walfisch-Ikegami(W) model. We evaluate the voice-data Erlang capacities at various data rates of 15 kbps to 960 kbps and it is shown that they have a linear relationship to each other. When the E$\_$b//N$\_$o/ is low from 4 ㏈ to 3 ㏈ in case of voice capacity of 50 Erlang at 8 kbps, the result shows the increase for the data capacity of 10 Erlang and the enlargement of 100 m for the cell coverage at low rate of 15 kbps, and the increase of 0.11 Erlang and the enlargement of 40 m at high rate of 960 kbps. The increase of the blocking probability results in the increase of the Erlang capacity, but not an effect on the cell coverage, and the increase of active users in a cell results in the decrease of the coverage.