• 제목/요약/키워드: Voice Web Page

검색결과 10건 처리시간 0.027초

SALT 기반 음성 웹 페이지의 자동 생성 (Automatic Generation of Voice Web Pages Based on SALT)

  • 고유정;김윤중
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제37권3호
    • /
    • pp.177-184
    • /
    • 2010
  • 음성 브라우저가 등장함에 따라, 음성 대화 어플리케이션이 웹 환경에서 사용이 가능하게 되었다. 음성 대화 어플리케이션은 음성 웹 페이지로 구성되어 있다. 음성 웹 페이지의 대화 스크립트는 SALT(Speech Application Language Tags) 언어 등으로 기술되어야 한다. 기존 웹 페이지들은 음성 대화를 고려하지 않고 시각용(visual)용으로 제작되었지만, 이들 웹 페이지에도 음성 대화를 이용하여 처리할 수 있는 요소들이 있다. 따라서 본 논문에서는 시각용으로 제작된 HTML 웹 페이지로부터 대화처리가 가능한 요소들을 추출하고 해당대화를 SALT로 생성해내는 음성 웹 페이지의 자동 생성방법을 제안하였다. 제안한 음성 웹 페이지의 자동 생성기는 어휘 분석기와 구문 분석기로 구성된 번역기로, HTML로 기술된 웹 페이지를 HTML+SALT로 기술된 음성 웹 페이지로 변환한다. 변환된 음성 웹 페이지는 기존의 마우스, 키보드롤 이용한 처리도 가능하고 음성 대화 처리도 가능하도록 설계되었다.

음성인식 시스템에서의 Voice Web Browsing에 관한 연구 (A Study on Voice Web Browsing in Automatic Speech Recognition Application System)

  • 윤재석
    • 한국정보통신학회논문지
    • /
    • 제7권5호
    • /
    • pp.949-954
    • /
    • 2003
  • 본 연구에서는 지금까지의 GUI 중심의 웹 어플리케이션을 VUI 중심의 웹 어플리케이션으로 구현하기 위한 음성 인식 항공 정보 시스템을 설계 구현하였다. 이러한 ASP(Active Solver Page)로써 구현한 윈도우 서버 기반에서 운용되는 시스템에 관한 Web 관련 ASR(Automatic Speech Recognition)연구가 최근 상당한 연구가 이루어지고 있지만 ASP의 웹과의 제한성으로 인해 시스템의 속도면, 이식성 등에서 제약을 가져왔다. 이와 같은 제약성을 해결하기 위해 본 연구에서는 음성 정보 및 동적 VoiceXML을 구현하는 자바 빈즈(JAVA Beans) 컴포넌트 구조에 대해서 연구하였다. 또한 본 연구에서는 Remote An(Abstract Windows Toolkit)기술을 이용하여 GUI 및 VUI 에서의 음성 및 그래픽 정보를 동시에 전달 가능하게 하는 Voice 웹 브라우징의 가능성을 확인하였다.

JAVABeans Component 구조를 갖는 음성인식 시스템에서의 Voice Web Browsing에 관한 연구 (A Study on Voice Web Browsing in JAVA Beans Component Architecture Automatic Speech Recognition Application System.)

  • 장준식;윤재석
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2003년도 춘계종합학술대회
    • /
    • pp.273-276
    • /
    • 2003
  • 본 연구에서는 지금까지의 GUI 중심의 웹 어플리케이션을 VUI 중심의 웹 어플리케이션으로 구현하기 위한 음성 인식 항공 정보 시스템을 설계 구현하였다 기존의 ASP(Active Server Page)로써 구현한 윈도우 서버 기반에서 운용되는 시스템에 관한 Web 관련 ASR(Automatic Speech Recognition) 연구가 최근 상당한 연구가 이루어지고 있지만 ASP의 웹과의 제한성으로 인해 시스템의 속도면, 이식성 등에서 제약을 가져왔다. 이와 같은 제약성을 해결하기 위해 본 연구에서는 음성 정보 및 동적 VoiceXML을 구현하는 자바 빈즈(JAVA Beans) 컴포넌트 구조에 대해서 연구해 보았다. 또한 본 연구에서는 Remote An(Abstract Windows Toolkit)기술을 이용하여 GUI 및 VUI에서의 음성 및 그래픽 정보를 동시에 전달 가능하게 하는 Voice 웹 브라우징에 대해서 연구하여 보았다.

  • PDF

시각장애을 위한 인터넷 웹 브라우저 개발 (The Development of the Internet Web Browser for the Blind)

  • 박찬용;장병태김동현
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 1998년도 추계종합학술대회 논문집
    • /
    • pp.829-832
    • /
    • 1998
  • 본 연구에서 시각 장애인을 위한 인터넷 웹 브라우저를 개발하였다. 인터넷 웹 브라우저 시스템은 인터넷에 연결된 컴퓨터와 문자 출력을 위한 점자 출력기와 음성 합성기, 그림 이미지의 출력을 위한 촉감 출력기, 인터넷 웹 페이지를 출력하기 위한 점자 프린터로 구성된다. 인터넷의 문자 정보는 점자로 변환하여 점자 출력기로 출력하였고, 전자석(solenoid) 방식의 구동기로 동작하는 촉감장치로 인터넷의 그림 정보를 출력하였다. 본 시스템을 이용하여 시각 장애인은 인터넷 웹 사이트 정보를 접근할 수있다.

  • PDF

시각장애인을 위한 웹 인터페이스에 관한 연구 (A study on Web interface for the Blind.)

  • 최태종;장병태;김현규;김정국;허웅
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 1999년도 하계종합학술대회 논문집
    • /
    • pp.559-562
    • /
    • 1999
  • In this paper, we developed on internet based assembly information display system for the blind. The system is consist of hardware and software. The hardware is consist of a voice synthesis device and a tactile display for character information, and the software is consist of internet web browser for the blind and braille program. The tactile-device system consists of a control unit, pin array, pin generator, serial port, and a power supply. The pin exerted by a electromagnetic method, solenoid. The internet web browser separates the character and image from internet web page, and character information in the web page is converted to braille and fed to sound system. Also the image in the web page can be printed developed tactile display. As the results of experiment, the blind could access the internet web site by using this system and understand various internet information.

  • PDF

스마트폰의 음성 검색에서 퍼지 쿼리 처리를 위한 프로토타입 모델 (A Prototype Model for Handling Fuzzy Query in Voice Search on Smartphones)

  • 최대영
    • 정보처리학회논문지D
    • /
    • 제18D권4호
    • /
    • pp.309-312
    • /
    • 2011
  • 스마트폰의 음성 검색에서 퍼지 쿼리를 처리하는 것은 가장 어려운 문제 중의 하나이다. 이는 자연어에 내재된 자유도와 복잡성에 주로 기인한다. 스마트폰의 음성 검색에서 퍼지 쿼리의 자유도와 복잡성을 줄이기 위해 속성값에 기반을 둔 방법이 제안된다. 또한, 퍼지 쿼리 처리를 위한 속성값에 기반을 둔 새로운 페이지 등급 알고리즘이 제안된다. 이는 사용자의 검색 의도에 기반을 둔 위치기반의 개인화된 페이지 등급을 스마트폰 사용자에게 제공할 수 있다. 제안된 방법은 스마트폰 사용자를 위한 위치기반의 개인화된 웹 검색의 진일보한 방법이라고 할 수 있다. 본 논문에서는 스마트폰의 음성 검색에서 퍼지 쿼리 처리를 위한 프로토타입 모델을 설계하고, 기존 스마트폰과 비교하여 제안된 방법의 성능 실험 결과를 제시한다.

모바일 음성 웹 페이지의 자동 생성 시스템에 관한 연구 (A Study On the Automatic Generation System of Mobile Voice Web Page)

  • 고유정;김윤중
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2008년도 추계학술발표대회
    • /
    • pp.153-156
    • /
    • 2008
  • 모바일 기기는 화면의 크기가 작아 스타일러스나 펜으로 웹 컨텐츠를 이용하기에는 불편함이 있다. 이에 따라 음성으로 웹의 컨텐츠를 개발하기 위한 포준 언어인 VoiceXML(Voice Extenxible Markup Language), SALT(Speech application Language Tags)가 빠르게 보급되고 있다. 이를 이용하기 위해서는 기존의 모바일 웹페이지를 음성 웹 표준 기술에 맞게 변환해줘야 한다. 따라서 본 논문에서는 WML(Wireless Markup Language)로 구성된 모바일 웹 페이지를 SALT 음성기술을 이용하여 음성명령이 가능한 모바일 음성 웹페이지(WML + SALT)로 자동 생성하는 시스템을 구현 하고자 한다. 이에 따라 사용자는 음성명령을 통해 컨텐츠를 제어함으로써 편리함을 제공하고, 개발자는 자동 생성 시스템을 이용함으로써 기존의 모바일 웹 페이지를 음성 웹 페이지를 변환하기 위한 개발시간과 비용을 감소 할 수 있다.

Strength in Numbers and Voice: An Assessment of the Networking Capacity of Chinese ENGOs

  • Shapiro, Matthew A.;Brunner, Elizabeth;Li, Hui
    • Journal of Contemporary Eastern Asia
    • /
    • 제17권2호
    • /
    • pp.147-175
    • /
    • 2018
  • Under authoritarian regimes, citizen-led NGOs such as environmental NGOs (ENGOs) often operate under close scrutiny of the government. While this presents a challenge to a single ENGO, we propose here - in line with existing research on network effects - that there are opportunities for multiple ENGOs to coordinate and thus work in ways that supersede government controls, affect public opinion, and contribute to policy revision and/or creation. In this paper, we specifically examine the possibility that the gamut of citizen-based ENGOs in China are coordinating. Based on network analysis of ENGOs web pages as well as interviews with more than a dozen ENGO leaders between 2014 and 2016, we find that ENGOs have few direct and public connections to each other, but social media sites and personal connections offline provide a crucial function in creating bridges. A closer examination of these bridges reveals, however, that they can be substantive to the environmental discussion or functional to the dissemination of web page information but typically not both. In short, ENGOs in China are not directly connected but rather are connected in a way that responds to the available social media and the government's censorship practices.

음성패턴인식 인터랙티브 콘텐츠 개발 (Interactive content development of voice pattern recognition)

  • 나종원
    • 한국항행학회논문지
    • /
    • 제16권5호
    • /
    • pp.864-870
    • /
    • 2012
  • 언어 학습 콘텐츠에서 공통적으로 가질 수 있는 문제점들을 분석하고 문제점에 대하여 음성 패턴인식기술을 적용하여 기존의 문제점을 해결하였다. 언어 학습 콘텐츠의 첫 번째 문제점은 온라인 학습 자세이다. 수업 진행은 되었지만 다른 웹 페이지를 열어 게임을 하는 등 학생들의 집중력은 떨어졌다. 두 번 째 문제점은 Speaking 학습 과정을 만들었지만 실제로 따라 읽는지 판단할 수가 없었다. 세 번 째 문제점은 학습 관리 시스템에 의한 기계적 진행이 아니라 선생님들의 평가에 의해 잘하는 학생들과 못하는 학생간의 학습 진행에 차이를 둘 필요가 생겼다. 마지막으로 가장 큰 문제는 기존에 만들어 놓은 콘텐츠들은 그대로 유지되면서 위의 문제들을 해결할 수 있어야 했다. 이러한 배경 하에 음성 패턴인식기술은 말하기 학습 전용 학습 프로그램으로 학습 진행을 위한 음성인식은 물론 학습 자체를 위한 음성인식 기능들을 모두 가지고 있으며 인식 절차에 사용된 학습자의 발화 데이터를 원하는 형태의 오디오 파일로 변경하여 서버의 특정 위치로 전송하거나 SQL서버에 등록할 수도 있으며, 또한 컴포넌트이기 때문에 그 어떠한 시스템이나 프로그램이라도 모두 적용 가능하고 이미 만들어진 콘텐츠 전체를 손상시키지 않고 쉽게 삽입하여 새로운 기능들을 사용할 수 있었다. 본 논문으로 교육 방식을 보다 인터렉티브하게 바꾸어 적극적인 수업참여가 되도록 기여하였다.

폭소노미 사이트를 위한 랭킹 프레임워크 설계: 시맨틱 그래프기반 접근 (A Folksonomy Ranking Framework: A Semantic Graph-based Approach)

  • 박현정;노상규
    • Asia pacific journal of information systems
    • /
    • 제21권2호
    • /
    • pp.89-116
    • /
    • 2011
  • In collaborative tagging systems such as Delicious.com and Flickr.com, users assign keywords or tags to their uploaded resources, such as bookmarks and pictures, for their future use or sharing purposes. The collection of resources and tags generated by a user is called a personomy, and the collection of all personomies constitutes the folksonomy. The most significant need of the folksonomy users Is to efficiently find useful resources or experts on specific topics. An excellent ranking algorithm would assign higher ranking to more useful resources or experts. What resources are considered useful In a folksonomic system? Does a standard superior to frequency or freshness exist? The resource recommended by more users with mere expertise should be worthy of attention. This ranking paradigm can be implemented through a graph-based ranking algorithm. Two well-known representatives of such a paradigm are Page Rank by Google and HITS(Hypertext Induced Topic Selection) by Kleinberg. Both Page Rank and HITS assign a higher evaluation score to pages linked to more higher-scored pages. HITS differs from PageRank in that it utilizes two kinds of scores: authority and hub scores. The ranking objects of these pages are limited to Web pages, whereas the ranking objects of a folksonomic system are somewhat heterogeneous(i.e., users, resources, and tags). Therefore, uniform application of the voting notion of PageRank and HITS based on the links to a folksonomy would be unreasonable, In a folksonomic system, each link corresponding to a property can have an opposite direction, depending on whether the property is an active or a passive voice. The current research stems from the Idea that a graph-based ranking algorithm could be applied to the folksonomic system using the concept of mutual Interactions between entitles, rather than the voting notion of PageRank or HITS. The concept of mutual interactions, proposed for ranking the Semantic Web resources, enables the calculation of importance scores of various resources unaffected by link directions. The weights of a property representing the mutual interaction between classes are assigned depending on the relative significance of the property to the resource importance of each class. This class-oriented approach is based on the fact that, in the Semantic Web, there are many heterogeneous classes; thus, applying a different appraisal standard for each class is more reasonable. This is similar to the evaluation method of humans, where different items are assigned specific weights, which are then summed up to determine the weighted average. We can check for missing properties more easily with this approach than with other predicate-oriented approaches. A user of a tagging system usually assigns more than one tags to the same resource, and there can be more than one tags with the same subjectivity and objectivity. In the case that many users assign similar tags to the same resource, grading the users differently depending on the assignment order becomes necessary. This idea comes from the studies in psychology wherein expertise involves the ability to select the most relevant information for achieving a goal. An expert should be someone who not only has a large collection of documents annotated with a particular tag, but also tends to add documents of high quality to his/her collections. Such documents are identified by the number, as well as the expertise, of users who have the same documents in their collections. In other words, there is a relationship of mutual reinforcement between the expertise of a user and the quality of a document. In addition, there is a need to rank entities related more closely to a certain entity. Considering the property of social media that ensures the popularity of a topic is temporary, recent data should have more weight than old data. We propose a comprehensive folksonomy ranking framework in which all these considerations are dealt with and that can be easily customized to each folksonomy site for ranking purposes. To examine the validity of our ranking algorithm and show the mechanism of adjusting property, time, and expertise weights, we first use a dataset designed for analyzing the effect of each ranking factor independently. We then show the ranking results of a real folksonomy site, with the ranking factors combined. Because the ground truth of a given dataset is not known when it comes to ranking, we inject simulated data whose ranking results can be predicted into the real dataset and compare the ranking results of our algorithm with that of a previous HITS-based algorithm. Our semantic ranking algorithm based on the concept of mutual interaction seems to be preferable to the HITS-based algorithm as a flexible folksonomy ranking framework. Some concrete points of difference are as follows. First, with the time concept applied to the property weights, our algorithm shows superior performance in lowering the scores of older data and raising the scores of newer data. Second, applying the time concept to the expertise weights, as well as to the property weights, our algorithm controls the conflicting influence of expertise weights and enhances overall consistency of time-valued ranking. The expertise weights of the previous study can act as an obstacle to the time-valued ranking because the number of followers increases as time goes on. Third, many new properties and classes can be included in our framework. The previous HITS-based algorithm, based on the voting notion, loses ground in the situation where the domain consists of more than two classes, or where other important properties, such as "sent through twitter" or "registered as a friend," are added to the domain. Forth, there is a big difference in the calculation time and memory use between the two kinds of algorithms. While the matrix multiplication of two matrices, has to be executed twice for the previous HITS-based algorithm, this is unnecessary with our algorithm. In our ranking framework, various folksonomy ranking policies can be expressed with the ranking factors combined and our approach can work, even if the folksonomy site is not implemented with Semantic Web languages. Above all, the time weight proposed in this paper will be applicable to various domains, including social media, where time value is considered important.