• 제목/요약/키워드: 언어 융합

검색결과 551건 처리시간 0.023초

RSS와 VoiceXML을 이용한 실시간 뉴스 서비스의 구현 (An Implementation of Realtime News Service Using RSS and VoiceXML)

  • 권형준;김동규;홍광석
    • 융합신호처리학회 학술대회논문집
    • /
    • 한국신호처리시스템학회 2006년도 하계 학술대회 논문집
    • /
    • pp.9-12
    • /
    • 2006
  • 높은 컴퓨터 보급률에 따른 인터넷의 대중화로 인하여 새로운 소식을 원하는 사람들은 기존의 정해진 시각에 전달되는 지면 신문보다 인터넷을 통해 새로운 소식을 접하는 경향이 높아지면서, 국내의 각 언론사들은 RSS(RDF Site Summary)문서를 제공하기 시작하였다. 차세대 웹인 시맨틱 웹의 여러 가지 규격 및 기술 중에서도 그 유용함과 편리성을 인정받아 우리 생활에 가장 먼저 적용되고 있는 RSS는 컨텐츠 배급을 위해 나온 XML형태의 규격 중 하나로서 웹사이트에서 사용자가 원하는 정보의 갱신된 내용을 신속하게 사용자에게 전달하는 자동 정보 수집 기술이다. 본 논문에서는 특정 언론사에서 제공하는 RSS문서에 음성인식 및 합성기술을 기반으로 동작하는 다른 XML형태의 규격인 음성 확장성 생성 언어(VoiceXML)를 접목하여 휴대전화 및 유선전화로 새로운 뉴스를 접할 수 있는 서비스를 제안하고 구현하였다. 실험 결과, 시간과 장소에 구애받지 않고 신뢰성 있는 언론사의 새로운 뉴스를 실시간으로 전달받을 수 있음을 확인하였다.

  • PDF

SystemC를 이용한 JPEG 인코더/디코더의 구현 (Implementation of JPEG Encoder and Decoder with SystemC)

  • 유명근;송기용
    • 융합신호처리학회 학술대회논문집
    • /
    • 한국신호처리시스템학회 2006년도 하계 학술대회 논문집
    • /
    • pp.89-92
    • /
    • 2006
  • 본 논문에서는 SystemC를 이용하여 데이터를 압축하는 JPEG의 인코더와 디코더 구현에 대하여 기술한다. SystemC는 SoC의 설계생산성을 높이기 위해 high-level abstraction에 기반하여 시스템을 모델링하고 명시하는 시스템 수준 설계 언어이고, JPEG은 DCT와 Huffman 코드를 이용하여 정지영상 정보를 압축하는 알고리즘이다. 설계된 JPEG 인코더와 디코더 모듈의 동작을 검증하기 위하여 인코더 모듈에 $16{\times}16$ 크기의 픽셀 RGB 데이터를 입력하고, 디코더 모듈에 인코더 모듈의 출력을 입력으로 연결하여 최종 출력되는 데이터를 비교 및 분석하여 확인하였다.

  • PDF

화력발전 설비의 사운드 모니터링 시스템 (Sound Detection System of Machines in Thermal Power Plant.)

  • 이성상;정의필;손창호
    • 융합신호처리학회 학술대회논문집
    • /
    • 한국신호처리시스템학회 2003년도 하계학술대회 논문집
    • /
    • pp.157-160
    • /
    • 2003
  • 발전소에서 운전중인 기계들의 안전운전과 예지 보전을 위하여 발전설비의 고장 감지 및 진단과 상태 모니터링은 중대한 역할을 담당하고 있다. 이 연구에서는 설비의 안전하고 신뢰적인 운전을 위한 기계의 작동상태를 사운드 정보로 획득하고 분석하는 시스템을 제안하였다. 사운드 정보의 사용은 적은 양의 채널의 사용으로 많은 기계 및 설비의 이상 유무의 판별을 가능케 하며, 이를 획득하기 위하여 3개의 마이크로폰, 다채널 A/D변환기, 다채널 I/O Sound Card(Soundtrack DSP24) 및 PC로 시스템을 구성하였다. 소프트웨어 개발언어로서 Microsoft Visual C++ 및 MATLAB을 이용하였다. 화력 발전소에 운전중인 주요기계들의 사운드 정보를 취득하여 취득한 기계별 사운드 정보를 이용하여 주파수 특성을 파악하고, 이를 이용하여 기기의 운전 상태진단을 가능하게 한다.

  • PDF

VHDL을 이용한 대역확산 시스템 기반의 FEC 디코더 설계 (The FEC decoder design of the spread spectrum basis which utilizes the VHDL)

  • 이재성;정운용;강병권;김선형
    • 융합신호처리학회 학술대회논문집
    • /
    • 한국신호처리시스템학회 2003년도 하계학술대회 논문집
    • /
    • pp.300-303
    • /
    • 2003
  • 본 논문에서는 VHDL 언어를 이용하여 대역확산 시스템의 기저대역부를 FPGA를 이용하여 설계하였다. 신호 전송시 필요로 하는 대역폭보다 훨씬 넓은 대역폭으로 확산하여 전송함으로써 간섭에 영향이 적고, 비화성이 우수한 대역확산 방식을 기반으로 하여, 길쌈부호기와 PN코드를 이용해 전송대역을 확산하였고, 에러정정을 위한 비터비 디코더를 설계하였다. VHDL 설계는 Xilinx사의 FPGA 디자인 툴인 Xilinx Foundations.1을 사용하였으며, FPGA configuration을 위한 타이밍 시뮬레이션을 수행하였다.

  • PDF

음성인식 끝말 이어가기 게임의 구현 (An Implementation of Word Relay Game using Speech Recognition)

  • 김동환;윤재선;홍광석
    • 융합신호처리학회 학술대회논문집
    • /
    • 한국신호처리시스템학회 2000년도 추계종합학술대회논문집
    • /
    • pp.177-180
    • /
    • 2000
  • 최근에 음성인식의 상용화가 급격히 추진되고 있다. 그러나 음성인식 응용제품의 부족과 음성인식 시스템의 성능문제로 인하여 일반인의 이용은 그다지 많지 않다. 본 논문에서는 연구실에서 만든 가변 어휘 음성인식기를 이용하여 음성인식 끝말 이어가기 게임을 구현하였다. 가변어휘 음성 인식기는 VCCV(Vowel+consonant+Consonant+vowel) 기반의 화자독립으로 구현하였다. 끝말 이어가기 게임을 위해서 약 500만 어절이 포함된 문장에서 추출한 단어의 일부를 이용하여 사전을 구축하였고, 같은 음절로 시작하는 단어가 많은 경우에는 그 수를 제안하였다. 본 연구에서 구현한 음성인식 끝말 이어가기 게임은 제한된 단어사전을 이용하도록 하였으나 음성인식기의 성능향상과 완전한 사전구축이 이루어지면 음성인식을 이용한 언어 학습기나 게임 등의 개발과 이용의 활성화에 크게 기여할 것이라 생각된다.

  • PDF

기계 번역기의 언어별 외래어 인식 정확도 비교 연구 (A Comparative Study on the Machine Translation Accuracy of Loanword by Language)

  • 김규석
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2021년도 춘계학술발표대회
    • /
    • pp.319-322
    • /
    • 2021
  • 4차 산업혁명 시대에는 빠른 무선 네트워크와 빅데이터를 기반으로 다양한 기술과 서비스들이 생겨나고 있다. 이런 환경 속에서 우리는 언제 어디서나 스마트폰을 통해 음악을 듣고, 게임을 하며, 웹서핑을 하는 등 PC에 버금가는 다양한 활동을 할 수 있다. 누구든 쉽게 전세계의 웹페이지에 접속하고 SNS를 통해 외국인 친구들과도 쉽게 연락을 할 수 있다. 기계 번역 기술 또한 이렇게 사용자가 늘어나는 만큼 빅데이터를 기반으로 그 정확도가 향상되고 있다. 그러나 일반 명사나 구문과는 다르게 은어, 외래어 등의 사용빈도가 상대적으로 낮은 단어들에 대한 기계 번역 정확도는 여전히 개선이 필요하다. 본 연구에서는 국내에서 가장 많이 사용되는 기계 번역기인 papago 번역기와 Google 번역기의 외래어 인식 정확도에 대한 비교 연구를 진행하였다. 추후, 본 연구 결과를 통해 앞으로의 새로운 연구 방향을 제시한다.

딥러닝 기반 특허의 종속 청구항 인식 개선 (Improving Recognition of Patent's Claims with Deep Neural Networks)

  • 박주연;신예지;김민수;김동호;김지희
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2020년도 춘계학술발표대회
    • /
    • pp.500-503
    • /
    • 2020
  • 특허를 통해 기술의 권리를 정의하고 보호하는 일이 매우 중요해짐에 따라 특허 문서를 분석하는 연구 또한 중요해지고 있다. 특히 특허의 청구항을 종속항과 독립항을 구분하고, 관련된 인용을 찾아내는 일은 관련 특허들을 분석하는데 매우 중요하다. 본 연구는 최근 텍스트 분석 분야에 획기적 성능 개선을 이끈 BERT(Bidirectional Encoder Representations From Transformers) 언어 모델을 사용하고 Neural Network 의 파인 튜닝 과정을 통해 청구항의 독립과 종속을 구분하였고, 인용하는 항의 번호와 인용 문구로 이루어진 인용 패턴을 통해 종속항의 인용 항을 찾아내었다. 이 방법을 2003 년 이후의 xml 형식의 미국 특허 데이터에 사용한 결과, 정확도 99% 의 성능을 확보하였다.

추상적 텍스트 요약 기반의 메소드 이름 제안 모델 (A Method Name Suggestion Model based on Abstractive Text Summarization)

  • 주한새
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2022년도 제66차 하계학술대회논문집 30권2호
    • /
    • pp.137-138
    • /
    • 2022
  • 소스 코드 식별자의 이름을 잘 정하는 것은 소프트웨어 엔지니어링에서 중요한 문제로 다루어지고 있다. 프로그램 엔티티의 의미있고 간결한 이름은 코드 이해도에 중요한 역할을 하며, 소프트웨어 유지보수 관리 비용을 줄이는 데에 큰 효과가 있다. 이러한 코드 식별자 중 평균적으로 가장 복잡한 식별자는 '메소드 이름'으로 알려져 있다. 본 논문에서는 메소드 내용과 일관성 있는 적절한 메소드 이름 생성을 자연어 처리 태스크 중 하나인 '추상적 텍스트 요약'으로 치환하여 수행하는 트랜스포머 기반의 인코더-디코더 모델을 제안한다. 제안하는 모델은 Github 오픈소스를 크롤링한 Java 데이터셋에서 기존 최신 메소드 이름 생성 모델보다 약 50% 이상의 성능향상을 보였다. 이를 통해 적절한 메소드 작명에 필요한 비용 절감 달성 및 다양한 소스 코드 관련 태스크를 언어 모델의 성능을 활용하여 해결하는 데 도움이 될 것으로 기대된다.

  • PDF

로그 이상 탐지를 위한 도메인별 사전 훈련 언어 모델 중요성 연구 (On the Significance of Domain-Specific Pretrained Language Models for Log Anomaly Detection)

  • 레리사 아데바 질차;김득훈;곽진
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2024년도 춘계학술발표대회
    • /
    • pp.337-340
    • /
    • 2024
  • Pretrained language models (PLMs) are extensively utilized to enhance the performance of log anomaly detection systems. Their effectiveness lies in their capacity to extract valuable semantic information from logs, thereby strengthening the detection performance. Nonetheless, challenges arise due to discrepancies in the distribution of log messages, hindering the development of robust and generalizable detection systems. This study investigates the structural and distributional variation across various log message datasets, underscoring the crucial role of domain-specific PLMs in overcoming the said challenge and devising robust and generalizable solutions.

음성인식을 위한 의사(疑似) N-gram 언어모델에 관한 연구 (A Study on Pseudo N-gram Language Models for Speech Recognition)

  • 오세진;황철준;김범국;정호열;정현열
    • 융합신호처리학회논문지
    • /
    • 제2권3호
    • /
    • pp.16-23
    • /
    • 2001
  • 본 논문에서는 대어휘 음성인식에서 널리 사용되고 있는 N-gram 언어모델을 중규모 어휘의 음성인식에서도 사용할 수 있는 의사(疑似) N-gram 언어모델을 제안한다. 제안방법은 ARPA 표준형식 N-gram 언어모델의 구조를 가지면서 각 단어의 확률을 임의로 부여하는 비교적 간단한 방법으로 1-gram은 모든 단어의 출현확률을 1로 설정하고, 2-gram은 허용할 수 있는 단어시작기호 와 WORD 및 WORD와 단어종료기호 의 접속확률만을 1로 설정하며, 3-gram은 단어 시작기호 와 WORD, 단어종료기호 만의 접속을 허용하며 접속확률을 1로 설정한다. 제안방법의 유효성을 확인하기 위해 사전실험으로서 국어공학센터(KLE) 단어음성에 대해 오프라인으로 평가한 견과, 남성 3인의 452 단어에 대해 평균 97.7%의 단어인식률을 구하였다. 또한 사전실험결과를 바탕으로 1,500단어의 중규모 어휘의 증권명을 대상으로 온라인 인식실험을 수행한 결과, 남성 20명이 발성한 20단어에 대해 평균 92.5%의 단어인식률을 얻어 제안방법의 유효성을 확인하였다.

  • PDF