• Title/Summary/Keyword: 단위화

Search Result 2,956, Processing Time 0.135 seconds

Phoneme-level Embedding based Korean Language Model (음소 단위 임베딩 기반 한국어 모델)

  • Choi, Woosung;Hyun, Kyungseok;Chung, Jaehwa;Jung, Soon Young
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2019.10a
    • /
    • pp.1026-1029
    • /
    • 2019
  • 최근 제안되고 있는 Bert 등의 딥러닝 언어 모델 기반 pre-training 기법은 다양한 NLP 분야에서 활용되고 있다. 텍스트로 작성된 데이터 셋을 딥러닝 언어 모델이 학습하기 위해서는 토크나이징(tokenizing) 기술이 필요하다. 그러나 기존 토크나이징 방식은 한국어 및 한글이 가지는 고유한 특성(교착어적 특성과 모아쓰기 반영)을 반영하기 어렵다는 한계를 가지고 있다. 본 논문에서는 한국어와 한글이 가지는 고유한 특성을 고려하기 위하여 음소 단위의 임베딩 기법을 제안하며, 이를 기반으로 언어 모델을 설계 및 구현한다. 또한 음소 단위 임베딩 기반 한국어 모델이 실제 데이터 집합(구약성서)에서 나타나는 언어적 패턴을 학습할 수 있다는 것을 실험을 통하여 밝힌다.

RDF 메타 데이터를 이용한 인덱스 기반의 XML/SGML 문서 검색 방법에 관한 연구

  • 오동현;김규태;정회경;이수연
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 1999.10a
    • /
    • pp.42-44
    • /
    • 1999
  • 인터넷이 급속히 성장함에 따라 대량의 SGML/XML 문서를 보다 효과적으로 다룰 필요성이 증대하고 있다. SGML/XML 문서를 데이터베이스에 저장하는 경우에 문서를 파싱하여 파싱된 결과를 모두 분리하여 저장하고 서로의 연관관계를 모두 구분하는 경우 구조화 정보를 최대한 이용할 수 있는 등 여러 가지 장점을 지니게 된다. 하지만, 이 경우 분할단위의 폭발적인 증가로 인한 시스템 성능 저하와 내용중복으로 인한 색인저장 오버헤드가 문제이다. 이런 문제점을 해결방안의 하나로서 본 논문에서는 RDF 메타데이타를 통하여 검색시 의미가 있는 단위로 분할 단위를 축소 지정하고 이 축소된 정보를 기반으로 인덱스를 생성하여 내용중복을 방지하는 방법을 제안하였다. 이 방법은 RDF메타데이타를 통해 이루어짐으로서 웹기반에서 자동으로 이루어질 수가 있으며, 이를 통해서 기존의 방법보다 자동화된 검색을 할 수 있다.

  • PDF

Parser as An Analysis Finisher (분석의 최종 판단자로서의 구문 분석기)

  • Yuh, Sang Hwa
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2004.05a
    • /
    • pp.677-680
    • /
    • 2004
  • 통상적인 언어 처리의 분석 과정은 전처리, 형태소분석, 품사 태깅, 복합 단위 인식, 구문 분석, 그리고 의미 분석 등의 여러 단계로 이루어진다. 분석의 매 단계에서 중의성(Ambiguity)가 발생하며, 이를 해결하기 위한 노력으로 구문 분석 이전의 분석 단계에서도 정확률(Precision)을 높이기 위해, 어휘(Lexical) 정보, 품사정보 그리고 구문 정보 등을 이용한다. 각 단계에서 고급 정보로서의 구문 정보 이용은 구문분석의 중복성과 분석 지식의 중복성을 야기한다. 또한, 기존의 처리 흐름에서는 각 분석 단계에서의 결과는 최종적인 것으로, 이로 인해 다음 분석 단계에 분석 오류를 전파한다. 본 논문에서는 구문 분석기를 분석 결과의 최종 판단자로 이용할 것을 제안한다. 즉, 구문 분석 전단계의 모든 분석 정보는 구문 분석기에 제공되고, 구문분석기는 상향식 구문분석을 수행하면서 이들 정보들로부터 최종의 그리고 최적의 분석 후보를 결정한다. 이를 위해 구문분석기는 한 문장 단위를 입력 받는 기존의 제한을 따르지 않는다. 제안된 방법은 구문분석 앞 단계에서의 잘못된 정보 제공(예: 문장 분리 오류, 품사 오류, 복합단위 인식 오류 등)으로부터 자유로우며, 이를 통해 분석 실패의 가능성을 최대로 줄인다.

  • PDF

A Development of Cloud Based Auto Video Enhancement Service (클라우드 기반의 영상 자동 향상 서비스개발)

  • Park, Sang-oh;Choi, Seung-ho;Park, Sang-il
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2018.06a
    • /
    • pp.130-132
    • /
    • 2018
  • 최근 1인 미디어의 확장과 맞물려 개인 차원에서의 영상편집이 활성화되고 있다. 인기 영상강의를 위주로 초보자들도 쉽게 접근할 수 있으나 여전히 많은 사람들이 영상제작을 어려워하고 있다. 특히 밝기, 대비 및 색 보정에서 어려움을 많이 겪는다. 전문적인 영상편집 툴의 경우 자동 보정 기능을 제공하고 있으나 파이널 컷의 경우 Apple 사의 맥 디바이스 환경을 구축해야 하는 문제, Adobe사 프로그램의 경우 완전 자동 기능 부재 및 무거운 연산처리 과정 및 유료화로 인한 접근성 저하, 기타 프로그램들의 경우 설치 접근성이 낮다는 단점이 있었다. 이에 본 연구에서는 클라우드 기반의 쉽고 빠른, 접근성을 높인 자동 영상보정 서비스를 제시하려 한다. 최종 단계의 클라우드 서비스에서는 흔들림 보정, 색 보정, 대비 보정, 명암 보정의 향상 기능과 컷 단위 인식, 신단위 인식, 객체 단위 인식의 서비스를 제공해야 한다는 결론에 도출하였다. 본 논문에서는 연구의 시작으로 클라우드 서비스 구축 및 OpenCV를 활용하여 프레임 별 영상 향상 알고리즘 구현을 시행하였다.

  • PDF

Test-bed of Total Ionizing Dose (TID) Test by Cosmic Rays for Metal Oxide Semiconductor Field Effect Transistor (MOSFET) (금속-산화막 반도체 전계효과 트랜지스터의 우주방사선에 의한 총이온화선량 시험을 위한 테스트 베드)

  • Sin, Gu-Hwan;Yu, Gwang-Seon;Gang, Gyeong-In;Kim, Hyeong-Myeong;Jeong, Seong-In
    • Journal of the Korean Society for Aeronautical & Space Sciences
    • /
    • v.34 no.11
    • /
    • pp.84-91
    • /
    • 2006
  • Recently, all the electrical parts for satellite application are required more strong against cosmic rays, because spacecraft's life time and function are depending on the their conditions. Also, a TID effect test was undertaken with units and/or subsystems which are already assembled on the PCB in past time. However, it is very hard to know and analyze that some abnormal states are appeared after launch. Moreover, it is necessary to perform a test of TID effects based on the parts level for preparing preliminary data in cosmic rays. Therefore, this paper presents a test-bed to perform a TID effect test of Metal-Oxide Semiconductor Field Effect Transistor (MOSFET) which is a fundamental element for electronics.

Development and Evaluation of an Address Input System Employing Speech Recognition (음성인식 기능을 가진 주소입력 시스템의 개발과 평가)

  • 김득수;황철준;정현열
    • The Journal of the Acoustical Society of Korea
    • /
    • v.18 no.2
    • /
    • pp.3-10
    • /
    • 1999
  • This paper describes the development and evaluation of a Korean address input system employing automatic speech recognition technique as user interface for input Korean address. Address consists of cities, provinces and counties. The system works on a window 95 environment of personal computer with built-in soundcard. In the speech recognition part, the Continuous density Hidden Markov Model(CHMM) for making phoneme like units(PLUs) and One Pass Dynamic Programming(OPDP) algorithm is used for recognition. For address recognition, Finite State Automata(FSA) suitable for Korean address structure is constructed. To achieve an acceptable performance against the variation of speakers, microphones, and environmental noises, Maximum a posteriori(MAP) estimation is implemented in adaptation. And to improve the recognition speed, fast search method using variable pruning threshold is newly proposed. In the evaluation tests conducted for the 100 connected words uttered by 3 males the system showed above average 96.0% of recognition accuracy for connected words after adaption and recognition speed within 2 seconds, showing the effectiveness of the system.

  • PDF

Design and Implementation of a Class-based Learning Support System Using Personalized System of Instruction Theory (개별화 수업체제를 활용한 학급단위 학습지원시스템의 설계 및 구현)

  • Kim, Yeon-Jung;Jun, Woo-Chun
    • Journal of The Korean Association of Information Education
    • /
    • v.14 no.1
    • /
    • pp.99-110
    • /
    • 2010
  • In order to adapt learners' individual differences in learning ability, individual learning and level-learning have been recommended. However, instructing each student accordingly is not easy issue. In this paper, an online learning support system based on Keller's Personalized System of Instruction theory is developed. As a class-based system, it supports teachers and students to conveniently conduct frequent formative evaluations. It enables students to study at their own learning pace and to reach their learning goals. And it adopts point system and level system to induce self-directed participation. Our implementation results confirm teachers can conduct formative evaluations efficiently.

  • PDF

Multi-Frame-Based Super Resolution Algorithm by Using Motion Vector Normalization and Edge Pattern Analysis (움직임 벡터의 정규화 및 에지의 패턴 분석을 이용한 복수 영상 기반 초해상도 영상 생성 기법)

  • Kwon, Soon-Chan;Yoo, Jisang
    • The Journal of Korean Institute of Communications and Information Sciences
    • /
    • v.38A no.2
    • /
    • pp.164-173
    • /
    • 2013
  • In this paper, we propose multi-frame based super resolution algorithm by using motion vector normalization and edge pattern analysis. Existing algorithms have constraints of sub-pixel motion and global translation between frames. Thus, applying of algorithms is limited. And single-frame based super resolution algorithm by using discrete wavelet transform which robust to these problems is proposed but it has another problem that quantity of information for interpolation is limited. To solve these problems, we propose motion vector normalization and edge pattern analysis for 2*2 block motion estimation. The experimental results show that the proposed algorithm has better performance than other conventional algorithms.

Efficient Parallelization Method of HEVC SAO (효율적인 HEVC SAO 병렬화 방법)

  • Ryu, Hochan;Kang, Jung-Won
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2016.06a
    • /
    • pp.237-239
    • /
    • 2016
  • 본 논문에서는 HEVC (High Efficiency Video Coding) 복호화기의 SAO (Sample Adaptive Offset)를 효율적으로 병렬화하기 위한 방법을 제안한다. HEVC 는 주관적 화질 향상 및 압축 효율 향상을 위해 디블록킹 필터 (de-blocking filter)와 샘플 적응적 오프셋 (SAO)이라는 두 가지 인-루프 필터를 사용한다. 두 종류의 인-루프 필터의 사용은 HEVC 복호화기의 복잡도를 증가시키는 요인이며, 인-루프 필터에 데이터레벨 병렬화를 적용하여 고속으로 복호화를 수행할 수 있다. 본 논문에서는 SAO 의 병렬화를 위해 CTU (Coding Tree Unit)의 행 단위로 병렬화를 수행함으로써, 병렬화로 인한 추가적으로 발생하는 라인 버퍼 사용을 줄여 SAO 병렬화 효율을 향상시켰다. 실험결과 제안하는 SAO 병렬화 방법을 사용하여 균등분할 SAO 병렬화 방법에 비해 91%의 속도를 향상시켰다.

  • PDF

비디오 원의 트래픽 모형화와 다중화 장치의 성능분석

  • 윤영하;홍정식;이창훈
    • Proceedings of the Korean Operations and Management Science Society Conference
    • /
    • 1996.04a
    • /
    • pp.537-542
    • /
    • 1996
  • ITU-T에서 표준 비디오 코딩 알고리즘으로 채택한 MPEG 코딩방식은 세 가지의 코딩방식 (I,B,P,방식)을 주기적으로 사용하기 때문에, 코딩된 정보량에 강한 주기성을 보인다. 본 연구에서는 이러한 MPEG 비디오 트래픽의 주기성을 반영하는 개별 비디오 원의 트래픽을 모형화하고 이를 바탕으로 다중화 장치의 성능분석을 실시하였다. 개별 비디오 원에서 발생된 트래픽은 I, B, P의 코딩순서를 반영하고, I, B, P 프레임 별로 셀 수를 모형화 하였다. 그리고 다중화 장치에 입력되는 트래픽은 프레임 시간 단위로 이산화시켜 셀 수를 모형화하였고, 이를 이산시간 마코프 연쇄를 이용해 다중화 장치에서의 셀 손실률을 구하였다. 다중화 장치에서 셀 손실은 입력되는 잘대적인 트래픽의 양 뿐만 아니라, 비디오 원 정렬 (Source Alignment)에도 많은 영향을 받는다. 이러한 비디오 원의 정렬 효과를 반영하여 다중화 장치에 연결될 수 있는 비디오 원의 수를 결정하였다.

  • PDF