• 제목/요약/키워드: multiple embedding

검색결과 85건 처리시간 0.025초

순환형 히스토그램 쉬프팅 기반 가역성 DNA 정보은닉 기법 (Reversible DNA Information Hiding based on Circular Histogram Shifting)

  • 이석환;권성근;권기룡
    • 전자공학회논문지
    • /
    • 제53권12호
    • /
    • pp.67-75
    • /
    • 2016
  • DNA 컴퓨팅 기술로 DNA 정보를 매개물로 하는 DNA 저장, DNA 스테가노그라픽, 및 DNA 워터마킹에 대한 관심이 많아지고 있다. 생물학적 변이없이 외부 워터마크를 DNA 정보 내에 은닉에서는 원본 DNA 서열의 복원이 가능하고, 은닉과 복원이 반복적으로 이루어지며, 외부 워터마크에 의한 의도적인 변이 분석이 가능한 가역성 정보은닉 기술이 필요하다. 본 논문에서는 DNA 부호계수의 순환형 히스토그램 다중 쉬프팅 (Circular Histogram Shifting, CHS) 기반으로 생물학적 변이없이 허위개시코돈 방지, 원본 서열 길이 유지, 높은 워터마크 용량성, 블라인드 검출이 가능한 가역성 DNA 정보은닉 방법을 제안한다. 제안한 방법은 비부호 영역 DNA 염기서열을 부호계수로 변환한 다음, 높은 용량성을 위하여 순환형 히스토그램 다중 쉬프팅에 의하여 부호계수에 다중비트를 은닉한다. 마지막으로 다중비트 은닉 과정에서 은닉된 인접 염기서열 간의 비교탐색을 통하여 허위개시코돈 생성을 방지한다. 실험 결과로부터 제안한 방법이 기존 방법보다 0.11~0.50 bpn(bit per nucleotide base) 높은 워터마크 용량성을 가지고, 허위개시코돈이 발생되지 않음을 확인하였다.

휴대형 지능형 프로젝션 시스템 개발 (Developing a Portable Intelligent Projection System)

  • 박한훈;서병국;진윤종;오지현;박종일
    • 대한전자공학회논문지SP
    • /
    • 제44권4호통권316호
    • /
    • pp.26-34
    • /
    • 2007
  • 지능형 프로젝션 시스템이란 임의의 환경에서 프로젝터를 이용하여 임의의 스크린에 영상을 왜곡없이 보여줄 수 있는 시스템을 말한다. 최근 프로젝터의 보편화로 인해 지능형 프로젝션 시스템에 대한 요구는 크게 증가했으며, 이러한 요구들은 지능형 프로젝션 시스템과 관련된 기술의 획기적인 발전을 가져왔다. 그러나, 여전히 지능형 프로젝션 시스템이 극복하지 못한 환경들(대부분 주어진 환경이나 시스템의 특성이 시간에 따라 변하는 것과 관련됨)이 존재하며, 이는 지능형 프로젝션 시스템들의 적용 범위를 크게 제약해왔다. 본 논문에서는 이러한 환경들 중에 대표적인 두 가지 예로 스크린에 전반사가 존재하는 경우와 스크린의 기하가 동적으로 변하는 경우에 대한 효과적인 해결책(다수의 중첩 프로젝터 시스템, 보색패턴 삽입) 및 실험결과를 제공한다. 또한, 사용자분석을 통해 사용자 관점에서 제안된 방법들의 효용성을 검증한다. 단 각 환경들은 독립적으로 다루어지며 모든 환경에 대해 동시에 적응하는 것에 대해서는 다루지 않는다. 이는 모든 환경들을 동시에 고려하기 위해서는 각 기술들을 단순히 조합하는 것으로는 불가능하며, 새로운 모델 및 기술이 개발되어야 하기 때문이다. 따라서, 지극히 일반적인 환경이 아니라면 본 논문에서 제안한 방법들을 이용함으로써 지능형 프로젝션 시스템의 응용 범위를 크게 확대할 수 있을 것으로 기대된다.

화자 구분 시스템의 관심 화자 추출을 위한 i-vector 유사도 기반의 음성 분할 기법 (I-vector similarity based speech segmentation for interested speaker to speaker diarization system)

  • 배아라;윤기무;정재희;정보경;김우일
    • 한국음향학회지
    • /
    • 제39권5호
    • /
    • pp.461-467
    • /
    • 2020
  • 잡음이 많고 여러 사람이 있는 공간에서 음성인식의 성능은 깨끗한 환경보다 저하될 수밖에 없다. 이러한 문제점을 해결하기 위해 본 논문에서는 여러 신호가 섞인 혼합 음성에서 관심 있는 화자의 음성만 추출한다. 중첩된 구간에서도 효과적으로 분리해내기 위해 VoiceFilter 모델을 사용하였으며, VoiceFilter 모델은 여러 화자의 발화로 이루어진 음성과 관심 있는 화자의 발화로만 이루어진 참조 음성이 입력으로 필요하다. 따라서 본 논문에서는 Probabilistic Linear Discriminant Analysis(PLDA) 유사도 점수로 군집화하여 혼합 음성만으로도 참조 음성을 대체해 사용하였다. 군집화로 생성한 음성에서 추출한 화자 특징과 혼합 음성을 VoiceFilter 모델에 넣어 관심 있는 화자의 음성만 분리함으로써 혼합 음성만으로 화자 구분 시스템을 구축하였다. 2명의 화자로 이루어진 전화 상담 데이터로 화자 구분 시스템의 성능을 평가하였으며, 분리 전 상담사(Rx)와 고객(Tx)의 음성 Source to Distortion Ratio(SDR)은 각각 5.22 dB와 -5.22 dB에서 분리 후 각각 11.26 dB와 8.53 dB로 향상된 성능을 보였다.

가변 길이 입력 발성에서의 화자 인증 성능 향상을 위한 통합된 수용 영역 다양화 기법 (Integrated receptive field diversification method for improving speaker verification performance for variable-length utterances)

  • 신현서;김주호;허정우;심혜진;유하진
    • 한국음향학회지
    • /
    • 제41권3호
    • /
    • pp.319-325
    • /
    • 2022
  • 화자 인증 시스템에서 입력 발성 길이의 변화는 성능을 하락시킬 수 있는 대표적인 요인이다. 이러한 문제점을 개선하기 위해, 몇몇 연구에서는 시스템 내부의 특징 가공 과정을 여러가지 서로 다른 경로에서 수행하거나 서로 다른 수용 영역(Receptive Field)을 가진 합성곱 계층을 활용하여 다양한 화자 특징을 추출하였다. 이러한 연구에 착안하여, 본 연구에서는 가변 길이 입력 발성을 처리하기 위해 보다 다양한 수용 영역에서 화자 정보를 추출하고 이를 선택적으로 통합하는 통합된 수용 영역 다양화 기법을 제안한다. 제안한 통합 기법은 입력된 특징을 여러가지 서로 다른 경로에서 다른 수용 영역을 가진 합성곱 계층으로 가공하며, 가공된 특징을 입력 발성의 길이에 따라 동적으로 통합하여 화자 특징을 추출한다. 본 연구의 심층신경망은 VoxCeleb2 데이터세트로 학습되었으며, 가변 길이 입력 발성에 대한 성능을 확인하기 위해 VoxCeleb1 평가 데이터 세트를 1 s, 2 s, 5 s 길이로 자른 발성과 전체 길이 발성에 대해 각각 평가를 수행하였다. 실험 결과, 통합된 수용 영역 다양화 기법이 베이스라인 대비 동일 오류율을 평균적으로 19.7 % 감소시켜, 제안한 기법이 가변 길이 입력 발성에 의한 성능 저하를 개선할 수 있음을 확인하였다.

Word2Vec을 활용한 제품군별 시장규모 추정 방법에 관한 연구 (A Study on Market Size Estimation Method by Product Group Using Word2Vec Algorithm)

  • 정예림;김지희;유형선
    • 지능정보연구
    • /
    • 제26권1호
    • /
    • pp.1-21
    • /
    • 2020
  • 인공지능 기술의 급속한 발전과 함께 빅데이터의 상당 부분을 차지하는 비정형 텍스트 데이터로부터 의미있는 정보를 추출하기 위한 다양한 연구들이 활발히 진행되고 있다. 비즈니스 인텔리전스 분야에서도 새로운 시장기회를 발굴하거나 기술사업화 주체의 합리적 의사결정을 돕기 위한 많은 연구들이 이뤄져 왔다. 본 연구에서는 기업의 성공적인 사업 추진을 위해 핵심적인 정보 중의 하나인 시장규모 정보를 도출함에 있어 기존에 제공되던 범위보다 세부적인 수준의 제품군별 시장규모 추정이 가능하고 자동화된 방법론을 제안하고자 한다. 이를 위해 신경망 기반의 시멘틱 단어 임베딩 모델인 Word2Vec 알고리즘을 적용하여 개별 기업의 생산제품에 대한 텍스트 데이터를 벡터 공간으로 임베딩하고, 제품명 간 코사인 거리(유사도)를 계산함으로써 특정한 제품명과 유사한 제품들을 추출한 뒤, 이들의 매출액 정보를 연산하여 자동으로 해당 제품군의 시장규모를 산출하는 알고리즘을 구현하였다. 실험 데이터로서 통계청의 경제총조사 마이크로데이터(약 34만 5천 건)를 이용하여 제품명 텍스트 데이터를 벡터화 하고, 한국표준산업분류 해설서의 산업분류 색인어를 기준으로 활용하여 코사인 거리 기반으로 유사한 제품명을 추출하였다. 이후 개별 기업의 제품 데이터에 연결된 매출액 정보를 기초로 추출된 제품들의 매출액을 합산함으로써 11,654개의 상세한 제품군별 시장규모를 추정하였다. 성능 검증을 위해 실제 집계된 통계청의 품목별 시장규모 수치와 비교한 결과 피어슨 상관계수가 0.513 수준으로 나타났다. 본 연구에서 제시한 모형은 의미 기반 임베딩 모델의 정확성 향상 및 제품군 추출 방식의 개선이 필요하나, 표본조사 또는 다수의 가정을 기반으로 하는 전통적인 시장규모 추정 방법의 한계를 뛰어넘어 텍스트 마이닝 및 기계학습 기법을 최초로 적용하여 시장규모 추정 방식을 지능화하였다는 점, 시장규모 산출범위를 사용 목적에 따라 쉽고 빠르게 조절할 수 있다는 점, 이를 통해 다양한 분야에서 수요가 높은 세부적인 제품군별 시장정보 도출이 가능하여 실무적인 활용성이 높다는 점에서 의의가 있다.