• 제목/요약/키워드: cosine

검색결과 1,078건 처리시간 0.021초

여현변환 계수를 이용한 이미지 탐색 알고리즘 (A Image Search Algorithm using Coefficients of The Cosine Transform)

  • 이석한
    • 한국정보전자통신기술학회논문지
    • /
    • 제12권1호
    • /
    • pp.13-21
    • /
    • 2019
  • 내용기반 영상검색은 영상 내의 정보인 색상, 질감, 형태 등의 특징 값을 추출하여 검색에 이용한다. 본 논문에서는 $8{\times}8$ 이산여현변환, 즉 $8{\times}8$ DCT(Discrete Cosine Transform) 후 얻어지는 DC, AC계수를 이용하여 필터뱅크(filter-bank)를 생성하고, 이를 영상의 내용기반 검색에 이용하는 검색방법을 제안한다. 제안된 방법은 생성된 DCT 필터뱅크에서 DC성분과 주요한 AC성분인 AC01, AC10, AC11 만을 이용하며, DC성분에 대한 양자화를 수행하여 계산량을 최소화한다. 그리고 양자화된 DC성분에 대한 히스토그램 정보를 기반으로 영상 검색에 필요한 특징 값을 산출한다. AC성분에 대해서는 Otsu 이진화를 통하여 개괄적인 형태정보를 취득한 다음 이에 대한 수평/수직 방향으로의 투영 히스토그램을 계산하여 특징 값을 취득한다. 추출된 AC성분의 특징 값은 DC성분의 특징 값과 함께, 특징벡터 빈(feature vector bins)을 구성하여 검색을 수행한다. 실험은 1000장의 데이터베이스를 이용하여 수행 되었으며, 기존의 색상정보를 이용한 검색방법보다 우수한 성능을 보임을 확인하였다.

X-ray 영상에서 그리드 아티팩트 개선을 위한 동적 분할 기반 DCT 기법 (A Dynamically Segmented DCT Technique for Grid Artifact Suppression in X-ray Images)

  • 김형규;정중은;이지현;박준혁;서지수;김호준
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제8권4호
    • /
    • pp.171-178
    • /
    • 2019
  • 방사선 진단에서 산란선 보정 그리드의 사용은 굴절되는 신호에 의한 영상의 왜곡을 방지할 수 있는 장점이 있는 반면, X-ray 영상에서 그리드 아티팩트를 발생시키는 부작용을 수반한다. 본 논문에서는 이산코사인변환(DCT: discrete cosine transform)을 사용하여, 그리드 라인을 개선하는 기법을 제안한다. X-ray 영상에서 그리드 라인은 피사체의 형태와 영상의 영역에 따라 서로 다른 특성을 보인다. 이러한 점을 해결하기 위하여 동적 분할 구조를 기반으로 DCT 변환을 적용하고, 개별 분할별로 적합한 필터전달함수를 설계하였다. 세부적으로 주파수 영역 데이터에 대하여 그리드 라인의 대역을 검출하는 알고리즘을 제안하였으며, 필터전달함수로 Kaiser 윈도우와 Butterworth 필터를 조합한 형태의 밴드스톱필터(BSF: band stop filter)를 구현하였다. 또한 블로킹 현상을 개선하기 위하여 다중구조의 영상으로부터 픽셀값을 결정하는 방법론을 제시하였다. 총 140개의 실제 X-ray 영상을 사용한 실험결과로부터 제안된 이론의 타당성을 실험적으로 평가하였다.

Spatial Gap-Filling of Hourly AOD Data from Himawari-8 Satellite Using DCT (Discrete Cosine Transform) and FMM (Fast Marching Method)

  • Youn, Youjeong;Kim, Seoyeon;Jeong, Yemin;Cho, Subin;Kang, Jonggu;Kim, Geunah;Lee, Yangwon
    • 대한원격탐사학회지
    • /
    • 제37권4호
    • /
    • pp.777-788
    • /
    • 2021
  • Since aerosol has a relatively short duration and significant spatial variation, satellite observations become more important for the spatially and temporally continuous quantification of aerosol. However, optical remote sensing has the disadvantage that it cannot detect AOD (Aerosol Optical Depth) for the regions covered by clouds or the regions with extremely high concentrations. Such missing values can increase the data uncertainty in the analyses of the Earth's environment. This paper presents a spatial gap-filling framework using a univariate statistical method such as DCT-PLS (Discrete Cosine Transform-based Penalized Least Square Regression) and FMM (Fast Matching Method) inpainting. We conducted a feasibility test for the hourly AOD product from AHI (Advanced Himawari Imager) between January 1 and December 31, 2019, and compared the accuracy statistics of the two spatial gap-filling methods. When the null-pixel area is not very large (null-pixel ratio < 0.6), the validation statistics of DCT-PLS and FMM techniques showed high accuracy of CC=0.988 (MAE=0.020) and CC=0.980 (MAE=0.028), respectively. Together with the AI-based gap-filling method using extra explanatory variables, the DCT-PLS and FMM techniques can be tested for the low-resolution images from the AMI (Advanced Meteorological Imager) of GK2A (Geostationary Korea Multi-purpose Satellite 2A), GEMS (Geostationary Environment Monitoring Spectrometer) and GOCI2 (Geostationary Ocean Color Imager) of GK2B (Geostationary Korea Multi-purpose Satellite 2B) and the high-resolution images from the CAS500 (Compact Advanced Satellite) series soon.

다중 스펙트럼 객체 감지를 위한 고주파 교환 네트워크 (High-Frequency Interchange Network for Multispectral Object Detection)

  • 박선후;윤준석;유석봉;한승회
    • 한국정보통신학회논문지
    • /
    • 제26권8호
    • /
    • pp.1121-1129
    • /
    • 2022
  • RGB 이미지를 활용하는 다양한 객체 인식 분야에서 조도가 어둡거나 특정 물체에 의해 가려진 환경에서의 RGB 이미지는 객체 인식 성능 저하를 일으킨다. IR 이미지는 가시광선이 아닌 적외선 파동을 감지하기 때문에 이러한 환경에서 강인한 객체 인식 성능을 가질 수 있고, RGB-IR 이미지 쌍을 가지고 각자의 강점을 결합 하는 것을 통해 객체 인식 성능을 향상시킬 수 있다. 본 논문에서는 RGB-IR 이미지 쌍의 강점만을 결합하여 객체 인식 성능을 향상시키는 다중 스펙트럼 융합 모델인 high-frequency interchange network (HINet)을 제안한다. HINet은 RGB-IR 이미지 간 주요 정보를 교환하기 위해 두 가지 객체 인식 모델을 mutual high-frequency transfer (MHT)를 이용하여 연결하였다. MHT에서는 RGB-IR 이미지 쌍 각각을 discrete cosine transform (DCT) 스펙트럼 도메인으로 변환하여 고주파 정보를 추출한다. 추출된 고주파 정보는 서로의 네트워크에 전달되어 객체 인식성능 향상을 위해 활용되어 진다. 실험 결과는 제안하는 네트워크의 우수성을 보이며 다중 스펙트럼 객체 인식 성능을 향상시키는 것을 확인할 수 있다.

뉴로모픽 구조 기반 FPGA 임베디드 보드에서 이미지 분류 성능 향상을 위한 특징 표현 방법 연구 (Feature Representation Method to Improve Image Classification Performance in FPGA Embedded Boards Based on Neuromorphic Architecture)

  • 정재혁;정진만;윤영선
    • 한국소프트웨어감정평가학회 논문지
    • /
    • 제17권2호
    • /
    • pp.161-172
    • /
    • 2021
  • 뉴로모픽 아키텍처는 저에너지로 인공지능 기술을 지원하는 차세대 컴퓨팅으로 주목받고 있다. 그러나 뉴로모픽 아키텍처 기반의 FPGA 임베디드 보드는 크기나 전력 등으로 인하여 가용 자원이 제한된다. 본 논문에서는 제한된 자원을 효율적으로 사용하기 위해 특징점의 고려 없이 크기를 재조정하는 보간법과 에너지 기반으로 특징점을 최대한 보존하는 DCT(Discrete Cosine Transform) 기법을 통한 특징 표현 방법을 비교 및 평가한다. 크기가 조정된 이미지는 일반적인 PC 환경에서와 FPGA 임베디드 보드의 Nengo 프레임워크에서 컨벌루션 신경망을 통해 정확도를 비교 분석했다. 실험 결과 PC의 컨벌루션 신경망과 FPGA Nengo 환경 모두에서 DCT 기반 분류 성능이 일반 보간법보다 약 1.9% 높은 성능을 보였다. 실험 결과를 바탕으로 뉴로모픽 구조 기반 FPGA 보드의 제한된 자원 환경에서 기존에 사용되던 보간법 대신 DCT 방식을 이용한다면 분류에 사용되는 뉴런의 표현에 많은 자원을 할당하여 인식률을 높일 수 있을 것으로 기대한다.

워드 임베딩(Word Embedding)을 활용한 최적의 키워드 추출 및 검색 방법 연구 (A Study on the Optimal Search Keyword Extraction and Retrieval Technique Generation Using Word Embedding)

  • 이정인;안진희;고경택;김영석
    • 한국지반신소재학회논문집
    • /
    • 제22권2호
    • /
    • pp.47-54
    • /
    • 2023
  • 본 논문에서는 자료 조사를 위한 최적의 키워드 추출 및 검색 방법을 제안하였으며, 북한 건설 관련 동향 파악을 예시로 제안 방법을 검증하였다. 대표적인 국내 언론 플랫폼인 빅카인즈(BigKinds)를 활용하여 표본 기사를 선정하고 키워드를 추출하였다. 추출된 키워드는 워드 임베딩(Word Embedding)을 활용하여 벡터화하였으며, 이를 토대로 코사인 유사도(Cosine Similarity)를 통해 추출된 키워드 간의 유사도를 검사하였다. 또한 상위 빈도수 10개에 대한 키워드를 기준으로 유사도 0.5 이상인 키워드들을 군집화하였다. 각 군집들은 빅카인즈 검색 양식에 맞추어 군집 내부 키워드 간에는 'OR', 군집 간에는 'AND'로 형성하였다. 심층 분석 결과, 본래 목적에 맞는 유의미한 기사들이 추출되었음을 확인할 수 있었다. 기존의 분류체계 및 검색 양식을 변형시키지 않은 상태에서 사용자의 세부 목적을 충족시키는 자료 조사·분류가 가능하게 되었다는 점에서 의의를 갖는다.

하모닉 코더를 위한 직선과 이산코사인변환 (DCT)을 이용한 하모닉 크기값 (Magnitude) 양자화 기법 (Method of Harmonic Magnitude Quantization for Harmonic Coder Using the Straight Line and DCT (Discrete Cosine Transform))

  • 최지욱;정규혁;이인성
    • 한국음향학회지
    • /
    • 제27권4호
    • /
    • pp.200-206
    • /
    • 2008
  • 본 논문은 음성신호의 주파수를 반으로 나누어 양자화 계수 추출에 직선과 DCT (Discrete Cosine Transform)를 혼합하여 사용한 양자화 기법을 제안한다. 하모닉 부호화기에서의 하모닉은 가변이므로 저주파에서의 하모닉만을 오버샘플링하여 차원을 고정한다. 고정된 차원의 스펙트럼 포락선을 직선으로 표현한 후 직선이 불연속인 주파수에서의 샘플값만을 전송한다. 이 논문에서는 저주파에서의 하모닉은 복원을 위해 고정된 직선의 계수를 사용하였고 고주파에서의 하모닉은 가변 DCT를 적용하여 직선과 DCT가 격합된 형태의 양자화기법을 제안한다. 제안된 양자화 기법의 성능평가는 스펙트럴의 크기값에 대한 Spectral Distortion (SD)값을 사용하였다. 실험결과 HVXC보다 제안된 양자화 기법의 SD가 0.3dB 정도 개선되었다.

교사와 학생의 사회적-과학적 쟁점(Socio-Scientific Issues) 주제 선호도 분석 (A Comparative Study of Teachers' and Students' Preference of Socio-Scientific Issues Topics)

  • 박현주
    • 과학교육연구지
    • /
    • 제47권2호
    • /
    • pp.180-191
    • /
    • 2023
  • 이 연구에서는 초등, 중, 고등학교의 학생과 교사가 선호하는 SSI 주제를 조사하여 학교급별 학생과 교사가 선호하는 SSI 주제의 유사성을 코사인 유사도 측정을 통해 분석하였다. 연구 대상은 초, 중, 고등학생 566명, 교사의 327명이었다. SSI 관련 선행연구 논문과 프로그램에 포함된 SSI 주제 60개를 환경, 과학기술, 보건·의학, 기타 사회 문제 영역로 구분하고 목록화하여, 연구 대상인 학생 또는 교사가 선호하는 주제 5개를 선택하도록 하였다. 자료수집은 서베이몽키를 이용한 온라인으로 진행하였고, 수집된 자료는 학생 및 교사별로 6개 집단으로 구분하고, 집단별로 주제의 선택 빈도를 조사하였다. 그리고 선택된 주제의 빈도를 기준으로 벡터 값을 계산하고, 학교급별 학생 간, 교사 간, 교사와 학생 간의 코사인 유사도를 측정하여 주제 선호 유사도를 분석하였다. 연구결과는 다음과 같다. 첫째, 학생의 학교급별 집단간 SSI 선호 주제 유사도는 중학생과 고등학생 사이의 코사인 유사도(0.982)가 초등학생과 중학생간(0.651) 또는 초등학생과 고등학생간(0.662)의 코사인유사도보다 높았다. 둘째, 교사의 학교급별 집단간 SSI 선호 주제 유사도는 초등, 중, 고등학교간의 모든 비교 집단에서 비교적 비슷한 코사인 유사도의 양상을 보였다. 셋째, 학생과 교사간 학교급별 SSI 선호 주제 유사도는 초등학교 학생과 교사 집단간 코사인 유사도(0.974)가 다른 학교급의 비교 집단, 중학교급(0.621) 또는 고등학교급(0.645)보다 높았다. 즉 초등학교의 학생과 교사는 서로 선호하는 SSI 주제가 73.33%의 수준에서 유사하고, 반면, 중학교 또는 고등학교의 학생과 교사는 서로 선호하는 주제가 33% 수준으로 유사한 경향을 보였다. SSI 교육에서 학생에게 관심 있는 주제로 접근하는 것은 학습 동기 유발과 지속, 그리고 즐거운 학습 경험과 학습에 대한 긍정적인 태도 형성과 긴밀하게 연관된다. 따라서, SSI 수업을 설계할 때, 학생 관심의 관점에서 주제를 검토해야 할 것이다. 특히 교사가 학생의 선호도와 다소 차이가 있는 SSI 주제를 선별한 경우, 그 차이를 극복할 수 있는 치밀한 교수 설계가 필요할 것이다.

고밀도 CHF3 플라즈마에서 바이어스 전압과 이온의 입사각이 Photoresist의 식각에 미치는 영향 (Effects of Bias Voltage and Ion-incident Angle on the Etching of Photoresist in a High-density CHF3 Plasma)

  • 강세구;민재호;이진관;문상흡
    • Korean Chemical Engineering Research
    • /
    • 제44권5호
    • /
    • pp.498-504
    • /
    • 2006
  • 고밀도 $CHF_3$ 플라즈마를 이용한 식각에서 photoresist(PR)의 식각속도 및 $SiO_2$의 PR에 대한 식각 선택도가 이온의 입사 각도에 따라 변화하는 특성을 관찰하였다. 플라즈마 내에 파라데이 상자를 설치하여 이온의 입사 각도를 조절하였으며, 바이어스 전압을 변화시켜 이온의 입사 에너지를 조절하였다. 대부분의 바이어스 전압에서 $SiO_2$의 식각속도는 이온입사각도가 증가함에 따라 단조 감소함에 비해 PR의 식각속도는 중간각도 영역까지 일정하다가 그 이후에 감소하기 시작하였다. 이온입사각도가 $0^{\circ}$인 조건에서의 식각속도를 기준으로 정규화된 식각속도(NER)는 $SiO_2$의 경우 cosine함수와 거의 일치하였으나 PR의 경우 중간각도영역에서 over-cosine 형태를 보였다. PR에 대한 $SiO_2$의 식각선택도는 이온입사각도에 따라 점차로 감소하였는데, 이는 PR이 $SiO_2$에 비해 중간각도에서 물리적 스퍼터링에 의해 식각 수율이 크게 증가하였기 때문이다. 또한, 바이어스 전압의 증가에 따라 PR에 대한 식각선택도는 대부분의 이온입사각도에서 감소하였다.

고음질을 위한 디지털 오디오 워터마킹에 관한 연구 (A Study on the Digital Audio Watermarking for a High Quality Audio)

  • 조병록;정일용;박창균;이강현
    • 전자공학회논문지CI
    • /
    • 제39권3호
    • /
    • pp.53-61
    • /
    • 2002
  • 본 논문에서는 고음질을 위한 디지털 오디오 워터마킹(watermarking) 알고리즘을 제안한다. 오늘날 디지털 저작물을 확인하는데 디지털 워터마크(digital watermark)가 쓰이고 있으며, 영상뿐만 아니라 디지털 오디오 분야도 연구가 활발하다. 특히, 디지털 오디오 분야에서의 워터마크 삽입은 워터마크의 강인성뿐만 아니라 워터마킹된 오디오 데이터 자체의 음질에 상당한 영향을 주게 된다. 오디오 워터마크는 일반적으로 FFT 변환 후 주파수 영역에 워터마크를 삽입하는데, 이때 워터마크 삽입 영향으로 오디오 데이터 음질에 영향을 미치게 된다. 따라서 오디오의 고음질을 유지하면서 강인한 워터마크를 삽입하는 연구가 큰 문제로 대두되었다. 논문에서는 심리음향 모델(Psychoacoustic model) 및 MDCT/IMDCT(Modified Discrete Cosine Transform/Inverse Modified Discrete Cosine Transform)를 사용한 고음질 오디오 워터마킹 알고리즘을 제안한다. 제안된 논문에서, 오디오 워터마킹 알고리즘을 위하여 44.1㎑, 128Kbps, 스테레오 오디오 파일을 이용하였다. 오디오 데이터가 MDCT를 통해 주파수 변환하는 과정에서 256, 1024, 2048 포인트 간격으로 워터마크를 삽입할 수 있다. 50㎳의 RMS 윈도우를 사용했을 때 원 오디오 데이터와 워터마킹 된 오디오 데이터의 전체 RMS 파워의 차이는 0.8㏈이다.