• 제목/요약/키워드: Improved similarity

검색결과 327건 처리시간 0.023초

다중 이동 객체의 실시간 인식 및 추적 시스템 (Real-time Recognition and Tracking System of Multiple Moving Objects)

  • 박호식;배철수
    • 한국통신학회논문지
    • /
    • 제36권7C호
    • /
    • pp.421-427
    • /
    • 2011
  • 실시간 객체 인식 및 추적은 컴퓨터 비전 응용 산업이 발달하면서 그 중요성이 더해지고 있다. 객체 추적을 위해 많이 이용되고 있는 알고리즘으로 Mean-Shift 알고리즘이 있다. Mean-Shift 알고리즘을 기반으로 한 객체 추적 알고리즘은 구현이 간단하고, 적은 계산 복잡도를 갖는 장점이 있다. 따라서 실시간 객체 추적 시스템에 적합하다고 할 수 있지만, 지역 모드로의 수렴만을 보장하는 특성으로 인해 객체의 수가 많은 경우 좋은 성능을 나타내지 못하는 단점을 가지고 있다. 그러므로 본 논문에서는 다중 이동 객체를 실시간으로 추적하기 위한 광류기반의 움직임 추정 기법을 제안한다. 제안된 알고리즘의 성능을 확인하기 위해 다중 이동 객체의 인식 실험 결과 유사도는 0.96으로 기존의 Mean-Shift 알고리즘에 비해 약 13.4% 정도 유사도가 개선되었고 평균 픽셀 오류도 3.07로 또한 50% 이상 감소하였다. 향후 알고리즘을 개선하여 처리 속도를 더욱 줄임으로써 매우 빠른 이동 객체 인식과 상황 인지 알고리즘을 추가한다면 보다 효율적인 인식 및 추적 시스템을 구축할 수 있을 것으로 사료된다.

자기공명영상장치의 뇌 T2 강조 영상에서 여기횟수 변화에 따른 영상 특성의 경향성 평가: MRiLab Simulation 연구 (Evaluation of Tendency for Characteristics of MRI Brain T2 Weighted Images according to Changing NEX: MRiLab Simulation Study)

  • 김남영;김주희;임준;강성현;이영진
    • 한국방사선학회논문지
    • /
    • 제15권1호
    • /
    • pp.9-14
    • /
    • 2021
  • 방사선에 의한 피폭 없이 대조도가 우수한 영상의 획득이 가능한 자기공명영상은 진단에 필수적이지만 영상에서의 노이즈 발생은 불가피한 요소이기 때문에 이를 보완하기 위해 자기공명영상장치의 변수들을 조절하여 우수한 특성을 가진 영상을 획득할 수 있다. 이 중, 여기횟수 (NEX; number of excitation)는 추가적인 영상 특성의 저하 없이 우수한 특성의 영상을 획득할 수 있지만 scan time이 증가하여 motion artifact를 발생시킬 수 있고, scan time의 증가에 비례하여 영상의 특성이 향상되지 않기 때문에 적절한 NEX의 설정이 필요하다. 따라서, 본 연구에서는 MRiLab simulation program을 통해 자기공명영상의 모든 변수들을 고정시킨 후, NEX만을 조절하여 획득한 뇌 T2 강조 영상의 정량적 평가를 통해 NEX 변화에 따른 영상 특성의 경향성을 평가하고자 하였다. 획득한 영상의 노이즈 레벨 및 유사도 평가를 하기 위해 신호 대 잡음비 (SNR; signal to noise ratio), 대조도 대 잡음비 (CNR; contrast to noise ratio), 평균 제곱근 오차 (RMSE; root mean square error) 그리고 최대 신호 대 잡음비 (PSNR; peak signal to noise ratio)를 계산하였다. 결과적으로, 노이즈 레벨 및 유사도 평가 인자 모두 NEX가 증가함에 따라 개선된 값을 보였으나, 점차 증가폭이 감소함을 보였다. 따라서, 과도하게 큰 NEX는 장시간의 scan에 따른 motion artifact를 발생시켜 영상 특성을 저하시킬 수 있으므로, 적절한 NEX의 설정이 중요함을 확인하였다.

언어모델을 활용한 콘텐츠 메타 데이터 기반 유사 콘텐츠 추천 모델 (Similar Contents Recommendation Model Based On Contents Meta Data Using Language Model)

  • 김동환
    • 지능정보연구
    • /
    • 제29권1호
    • /
    • pp.27-40
    • /
    • 2023
  • 스마트 기기의 보급률 증가와 더불어 코로나의 영향으로 스마트 기기를 통한 미디어 콘텐츠의 소비가 크게 늘어나고 있다. 이러한 추세와 더불어 OTT 플랫폼을 통한 미디어 콘텐츠의 시청과 콘텐츠의 양이 늘어나고 있어서 해당 플랫폼에서의 콘텐츠 추천이 중요해지고 있다. 콘텐츠 기반 추천 관련 기존 연구들은 콘텐츠의 특징을 가리키는 메타 데이터를 활용하는 경우가 대부분이었고 콘텐츠 자체의 내용적인 메타 데이터를 활용하는 경우는 부족한 상황이다. 이에 따라 본 논문은 콘텐츠의 내용적인 부분을 설명하는 제목과 시놉시스를 포함한 다양한 텍스트 데이터를 바탕으로 유사한 콘텐츠를 추천하고자 하였다. 텍스트 데이터를 학습하기 위한 모델은 한국어 언어모델 중에 성능이 우수한 KLUE-RoBERTa-large를 활용하였다. 학습 데이터는 콘텐츠 제목, 시놉시스, 복합 장르, 감독, 배우, 해시 태그 정보를 포함하는 2만여건의 콘텐츠 메타 데이터를 사용하였으며 정형 데이터로 구분되어 있는 여러 텍스트 피처를 입력하기 위해 해당 피처를 가리키는 스페셜 토큰으로 텍스트 피처들을 이어붙여서 언어모델에 입력하였다. 콘텐츠들 간에 3자 비교를 하는 방식과 테스트셋 레이블링에 다중 검수를 적용하여 모델의 유사도 분류 능력을 점검하는 테스트셋의 상대성과 객관성을 도모하였다. 콘텐츠 메타 텍스트 데이터에 대한 임베딩을 파인튜닝 학습하기 위해 장르 분류와 해시태그 분류 예측 태스크로 실험하였다. 결과적으로 해시태그 분류 모델이 유사도 테스트셋 기준으로 90%이상의 정확도를 보였고 기본 언어모델 대비 9% 이상 향상되었다. 해시태그 분류 학습을 통해 언어모델의 유사 콘텐츠 분류 능력이 향상됨을 알 수 있었고 콘텐츠 기반 필터링을 위한 언어모델의 활용 가치를 보여주었다.

사후전산화단층촬영의 법의병리학 분야 활용을 위한 조건부 적대적 생성 신경망을 이용한 CT 영상의 해상도 개선: 팬텀 연구 (Enhancing CT Image Quality Using Conditional Generative Adversarial Networks for Applying Post-mortem Computed Tomography in Forensic Pathology: A Phantom Study)

  • 윤예빈;허진행;김예지;조혜진;윤용수
    • 대한방사선기술학회지:방사선기술과학
    • /
    • 제46권4호
    • /
    • pp.315-323
    • /
    • 2023
  • Post-mortem computed tomography (PMCT) is commonly employed in the field of forensic pathology. PMCT was mainly performed using a whole-body scan with a wide field of view (FOV), which lead to a decrease in spatial resolution due to the increased pixel size. This study aims to evaluate the potential for developing a super-resolution model based on conditional generative adversarial networks (CGAN) to enhance the image quality of CT. 1761 low-resolution images were obtained using a whole-body scan with a wide FOV of the head phantom, and 341 high-resolution images were obtained using the appropriate FOV for the head phantom. Of the 150 paired images in the total dataset, which were divided into training set (96 paired images) and validation set (54 paired images). Data augmentation was perform to improve the effectiveness of training by implementing rotations and flips. To evaluate the performance of the proposed model, we used the Peak Signal-to-Noise Ratio (PSNR), Structural Similarity Index Measure (SSIM) and Deep Image Structure and Texture Similarity (DISTS). Obtained the PSNR, SSIM, and DISTS values of the entire image and the Medial orbital wall, the zygomatic arch, and the temporal bone, where fractures often occur during head trauma. The proposed method demonstrated improvements in values of PSNR by 13.14%, SSIM by 13.10% and DISTS by 45.45% when compared to low-resolution images. The image quality of the three areas where fractures commonly occur during head trauma has also improved compared to low-resolution images.

정맥 관찰용 소형 근적외선 영상 시스템에서의 비지역적평균 알고리즘 적용 가능성 연구 (Application Feasibility Study of Non-local Means Algorithm in a Miniaturized Vein Near-infrared Imaging System)

  • 정현우;이영진
    • 한국방사선학회논문지
    • /
    • 제17권5호
    • /
    • pp.679-684
    • /
    • 2023
  • 정맥의 천자는 병리학적 검사를 위한 혈액 샘플을 획득하기 위해 널리 사용되고 있다. 바늘을 사용한 침습적인 정맥 천자 방법이 반복되서 시행되면 환자가 받는 고통이 증가되는 문제가 있어 본 연구팀은 사전에 소형 근적외선 (near-infrared, NIR) 영상 시스템을 개발하였다. 획득된 NIR 영상의 화질 개선을 위하여 본 연구에서는 노이즈 제거에 효율적으로 잘 알려진 비지역적 평균 (non-local means, NLM) 알고리즘을 모델링하여 시스템에서의 적용 가능성을 분석하고자 한다. 개발된 NIR 영상 시스템은 dichroic 및 long-pass filter를 적외선 (infrared, IR)이 통과하여 최종적으로 CMOS 센서 모듈로 검출되는 원리를 기반으로 구성하였다. 제안하는 NLM 알고리즘은 노이즈를 제거시키고자 하는 픽셀을 주변 픽셀들간의 거리들을 고려한 값으로 대체하는 원리를 기반으로 모델링하였다. 850 nm의 중심 파장을 가진 NIR 영상을 획득 후 NLM 알고리즘을 적용하여 히스토그램 평활화를 통해 최종 정맥 영역을 분할하였다. 결과적으로 NLM 알고리즘을 적용한 정맥의 NIR 영상의 coefficient of variation은 평균 0.247로 기존의 filtering 방법들과 비교하여 우수한 결과값으로 도출되었다. 또한 NLM 알고리즘의 dice similarity coefficient 값은 기존의 median filter와 total variation 방법에 비하여 각각 62.91 및 9.40% 향상된 값이 획득되었다. 결론적으로 NLM 알고리즘은 NIR 영상 시스템으로 획득한 정맥의 정확한 분할이 가능하게 할 수 있음을 증명하였다.

초음파 영상에서의 초고분해능 합성곱 신경망 알고리즘의 시뮬레이션 및 실험 연구 (Simulation and Experimental Studies of Super Resolution Convolutional Neural Network Algorithm in Ultrasound Image)

  • 이영진
    • 한국방사선학회논문지
    • /
    • 제17권5호
    • /
    • pp.693-699
    • /
    • 2023
  • 초음파는 의료분야에서 비파괴적 및 비침습적인 질병 진단에 널리 활용되고 있다. 진단의료영상의 질병진단 정확도를 향상시키기 위하여 공간 분해능을 향상시키는 것은 매우 중요하다. 본 연구에서는 초음파 영상에서의 초고분해능 합성곱 신경망 알고리즘 (super resolution convolutional neural network, SRCNN)을 모델링하여 적용 가능성을 분석하고자 한다. 연구는 Field II 시뮬레이션과 open source로 제공되는 임상 간 혈관종 초음파 영상을 사용한 실험 연구로 수행되었다. 제안하는 SRCNN 알고리즘은 저분해능 (low resolution, LR)에서 고분해능 (high resolution)으로 end-to-end 방식의 학습이 적용될 수 있도록 모델링하였다. 시뮬레이션 결과 Field II 프로그램을 통한 팬텀 영상에서의 반치폭 값은 SRCNN을 사용하였을 때 LR에 비하여 41.01% 향상되는 것을 확인하였다. 또한, 최대신호대잡음비 (peak to signal to noise ratio, PSNR)와 구조적 유사도 지표 (structural similarity index, SSIM)) 평가 결과는 시뮬레이션과 실제 간 혈관종 영상에서 SRCNN이 가장 우수한 값으로 도출되었다. 결론적으로 SRCNN의 초음파 영상에서의 적용 가능성을 증명하였고, 나아가 다양한 진단의료분야에서의 사용이 가능할 것으로 기대한다.

이자 분할을 위한 노이즈 제거 알고리즘 기반 기존 임계값 기법 대비 U-Net 모델의 대체 가능성 (Substitutability of Noise Reduction Algorithm based Conventional Thresholding Technique to U-Net Model for Pancreas Segmentation)

  • 임세원;이영진
    • 한국방사선학회논문지
    • /
    • 제17권5호
    • /
    • pp.663-670
    • /
    • 2023
  • 본 연구에서는 기존의 노이즈 제거 알고리즘을 적용한 영역 확장 기반의 분할 방법과 U-Net을 이용한 분할 방법의 성능을 정량적 평가인자를 이용하여 비교평가 하고자 하였다. 먼저, 전산화단층검사 영상에 median filter, median modified Wiener filter, fast non-local means algorithm을 모델링하여 적용한 뒤 영역 확장 기반의 분할을 수행하였다. 그리고 U-Net 기반의 분할 모델로 훈련을 진행하여 분할을 수행하였다. 그 후, 노이즈 제거 알고리즘을 사용한 경우와 U-Net을 사용한 경우의 분할 성능을 비교 평가하기 위해 평균 제곱근 편차 (root mean square error, RMSE), 최대 신호 대 잡음비 (peak signal to noise ratio, PSNR), universal quality image index (UQI), 그리고 dice similarity coefficient (DSC)를 측정하였다. 실험 결과, U-Net을 이용하여 분할을 수행했을 때 분할 성능이 가장 향상되었다. RMSE, PSNR, UQI, 그리고 DSC 값은 각각 약 0.063, 72.11, 0.864, 그리고 0.982로 noisy한 영상에 비해 각각 1.97배, 1.09배, 5.30배, 그리고 1.99배 개선된 것을 확인할 수 있었다. 결론적으로, 전산화단층검사영상에서 U-Net이 노이즈 제거 알고리즘에 비해 분할 성능 향상에 효과적임을 입증하였다.

Perceptional Change of a New Product, DMB Phone

  • Kim, Ju-Young;Ko, Deok-Im
    • 마케팅과학연구
    • /
    • 제18권3호
    • /
    • pp.59-88
    • /
    • 2008
  • Digital Convergence means integration between industry, technology, and contents, and in marketing, it usually comes with creation of new types of product and service under the base of digital technology as digitalization progress in electro-communication industries including telecommunication, home appliance, and computer industries. One can see digital convergence not only in instruments such as PC, AV appliances, cellular phone, but also in contents, network, service that are required in production, modification, distribution, re-production of information. Convergence in contents started around 1990. Convergence in network and service begins as broadcasting and telecommunication integrates and DMB(digital multimedia broadcasting), born in May, 2005 is the symbolic icon in this trend. There are some positive and negative expectations about DMB. The reason why two opposite expectations exist is that DMB does not come out from customer's need but from technology development. Therefore, customers might have hard time to interpret the real meaning of DMB. Time is quite critical to a high tech product, like DMB because another product with same function from different technology can replace the existing product within short period of time. If DMB does not positioning well to customer's mind quickly, another products like Wibro, IPTV, or HSPDA could replace it before it even spreads out. Therefore, positioning strategy is critical for success of DMB product. To make correct positioning strategy, one needs to understand how consumer interprets DMB and how consumer's interpretation can be changed via communication strategy. In this study, we try to investigate how consumer perceives a new product, like DMB and how AD strategy change consumer's perception. More specifically, the paper segment consumers into sub-groups based on their DMB perceptions and compare their characteristics in order to understand how they perceive DMB. And, expose them different printed ADs that have messages guiding consumer think DMB in specific ways, either cellular phone or personal TV. Research Question 1: Segment consumers according to perceptions about DMB and compare characteristics of segmentations. Research Question 2: Compare perceptions about DMB after AD that induces categorization of DMB in direction for each segment. If one understand and predict a direction in which consumer perceive a new product, firm can select target customers easily. We segment consumers according to their perception and analyze characteristics in order to find some variables that can influence perceptions, like prior experience, usage, or habit. And then, marketing people can use this variables to identify target customers and predict their perceptions. If one knows how customer's perception is changed via AD message, communication strategy could be constructed properly. Specially, information from segmented customers helps to develop efficient AD strategy for segment who has prior perception. Research framework consists of two measurements and one treatment, O1 X O2. First observation is for collecting information about consumer's perception and their characteristics. Based on first observation, the paper segment consumers into two groups, one group perceives DMB similar to Cellular phone and the other group perceives DMB similar to TV. And compare characteristics of two segments in order to find reason why they perceive DMB differently. Next, we expose two kinds of AD to subjects. One AD describes DMB as Cellular phone and the other Ad describes DMB as personal TV. When two ADs are exposed to subjects, consumers don't know their prior perception of DMB, in other words, which subject belongs 'similar-to-Cellular phone' segment or 'similar-to-TV' segment? However, we analyze the AD's effect differently for each segment. In research design, final observation is for investigating AD effect. Perception before AD is compared with perception after AD. Comparisons are made for each segment and for each AD. For the segment who perceives DMB similar to TV, AD that describes DMB as cellular phone could change the prior perception. And AD that describes DMB as personal TV, could enforce the prior perception. For data collection, subjects are selected from undergraduate students because they have basic knowledge about most digital equipments and have open attitude about a new product and media. Total number of subjects is 240. In order to measure perception about DMB, we use indirect measurement, comparison with other similar digital products. To select similar digital products, we pre-survey students and then finally select PDA, Car-TV, Cellular Phone, MP3 player, TV, and PSP. Quasi experiment is done at several classes under instructor's allowance. After brief introduction, prior knowledge, awareness, and usage about DMB as well as other digital instruments is asked and their similarities and perceived characteristics are measured. And then, two kinds of manipulated color-printed AD are distributed and similarities and perceived characteristics for DMB are re-measured. Finally purchase intension, AD attitude, manipulation check, and demographic variables are asked. Subjects are given small gift for participation. Stimuli are color-printed advertising. Their actual size is A4 and made after several pre-test from AD professionals and students. As results, consumers are segmented into two subgroups based on their perceptions of DMB. Similarity measure between DMB and cellular phone and similarity measure between DMB and TV are used to classify consumers. If subject whose first measure is less than the second measure, she is classified into segment A and segment A is characterized as they perceive DMB like TV. Otherwise, they are classified as segment B, who perceives DMB like cellular phone. Discriminant analysis on these groups with their characteristics of usage and attitude shows that Segment A knows much about DMB and uses a lot of digital instrument. Segment B, who thinks DMB as cellular phone doesn't know well about DMB and not familiar with other digital instruments. So, consumers with higher knowledge perceive DMB similar to TV because launching DMB advertising lead consumer think DMB as TV. Consumers with less interest on digital products don't know well about DMB AD and then think DMB as cellular phone. In order to investigate perceptions of DMB as well as other digital instruments, we apply Proxscal analysis, Multidimensional Scaling technique at SPSS statistical package. At first step, subjects are presented 21 pairs of 7 digital instruments and evaluate similarity judgments on 7 point scale. And for each segment, their similarity judgments are averaged and similarity matrix is made. Secondly, Proxscal analysis of segment A and B are done. At third stage, get similarity judgment between DMB and other digital instruments after AD exposure. Lastly, similarity judgments of group A-1, A-2, B-1, and B-2 are named as 'after DMB' and put them into matrix made at the first stage. Then apply Proxscal analysis on these matrixes and check the positional difference of DMB and after DMB. The results show that map of segment A, who perceives DMB similar as TV, shows that DMB position closer to TV than to Cellular phone as expected. Map of segment B, who perceive DMB similar as cellular phone shows that DMB position closer to Cellular phone than to TV as expected. Stress value and R-square is acceptable. And, change results after stimuli, manipulated Advertising show that AD makes DMB perception bent toward Cellular phone when Cellular phone-like AD is exposed, and that DMB positioning move towards Car-TV which is more personalized one when TV-like AD is exposed. It is true for both segment, A and B, consistently. Furthermore, the paper apply correspondence analysis to the same data and find almost the same results. The paper answers two main research questions. The first one is that perception about a new product is made mainly from prior experience. And the second one is that AD is effective in changing and enforcing perception. In addition to above, we extend perception change to purchase intention. Purchase intention is high when AD enforces original perception. AD that shows DMB like TV makes worst intention. This paper has limitations and issues to be pursed in near future. Methodologically, current methodology can't provide statistical test on the perceptual change, since classical MDS models, like Proxscal and correspondence analysis are not probability models. So, a new probability MDS model for testing hypothesis about configuration needs to be developed. Next, advertising message needs to be developed more rigorously from theoretical and managerial perspective. Also experimental procedure could be improved for more realistic data collection. For example, web-based experiment and real product stimuli and multimedia presentation could be employed. Or, one can display products together in simulated shop. In addition, demand and social desirability threats of internal validity could influence on the results. In order to handle the threats, results of the model-intended advertising and other "pseudo" advertising could be compared. Furthermore, one can try various level of innovativeness in order to check whether it make any different results (cf. Moon 2006). In addition, if one can create hypothetical product that is really innovative and new for research, it helps to make a vacant impression status and then to study how to form impression in more rigorous way.

  • PDF

액체질소를 이용한 산화제펌프의 극저온 성능시험 (Cryogenic Performance Test of LOX Turbopump in Liquid Nitrogen)

  • 김진선;홍순삼;김대진;최창호;김진한
    • 대한기계학회논문집B
    • /
    • 제34권4호
    • /
    • pp.391-397
    • /
    • 2010
  • 액체질소를 작동유체로 한 극저온 시험설비를 이용하여 산화제펌프의 성능시험을 수행하였다. 설계회전수의 30~55%영역에서 시험을 수행하였으며, 그 결과를 작동유체로 물을 이용한 상온수류시험의 결과와 비교/분석하였다. 수력성능에 있어서는 회전수에 대한 상사성을 만족시킴으로써, 설계회전수인 20000rpm에서의 성능예측을 가능하게 했다. 펌프의 극저온 흡입성능에서는 설계유량에서 극저온 임계 캐비테이션 수가 0.012으로 나타났으며, 상온수류시험의 경우는 0.024를 보이면서, 모든 시험회전수와 시험유량영역에서 수류시험의 경우보다 향상된 결과를 보였다. 이러한 향상된 극저온 환경에서의 흡입성능은 극저온 유체에서 펌프의 열역학적인 효과로부터 기인하는 것으로 판단된다.

퍼지 추론을 이용한 영상은닉 알고리즘 (An Image Concealment Algorithm Using Fuzzy Inference)

  • 김하식;김윤호
    • 한국항행학회논문지
    • /
    • 제11권4호
    • /
    • pp.485-492
    • /
    • 2007
  • 본 논문에서는 비디오 코덱의 수신단 블록 오류를 퍼지추론을 이용하여 검출하고 영상을 은닉하는 방법을 제안하였다. 제안한 블록 오류 검출 알고리즘은 인접된 두 프레임에서 서로 대응되는 블록들 간의 시간적 유사성을 이용하여 SSD를 구하고, 1차 임계값보다 SSD가 큰 블록들을 1차적인 오류 블록으로 분류하였다. 그리고 각각의 파라미터를 가지고 퍼지데이터 구한 후에 비례상수 ${\alpha}$와 임계값 TH1과 TH2를 결정하였다. 제안된 알고리즘의 타당성을 검토하기 위하여 QCIF 동영상에 랜덤 오류를 삽입하여 오류 검출 및 은닉 실험을 하였으며, 알고리즘의 성능평가는 동영상에 오류를 삽입한 후 기존의 VLC 테이블에 의한 오류 검출 알고리즘과 검출결과를 비교 분석하였다. 실험 결과, 제안한 오류 검출 알고리즘은 실험 영상의 오류 블록들을 모두 검출할 수 있었으며, 오류 은닉 후 영상의 화질이 기존의 오류 검출 알고리즘 보다 15dB 이상 개선됨을 알 수 있었다.

  • PDF