• 제목/요약/키워드: Image Entropy

검색결과 349건 처리시간 0.027초

디지털 저작권 관리를 위한 효율적인 H.264/AVC 비디오 스크램블링 방법 (Efficient H.264/AVC Video Scrambling Methods for Digital Rights Management)

  • 김수진;박균;조경순
    • 정보처리학회논문지:컴퓨터 및 통신 시스템
    • /
    • 제1권3호
    • /
    • pp.187-192
    • /
    • 2012
  • 본 논문은 디지털 저작권 관리를 위한 효율적인 H.264/AVC 비디오 스크램블링 방법을 제안한다. 제안하는 방법은 H.264 동영상 압축 방법에서 엔트로피 부호화에서 사용되는 레벨 및 suffix와 움직임 예측에서 사용되는 MVD에 스크램블링 방법을 적용하는 것이다. 다른 논문들에서 제안된 방법들은 데이터의 압축 효율을 감소시키거나 많은 연산량으로 인해 실시간 처리가 불가능하다는 문제점이 있다. 본 논문에서 제안하는 스크램블링/디스크램블링 방법은 다른 논문에서 제안한 방식들의 문제점을 개선시켜 복원된 영상에 왜곡을 일으키지 않을 뿐만 아니라 압축 효율을 원래의 압축 방법 그대로 유지한다. H.264 레퍼런스 프로그램을 이용한 실험을 통해 제안하는 방법의 성능 및 동작을 검증하였으며, USB동글을 이용하여 제안하는 스크램블링/디스크램블링 방식을 H.264 비디오 압축에 적용할 수 있는 동영상 재생 시스템을 구현하였다.

뉴 패러다임 관점에서 해석한 공간의 위계구조와 준공적 공간에 관한 연구 (A study on the semi-public space and spatial hierarchy understood from the viewpoint of new paradigm)

  • 신문영
    • 디자인학연구
    • /
    • 16호
    • /
    • pp.27-38
    • /
    • 1996
  • 환경을 다루는 디자이너에게 있어서 유동적으로 변화하는 과학적 지식 체계의 흐름을 파악하는 것은 중요하다. 당대의 시대적 세계관과 타학문 분야의 발전 성향을 반영하여 새로운 문화를 창조하고 제시하는 과정이 환경디자인이기 때문이다. 본 연구는 변화하는 세계관이 관점에서 공간을 파악하여 현대인의 도시환경에 상실되어 가는 이미지를 회복할 수 있는 방향을 제시하는 데에 그 의의를 둔다. 연구의 진행 과정은 다음과 같다. 1. 공간의 순위적 질서에 따른 각 공간의 역할과 인간과의 관계에 있어서 각 공간의 중요성을 논한다. 2. 새로운 패러다임의 관점에서 공간은 어떻게 해석되는 지와 그에 따른 환경디자인 접근방법의 방향을 제시한다. 3. 도시 환경에 있어서 준공 적 공간의 제안이 뉴 패러다임과 그 입장을 같이 하고 있음을 논하고 준공 적 공간의 도시 활성화 역할의 중요성을 밝힌다. 연구결과 새로운 패러다임에 입각한 공간의 이해에서 출발한 준공적 공간이 도시에서의 풍요로운 삶의 영역을 확장하여 무질서, 엔트로피의 증가라는 부정적인 환경 문제를 극복하는 에너지로서 작용할 수 있는 가능성을 찾아볼 수 있었다.

  • PDF

퍼지 성능 측정자를 결합한 최적 클러스터 분석방법 (An Optimal Cluster Analysis Method with Fuzzy Performance Measures)

  • 이현숙;오경환
    • 한국지능시스템학회논문지
    • /
    • 제6권3호
    • /
    • pp.81-88
    • /
    • 1996
  • 클러스터링은 주어진 데이타 집합의 패턴을 비슷한 성질을 가지는 그룹으로 나누어 패턴 상호간의 관계를 정립하기 위한 방법론이다. 이러한 클러스터링 기법을 위하여 많은 알고리즘이 개발되었고, 패턴인식과 영상처리 등의 여러 공학영역에 적용되어 왔다. 대부분의 실세계 데이타는 그 경계가 명확하지 않으므로 그 특성을 보다 정확히 반영하기 위하여 퍼지이론이 도입되었다.이와 같은 클러스터 분석 방법은 보다 적절히 으용하기 위하여 클러스터링의 적절성을 평가하기 위한 방법론과 함께 연구되어야 한다. 이를 위하여 각 데이타 패턴이 얼마나 잘 분류되었는지를 수학적으로 계산하기 위한 함수들이 제안되었다. 그러나 클로스터 타당성 문제는 주어지 클러스터링 방법론의 특성, 그 알고리즘에서 사용한 파라메터의 성질, 주어진 입력 데이타 집합의 특성 등 여러 복잡한 상황을 포함하고 있으므로 기존의 연구에서와 같이 하나의 함수를 이용하여 해결하기는 어렵다. 그러므로 본 논문에서는 기존에 연구되어온 타당성 측정 함수를 조사하고 그의 단점을 고찰하여 이를 해결하기 위한 방법으로 4가지성능 측정자를 제안하고 이의 결합에 의하여 형성된 클러스터 타당성의 정도를 구하는 방법론을 제시하고자 한다. 또한 이러한 방법은 퍼지 클러스터링을 위한 학습 알고리즘과 결함하여 클러스터의 수나 데이타의 분포에 대한 정보없이 최적 클러스터를 찾아주는 방법에 응용될 수 있음을 보인다.

  • PDF

H.264/AVC용 CAVLC 디코더의 설계 (Design of CAVLC Decoder for H.264/AVC)

  • 정덕영;손승일
    • 한국정보통신학회논문지
    • /
    • 제11권6호
    • /
    • pp.1104-1114
    • /
    • 2007
  • 디지털 비디오 압축 기술은 대역폭과 저장 공간이 제한되는 멀티미디어 데이터의 효율적인 전송과 저장을 가능하게 하는 중요한 역할을 해왔다. JVT가 제안한 새로운 비디오 코딩 표준인 H.264/AVC는 압축 성능에 있어서 이전의 표준들을 훨씬 능가하고 있다. 특히 비디오 및 이미지 압축 응용에서 가변길이 부호는 중요한 역할을 한다. H.264/AVC 표준은 엔트로피 코딩 방식으로서 CAVLC를 채택하였다. H.264/AVC의 CAVLC는 많은 메모리 액세스를 필요로 한다. 이는 메모리 액세스시에 상당한 전력을 소비하기 때문에 DMB와 비디오 폰 서비스와 같은 응용을 위해서는 심각한 문제가 될 수 있다. 본 논문에서는 이러한 문제점을 극복하기 위해, 산술연산에 근거한 메모리 사용없는 coeff_token, level 및 run_before 디코딩을 구현하고, total_zero 가변길이 디코딩시에만 필요한 메모리의 70%만 사용하여 구현하는 가변길이 디코딩 기법을 제안한다.

딥러닝 학습에서 최적의 알고리즘과 뉴론수 탐색 (Optimal Algorithm and Number of Neurons in Deep Learning)

  • 장하영;유은경;김혁진
    • 디지털융복합연구
    • /
    • 제20권4호
    • /
    • pp.389-396
    • /
    • 2022
  • 딥러닝(Deep Learning)은 퍼셉트론을 기반으로 하고 있으며 현재에는 이미지 인식, 음성 인식, 객체 검출 및 약물 개발 등과 같은 다양한 영역에서 사용되고 있다. 이에 따라 학습 알고리즘이 다양하게 제안되었고 신경망을 구성하는 뉴런수도 연구자마다 많은 차이를 보이고 있다. 본 연구는 현재 대표적으로 사용되고 있는 확률적 경사하강법(SGD), 모멘텀법(Momentum), AdaGrad, RMSProp 및 Adam법의 뉴런수에 따른 학습 특성을 분석하였다. 이를 위하여 1개의 입력층, 3개의 은닉층, 1개의 출력층으로 신경망을 구성하였고 활성화함수는 ReLU, 손실 함수는 교차 엔트로피 오차(CEE)를 적용하였고 실험 데이터셋은 MNIST를 사용하였다. 그 결과 뉴런수는 100~300개, 알고리즘은 Adam, 학습횟수(iteraction)는 200회가 딥러닝 학습에서 가장 효율적일 것으로 결론을 내렸다. 이러한 연구는 향후 새로운 학습 데이터가 주어졌을 경우 개발될 알고리즘과 뉴런수의 기준치에 함의를 제공할 것이다.

단일 훈련 샘플만을 활용하는 준-지도학습 심층 도메인 적응 기반 얼굴인식 기술 개발 (Development of Semi-Supervised Deep Domain Adaptation Based Face Recognition Using Only a Single Training Sample)

  • 김경태;최재영
    • 한국멀티미디어학회논문지
    • /
    • 제25권10호
    • /
    • pp.1375-1385
    • /
    • 2022
  • In this paper, we propose a semi-supervised domain adaptation solution to deal with practical face recognition (FR) scenarios where a single face image for each target identity (to be recognized) is only available in the training phase. Main goal of the proposed method is to reduce the discrepancy between the target and the source domain face images, which ultimately improves FR performances. The proposed method is based on the Domain Adatation network (DAN) using an MMD loss function to reduce the discrepancy between domains. In order to train more effectively, we develop a novel loss function learning strategy in which MMD loss and cross-entropy loss functions are adopted by using different weights according to the progress of each epoch during the learning. The proposed weight adoptation focuses on the training of the source domain in the initial learning phase to learn facial feature information such as eyes, nose, and mouth. After the initial learning is completed, the resulting feature information is used to training a deep network using the target domain images. To evaluate the effectiveness of the proposed method, FR performances were evaluated with pretrained model trained only with CASIA-webface (source images) and fine-tuned model trained only with FERET's gallery (target images) under the same FR scenarios. The experimental results showed that the proposed semi-supervised domain adaptation can be improved by 24.78% compared to the pre-trained model and 28.42% compared to the fine-tuned model. In addition, the proposed method outperformed other state-of-the-arts domain adaptation approaches by 9.41%.

흉부 X선 영상을 이용한 작은 층수 ResNet 기반 폐렴 진단 모델의 성능 평가 (Performance Evaluation of ResNet-based Pneumonia Detection Model with the Small Number of Layers Using Chest X-ray Images)

  • 최용은;이승완
    • 대한방사선기술학회지:방사선기술과학
    • /
    • 제46권4호
    • /
    • pp.277-285
    • /
    • 2023
  • In this study, pneumonia identification networks with the small number of layers were constructed by using chest X-ray images. The networks had similar trainable-parameters, and the performance of the trained models was quantitatively evaluated with the modification of the network architectures. A total of 6 networks were constructed: convolutional neural network (CNN), VGGNet, GoogleNet, residual network with identity blocks, ResNet with bottleneck blocks and ResNet with identity and bottleneck blocks. Trainable parameters for the 6 networks were set in a range of 273,921-294,817 by adjusting the output channels of convolution layers. The network training was implemented with binary cross entropy (BCE) loss function, sigmoid activation function, adaptive moment estimation (Adam) optimizer and 100 epochs. The performance of the trained models was evaluated in terms of training time, accuracy, precision, recall, specificity and F1-score. The results showed that the trained models with the small number of layers precisely detect pneumonia from chest X-ray images. In particular, the overall quantitative performance of the trained models based on the ResNets was above 0.9, and the performance levels were similar or superior to those based on the CNN, VGGNet and GoogleNet. Also, the residual blocks affected the performance of the trained models based on the ResNets. Therefore, in this study, we demonstrated that the object detection networks with the small number of layers are suitable for detecting pneumonia using chest X-ray images. And, the trained models based on the ResNets can be optimized by applying appropriate residual-blocks.

Improving Field Crop Classification Accuracy Using GLCM and SVM with UAV-Acquired Images

  • Seung-Hwan Go;Jong-Hwa Park
    • 대한원격탐사학회지
    • /
    • 제40권1호
    • /
    • pp.93-101
    • /
    • 2024
  • Accurate field crop classification is essential for various agricultural applications, yet existing methods face challenges due to diverse crop types and complex field conditions. This study aimed to address these issues by combining support vector machine (SVM) models with multi-seasonal unmanned aerial vehicle (UAV) images, texture information extracted from Gray Level Co-occurrence Matrix (GLCM), and RGB spectral data. Twelve high-resolution UAV image captures spanned March-October 2021, while field surveys on three dates provided ground truth data. We focused on data from August (-A), September (-S), and October (-O) images and trained four support vector classifier (SVC) models (SVC-A, SVC-S, SVC-O, SVC-AS) using visual bands and eight GLCM features. Farm maps provided by the Ministry of Agriculture, Food and Rural Affairs proved efficient for open-field crop identification and served as a reference for accuracy comparison. Our analysis showcased the significant impact of hyperparameter tuning (C and gamma) on SVM model performance, requiring careful optimization for each scenario. Importantly, we identified models exhibiting distinct high-accuracy zones, with SVC-O trained on October data achieving the highest overall and individual crop classification accuracy. This success likely stems from its ability to capture distinct texture information from mature crops.Incorporating GLCM features proved highly effective for all models,significantly boosting classification accuracy.Among these features, homogeneity, entropy, and correlation consistently demonstrated the most impactful contribution. However, balancing accuracy with computational efficiency and feature selection remains crucial for practical application. Performance analysis revealed that SVC-O achieved exceptional results in overall and individual crop classification, while soybeans and rice were consistently classified well by all models. Challenges were encountered with cabbage due to its early growth stage and low field cover density. The study demonstrates the potential of utilizing farm maps and GLCM features in conjunction with SVM models for accurate field crop classification. Careful parameter tuning and model selection based on specific scenarios are key for optimizing performance in real-world applications.

제조 공정 결함 탐지를 위한 MixMatch 기반 준지도학습 성능 분석 (Performance Analysis of MixMatch-Based Semi-Supervised Learning for Defect Detection in Manufacturing Processes)

  • 김예준;정예은;김용수
    • 산업경영시스템학회지
    • /
    • 제46권4호
    • /
    • pp.312-320
    • /
    • 2023
  • Recently, there has been an increasing attempt to replace defect detection inspections in the manufacturing industry using deep learning techniques. However, obtaining substantial high-quality labeled data to enhance the performance of deep learning models entails economic and temporal constraints. As a solution for this problem, semi-supervised learning, using a limited amount of labeled data, has been gaining traction. This study assesses the effectiveness of semi-supervised learning in the defect detection process of manufacturing using the MixMatch algorithm. The MixMatch algorithm incorporates three dominant paradigms in the semi-supervised field: Consistency regularization, Entropy minimization, and Generic regularization. The performance of semi-supervised learning based on the MixMatch algorithm was compared with that of supervised learning using defect image data from the metal casting process. For the experiments, the ratio of labeled data was adjusted to 5%, 10%, 25%, and 50% of the total data. At a labeled data ratio of 5%, semi-supervised learning achieved a classification accuracy of 90.19%, outperforming supervised learning by approximately 22%p. At a 10% ratio, it surpassed supervised learning by around 8%p, achieving a 92.89% accuracy. These results demonstrate that semi-supervised learning can achieve significant outcomes even with a very limited amount of labeled data, suggesting its invaluable application in real-world research and industrial settings where labeled data is limited.

Classification of mandibular molar furcation involvement in periapical radiographs by deep learning

  • Katerina Vilkomir;Cody Phen;Fiondra Baldwin;Jared Cole;Nic Herndon;Wenjian Zhang
    • Imaging Science in Dentistry
    • /
    • 제54권3호
    • /
    • pp.257-263
    • /
    • 2024
  • Purpose: The purpose of this study was to classify mandibular molar furcation involvement (FI) in periapical radiographs using a deep learning algorithm. Materials and Methods: Full mouth series taken at East Carolina University School of Dental Medicine from 2011-2023 were screened. Diagnostic-quality mandibular premolar and molar periapical radiographs with healthy or FI mandibular molars were included. The radiographs were cropped into individual molar images, annotated as "healthy" or "FI," and divided into training, validation, and testing datasets. The images were preprocessed by PyTorch transformations. ResNet-18, a convolutional neural network model, was refined using the PyTorch deep learning framework for the specific imaging classification task. CrossEntropyLoss and the AdamW optimizer were employed for loss function training and optimizing the learning rate, respectively. The images were loaded by PyTorch DataLoader for efficiency. The performance of ResNet-18 algorithm was evaluated with multiple metrics, including training and validation losses, confusion matrix, accuracy, sensitivity, specificity, the receiver operating characteristic (ROC) curve, and the area under the ROC curve. Results: After adequate training, ResNet-18 classified healthy vs. FI molars in the testing set with an accuracy of 96.47%, indicating its suitability for image classification. Conclusion: The deep learning algorithm developed in this study was shown to be promising for classifying mandibular molar FI. It could serve as a valuable supplemental tool for detecting and managing periodontal diseases.