• 제목/요약/키워드: Weak Label

검색결과 12건 처리시간 0.022초

딥 러닝에서 Labeling 부담을 줄이기 위한 연구분석 (An Analysis of the methods to alleviate the cost of data labeling in Deep learning)

  • 한석민
    • 문화기술의 융합
    • /
    • 제8권1호
    • /
    • pp.545-550
    • /
    • 2022
  • 딥러닝은 많은 데이터를 필요로 한다는 것은 이미 널리 알려져있다. 이를 통해, 딥러닝에 쓰이는 신경망의 수없이 많은 parameter들을 학습시킨다. 학습과정에는 데이터뿐 아니라, 각 데이터별로 전문가가 입력한 label이 필요한 경우가 대부분인데, 이 label을 얻는 과정은 시간과 자원 소비가 심하다. 이 문제를 완화하기 위해, few-shot learning, self-supervised learning, weak-supervised learning등이 연구되어오고 있다. 본 논문에서는, label을 상대적으로 적은 노력으로 수행하기 위한 연구들의 동향을 살펴보고, 앞으로의 개선 방향을 제시하도록 한다.

Attention CRNN에 기반한 오디오 이벤트 검출 (Audio Event Detection Based on Attention CRNN)

  • 곽진열;정용주
    • 한국전자통신학회논문지
    • /
    • 제15권3호
    • /
    • pp.465-472
    • /
    • 2020
  • 최근 들어, 오디오 이벤트 검출을 위하여 다양한 딥뉴럴네트워크 기반의 방법들이 제안되어 왔다. 본 연구에서는 베이스라인 CRNN(Convolutional Recurrent Neural Network) 구조에 attention 방식을 도입함으로서 오디오 이벤트 검출의 성능을 향상시키고자 하였다. 베이스라인 CRNN의 입력단에 context gating을 적용하고 출력단에 attention layer을 추가하였다. 또한, 프레임(frame) 단위의 강전사 레이블(strong label)정보 뿐만 아니라 클립(clip) 단위의 약전사 레이블(weakly label) 오디오 데이터를 이용한 학습을 통하여 보다 나은 성능을 이루고자 하였다. DCASE 2018/2019 Challenge Task 4 데이터를 이용한 오디오 이벤트 검출 실험에서 제안된 attention 기반의 CRNN을 통하여 기존의 CRNN 방식에 비해서 최대 66%의 상대적 F-score 향상을 얻을 수 있었다.

표의 테두리 유사 라벨을 활용한 문자 영역 검출 방법 (Text Region Detection Method Using Table Border Pseudo Label)

  • 한정훈;박세진;문영식
    • 한국정보통신학회논문지
    • /
    • 제24권10호
    • /
    • pp.1271-1279
    • /
    • 2020
  • 문자 영역 검출이란 수기 혹은 인쇄된 문서에서 문자의 영역을 검출하는 기술이다. 검출된 문자 영역들은 인식 단계를 거쳐 디지털화되며 이는 활용 목적에 따라 다양한 곳에서 활용된다. 하지만 문자 단위의 검출 결과는 대용량 문서를 인식해야 하는 산업 현장의 문자 인식 단계에는 적합하지 않다. 또한, 문서 내 존재하는 표는 문자 영역 검출 단계에서 오검출을 야기하며 이는 문자 인식 단계에서 악영향을 끼친다. 이를 해결하기 위해 본 논문에서는 표의 테두리 정보를 활용한 문자 영역 검출 방법을 제안한다. 표의 테두리 정보를 활용하기 위하여 제안하는 방법은 2개 디코더를 추가하고 간접적인 학습을 유도하기 위하여 각 디코드의 흐름을 조절하였다. 실험을 통해 표의 테두리 유사 라벨을 이용한 약지도 학습 방법이 성능 향상에 도움이 됨을 보였다.

약한 레이블을 이용한 확장 합성곱 신경망과 게이트 선형 유닛 기반 음향 이벤트 검출 및 태깅 알고리즘 (Dilated convolution and gated linear unit based sound event detection and tagging algorithm using weak label)

  • 박충호;김동현;고한석
    • 한국음향학회지
    • /
    • 제39권5호
    • /
    • pp.414-423
    • /
    • 2020
  • 본 논문은 약한 레이블 기반 음향 이벤트 검출을 위한 시간-주파수 영역분할 맵 추출 모델에서 발생하는 희소성 및 수용영역 부족에 관한 문제를 완화 시키기 위해, 확장 게이트 선형 유닛(Dilated Convolution Gated Linear Unit, DCGLU)을 제안한다. 딥러닝 분야에서 음향 이벤트 검출을 위한 영역분할 맵 추출 기반 방법은 잡음 환경에서 좋은 성능을 보여준다. 하지만, 이 방법은 영역분할 맵을 추출하기 위해 특징 맵의 크기를 유지해야 하므로 풀링 연산 없이 모델을 구성하게 된다. 이로 인해 이 방법은 희소성과 수용영역의 부족으로 성능 저하를 보이게 된다. 이런 문제를 완화하기 위해, 본 논문에서는 정보의 흐름을 제어할 수 있는 게이트 선형 유닛과 추가의 파라미터 없이 수용영역을 넓혀 줄 수 있는 확장 합성곱 신경망을 적용하였다. 실험을 위해 사용된 데이터는 URBAN-SED와 자체 제작한 조류 울음소리 데이터이며, 제안하는 DCGLU 모델이 기존 베이스라인 논문들보다 더 좋을 성능을 보였다. 특히, DCGLU 모델이 자연 소리가 섞인 환경인 세 개의 Signal to Noise Ratio(SNR)(20 dB, 10 dB, 0 dB)에서 강인하다는 것을 확인하였다.

제조업체 Private Labels 도입의 선행요인 : 전략적 시장관리 관점을 중심으로 (Antecedents of Manufacturer's Private Label Program Engagement : A Focus on Strategic Market Management Perspective)

  • 임채운;이호택
    • 한국유통학회지:유통연구
    • /
    • 제17권1호
    • /
    • pp.65-86
    • /
    • 2012
  • 우리나라에 유통업체상표(Private Label)가 도입된 지 10년이 넘었음에도 불구하고 유통업체 상표에 대한 대부분의 연구는 소비자 관점에서 진행되어져 왔다. 본 연구는 유통업체상표를 소비자 관점이 아닌 제조업체의 관점에서 바라본 연구로, 제조업체의 유통업체상표 생산에 영향을 미치는 내외부적 요인들에 대해서 자원기반이론과 S-C-P Paradigm의 통합적인 연구모형인 전략적 시장관리 관점을 제시하였다. 연구결과를 보면, 제조업체의 마케팅 역량이 높을수록 전체 매출에서 유통업체상표가 차지하는 매출이 적은 것으로 나타났으며, 마케팅 역량에는 제조업체 브랜드명성, 마케팅 투자, 제품포트폴리오 등이 영향을 미치는 것으로 나타났다. 또한 제조업체의 마케팅 역량과 유통업체 상표 생산 간의 관계에는 제조업체의 경쟁강도가 조절효과를 미치는 것으로 나타났는데, 이는 일반적으로 마케팅 역량이 높은(낮은) 기업일수록 전체 매출에서 유통업체상표가 차지하는 비율이 낮지만(높지만), 이러한 기업들 중 경쟁강도를 낮게 지각하는 제조업체의 전체매출 중 유통업체상표가 차지하는 매출은 경쟁강도를 높게 지각하는 제조업체들에 비해 상대적으로 높게 나타났다. 이러한 연구결과를 바탕으로, 본 연구는 유통업체상표 생산에 대한 이론 및 실무적인 시사점을 제시하고 있다.

  • PDF

Immunohistochemical Localization of Anoctamin 1 in the Mouse Cerebellum

  • Park, Yong Soo;Jeon, Ji Hyun;Lee, Seung Hee;Paik, Sun Sook;Kim, In-Beom
    • Applied Microscopy
    • /
    • 제48권4호
    • /
    • pp.110-116
    • /
    • 2018
  • Since a transmembrane protein, TMEM16A, also called anoctamin 1 (ANO1), was identified as a bona fide calcium ($Ca^{2+}$)-activated chloride ($Cl^-$) channel (CaCC), there have been many reports on its expression and function. However, limited information on ANO1 expression and function in the brain is still available. In this study, we tried to reexamine expression patterns of ANO1 in the mouse cerebellum and further characterize ANO1-expressing components by immunohistochemical analyses. Strong ANO1 immunoreactivity was observed as large puncta in the granule cell layer and weak to moderate immunoreactivities were observed as small puncta in the molecular and Purkinje cell layers. Double-label experiments revealed that ANO1 did not colocalize with cerebellar neuronal population markers, such as anti-calbindin and anti-NeuN, while it colocalized or intermingled with a presynaptic marker, anti-synaptophysin. These results demonstrate that ANO1 is mainly localized at presynaptic terminals in the cerebellum and involved in synaptic transmission and modulation in cerebellar information processing.

SPAD과 CNN의 특성을 반영한 ToF 센서와 스테레오 카메라 융합 시스템 (Fusion System of Time-of-Flight Sensor and Stereo Cameras Considering Single Photon Avalanche Diode and Convolutional Neural Network)

  • 김동엽;이재민;전세웅
    • 로봇학회논문지
    • /
    • 제13권4호
    • /
    • pp.230-236
    • /
    • 2018
  • 3D depth perception has played an important role in robotics, and many sensory methods have also proposed for it. As a photodetector for 3D sensing, single photon avalanche diode (SPAD) is suggested due to sensitivity and accuracy. We have researched for applying a SPAD chip in our fusion system of time-of-fight (ToF) sensor and stereo camera. Our goal is to upsample of SPAD resolution using RGB stereo camera. Currently, we have 64 x 32 resolution SPAD ToF Sensor, even though there are higher resolution depth sensors such as Kinect V2 and Cube-Eye. This may be a weak point of our system, however we exploit this gap using a transition of idea. A convolution neural network (CNN) is designed to upsample our low resolution depth map using the data of the higher resolution depth as label data. Then, the upsampled depth data using CNN and stereo camera depth data are fused using semi-global matching (SGM) algorithm. We proposed simplified fusion method created for the embedded system.

No-Reference Image Quality Assessment based on Quality Awareness Feature and Multi-task Training

  • Lai, Lijing;Chu, Jun;Leng, Lu
    • Journal of Multimedia Information System
    • /
    • 제9권2호
    • /
    • pp.75-86
    • /
    • 2022
  • The existing image quality assessment (IQA) datasets have a small number of samples. Some methods based on transfer learning or data augmentation cannot make good use of image quality-related features. A No Reference (NR)-IQA method based on multi-task training and quality awareness is proposed. First, single or multiple distortion types and levels are imposed on the original image, and different strategies are used to augment different types of distortion datasets. With the idea of weak supervision, we use the Full Reference (FR)-IQA methods to obtain the pseudo-score label of the generated image. Then, we combine the classification information of the distortion type, level, and the information of the image quality score. The ResNet50 network is trained in the pre-train stage on the augmented dataset to obtain more quality-aware pre-training weights. Finally, the fine-tuning stage training is performed on the target IQA dataset using the quality-aware weights to predicate the final prediction score. Various experiments designed on the synthetic distortions and authentic distortions datasets (LIVE, CSIQ, TID2013, LIVEC, KonIQ-10K) prove that the proposed method can utilize the image quality-related features better than the method using only single-task training. The extracted quality-aware features improve the accuracy of the model.

Research on Community Knowledge Modeling of Readers Based on Interest Labels

  • Kai, Wang;Wei, Pan;Xingzhi, Chen
    • Journal of Information Processing Systems
    • /
    • 제19권1호
    • /
    • pp.55-66
    • /
    • 2023
  • Community portraits can deeply explore the characteristics of community structures and describe the personalized knowledge needs of community users, which is of great practical significance for improving community recommendation services, as well as the accuracy of resource push. The current community portraits generally have the problems of weak perception of interest characteristics and low degree of integration of topic information. To resolve this problem, the reader community portrait method based on the thematic and timeliness characteristics of interest labels (UIT) is proposed. First, community opinion leaders are identified based on multi-feature calculations, and then the topic features of their texts are identified based on the LDA topic model. On this basis, a semantic mapping including "reader community-opinion leader-text content" was established. Second, the readers' interest similarity of the labels was dynamically updated, and two kinds of tag parameters were integrated, namely, the intensity of interest labels and the stability of interest labels. Finally, the similarity distance between the opinion leader and the topic of interest was calculated to obtain the dynamic interest set of the opinion leaders. Experimental analysis was conducted on real data from the Douban reading community. The experimental results show that the UIT has the highest average F value (0.551) compared to the state-of-the-art approaches, which indicates that the UIT has better performance in the smooth time dimension.

바이오 물질 분석을 위한 금속 나노입자를 이용한 SERS 분석 연구동향 (A Review of SERS for Biomaterials Analysis Using Metal Nanoparticles)

  • 장의순
    • 세라미스트
    • /
    • 제22권3호
    • /
    • pp.281-300
    • /
    • 2019
  • Surface enhanced Raman scattering (SERS) was first discovered in 1974 by an unexpected Raman signal increase from Pyridine adsorbed on rough Ag electrode surfaces by the M. Fleishmann group. M. Moskovits group suggested that this phenomenon could be caused by surface plasmon resonance (SPR), which is a collective oscillation of free electrons at the surface of metal nanostructures by an external light source. After about 40 years, the SERS study has attracted great attention as a biomolecule analysis technology, and more than 2500 new papers and 500 review papers related to SERS topic have been published each year in recently. The advantages of biomaterials analysis using SERS are as follows; ① Molecular level analysis is possible based on unique fingerprint information of biomolecule, ② There is no photo-bleaching effect of the Raman reporters, allowing long-term monitoring of biomaterials compared to fluorescence microscopy, ③ SERS peak bandwidth is approximately 10 to 100 times narrower than fluorescence emission from organic phosphor or quantum dot, resulting in higher analysis accuracy, ④ Single excitation wavelength allows analysis of various biomaterials, ⑤ By utilizing near-infrared (NIR) SERS-activated nanostructures and NIR excitation lasers, auto-fluorescence noise in the visible wavelength range can be avoided from in vivo experiment and light damage in living cells can be minimized compared to visible lasers, ⑥ The weak Raman signal of the water molecule makes it easy to analyze biomaterials in aqueous solutions. For this reason, SERS is attracting attention as a next-generation non-invasive medical diagnostic device as well as substance analysis. In this review, the principles of SERS and various biomaterial analysis principles using SERS analysis will be introduced through recent research papers.