• 제목/요약/키워드: retina detection

검색결과 56건 처리시간 0.027초

윤곽 검출용 CMOS 시각칩을 이용한 물체 추적 시스템 요소 기술 연구 (Fundamental research of the target tracking system using a CMOS vision chip for edge detection)

  • 현효영;공재성;신장규
    • 센서학회지
    • /
    • 제18권3호
    • /
    • pp.190-196
    • /
    • 2009
  • In a conventional camera system, a target tracking system consists of a camera part and a image processing part. However, in the field of the real time image processing, the vision chip for edge detection which was made by imitating the algorithm of humanis retina is superior to the conventional digital image processing systems because the human retina uses the parallel information processing method. In this paper, we present a high speed target tracking system using the function of the CMOS vision chip for edge detection.

화재 재난 상황 인식을 위한 객체 검출 (Object detection for Fire Disaster Situation Recognition)

  • 김태성;방재연;서정운;손경아
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2022년도 추계학술발표대회
    • /
    • pp.426-428
    • /
    • 2022
  • 화재 상황에서의 빠른 현장 파악은 인명피해를 줄이는데 중요한 요소이다. 기존 연구의 화재와 관련된 데이터셋들은 대부분 불과 연기를 라벨링하여 화재의 예방에 초점을 두고 있다. 본 연구에서는 화재 상황에서 사람과 소방관, 연기, 불을 탐지하는 Object detection 모델을 만들어 현장 파악에 더욱 도움을 주고자 하였다. 이를 위해 화재 상황 이미지 약 3000장을 수집하고 라벨링하여 데이터셋을 구성하였으며 이를 이용해 객체 검출 모델인 RetinaNet을 학습하였다. 또한, 화재 상황에서 Object Detection 모델의 성능을 향상시키기 위해 기존 모델인 RetinaNet에 Dehazing(FFA-Net), Smoke augmentation, semi-supervised(ISD) 방법을 적용하였고, semi-supervised 조건에서 mAP 63.7로 가장 높은 성능을 도출하였다.

재난지역에서의 신속한 건물 피해 정도 감지를 위한 딥러닝 모델의 정량 평가 (Quantitative Evaluations of Deep Learning Models for Rapid Building Damage Detection in Disaster Areas)

  • 서준호;양병윤
    • 한국측량학회지
    • /
    • 제40권5호
    • /
    • pp.381-391
    • /
    • 2022
  • 본 연구는 AI 기법 중에 최근 널리 사용되고 있는 딥러닝 모델들을 비교하여 재난으로 인해 손상된 건물의 신속한 감지에 가장 적합한 모델을 선정하는 데 목적이 있다. 먼저, 신속한 객체감지에 적합한 1단계 기반 검출기 중 주요 딥러닝 모델인 SSD-512, RetinaNet, YOLOv3를 후보 모델로 선정하였다. 이 방법들은 1단계 기반 검출기 방식을 적용한 모델로서 객체 인식 분야에 널리 이용되고 있다. 이 모델들은 객체 인식 처리방식의 구조와 빠른 연산의 장점으로 인해 객체 인식 분야에 널리 사용되고 있으나 재난관리에서의 적용은 초기 단계에 머물러 있다. 본 연구에서는 피해감지에 가장 적합한 모델을 찾기 위해 다음과 같은 과정을 거쳤다. 먼저, 재난에 의한 건물의 피해 정도 감지를 위해 재난에 의해 손상된 건물로 구성된 xBD 데이터셋을 활용하여 초고해상도 위성영상을 훈련시켰다. 다음으로 모델 간의 성능을 비교·평가하기 위하여 모델의 감지 정확도와 이미지 처리속도를 정량적으로 분석하였다. 학습 결과, YOLOv3는 34.39%의 감지 정확도와 초당 46개의 이미지 처리속도를 기록하였다. RetinaNet은 YOLOv3보다 1.67% 높은 36.06%의 감지 정확도를 기록하였으나, 이미지 처리속도는 YOLOv3의 3분의 1에 그쳤다. SSD-512는 두 지표에서 모두 YOLOv3보다 낮은 수치를 보였다. 대규모 재난에 의해 발생한 피해 정보에 대한 신속하고 정밀한 수집은 재난 대응에 필수적이다. 따라서 본 연구를 통해 얻은 결과는 신속한 지리정보 취득이 요구되는 재난관리에 효과적으로 활용될 수 있을 것이라 기대한다.

Object detection in financial reporting documents for subsequent recognition

  • Sokerin, Petr;Volkova, Alla;Kushnarev, Kirill
    • International journal of advanced smart convergence
    • /
    • 제10권1호
    • /
    • pp.1-11
    • /
    • 2021
  • Document page segmentation is an important step in building a quality optical character recognition module. The study examined already existing work on the topic of page segmentation and focused on the development of a segmentation model that has greater functional significance for application in an organization, as well as broad capabilities for managing the quality of the model. The main problems of document segmentation were highlighted, which include a complex background of intersecting objects. As classes for detection, not only classic text, table and figure were selected, but also additional types, such as signature, logo and table without borders (or with partially missing borders). This made it possible to pose a non-trivial task of detecting non-standard document elements. The authors compared existing neural network architectures for object detection based on published research data. The most suitable architecture was RetinaNet. To ensure the possibility of quality control of the model, a method based on neural network modeling using the RetinaNet architecture is proposed. During the study, several models were built, the quality of which was assessed on the test sample using the Mean average Precision metric. The best result among the constructed algorithms was shown by a model that includes four neural networks: the focus of the first neural network on detecting tables and tables without borders, the second - seals and signatures, the third - pictures and logos, and the fourth - text. As a result of the analysis, it was revealed that the approach based on four neural networks showed the best results in accordance with the objectives of the study on the test sample in the context of most classes of detection. The method proposed in the article can be used to recognize other objects. A promising direction in which the analysis can be continued is the segmentation of tables; the areas of the table that differ in function will act as classes: heading, cell with a name, cell with data, empty cell.

수술 동영상에서의 인공지능을 사용한 출혈 검출 연구 (A Study on the Bleeding Detection Using Artificial Intelligence in Surgery Video)

  • 정시연;김영재;김광기
    • 대한의용생체공학회:의공학회지
    • /
    • 제44권3호
    • /
    • pp.211-217
    • /
    • 2023
  • Recently, many studies have introduced artificial intelligence systems in the surgical process to reduce the incidence and mortality of complications in patients. Bleeding is a major cause of operative mortality and complications. However, there have been few studies conducted on detecting bleeding in surgical videos. To advance the development of deep learning models for detecting intraoperative hemorrhage, three models have been trained and compared; such as, YOLOv5, RetinaNet50, and RetinaNet101. We collected 1,016 bleeding images extracted from five surgical videos. The ground truths were labeled based on agreement from two specialists. To train and evaluate models, we divided the datasets into training data, validation data, and test data. For training, 812 images (80%) were selected from the dataset. Another 102 images (10%) were used for evaluation and the remaining 102 images (10%) were used as the evaluation data. The three main metrics used to evaluate performance are precision, recall, and false positive per image (FPPI). Based on the evaluation metrics, RetinaNet101 achieved the best detection results out of the three models (Precision rate of 0.99±0.01, Recall rate of 0.93±0.02, and FPPI of 0.01±0.01). The information on the bleeding detected in surgical videos can be quickly transmitted to the operating room, improving patient outcomes.

형광안저 조영영상에서 선택적 영역침식을 이용한 맥락막혈관영상 향상 (Enhancement of a Choroid Vessel Using Conditional Erosion in ICGA Image)

  • 정지운;김필운;이윤정;김명남
    • 한국멀티미디어학회논문지
    • /
    • 제12권8호
    • /
    • pp.1073-1081
    • /
    • 2009
  • 본 논문에서는 망막혈관의 밝기를 저하시킴으로써 맥락막혈관을 향상시킬 수 있는 새로운 방법을 제안하였다. 맥락막혈관신생 현상은 실명과 관련이 있는 것으로 알려져 있으며 이 현상의 주요 특징은 맥락막에 새로운 혈관의 발생이다. 인도시아닌 형광안저 조영영상에서 맥락막혈관의 밝기보다 망막혈관의 밝기가 더 크기 때문에 맥락막혈관을 관찰하기가 어렵다. 따라서 정화한 진단을 위해서는 영상에서 맥락막혈관의 밝기가 향상될 필요가 있다. 제안한 향상 방법은 3단계에 걸쳐 수행된다. 먼저, 다중크기 향상기법, 히스테리시스 문턱화, KNN 분류법을 이용하여 망막혈관을 검출하고 이로 부터 망막혈관 마스크영상을 만든다. 그런 다음, 마스크영역이 없애질 때까지 마스크영역과 제안한 선택적 영역침식방식을 이용하여 망막혈관의 밝기를 저하시킨다. 최종적으로 처리된 영상에 대하여 맥락막혈관의 밝기를 향상시켰다. 실험을 통하여 제안한 방법이 안정적이고 효과적임을 확인하였다.

  • PDF

면역조직화학적 방법을 이용한 흰쥐의 호모시스테인 수준과 망막 손상의 관련성 연구 (Effects of Hyperhomocysteinemia on the Immunohistochemical Reactivity for Vimentin in the Retinal Glial Cell)

  • 이인선;이화영;장남수
    • Journal of Nutrition and Health
    • /
    • 제38권2호
    • /
    • pp.96-103
    • /
    • 2005
  • It has been suggested that the elevated plasma homocysteine may lead to retinal dysfunction. We investigated the effects of plasma levels of homocysteine and folate on the retinal glial cells' injuries. Male Sprague-Dawley rats were raised either on a control diet or on an experimental diet containing 3.0 g/kg homocystine without folic acid for 10 weeks. Plasma homocysteine concentrations were measured by a HPLC-fluorescence detection method. Plasma folate and vitamin B/sub 12/ levels were analyzed by a radioimmunoassay. The response of Muller cells which are the principal glial cells of the retina was immunohistochemically examined using an antibody for vimentin, a cytoskeletal protein belonging to the family of intermediate filament. At 2 weeks, the homocystine diet induced a twofold increase in plasma homocysteine, and a concomitant increase in the expression of vimentin in the Muller cells' processes spanning from the inner to outer membranes of the retina indicating arterial degeneration. At 10 weeks, the homocystine diet induced a fourfold increase in plasma homocystine, but vimentin immunoreactivity in the retinas was similar in both groups. In conclusion, increased plasma homocysteine levels have influence on morphological and functional changes of Muller cells in the retina. (Korean J Nutrition 38(2): 96~103, 2005)

Retina-Motivated CMOS Vision Chip Based on Column Parallel Architecture and Switch-Selective Resistive Network

  • Kong, Jae-Sung;Hyun, Hyo-Young;Seo, Sang-Ho;Shin, Jang-Kyoo
    • ETRI Journal
    • /
    • 제30권6호
    • /
    • pp.783-789
    • /
    • 2008
  • A bio-inspired vision chip for edge detection was fabricated using 0.35 ${\mu}m$ double-poly four-metal complementary metal-oxide-semiconductor technology. It mimics the edge detection mechanism of a biological retina. This type of vision chip offer several advantages including compact size, high speed, and dense system integration. Low resolution and relatively high power consumption are common limitations of these chips because of their complex circuit structure. We have tried to overcome these problems by rearranging and simplifying their circuits. A vision chip of $160{\times}120$ pixels has been fabricated in $5{\times}5\;mm^2$ silicon die. It shows less than 10 mW of power consumption.

  • PDF

재구조화된 RetinaNet을 활용한 객체 탐지에 관한 연구 (A Study on Object Detection using Restructured RetinaNet)

  • 김준영;정세훈;심춘보
    • 한국멀티미디어학회논문지
    • /
    • 제23권12호
    • /
    • pp.1531-1539
    • /
    • 2020
  • Searching for portable baggage through the system before boarding an airplane at an airport is important because it prevents many risks. In addition to these dangerous items, personal and confidential information leaks are occurring at airports through data storage devices. In the airport search system, there is a need for a system that searches not only dangerous items but also devices that can leak data. In this paper, we proposed a model that searches for a data storage device by improving the existing model. A comparative evaluation was conducted using existing algorithms. As a result, it was confirmed that the performance of the proposed model is 74 in the training data and 46.73 in the test data, which is superior to the existing model.

국소 광적응 기능을 가지는 윤곽검출용 32x32 방사형 CMOS 시각칩의 설계 및 제조 (Design and Fabrication of 32x32 Foveated CMOS Retina Chip for Edge Detection with Local-Light Adaptation)

  • 박대식;박종호;김경문;이수경;김현수;김정환;이민호;신장규
    • 센서학회지
    • /
    • 제11권2호
    • /
    • pp.84-92
    • /
    • 2002
  • 국소 광적응 기능을 가지는 윤곽검출용 시각칩을 픽셀수 $32{\times}32$의 방사형 구조로 CMOS 공정기술을 이용하여 설계 및 제조하였다. 생체의 망막은 넓은 범위의 입력 광강도에 대해서 물체의 윤곽을 검출할 수 있다. 본 연구에서는 시세포, 수평세포, 쌍극세포로 이루어진 망막의 윤곽검출 기능을 모델링하여 윤곽검출용 인공시각칩을 설계하였다 국소 광적응을 위해 입력 광강도에 따라 수용야의 크기를 국소적으로 바뀌게 하였다. 아울러 단위셀을 방사형으로 배치함으로써 영상데이터의 양을 감소시킴과 동시에 칩의 중심부분으로 갈수록 해상도가 높아지도록 설계하였다. 설계된 칩은 $0.6\;{\mu}m$ double-poly triple-metal 표준 CMOS 공정기술을 이용하여 제조되었으며, HSPICE 시뮬레이션으로 성능을 최적화 시켰다.