• Title/Summary/Keyword: pre-extraction

검색결과 510건 처리시간 0.028초

Generating Radiology Reports via Multi-feature Optimization Transformer

  • Rui Wang;Rong Hua
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제17권10호
    • /
    • pp.2768-2787
    • /
    • 2023
  • As an important research direction of the application of computer science in the medical field, the automatic generation technology of radiology report has attracted wide attention in the academic community. Because the proportion of normal regions in radiology images is much larger than that of abnormal regions, words describing diseases are often masked by other words, resulting in significant feature loss during the calculation process, which affects the quality of generated reports. In addition, the huge difference between visual features and semantic features causes traditional multi-modal fusion method to fail to generate long narrative structures consisting of multiple sentences, which are required for medical reports. To address these challenges, we propose a multi-feature optimization Transformer (MFOT) for generating radiology reports. In detail, a multi-dimensional mapping attention (MDMA) module is designed to encode the visual grid features from different dimensions to reduce the loss of primary features in the encoding process; a feature pre-fusion (FP) module is constructed to enhance the interaction ability between multi-modal features, so as to generate a reasonably structured radiology report; a detail enhanced attention (DEA) module is proposed to enhance the extraction and utilization of key features and reduce the loss of key features. In conclusion, we evaluate the performance of our proposed model against prevailing mainstream models by utilizing widely-recognized radiology report datasets, namely IU X-Ray and MIMIC-CXR. The experimental outcomes demonstrate that our model achieves SOTA performance on both datasets, compared with the base model, the average improvement of six key indicators is 19.9% and 18.0% respectively. These findings substantiate the efficacy of our model in the domain of automated radiology report generation.

음성 데이터의 내재된 감정인식을 위한 다중 감정 회귀 모델 (Multi-Emotion Regression Model for Recognizing Inherent Emotions in Speech Data)

  • 이명호;임명진;신주현
    • 스마트미디어저널
    • /
    • 제12권9호
    • /
    • pp.81-88
    • /
    • 2023
  • 최근 코로나19로 인한 비대면 서비스의 확산으로 온라인을 통한 소통이 증가하고 있다. 비대면 상황에서는 텍스트나 음성, 이미지 등의 모달리티를 통해 상대방의 의견이나 감정을 인식하고 있다. 현재 다양한 모달리티를 결합한 멀티모달 감정인식에 관한 연구가 활발하게 진행되고 있다. 그중 음성 데이터를 활용한 감정인식은 음향 및 언어정보를 통해 감정을 이해하는 수단으로 주목하고 있으나 대부분 단일한 음성 특징값으로 감정을 인식하고 있다. 하지만 대화문에는 다양한 감정이 복합적으로 존재하기 때문에 다중 감정을 인식하는 방법이 필요하다. 따라서 본 논문에서는 복합적으로 존재하는 내재된 감정인식을 위해 음성 데이터를 전처리한 후 특징 벡터를 추출하고 시간의 흐름을 고려한 다중 감정 회귀 모델을 제안한다.

저전력 장치를 위한 자원 효율적 객체 검출기 (Resource-Efficient Object Detector for Low-Power Devices)

  • 악세이 쿠마 샤마;김경기
    • 반도체공학회 논문지
    • /
    • 제2권1호
    • /
    • pp.17-20
    • /
    • 2024
  • 본 논문은 전통적인 자원 집약적인 컴퓨터 비전 모델의 한계를 해결하기 위해 저전력 엣지 장치에 최적화된 새로운 경량 객체 검출 모델을 제안합니다. 제안된 검출기는 Single Shot Detector (SSD)에 기반하여 소형이면서도 견고한 네트워크를 설계하였고, 작은 객체를 효율적으로 감지하는 데 있어 효율성을 크게 향상시키도록 모델을 구성하였다. 이 모델은 주로 두 가지 구성요소로 구성되어 있습니다: Depthwise 와 Pointwise Convolution 레이어를 사용하여 효율적인 특징 추출을 위한 Light_Block, 그리고 작은 객체의 향상된 감지를 위한 Enhancer_Block 으로 나누었다. 우리의 모델은 300x480 의 이미지 크기를 가진 Udacity 주석이 달린 데이터셋에서 처음부터 훈련되었으며, 사전 훈련된 분류 가중치의 필요성을 제거하였다. 약 0.43M 의 파라미터로 5.5MB 만의 무게를 가진 우리의 검출기는 평균 정밀도 (mAP) 27.7%와 140 FPS 의 처리 속도를 달성하여, 정밀도와 효율성 모두에서 기존 모델을 능가하였다. 따라서, 본 논문은 추론의 정확성을 손상시키지 않으면서 엣지 장치를 위한 객체 검출에서의 효과적인 경량화를 보여주고 있다.

Effectiveness of laser-engineered copper-nickel titanium versus superelastic nickel-titanium aligning archwires: A randomized clinical trial

  • Omar Khairullah Ahmed;Ammar Salim Kadhum
    • 대한치과교정학회지
    • /
    • 제54권1호
    • /
    • pp.16-25
    • /
    • 2024
  • Objective: To compare the effectiveness of laser-engineered copper-nickel titanium (SmartArch) and superelastic nickel-titanium (SENT) archwires in aligning teeth and inducing root resorption and pain experienced by patients. Methods: Two-arm parallel groups with a 1:1 allocation ratio were used. The participants were patients aged 11.5 years and older with 5-9 mm of mandibular anterior crowding who were indicated for non-extraction treatment. The primary outcome was alignment effectiveness, assessed using Little's irregularity index (LII) over 16 weeks with a single wire (0.016-inch) in the SmartArch group and 2 wires (0.014- and 0.018-inch) in the SENT group (8 weeks each). Secondary outcomes included root resorption evaluated by pre- and post-intervention periapical radiographs and pain levels recorded by the participants during the first week. Results: A total of 40 participants were randomly allocated into 2 groups; 33 completed the study and were analyzed (16 in the SmartArch group and 17 in the SENT group, aged 16.97 ± 4.05 years). The total LII decrease for the SmartArch and SENT groups was 5.63 mm and 5.29 mm, respectively, which was neither statistically nor clinically significant. Root resorption was not significantly different between the groups. The difference in pain levels was not statistically significant for the first 5 days following wire placement; however, there was a significant difference favoring the SENT group in the final 2 days. Conclusions: SmartArch and SENT archwires were similarly effective during the alignment phase of orthodontic treatment. Root resorption should be observed throughout the treatment with either wire. SmartArch wires demonstrated higher pain perception than SENT wires.

Transfer Learning for Caladium bicolor Classification: Proof of Concept to Application Development

  • Porawat Visutsak;Xiabi Liu;Keun Ho Ryu;Naphat Bussabong;Nicha Sirikong;Preeyaphorn Intamong;Warakorn Sonnui;Siriwan Boonkerd;Jirawat Thongpiem;Maythar Poonpanit;Akarasate Homwiseswongsa;Kittipot Hirunwannapong;Chaimongkol Suksomsong;Rittikait Budrit
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제18권1호
    • /
    • pp.126-146
    • /
    • 2024
  • Caladium bicolor is one of the most popular plants in Thailand. The original species of Caladium bicolor was found a hundred years ago. Until now, there are more than 500 species through multiplication. The classification of Caladium bicolor can be done by using its color and shape. This study aims to develop a model to classify Caladium bicolor using a transfer learning technique. This work also presents a proof of concept, GUI design, and web application deployment using the user-design-center method. We also evaluated the performance of the following pre-trained models in this work, and the results are as follow: 87.29% for AlexNet, 90.68% for GoogleNet, 93.59% for XceptionNet, 93.22% for MobileNetV2, 89.83% for RestNet18, 88.98% for RestNet50, 97.46% for RestNet101, and 94.92% for InceptionResNetV2. This work was implemented using MATLAB R2023a.

온라인 리뷰 분석을 통한 상품 평가 기준 추출: LDA 및 k-최근접 이웃 접근법을 활용하여 (Product Evaluation Criteria Extraction through Online Review Analysis: Using LDA and k-Nearest Neighbor Approach)

  • 이지현;정상형;김준호;민은주;여운영;김종우
    • 지능정보연구
    • /
    • 제26권1호
    • /
    • pp.97-117
    • /
    • 2020
  • 상품 평가 기준은 상품에 대한 속성, 가치 등을 표현한 지표로써 사용자나 기업이 상품을 측정하고 파악할 수 있게 한다. 기업이 자사 제품에 대한 객관적인 평가와 비교를 수행하기 위해서는 적절한 기준을 선정하는 것이 필수적이다. 이때, 평가 기준은 소비자들이 제품을 실제로 구매 및 사용 후 평가할 때 고려하는 제품의 특징을 반영하여야 한다. 그러나 기존에 사용되던 평가 기준은 제품마다 상이한 소비자의 의견을 반영하지 못하고 있다. 기존 연구에서는 소비자 의견이 반영된 온라인 리뷰를 통해 상품의 특징, 주제를 추출하고 이를 평가기준으로 사용했다. 하지만 여전히 상품과 연관성이 낮은 평가 기준이 추출되거나 부적절한 단어가 정제되지 않는 한계가 있다. 본 연구에서는 이를 극복하기 위해 잠재 디리클레 할당(Latent Dirichlet Allocation, LDA) 기법으로 리뷰로부터 평가 기준 후보군을 추출하고 이를 k-최근접 이웃 접근법(k-Nearest Neighbor Approach, k-NN)을 이용해 정제하는 모델을 개발하고 검증했다. 제시하는 방법은 준비 단계와 추출 단계로 이루어진다. 준비 단계에서는 워드임베딩(Word Embedding) 모델과 평가 기준 후보군을 정제하기 위한 k-NN 분류기를 생성한다. 추출 단계에서는 k-NN 분류기와 언급 비율을 이용해 평가 기준 후보군을 정제하고 최종 결과를 도출한다. 제안 모델의 성능 평가를 위해 명사 빈도 추출 모델, LDA 빈도 추출 모델, 실제 전자상거래 사이트가 제공하는 평가 기준을 세 비교 모델로 선정했다. 세 모델과의 비교를 위해 설문을 진행하고 점수화하여 결과를 검정했다. 30번의 검정 결과 26번의 결과에서 제안 모델이 우수함을 확인했다. 본 연구의 제안 모델은 전자상거래 사이트에서 리뷰 특성을 반영한 상품군 별 차원을 도출하는데 활용될 수 있고 이를 기초로 인사이트 발굴을 위한 리뷰 분석 및 활용에 크게 기여할 것이다.

무인항공기 영상 활용 자동 정합점 추출을 통한 KOMPSAT-3A 위성영상의 RPC 보정 (RPC Correction of KOMPSAT-3A Satellite Image through Automatic Matching Point Extraction Using Unmanned AerialVehicle Imagery)

  • 박주언;김태헌;이창희;한유경
    • 대한원격탐사학회지
    • /
    • 제37권5_1호
    • /
    • pp.1135-1147
    • /
    • 2021
  • 고해상도 위성영상의 기하보정을 위해 촬영 당시의 위성 센서와 지표면과의 기하학적 관계를 복원하는 센서모델링 과정이 필요하다. 이를 위해 일반적으로 고해상도 위성은 RPC (Rational Polynomial Coefficient) 정보를 제공하고 있지만, 제공 RPC는 위성 센서의 위치와 자세 등에 의해 발생하는 기하왜곡을 포함하고 있다. 이러한 RPC 오차를 보정하기 위해 일반적으로 지상기준점(Ground Control Points)을 활용한다. 지상기준점을 수집하는 대표적인 방법으로 현장 측량을 통해 지상좌표를 취득하지만, 이는 위성영상의 품질이나 촬영 시기에 따른 토지피복의 변화, 기복변위 등으로 위성영상 내에서 지상기준점을 판독하기에 어려운 문제가 있다. 이에 최근에는 다양한 센서로부터 취득된 영상지도를 참조자료로 이용하여, 영상정합 기법을 통해 지상기준점 수집을 자동화할 수 있다. 본 연구에서는 무인항공기 영상을 활용하여 추출된 정합점을 통해 KOMPSAT-3A 위성영상의 RPC를 보정하고자 한다. 무인항공기 영상과 KOMPSAT-3A 위성영상의 정합점 추출을 위한 전처리 방법을 제안하고, 대표적인 특징기반 정합기법(Feature-based matching method)과 영역기반 정합기법(Area-based matching method)인 SURF (Speeded-Up Robust Features)와 위상상관(Phase Correlation) 기법을 각각 적용하여 추출된 정합점의 특성을 비교하였다. 각 기법을 통해 추출된 정합점을 활용하여 RPC 보정계수를 산출한 후, GNSS (Global Navigation Satellite System) 측량을 통해 직접 취득한 검사점에 적용하여 KOMPSAT-3A의 기하품질을 향상하였다. 제안기법의 성능 및 활용성 검증을 위해 GCP를 이용하여 보정한 결과와 비교하여 분석하였다. GCP 기반 보정 방법은 제공 RPC보다 Sample은 2.14 pixel, Line은 5.43 pixel 만큼 개선된 보정 정확도를 보였다. 그리고 SURF와 위상상관 기법을 활용한 제안기법은 제공 RPC보다 각각 Sample은 0.83 pixel, 1.49 pixel만큼 보정되었으며, Line은 4.81 pixel, 5.19 pixel만큼 개선되었다. 이를 통해 GCP 기반 위성영상 RPC 보정 방법의 대안으로 무인항공기 영상이 활용될 수 있음을 확인하였다.

MORPHEUS: 확장성이 있는 비교 쇼핑 에이전트 (MORPHEUS: A More Scalable Comparison-Shopping Agent)

  • 양재영;김태형;최중민
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제28권2호
    • /
    • pp.179-191
    • /
    • 2001
  • 비교 쇼핑은 웹 상에 존재하는 웹 상점으로부터 구매를 원하는 상품에 대해 저렴한 가격을 찾아주는 일종의 판매자 중개 방법이다. 보다 쉽게 확장 가능한 비교 쇼핑 시스템을 생성하기 위해서 에이전트는 각각의 준 구조화된 상점으로부터 필요한 정보만을 추출할 수 있는 wrapper를 자동으로 생성해낼 수 있어야 한다. 웹 문서를 작성하기 위한 HTML은 포함하고 잇는 정보의 의미가 아닌 브라우저를 통한 정보의 표현에 대해서만 정의하고 있다. 또한 각 웹 상점들은 사용자의 다양한 상품 검색 요구를 수용하기 위해 다양한 상품 검색 방법과 검색 결과의 출력 형태를 가진다. 따라서 자동으로 필요한 정보만을 추출하는 wrapper의 생성은 어려운 작업이다. wrapper의 귀납적인 생성은 이러한 이질적인 환경을 극복하기 위한 기술이다. 그러나 Shopbot과 같은 기존의 확장 가능한 비교 쇼핑 에에전트는 원하는 상품 정도를 추출하기 위해 강한 바이어스에 의존한다. 따라서 Shopbot은 바이어스를 따르지 않는 많은 웹 상점으로부터 wrapper를 생성할 수 없다. 본 논문에서는 강한 바이어스를 사용하지 않고 wrapper를 생성해 낼 수 있는 비교 쇼핑 에이전트 시스템인 모피우스를 제안한다. 모피우스는 간단하면서도 견고한 학습 알고리즘을 바탕으로 wrapper를 생성한다. 제안하는 학습 알고리즘의 핵심은 상품 검색 결과를 논리적 라인으로 나누고 여기서 나타나는 상품 설명 단위의 패턴으로 wrapper를 생성하는 것이다. 모피우스 대부분의 웹 상점에 대한 wrapper를 정확하게 생성해 낸다. 또한 학습하려는 검색 결과에 노이즈가 존재하는 경우에도 wrapper를 정확하게 추출할 수 있다. 모피우스는 헤더나 광고와 같은 불필요한 정보들을 제거하는 별도의 단계를 거치지 않으므로 wrapper를 빠르게 생성한다. 궁극적으로 모피우스는 새로운 웹 상점을 사용자가 자유롭게 추가, 삭제할 수 있는 환경을 제공한다.

  • PDF

수직적 안모유헝에 따른 치료 후 교합평면 안정성에 관한 연구 (Post-treatment stability of the occlusal plane according to different vertical facial patterns)

  • 박정은;이진우;정동화;차경석
    • 대한치과교정학회지
    • /
    • 제36권5호
    • /
    • pp.369-379
    • /
    • 2006
  • 본 연구는 수직적 안모유형에 따른 치료 후 교합평면 변화양상을 조사하여 향후 적절한 치료계획과 기전의 설정에 도움이 되고자 시행하였다. 골격성 I급 부정교합으로 진단되어 비발치로 치료받은 성민 60명(남자 28명, 여자 32명)을 대상으로 하였으며, Ricketts법의 facial axis, facial depth, mandibular plane angle, lower face height, mandibular arc의 5개 항목을 이용하여 한국 성인의 정상교합자 통계치의 기준에 따라 short face type (1군), average face type (2군), long face type (3군)으로 분류하였다. 각 군의 치료 전, 치료 종료, 종료 후 1년의 측모두부 방사선사진 계측치를 비교 분석하였다. 1군은 치료 종료 시와 비교하여 유지기간에 일반적 교합평면각, 기능적 교합 평면각, L6/L1, MP-L6 항목이 유의하게 감소하였고(p < 0.01) L1-FOP 항목은 유의하게 증가하였다(p < 0.001). 2군은 유지기간에 유의한 변화를 보이지 않았으며 3군은 유지기간에 기능적 교합평면각이 유의하게 증가하였다(p < 0.05). 기능적 교합평면각의 치료 후 변화량은 각 군 간에 유의한 차이를 보였으며 특히, 1군과 3군 간에 매우 큰 유의성을 보였다. 따라서 치아의 압하, 정출 및 치료 후 전치부 피개 등에 있어 유지기간 중 교합평면각 변화의 고려가 필요하다고 생각된다.

다수의 영상간 효율적인 스티칭을 위한 카메라 센서 정보 기반 영상 그룹핑 기술 (Images Grouping Technology based on Camera Sensors for Efficient Stitching of Multiple Images)

  • 임지헌;이의상;김회정;김규헌
    • 방송공학회논문지
    • /
    • 제22권6호
    • /
    • pp.713-723
    • /
    • 2017
  • 파노라마 영상은 카메라 시야각의 제한을 극복하여 넓은 시야를 가질 수 있으므로 컴퓨터 비전, 스테레오 카메라 등의 분야에서 효율적으로 연구되고 있다. 파노라마 영상을 생성하기 위해서는 왜곡이 생기는 광각 카메라를 사용하는 대신 다수의 일반 카메라로 촬영한 영상들을 스티칭 하는 것이 영상의 왜곡 현상을 줄일 수 있기에 많이 활용되어지고 있다. 영상 스티칭 기술은 여러 영상에서 추출한 특징점의 디스크립터를 생성하고, 특징점들 간의 유사도를 비교하여 영상들을 이어 붙여 큰 하나의 영상으로 만드는 것이다. 각각의 특징점은 수십 수백차원의 정보를 가지고 있고, 스티칭 할 영상이 많아질수록 데이터 처리 시간이 증가하게 된다. 특히, 하나의 객체에 대하여 다수의 불특정 카메라에 의해 촬영한 영상들을 기반으로 파노라마를 생성할 경우, 유사한 영상들에 대한 중복적 특징점 추출의 과정을 거치기에 그 처리 시간은 더욱 증가한다. 본 논문에서는 이와 같이, 하나의 객체 또는 환경에 대하여 불특정 다수의 카메라에서 획득한 영상을 기반으로 스티칭을 효율적으로 처리하기 위한 전처리 과정을 제안한다. 그 방법으로 카메라 센서 정보를 기반으로 영상들을 미리 그룹화 하여 한 번에 스티칭 할 영상의 수를 줄임으로써 데이터 처리 시간을 줄일 수 있다. 후에 계층적으로 스티칭 하여 하나의 큰 파노라마를 만든다. 본 논문에서 제안한 그룹핑 전처리를 통해 다수의 영상을 대상으로 한 스티칭 시간이 대폭 감소하는 것을 실험 결과를 통해 검증하였다.