• Title/Summary/Keyword: Automatic extraction

Search Result 879, Processing Time 0.029 seconds

Generating Radiology Reports via Multi-feature Optimization Transformer

  • Rui Wang;Rong Hua
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제17권10호
    • /
    • pp.2768-2787
    • /
    • 2023
  • As an important research direction of the application of computer science in the medical field, the automatic generation technology of radiology report has attracted wide attention in the academic community. Because the proportion of normal regions in radiology images is much larger than that of abnormal regions, words describing diseases are often masked by other words, resulting in significant feature loss during the calculation process, which affects the quality of generated reports. In addition, the huge difference between visual features and semantic features causes traditional multi-modal fusion method to fail to generate long narrative structures consisting of multiple sentences, which are required for medical reports. To address these challenges, we propose a multi-feature optimization Transformer (MFOT) for generating radiology reports. In detail, a multi-dimensional mapping attention (MDMA) module is designed to encode the visual grid features from different dimensions to reduce the loss of primary features in the encoding process; a feature pre-fusion (FP) module is constructed to enhance the interaction ability between multi-modal features, so as to generate a reasonably structured radiology report; a detail enhanced attention (DEA) module is proposed to enhance the extraction and utilization of key features and reduce the loss of key features. In conclusion, we evaluate the performance of our proposed model against prevailing mainstream models by utilizing widely-recognized radiology report datasets, namely IU X-Ray and MIMIC-CXR. The experimental outcomes demonstrate that our model achieves SOTA performance on both datasets, compared with the base model, the average improvement of six key indicators is 19.9% and 18.0% respectively. These findings substantiate the efficacy of our model in the domain of automated radiology report generation.

GIS 기반의 하천망분석도 집수구역 자동 분할을 위한 알고리듬 및 모듈 개발 (GIS based Development of Module and Algorithm for Automatic Catchment Delineation Using Korean Reach File)

  • 박용길;김계현;유재현
    • 한국지리정보학회지
    • /
    • 제20권4호
    • /
    • pp.126-138
    • /
    • 2017
  • 최근 환경에 대한 국민적 관심이 증대되고 있으며 물환경 관련 문제에 대한 신속하고 정확한 대응을 위해 GIS를 활용한 물환경데이터의 분석에 대한 지원요구가 증가함에 따라 물환경데이터의 공간분석을 지원하는 공간네트워크 데이터기반의 하천망분석도를 개발하여 제공하고 있다. 그러나 오염사고 등 사용자의 필요에 따라 수시로 요구되는 공간자료인 집수구역의 분할에 어려움을 겪고 있는 실정이다. 따라서 본 연구에서는 수치표고모델 및 흐름방향도를 이용한 집수구역 자동 분할 알고리듬 및 모듈 개발을 포함하는 자동분할 프로그램의 개발이 이루어졌다. 집수구역 자동분할 프로그램의 개발은 집수구역 분할 방법 설계, 알고리듬 개발, 모듈 개발의 순서로 진행하였다. 집수구역 분할을 위해 수치표고자료와 이를 기반으로 제작된 흐름방향도를 활용하였다. 집수구역 분할을 위한 알고리듬은 집수구역 격자추출단계, 경계점 추출단계 및 경계선 분할 단계의 3단계로 개발되었으며 집수구역 분할모듈은 프로그램의 생산성과 활용성을 고려하여 ESRI사의 ArcGIS를 기반으로 하는 Add-in 모듈로 개발하였다. 집수구역 자동분할 모듈을 이용하여 실제 집수구역을 분할하였으며, 현재 활용중인 집수구역과 비교 분석하였다. 집수구역 분할 결과 수치표고자료 기반의 집수구역 분할이 원활하게 이루어지는 것을 확인하였다. 특히 지형학적 경사가 명확한 지역은 집수구역의 분할이 정확하고 신속하게 이루어지는 것을 확인할 수 있었다. 논, 밭, 도심지역 등 평평한 곳이나 배수시설이 정비된 지역의 경우 집수구역의 분할이 이루어지지 않는 경우가 있었으나 전반적으로 기존 집수구역의 분할시간을 줄이는데 기여가 클 것으로 판단되었다. 향후에는 보다 정밀한 수치표고자료의 활용이 가능하면서 자료 크기로 인한 계산 시간을 줄이기 위한 알고리듬의 개발이 필요하다.

RSS와 OLAP 큐브를 이용한 FOAF의 동적 관리 기법 (A Dynamic Management Method for FOAF Using RSS and OLAP cube)

  • 손종수;정인정
    • 지능정보연구
    • /
    • 제17권2호
    • /
    • pp.39-60
    • /
    • 2011
  • 웹 2.0 기술이 소개된 이후 소셜 네트워크 서비스는 미래 정보기술의 기초로서 중요하게 인식되고 있다. 이에, 웹2.0 환경에서 소셜 네트워크를 구축하기 위하여 온톨로지 기반의 사용자 프로필 기술 도구인 FOAF를 활용하기 위한 다양한 연구가 이뤄지고 있다. 그러나 FOAF를 이용하여 소셜 네트워크를 생성 및 관리하는 대부분의 방법은 시간의 흐름에 따라 변화하는 사용자의 소셜 네트워크를 자동적으로 반영하기 어려운 단점이 있으며 다양한 소셜 미디어 서비스가 제공되는 환경에서는 FOAF를 동적으로 관리하기가 쉽지 않다. 따라서 본 논문에서는 기존 FOAF를 이용한 소셜 네트워크 추출방법의 한계를 극복하기 위하여 사용자 프로파일 기술 언어인 FOAF와 웹 저작물 출판 매커니즘인 RSS를 OLAP 시스템에 적용시켜 동적으로 FOAF를 갱신하고 관리하기 위한 방법을 제안한다. 본 논문에서 제안하는 방법은 수집한 FOAF와 RSS 파일들을 스타스키마로 설계된 데이터베이스에 넣어 OLAP 큐브를 생성한다. 그리고 OLAP 연산을 이용하여 사용자의 연결관계를 분석하고 FOAF에 그 결과를 반영한다. 본 논문에서 제안하는 방법은 이기종 분산처리 환경 하에서 데이터의 상호호환성을 보장할 뿐만 아니라 시간의 흐름에 따른 사용자의 관심 및 이슈 등의 변화를 효과적으로 반영한다.

관심 문자열 인식 기술을 이용한 가스계량기 자동 검침 시스템 (Automatic gasometer reading system using selective optical character recognition)

  • 이교혁;김태연;김우주
    • 지능정보연구
    • /
    • 제26권2호
    • /
    • pp.1-25
    • /
    • 2020
  • 본 연구에서는 모바일 기기를 이용하여 획득한 가스계량기 사진을 서버로 전송하고, 이를 분석하여 가스 사용량 및 계량기 기물 번호를 인식함으로써 가스 사용량에 대한 과금을 자동으로 처리할 수 있는 응용 시스템 구조를 제안하고자 한다. 모바일 기기는 일반인들이 사용하는 스마트 폰에 준하는 기기를 사용하였으며, 획득한 이미지는 가스 공급사의 사설 LTE 망을 통해 서버로 전송된다. 서버에서는 전송받은 이미지를 분석하여 가스계량기 기물 번호 및 가스 사용량 정보를 추출하고, 사설 LTE 망을 통해 분석 결과를 모바일 기기로 회신한다. 일반적으로 이미지 내에는 많은 종류의 문자 정보가 포함되어 있으나, 본 연구의 응용분야인 가스계량기 자동 검침과 같이 많은 종류의 문자 정보 중 특정 형태의 문자 정보만이 유용한 분야가 존재한다. 본 연구의 응용분야 적용을 위해서는 가스계량기 사진 내의 많은 문자 정보 중에서 관심 대상인 기물 번호 및 가스 사용량 정보만을 선별적으로 검출하고 인식하는 관심 문자열 인식 기술이 필요하다. 관심 문자열 인식을 위해 CNN (Convolutional Neural Network) 심층 신경망 기반의 객체 검출 기술을 적용하여 이미지 내에서 가스 사용량 및 계량기 기물번호의 영역 정보를 추출하고, 추출된 문자열 영역 각각에 CRNN (Convolutional Recurrent Neural Network) 심층 신경망 기술을 적용하여 문자열 전체를 한 번에 인식하였다. 본 연구에서 제안하는 관심문자열 기술 구조는 총 3개의 심층 신경망으로 구성되어 있다. 첫 번째는 관심 문자열 영역을 검출하는 합성곱신경망이고, 두 번째는 관심 문자열 영역 내의 문자열 인식을 위해 영역 내의 이미지를 세로 열 별로 특징 추출하는 합성곱 신경망이며, 마지막 세 번째는 세로 열 별로 추출된 특징 벡터 나열을 문자열로 변환하는 시계열 분석 신경망이다. 관심 문자열은 12자리 기물번호 및 4 ~ 5 자리 사용량이며, 인식 정확도는 각각 0.960, 0.864 이다. 전체 시스템은 Amazon Web Service 에서 제공하는 클라우드 환경에서 구현하였으며 인텔 제온 E5-2686 v4 CPU 및 Nvidia TESLA V100 GPU를 사용하였다. 1일 70만 건의 검침 요청을 고속 병렬 처리하기 위해 마스터-슬레이브 처리 구조를 채용하였다. 마스터 프로세스는 CPU 에서 구동되며, 모바일 기기로 부터의 검침 요청을 입력 큐에 저장한다. 슬레이브 프로세스는 문자열 인식을 수행하는 심층 신경망으로써, GPU에서 구동된다. 슬레이브 프로세스는 입력 큐에 저장된 이미지를 기물번호 문자열, 기물번호 위치, 사용량 문자열, 사용량 위치 등으로 변환하여 출력 큐에 저장한다. 마스터 프로세스는 출력 큐에 저장된 검침 정보를 모바일 기기로 전달한다.

국어사전을 이용한 한국어 명사에 대한 상위어 자동 추출 및 WordNet의 프로토타입 개발 (The Automatic Extraction of Hypernyms and the Development of WordNet Prototype for Korean Nouns using Korean MRD (Machine Readable Dictionary))

  • 김민수;김태연;노봉남
    • 한국정보처리학회논문지
    • /
    • 제2권6호
    • /
    • pp.847-856
    • /
    • 1995
  • 인간은 문장 안에 있는 명사를 인식할 때 그 명사의 상위 개념을 머리에 떠올린다. 컴퓨터에게 인간의 단어 인식작용을 시뮬레이션하기 위해서는 단어의 상위 개념(상위어) 을 지식 베이스(WordNet)로 구축해야만 한다. 현재 한국에서는 많은 인력과 시간이 소요되기 때문에 WordNet의 작업을 시작하지 못하였으나 컴퓨터의 성능이 급격히 향상 되고 상용화된 MRD(Machine Readable Dictionary)가 이용하능하게 됨에 따라 자동으로 WordNet 구축의 가능성을 보이고 있다. 본 논문에서는 한국어 MRD(Machine Readable Dictionary)의 명사의 정의 (description)를 이용하여 자동으로 한국어 명사 WordNet 을 구축하는 방법을 제안한다. 한국어 문장의 구조적인 특징을 분석하여 상위 개념 (상위어)를 추출하는 규칙을 제안한다. 그것은 중심적인 말이 보통 뒤에 나타난다는 것과 명사의 정의는 특수한 구조를 갖는다는 것을 반영하였다. 또한, 이러한 규칙에 의해 만들어진 상위어들을 결합한 한국어 명사의 WordNet프로토타입을 개발 하였다. 약 250개 표본 단어의 상위어를 추출한 결과 약 92여 퍼센트가 상위어가 옳게 추출 되었다.

  • PDF

MORPHEUS: 확장성이 있는 비교 쇼핑 에이전트 (MORPHEUS: A More Scalable Comparison-Shopping Agent)

  • 양재영;김태형;최중민
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제28권2호
    • /
    • pp.179-191
    • /
    • 2001
  • 비교 쇼핑은 웹 상에 존재하는 웹 상점으로부터 구매를 원하는 상품에 대해 저렴한 가격을 찾아주는 일종의 판매자 중개 방법이다. 보다 쉽게 확장 가능한 비교 쇼핑 시스템을 생성하기 위해서 에이전트는 각각의 준 구조화된 상점으로부터 필요한 정보만을 추출할 수 있는 wrapper를 자동으로 생성해낼 수 있어야 한다. 웹 문서를 작성하기 위한 HTML은 포함하고 잇는 정보의 의미가 아닌 브라우저를 통한 정보의 표현에 대해서만 정의하고 있다. 또한 각 웹 상점들은 사용자의 다양한 상품 검색 요구를 수용하기 위해 다양한 상품 검색 방법과 검색 결과의 출력 형태를 가진다. 따라서 자동으로 필요한 정보만을 추출하는 wrapper의 생성은 어려운 작업이다. wrapper의 귀납적인 생성은 이러한 이질적인 환경을 극복하기 위한 기술이다. 그러나 Shopbot과 같은 기존의 확장 가능한 비교 쇼핑 에에전트는 원하는 상품 정도를 추출하기 위해 강한 바이어스에 의존한다. 따라서 Shopbot은 바이어스를 따르지 않는 많은 웹 상점으로부터 wrapper를 생성할 수 없다. 본 논문에서는 강한 바이어스를 사용하지 않고 wrapper를 생성해 낼 수 있는 비교 쇼핑 에이전트 시스템인 모피우스를 제안한다. 모피우스는 간단하면서도 견고한 학습 알고리즘을 바탕으로 wrapper를 생성한다. 제안하는 학습 알고리즘의 핵심은 상품 검색 결과를 논리적 라인으로 나누고 여기서 나타나는 상품 설명 단위의 패턴으로 wrapper를 생성하는 것이다. 모피우스 대부분의 웹 상점에 대한 wrapper를 정확하게 생성해 낸다. 또한 학습하려는 검색 결과에 노이즈가 존재하는 경우에도 wrapper를 정확하게 추출할 수 있다. 모피우스는 헤더나 광고와 같은 불필요한 정보들을 제거하는 별도의 단계를 거치지 않으므로 wrapper를 빠르게 생성한다. 궁극적으로 모피우스는 새로운 웹 상점을 사용자가 자유롭게 추가, 삭제할 수 있는 환경을 제공한다.

  • PDF

비선형 피부색 변화 모델을 이용한 실감적인 표정 합성 (Synthesis of Realistic Facial Expression using a Nonlinear Model for Skin Color Change)

  • 이정호;박현;문영식
    • 전자공학회논문지CI
    • /
    • 제43권3호
    • /
    • pp.67-75
    • /
    • 2006
  • 얼굴의 표정은 얼굴의 구성요소같은 기하학적 정보와 조명이나 주름 같은 세부적인 정보들로 표현된다. 얼굴 표정은 기하학적 변형만으로는 실감적인 표정을 생성하기 힘들기 때문에 기하학적 변형과 더불어 텍스처 같은 세부적인 정보도 함께 변형해야만 실감적인 표현을 할 수 있다. 표정비율이미지 (Expression Ratio Image)같은 얼굴 텍스처의 세부적인 정보를 변형하기 위한 기존 방법들은 조명에 따른 피부색의 변화를 정확히 표현할 수 없는 단점이 있다. 따라서 본 논문에서는 이러한 문제를 해결하기 위해 서로 다른 조명 조건에서도 실감적인 표정 텍스처 정보를 적용할 수 있는 비선형 피부색 모델 기반의 표정 합성방법을 제안한다. 제안된 방법은 동적 외양 모델을 이용한 자동적인 얼굴 특징 추출과 와핑을 통한 표정 변형 단계, 비선형 피부색 변화 모델을 이용한 표정 생성 단계, 유클리디 거리 변환 (Euclidean Distance Transform)에 의해 계산된 혼합 비율을 사용한 원본 얼굴 영상과 생성된 표정의 합성 등 총 3 단계로 구성된다. 실험결과는 제안된 방법이 다양한 조명조건에서도 자연스럽고 실감적인 표정을 표현한다는 것을 보인다.

RTK-GPS를 이용한 해안선 변화 자동추출 알고리즘의 정확도 평가 (An Accuracy Evaluation of Algorithm for Shoreline Change by using RTK-GPS)

  • 이재원;김용석;이인수
    • 대한토목학회논문집
    • /
    • 제32권1D호
    • /
    • pp.81-88
    • /
    • 2012
  • 본 연구는 해안선의 변화양상을 분석하기 위하여 두 가지 부분(측량 부분과 프로그램 부분)으로 나누어 진행하였다. 첫 번째는 다년간 GPS 측량을 통하여 자료를 취득하여 해안선 정보를 수집하였다. 두 번째는 다중영상정보를 이용하여 해안선 변화에 대한 자동경계검출 알고리즘을 개발하여 비교 분석하였다. 실험대상지역은 한국의 대표적인 해안인 부산시 해운대해수욕장을 선정하였고, 실험은 RTK-GPS의 경우 2005년 9월부터 2009년 9월까지 총 8회, 그리고 항공 Lidar는 2006년 12월과 2009년 3월에 실험을 수행하였다. 그 결과 RTK-GPS으로 나타난 평균 해안선의 길이는 약 1,364.6m이고, 항공 Lidar의 결과는 약 1,402.5m로 나타났다. 본 연구에서는 Visual C++ MFC(Microsoft Foundation Class)를 이용하여 해안선 경계 추출 알고리즘을 고안하였으며, 항공사진과 위성영상을 이용하여 해안선을 추출한 결과 평균 1,391.0m로 나타났다. 실측한 정보와의 상호비교를 통하여 약 98.1%의 정확도로 해안선 자동경계 추출이 되는 것으로 제시되었다.

점진적 EM 알고리즘에 의한 잠재토픽모델의 학습 속도 향상 (Accelerated Loarning of Latent Topic Models by Incremental EM Algorithm)

  • 장정호;이종우;엄재홍
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제34권12호
    • /
    • pp.1045-1055
    • /
    • 2007
  • 잠재토픽모델(latent topic model)은 데이타에 내재된 특징적 패턴이나 데이타 정의 자질들 간의 상호 관련성을 확률적으로 모델링하고 자동 추출하는 모델로서 최근 텍스트 문서로부터의 의미 자질 자동 추출, 이미지를 비롯한 멀티미디어 데이타 분석, 생물정보학 분야 등에서 많이 응용되고 있다. 이러한 잠재토픽모델의 대규모 데이타에 대한 적용 시 그 효과 증대를 위한 중요한 이슈 중의 하나는 모델의 효율적 학습에 관한 것이다. 본 논문에서는 대표적 잠재토픽모델 중의 하나인 PLSA (probabilistic latent semantic analysis) 기법을 대상으로 점진적 EM 알고리즘을 활용한, 기본 EM 알고리즘 기반의 기존 학습에 대한 학습속도 증진 기법을 제안한다. 점진적 EM 알고리즘은 토픽 추론 시 전체 데이타에 대한 일괄적 E-step 대신에 일부 데이타에 대한 일련의 부분적 E-step을 수행하는 특징이 있으며 이전 데이터 일부에 대한 학습 결과를 바로 다음 데이타 학습에 반영함으로써 모델 학습의 가속화를 기대할 수 있다. 또한 이론적인 측면에서 지역해로의 수렴성이 보장되고 기존 알고리즘의 큰 수정 없이 구현이 용이하다는 장점이 있다. 논문에서는 해당 알고리즘의 기본적인 응용과 더불어 실제 적용과정 상에서의 가능한 데이터 분할법들을 제시하고 모델 학습 속도 개선 면에서의 성능을 실험적으로 비교 분석한다. 실세계 뉴스 문서 데이타에 대한 실험을 통해, 제안하는 기법이 기존 PLSA 학습 기법에 비해 유의미한 수준에서 학습 속도 증진을 달성할 수 있음을 보이며 추가적으로 모델의 병렬 학습 기법과의 조합을 통한 실험 결과를 간략히 제시한다.

수문학적 유역특성자료 자동화 추출 및 분석시스템 적용 (II) -PRMS 모형을 이용한 용담댐 유역을 대상으로- (Application of the Developed Pre- and Post-Processing System to Yongdamdam Watershed using PRMS Hydrological Model)

  • 권형중;황의호;이근상;유병혁;고덕구
    • 한국지리정보학회지
    • /
    • 제11권3호
    • /
    • pp.13-22
    • /
    • 2008
  • 본 연구의 목적은 용담댐 유역을 대상으로 유역특성자료 분석시스템 (KGIS-Hydrology)을 이용하여 PRMS 모형의 입력매개변수를 추출하고 유출모의를 수행함으로서 개발된 유역특성자료 분석시스템 및 추출된 매개변수를 이용한 PRMS 모형의 국내 유역에 대한 적용성을 검토하는데 있다. 용담댐 유역을 대상으로 DEM, 토양도, 임상도 등을 구축하여 유역특성자료 분석시스템에 적용하여 PRMS 모형의 입력 매개변수를 추출하였다. 강수자료 및 기상자료는 기상청의 장수기상관측소의 시계열 자료를 사용하였으며 모의 결과를 검증할 수 있는 하천유출량 자료로서 용담댐 지점(용담댐 유역)과 동향수위관측소(구량천 유역)의 자료를 사용하였다. 장기유출모의 목적에 맞는 PRMS 모형을 구성하고 유역특성자료 분석시스템을 이용하여 추출된 매개변수로서 1966년부터 2001년까지 용담댐 유역에 적용하여 매개변수를 최적화하였다. 최적화된 매개변수를 이용하여 용담댐 유역(2002-2006)에 대하여 검토한 결과 0.49~0.83, 구량천 유역(2001-2004)은 0.57~0.75의 모형효율을 나타내어 모의결과가 실측치에 대하여 높은 모형효율을 나타내었다.

  • PDF