• 제목/요약/키워드: Segmentation model

검색결과 1,047건 처리시간 0.031초

Mandible Reconstruction with 3D Virtual Planning

  • Woo, Taeyong;Kraeima, Joep;Kim, Yong Oock;Kim, Young Seok;Roh, Tai Suk;Lew, Dae Hyun;Yun, In Sik
    • Journal of International Society for Simulation Surgery
    • /
    • 제2권2호
    • /
    • pp.90-93
    • /
    • 2015
  • The fibula free flap has now become the most reliable and frequently used option for mandible reconstruction. Recently, three dimensional images and printing technologies are applied to mandibular reconstruction. We introduce our recent experience of mandibular reconstruction using three dimensionally planned fibula free flap in a patient with gunshot injury. The defect was virtually reconstructed with three-dimensional image. Because bone fragments are dislocated from original position, relocation was necessary. Fragments are virtually relocated to original position using mirror image of unaffected right side of the mandible. A medical rapid prototyping (MRP) model and cutting guide was made with 3D printer. Titanium reconstruction plate was adapted to the MRP model manually. 7 cm-sized fibula bone flap was designed on left lower leg. After dissection, proximal and distal margin of fibula flap was osteotomized by using three dimensional cutting guide. Segmentation was also done as planned. The fibula bone flap was attached to the inner side of the prebent reconstruction plate and fixed with screws. Postoperative evaluation was done by comparison between preoperative planning and surgical outcome. Although dislocated condyle is still not in ideal position, we can see that reconstruction was done as planned.

Intra-Rater and Inter-Rater Reliability of Brain Surface Intensity Model (BSIM)-Based Cortical Thickness Analysis Using 3T MRI

  • Jeon, Ji Young;Moon, Won-Jin;Moon, Yeon-Sil;Han, Seol-Heui
    • Investigative Magnetic Resonance Imaging
    • /
    • 제19권3호
    • /
    • pp.168-177
    • /
    • 2015
  • Purpose: Brain surface intensity model (BSIM)-based cortical thickness analysis does not require complicated 3D segmentation of brain gray/white matters. Instead, this technique uses the local intensity profile to compute cortical thickness. The aim of the present study was to evaluate intra-rater and inter-rater reliability of BSIM-based cortical thickness analysis using images from elderly participants. Materials and Methods: Fifteen healthy elderly participants (ages, 55-84 years) were included in this study. High-resolution 3D T1-spoiled gradient recalled-echo (SPGR) images were obtained using 3T MRI. BSIM-based processing steps included an inhomogeneity correction, intensity normalization, skull stripping, atlas registration, extraction of intensity profiles, and calculation of cortical thickness. Processing steps were automatic, with the exception of semiautomatic skull stripping. Individual cortical thicknesses were compared to a database indicating mean cortical thickness of healthy adults, in order to produce Z-score thinning maps. Intra-class correlation coefficients (ICCs) were calculated in order to evaluate inter-rater and intra-rater reliabilities. Results: ICCs for intra-rater reliability were excellent, ranging from 0.751-0.940 in brain regions except the right occipital, left anterior cingulate, and left and right cerebellum (ICCs = 0.65-0.741). Although ICCs for inter-rater reliability were fair to excellent in most regions, poor inter-rater correlations were observed for the cingulate and occipital regions. Processing time, including manual skull stripping, was $17.07{\pm}3.43min$. Z-score maps for all participants indicated that cortical thicknesses were not significantly different from those in the comparison databases of healthy adults. Conclusion: BSIM-based cortical thickness measurements provide acceptable intra-rater and inter-rater reliability. We therefore suggest BSIM-based cortical thickness analysis as an adjunct clinical tool to detect cortical atrophy.

HMM과 연결 숫자음의 후처리를 이용한 음성 다이얼링에 관한 연구 (A Study on the Voice Dialing using HMM and Post Processing of the Connected Digits)

  • 양진우;김순협
    • 한국음향학회지
    • /
    • 제14권5호
    • /
    • pp.74-82
    • /
    • 1995
  • 본 논문은 HMM과 연결 숫자음의 후처리를 이용한 음성 다이얼링에 관한 연구이다. HMM(Hidden Markov Model)은 좋은 결과를 보이면서 현재 음성 인식 분야에서 널리 사용되는 알고리즘이다. 그러나, HMM의 학습 방법인 maximum like-lihood estimation은 인식률을 극대화하는 모델의 파라메터 값을 생성하지 못하는 단점이 었다. 이러한 문제점을 보완하기 위하여 Segmental K-means 학습 과정에 후저리를 이용하여 인식 실험을 하였다. 한국어 연속 숫자음은 영어 연속 숫자음과 달리 연음 현상의 영향을 많이 받는다. Level Building 과정에서 연음에 의한 오류를 감소시키기 위해 연음에 의해 발생할 수 있는 단어를 별도의 모델로 추가하였다. 이렇게 추가된 단어 모델들에 대한 몇 가지 규칙을 인식 결과에 적용하여 출력을 다시 조정한다. 본 시 스템은 TMS320C30 프로세서를 내장한 DSP 보드와 IBM PC 상에서 구현되었고, 표준 패턴은 실험실 잡음 환경에서 남성 화자3명을 대상으로 작성하였다. 인식 실험 결과 21종 전화 번호 252개 데이타에 대하여 화자 종속의 경우 $91.6\%$, 회자 독립의 경우 $80.5\%$의 인식률을 나타내었다.

  • PDF

HSV 색상 모델과 영역 확장 기법을 이용한 동영상 프레임 이미지의 흑백 만화 카투닝 알고리즘 (A Black and White Comics Generation Procedure for the Video Frame Image using Region Extension based on HSV Color Model)

  • 류동성;조환규
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제35권12호
    • /
    • pp.560-567
    • /
    • 2008
  • 본 논문에서는 비디오 영상에서 추출한 이미지를 이용하여, 흑백 만화로 변환하기 위한 알고리즘에 대해 논의한다. 대부분의 흑백 만화는 사람의 얼굴이나 손과 같은 살색 계통은 흰색 내지 엷은 색상으로 표현되며, 이미지의 어두운 영역은 해칭과 같이 규칙적이면서도 불규칙한 형태로 묘사한다. 그러므로 단순한 임계값을 이용한 이진화 알고리즘으로 흑백 만화를 렌더링 할 경우, 원본 색상 영상의 다양한 색상과 흑백 만화에서 사용되는 다양한 패턴을 렌더링 할 수 없다. 이러한 흑백 만화의 특징을 반영한 카투닝을 수행하기 위해서, 본 논문에서는 다음과 같은 작업을 수행한다. 먼저, 원본 이미지 영상의 미세한 색상변화를 제거하기 위해서, 1) Bilateral 필터를 적용한다. 그 후, 영상의 각 영역을 유사한 색상 정보로 클러스터링 하기 위해서, 2) Mean shift 세그멘테이션을 적용하였으며, 각 영역별 확장 작업을 수행하였다. 이때 각 영역의 색상이 유사한 정도를 계산하기 위해서, 사람의 색상인지 능력과 유사한 특성을 가진 HSV 색상 모델을 사용하여, 각 영역의 색상 유사정도를 계산하였다. 최종적으로 세그멘테이션된 색상정보를 바탕으로 흑백만화에서 일반적으로 활용되는 색상과 프레임 이미지의 픽셀값을 고려한 3) 이진화를 수행하고, 4) 스트록을 추가해 흑백 만화의 컷 이미지를 완성한다.

다시점 영상 부호화에서 전역 변이 벡터를 이용한 고속 모드 결정 (Fast Mode Decision using Global Disparity Vector for Multi-view Video Coding)

  • 한동훈;조숙희;허남호;이영렬
    • 방송공학회논문지
    • /
    • 제13권3호
    • /
    • pp.328-338
    • /
    • 2008
  • H.264/AVC기반의 다시점 영상 부호화 기술은 시점간 상관성을 이용한 새로운 예측 방법을 이용하여 여러 대의 카메라로부터 촬영된 영상을 효율적으로 부호화하는 기술이다. 그러나 다시점 부호화 기술은 시점의 증가와 시점간 예측의 사용으로 인해 부호화 시간이 크게 증가한다. 본 논문은 부호화 시간을 줄이기 위해 다시점 영상에서 시점간에 대응하는 마크로블록 (Macroblock) 기반 영역 분할 정보와 시점간의 전역 변이 벡터를 이용한 고속 모드 결정 방법을 제안한다. 제안하는 방법은 다시점 영상 부호화 표준의 참조 소프트웨어인 joint multi-view video model (JMVM) 4.0에 비해 약 0.04dB의 화질 열화를 보이지만 전체 부호화 시간을 평균적으로 40% 단축할 수 있었다.

실물에 대한 디지털 홀로그램 고속 생성 (Fast Digital Hologram Generation Using True 3D Object)

  • 강훈종;이강성;이승현
    • 한국통신학회논문지
    • /
    • 제34권11B호
    • /
    • pp.1283-1288
    • /
    • 2009
  • 컴퓨터 그래픽 모델로부터 3차원 정보를 쉽게 추출할 수 있기 때문에, 일반적으로 3차원 컴퓨터 그래픽 모델이 디지털 홀로그래피에 사용되고 있다. 본 논문에서는 depth 카메라를 이용하여 실사로부터 3차원 정보 추출하였고 이를 이용하여 디지털 홀로그램을 생성하였다. Depth 카메라에서 획득된 2차원 실사 영상 및 실물에 대한 깊이 영상은 디지털 홀로그램 생성을 위한 3차원 정보(point cloud) 추출에 사용되었다. 추출된 3차원 정보는 고속 디지털 홀로그램 생성 알고리즘인 코히어런트 홀로그래픽 스테레오그램 방식을 사용하여 홀로그램을 생성하였고, 생성된 디지털 홀로그램은 프라넬(Fresnel) 기반 복원 알고리즘에 의해 복원하였다. 본 방법에 의해 실사에 대한 고속 디지털 홀로그램 생성이 가능함을 제시하였으며, 생성된 디지털 홀로그램으로부터 프라넬 홀로그램의 복원 영상과 같이 선명한 복원 영상을 얻을 수 있었다.

음성인식 기반 응급상황관제 (Emergency dispatching based on automatic speech recognition)

  • 이규환;정지오;신대진;정민화;강경희;장윤희;장경호
    • 말소리와 음성과학
    • /
    • 제8권2호
    • /
    • pp.31-39
    • /
    • 2016
  • In emergency dispatching at 119 Command & Dispatch Center, some inconsistencies between the 'standard emergency aid system' and 'dispatch protocol,' which are both mandatory to follow, cause inefficiency in the dispatcher's performance. If an emergency dispatch system uses automatic speech recognition (ASR) to process the dispatcher's protocol speech during the case registration, it instantly extracts and provides the required information specified in the 'standard emergency aid system,' making the rescue command more efficient. For this purpose, we have developed a Korean large vocabulary continuous speech recognition system for 400,000 words to be used for the emergency dispatch system. The 400,000 words include vocabulary from news, SNS, blogs and emergency rescue domains. Acoustic model is constructed by using 1,300 hours of telephone call (8 kHz) speech, whereas language model is constructed by using 13 GB text corpus. From the transcribed corpus of 6,600 real telephone calls, call logs with emergency rescue command class and identified major symptom are extracted in connection with the rescue activity log and National Emergency Department Information System (NEDIS). ASR is applied to emergency dispatcher's repetition utterances about the patient information. Based on the Levenshtein distance between the ASR result and the template information, the emergency patient information is extracted. Experimental results show that 9.15% Word Error Rate of the speech recognition performance and 95.8% of emergency response detection performance are obtained for the emergency dispatch system.

라이다데이터를 이용한 도시지역의 자동변화탐지 (Automatic Change Detection of Urban Areas using LIDAR Data)

  • 최경아;이임평
    • 한국측량학회지
    • /
    • 제26권4호
    • /
    • pp.341-350
    • /
    • 2008
  • 변화탐지는 도시모델의 갱신을 위해 중요한 단계이다. 이에 본 연구는 서로 다른 시기에 취득된 라이다 데이터로부터 도시변화를 탐지하는 방법을 제안한다. 제안된 방법의 주요 과정은(1) 라이다 데이터로부터 생성된 DSM의 차분을 통해 변화영역을 탐지하고, (2) 탐지된 영역의 라이다 점으로부터 표면패치를 구성하고, (3) 구성된 각각의 패치의 종류를 지면, 수목, 빌딩으로 분류하고, (4) 패치의 종류 및 속성에 기반하여 변화의 종류를 결정한다. 제안된 방법을 실측데이터에 적용한 결과를 동일한 지역의 정사영상으로부터 육안검사를 통해 수동생성된 참조데이터를 이용하여 검증하였다. 변화탐지의 성공률은 평균적으로 97%로 평가되었다. 결론적으로 제안된 방법은 변화탐지 및 도시모델의 갱신을 위한 신뢰성이 높고, 효율적인 방법으로 판단된다.

어안 렌즈 카메라 영상을 이용한 기절동작 인식 (Development of a Fall Detection System Using Fish-eye Lens Camera)

  • 소인미;한대경;강선경;김영운;정성태
    • 한국컴퓨터정보학회논문지
    • /
    • 제13권4호
    • /
    • pp.97-103
    • /
    • 2008
  • 이 논문은 응급상황을 인식하기 위하여 어안렌즈를 통해 획득된 영상을 이용하여 기절 동작을 인식하는 방법을 제안한다. 거실의 천장 중앙에 위치한 어안렌즈(fish-eye lens)를 장착한 카메라로부터 영상을 입력 받은 뒤, 가우시안 혼합 모델 기반의 적응적 배경 모델링 방법을 이용하여 전경 픽셀을 추출한다. 그리고 연결되어 있는 전경픽셀 영역들의 외곽점들을 추적하여 타원으로 매핑한다. 이 타원을 추적하면서 어안 렌즈 영상을 투시 영상으로 변환한 다음 타원의 크기 변화, 위치 변화, 이동 속도정보를 추출하여 이동과 정지 및 움직임이 기절동작과 유사한지를 판단한다. 실험 결과 어안 렌즈 영상을 그대로 사용하는 것보다 투시 영상으로 변환하여 타원의 크기변화, 위치변화, 이동속도 정보를 추출하는 방법이 보다 높은 인식률을 보였다.

  • PDF

Improved STGAN for Facial Attribute Editing by Utilizing Mask Information

  • Yang, Hyeon Seok;Han, Jeong Hoon;Moon, Young Shik
    • 한국컴퓨터정보학회논문지
    • /
    • 제25권5호
    • /
    • pp.1-9
    • /
    • 2020
  • 본 논문에서는 머리카락과 모자 영역의 마스크 정보를 활용하여 더 자연스러운 얼굴 속성 편집(facial attribute editing)을 수행하는 모델을 제안한다. 최신 얼굴 속성 편집 연구인 STGAN은 다중 얼굴 속성을 자연스럽게 편집하는 성과를 보였다. 그러나 머리카락과 관련된 속성을 편집할 때 부자연스러운 결과를 생성할 수 있다. 제안하는 방법의 핵심 아이디어는 기존 모델에서 부족했던 얼굴 영역의 정보를 모델에 추가로 반영하는 것이다. 이를 위해 세 가지 아이디어를 적용한다. 첫째로 마스크를 통해 머리카락 면적 속성을 추가하여 머리카락 정보를 보완한다. 둘째로 순환 일관성 손실(cycle consistency loss)을 추가하여 영상의 불필요한 변화를 억제한다. 셋째로 모자 분할 신경망을 추가하여 모자 영역 왜곡을 방지한다. 정성적 평가를 통해 제안하는 방법 적용 여부에 따른 유효성을 평가 및 분석한다. 실험 결과에서 제안하는 방법이 머리카락 및 얼굴 영역을 더 자연스럽게 생성하고, 모자 영역의 왜곡을 성공적으로 방지했다.