통합 검색 | Korea Science

오디오와 영상 정보를 이용한 비디오 세그먼테이션 및 크래시피케이션 (Segmentation and Classification Using Audio and Image Information)

정해준;정성환
- 한국정보처리학회:학술대회논문집
- /
- 한국정보처리학회 2000년도 추계학술발표논문집 (하)
- /
- pp.891-894
- /
- 2000
본 논문에서는 효과적인 내용기반 비디오 검색을 위한 샷 경계 검출, 장면 경계 검출, 그리고 비디오 크래시피케이션 방법을 연구하였다. 먼저, 샷 경계 검출을 위해 칼라 히스토그램과 DCT 변환 계수를 통합하여 사용했다. 그리고 장면 경계 검출을 위해서는 영상 정보뿐만 아니라 오디오 정보를 함께 사용하여 장면 경계를 검출하였다. 또한 비디오 크래시피케이션에서는 장면 경계검출시 추출한 오디오 정보를 이용해 비디오를 내용별로 분류하는 연구를 제안하였다. 뉴스, 광고, 스포츠 등 다양한 3개 분야의 TV 프로그램으로 구성된 약 8,500개 영상 프레임과 약 50,000개의 오디오 프레임을 가진 실험 비디오 데이터베이스를 구성하여 제안된 시스템을 실험하였다. 실험한 결과, 약 88%의 정확도(Precision)를 가지는 장면 경계 검출과 약 85%의 평균 분류율을 보였다.
PDF

영역 확장법을 이용한 연기검출 (Smoke Detection using Region Growing Method)

김동근
- 정보처리학회논문지B
- /
- 제16B권4호
- /
- pp.271-280
- /
- 2009
본 논문에서는 옥외 비디오 영상에서 영역 확장법을 이용한 연기 영역검출 방법을 제시한다. 제안된 방법은 차영상에 의한 초기 변화영역 검출 단계, 경계선 검출 및 확장 단계, 특징 검출 및 연기분류의 3단계로 구성된다. 초기 변화영역 검출 단계에서는 배경영상으로 차영상을 계산하고, 초기 임계치를 이용하여 이진영상을 구하고, 잡음 제거를 위하여 모폴로지 연산을 수행한다. 경계선 검출 및 확장 단계는 레이블링 알고리즘에 의해 이진영상에서 변화영역을 검출하고, 각 변화영역의 경계선을 검출한 다음, 차영상과 경계선을 이용하여 확장된 경계선을 계산한다. 특징 검출 및 연기분류 단계에서는 확장된 경계선에 모멘트를 이용하여 타원을 추정하고 타원의 시간에 따른 특징정보를 이용하여 연기 영역을 분류한다.
https://doi.org/10.3745/KIPSTB.2009.16-B.4.271 인용 PDF KSCI

Conditional Random Fields를 이용한 세부 분류 개체명 인식 (Fine-Grained Named Entity Recognition using Conditional Random Fields for Question Answering)

이창기;황이규;오효정;임수종;허정;이충희;김현진;왕지현;장명길
- 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
- /
- 한국정보과학회언어공학연구회 2006년도 제18회 한글 및 한국어 정보처리 학술대회
- /
- pp.268-272
- /
- 2006
질의응답 시스템은 사용자 질의에 해당하는 정답을 찾기 위해서 세부 분류된 개체명을 사용한다. 이러한 세부 분류 개체명 인식을 위해서 대부분의 시스템이 일반 대분류 개체명인식 후에 사전 등을 이용하여 세부 분류로 나누는 방법을 이용하고 있다. 본 논문에서는 질의응답 시스템을 위한 세부 분류 개체명 인식을 위해서 Conditional Random Fields를 이용한다. 개체명 인식의 과정을 개체명 경계 인식과 경계가 인식된 개체명의 클래스 분류의 두 단계로 나누어, 개체명 경계 인식에 Conditional Random Fields를 이용하고, 경계 인식된 개체명의 클래스 분류에는 Maximum Entropy를 이용한다. 실험결과 147개의 세부분류 개체명 인식에 대해서 정확도 85.8%, 재현률 81.1%. F1=83.4의 성능을 얻었고. baseline model 보다 학습 시간이 27%로 줄고 성능은 증가하였다. 또한 제안된 세부 분류개체명 인식기를 이용하여 질의응답 시스템에 적용한 결과 26%의 성능향상을 보였다.
PDF

운송 컨테이너 영상의 식별자 인식을 위한 개선된 퍼지 ART 알고리즘 (An Enhanced Fuzzy ART Algorithm for The Identifier Recognition from Shipping Container Image)

류재욱;김태경;김광백
- 한국지능시스템학회:학술대회논문집
- /
- 한국퍼지및지능시스템학회 2002년도 추계학술대회 및 정기총회
- /
- pp.365-369
- /
- 2002
퍼지 ART 알고리즘에서 경계 변수는 패턴들을 클러스터링하는데 있어서 반지름 값이 되며 임의의 패턴과 저장된 패턴과의 불일치(mismatch) 허용도를 결정한다. 이 경계 변수가 크면 입력 벡터와 기대 벡터 사이에 약간의 차이가 있어도 새로운 카테고리(category)로 분류하게 핀다. 반대로 경계 변수가 작으면 입력 벡터와 기대 벡터 사이에 많은 차이가 있더라도 유사성이 인정되어 입력 벡터들을 대략적으로 분류한다. 따라서 영상 인식에 적용하기 위해서는 경험적으로 경계 변수를 설정해야 단점이 있다. 그리고 연결 가중치를 조정하는 과정에서 저장된 패턴들의 정보들이 손실되는 경우가 발생하여 인식율을 저하시킨다. 된 논문에서는 퍼지 ART 알고리즘의 문제점을 개선하기 위하여 퍼지 논리 접속 연산자를 이용하여 경계 변수를 동적으로 조정하고 저장 패턴들과 학습 패턴간의 실제적인 왜곡 정도를 충분히 고려하여 승자 노드로 선택된 빈도수를 가중치 조정에 적용한 개선된 퍼지 ART 알고리즘을 제안하였다. 제안된 방법의 성능을 확인하기 위해서 실제 운송 컨테이너 영상들을 대상으로 실험한 결과, 기존의 ART2 알고리즘이나 퍼지 ART 알고리즘보다 클러스터의 수가 적게 생성되었고 인식 성능도 기존의 방법들보다 우수한 성능이 있음을 확인하였다.

노이즈 데이터 정제를 통한 분류모델 성능 향상 (Enhancing Classification Model Performance through Noise Data Refinement)

정운국;강승식
- 한국정보처리학회:학술대회논문집
- /
- 한국정보처리학회 2024년도 춘계학술발표대회
- /
- pp.559-562
- /
- 2024
자연어 기반의 분류모델을 개발할 때 높은 성능을 획득하기 위해서는 데이터의 품질이 중요한 요소이다. 특히 무역상품 국제 분류체계 HS-CODE에서 상품명을 기반으로 HS코드를 분류할 때, 라벨링 된 데이터의 품질에 의해서 분류모델의 성능이 좌우된다. 하지만 현실적으로 확보 가능한 데이터셋에는 데이터 라벨링 오류나 데이터로 활용하기에 특징점이 부족한 데이터들이 다수 존재하기도 한다. 본 연구에서는 분류모델 학습 데이터의 정제 방법론으로, 딥러닝 기반 노이즈 검출 알고리즘을 제안한다. 분류 대상의 특징점이 분류 경계값 주변에 존재한다면 분류하기 모호한 노이즈 데이터일 가능성이 높다고 가정하고, 해당 노이즈 데이터를 검출하는 방법으로 딥러닝 기술을 활용한다. 해당 경계값 노이즈 검출 알고리즘으로 데이터를 정제한 뒤 학습모델의 성능비교 결과, 기존 대비 우수한 분류 정확도를 기록하였다.
https://doi.org/10.3745/PKIPS.y2024m05a.559 인용 PDF

퍼지 분할을 위한 분류 경계의 추출과 패턴 분류에의 응용 (Extraction of Classification Boundary for Fuzzy Partitions and Its Application to Pattern Classification)

손창식;서석태;정환묵;권순학
- 한국지능시스템학회논문지
- /
- 제18권5호
- /
- pp.685-691
- /
- 2008
퍼지 규칙기반 분류 시스템에서 위한 퍼지 분할 경계들의 선택은 중요하고 어려운 문제이다. 그래서 이들을 효과적으로 결정하기 위해서 신경망, 유전자알고리즘 등과 같은 학습과정에 기반을 둔 다양한 방법들이 제안되었고, 이전 연구에서는 이들 방법에 대한 문제점을 지적하고 이를 개선하기 위하여 중첩 형태에서 퍼지 분할을 결정할 수 있는 방법에 대해서 논의하였다. 본 논문에서는 이전 연구의 방법을 3가지 형태의 분류 경계들, 즉 비중첩, 중첩, 1점 인접 형태로 확장하였다. 또한 이들을 학습에 의존하지 않고 주어진 데이터로부터 얻어진 통계적 정보만을 사용하여 결정하는 방법을 제안하고, 이를 패턴 분류 문제에 적용하여 제안된 방법의 효용성을 보인다.
https://doi.org/10.5391/JKIIS.2008.18.5.685 인용 PDF KSCI

형태특징과 지역특징 융합기법을 활용한 열영상 기반의 차량 분류 방법 (A Vehicle Classification Method in Thermal Video Sequences using both Shape and Local Features)

양동원
- 전기전자학회논문지
- /
- 제24권1호
- /
- pp.97-105
- /
- 2020
열 영상은 온도에 따라 방출하는 에너지의 차이를 나타낸 영상이다. 주야간 사용이 가능하기 때문에 군사적인 용도로 많이 활용되고 있으나, 열 영상은 물체의 경계가 불명확하고 흐릿하게 표현되는 경우가 많으며 화염 등의 열기로 인해 경계부분이 변질되는 단점이 있다. 따라서, 열 영상을 이용하여 표적의 종류를 분류할 때 정확하게 분할된 경계선을 이용할 경우 효과적으로 분류 할 수 있지만, 물체의 경계가 잘못 추출되는 경우 분류의 정확도가 크게 감소한다. 본 논문에서는 이러한 단점을 극복하기 위해서 표적 영상의 분할 신뢰도에 따라 형태특징과 지역특징의 분류결과를 융합하는 계층적 분류기법을 제안하였으며, 연속 영상 기반으로 분류 결과를 갱신하는 기법을 새롭게 제안하여 차량 표적 분류 정확도를 개선하였다. 제안하는 방법은 실제 군용 표적 4종(전차, 장갑차, 상용차, 군용트럭)이 있는 다양한 자세의 열 영상 20,000장 이상을 이용하여 성능을 검증하였으며, 우수한 성능의 기존 방법 대비 정확도 개선에 효과가 있음을 확인하였다.
https://doi.org/10.7471/ikeee.2020.24.1.97 인용 PDF KSCI

경계선 보존 알고리즘 기반의 디블로킹 필터와 효율적인 VLSI 구조 (Deblocking Filter Based on Edge-Preserving Algorithm And an Efficient VLSI Architecture)

트풍퀑빈;김지훈;김영철
- 한국통신학회논문지
- /
- 제36권11C호
- /
- pp.662-672
- /
- 2011
본 논문은 새로운 경계선 보존 알고리즘을 이용하여 블록화 현상을 제거하는 디블로킹 필터와 HD해상도의 실시간 영상처리가 가능한 디블로킹 필터의 VLSI구조를 제안한다. 기존의 블록 분류 기반의 접근 방법과 달리 제안된 알고리즘은 픽셀 분류 기반 접근을 사용한다. 또한 제안된 경계선 보존 맵은 픽셀을 경계선 영역과 평탄 영역으로 분류하며, 블록화 현상 제거에 사용되는 오프셋 필터와 경계선 보존 필터의 기반이 된다. 이를 바탕으로 제안된 디블로킹 필터의 VLSI구조는 고연산량 처리를 위하여 블록 전체에 파이프라인 기법을 적용하였다. 또한 블록 버퍼를 위한 메모리 절감 구조는 메모리의 사용을 최적화 시킨다. 본 필터는 VHDL을 이용한 설계를 통하여 CycloneII FPGA상에서 구현된 구조의 동작을 검증 후, Synopsys의 Design Compiler와 ANAM 0.25 ${\mu}m$ CMOS cell library로 합성하여 칩으로 구현하였을 때의 성능을 예측하였다. 제안된 알고리즘의 실험 결과는 세밀한 영상성분을 보존하면서 효과적으로 블록화 현상을 제거하며, 픽셀 분류 기반에서 제안된 알고리즘은 블록 분류 기반보다 PSNR 성능이 우수함을 보였다.
https://doi.org/10.7840/KICS.2011.36C.11.662 인용 PDF KSCI

칼라 분포 특성에 기반한 객체 영상 린 비객체 영상의 분류 방법 (Classification of Object and Non-object Images Based on Color Distribution)

박소연;김성영;김민환
- 한국멀티미디어학회:학술대회논문집
- /
- 한국멀티미디어학회 2003년도 추계학술발표대회(상)
- /
- pp.318-321
- /
- 2003
의미 있는 객체가 영상에 포함되어 있는지를 판단하여 영상을 객체 및 비객체 영상으로 분류함으로써 영상 검색이나 효과적인 영상 데이터베이스 구축 등에 유용하게 활용 가능하다. 이에 본 논문에서는 영상 유형에 따른 특징을 분석하여 영상 분류를 위한 기준을 선정함으로써 입력 영상을 객체 및 비객체 영상으로 분류할 수 있는 방법을 제안한다 일반적으로 객체는 주로 영상의 중심 부근에 위치하고 주변과는 상이한 칼라 특징으로 표현되므로, 영상 중심 부근에 주로 위치하는 칼라의 분포 정보를 영상 분류의 기준으로 사용하였다. 또한 객체 추출 방법[4]을 적용하여 추출된 객체와 배경 사이의 공유 경계에서 발생하는 경계 강도 정도를 활용하였다. 코렐 CD에서 무작위로 선택된 800장의 영상에 대해 제안된 기준을 적용하여 분류한 결과 약80%의 분류 정확도를 얻었다.
PDF

벡터 양자화를 이용한 한국어 억양 곡선 생성 (Generation of Korean Intonation using Vector Quantization)

안혜선;김형순
- 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
- /
- 한국정보과학회언어공학연구회 2001년도 제13회 한글 및 한국어 정보처리 학술대회
- /
- pp.209-212
- /
- 2001
본 논문에서는 text-to-speech 시스템에서 사용할 억양 모델을 위해 벡터 양자화(vector quantization) 방식을 이용한다. 어절 경계강도(break index)는 세단계로 분류하였고, CART(Classification And Regression Tree)를 사용하여 어절 경계강도의 예측 규칙을 생성하였다. 예측된 어절 경계강도를 바탕으로 운율구를 예측하였으며 운율구는 다섯 개의 억양 패턴으로 분류하였다. 하나의 운율구는 정점(peak)의 시간축, 주파수축 값과 이를 기준으로 한 앞, 뒤 기울기를 추출하여 네 개의 파라미터로 단순화하였다. 운율구에 대해서 먼저 운율구가 문장의 끝일 경우와 아닐 경우로 분류하고, 억양 패턴 다섯 개로 분류하여. 모두 10개의 운율구 set으로 나누었다. 그리고 네 개의 파라미터를 가지고 있는 운율구의 억양 패턴을 벡터 양자화 방식을 이용하여 분류(clusteing)하였다 운율의 변화가 두드러지는 조사와 어미는 12 point의 기본주파수 값을 추출하고 벡터 양자화하였다. 운율구와 조사 어미의 codebook index는 문장에 대한 특징 변수 값을 추출하고 CART를 사용하여 예측하였다. 합성할 때에는 입력 tort에 대해서 운율구의 억양 파라미터를 추정한 다음, 조사와 어미의 12 point 기본주파수 값을 추정하여 전체 억양 곡선을 생성하였고 본 연구실에서 제작한 음성합성기를 통해 합성하였다.
PDF

검색결과 644건 처리시간 0.034초

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

자세히 찾기

이미지 검색 (β)