• 제목/요약/키워드: 특징값 추출

검색결과 949건 처리시간 0.03초

HTML 문서의 테이블 식별 (Detecting Tables in HTML Documents)

  • 김연석;이경호
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 봄 학술발표논문집 Vol.31 No.1 (B)
    • /
    • pp.163-165
    • /
    • 2004
  • HTML의 <TABLE> 태그는 연관된 정보를 기술하기 위한 테이블은 물론이고 웹 문서의 레이아웃을 표현하기 위하여 사용된다 본 논문에서는 웹으로부터 유용한 정보를 추출하기 위한 목적의 일환으로 HTML 문서로부터 테이블을 식별하는 효율적인 방법을 제안한다. 제안된 방법은 전처리와 속성-값 연관관계에 추출의 두 단계로 구성된다. 전처리 단계에서는 진짜 테이블 또는 레이아웃용으로 사용된 <TABLE> 태그의 일반적인 특징을 반영한 규칙을 적용하여 진짜 또는 가짜로 명확히 식별이 가능한 <TABLE> 태그를 추출한다. 속성-값 연관관계 추출 단계에서는 테이블 영역을 속성 및 값 영역으로 구분한 후. 값 영역에 대하여 구문적 일관성 검사를 수행한다 또한 값 영역의 크기가 작아서 구문적 일관성 검사를 수행할 수 없는 경우, 속성-칸 영역의 의미적 일관성을 검사한다. 제안된 방법의 성능을 명가하기 위하여 1,393개의 HTML 문서로부터 추출한 11,477개의 <TABLE> 태그를 대상으로 실험한 결과. 평균적으로 97.54%의 정확률과 99.22%의 재현률을 보여 기존 연구보다 우수하였다.

  • PDF

위치기반 상대빈도차 기반의 바이러스 염기서열 시그너쳐 추출 기법 (A Nucleotide Sequence Signature Extraction Method based on Position-Specific Relative Base Frequency Differences)

  • 황경순;이혜리;이건명;이찬희;윤형우;김성수
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 2007년도 춘계학술대회 학술발표 논문집 제17권 제1호
    • /
    • pp.167-170
    • /
    • 2007
  • 동일한 집단에 속하는 개체를 다른 집단에 속하는 개체로부터 구별할 수 있는 염기의 특징을 해당 집단의 시그너쳐라고 한다. 학습 데이터는 두 집단에 속하는 염기서열들이고, 염기서열에 대한 시그너쳐는 개체를 다른 집단과 구별할 수 있는 위치의 염기들로 구성된 서열이다. 제안한 방법에서는 각 집단에 대해서 위치별로 염기의 발생빈도를 계산하고, 가장 발생빈도가 높은 염기를 결정한 다음, 다른 집단의 대응 위치에서 해당 염기의 빈도를 계산하여, 빈도차이가 지정한 분류임계값 이상이면, 해당 위치의 염기를 시그너쳐를 구성하는 특징으로 간주한다. 시그너쳐를 대한 임의의 염기서열에 대한 부합정도는 시그너쳐에 속하는 염기의 학습집단에서의 상대빈도값을 가중치로 하여 계산한다. 임의의 염기서열이 특정 집단에 속하는지 판단하기 위해서는 해당 집단의 시그너쳐에 대한 부합정도를 계산하게 되는데, 부합정도가 얼마이상이 되어야 해당 집단에 속하는 것으로 간주할지 기준이 되는 임계값을 엄밀도 임계값이라고 한다. 엄밀도 임계값은 학습 데이터 집합에 대해서 주어진 시그너쳐에 대한 엄밀도 임계값이 민감도와 특이도를 최대로 하는 것을 선택한다. 제안한 방법을 구현한 바이오인포매틱스 도구를 개발하여, 한국형 HIV-1 바이러스 시그너쳐 추출에 적용하여 분류특성이 우수한 시그너쳐를 추출할 수 있음을 확인하였다.

  • PDF

실시간 얼굴인식을 위한 빠른 Gabor 특징 추출 (Fast Gabor Feature Extraction for Real Time Face Recognition)

  • 조경식
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2007년도 춘계종합학술대회
    • /
    • pp.597-600
    • /
    • 2007
  • 얼굴은 개인의 신원확인을 위하여 중요한 생체부분이다. 하지만 얼굴인식은 고차원적인 패턴인식의 문제이다. 저해상도 얼굴영상 조차도 대단히 큰 특징공간을 생성한다. 고유공간기반 얼굴인식은 고차원적인 패턴인식의 문제를 보다 낮은 차원으로 줄여서 얼굴인식을 하는 방법이다. 본 연구의 목적은 실시간 얼굴인식을 위하여 빠른 특징 추출방법을 제공하는 것이다. 먼저, 입력된 얼굴 영상에서 주성분분석을 수행하여 고유벡터와 고유값을 생성하고, 생성된 고유벡터의 특이점에 Gabor 필터를 적용하여 특징벡터를 구성한 후에 앞에서 구해진 고유값을 곱하여 특징을 추출하는 방법을 제안한다. 본 연구에서는 ORL 데이터베이스를 이용하여 실험하였다.

  • PDF

손 모양 특징점 정보를 이용한 핸드마우스 인터페이스 구현 (Efficient Hand Mouse Interface using Feature Points with Hand Gestures)

  • 김지현;김민하;차의영
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2011년도 추계학술대회
    • /
    • pp.223-226
    • /
    • 2011
  • 본 논문은 웹 카메라로부터 입력받은 영상을 이용하여 손 영역을 추출하여 마우스를 대체할 수 있는 핸드마우스를 구현한다. 먼저 웹 카메라를 이용하여 입력받은 영상에서 손 영역을 추출한다. 손영역을 추출하기 위해서 HSV 컬러 모델에서 조도 변화에 강인한 Hue값과 피부색 특징이 잘 나타나는 YcbCr 컬러 공간을 이용하여 손 후보 영역을 획득한다. 손 후보 영역에서 레이블링(labeling) 알고리즘을 적용하여 정확한 손 영역을 추출한다. 추출한 손 영역에서 무게 중심점을 구한 후, 무게 중심점으로부터 거리를 이용하여 손 영역을 분리한다. 분리된 손 영역에서 무게 중심점으로부터 거리 정보를 이용하여 손 영역의 최종 특징 점을 추출한다. 본 논문에서 제안한 방법은 추출한 손 모양의 손끝 정보를 이용하여 마우스 이벤트를 수행함으로써 사용자가 사용하기 편리한 핸드마우스를 구현하였다.

  • PDF

모자이크를 이용한 얼굴 영역의 추출 (Face Segmentation Using Mosaic)

  • 이승훈;이필규
    • 한국데이타베이스학회:학술대회논문집
    • /
    • 한국데이타베이스학회 1995년도 제4회 멀티미디어 산업기술 학술대회 논문집
    • /
    • pp.197-202
    • /
    • 1995
  • 본 논문에서는 조명, 얼굴 개수 및 얼굴의 크기에 제한 받지 않고 복잡한 배경에서 얼굴 영역을 추출하는 알고리즘을 제안한다. 이 알고리즘은 3단계로 구성된다. 첫번째 단계는 입력 영상의 평균 그레이값을 계산하고 그 값이 임계치보다 작다면 히스토그램 균일화 작업을 수행한다. 두번째 단계에서는 입력 영상의 모자이크 이미지를 만들고 이 이미지에 대해 확장된 quartet을 만들고 실험을 통해 얻어진 규칙을 적용하여 대략적으로 얼굴의 후보 영역들을 추출한다. 이 작업은 모자이크 이미지를 구성하는 셀의 크기를 변화시킬 때마다 적용한다. 세번째 단계에서는 추출된 얼굴 후보 영역에 대해 Octet을 만들고 이 octet에 규칙을 적용하여 후보 영역에 대한 검증 작업을 수행한다. 세번째 과정에서 만들어진 모자이크 이미지는 두 번째 과정에서 얻어진 이미지보다 더 세밀하게 얼굴의 특징들을 표현하고 검증한다.

  • PDF

잎맥 특징을 이용한 모양기반의 식물 잎 이미지 검색 (Shape-based Leaf Image Retrieval using Venation Feature)

  • 남윤영;박진규;황인준;김동윤
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2006년도 한국컴퓨터종합학술대회 논문집 Vol.33 No.1 (D)
    • /
    • pp.346-348
    • /
    • 2006
  • 본 논문은 잎맥 특징을 이용한 식물의 잎 이미지 검색 방법을 제안한다. 식물의 검색을 위해 모양 기반의 검색방법을 사용하였으며, 잎의 외곽선 분만 아니라 내부의 잎맥 정보를 이용하여 정확율을 향상시켰다. 외곽선은 MPP(Minimum Perimeter Polygons) 알고리즘을 개선하여 표현하고, 내부의 잎맥의 특징은 CSS(Curvature Scale Space)를 개선하여 주맥과 교차점, 끝점을 추출하여 표현하였다. 특징 점들간의 관계와 거리값을 통해 가중치가 있는 그래프로 표현하고 이 값을 통해 유사도를 계산하였다. 실험에서는 식물도감에서 1000여개의 식물 잎 이미지를 추출하여 기존의 알고리즘인 Fourier Descriptor, CSSD, CCD, Moment Invariants, MPP와 비교하였다.

  • PDF

Support Vector Machine과 원형 조명을 이용한 납땜 검사 시스템 (Solder Joint Inspection System using Support Vector Machine and Circular Illumination)

  • 심광재;윤태수;김항준
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1999년도 가을 학술발표논문집 Vol.26 No.2 (2)
    • /
    • pp.494-496
    • /
    • 1999
  • 본 논문에서는 SV(Support Vector Machine)과 3단의 칼라 원형 조명장치를 이용한 효율적인 납땜 검사 시스템을 제안한다. 원형 조명장치를 이용하여 납땜부의 표면의 경사도에 의해서 생기는 명암의 분포로부터 납땜 검사를 위한 특징값을 추출한다. SVM은 추출된 특징값을 이용하여 납땜 영상을 정의된 타입중의 하나로 분류한다. SVM은 두 부류의 경계를 최대로 하는 최적경계를 학습하므로 납땜 영상과 같이 각 부류의 경계가 모호한 문제에 대해서 적은 수의 학습 데이터를 사용해도 우수한 성능을 나타낸다. 제안된 시스템은 현산업에서 사용되고 있는 다양한 표면실장형 부품에 대해서 적용해 본 결과 적은 학습 데이터에도 효율적으로 적용될 수 있음을 보였다.

  • PDF

Support Vector Machine 과 원형 조명을 이용한 납땜 검사 시스템 (Solder Joint Inspection System using Support Vector Machine and Circular Illumination)

  • 심광재;윤태수;김항준
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 봄 학술발표논문집 Vol.27 No.1 (B)
    • /
    • pp.607-609
    • /
    • 2000
  • 본 논문에서는 SVM(Support Vector Machine)과 3단의 칼라 원형 조명장치를 이용한 효율적인 납땜 검사시스템을 제안한다. 원형 조명장치를 이용하여 납땜부의 표면의 경사도에 의해서 생기는 명암의 분포로부터 납땜 검사를 위한 특징값을 추출한다. SVM은 추출된 특징값을 이용하여 납땜 영상을 정의된 타입중의 하나로 분류한다. SBM은 두 부류의경계를 최대로 하는 최적경계를 학습하므로 납땜 영상과 같이 각 부류의 경계가 모호한 문제에 대해서 적은 수의 학습 데이터를 사용해도 우수한 성능을 나타낸다. 제안된 시스템은 현산업에서 사용되고 있는 다양한 표면실장형 부품에 대해서 적용해 본 결과 적은 학습 데이터에도 효율적으로 적용될 수 있음을 보였다.

  • PDF

영상 처리 기법을 이용한 콘크리트 표면 균열의 폭 및 길이 추출 (A Length and Width Extraction of Concrete Surface Cracks using Image Processing Technique)

  • 허주용;김경란;임은경;안상호;김광백
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2006년도 춘계종합학술대회
    • /
    • pp.346-351
    • /
    • 2006
  • 본 논문은 콘크리트 표면 균열 영상에서 균열의 특징을 추출하기 위해, 영상 처리 기법을 적용하여 균열의 특징(길이, 폭, 방향)을 자동으로 추출 및 처리 할 수 있는 기법을 제안한다. 본 논문에서 적용된 영상 처리 기법으로는 균열 영상의 빛을 보정하기 위하여 모폴로지 기법인 채움(Closing)기법을 적용한다. 균열의 경계를 명확히 추출하기 위하여 고주파 강화 필터링을 적용한 후, 8가지 색상(검정, 빨강, 파랑, 초록, 노랑, 자주, 주황, 하늘)으로 명암 값을 분류하고 그 중 빈도수가 가장 높은 색상을 가진 명암 값을 제거한 후에 추출한 영상을 이진화한다. 이진화된 영상에서 콘크리트 표면 균열의 실거리 측정을 위한 임의의 선을 제거하기 위하여 위치 히스토그램을 적용하여 임의의 선을 제거한다. 임의의 선이 제거된 균열 영상에서 $5\times5$ 마스크를 적용하여 균열을 확대시키고, 3차례에 걸쳐 잡음 제거연산을 수행하여 균열의 후보 영역을 선택한 후, 후보 영역으로부터 특정 균열들을 추출한다. 추출된 특정 균열을 모폴로지 기법인 제거(Opening) 연산을 수행하여 균열의 특징이 일정하게 유지되게 하고 미세하게 끊어진 부분을 보정하여 균열의 특징(길이, 방향, 폭)을 측정한다. 실제 콘크리트 표면 균열영상을 대상으로 실험한 결과, 특정 균열이 효율적으로 추출되었고, 특정 균열의 길이, 방향, 폭의 등이 정확히 추출 및 계산되었다.

  • PDF

영상분류를 이용한 내용기반 영상검색 시스템 (Content-Based Image Retrieval System Using Image Classification)

  • 이현운;전준철
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2000년도 추계학술발표논문집 (하)
    • /
    • pp.887-890
    • /
    • 2000
  • 본 연구에서는 내용기반 영상 데이터 검색을 위하여 변환 영역에서 위치 정보와 주파수 정보를 가지는 웨이블릿 성질을 이용하여 영상을 압축한 후에 저주파 성분에 의한 객체들의 특징을 추출하는 방안으로 Vector Quantization 을 이용한 class 별 영상 검색을 제시한다 내용기반 영상 검색의 주요특징들은 색상, 질감, 그리고 영상의 공간적인 특징을 고려한 특징 값 둥이 사용된다. 먼저 검색의 효율성을 높이기 위해 영상을 구성하는 특징 치 중에서 가장 빈도가 많은 class 부터 영상의 유사도를 검색한 후에 다음으로 영상을 구성하는 빈도가 큰 순서대로 DB 내에 저장되어 있는 영상과 비교를 하게 된다. DB내 영상 검색은 빈도수가 우선인 5개의 class를 기준으로 유사도를 측정해서 검색을 이룬다. 이러한 영상의 특징들을 어떻게 결합하고 특징 추출을 하느냐에 따라 검색의 효율성에 영향을 준다. 따라서 본 연구에서는 영상의 위치 정보와 주파수 정보를 가지는 웨이블릿 변환 후 얻어지는 저대역 부밴드에서의 공간적인 특성을 고려한 특징 값을 이용하여 Vector Quantization 알고리즘에 의해 정지영상의 객체 대표 특징들을 마르게 검색하고자 한다. 본 연구에서는 Haar Wavelet과 Vector Quantization 에서 색상과 질감의 가중치를 적용한 후 DB 에 저장된 영상과 유사도를 검색하는 방법을 취하고자 한다.

  • PDF