• 제목/요약/키워드: 중복수 추출

검색결과 216건 처리시간 0.03초

유전자 알고리즘과 Feature Wrapping을 통한 마이크로어레이 데이타 중복 특징 소거법 (Removing Non-informative Features by Robust Feature Wrapping Method for Microarray Gene Expression Data)

  • 이재성;김대원
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제35권8호
    • /
    • pp.463-478
    • /
    • 2008
  • 본 논문에서는 유전자 사이의 상관계수가 높은 마이크로어레이 데이타에 대하여 제안하는 알고리즘을 통해 상관계수가 낮은 유전자들의 부집합을 만들고, 이에 대해 적합 함수를 통한 평가로 기존 방법론이 가지는 한계를 극복할 수 있도록 하였다. 기존 방법론은 개별 특징의 평가를 통해 중복 특징을 제거하며, 상관계수에 대한 고려가 없어 선택된 유전자 부집합들의 상관계수가 논은 문제가 있었다. 이에 따라 제안하는 알고리즘은 특징간의 관계를 평가하는 Feature Wrapping 기법을 활용하여, 추출된 유전자 부집합에 포함된 유전자 사이의 상관관계가 낮고, 클래스 구분력이 높은 특징을 갖도록 하였다.

MPEG 몰입형 비디오를 위한 클러스터 기반 MV-HEVC 부호화 모드 결정 (Cluster-based MV-HEVC Coding Mode Decision for MPEG Immersive Video)

  • 한창희;정종범;류은석
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2021년도 추계학술대회
    • /
    • pp.189-192
    • /
    • 2021
  • three degree of freedom (3DoF), three degree of freedom plus (3DoF+), six degree of freedom(6DoF) 등 몰입형 비디오의 높은 몰입감을 제공하기 위해 다중 비디오 영상을 효율적으로 처리하는 기법이 활발히 연구되고 있다. 이를 위해 원본의 몰입형 비디오가 입력되면 기본 시점 영상과 추가 시점 영상에서의 중복을 제거하고 기본 시점(basic view)에서는 보이지 않지만 추가 시점(additional view)에서는 보이는 영역을 추출하는 프루닝 과정이 이뤄지는 부호기에서의 부호화 모드 결정은 매우 중요하다. 본 논문은 test model for immersive video (TMIV)의 모드 중 하나인 MPEG immersive video (MIV) view mode 를 통해 만들어진 프루닝 (pruning) 그래프에서 선택된 시점들을 활용하여 뷰 간 중복성을 제거할 수 있는 효율적인 부호화 구조로 클러스터를 기반으로 병렬적으로 부호화하는 클러스터 기반 정렬 기법을 제안한다. 선택된 시점들을 인덱스 순서에 따라 부호화하는 기존 방법에 비해 제안하는 방법은 peak signal-to-noise ratio (Y-PSNR)에서 평균 3.9%의 BD-rate 절감을 보여주었다. 본 연구는 또한 더 객관적인 품질 측정을 위해 immersive video peak signal-to-noise ratio (IV-PSNR)에 의한 비교 결과도 함께 제공하며, 참조 순서에 맞게 정렬한 프루닝 기반 정렬 기법과의 비교도 함께 제공한다.

  • PDF

의존관계에 기초한 일본어 키워드 추출방법 (The Method of Deriving Japanese Keyword Using Dependence)

  • 이태헌;정규철;박기홍
    • 정보처리학회논문지B
    • /
    • 제10B권1호
    • /
    • pp.41-46
    • /
    • 2003
  • 본 논문에서 일본어 키워드 추출을 목적으로 요약문서 중에 떨어진 문자열을 합성하고, 그 문장에 나타난 규칙을 가지고 단어 정보(표기, 품사)와 구문 정보를 이용하여 복합명사고로 된 키워드 추출 방법을 제안한다. 저자 자신이 부여한 학술 논문의 키워드 중에서 문서 중에 그대로 존재하지 않는 키워드의 특징을 분석한 결과로 의존 관계에 의한 복합명사 생성 규칙을 구축한다. 또 문장의 내용과 다른 키워드의 추출을 억제하기 위해 생성규칙에 대한 제약과 중복 단어를 고려한 중요도 결정법을 제안한다. 자연ㆍ 음성언어처리에 관한 일본어 논문 65파일의 타이틀과 초록부분을 이용하여 추출된 키워드의 타당성에 대한 실험을 한 결과 추출 정밀도는 중요도의 상위 1개를 출력한 경우 63%가 되어 추출 방법의 유효성을 확인 할 수가 있었다.

단어의 공기정보를 이용한 클러스터 기반 다중문서 요약 (Multi-document Summarization Based on Cluster using Term Co-occurrence)

  • 이일주;김민구
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제33권2호
    • /
    • pp.243-251
    • /
    • 2006
  • 대표문장 추출에 의한 다중문서 요약에서는 비슷한 정보가 여러 문서에서 반복적으로 나타나는 정보의 중복문제에 대해 문장의 유사성과 차이점을 고려하여 이를 해결할 수 있는 효율적인 방법이 필요하다. 본 논문에서는 단어의 공기정보에 의한 관련단어 클러스터링 기법을 이용하여 문장의 중복성을 제거하고 중요문장을 추출하는 다중문서 요약을 제안한다. 관련단어 클러스터링 기법에서는 각 단어들은 서로 독립적으로 존재하는 것이 아니라 서로 간에 의미적으로 연관되어 있다고 보며 주제별 문장클러스터단위의 단어 연관성(cohesion)을 이용한다. 평가용 실험문서인 DUC(Document Understanding Conferences) 데이타를 이용하여 실험한 결과 본 논문에서 제안한 문장클러스터단위의 단어 공기정보를 이용한 방법이 단순 통계정보와 문서단위 단어 공기정보, 문장단위 단어 공기정보에 의한 다중문서 요약에 비해 좋은 결과를 보였다.

퍼지 이진화와 가우시안 필터링을 이용한 세라믹의 결함 검출 (Detection of Flaws in Cerarmics using Fuzzy Binarization and Gaussian Filtering Method)

  • 황선우;박효민;우영운;김광백
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2011년도 추계학술대회
    • /
    • pp.215-218
    • /
    • 2011
  • 본 논문에서는 비파괴 검사를 이용하여 획득한 세라믹 소재 영상에서 효율적으로 결함을 검출하는 방법을 제안한다. 제안된 방법은 세라믹 소재 영상에 비등방성 필터링 기법과 가우시안 필터링 기법을 반복 적용하여 잡음을 제거하고, Ends-in Search Stretching 기법을 적용하여 명암 대비를 강조한다. 명암 대비가 강조된 영상에 $7{\times}7$ Sobel 마스크를 적용하여 윤곽선을 추출한 후, 임계치 이진화 기법을 적용하여 영역을 세분화하기 위한 기울기를 계산한다. 계산된 기울기를 이용하여 영상을 세분화한 후에 Glassfire 기법을 적용한다. Glassfire 기법이 적용된 영상과 Ends-in Search Stretching 기법이 적용된 영상을 비교하여 중복되는 영역만을 추출한다. 추출된 영역에 퍼지 이진화 기법과 침식 연산을 적용하여 잡음을 제거하고 결함을 검출한다. 제안된 방법을 세라믹 소재 영상을 대상으로 실험한 결과, 기존의 결함 검출 방법보다 효율적으로 결함이 검출되는 것을 확인할 수 있었다.

  • PDF

PCA 기반 파라메타를 이용한 숫자음 인식 (The Recognition of Korean Syllables using Parameter Based on Principal Component Analysis)

  • 박경훈;표창수;김창근;허강인
    • 융합신호처리학회 학술대회논문집
    • /
    • 한국신호처리시스템학회 2000년도 추계종합학술대회논문집
    • /
    • pp.181-184
    • /
    • 2000
  • 본 논문에서는 음성 특징추출의 한 방법으로서 기존의 방법들과는 달리 음성의 통계적인 특성들을 고려하여, 입력 공간내에서 변동량이 가장 많은 방향으로 주축을 발견한 다음 그 정보를 이용하여 데이터의 중복성을 제거하는 주성분 해석(PCA:Principal Component Analysis)기법을 사용하여 음성의 특징을 추출하는 방법을 제안한다. 본 논문의 숫자음 인식실험 결과와 비교하기 위하여 기존의 음성특징 파라메타인 Mel-Cepstrum과 비교하였을 때, 0.5%의 인식률 차이가 있었으나, 음성특징 추출시 기존의 파라메타에 비하여 비교적 짧은 시간에 구해지는 점과 데이터의 통계적 특성을 이용한 최적의 기저벡터를 이용한다면 단어나 문장 인식시에 보다 나은 인식률을 얻으리라 사료된다.

  • PDF

문서 분석 기반 주요 요소 추출 시스템 (Document Analysis based Main Requisite Extraction System)

  • 이종원;여일연;정회경
    • 한국정보통신학회논문지
    • /
    • 제23권4호
    • /
    • pp.401-406
    • /
    • 2019
  • 본 논문에서는 XML 형태의 논문이나 보고서로 작성된 문서를 분석하는 시스템을 제안한다. 논문이나 보고서에서 지정한 키워드를 추출하고 이를 사용자에게 보여준 뒤 사용자가 해당 문서 내에서 검색을 원하는 키워드를 입력하면 각 키워드들을 포함하고 있는 문단들을 추출한다. 시스템은 사용자가 입력한 키워드들의 빈도수를 확인하고 가중치를 계산한 뒤 가중치가 가장 낮은 키워드만을 포함한 문단들을 제거한다. 또한, 정제된 문단들을 10개의 영역으로 나눈 뒤 영역별 문단들의 중요도를 계산하고 각 영역들의 중요도를 비교하여 가장 높은 중요도를 갖는 주요 영역을 사용자에게 알려준다. 이러한 특징들로 인해 제안하는 시스템을 활용할 경우 기존의 문서 분석 시스템을 활용하여 논문이나 보고서를 분석하는 것보다 압축률이 높은 형태로 주요 문단들을 제공받을 수 있다. 이로 인해 문서를 이해하는데 필요한 시간을 줄일 수 있을 것으로 사료된다.

코드 리팩토링을 위한 확장된 IPO 기법 (Extended IPO technique for Code Refactoring)

  • 박재진;이재욱;홍장의
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2012년도 한국컴퓨터종합학술대회논문집 Vol.39 No.1(B)
    • /
    • pp.255-257
    • /
    • 2012
  • 긴 파라미터 리스트(Long parameter list)는 소프트웨어 코드의 품질을 저해시키는 Bad Smell들 중 하나로써, 코드에 대한 이해도를 떨어뜨리고 코드의 변경을 어렵게 한다는 문제점이 있다. 이러한 문제를 해결하는 기법들 중 하나인 IPO(Introduce Parameter Object) 기법은 함께 사용되는 빈도가 높은 파라미터들을 하나의 클래스로 만든 후에 관련된 기능들을 해당 클래스의 메소드로 추출하여 사용하므로 코드의 중복을 막아 재사용성을 높이고 코드에 대한 이해도를 높일 수 있다. 하지만 IPO 기법의 주된 관심사는 파라미터 그룹의 발생 빈도에 초점을 두고 있으며, 커플링에 대한 고려가 충분히 이루어지지 않는다. 따라서 본 연구에서는 IPO 기법과 커플링의 관계를 분석하여 IPO 기법이 커플링까지 고려할 수 있도록 확장된 IPO기법을 제안한다. 제안된 기법은 기존의 기법에 비해 더 낮은 커플링을 달성하여 고품질의 코드를 얻을 수 있다.

개선된 Shrink-wrapping 알고리즘을 이용한 비조직 3차원 데이터로부터의 표면 재구성 (Surface Reconstruction from unorganized 3D Points by an improved Shrink-wrapping Algorithm)

  • 박은진;구본기;최영규
    • 정보처리학회논문지A
    • /
    • 제14A권3호
    • /
    • pp.133-140
    • /
    • 2007
  • SWBF(shrink-wrapped boundary face) 알고리즘은 조직되지 않은 3차원 측정점으로부터 표면을 재구성하기 위해 최근에 제안된 방법이다. 본 논문에서는 SWBF 알고리즘의 표면 중복문제를 제기하고, 이를 해결하기 위한 개선된 표면 재구성 방법을 제안한다. 제안된 방법은 경계셀이 아닌 모든 셀들을 내부셀과 외부셀로 구분하고, 개선된 경계면의 정의를 이용해 초기메쉬에서 표면의 중복이 발생하지 않도록 하였다. 또한, 측정 방향에 따라 표면 샘플링의 조밀도가 차이가 나는 일반적인 3차원 스캐너로부터 추출된 데이터의 처리를 위해 셀 영상에서 2차원 연결성을 정의하여 사용하였다. 실험을 통해 제안된 방법이 SWBF 알고리즘의 표면중복문제를 극복하는데 매우 유용함을 알 수 있었다.

구조적 속성과 어휘적 특징에 기반한 안전기준 고찰 (A Review of Safety Standards in Korea based on Structural Attributes and Lexical Characteristics)

  • 임수정;박덕근
    • 한국융합학회논문지
    • /
    • 제10권11호
    • /
    • pp.353-366
    • /
    • 2019
  • 사회발달로 인해 안전기준이 세분화 전문화되면서 관련 법령 또한 그 수가 점차 증가하여 법령 내에서 중복 또는 상충의 문제점이 나타나고 있다. 우리나라 법령에 존재하는 모든 안전기준을 수집한 후 중복 또는 상충문제를 찾아내기 위해서는 우선 안전기준이 가지는 특성들을 분석할 필요가 있다. 본 연구에서는 모든 안전기준에서 나타나는 공통요소와 특정 안전기준에서만 나타나는 특이점을 추출하면서 안전기준의 특성을 크게 구조적, 어휘적 부분으로 구분하였다. 분석결과, 안전기준의 구조적 속성은 2가지, 어휘적 특징은 4가지로 도출되었다. 이러한 특성들이 안전기준을 관리할 향후 시스템에 미치는 영향에 대해서도 추가로 검토하였다. 본 연구를 기반으로 향후 더 많은 안전기준의 구조 및 어휘적 특성들이 축적된다면 효율적인 안전기준의 수집.분석 알고리즘 개발이 가능해져 결국 법령내 안전기준의 중복 상충 문제점 해소에 도움이 될 것이다.